インサイダーブリーフ

  • 中国の科学者は、国内で開発された量子コンピューターを使用して、10億パラメーターAIモデルを微調整し、これをグローバルな最初のものとして主張しています。 グローバルタイムズ 報告されています。
  • Anhui Quantum Computing Engineering Research Centerによると、72 Qubit Origin Wukong Systemで実施された実験では、パラメーターを75%以上削減した後もモデルのパフォーマンスが向上しました。
  • この研究は、商業展開ではなくデモのままであり、ピアレビューされた研究は発表されていません。 グローバルタイムズ 注目されています。
  • 画像:Anhui Quantum Computing Engineering Research Center/Global Times

中国の科学者は量子コンピューターを使用して、10億パラメーター人工知能(AI)モデルを微調整し、彼らが主張するものであると主張するものであり、量子コンピューティングと高度なAIタスクを組み合わせるためのステップであると主張しています。 国家関連のグローバルタイムズは報告されました

この実験は、国内で構築された72クットチップで実行されるOrigin Wukongと呼ばれる超伝導量子コンピューターで実施されました。 Global Timesによると、微調整タスクは、量子ハードウェアがモデルのトレーニングパフォーマンスを改善できることを示しました – モデルパラメーターの数が大幅に減少した場合でも、コンピューティングパワーの需要をマウントする潜在的なソリューションを提供します。

Anhui Quantum Computing Engineering Research Center

Origin Wukongは、月曜日の開発について説明したAnhui Quantum Computing Engineering Research Centerによって運営されています。センターは、入力データの単一のバッチが数百の量子タスクを同時にトリガーできるため、大規模な並列処理を可能にする可能性があると述べました。

レスポンシブ画像

ある試験では、チームはOrigin Wukongを使用して10億パラメーターモデルを微調整しました、と新聞は報告しています。心理的カウンセリングの対話データセットでは、結果のモデルでは、モデルがどれだけよく学習しているかについての重要なメトリックであるトレーニング損失が15%減少しました。数学的推論に焦点を当てた別のタスクでは、モデルの精度は68%から82%に跳ね上がりました。

中国の国営の人々の毎日と提携しているGlobal Timesは、研究者がモデルサイズを76%削減した場合でも、トレーニングの有効性が8.4%改善されたと報告しました。科学者は、これがより効率的なモデルにつながる可能性があると言います。

微調整はAI開発における一般的なステップであり、事前に訓練された大規模な言語モデル(LLM)を法的アドバイスや顧客サービスなどの特定のドメインに適応させるために使用されます。一般に、このプロセスでは、数百万または数十億のパラメーターを調整するために高いコンピューティング能力が必要です。これは、モデルが使用する内部数値値であり、予測を行います。これをQuantum Hardwareで行うと、従来のクラシックコンピューターが伝統的に処理するワークロードを明るくする可能性があります。

大きな一歩

「これは量子コンピューティングの分野での大きな前進です」と、HEFEI包括的な国立科学センターの下で人工知能研究所の副研究者であるChen Zhaojun氏は述べています。 グローバルタイムズ。彼は、大規模なモデルの微調整をサポートするために実際の量子マシンが使用されたのは初めてであり、ハードウェアがそのようなタスクの準備ができていることを紙に伝えたと語った。

Origin Quantum Computing Technology Co.の副社長であり、Anhui Quantum Computing Engineering Research Centerの副ディレクターであるDou Menghan氏は、量子ツールを古典的なシステムと組み合わせることで取り組んだと述べました。 「これは、古典的なモデルに「量子エンジン」を装備し、2人が相乗効果で動作できるようにするようなものです」とDouはGlobal Timesに語りました。

研究者は、Origin Wukongを使用して、一連の量子処理ジョブで微調整タスクを実行しました。各ジョブは、量子システムが理論的に適切なプロセスである並行してモデルトレーニングをサポートすることができました。量子コンピューターは、古典的なシステムでは困難または不可能な計算を実行するために、Qubits(量子情報の単位)に依存しています。

Global Timesによると、72 Qubit Chip Inside Origin Wukongは中国で開発された最も強力な開発であり、国際的により高度なシステムの1つです。 Wukongは2024年1月6日から運営されており、流体のダイナミクス、金融、および生物医学のアプリケーションにまたがる350,000を超えるコンピューティングタスクを完了しています。また、Global Timesに提供されたデータによると、139か国と地域のユーザーからリモートアクセスリクエストを受け取りました。

ウコンという名前は、中国神話の猿の王であるサン・ウーコンに触発されました。 72の異なる形式に変換する能力で知られるこの数字は、業界と問題タイプにわたるマシンの柔軟性と範囲を象徴するために選択されました。

Global Timesが引用した業界アナリストは、この実験はAI分野を取り巻くいわゆる「コンピューティングパワー不安」から抜け出す方法を提供できると述べました。 LLMSが大きくなるにつれて、ハードウェアの上昇を要求し、コストとエネルギーの使用を促進します。量子プロセッサは、初期段階であっても、最終的にそれらのニーズを相殺するのに役立ちます。

中国は量子ハードウェアと研究に積極的な投資を行っていますが、世界的な競争は依然として激しいものです。米国、ヨーロッパ、カナダは、QuantumをAIと統合するプログラムも開始しました。しかし、この最新の試験の背後にある研究者によると、Origin Wukongは、有形の結果を伴う本格的なAIの微調整ワークロードを処理する最初の量子プラットフォームの1つです。

この実験は、完全な商用アプリケーションではなく、まだデモンストレーションであることに注意することが重要です。研究者が公開した、または実験に関する研究を公開した記事には兆候はありません。これにより、実験をより技術的に検討できます。

Source link