インサイダーブリーフ

  • コーネル主導の研究チームは、大規模なデータセットを簡素化し、従来のテクニックよりも効果的にノイズをフィルタリングするための新しい量子にインスパイアされた方法を開発しました。
  • このモデルは、本質的な寸法推定を改善します。これは、実際のデータのノイズと複雑さによってしばしば妥協される重要な統計的手法です。
  • 量子認知機械学習と呼ばれるこのアプローチは、量子数学構造を使用しますが、古典的なコンピューターで実行され、エネルギー効率が高く広くアクセス可能になります。

大学のニュース – ビッグデータが大きくなりすぎました。

コーネルの統計学者との研究チームが開発されました 量子力学に触発されたデータ表現方法 これにより、大規模なデータセットは、それらを単純化してノイズを除外することにより、従来の方法よりも効率的に処理します。

この方法は、従来のデータ方法がこれまで不十分であることが判明したヘルスケアやエピジェネティクスのような、データが豊富であるが統計的に威圧的な分野の革新を促進する可能性があります。

レスポンシブ画像

「物理学者と同盟科学者は、複雑なデータの簡潔な数学的表現を提供する量子力学ベースのツールを開発しました」と言いました。 マーティンウェルズ、チャールズ・A・アレクサンダー・アレクサンダー・統計科学の教授コーネル・アン・S・バウアーズ・カレッジ・オブ・コンピューティング・アンド・イル・スクール。彼は「」の共著者です。量子認知機械学習を使用したデータセットの固有の次元の堅牢な推定、2月26日に科学報告書に掲載された。「私たちは、データの構造を理解するために、量子力学から数学的構造を借用し、使用しています。」

データをイノベーションまたは医療ブレークスルーにスピンする前に、データサイエンティストは最初にデータの複雑さの感覚を得る必要があります。これを行うために、学者 – 特にネットワーク分析や健康科学などの分野で働いている学者は、伝統的に、すべての詳細を分析せずにデータ科学者が大規模なデータセットの要点を取得するのに役立つ内因性ディメンション推定と呼ばれる手法に変わりました。問題は、本質的な寸法の推定が騒音と複雑さによって捨てられる可能性があり、実際のデータが両方であることが多いことです、と研究者は言いました。

「これらの本質的な寸法推定手法を使用すると、彼らは非常に大きなマージンで間違った答えを得ることがよく、お互いに反対します」と、リード著者兼研究ディレクターのルカ・カンデロリは言いました。 qognitive、人工知能のスタートアップ。 「実際のデータセットにそれらを適用し、実際の見積もりを取得することは非常に困難です。」

チームのAI駆動型モデルは、本質的なディメンション推定技術の細かく調整されたバージョンを表し、より正確で、騒音の影響を受けにくく、したがって、今日の複雑なデータセットを処理するのに適しています。実世界のデータと人工データセットの両方のテストでは、意図的にノイズの多いものになったため、チームのモデルは一貫した推定値を維持しています、と研究者は言いました。

チームの方法は、今日の標準的な実践と同様に、従来の確率理論ではなく、人間が考える柔軟で微妙な方法に基づいたQognitiveによって開発されたAIトレーニングへのアプローチである「量子認知機械学習」に基づいています。これらの従来の方法を使用して、大規模な言語モデルのような最先端のツールを訓練するには、費用がかかりすぎて、SAPSが多すぎるとCandeloriは言いました。

「量子認知機械学習を開発する動機の多くは、データとデータの分布を表現するより経済的な方法を見つけようとすることです」とCandelori氏は言います。

研究者は、量子認知機械学習は量子数学を使用しているが、強力で高価な量子コンピューティングハードウェアを必要としないことに注意してください。標準のラップトップで実行できます。

「この量子の側面はゲームチェンジャーです」とウェルズは言いました。 「わずか3年前に利用できなかった数学的および統計的ツールへのアクセスを提供します。」

CandeloriとWellsとともに、論文の著者は次のとおりです。統計分野の博士課程の学生であるCameron Hogan。アレクサンダー・アバノフ、ストーニー・ブルック大学の物理学および天文学の教授。 Mengjia Xu、ニュージャージー工科大学のデータサイエンス助教授。ハレン・ムサエリアン、ジェフリー・バーガー、ヴァハニ・キラコシアン、ライアン・サムソン、ジェームズ・スミス、ダリオ・ヴィラニ、すべてQognitive。

この研究は、国立衛生研究所、米国エネルギー省、米国空軍科学研究局、キングスカレッジロンドンの数学省によってサポートされていました。

Source link