インサイダーブリーフ:

  • クリーブランドクリニックの研究者は、古典的な分子記述子と量子回路を組み合わせて、プロトン親和性を効率的かつ正確に予測するハイブリッド機械学習モデルを開発しました。
  • 彼らの古典的なアンサンブルモデルは、実験的な不確実性と整合する平均絶対誤差2.47 kcal/molを達成しましたが、ハイブリッドモデルは、より少ない機能とパラメーターを使用して同様の精度に近づきました。
  • 量子回路は機能エンコーダーとして機能し、古典的な入力をより高次元表現に変換し、元の機能よりもPA値とのより強い相関を明らかにしました。
  • 低い深さの量子回路をエンコードプロセスに統合することにより、この研究は、特に現在のNISQハードウェアの制限を考慮して、古典的なワークフローを強化する際の量子ツールの実用的な役割を示しています。

私たちの世界を構成する分子の一見無限のライブラリーでは、陽子は静かではあるが決定的な役割を果たします。プロトンが分子に結合する場合、その形状、反応性、さらには質量分析でどのように表示されるかを変えることができます。それでも、最も有利なプロトン化サイト(最も高いプロトン親和性を持つプロトン)を特定することは、些細なことではなく、高コストの量子計算または慎重な実験作業のために普段は予約されています。

Journal of Chemical Theory and Computationに掲載された新しい研究、クリーブランドクリニックの研究者ホンニジンとケネスメルツジュニアは、3番目のオプションを提案します。彼らは、古典的な記述子と量子回路を組み合わせて、プロトンの親和性を効率的かつ競争の正確性で予測するハイブリッド機械学習モデルを開発しました。彼らのモデルは、分子の多様なセットでほぼ実験的性能に達し、特に騒々しい量子ハードウェアでも一貫した結果を示します。

古典的な制限と量子の代替

プロトン親和性は、特にイオンモビリティ – 質量分析などのワークフローで、気相イオン化学に特に関連しています。複数のプロトン化サイトが利用可能な場合、通常、観測されたデータに一致するジオメトリにつながる1つだけが1つだけです。しかし、そのサイトを特定することは複雑です。 G4やW1などの高精度AB InitioメソッドはPAを直接計算できますが、それらは計算上高価で、より大きな分子に対して非実用的です。実験方法は、特に不揮発性または熱的に不安定な化合物の場合、制限にも直面しています。

レスポンシブ画像

これらのボトルネックを避けるために、ジンとメルツは、NistとPubchemからキュレーションされた1,185個の有機化合物を訓練した機械学習モデルを構築しました。各分子は、2Dおよび3Dの物理化学的記述子、ホモルモエネルギーなどの量子化学変数、MACCSフィンガープリントを含む186の特徴の広範なセットを使用して記述されました。サポートベクトル回帰、ランダムフォレスト、グラデーションブーストツリーなどのモデルを個別に、およびアンサンブルでテストしました。ベストパフォーマー、アンサンブル投票リグレッサーは、実験測定の不確実性範囲と一致する2.47 kcal/molの平均絶対誤差を達成しました。

機能からヒルベルトスペースまで

研究のハイブリッド成分は別のタックを取ります。記述子を古典的なニューラルネットワークに直接供給する代わりに、著者は、パラメーター化された量子回路を使用して、機能のサブセットを量子状態に縮小したサブセットをエンコードしました。各回路は機能エンコーダとして機能し、角度回転や絡み合いゲートなどの量子操作を使用して、古典的なデータを高次元表現に変換します。これらの出力は、従来のニューラルネットワークに供給されました。

デザインを今日の騒々しい中間スケールの量子ハードウェアと互換性のあるデザインに保つために、著者は「パッチ」アプローチを使用しました。特徴はサブセットに分割され、それぞれが小さく構造的に同一の量子回路、またはサブエンコーダーで処理されました。これらは、低ノイズ実行のために最適化された回路検索方法であるélivagárを使用して生成されました。各サブエンコーダーは、わずかなキュービットと固定数のトレーニング可能なゲートで構成されており、深さを最小限に抑え、ハードウェアエラーを導入できる長距離エンタングルメントを回避しました。

論文で述べたように、パフォーマンスは、より多くの機能、サブエンコーダーごとのより多くのQubits、およびより大きな回路の表現率で一貫して改善されました。 64の入力機能が4つのサブエンコーダーに分割されており、それぞれ10キュビットを使用して、ハイブリッドモデルは3.29 kcal/molのMAEを達成しました。 IBM-Clevelandで実装された場合、モデルの実質バージョンは、古典的なニューラルネットベースラインに一致する3.63 kcal/molのMAEを維持しました。

Quantum Circuitsは優れた機能エンコーダですか?

パフォーマンスだけで有望でしたが、著者はまた、量子強化モデルが機能する理由を調査しました。彼らは、元の機能と量子エンコードされた機能の両方の入力機能とPA値の間の相関を比較しました。特にエンコードされた機能の1つは、元の記述子のいずれよりも2桁強い相関を示しました。これは、量子回路が古典的な前処理方法が見逃していたデータの構造をキャプチャしていたことを示唆しています。

ここでのアイデアは、量子モデルが全面的に古典的なモデルよりも優れているということではありませんが、むしろ、量子回路がプロセスのデータ変換部分の強力なツールとして役立つ可能性があるということです。フィーチャエンジニアリングと選択がモデルを作成または壊すことができる分子特性予測などの高次元問題では、量子機能エンコーディングが方法論の重要な部分になる可能性があります。

NISQをナビゲートします

明確にするために、この研究で最も正確な結果は、古典的なアンサンブルから依然として来ました。しかし、入力が少なく、パラメーターが少ない強力で安定した結果を達成するハイブリッドモデルの能力は、特に現在のハードウェアの制約に照らして顕著です。著者が指摘しているように、騒音、デコヒェランス、および不毛のプラトーは、より深いまたはより複雑な量子回路の本当の障壁のままです。

しかし、ソルバーとしてではなく、エンコーダとして、戦略的な役割で軽量回路を使用することにより、研究者は、既存のパイプラインに量子コンポーネントを有意義に統合する方法を示しています。このようにして、それは量子の利点ではなく、既存の手法をアップグレードするのに役立つ量子ツールを戦略的に含める方法です。

構造的ニュアンスが重要であり、従来のアプローチがすぐに計算的に禁止される可能性がある問題ドメインでは、この方法は説得力があります。化学や物理学の代替品ではなく、補完です。

この研究の貢献者には、Hongni JinとKenneth M. Merz Jr.が含まれます。

Source link