Openai CEO Sam Altman xに投稿 彼の会社が2022年12月にChatGPTをリリースして以来、AIにとって最も重要な一日の終わりに向かっていました。
月曜日の彼のメッセージは、破壊者が破壊されたことをAIの階層からの確認でした。
「DeepseekのR1は印象的なモデルです。特に、彼らが価格のために提供できるものを中心に」と彼は書いています。 「私たちは明らかにはるかに優れたモデルを提供します。また、新しい競合他社を持つことは合法的です!リリースをいくつか引き上げます。」
Deepseekは、月曜日に米国の市場を覆した突然人気の中国のAIモデルであり、AIアシスタントがAppleのApp Storeをトッピングし、ドナルドトランプ大統領とテックのトップリーダーからの反応を刺激しました。
Deepseekの突然の外観は、シリコンバレーが他のすべての人をガタガタと鳴らすために使用した方法でシリコンバレーをガタガタと鳴らしました。中国で活動する少数の才能あるプログラマーは、AIの将来に関して大きな技術を支配している仮定を覆しました。
これらの仮定は、お金、エネルギー、モデルを中心としています。思考は次のようになりました。AIモデルを構築する最良の方法は、最も強力なコンピューターチップを使用して数学的な複雑さを磨くために何度も何度も訓練することです。もっとai馬力が欲しいですか?より大きなAIエンジンを構築します(別名、マンハッタンのほとんどのサイズのスペースを占める可能性のあるデータセンター)。それは高価でリソース集中的な提案です。
そして、テクノロジーのほぼ全員がその命題を受け入れました。それがゴールドマン・サックスが投影した理由です AI投資で1兆ドル以上 今年の数年で、マーク・ザッカーバーグは今年AI支出で600億ドルを宣伝しましたが、Elon MuskとAltmanはStargateと呼ばれる5,000億ドルのプロジェクトをスパーリングしました。
Deepseekは別の方法で行きました。効率を向上させるための高度な(しかし既知の)概念を使用して、Scrappy Kidsの乗組員 – CEOは、中国の大学からまっすぐに雇うことを目指していると言いました – は、派手なチップやエネルギー集約的なトレーニングなしでモデルを作成しようとしました。米国の大規模なモデル。
その代替案は、数十億ドルがすでに投資されているさまざまな大きな技術的仮定に疑問を投げかけています。
AIモデルが構築するのがそれほど難しくない場合はどうなりますか? AIモデルがスマートフォンのように小さいものであっても、それほど高価または実行が難しくない場合はどうなりますか? AIチップがかつて考えられていたほど重要ではない場合はどうなりますか?中国はどのようにしてAI開発を妨害することを意図した輸出制御を避けましたか?
シリコンバレーとハイテク市場はより広く – これが来るのを見ましたか?
いくつかはそうしました。
フロンティア、または最も賢明なAIモデルが差別化されていないという考えは、AIの世界で成長しているトピックであり、Tech Consultancy Infosysの共同設立者とともに 9月にCNBCに伝えます 彼らがコモディティ化され、交換可能になるために進んでいたこと。
Deepseekについてのかすかな話題は、会社のコーディングモデルがあった2023年にまでさかのぼることができます テストしました 人々によって AIコミュニティで。 いくつかの議論 同社がより多くのモデルをリリースしたため、2024年にピックアップされました。年の終わりまでに、一部の人々は、Deepseekがすでに業界を混乱に陥れる兆候を示していることを警告していました。
「Deepseekの安価なトレーニング方法の重要な重要性は、より広い採用と革新のために開かれる道、特に既存のテクノロジーハブの外側にあります」 Azeem Azharを書いた、テクノロジー起業家、12月31日。制約は創意工夫を繁殖させます。皮肉なことに、輸出制御は、中国のAIチームに拍車をかけて、よりlear的で効率的なソリューションをエンジニアにしたようです。」
あまり明確ではないのは、これが本当に大きな技術の腸のパンチなのかです。はい、Nvidiaは記録的な金額の市場価値を失いましたが、それでも3兆ドル近くの価値があります(そして、その株は火曜日にほぼ9%跳ね返りました)。ハイテクアナリストは、AIをより安価なテクノロジーにすることは、消費者プラットフォームの開発に取り組んでいる企業など、大きな利点があると指摘しています。
ビジネスおよびテクノロジーアナリストのベン・トンプソン、 彼のブログStratecheryに書いた Deepseekの出現とその最初のショックは、Big Techが最終的に利益を得る未来に道を譲ることができるということです。
「長期的には、モデルのコモディティ化と安価な推論(Deepseekも実証している)は、ビッグテクノロジーにとって素晴らしいことです」とThompsonは書いています。 「マイクロソフトがコストのほんの一部で顧客に推論を提供する世界は、MicrosoftがデータセンターとGPUに費やすことを少なくしなければならないことを意味します。
「長期的には、モデルのコモディティ化と安価な推論(Deepseekも実証している)は、ビッグテクノロジーにとって素晴らしいことです。」
ベン・トンプソン
月曜日の夕方、トランプはDeepseekに関する彼自身の声明でその評価に同意し、「数十億と数十億を費やす代わりに、あなたはより少なく費やし、できれば同じ解決策を考え出す」と述べた。
Googleで働いていた独立したAI研究者であるChristopher Ackermanは、フロンティアAIモデルの構築に焦点を当てた企業が挑戦的な実行、特にOpenaiとAnthropicの2つの最大のAIスタートアップの2つですが、そのチップスは挑戦的な実行に焦点を合わせている可能性があると述べました。より効率的なモデルがあっても、Nvidiaにある程度のセキュリティを提供する必要があります。 Deepseekは、独自のモデルがあまり高度なNvidiaチップを使用して訓練されたと述べています。
「現在、市場は同意していませんが、市場は反応的です」と彼は書いています。
あまり心配していない人もいます。金融サービス会社Wedbush SecuritiesのアナリストであるDan Ivesは、火曜日にアナリストのメモに、DeepSeekへの反応は過剰であり、 Jevons Paradox – 最近も言及されています Microsoft CEO Satya Nadellaによる Deepseekに関連して – このエピソードは、Big Techの肯定的なものとして振り返られることを意味します。
「AIおよびLLMモデルのコストが削減されると予想しています」とIvesは書いています。 「それは、最終的には、パワー、ユースケース、そしてこの第4回産業革命でテクノロジーの世界が進んでいる場所にとって素晴らしいことです。」