ChatGPT でビデオ機能を取得する

から

12月 13, 2024

OpenAIの人工知能チャットボットはスマートフォンのカメラを通じて物体を認識し、リアルタイムに反応できるようになります

OpenAI の ChatGPT は、ユーザーが提供するビデオキューを処理できるようになりました。この新機能は、有料の ChatGPT Plus および Pro 加入者にすでに提供されており、企業および教育機関の顧客も来月にはアクセスできるようになる予定です。

2022 年に発売された人工知能チャットボットは、その機能を着実に拡張しています。昨年、その開発者らは、GPT-4 大規模言語モデルは SAT 試験 (米国の大学入学に広く使用されている標準テスト) で、全人の 90% 以上よりも高いスコアを獲得できる可能性があると発表しました。

木曜日のライブストリーム中に、OpenAIは、スマートフォンのカメラを通して観察したもの、または現在画面に表示されているものに基づいてChatGPTがユーザーと対話できるようにする最新機能を発表した。たとえば、人間はチャットボットに対し、開いているアプリ内のメッセージに対する適切な回答を書いたり、現実世界でタスクを実行する際のリアルタイムのアドバイスを書いたりするよう依頼できます。

2月に研究者らは「Sora」という名前のツールを発表した。 「複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成できます。」 すべてはユーザーからのプロンプトに基づいています。同社は当時、AIが生成したビデオのいくつかの例をソーシャルメディアアカウントで共有し、供給された画像やビデオを新しい素材で拡張できると述べた。

7月、ロイターは、OpenAIがAIモデルの推論能力を大幅に向上させることを目的としたアプローチに取り組んでいると報じた。匿名の情報源によって次のように説明されている機能 「作業が進行中です」 これにより、ChatGPT はクエリに対する回答を生成するだけでなく、 「深い研究」 インターネットを積極的にナビゲートします。

「Strawberry」は、これまでのところ ChatGPT や同様のモデルの弱点のような、通常は人間にとって直観的な常識的な解決策を見つける AI チャットボットの能力を強化するはずです。

同じ頃、T銀行のAI研究所とモスクワに本拠を置く人工知能研究所（AIRI）のロシアの科学者グループは、自分たちが何もせずに新しいタスクや状況に自己適応できる新しい人工知能モデルを開発したと発表した。人間による追加入力。

「Headless-AD」と呼ばれるモデルの開発者によると、このモデルはすでに、最初に教えられた動作の 5 倍のアクションを実行することができました。

このストーリーをソーシャルメディアで共有できます。

RTをフォローしてください