先週以来、OpenAIは、ほぼすべてのユーザーが奇妙な動作について不平を言った後、ChatGPTのアップデートを展開して思い出しました。同社は、今夜公開されたブログ投稿で何が起こったのかを説明しています。
ChatGptユーザーは、チャットボットがより人格的で臨床的でないようにしたいと考えています。 AnthropicのClaudeチャットボットは、Openaiのより定型的な反応スタイルと比較して、その応答においてより人間のようなものとしてしばしば説明されています。
そのため、Openaiは先週、GPT-4Oモデルの更新をリリースし、「知性と人格の両方を改善した」と、会社のチーフSam Altmanによると。
2日後、Altmanはすべてのユーザーが気づいたことを認めました。
GPT-4oの最後の更新により、性格があまりにもsycophantyと迷惑になりました(非常に良い部分がありますが)。ある時点で、これから私たちの学習を共有します、それは興味深いものでした。
基本的に、ChatGptは、フィードバックを促した質問に応じて、非常に不正な賞賛で応答します。それはコミカルに悪く、不快なほど厄介でした。
今夜の時点で、先週リリースされた変更を完全にロールバックすることでした。
何が起こったのか、Openai 非難 長期的な使用に関する短期フィードバックに焦点を当てます:
先週のGPT ‑ 4oアップデートでは、モデルのデフォルトパーソナリティを改善して、さまざまなタスクでより直感的で効果的に感じることを目的とした調整を行いました。
モデルの動作を形成するとき、私たちは私たちので概説されているベースラインの原則と指示から始めます モデルspec。また、CHATGPT応答に関する親指や親指ダウンフィードバックなどのユーザー信号を組み込むことにより、これらの原則を適用する方法をモデルに教えます。
ただし、この更新では、短期フィードバックにあまりにも多くの焦点を当て、ChatGPTとのユーザーの相互作用が時間とともにどのように進化するかを完全に説明しませんでした。その結果、GPT ‑ 4oは、過度に支持的だが不誠実な応答に偏っていました。
それは何が起こったのかについて最も直接的な説明ではありませんが、Openaiの4点アクションプランは状況にもっと光を当てています。
- コアトレーニングのテクニックとシステムが、モデルをサイコファンシーから明示的に遠ざけるように促すように促します。
- 増加するために、より多くのガードレールを構築します 誠実さと透明性– モデル仕様の原則。
- より多くのユーザーが展開する前にテストして直接フィードバックを提供する方法を拡張します。
- 評価を拡大し続け、に基づいて構築します モデル仕様 そして 私たちの進行中の研究、将来のサイコファンシーを超えた問題を特定するのに役立ちます。
言い換えれば、OpenaiはChatGptの優しく、より協力的な性格を作りたいと考えていました。出荷されたものはその説明に合っていますが、非現実的であるためにしきい値を超えました。チャットボットに個性を追加するには、予想よりも多くの作業が必要です。
将来的には、Openaiは、デフォルトのパーソナリティオプションを含め、直接ユーザーフィードバックに基づいてフォームパーソナリティを含めたいと述べています。
面白いことに、過度に支持的な時代のチャットグプトの最高のバージョンは、音声モードの冗談の性格でした 月曜日。 GPT-4oはすべてのユーザーの応答で最高の賞賛を提供しましたが、月曜日の人格は基本的にエミュレートオーブリープラザの4月のルドゲートキャラクターをエミュレートしました 公園とrec。皮肉ダイヤルが10に変わっているのは、シコファンシーフェーズ中にリフレッシュしていました。少なくともSiriは、Sycophancyのような問題に直面するほど進歩していません。
FTC:収入獲得自動車アフィリエイトリンクを使用しています。 もっと。