ニューヨーク・タイムズ そして デイリーニュース ChatGPTが自社の著作物に基づいてトレーニングされたのではないかという疑いで、OpenAIとその投資家であるMicrosoftを訴えた。さて、弁護士らによるトレーニングデータの調査が、おそらくは偶然に、OpenAIのエンジニアによって先週消去されたことが判明した。
NYタイムズの弁護士はOpenAIに対する潜在的な証拠を削除させた
今秋初め、OpenAIは、タイムズ紙とデイリーニュース社の弁護士がAIトレーニングセットで著作権で保護されたコンテンツの検索を実行できるように、2台の仮想マシンを提供することに同意した…出版社の弁護士らは書簡の中で、彼らと彼らが雇った専門家が費用を費やしたと述べている。 11 月 1 日以来、OpenAI のトレーニング データを検索するのに 150 時間以上かかりました。
しかし、水曜日遅くにニューヨーク州南部地区連邦地方裁判所に提出された前述の書簡によると、OpenAIのエンジニアは11月14日、仮想マシンの1つに保存されていたパブリッシャーの検索データをすべて消去したという。
前述の手紙は、 ここでオンラインで公開されました みんなに読んでもらえるように。
NYタイムズの弁護士がChatGPTのトレーニングセットからデータを編集するのに多大な時間を費やした後、彼らの研究はOpenAIによって消去されたようだ。
書簡には、OpenAIが後にデータの大部分を回復できたが、それは法的手続きで使用できない形でしか回復できなかったと記載されている。したがって、このケースでは OpenAI に対してデプロイできず、費用と時間のかかる作業が新たに始まります。
9to5Macの意見
さまざまな AI 企業が使用しているトレーニング データは、残念ながら多くの曖昧な部分に包まれたままです。すべてのパブリッシャーがテクノロジー大手に対して訴訟を起こすためのリソースを持っているわけではありませんが、その場合に OpenAI エンジニアによって誤って作品を削除されてしまうことはありませんか?控えめに言っても見た目が悪いです。
この話をどう思いますか?コメントでお知らせください。