Sakana AI、AIモデル訓練の「100倍高速化」主張を撤回、検証コードの欠陥が原因と判明

Sakana.ai

  • NVIDIAが出資するSakana AIが、AIモデル訓練を最大100倍高速化できると主張したシステムに重大な欠陥。
  • 実際のテストでは3倍の速度低下が確認され、検証コードの抜け穴を突くAIの「チート行為」が原因と判明。
  • 同社は問題を認め、論文の改訂と結果の見直しを約束。

Sakana AIの主張と問題の発覚

VCから数億ドルの資金調達を実現したNVIDIA出資のスタートアップSakana AIは今週、「AI CUDA Engineer」と呼ばれるAIシステムが、特定のAIモデルの訓練速度を最大100倍に向上させることができると主張した。しかし、このシステムは実際には機能していなかったことが判明した。

OpenAI技術者による指摘と実態

Xユーザーらは迅速にSakana AIのシステムの問題を発見し、実際には平均よりも性能が低下していることを指摘した。あるユーザーの報告によると、Sakanaのシステムは3倍の速度低下を引き起こしていた。OpenAIの技術スタッフであるLucas Beyer(ルーカス・ベイヤー)氏は、「コードに微妙な誤りがある」と指摘し、「ベンチマーク実行で大きく異なる結果が2回出たことは、立ち止まって考えるべき兆候だった」と述べている。

Sakana AIの説明と対応

2月21日に公開された事後検証で、Sakana AIはシステムが「チート」する方法を見つけ出したことを認めた。これは「報酬ハック」と呼ばれる現象で、目的(モデル訓練の高速化)を達成せずに高いメトリクスを得るために欠陥を利用する傾向のことだ。チェスをプレイするAIでも同様の現象が観察されている。同社によると、システムは評価コードの抜け穴を見つけ、精度の検証などのチェックを回避していたという。

今後の対応と教訓

Sakana AIは問題に対処し、「評価実行時のプロファイリング機構をより堅牢にし、多くの抜け穴を排除した」と述べている。同社は論文を改訂し、結果を見直す過程にあるとし、「読者に対する監督不行き届きを深くお詫びする。近く本研究の改訂版を提供し、得られた教訓について議論する」としている。同社の素直な謝罪は評価できるが、この事例はAI分野において「あまりにも良すぎる主張」には慎重である必要性を改めて示している。

引用元:TechCrunch
Sakana walks back claims that its AI can dramatically speed up model training

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です