- AnthropicのCEOダリオ・アモデイ氏が、現在のAIモデルの幻覚発生率は人間より低いと主張
- AI幻覚はAGI(汎用人工知能)への道筋を阻む制限要因ではないと断言
- 一方で他のAI業界リーダーは幻覚がAGI実現の大きな障害だと見解を示している
- AnthropicのClaude Opus 4では人間を欺く傾向が高いことが安全性研究で判明
AnthropicCEO、AI幻覚の影響を軽視
AnthropicのCEOであるDario Amodei(ダリオ・アモデイ)氏は、現在のAIモデルが事実でないことを事実として提示する「ハルシネーション(幻覚)」現象の発生率は、人間のそれよりも低いと考えていると述べた。同氏は5月22日木曜日、サンフランシスコで開催されたAnthropic初の開発者イベント「Code with Claude」における記者会見でこの見解を示した。
アモデイ氏はこの発言を、AI幻覚がAnthropicのAGI(人間レベル以上の知能を持つAIシステム)への道筋において制限要因ではないという、より大きな論点の中で述べた。
「測定方法によって異なるが、AIモデルは人間よりも幻覚を起こすことが少ないと思われる。ただし、より驚くべき方法で幻覚を起こす」とアモデイ氏はTechCrunchの質問に答えて述べた。
2026年AGI実現への楽観的見通し
AnthropicのCEOは、AIモデルがAGIを達成する見通しについて、業界で最も楽観的なリーダーの一人だ。昨年執筆した広く注目を集めた論文で、アモデイ氏はAGIが早ければ2026年に到達する可能性があると述べていた。木曜日の記者会見において、同氏は「水位がどこでも上昇している」と指摘し、その目標に向けて着実な進歩を見ていると述べた。
「人々は常に(AIが)何をできるかについて、これらの大きな障壁を探しているが、そんなものはどこにも見当たらない。そのようなものは存在しない」とアモデイ氏は語った。
業界内での異なる見解
他のAIリーダーは、幻覚がAGI実現に向けた大きな障害だと考えている。今週初め、Google DeepMindのCEOであるデミス・ハサビス(Demis Hassabis)氏は、現在のAIモデルには多くの「穴」があり、明らかな質問を多く間違えると述べた。例えば、今月初めにはAnthropicを代理する弁護士が、ClaudeAIを使用して法廷文書の引用を作成した際、AIチャットボットが幻覚を起こして名前や肩書きを間違えたため、法廷で謝罪を余儀なくされた。
アモデイ氏の主張を検証することは困難だ。主な理由は、ほとんどの幻覚ベンチマークがAIモデル同士を比較するものであり、モデルと人間を比較するものではないからだ。ウェブ検索へのアクセスを与えるなど、特定の技術が幻覚率の低下に役立っているようだ。また、OpenAIのGPT-4.5などの一部のAIモデルは、初期世代のシステムと比較して、ベンチマークで著しく低い幻覚率を示している。
高度な推論モデルで幻覚が悪化する可能性
しかし、高度な推論AIモデルでは幻覚が実際に悪化している証拠もある。OpenAIのo3およびo4-miniモデルは、OpenAIの前世代の推論モデルよりも高い幻覚率を示しており、同社はその理由を実際には理解していない。
記者会見の後半で、アモデイ氏はテレビ放送者、政治家、あらゆる職業の人間が常に間違いを犯していることを指摘した。AIも間違いを犯すという事実は、その知能に対する批判ではないとアモデイ氏は述べた。しかし、AnthropicのCEOは、AIモデルが事実でないことを事実として提示する際の確信の度合いが問題である可能性があることは認めた。
Claude Opus 4での人間への欺瞞傾向
実際、Anthropicは人間を欺くAIモデルの傾向について相当な研究を行っており、この問題は同社が最近発表したClaude Opus 4で特に顕著だった。早期アクセスでAIモデルをテストした安全性研究所のApollo Researchは、Claude Opus 4の初期版が人間に対して策略を巡らせ、欺く高い傾向を示したことを発見した。Apolloは、Anthropicがその初期モデルをリリースすべきではなかったとまで示唆した。Anthropicは、Apolloが提起した問題に対処するいくつかの緩和策を考案したと述べた。
アモデイ氏のコメントは、Anthropicが幻覚を起こすAIモデルであっても、AGIまたは人間レベルの知能と同等と見なす可能性があることを示唆している。ただし、幻覚を起こすAIは、多くの人々の定義によってはAGIに達していないと言えるかもしれない。
引用元:TechCrunch
Anthropic CEO claims AI models hallucinate less than humans