- xAIのチャットボットGrokが「南アフリカでの白人ジェノサイド」に関する発言を無関係な文脈で繰り返す問題が発生
- 同社は「無断改変」が原因と説明、システムプロンプトへの不正な変更があったと発表
- xAIは再発防止策としてシステムプロンプトの公開や24時間監視チームの設置を約束
xAI チャットボットGrokの異常な「白人ジェノサイド」発言問題
xAIは、同社のAIを搭載したチャットボットGrokが特定の文脈でX(旧Twitter)上で「南アフリカでの白人ジェノサイド」に繰り返し言及する問題について、「無断改変」が原因だったと発表した。
水曜日、Grokは無関係な話題に対してさえ、南アフリカでの白人ジェノサイドに関する情報をX上の数十の投稿に返信し始めた。この奇妙な返信は、ユーザーが「@grok」とタグ付けするたびにAIが生成した投稿で応答するGrokのXアカウントから発信されていた。
We want to update you on an incident that happened with our Grok response bot on X yesterday.
What happened:
On May 14 at approximately 3:15 AM PST, an unauthorized modification was made to the Grok response bot’s prompt on X. This change, which directed Grok to provide a…— xAI (@xai) May 16, 2025
何が起こったのか:
5月14日午前3時15分(PST)頃、X上のGrok応答ボットのプロンプトに不正な変更が加えられました。
政治的なトピックに関する特定の応答をGrokに指示するこの変更は、xAIの内部ポリシーとコアバリューに違反していました。私たちは徹底的な調査を行い、Grokの透明性と信頼性を高めるための対策を実施しています。
xAIによる「無断改変」の説明
xAIの公式Xアカウントが木曜日に投稿した内容によると、水曜日の朝にGrokボットのシステムプロンプト(ボットの動作を導く高レベルの指示)に変更が加えられ、「政治的トピック」について「特定の応答」を提供するようGrokに指示していたという。xAIはこの調整が「社内ポリシーと核心的価値観に違反した」と述べ、「徹底的な調査を実施した」と説明した。
これはxAIが、Grokのコードへの無断変更によりAIが物議を醸す方法で応答したことを公に認めた2度目の事例となる。
Grokコード改ざんの前例
2月には、Grokが一時的にドナルド・トランプとxAIの創設者でXのオーナーであるイーロン・マスクに関する好ましくない言及を検閲した。xAIのエンジニアリングリードであるIgor Babuschkin(イゴール・バブシュキン)氏によると、不正行為を行った従業員によってGrokはマスクまたはトランプが誤情報を広めているという言及をする情報源を無視するよう指示されており、ユーザーがそれを指摘し始めるとすぐにxAIはその変更を元に戻したという。
xAIの再発防止策
xAIは木曜日、同様の事件が将来発生するのを防ぐためにいくつかの変更を行う予定だと発表した。
本日から、xAIはGrokのシステムプロンプトと変更履歴をGitHubで公開する。同社は、xAIの従業員がレビューなしにシステムプロンプトを変更できないよう「追加のチェックと対策を実施する」とともに、「自動システムで検出されないGrokの回答に関する問題に対応するための24時間365日の監視チーム」を設立するとしている。
xAIのAI安全性への取り組みに対する懸念
マスク氏がAIの無制限な危険性について頻繁に警告しているにもかかわらず、xAIはAI安全性において貧弱な実績を持つ。最近の報告では、Grokは要求に応じて女性の写真から服を脱がせることが判明した。このチャットボットは、GoogleのGeminiやChatGPTなどのAIよりもかなり粗野で、ほとんど制約なく罵詈雑言を使用することがある。
AIラボの説明責任向上を目指す非営利団体SaferAIによる調査では、xAIは「非常に弱い」リスク管理慣行のため、同業他社の中で安全性の評価が低いことが判明した。今月初め、xAIは自ら課したAI安全性フレームワーク最終版の公開期限を逃している。
引用元:TechCrunch
xAI blames Grok’s obsession with white genocide on an ‘unauthorized modification’