- 13万3,000件のデータセットに基づく高度な検閲AIシステムを発見
- 政治、社会、軍事に関する微妙な内容を自動的に検出
- AIテクノロジーを用いた情報統制の新たな手法
AIによる高度な検閲メカニズム
TechCrunchが入手した機密データにより、中国が極めて洗練された大規模言語モデル(LLM)を使用した検閲システムの存在が明らかになった。このシステムは、天安門事件のような従来のタブーを超えて、政府にとって敏感な内容を自動的に検出する能力を持つ。
検閲対象となる主な内容
システムは政治、社会生活、軍事に関する極めて微妙な内容を高優先度で検出する。環境汚染、食品安全スキャンダル、金融詐欺、労働争議、政治風刺、台湾政治、軍事運動などが主な監視対象となっている。
専門家の見解
カリフォルニア大学バークレー校の研究者Xiao Qiang(シャオ・チアン)氏は、この検閲システムについて「従来の人手によるキーワードフィルタリングとは異なり、LLMを使用することで情報統制の効率と精度を大幅に向上させる」と指摘。権威主義的な政権がAIテクノロジーを抑圧的な目的に活用する新たな証拠と評価している。
データの特徴
セキュリティ研究者NetAskariが発見した13万3,000件のデータセットは、中国の検閲機関である中国インターネット情報办公室が「世論工作」のために開発したものと考えられる。2024年12月までの最新のデータが含まれており、AIを用いた情報統制の進化を示している。
引用元:TechCrunch
Leaked data exposes a Chinese AI censorship machine