- Wikipediaの編集者が2023年から取り組む「Project AI Cleanup」が、AI生成文章を識別する詳細なガイドを公開
- 「重要性の強調」「継続的な関連性の反映」など現在分詞を使った曖昧な主張が特徴的
- 「重要な瞬間」「より広い運動」など一般的な表現で主題の重要性を強調する傾向
- 風景は常に「風光明媚」、景色は常に「息をのむような」など、漠然としたマーケティング言語を使用
AI生成文章の識別は困難だが、Wikipediaが解決策を提示
私たちは皆、読んでいる何かが大規模言語モデルによって書かれたのではないかという忍び寄る疑念を感じたことがある。しかし、それを特定するのは驚くほど困難だ。昨年数カ月間、「delve(掘り下げる)」や「underscore(強調する)」のような特定の単語がモデルを見破れると誰もが確信したが、証拠は薄く、モデルがより洗練されるにつれて、特徴的な単語を追跡するのは難しくなっている。
しかし、実はWikipediaの人々はAI生成の文章にフラグを立てるのがかなり上手になっており、グループの公開ガイド「Signs of AI writing」は、疑念が正当かどうかを特定するために見つけた最良のリソースだ。(このドキュメントをXで指摘した詩人Jameson Fitzpatrick(ジェイムソン・フィッツパトリック)氏に感謝。)
2023年開始の「Project AI Cleanup」が生んだ詳細なフィールドガイド
2023年以来、Wikipedia編集者はAI投稿を把握する取り組みを行っており、これを「Project AI Cleanup」と呼んでいる。毎日数百万の編集が入ってくるため、参考にする素材は十分にあり、典型的なWikipedia編集者スタイルで、グループは詳細で証拠に基づいたフィールドガイドを作成した。
自動ツールは基本的に役に立たない
まず、ガイドは私たちがすでに知っていることを確認している。自動ツールは基本的に役に立たない。代わりに、ガイドはWikipediaでは珍しいが、インターネット全般では一般的な(したがって、モデルの訓練データでは一般的な)習慣や言い回しに焦点を当てている。ガイドによると、AI投稿は主題がなぜ重要であるかを強調するのに多くの時間を費やし、通常「重要な瞬間」や「より広い運動」のような一般的な用語を使用する。AIモデルはまた、主題を注目に値するように見せるために、マイナーなメディアスポットを詳述するのに多くの時間を費やす。これは個人の経歴から期待されるようなものだが、独立した情報源からは期待されない。
現在分詞を使った曖昧な重要性の主張が特徴
ガイドは、曖昧な重要性の主張を伴う末尾の節に関する特に興味深い癖にフラグを立てている。モデルは、何らかのイベントや詳細が何かの「重要性を強調している」とか、何らかの一般的なアイデアの「継続的な関連性を反映している」と言う。(文法オタクはこれを「現在分詞」として知っている。)特定するのは少し難しいが、一度認識できるようになれば、いたるところで見かけるようになる。
漠然としたマーケティング言語の傾向
また、インターネット上で非常に一般的な、漠然としたマーケティング言語への傾向もある。風景は常に風光明媚で、景色は常に息をのむようであり、すべてが清潔でモダンだ。編集者が言うように、「テレビコマーシャルのトランスクリプトのように聞こえる。」
AIモデルの訓練と展開方法に深く組み込まれた習慣
ガイドは全体を読む価値があるが、私は非常に感銘を受けた。これまで、私はLLMの文章は特定するには速すぎるペースで進化していると言っていただろう。しかし、ここでフラグが立てられた習慣は、AIモデルが訓練され展開される方法に深く組み込まれている。それらは偽装できるが、完全に排除するのは難しいだろう。そして、一般大衆がAI文章を識別することにより精通すれば、あらゆる種類の興味深い結果をもたらす可能性がある。
引用元:TechCrunch The best guide to spotting AI writing comes from Wikipedia
https://techcrunch.com/2025/11/20/the-best-guide-to-spotting-ai-writing-comes-from-wikipedia/

