要点まとめ
- OpenAIのボットによる大規模なデータスクレイピングで、小規模企業のウェブサイトが機能停止
- 適切な防御措置を講じない限り、AIボットは許可なくデータを収集し続ける実態が明らかに
- 2024年にはAIボットによる無効トラフィックが86%増加
OpenAIボットによるDDoS攻撃が発生
Triplegangersの最高経営責任者(CEO)オレクサンドル・トムチュク氏は土曜日、同社のEコマースサイトが停止していることを知らされた。分散型サービス妨害(DDoS)攻撃のような状況だった。原因はすぐに判明した。OpenAIのボットが同社の巨大なサイト全体を執拗にスクレイピングしようとしていたのだ。
「当社には65,000以上の商品があり、各商品にページがあります。各ページには少なくとも3枚の写真があります」とトムチュク氏は説明する。OpenAIは「数万件」のサーバーリクエストを送信し、数十万枚の写真と詳細な説明文を全てダウンロードしようと試みた。「OpenAIは600のIPアドレスを使用してデータをスクレイピングしており、先週のログをまだ分析中ですが、さらに多い可能性があります」と同氏は述べた。
被害と防御措置の実態
Triplegangersのウェブサイトは同社のビジネスそのものだ。7人の従業員で構成される同社は、実際の人物モデルをスキャンした「人間のデジタルダブル」の最大級データベースを10年以上かけて構築してきた。3Dアーティストやビデオゲーム制作者向けに、手や髪、皮膚、全身など、3Dオブジェクトファイルや写真を販売している。ウクラインを拠点とし、米国フロリダ州タンパにもライセンスを持つ。
同社のサイトには利用規約があり、許可なくボットが画像を取得することを禁止している。しかし、それだけでは効果がなかった。ウェブサイトはrobot.txtファイルを適切に設定し、OpenAIのボットであるGPTBotに対して具体的にサイトへのアクセスを禁止する必要がある。OpenAIには他にもChatGPT-UserやOAI-SearchBotなど、独自のタグを持つボットが存在する。
AIクローラーが盗んだものは不明
水曜日までに、同社は適切なrobot.txtファイルを設定し、CloudflareアカウントでGPTBotや他のボット(SEOクローラーのBarkrowler、TikTokのクローラーBytespiderなど)をブロックした。トムチュク氏は、他のAIモデル企業のクローラーもブロックできていることを期待している。木曜日の朝には、サイトのクラッシュは発生しなかった。
皮肉なことに、OpenAIボットの貪欲さが、Triplegangersにその露出度を警告したのです。もしそれがもっと優しく削られていたら、トムチュクは決して気づかなかっただろう、と彼は言った。
デジタル広告企業DoubleVerifyの新しい調査によると、2024年にはAIクローラーとスクレイパーによる「一般無効トラフィック」(実際のユーザーからのものではないトラフィック)が86%増加した。「ほとんどのサイトは、これらのボットによってスクレイピングされたことに気付いていません」とトムチュク氏は警告する。「今では毎日、ログ活動を監視してこれらのボットを発見する必要があります」
引用元:TechCrunch
How OpenAI’s bot crushed this seven-person company’s web site ‘like a DDoS attack’