Apple AIモデルのアップグレード版が性能面で期待外れ、OpenAIやGoogleに劣る結果

AppleがApple Intelligence機能を支える新AIモデルのアップデート版を発表
同社ベンチマークでOpenAIのGPT-4oやMeta Llama 4 Scoutに劣る結果
Apple On-Deviceモデルは30億パラメータでオフライン動作を実現
AI研究部門が競合他社に追いつけずにいるとの報告を裏付ける結果

Apple Intelligence新モデルがOpenAI GPT-4oに劣る性能

Appleは、iOS、macOS、その他のプラットフォームでApple Intelligence機能スイートを支えるAIモデルのアップデートを発表した。しかし、同社独自のベンチマークによると、これらのモデルはOpenAIを含む競合テック企業の古いモデルよりも性能が劣っている。

Appleは月曜日のブログ投稿で、iPhoneを含む製品でオフラインで動作する最新の「Apple On-Device」モデルが生成するテキストの品質について、人間のテスターが同サイズのGoogleとAlibabaのモデルと「同程度」と評価したが、それを上回る評価は得られなかったと述べた。一方、同じテスターたちは、同社のデータセンターで動作するよう設計されたより高性能な新モデル「Apple Server」を、OpenAIの1年前のモデルであるGPT-4oより劣ると評価した。

Meta Llama 4 ScoutがApple Serverを画像解析で上回る

Appleのモデルの画像解析能力を評価する別のテストでは、Appleによると、人間の評価者がApple ServerよりもMetaのLlama 4 Scoutモデルを好む結果となった。これは少し驚くべき結果である。多くのテストにおいて、Llama 4 ScoutはGoogle、Anthropic、OpenAIなどのAIラボの主要モデルよりも劣る性能を示している。

AppleのAI研究部門が競合に遅れをとる現状を浮き彫り

ベンチマーク結果は、AppleのAI研究部門が激烈なAI競争で競合他社に追いつくのに苦戦しているとする報告に信憑性を与えている。近年のAppleのAI能力は期待外れであり、約束されたSiriのアップグレードは無期限に延期されている。一部の顧客は、Appleがまだ提供していないAI機能を製品でマーケティングしていると同社を非難して訴訟を起こしている。

Apple On-Deviceモデルは30億パラメータでオフライン機能を実現

テキスト生成に加えて、約30億パラメータのサイズを持つApple On-Deviceは、要約やテキスト解析などの機能を駆動している。（パラメータはモデルの問題解決能力にほぼ対応し、一般的により多くのパラメータを持つモデルほど優れた性能を発揮する。）月曜日現在、サードパーティ開発者はAppleのFoundation Modelsフレームワークを通じてこのモデルを利用できる。