- AppleがApple Intelligence機能を支える新AIモデルのアップデート版を発表
- 同社ベンチマークでOpenAIのGPT-4oやMeta Llama 4 Scoutに劣る結果
- Apple On-Deviceモデルは30億パラメータでオフライン動作を実現
- AI研究部門が競合他社に追いつけずにいるとの報告を裏付ける結果
Apple Intelligence新モデルがOpenAI GPT-4oに劣る性能
Appleは、iOS、macOS、その他のプラットフォームでApple Intelligence機能スイートを支えるAIモデルのアップデートを発表した。しかし、同社独自のベンチマークによると、これらのモデルはOpenAIを含む競合テック企業の古いモデルよりも性能が劣っている。
Appleは月曜日のブログ投稿で、iPhoneを含む製品でオフラインで動作する最新の「Apple On-Device」モデルが生成するテキストの品質について、人間のテスターが同サイズのGoogleとAlibabaのモデルと「同程度」と評価したが、それを上回る評価は得られなかったと述べた。一方、同じテスターたちは、同社のデータセンターで動作するよう設計されたより高性能な新モデル「Apple Server」を、OpenAIの1年前のモデルであるGPT-4oより劣ると評価した。
Meta Llama 4 ScoutがApple Serverを画像解析で上回る
Appleのモデルの画像解析能力を評価する別のテストでは、Appleによると、人間の評価者がApple ServerよりもMetaのLlama 4 Scoutモデルを好む結果となった。これは少し驚くべき結果である。多くのテストにおいて、Llama 4 ScoutはGoogle、Anthropic、OpenAIなどのAIラボの主要モデルよりも劣る性能を示している。
AppleのAI研究部門が競合に遅れをとる現状を浮き彫り
ベンチマーク結果は、AppleのAI研究部門が激烈なAI競争で競合他社に追いつくのに苦戦しているとする報告に信憑性を与えている。近年のAppleのAI能力は期待外れであり、約束されたSiriのアップグレードは無期限に延期されている。一部の顧客は、Appleがまだ提供していないAI機能を製品でマーケティングしていると同社を非難して訴訟を起こしている。
Apple On-Deviceモデルは30億パラメータでオフライン機能を実現
テキスト生成に加えて、約30億パラメータのサイズを持つApple On-Deviceは、要約やテキスト解析などの機能を駆動している。(パラメータはモデルの問題解決能力にほぼ対応し、一般的により多くのパラメータを持つモデルほど優れた性能を発揮する。)月曜日現在、サードパーティ開発者はAppleのFoundation Modelsフレームワークを通じてこのモデルを利用できる。
15言語対応と拡張データセットでツール使用効率を向上
Appleによると、Apple On-DeviceとApple Serverの両方が、前世代と比較してツール使用と効率が向上し、約15言語を理解できるという。これは部分的に、画像データ、PDF、文書、原稿、インフォグラフィック、表、チャートを含む拡張されたトレーニングデータセットによるものである。
引用元: TechCrunch
Apple’s upgraded AI models underwhelm on performance