- Mistral AIの新モデルがGPT-4oやLlama 4 Maverickを性能面で上回る結果を示す
- 推論コストはGPT-4o APIの1/5以下という低価格を実現
- 最大128kトークンのコンテキスト長と画像入力対応のマルチモーダル設計
- 企業向けにクラウドおよびオンプレミス展開に対応し柔軟なデプロイ選択肢を提供
Mistral AIの最新フラッグシップモデル
フランスのAIスタートアップMistral AIが2025年5月7日、新たな大規模言語モデル「Mistral Medium 3」を発表した。同モデルはOpenAIのGPT-4oやMetaのLlama 4 Maverickといった最先端モデルを性能面で凌駕しながら、推論コストを大幅に抑えている。企業向けに特化した設計と柔軟なデプロイオプションを備えており、導入コストと性能のバランスを重視する組織に新たな選択肢を提供する。
128kトークン対応のマルチモーダルモデル
Medium 3は最大128kトークンのコンテキスト長を持ち、画像入力にも対応するマルチモーダル型のモデルである。API経由やAmazon SageMakerなどで即日利用可能となっており、Watsonx、Vertex AIなど他のクラウド基盤にも順次対応する予定だ。また、オンプレミス環境にも対応しており、最小構成ではGPU 4枚から稼働可能とされている。
ベンチマークでGPT-4oを上回る結果
ベンチマークにおいても同モデルは高い評価を得ている。MMLU(多様な専門知識を問うベンチマーク)では0.76、RULER-128k(超長文読解)では0.902を記録し、GPT-4oやLlama 4 Maverickを上回る数値を示した。特に、ソフトウェア開発や数学・物理などSTEM領域における生成精度において高いパフォーマンスを持つという。
GPT-4oの1/5のコストを実現
価格は入力トークンが100万トークンあたり0.40ドル(約60円)、出力トークンが同2.00ドル(約300円)とされ、現行のGPT-4o APIの1/5以下の水準に設定されている。Mistral社は、性能とコストの両面で「Claude 3.7 Sonnetを上回るか同等」と主張している。
企業向け「Le Chat Enterprise」の同時リリース
モデルと同時に、企業向けチャットクライアント「Le Chat Enterprise」も発表された。クライアントの機能は以下の通り:Google Drive、Gmail、SharePointとの統合、社内ドキュメントの検索・要約・対話生成が可能、エージェント機能による業務支援。モデル本体と連携した社内業務支援が可能で、生成AIの業務実装を加速する仕組みとされる。
欧州拠点の強みとAIモデル市場への影響
Mistral AIは欧州を拠点とする企業であり、EU域内のデータ規制や法令に準拠した運用が可能な点でも注目されている。とくに、金融や医療など高いセキュリティ要件を持つ分野では、オンプレミス運用が可能な点が評価されやすい。同社はすでに次の「Large」モデルの投入を予告しており、AIモデル市場における競争の激化が今後も続くと見られる。
引用元:ledge.ai
Mistral Medium 3、業界最安水準でフラッグシップ級性能を実現——GPT-4oやLlama 4 Maverickを上回るベンチマーク結果も