アリババ、ハイブリッドAI推論モデル群「Qwen 3」を発表

AI ART

  • 中国テック企業アリババが最新AIモデル「Qwen3」を発表、GoogleやOpenAIの最高モデルと同等またはそれ以上の性能を主張
  • ほとんどのモデルは「オープン」ライセンスでHugging FaceやGitHubで公開中または近日公開予定
  • Qwen3モデルは「ハイブリッド」設計で、複雑な問題の「推論」に時間をかけたり、単純な要求に素早く応答したりが可能
  • 最大モデルのQwen-3-235B-A22Bは、OpenAIのo3-miniやGoogleのGemini 2.5 Proを一部ベンチマークで上回る性能

中国発のAIモデルがOpenAIやGoogleに挑戦

中国テック企業アリババは月曜日、「Qwen3」と名付けられたAIモデル群を発表した。同社によれば、これらのモデルはGoogleやOpenAIから提供されている最高のモデルと同等、場合によってはそれを上回る性能を発揮するという。

ほとんどのモデルは現在、あるいは近い将来に、AIデベロッパープラットフォームであるHugging FaceGitHubで「オープン」ライセンスの下でダウンロード可能となる。そのサイズは6億パラメータから2,350億パラメータまで多岐にわたる。(パラメータはモデルの問題解決能力に大まかに対応しており、一般的にパラメータが多いモデルはパラメータが少ないモデルよりも優れたパフォーマンスを発揮する。)

Qwenのような中国発のモデルシリーズの台頭は、OpenAIなどの米国の研究機関により高度なAI技術の開発を促す圧力となっている。また、中国のAI企業がモデルのトレーニングに必要なチップを入手する能力を制限することを目的とした規制を政策立案者が実施するきっかけにもなっている。

ハイブリッド設計で柔軟な思考モードを実現

アリババによれば、Qwen3モデルは「ハイブリッド」モデルであり、複雑な問題を「推論」するために時間をかけたり、より単純な要求に素早く答えたりすることができる。推論機能により、モデルはOpenAIのo3のようなモデルと同様に、事実上自己チェックを効果的に行うことができるが、その代わりにレイテンシーが高くなる。

「思考モードと非思考モードをシームレスに統合し、ユーザーに思考予算を制御する柔軟性を提供している」とQwenチームはブログ記事で述べている。「この設計により、ユーザーはタスク固有の予算をより簡単に設定できるようになる。」

一部のモデルは、クエリに対応するための計算効率が高い専門家の混合(MoE)アーキテクチャも採用している。MoEはタスクをサブタスクに分解し、より小さな専門「エキスパート」モデルに委任する。

119言語に対応、36兆トークン超のデータセットでトレーニング

アリババによれば、Qwen3モデルは119の言語をサポートし、360兆トークン以上のデータセットでトレーニングされたという。(トークンはモデルが処理する生のデータビットであり、100万トークンは約75万語に相当する。)同社によれば、Qwen3は教科書、「質問と回答のペア」、コードスニペット、AI生成データなどの組み合わせでトレーニングされたとのことだ。

これらの改良により、前身のQwen2と比較してQwen3の能力が大幅に向上したとアリババは述べている。Qwen3モデルのいずれも、OpenAIのo3やo4-miniのような最新の最高水準のモデルを大きく上回るわけではないが、それでも優れたパフォーマンスを発揮している。

ベンチマークテストで高い性能を発揮

プログラミングコンテストのプラットフォームであるCodeforcesでは、最大のQwen3モデル — Qwen-3-235B-A22B — がOpenAIのo3-miniとGoogleのGemini 2.5 Proをわずかに上回っている。Qwen-3-235B-A22Bはまた、難易度の高い数学ベンチマークであるAIMEの最新バージョンと、モデルの問題についての「推論」能力を評価するテストであるBFCLでもo3-miniを上回っている。

ただし、Qwen-3-235B-A22Bは現時点では公開されていない。

公開されている最大のQwen3モデルであるQwen3-32Bは、中国のAI研究所DeepSeekのR1を含む、多くの独自および公開AIモデルと競合できるレベルにある。Qwen3-32BはコーディングベンチマークのLiveCodeBenchを含む複数のテストでOpenAIのo1モデルを上回っている。

アリババによれば、Qwen3はツール呼び出し機能や指示に従う能力、特定のデータ形式のコピーなどにも「優れている」という。ダウンロード用モデルに加えて、Qwen3はFireworks AIやHyperbolicなどのクラウドプロバイダーからも利用可能だ。

AIクラウドホストBasetenの共同創業者兼CEOであるTuhin Srivastava(トゥーヒン・スリバスタバ)氏は、Qwen3はOpenAIのようなクローズドソースシステムと歩調を合わせるオープンモデルの傾向を示す別の例だと述べている。

「米国は中国へのチップ販売や中国からの購入制限を強化しているが、最先端でオープンなQwen 3のようなモデルは間違いなく国内で使用されるだろう」と彼は語った。「これは企業が独自のツールを構築すると同時に、AnthropicやOpenAIのようなクローズドモデル企業を通じて既製品を購入している現実を反映している。」

引用元:TechCrunch
Alibaba unveils Qwen 3, a family of hybrid AI reasoning models

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です