- イーロン・マスク氏のAI企業xAIが最新フラッグシップモデル「Grok 3」を公開
- 前モデルの「10倍」の計算能力で開発され、OpenAIのGPT-4oを上回ると主張
- 「推論」機能を備えたモデルラインナップと、新機能「DeepSearch」を導入
- プレミアム機能は月額30ドル(約4,500円)の「SuperGrok」プランで提供予定
xAIによるGrok 3の公開と基本機能
イーロン・マスク氏のAI企業xAIは月曜日深夜、最新フラッグシップAIモデル「Grok 3」をリリースし、GrokのiOSアプリとウェブアプリの新機能を発表した。
OpenAIのGPT-4oやGoogleのGeminiに対抗するxAIのモデルGrokは、画像を分析して質問に回答する能力を持ち、マスク氏のソーシャルネットワークXで多くの機能を支えている。数ヶ月にわたって開発されてきたGrok 3は、当初2024年中のリリースが楽観的に予定されていたが、その期限に間に合わなかった。
Grok 3は前モデルの10倍の計算能力
xAIはGrok 3のトレーニングに、約20万基のGPUを含むメンフィスの巨大データセンターを使用している。Xへの投稿でマスク氏は、Grok 3が前モデルのGrok 2のおよそ「10倍」の計算能力で開発され、裁判所の文書など拡大されたトレーニングセットを使用したと主張した。
Cool!
And Grok 3 is coming soon. Pretraining is now complete with 10X more compute than Grok 2. https://t.co/54j81EEOF5
— Elon Musk (@elonmusk) January 4, 2025
「Grok 3はGrok 2より桁違いに高性能だ」とマスク氏は月曜日のライブストリーム発表で述べた。「これは最大限に真実を追求するAIであり、たとえその真実が政治的正しさと相反することがあっても追求する」。
Grok 3モデルファミリーの特徴
Grok 3はモデルファミリーで、Grok 3の小型版である「Grok 3 mini」は、一部の精度を犠牲にして質問により迅速に応答する。Grok 3の全モデルと関連機能は一部がベータ版でまだ正式に利用可能ではないが、月曜日からロールアウトが始まった。
xAIによれば、Grok 3はAIME(数学問題のサンプリングに対するモデルのパフォーマンス評価)やGPQA(PhD級の物理学、生物学、化学問題を使用したモデル評価)などのベンチマークでGPT-4oを上回るという。xAIによると、Grok 3の初期バージョンは、異なるAIモデルを対戦させ、ユーザーに好ましい応答に投票させるクラウドソーシングテスト「Chatbot Arena」でも競争力のあるスコアを獲得したという。
推論機能と「DeepSearch」の導入
新しいGrok 3ファミリーの2つのモデル「Grok 3 Reasoning」と「Grok 3 mini Reasoning」は、OpenAIのo3-miniや中国AI企業DeepSeekのR1のような「推論」モデルと同様に、問題を慎重に「考え抜く」ことができる。推論モデルは結果を出す前に自己事実確認を試み、通常モデルが陥るいくつかの落とし穴を回避するのに役立つ。
xAIは、Grok 3 Reasoningが、AIME 2025と呼ばれる新しい数学ベンチマークを含む複数の一般的なベンチマークで、o3-miniの最高バージョンであるo3-mini-highを上回っていると主張している。
これらの推論モデルはGrokアプリを通じてアクセスできる。ユーザーはGrok 3に「考える」よう依頼するか、より難しいクエリの場合は、追加の計算を使用する推論のために「Big Brain」モードを活用できる。xAIは、推論モデルが数学、科学、プログラミングの質問に最も適していると説明している。
マスク氏によると、推論モデルの「思考」の一部はGrokアプリで隠されており、他のモデルから知識を抽出するためにAIモデル開発者によって使用される方法である「蒸留」を防止しているという。最近、DeepSeekはOpenAIのモデルを蒸留して独自のモデルを作成したとして非難されていた。
Grokの推論モデルは、GrokアプリにおけるOpenAIのディープリサーチのようなAI駆動リサーチツールに対するxAIの回答である「DeepSearch」と呼ばれる新機能の基盤となっている。DeepSearchはインターネットとXをスキャンして情報を分析し、質問に対する要約を提供する。
料金プランと今後の展開
Xのプレミアム+ティア(月額50ドル(約7,500円))の加入者がまずGrok 3にアクセスでき、他の機能はxAIが「SuperGrok」と呼ぶ新しいプランの後ろにゲート化される。リークによれば月額30ドル(約4,500円)または年額300ドル(約45,000円)で提供されるSuperGrokは、追加の推論とDeepSearchクエリをアンロックし、無制限の画像生成も含まれる。
マスク氏によると、今後—約1週間後くらいにはGrokアプリは「音声モード」を獲得し、Grokモデルに合成音声を与えるという。その数週間後には、DeepSearch機能とともにGrok 3モデルがxAIのエンタープライズAPIを通じて利用可能になるとのことだ。
マスク氏によれば、xAIは今後数ヶ月のうちにGrok 2をオープンソース化する計画だという。
「我々の一般的なアプローチは、次のバージョンが完全にリリースされたときに前のバージョン[のGrok]をオープンソース化することだ」と彼は続けた。「Grok 3が成熟して安定した状態になれば、おそらく数ヶ月以内に、Grok 2をオープンソース化する予定だ」。
Grokの特徴と政治的中立性の課題
マスク氏が約2年前にGrokを発表した際、このAIモデルはエッジーで、フィルターがなく、他のAIシステムが答えない物議を醸す質問に喜んで答えると売り込んだ。例えば、卑猥になるよう指示されると、GrokとGrok 2は喜んで従い、ChatGPTからは聞けないようなカラフルな言葉を吐き出した。
しかし、Grok 3以前のGrokモデルは政治的主題について慎重で、特定の境界を越えなかった。実際、ある研究によれば、Grokはトランスジェンダーの権利、多様性プログラム、不平等などのトピックで政治的に左寄りだったという。
マスク氏はこの行動をGrokのトレーニングデータのせいにし、「Grokをより政治的に中立にシフトさせる」と約束した。xAIがその目標を達成したかどうか、そしてその結果がどうなるかはまだ明らかではない。
引用元:TechCrunch
Elon Musk’s xAI releases its latest flagship model, Grok 3