Anthropic新Claude 4 AIモデルが多段階推論を実現、Opus 4とSonnet 4で業界最高水準を目指す

Claude

  • AnthropicがClaude Opus 4とClaude Sonnet 4を発表、多段階推論と複雑なタスク実行が可能
  • プログラミングタスクに特化した調整を実施、コード作成・編集に最適化
  • Opus 4は1500万ドル/7500万ドル、Sonnet 4は300万ドル/1500万ドルのトークン単価
  • 2027年に120億ドル(約1兆8000億円)の収益目標、競合他社との激しい開発競争

Claude 4ファミリーの主要機能と性能向上

木曜日に開催された初の開発者会議で、Anthropicは業界最高水準と主張する2つの新AIモデルを発表した。Claude 4ファミリーに属するClaude Opus 4とClaude Sonnet 4は、大規模データセットの分析、長期タスクの実行、複雑なアクションの実行が可能だという。両モデルはプログラミングタスクで優れた性能を発揮するよう調整されており、コードの作成と編集に適している。

有料ユーザーと無料チャットボットアプリのユーザーはSonnet 4にアクセス可能だが、Opus 4は有料ユーザーのみ利用できる。AnthropicのAPI、AmazonのBedrockプラットフォーム、GoogleのVertex AI経由では、Opus 4が1500万ドル/7500万ドル(約225万円/約1125万円)、Sonnet 4が300万ドル/1500万ドル(約45万円/約225万円)のトークン単価で提供される。

トークン単価と処理能力の詳細

トークンはAIモデルが処理する生データの単位である。100万トークンは約75万語に相当し、これは「戦争と平和」より約16万3000語長い分量となる。

Anthropicの収益目標と市場戦略

Claude 4モデルの発表は、同社が大幅な収益成長を目指す中で行われた。元OpenAI研究者らが設立した同社は、今年の予想収益22億ドル(約3300億円)から2027年には120億ドル(約1兆8000億円)の収益を目標としている。Anthropicは最近25億ドル(約3750億円)のクレジットファシリティを締結し、Amazonや他の投資家から数十億ドルを調達した。これは最先端モデル開発に伴う費用増加に備えたものだ。

OpenAI、Googleとの激しい競争環境

競合他社はAI競争での優位性維持を容易にしていない。AnthropicはClaude Sonnet 3.7とエージェント型コーディングツール「Claude Code」を今年初めに発表したが、OpenAIやGoogleなどの競合他社は強力なモデルと開発ツールで同社を上回ろうと競争を繰り広げている。

Opus 4とSonnet 4の技術的特徴

今回発表された2つのモデルのうち、より高性能なOpus 4は、ワークフローの多くのステップにわたって「集中した努力」を維持できるという。一方、Sonnet 3.7の「ドロップイン代替品」として設計されたSonnet 4は、従来モデルと比較してコーディングと数学で改善され、より正確に指示に従うとしている。

Claude 4ファミリーは、Sonnet 3.7と比較して「報酬ハッキング」に関与する可能性が低いとAnthropicは主張している。報酬ハッキングは仕様ゲーミングとも呼ばれ、モデルがタスクを完了するためにショートカットや抜け穴を利用する行動である。

ベンチマーク性能と安全性対策

これらの改善により、すべてのベンチマークで世界最高のモデルが生まれたわけではない。例えば、Opus 4はコーディング能力を評価するSWE-bench VerifiedでGoogleのGemini 2.5 ProやOpenAIのo3、GPT-4.1を上回るが、マルチモーダル評価MMMMやPhD レベルの生物学、物理学、化学関連の質問セットGPQA Diamondではo3を上回ることはできない。

それでも、Anthropicは強化された有害コンテンツ検出器やサイバーセキュリティ防御を含む、より厳格な安全対策の下でOpus 4をリリースしている。同社の内部テストによると、Opus 4はSTEM背景を持つ人物が化学、生物学、核兵器を取得、製造、展開する能力を「大幅に向上」させる可能性があり、Anthropicの「ASL-3」モデル仕様に達している。

ハイブリッドモデルによる推論機能

Opus 4とSonnet 4はどちらも「ハイブリッド」モデルであり、ほぼ瞬時の応答と深い推論のための拡張思考が可能だという(AIが人間が理解するような「推論」や「思考」ができる範囲で)。推論モードをオンにすると、モデルは回答前に与えられた問題の可能な解決策をより多くの時間をかけて検討できる。

モデルが推論する際、思考プロセスの「ユーザーフレンドリーな」要約を表示するとAnthropicは述べている。なぜ全体を表示しないのか?部分的にはAnthropicの「競争上の優位性」を保護するためだと、同社はTechCrunchに提供したドラフトブログ投稿で認めている。

Claude Codeの機能拡張

モデルをプログラマーにとってより使いやすくするため、Anthropicは前述のClaude Codeのアップグレードを展開している。開発者がターミナルから直接Anthropicのモデルを通じて特定のタスクを実行できるClaude Codeは、現在IDEと統合され、開発者がサードパーティアプリケーションと接続できるSDKを提供している。

今週初めに発表されたClaude Code SDKは、サポートされているオペレーティングシステム上でClaude Codeをサブプロセスとして実行することを可能にし、Claudeモデルの機能を活用するAI駆動のコーディングアシスタントやツールを構築する方法を提供している。

Microsoft、JetBrains、GitHubとの統合

AnthropicはMicrosoftのVS Code、JetBrains、GitHub向けにClaude Code拡張機能とコネクターをリリースした。GitHubコネクターにより、開発者はClaude Codeをタグ付けしてレビュアーのフィードバックに応答したり、コードのエラー修正やその他の変更を試行したりできる。

AIモデルは依然として質の高いソフトウェアのコーディングに苦労している。コード生成AIは、プログラミング論理を理解する能力などの弱点により、セキュリティ脆弱性やエラーを導入する傾向がある。それでも、コーディング生産性を向上させる約束が企業と開発者を急速に採用に駆り立てている。

これを十分に認識しているAnthropicは、より頻繁なモデル更新を約束している。同社はドラフト投稿で「より頻繁なモデル更新にシフトし、画期的な機能を顧客により迅速に提供する安定した改善の流れを届ける。このアプローチにより、モデルを継続的に改良・強化する中で、最先端を維持できる」と記述している。

引用元:TechCrunch
Anthropic’s new Claude 4 AI models can reason over many steps

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です