AnthropicがClaude音声モードをローンチ、完全な会話体験を提供

Anthropic

  • AnthropicがClaudeチャットボットアプリ向けに音声モード(ベータ版)の展開を開始
  • Claude Sonnet 4モデルを活用し、5つの音声オプションから選択可能
  • Google Workspaceコネクタにより有料ユーザーはカレンダーやGmailにアクセス
  • OpenAI、Google、xAIなど競合他社も同様の音声チャット機能を提供中

Claude音声モードの機能概要とSonnet 4による駆動

Anthropicは同社のClaudeチャットボットアプリ向けに「音声モード」の展開を開始した。現在ベータ版として提供されているこの音声モードにより、Claudeモバイルアプリユーザーは「Claudeとの完全な音声会話」が可能となり、今後数週間で英語版が提供される予定だとAnthropic公式Xアカウントと同社ウェブサイトの更新ドキュメントが発表している。

少なくとも1人のXユーザーが火曜日遅くに音声モードへのアクセスを得たと報告している。デフォルトでは、AnthropicのClaude Sonnet 4モデルによって駆動されている。

音声モード機能の詳細仕様と利用制限

サポートページによると、「音声モードは、手は忙しいが頭は忙しくない時にClaudeを使いやすくし、Claudeに話しかけて音声で応答を聞くことを可能にする」としている。「音声モードは、Claudeが話している間に重要ポイントを画面に表示し、Claudeに話しかけてClaudeの音声応答を聞くことを可能にすることで、Claudeとのやり取り方法を変革する」。

この機能により、ユーザーは文書や画像について音声でチャットでき、5つの異なる音声オプションから選択可能だ。また、テキストと音声を即座に切り替えることができ、会話後には記録と要約を確認できる。

ただし、この機能には一定の制限がある。音声会話は通常の使用上限にカウントされ、Anthropicによると無料ユーザーの大半は20~30回の会話が期待できる。さらに、有料Claudeサブスクライバーのみが、音声モードでGoogleカレンダーの予定やGmailのメールにアクセス可能なGoogle Workspaceコネクタを利用できる(Google Docsの統合はClaude Enterpriseプラン限定)。

競合他社の音声チャット体験との比較

OpenAIを含む多くのAI企業が、それぞれのチャットボット向けに音声チャット体験を提供している。例えば、GoogleはGemini Liveを持ち、xAIはGrok用のVoice Modeを提供している。いずれもユーザーがタイピングの代わりに話すことでボットとやり取りでき、会話をより自然で直感的にしている。

Anthropic CPOが明かした音声機能開発の背景

Anthropic CPOのMike Krieger(マイク・クリーガー)氏は3月初旬のFinancial Timesとのインタビューで、同社がClaude向けの音声機能開発に取り組んでいることを確認した。同報告によると、AnthropicはClaude向けの将来の音声機能を推進するため、同社の主要投資家でありパートナーであるAmazonと、音声に特化したAIスタートアップElevenLabsとの協議を行っていた。

これらのパートナーシップのいずれかが実現したかどうかは不明である。

引用元:TechCrunch
Anthropic launches a voice mode for Claude

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です