- OpenAIが週末にChatGPTのAdvanced Voice機能をアップデート、より自然で流暢な音声対話を実現
- 微細なイントネーション、リアルな話し方、共感や皮肉などの感情表現が向上
- 新たに言語翻訳機能が強化され、継続的な通訳が可能に
- 有料ユーザー全体で利用可能だが、音質の軽微な低下や幻覚バグは未解決
ChatGPT Advanced Voice機能の大幅改善
ChatGPTの会話音声モードが大幅なアップグレードを受けた。週末にかけて、OpenAIはユーザーがChatGPTと音声で対話できるAdvanced Voice機能のアップデートを展開した。同社によると、ChatGPTの音声は現在、より自然で流暢になり、「微細なイントネーション」、「リアルな話し方」(間合いや強調を含む)、そして共感や皮肉といった感情に対するより「的確な表現力」を備えているという。
言語翻訳機能の強化
音声モードでは、ユーザーがより簡単に言語翻訳を行えるようになった。ChatGPTに通訳を依頼すると、ユーザーが停止を指示するか別の言語に切り替えるまで、会話の翻訳を継続する機能が追加された。
全有料ユーザー向けに展開
この機能は、すべての市場とプラットフォームの有料ChatGPTユーザーが利用可能となっている。OpenAIは、「トーンやピッチの予期しない変動」を含む音質の軽微な低下が発生する可能性があると述べ、今回のアップデートは音声モードで時折発生する幻覚関連のバグ(意図しない音、意味不明な言葉、背景音楽など)を修正するものではないと注記した。
技術的改善の詳細
今回のアップデートにより、ChatGPTの音声は以下の点で改善された:
微細なイントネーションの向上により、より人間らしい話し方を実現。リアルな話し方では、自然な間合いや適切な強調が加えられ、会話がより流暢になった。感情表現の面では、共感や皮肉といった複雑な感情をより的確に表現できるようになっている。
残存する技術的課題
OpenAIは、アップデートにも関わらず一部の技術的問題が残存していることを認めている。音質に関しては軽微な低下が発生する可能性があり、特にトーンやピッチの予期しない変動が報告されている。また、音声モードで時折発生する幻覚現象による意図しない音や意味不明な発話、背景音楽の再生といったバグについては、今回のアップデートでは解決されていない。
ユーザー体験の向上
このアップデートにより、ChatGPTとの音声対話はより自然で直感的なものとなった。特に言語翻訳機能の強化により、多言語環境でのコミュニケーションがより円滑に行えるようになっている。継続的な翻訳機能は、リアルタイムでの国際的なコミュニケーションを大幅に改善すると期待される。
引用元:TechCrunch
OpenAI updates ChatGPT’s voice mode with more natural-sounding speech