OpenAI:ChatGPT音声モードの裏にあるLiveKit技術、リアルタイム通信の実現に貢献

OpenAI ChatGPT

  • OpenAIのChatGPT音声モードはLiveKitのリアルタイム通信技術によって支えられている
  • LiveKitはリアルタイムの音声・動画配信を構築するためのオープンソースソフトウェアパッケージ
  • OpenAIを含むSpotify、Meta、Microsoft等の大手テック企業がLiveKitの主要顧客に
  • リアルタイム通信技術の進化がOpenAIの音声インターフェース開発を加速させる可能性

OpenAIのChatGPT音声モードを支えるLiveKit技術

OpenAIのChatGPT音声モードの背後には、高度なリアルタイム通信技術が不可欠だ。多くのAI企業や大手テック企業が直面する課題の一つが、高帯域マルチモーダルデータをリアルタイムで中断なくユーザーに配信することである。OpenAIもこの課題に対応するため、専門技術を持つパートナーに目を向けた。

OpenAIがChatGPT音声モードに採用したのは、ラス・ディサ(Russ d’Sa)氏とデビッド・ジャオ(David Zhao)氏が2021年に創設したLiveKitだ。このオープンソースソフトウェアパッケージは、リアルタイムの音声と動画を送信できるアプリケーション構築を可能にしている。OpenAIは高品質な音声対話を実現するためにこの技術を選択した。

OpenAIのような企業がLiveKitを選ぶ理由は明確だ。LiveKitは現在「クラウドプラットフォームとオープンソース製品全体で500社以上の有料顧客と10万人以上の開発者」を抱え、「米国の緊急通報911の約25%のバックボーン」として機能している。このような信頼性と実績がOpenAIの選択に影響したと考えられる。

OpenAIを含む著名テック企業が採用するLiveKit

LiveKitの創業者によると、「Spotify、Oracle、Redditのような大企業がLiveKitを試験的に使用し、クラウドホスト版を求めてきた」ことがきっかけで事業化が進んだという。OpenAIもこの流れに乗り、ChatGPT音声モードの基盤技術としてLiveKitを採用した。

OpenAIのChatGPTが提供する高品質な音声対話体験の裏には、LiveKitが提供するSDK、ツール、APIがある。これによりOpenAIはユーザーとAIのスムーズな音声コミュニケーションを実現している。同様のメリットを求め、Spotify、Meta、Microsoftといった技術大手も同技術を採用している。

LiveKitはカリフォルニア州サンノゼに本拠を置き、現在エンジニアリングと製品チームの拡大—約50人を雇用—とコアインフラの拡張に注力している。また「弾力的なエージェント計算サービス」と呼ばれる、チャットボットのような音声「エージェント」を自動的にスケーリングできる製品も開発中だ。この技術が進化すれば、OpenAIの音声対話技術もさらに向上する可能性がある。

LiveKitの財務状況も堅調で、昨年の年間換算売上高は1,000万ドル(約15億円)を超えた。最近、Altimeterが主導し、Redpoint VenturesとHanabi Capitalが参加する4,500万ドル(約67億5,000万円)のシリーズBラウンドの資金調達も完了している。こうした資金力を背景にした技術開発が、OpenAIのような先端企業のAI音声技術のさらなる進化を支えていくだろう。

引用元:TechCrunch
LiveKit’s tools power real-time communications, including OpenAI’s Voice Mode

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です