OpenAIが開発者向けAPI強化、GPT-5 Pro、Sora 2、音声モデルを発表

OpenAI ChatGPT

  • OpenAIがDev Dayで新APIアップデートを発表、最新言語モデルGPT-5 Proを導入
  • 新しい動画生成モデルSora 2と70%安価な小型音声モデル「gpt-realtime mini」をAPI提供開始
  • GPT-5 Proは金融、法律、医療業界向けに高精度と深い推論能力を提供
  • Sora 2は物理的に一貫性のあるシーンと同期サウンドで、よりリアルな動画生成を実現

OpenAIがDev Dayで新APIモデルを発表

OpenAIは月曜日のDev Dayで新しいAPIアップデートを発表し、最新の言語モデルGPT-5 Pro、新しい動画生成モデルSora 2、そしてより小型で安価な音声モデルを導入した。

このアップデートは、エージェント構築ツールのローンチやChatGPT内でアプリを構築する機能など、開発者をOpenAIのエコシステムに引き付けることを目的とした一連の発表の一部だった。

GPT-5 Proの追加は、金融、法律、医療などのアプリケーションを構築する開発者にアピールする可能性がある。OpenAIのCEO Sam Altman(サム・アルトマン)氏によると、これらの業界は「高い精度と深い推論」を必要としている。

70%安価な新音声モデル「gpt-realtime mini」

Altman氏はまた、音声機能は人々がAIと対話する主要な方法の1つとして急速に普及しており、将来的に不可欠になると指摘した。そのため、OpenAIは、音声とスピーチの低レイテンシストリーミングインタラクションをサポートするAPIの小型で安価な音声モデル「gpt-realtime mini」をローンチしている。新しいモデルはOpenAIの以前の高度な音声モデルより70%安価だが、「同じ音声品質と表現力」を約束している。

最後に、OpenAIの開発者エコシステムに関わるクリエイターは、APIでプレビューとしてSora 2を利用できるようになった。OpenAIは先週、最新のオーディオおよび動画ジェネレーターSora 2を、AI生成の短編動画で満たされたTikTok競合アプリSoraと共にリリースした。Soraアプリを使用すると、ユーザーはプロンプトに基づいて自分、友人、または何でも動画を生成し、TikTokスタイルのアルゴリズムフィードを介して共有できる。

「開発者はSora 2の見事な動画出力を支えるのと同じモデルに、自分のアプリ内で直接アクセスできるようになった」とAltman氏は述べた。

Sora 2の機能強化とクリエイティブコントロール

Sora 2は、前世代を基に、同期サウンドとより優れたクリエイティブコントロールを備えた、よりリアルで物理的に一貫性のあるシーンを構築している。詳細なカメラディレクションからスタイライズされたビジュアルまで対応する。

「例えば、iPhoneビューを取得し、Soraにプロンプトを出して、それを広がりのある映画的なワイドショットに拡張できる」とAltman氏は述べた。「しかし、私たちが取り組んできた中で最もエキサイティングなことの1つは、この新しいモデルがサウンドとビジュアルをどれだけうまくペアリングするかだ。スピーチだけでなく、豊かなサウンドスケープ、アンビエントオーディオ、見ているものに基づいた同期エフェクトだ」

Mattelとの提携とコンセプト開発ツールとしてのSora 2

Sora 2は、コンセプト開発のためのツールとして位置付けられている。製品の一般的な雰囲気に基づいた広告の視覚的な出発点であろうと、スケッチをおもちゃのコンセプトに変えるMattelのデザイナーであろうと。これはAltman氏がDev Dayで提供した例で、バービーメーカーとのOpenAIの契約に光を当てており、生成AIをおもちゃ製造パイプラインに導入することを示している。

引用元: TechCrunch「OpenAI ramps up developer push with more powerful models in its API」

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です