OpenAI、アップグレードした画像生成機能を開発者向けに公開

OpenAI ChatGPT

  • OpenAIが新しい画像生成技術をAPI経由で開発者に提供開始、アプリやサービスへの統合が可能に
  • 「gpt-image-1」モデルは3月末にChatGPTで公開され、リアルなジブリ風写真や「AIアクションフィギュア」で話題に
  • 発表後1週間で7億枚以上の画像が生成され、OpenAIのシステムに大きな負荷
  • Adobe、Airtable、Wix、Instacart、GoDaddy、Canva、Figmaなどの企業がすでに新機能を導入または実験中

OpenAIの強化された画像生成技術が開発者に解放

OpenAIは水曜日、ChatGPTの新しく改良された画像生成機能の背後にある技術をAPIを通じて提供開始し、開発者がこれを自社のアプリやサービスに統合できるようにした。

3月下旬にほとんどのChatGPTユーザーに公開されたOpenAIの新しい画像生成ツールは、リアルなジブリ風の写真や「AIアクションフィギュア」を作成する能力で話題となった。これはOpenAIにとって功罪相半ばするものとなり、ChatGPTの新規登録が数百万件増加する一方で、同社のキャパシティに大きな負担をかけることにもなった。同社によると、このツールが利用可能になった最初の1週間だけで、1億3000万人以上のChatGPTユーザーが7億枚以上の画像を作成したという。

「gpt-image-1」モデルの機能と特徴

OpenAIのAPIでは、画像生成機能は「gpt-image-1」と呼ばれるAIモデルによって提供される。このネイティブマルチモーダルモデルは、様々なスタイルの画像を作成し、カスタムガイドラインに従い、世界知識を活用し、テキストをレンダリングすることができる。

開発者はgpt-image-1を使用して一度に複数の画像を生成し、生成品質—したがって速度—を制御することができる。

安全性とモデレーション機能

OpenAIによると、gpt-image-1はChatGPTでの画像生成と同じ安全ガードレールを採用しており、同社のポリシーに違反するコンテンツの生成を制限する保護機能を含んでいる。開発者はモデレーションの感度を制御でき、標準的なフィルタリングには「auto」、より制限の少ないフィルタリングには「low」を設定できる。提供されたOpenAIのドキュメンテーションによると、低フィルタリングは年齢不適切なコンテンツの潜在的なカテゴリのフィルタリングをより少なくする。

またOpenAIは、gpt-image-1で作成されたすべての画像にC2PAメタデータによる電子透かしが入れられ、対応するプラットフォームやアプリでAI生成として識別できるとしている。

価格設定と企業での活用例

価格はテキストの入力トークンが100万トークンあたり5ドル(約750円)、画像の入力トークンが100万トークンあたり10ドル(約1,500円)、画像の出力トークンが100万トークンあたり40ドル(約6,000円)となっている。(トークンはモデルが処理する生データのビットである。)これはOpenAIによれば、低品質、中品質、高品質の正方形画像の場合、生成される画像1枚あたりそれぞれ約2セント、7セント、19セント(約3円、10円、28円)に相当する。

OpenAIによると、Adobe、Airtable、Wix、Instacart、GoDaddy、Canva、Figmaなどの企業がすでにgpt-image-1を使用または実験している。例えば、FigmaのFigma Designプラットフォームでは、ユーザーはgpt-image-1を通じて画像を生成・編集できるようになり、Instacartはレシピやショッピングリストの画像にこのモデルをテストしている。

引用元:TechCrunch
OpenAI makes its upgraded image generator available to developers

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です