Midjourney、初のAI動画生成モデル「V1」を発表

MidJourney

  • MidjourneyがDiscord限定で初のAI動画生成モデル「V1」を発表
  • 画像から5秒間の動画を4本生成、最大21秒まで延長可能
  • OpenAIのSora、RunwayのGen 4など競合他社との激しい競争に参入
  • ディズニーとユニバーサルから著作権侵害で訴訟を受けた直後のリリース

Midjourney V1の特徴と機能

AI画像生成分野で最も人気の高いスタートアップの一つであるMidjourneyは6月18日、待望のAI動画生成モデル「V1」の発表を行った。V1は画像から動画を生成するモデルで、ユーザーがアップロードした画像やMidjourneyの他のモデルで生成した画像を基に、4つの5秒間動画を生成する。

Midjourneyの画像モデルと同様に、V1はDiscordでのみ利用可能で、ローンチ時点ではウェブ版でのみ提供される。V1には、ユーザーが動画モデルの出力を制御できるカスタム設定がいくつか用意されている。自動アニメーション設定で画像をランダムに動かすか、手動設定でテキストによる特定のアニメーションを指定できる。

OpenAI Sora、Runway Gen 4との競争激化

V1の発表により、MidjourneyはOpenAIのSora、RunwayのGen 4、AdobeのFirefly、GoogleのVeo 3など他社のAI動画生成モデルとの競争に参入することになる。多くの企業が商用環境での制御可能なAI動画モデルの開発に注力する中、Midjourneyはクリエイティブな人々に対応する独特なAI画像モデルで常に注目を集めてきた。

同社のAI動画モデルは、ハリウッド映画のB-rollや広告業界向けコマーシャル生成以上の大きな目標を持つという。Midjourney CEOのDavid Holz(デイビッド・ホルツ)氏はブログ投稿で、AI動画モデルは「リアルタイムオープンワールドシミュレーション」が可能なAIモデル創造という最終目標への次のステップだと述べている。

Disney・Universal Studios からの著作権侵害訴訟

Midjourney V1モデルの発表は、同スタートアップがハリウッドの著名な映画スタジオであるディズニーとユニバーサルから訴訟を起こされたわずか1週間後のことだった。この訴訟では、MidjourneyのAI画像モデルが生成した画像が、ホーマー・シンプソンやダース・ベイダーなどスタジオの著作権キャラクターを描写していると主張している。

ハリウッドスタジオは、Midjourneyが開発するようなAI画像・動画生成モデルの人気上昇に対処するのに苦労している。これらのAIツールがそれぞれの分野でクリエイターの仕事を代替したり価値を下げたりする可能性への懸念が高まっており、複数のメディア企業がこれらの製品が自社の著作権作品で訓練されていると主張している。

料金体系と利用プラン

Midjourneyは動画生成については通常の画像生成の8倍の料金を課すと発表している。これは、加入者が動画作成時に月次割り当て生成数を画像作成時よりもはるかに早く消費することを意味する。ローンチ時点でV1を試す最も安価な方法は、Midjourneyの月額10ドル(約1,450円)のBasicプランに加入することだ。

月額60ドル(約8,700円)のProプランと月額120ドル(約17,400円)のMegaプランの加入者は、同社の低速「Relax」モードで無制限の動画生成が可能になる。Midjourneyは今後1か月間で動画モデルの価格設定を再評価すると述べている。

技術仕様と将来展望

V1で生成される動画は5秒間の長さだが、ユーザーは最大4回まで4秒ずつ延長できるため、V1動画は最大21秒まで延長可能だ。ユーザーは設定で「低動作」または「高動作」を選択することで、カメラと被写体の動きの量を調整することもできる。

MidjourneyのAI画像モデルと同様に、V1動画の初期デモは超現実的というよりもやや幻想的に見える。V1への初期反応は好意的だが、数か月または数年間市場に出ている他の主要AI動画モデルとの比較での性能は未だ不明だ。

AI動画モデルの後、Midjourneyは3Dレンダリング生成用AIモデルの開発と、リアルタイムAIモデルの開発を計画していると発表している。

引用元:TechCrunch
Midjourney launches its first AI video generation model, V1

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です