- DeepSeekが新たなマルチモーダルAIモデル「Janus-Pro」を発表、DALL-E 3を上回る性能を主張。
- オープンソースで商用利用可能なモデルファミリーを公開、1億から7億のパラメータ規模で展開。
- 画像生成と分析の両方に対応し、複数のベンチマークでトップクラスの性能を示す。
Janus-Proモデルの特徴と性能
急成長中のAI企業DeepSeekが、OpenAIのDALL-E 3を上回る性能を持つとされる新たなマルチモーダルAIモデル群を発表した。AI開発プラットフォームHugging Faceで公開された「Janus-Pro」と名付けられたこのモデルファミリーは、1億から7億のパラメータ規模で展開される。パラメータ数はモデルの問題解決能力とおおよその相関があり、一般的にパラメータ数が多いモデルほど高い性能を示す傾向にある。
Janus-ProはMITライセンスの下で公開され、商用利用に制限がない点が特徴だ。
引用元:Hugging Face
技術的優位性と制限
DeepSeekは、Janus-Proを「革新的な自己回帰フレームワーク」と説明している。同社によると、最大モデルのJanus-Pro-7Bは、GenEvalとDPG-Benchという2つのAI評価ベンチマークにおいて、DALL-E 3やPixArt-alpha、Emu3-Gen、Stability AIのStable Diffusion XLといった競合モデルを上回る性能を示した。
引用元:Hugging Face
比較対象のモデルの一部は比較的古く、また大半のJanus-Proモデルは384 x 384ピクセルまでの小規模な画像しか分析できないという制限がある。しかし、モデルのコンパクトなサイズを考慮すると、その性能は注目に値する。
DeepSeekの急成長と業界への影響
量的取引会社High-Flyer Capital Managementを主要な資金源とする中国のAI研究所DeepSeekは、そのチャットボットアプリがApple App Storeでトップに躍り出たことで、今週一躍注目を集めた。同社が開発した計算効率の高いトレーニング手法を用いた言語モデルは、米国がAI開発競争での優位性を維持できるのか、またAIチップへの需要が持続するのかという疑問を、多くのウォール街のアナリストや技術者たちの間に投げかけている。
引用元:TechCrunch
Viral AI company DeepSeek releases new image model family