- 中国スタートアップDeepSeekがR1推論AIモデルの更新版をHugging Faceで公開
- MITライセンスで商用利用可能、6,850億パラメータの大規模モデル
- WeChat投稿で「マイナーアップデート」と発表、詳細な改善内容は未公開
- OpenAIモデルに匹敵する性能で注目、米国では国家安全保障上の懸念も
DeepSeek、R1推論AIモデルの更新版をHugging Faceで公開
中国のスタートアップDeepSeekは水曜日の朝、WeChatでの発表後、開発者プラットフォームHugging Face上でR1推論AIモデルの更新版をリリースした。
商用利用が可能な寛容なMITライセンス下にある更新版R1は、DeepSeekのWeChat発表によると「マイナー」なアップグレードだという。Hugging Faceのリポジトリにはモデルの説明は含まれておらず、設定ファイルとウェイト(モデルの動作を導く内部コンポーネント)のみが含まれている。
6,850億パラメータの大規模モデル、コンシューマー機器では動作困難
更新版R1は6,850億パラメータのサイズで、かなり重量級だ(「パラメータ」は「ウェイト」と同義)。無修正では、このモデルはコンシューマーグレードのハードウェアでは動作できない可能性が高い。
DeepSeekは今年初頭、OpenAIのモデルに匹敵する性能を持つR1のリリース後に注目を集めた。このスタートアップは米国の一部規制当局の怒りを買っており、彼らはDeepSeekの技術が国家安全保障上のリスクをもたらすと主張している。
引用元:TechCrunch
DeepSeek updates its R1 reasoning AI model, releases it on Hugging Face