DeepSeek、R1推論AIモデルを更新しHugging Faceで公開 – 6,850億パラメータのオープンソースモデル

DeepSeek

  • 中国スタートアップDeepSeekがR1推論AIモデルの更新版をHugging Faceで公開
  • MITライセンスで商用利用可能、6,850億パラメータの大規模モデル
  • WeChat投稿で「マイナーアップデート」と発表、詳細な改善内容は未公開
  • OpenAIモデルに匹敵する性能で注目、米国では国家安全保障上の懸念も

DeepSeek、R1推論AIモデルの更新版をHugging Faceで公開

中国のスタートアップDeepSeekは水曜日の朝、WeChatでの発表後、開発者プラットフォームHugging Face上R1推論AIモデルの更新版をリリースした。

商用利用が可能な寛容なMITライセンス下にある更新版R1は、DeepSeekのWeChat発表によると「マイナー」なアップグレードだという。Hugging Faceのリポジトリにはモデルの説明は含まれておらず、設定ファイルとウェイト(モデルの動作を導く内部コンポーネント)のみが含まれている。

6,850億パラメータの大規模モデル、コンシューマー機器では動作困難

更新版R1は6,850億パラメータのサイズで、かなり重量級だ(「パラメータ」は「ウェイト」と同義)。無修正では、このモデルはコンシューマーグレードのハードウェアでは動作できない可能性が高い。

DeepSeekは今年初頭、OpenAIのモデルに匹敵する性能を持つR1のリリース後に注目を集めた。このスタートアップは米国の一部規制当局の怒りを買っており、彼らはDeepSeekの技術が国家安全保障上のリスクをもたらすと主張している。

引用元:TechCrunch
DeepSeek updates its R1 reasoning AI model, releases it on Hugging Face

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です