Hugging Face、DeepSeekの「推論」AIモデルのオープンソース版開発に着手

DeepSeek

  • Hugging Faceが「オープンな知識」を目指し、DeepSeekのR1モデルの複製プロジェクトを開始。
  • 768台のNVIDIA H100 GPUを活用し、数週間での複製を目指す。
  • AIの民主化とオープンソース開発の重要性を強調、コミュニティベースの開発を推進。
  • GitHubで3日間で1万スターを獲得し、高い注目を集める。

Open-R1プロジェクトの始動

DeepSeekの「推論」AIモデルR1の発表から1週間も経たないうちに、Hugging Faceの研究者たちが「オープンな知識」の追求を掲げ、このモデルの完全な複製に挑戦している。Hugging Faceの研究責任者Leandro von Werra(レアンドロ・フォン・ヴェラ)氏らのエンジニアチームは、R1の複製版を構築し、トレーニングデータを含むすべてのコンポーネントをオープンソース化することを目指すOpen-R1プロジェクトを立ち上げた。

このOpen-R1モデルは複数のベンチマークでOpenAIのo1推論モデルと同等かそれ以上の性能を示している。推論モデルとしてのR1は自己事実確認を行い、通常のモデルが陥りやすい落とし穴を回避する。一般的な非推論モデルと比較して解決までに数秒から数分長くかかるものの、物理学、科学、数学などの分野でより信頼性の高い結果を出す傾向にある。

オープンソース化への取り組み

Hugging Faceのエンジニアの一人であるElie Bakouch(エリー・バクーチ)氏は「R1モデルは印象的だが、オープンなデータセット、実験の詳細、中間モデルが公開されておらず、複製や更なる研究が困難だ」と語った。「R1の完全なアーキテクチャをオープンソース化することは、単なる透明性の問題ではなく、そのポテンシャルを解き放つことだ」と述べている。

Open-R1プロジェクトの具体的計画

Open-R1プロジェクトは、Hugging FaceのScience Cluster(768台のNVIDIA H100 GPUを備えた専用研究サーバー)を活用し、数週間でのR1複製を目指している。エンジニアチームは、R1の作成に使用されたものと同様のデータセットを生成し、Hugging FaceとGitHubでAIコミュニティからの協力を得ながらトレーニングパイプラインを構築する計画だ。

すでにGitHubでは3日間で1万件のスターを獲得するなど、高い関心を集めている。スターはGitHubユーザーがプロジェクトへの支持や有用性を示す指標となる。

Bakouch氏は、「R1のレシピが複製されれば、GPUをレンタルできる人なら誰でも独自のデータで独自のR1バリアントを構築できるようになり、技術がさらに広く普及する」と述べている。「最近のオープンソースリリースがAIにおけるオープン性の役割を強化していることに興奮している。これは、一握りの研究所だけが進歩を遂げられるという従来の考えを覆す、重要な転換点となる」と語った。

引用元:TechCrunch
Hugging Face researchers are trying to build a more open version of DeepSeek’s AI ‘reasoning’ model

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です