DeepMind、数学・科学問題に特化した新AIツール「AlphaEvolve」を発表 ハルシネーション抑制と実用化へ

DeepMind Google

  • GoogleのAI研究部門DeepMindが、機械的に評価可能な解を持つ問題に取り組むための新しいAIシステム「AlphaEvolve」を開発したと発表した。
  • AlphaEvolveは、自動評価システムを導入することで、AIの課題であるハルシネーション(偽情報の生成)を抑制する仕組みを持つ。
  • Geminiモデルを活用しており、一部の数学問題で既知の最良解を再発見したり、改善された解を見つけたりする性能を示した。
  • Google社内のAIモデル学習最適化などに実用的な効果を示しており、今後、選ばれた研究者向けの早期アクセスプログラムが計画されている。

DeepMind、問題解決特化型AI「AlphaEvolve」開発

GoogleのAI研究開発ラボであるDeepMindは、機械的に採点可能な、すなわち自動的に正誤を判断できる解を持つ問題に取り組むための新しいAIシステム「AlphaEvolve」を開発したと発表した。このシステムは、特に数学や科学分野の問題解決に威力を発揮することが期待されている。

ハルシネーション抑制と自動評価の仕組み

多くのAIモデルは、時には自信満々に事実とは異なる情報を生成するハルシネーションという課題を抱えている。DeepMindによれば、最新のAIモデルでもこの問題は依然として難しい。AlphaEvolveは、このハルシネーションを抑制するための巧妙なメカニズムとして、自動評価システムを導入している。

このシステムは、複数のモデルを使用して問題に対する可能性のある回答群を生成し、それぞれの回答を批判的に検討する。その後、生成された回答を自動的に評価し、その精度に基づいてスコアリングを行うことで、信頼性の高い解にたどり着こうとする仕組みである。

Geminiモデル活用と能力、そして限界

DeepMindは、AlphaEvolveが最新のGeminiモデルを活用している点が、これまでの同様のAIシステムよりも能力を著しく向上させていると主張する。ユーザーは問題文に加えて、指示、方程式、コードスニペット、関連文献などを任意で入力でき、さらにシステムの回答を自動評価するための計算式(メカニズム)を提供する必要がある。

ただし、AlphaEvolveには限界もある。自動評価可能な問題にpenか対応できないため、コンピュータサイエンスやシステム最適化といった分野の特定の種類の問題にしか適用できない。また、解をアルゴリズムとしてしか記述できないため、数値的でない問題には適していないという大きな制約がある。

実用的な成果と今後の展開

DeepMindはAlphaEvolveの性能を評価するため、幾何学から組み合わせ論まで約50問の数学問題でベンチマークを実施した結果、既知の最良解を75%の確率で「再発見」し、20%のケースで既知の解よりも優れた解を見つけ出したと報告している。

さらに、DeepMindはGoogle社内のインフラ最適化など、実用的な問題でも AlphaEvolve を評価した。その結果、GoogleのAIモデル学習にかかる全体時間を1%削減する最適化案を提示したり、Googleのデータセンターにおける全世界の計算リソースを平均0.7%継続的に回復させるアルゴリズムを生成したりするなど、具体的な成果を上げたと主張している。これにより、専門家が他の重要な作業に集中できるよう、時間の節約に貢献できるとしている。

AlphaEvolveは主に各分野の専門家による利用を想定しており、DeepMindはユーザーインターフェースの開発を進めているほか、選ばれた研究者向けの早期アクセスプログラムを立ち上げた後、より広範な展開を検討する計画である。

引用元:TechCrunch
DeepMind claims its newest AI tool is a whiz at math and science problems

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です