|
2026年3月25日、汎用人工知能(AGI)の実現に不可欠な「知能」を測定するための新たなベンチマーク「ARC-AGI-3」が公開され、現在のAIの性能は1%未満と極めて低く、最強クラスのモデルでもほぼ解けない状況であることがわかりました。 前モデルのARC-AGI-2ベンチマークが2025年3月24日に公開されてから、AIが70%以上の性能を達成するまでにかかった期間は約11ヶ月でした 。GoogleのGemini 3 Deep Thinkが2026年2月12日に正答率84.6%を記録し、このマイルストーンを初めて達成しました。 2026年3月25日に公開されたばかりのARC-AGI-3は、静的なパズル解決からインタラクティブな環境でのエージェント的知能の測定へとパラダイムを大きく転換させており、AIにとって質的により困難な課題となっています。この質的な困難さを考慮すると、ARC-AGI-3で70%以上のスコアを達成するには、ARC-AGI-2よりも長い期間かかると考えられているようです。少なくとも1.5年から2年以上を要すると予測されています。 生成AIに、「ARC-AGI-3」で生成AIが70%以上のスコアを達成するにはどのくらいの期間がかかりそうか、深掘りさせました。なお、生成AIによる調査・分析結果は、公開された情報からだけの分析であり、必ずしも実情を示したものではないこと、誤った情報も含まれていることについてはご留意されたうえで、ご参照ください。 ARC-AGI-3: A New Challenge for Frontier Agentic Intelligence ARC Prize Foundation ∗ March 24, 2026 https://arcprize.org/media/ARC_AGI_3_Technical_Report.pdf 2026年03月26日 AIの知能をルール不明のゲームで測定する「ARC-AGI-3」が登場、AIはまだクリアできないが人間には100%クリアできるゲームを実際にプレイ可能 https://gigazine.net/news/20260326-arc-agi-3/ When will generative AI achieve a score of over 70% on “ARC-AGI-3”? On March 25, 2026, a new benchmark, “ARC-AGI-3,” was released to measure the kind of “intelligence” considered essential for achieving Artificial General Intelligence (AGI). The results revealed that current AI performance is extremely low—below 1%—with even the most advanced models barely able to solve the tasks. For the previous benchmark, ARC-AGI-2, it took approximately 11 months from its release on March 24, 2025, for AI to surpass the 70% performance threshold. Google’s Gemini 3 Deep Think achieved an accuracy of 84.6% on February 12, 2026, marking the first time this milestone was reached. ARC-AGI-3, released on March 25, 2026, represents a major paradigm shift—from solving static puzzles to evaluating agent-like intelligence in interactive environments. This makes the tasks qualitatively more challenging for AI. Considering this increased level of difficulty, it is expected that achieving a score of over 70% on ARC-AGI-3 will take longer than it did for ARC-AGI-2. Current estimates suggest it may require at least 1.5 to 2 years or more. I asked generative AI to explore in depth how long it might take for AI to surpass the 70% threshold on ARC-AGI-3. Please note that the analysis and insights generated by AI are based solely on publicly available information and may not fully reflect reality; they may also contain inaccuracies. Your browser does not support viewing this document. Click here to download the document. Your browser does not support viewing this document. Click here to download the document. Your browser does not support viewing this document. Click here to download the document. Your browser does not support viewing this document. Click here to download the document. Your browser does not support viewing this document. Click here to download the document. Your browser does not support viewing this document. Click here to download the document. Your browser does not support viewing this document. Click here to download the document. Your browser does not support viewing this document. Click here to download the document. Your browser does not support viewing this document. Click here to download the document.
0 Comments
Leave a Reply. |
著者萬秀憲 アーカイブ
January 2026
カテゴリー |
RSS Feed