12月20日、OpenAI連続発表会の12日目に「o3」、「o3 mini」の登場が発表されました。
「o3」は高度な推論力を持ち、数学・プログラミング・科学分野で人間専門家水準を上回る性能を達成しています。 人間が容易に解けるのに大規模言語モデル(LLM)が解けなかった「ARC-AGI」と呼ばれるベンチマークテストで、「o3」は飛躍的に性能を向上させました。GPT-3が0%(2020年)、GPT-4oが5%(2024年)だったのが、計算リソースを抑えつつ実行した場合75.7%、大量の計算資源を投入した場合87.5%で、人間の水準(85%)を上回る正解率となっています。 「o3 mini」は、コスト効率を重視した軽量版モデルで、2025年1月末に、続いてo3も一般公開予定とのことです。 現状、OpenAIでは、2024年5月からの「ChatGPT-4o」、2024年12月からの「OpenAI o1」、「OpenAI o1 pro」、「OpenAI o1 mini」を用途により使い分ける使い方になります。 Googleでは、2024年2月からの「Gemini 1.5 Pro」、「Gemini 1.5 Flash」(2024年9月にいずれもアップデート)に加え、2024年12月11日「Gemini2.0 Flash Experimental」、12月19日新たな推論AIモデル「Gemini 2.0 Flash Thinking」が発表され、現在使えるようになっています。 Anthropicでは、2024年3月に発表された「Claude 3 Opus」、2024年6月に発表された「Claude 3.5 Sonnet」(2024年10月アップグレード)、2024年10月発表された「Claude 3.5 Haiku」が現在使えます。 これら3社以外にも、次々と新しい大規模言語モデル(LLM)が発表されていますので、用途に応じて使い分けることが出来る時代になってきたと言えます。 o3 preview & call for safety researchers https://openai.com/12-days/ 【転換点直前】o1を越える「o3」登場。性能・特徴を徹底解説 https://chatgpt-lab.com/n/nc3c0040035c1 OpenAI Unveils New Generation Models "o3" and "o3 mini" On December 20, the 12th day of OpenAI's consecutive announcement event, the release of "o3" and "o3 mini" was announced. The "o3" model boasts advanced reasoning capabilities, achieving performance levels that surpass human experts in fields such as mathematics, programming, and science. It demonstrated remarkable improvements in the ARC-AGI benchmark test, which measures tasks that are easy for humans but challenging for large language models (LLMs). While GPT-3 achieved a 0% accuracy rate in 2020 and GPT-4o reached 5% in 2024, "o3" recorded a 75.7% accuracy rate when executed with limited computational resources. When provided with extensive computational resources, it achieved an 87.5% accuracy rate, surpassing the human benchmark of 85%. The "o3 mini" is a lightweight version designed with cost-efficiency in mind. It is scheduled for public release by the end of January 2025, followed by the general release of "o3." Currently, OpenAI offers the "ChatGPT-4o" since May 2024, and "OpenAI o1," "OpenAI o1 pro," and "OpenAI o1 mini" starting from December 2024, which can be used based on specific purposes. Google has also introduced models like "Gemini 1.5 Pro" and "Gemini 1.5 Flash" since February 2024, both of which were updated in September 2024. Additionally, the "Gemini 2.0 Flash Experimental" was announced on December 11, 2024, and is now available. Anthropic offers "Claude 3 Opus," released in March 2024, "Claude 3.5 Sonnet," launched in June 2024 and upgraded in October 2024, and "Claude 3.5 Haiku," introduced in October 2024. Besides these three companies, numerous new large language models (LLMs) continue to be released, allowing users to select models that best suit their specific needs.
0 Comments
Leave a Reply. |
著者萬秀憲 アーカイブ
January 2025
カテゴリー |