株式会社LifePromptによると、今年(2025年)の大学入学共通テストをChatGPT o1に解かせる実験を行ったところ正答率が91%になり、東大合格レベルになったということです。昨年(2024年)は、ChatGPT-4で66%だったということで、得点が伸びた要因は、① 図表の読み取りができるようになった、② 数理計算能力が向上した、③ 言語モデル特有のミスが減った、ということです。
一方、英語や数学でのイラストの理解、空間図形の理解、グラフの読み取り、日本史での知識問題でのミスなどが課題になっているようです。 いずれにせよ、ChatGPT o1のレベルの高さを認めざるを得ない結果ではあります。 【共通テスト2025】ChatGPTの正答率9割超…ついに東大合格レベルに https://news.yahoo.co.jp/articles/dd6fab1a29eb77ada003d607b6271d70eabaef10 【ついに9割!】共通テスト2025をChatGPTに解かせてみた https://lifeprompt.net/case/kyotsu-2025 ChatGPT Reaches University of Tokyo Entrance Exam Level According to LifePrompt, when they conducted an experiment to have ChatGPT o1 solve questions from this year's (2025) Common Test for University Entrance, the correct answer rate was 91%, which is the level required to pass the University of Tokyo entrance exam. Last year (2024), the score with ChatGPT-4 was 66%, so the factors that led to the score increase were (1) the ability to read graphs and diagrams improved, (2) the mathematical calculation ability improved, and (3) the number of errors specific to language models decreased. On the other hand, there seem to be problems in understanding illustrations in English and mathematics, understanding spatial figures, reading graphs, and making mistakes on knowledge questions about Japanese history. In any case, the results force us to acknowledge the high level of ChatGPT o1.
0 Comments
Leave a Reply. |
著者萬秀憲 アーカイブ
March 2025
カテゴリー |