&

{中美AI“考生”東大入學(xué)考：英語超群數(shù)學(xué)短板，能否預(yù)示AI未來？）

更新時(shí)間：2025-04-09來源：網(wǎng)絡(luò)

近期，據(jù)日經(jīng)新聞披露的一項(xiàng)聯(lián)合研究成果顯示，中美兩國的新型生成式人工智能（AI）已經(jīng)展現(xiàn)出令人矚目的學(xué)術(shù)能力，成功跨越了日本頂尖學(xué)府——東京大學(xué)理科3類入學(xué)考試的門檻。這一突破性進(jìn)展是通過對比測試美國OpenAI的“o1”模型與中國AI初創(chuàng)企業(yè)DeepSeek的“R1”模型得出的。

測試內(nèi)容涵蓋了2025年度的東京大學(xué)入學(xué)考試科目，由AI初創(chuàng)公司Life Prompt提供答案輸出，并由知名預(yù)備學(xué)校河合塾的專業(yè)講師進(jìn)行評分。結(jié)果顯示，在兩個(gè)基礎(chǔ)模型的表現(xiàn)中，o1獲得了374分，R1緊隨其后，取得了369分，均超過了東大理科3類合格的最低分?jǐn)?shù)線368.7分。

值得注意的是，盡管R1在理科1類和理科2類的共通考試中未能達(dá)到合格線，但在其他類別，包括文科在內(nèi)，它與o1均成功“合格”。這一表現(xiàn)不僅展示了AI在跨學(xué)科應(yīng)用上的潛力，也反映了其在學(xué)術(shù)評估中的廣泛適用性。

在具體的考試科目中，英語成為了AI模型的強(qiáng)項(xiàng)。o1和R1在英語部分的得分率均超過了75%，河合塾的英語講師久恒秀雄對此評價(jià)道：“這兩個(gè)模型在英語表達(dá)上幾乎沒有單詞和語法的錯誤，其水平遠(yuǎn)遠(yuǎn)超過了東大考生的平均水平?！?/p>

然而，在數(shù)學(xué)科目上，盡管AI模型能夠正確解答出不少最終答案，但在圖形處理和論證問題上卻頻繁出現(xiàn)論述錯誤和說明不足的情況。在滿分為120分的理科數(shù)學(xué)考試中，o1得了38分，R1得了49分，這一成績顯著低于合格者的平均分。負(fù)責(zé)數(shù)學(xué)評分的香坂季京講師指出：“AI在數(shù)學(xué)論證上的表現(xiàn)還有待提高?！?/p>

對于這一研究成果，自2011年起便致力于“機(jī)器人能否進(jìn)入東京大學(xué)”項(xiàng)目的國立信息學(xué)研究所新井紀(jì)子教授給予了高度評價(jià)：“這是AI成長歷程中的一個(gè)重要里程碑。然而，我們也必須認(rèn)識到，AI有時(shí)會給出令人困惑甚至錯誤的答案。因此，培養(yǎng)能夠正確判斷并熟練使用AI輸出的人才顯得尤為重要。”

相關(guān)資訊

日韩成年人电影在线观看_国产成人无码免费精品_美女自慰无遮亚洲一区_国产变态强奷在线播放

{中美AI“考生”東大入學(xué)考：英語超群數(shù)學(xué)短板，能否預(yù)示AI未來？）

{中美AI“考生”東大入學(xué)考：英語超群數(shù)學(xué)短板，能否預(yù)示AI未來？）