毛片网站在线观看-毛片网站在线-毛片网站有哪些-毛片网站视频-女生脱衣服app-女色综合

ABB
關(guān)注中國(guó)自動(dòng)化產(chǎn)業(yè)發(fā)展的先行者!
CAIAC 2025
2025工業(yè)安全大會(huì)
OICT公益講堂
當(dāng)前位置:首頁(yè) >> 資訊 >> 行業(yè)資訊

資訊頻道

僅比金牌低1分,AI達(dá)到國(guó)際數(shù)學(xué)奧賽銀牌水平
  • 點(diǎn)擊數(shù):326     發(fā)布時(shí)間:2024-08-20 23:11:40
  • 分享到:
“這顯然是一個(gè)非常重大的進(jìn)步。”英國(guó)劍橋大學(xué)數(shù)學(xué)家Joseph Myers說(shuō)。他與菲爾茲獎(jiǎng)獲得者Tim Gowers一起,幫助挑選了今年IMO的原始題目并審查了這些解題方案。
關(guān)鍵詞: AI , 數(shù)學(xué)奧賽 , 銀牌

在從圍棋到戰(zhàn)略棋類游戲的所有領(lǐng)域戰(zhàn)勝人類后,美國(guó)谷歌公司旗下的DeepMind表示,它即將在解決數(shù)學(xué)問(wèn)題方面擊敗全球最優(yōu)秀的學(xué)生。

7月25日,DeepMind宣布,其人工智能(AI)系統(tǒng)已經(jīng)解答了本月在英國(guó)巴斯舉行的2024年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽(IMO)6個(gè)題目中的4個(gè)。AI給出了嚴(yán)謹(jǐn)、循序漸進(jìn)的證明,并由兩名頂級(jí)數(shù)學(xué)家打分,得分為28/42,這相當(dāng)于銀牌的成績(jī),僅比金牌差1分。

“這顯然是一個(gè)非常重大的進(jìn)步。”英國(guó)劍橋大學(xué)數(shù)學(xué)家Joseph Myers說(shuō)。他與菲爾茲獎(jiǎng)獲得者Tim Gowers一起,幫助挑選了今年IMO的原始題目并審查了這些解題方案。

DeepMind和其他公司正在競(jìng)相讓機(jī)器最終提供證明,以解決數(shù)學(xué)領(lǐng)域的實(shí)質(zhì)性研究問(wèn)題。該公司表示,IMO的題目已經(jīng)成為實(shí)現(xiàn)這一目標(biāo)的基準(zhǔn),并被視為機(jī)器學(xué)習(xí)的“重大挑戰(zhàn)”。

“這是AI系統(tǒng)首次達(dá)到獎(jiǎng)牌級(jí)別的表現(xiàn)。”DeepMind負(fù)責(zé)AI科學(xué)的副總裁Pushmeet Kohli表示,“這是高級(jí)定理證明過(guò)程中的一座關(guān)鍵里程碑。”

今年1月,DeepMind的AI系統(tǒng)AlphaGeometry在解決一類IMO問(wèn)題——?dú)W幾里得幾何方面取得了獎(jiǎng)牌級(jí)別的成績(jī)。這是第一個(gè)在整體測(cè)試中達(dá)到金牌水平的AI,包括代數(shù)、組合數(shù)學(xué)和數(shù)論。這些問(wèn)題通常被認(rèn)為比幾何更具挑戰(zhàn)性,解決它們將有資格獲得500萬(wàn)美元獎(jiǎng)金。

在最新研究中,研究人員使用AlphaGeometry2在20秒內(nèi)解決了幾何問(wèn)題。DeepMind計(jì)算機(jī)科學(xué)家Thang Luong表示,該AI是他們創(chuàng)紀(jì)錄系統(tǒng)的改進(jìn)版本,速度更快。

對(duì)于其他類型的問(wèn)題,該團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)名為AlphaProof的全新系統(tǒng)。新系統(tǒng)花了3天時(shí)間解決了競(jìng)賽中的兩道代數(shù)題,外加一道數(shù)論題。不過(guò),它無(wú)法解決組合數(shù)學(xué)領(lǐng)域的兩道題。

當(dāng)試圖用語(yǔ)言模型回答數(shù)學(xué)問(wèn)題時(shí),研究人員得到了喜憂參半的結(jié)果。有時(shí),這些模型給出了正確答案,但無(wú)法合理解釋其推理;有時(shí),它們會(huì)胡說(shuō)八道。

據(jù)介紹,AlphaProof將語(yǔ)言模型與強(qiáng)化學(xué)習(xí)技術(shù)相結(jié)合,使用了DeepMind的AlphaZero系統(tǒng),后者成功用于“狙擊”圍棋等游戲以及解決一些特定數(shù)學(xué)問(wèn)題。

在強(qiáng)化學(xué)習(xí)中,神經(jīng)網(wǎng)絡(luò)通過(guò)試錯(cuò)進(jìn)行學(xué)習(xí)。當(dāng)它的答案可以被客觀指標(biāo)評(píng)估時(shí),這種方法就很有效。為此,AlphaProof被訓(xùn)練用一種名為L(zhǎng)ean的正式語(yǔ)言來(lái)閱讀和編寫(xiě)證明,Lean被用于數(shù)學(xué)家常用的同名“證明助手”軟件包。AlphaProof在Lean軟件包中運(yùn)行并測(cè)試其輸出是否正確,這有助于填充代碼中的一些步驟。

訓(xùn)練任何語(yǔ)言模型都需要大量數(shù)據(jù),但Lean中幾乎沒(méi)有數(shù)學(xué)證明。DeepMind機(jī)器學(xué)習(xí)研究員Thomas Hubert表示,為了解決這個(gè)問(wèn)題,團(tuán)隊(duì)設(shè)計(jì)了一個(gè)額外網(wǎng)絡(luò),試圖將現(xiàn)有的100萬(wàn)個(gè)用自然語(yǔ)言編寫(xiě)的問(wèn)題轉(zhuǎn)化成Lean語(yǔ)言,但不包括人工編寫(xiě)的解題方案。

許多Lean的翻譯都是荒謬的,但足夠多的翻譯足以讓AlphaProof開(kāi)啟它的強(qiáng)化學(xué)習(xí)周期。Gowers說(shuō),結(jié)果遠(yuǎn)遠(yuǎn)好于預(yù)期。在某些情況下,AlphaProof似乎能夠提供額外的創(chuàng)造力,在無(wú)限的可能性中做出正確的選擇。但Gowers補(bǔ)充說(shuō),還需要進(jìn)一步分析才能確定。

Myers表示,這些技術(shù)能否完善到在數(shù)學(xué)領(lǐng)域進(jìn)行研究級(jí)別的工作,仍有待觀察。“它能擴(kuò)展到其他類型的數(shù)學(xué)問(wèn)題嗎?在那里可能沒(méi)有100萬(wàn)個(gè)問(wèn)題可以訓(xùn)練。”

來(lái)源:《中國(guó)科學(xué)報(bào)》

熱點(diǎn)新聞

推薦產(chǎn)品

x
  • 在線反饋
1.我有以下需求:



2.詳細(xì)的需求:
姓名:
單位:
電話:
郵件: