幾百年來,數(shù)學家使用的工具依然簡樸:一張紙、一支筆。他們憑借邏輯與靈感,在符號的迷宮中尋找通往真理的路徑。
為了打破這一局面,美國國防高級研究計劃局今年4月啟動了“指數(shù)性數(shù)學”計劃,旨在開發(fā)一種能極大提升數(shù)學研究效率的人工智能(AI)“合著者”系統(tǒng)。
幾十年來,數(shù)學家借助計算機進行輔助計算或驗證命題,如今的AI或許能更上層樓,挑戰(zhàn)那些人類長年未解的難題。不過,從能解高中題的AI,到能協(xié)助攻克前沿數(shù)學難關的AI,中間仍隔著一道鴻溝。
圖片來源:物理學家組織網(wǎng)
解決重大難題仍力不從心
大型語言模型(LLM)并不擅長數(shù)學。它們常常出現(xiàn)“幻覺”,甚至可能被誤導相信2+2=5。但新一代大型推理模型,如OpenAI的o3、Anthropic的Claude 4 Thinking等,展現(xiàn)出的進步令數(shù)學家眼前一亮。
今年,這些模型在美國數(shù)學邀請賽中的表現(xiàn)接近優(yōu)秀高中生水平。不同于過去“一錘定音”式的輸出,這些模型開始嘗試模擬數(shù)學家逐步推理的思考過程。
同時,一些將LLM與某種事實核查系統(tǒng)相結合的新型混合模型也取得了突破。例如,谷歌“深度思維”的AlphaProof系統(tǒng)將語言模型與棋類AI——AlphaZero結合,成為首個取得與國際數(shù)學奧林匹克競賽銀牌得主成績相當?shù)南到y(tǒng)。今年5月,谷歌的AlphaEvolve模型更進一步,在多個長期未解的數(shù)學與計算難題上找到優(yōu)于人類現(xiàn)有方案的解法。
美國《麻省理工科技評論》指出,盡管這些AI成績亮眼,但專家們普遍認為,它們?nèi)圆痪邆湔嬲膮f(xié)助科研的能力。競賽題雖難,卻更像是智力游戲,有一定“套路”。真正的數(shù)學研究則更開放、更復雜。面對“P vs NP”“黎曼猜想”等重大難題時,AI仍力不從心。
為了更準確地評估AI的能力,初創(chuàng)公司Epoch AI去年推出了FrontierMath測試,聯(lián)合60多位數(shù)學家設計出全新高難度題目,避開模型已見過的訓練數(shù)據(jù),結果LLM幾乎集體“交白卷”。
這些測試表明,AI在數(shù)學道路上雖已邁步,但離“合著者”角色仍有很長一段路要走。
需攻克“超長推理鏈”
仔細觀察數(shù)學問題會發(fā)現(xiàn),它們在某些方面類似:解決問題需完成一系列連續(xù)步驟,關鍵在于找到這些步驟。
美國加州理工學院謝爾蓋·古科夫指出,困難的差異往往體現(xiàn)在路徑的長度上。高中數(shù)學可能只需10到40步,而像黎曼猜想這樣的難題,路徑可能長達百萬步。
這類“超長路徑”極難處理。就像下圍棋時尋找一條制勝序列,AI必須在指數(shù)級增長的可能路徑中找到正確解法。而在數(shù)學中,這個復雜度要遠超棋類游戲。
據(jù)物理學家組織網(wǎng)今年2月報道,為應對這一挑戰(zhàn),古科夫團隊開發(fā)了一種方法,將多個步驟打包成“超級步驟”,相當于穿上“巨人靴”跨越大段路程。他們設計了一個系統(tǒng),其中強化學習模型負責提出超級步驟,另一個模型負責驗證其合理性。
該策略在經(jīng)典未解難題——安德魯斯-柯蒂斯猜想上取得了突破。雖然尚未證明或推翻該猜想,但借助AI,科學家推翻了一個40年來被廣泛引用的“反例”。這曾被視為證明該猜想錯誤的關鍵依據(jù)。
牛津大學數(shù)學家馬丁·布里森對此表示肯定:“排除錯誤路徑,是科研中非常有價值的一步。”
古科夫相信,這種“壓縮路徑”的思路適用于所有需要推理鏈條的領域。他希望,這種方法不僅能推動AI跳出固有模式,也為數(shù)學研究帶來新突破。
真正的創(chuàng)新和突破仍屬人類
跳出思維定式,正是數(shù)學家攻克難題的關鍵。數(shù)學常被看作機械推理,而高等數(shù)學則更像是一場實驗,充滿一波三折的試錯與靈光乍現(xiàn)的頓悟。
這正是AlphaEvolve等AI工具的優(yōu)勢所在。它通過LLM不斷生成并改進解題代碼,配合第二個模型評估每一輪結果,最終提出比人類更優(yōu)的解法。這種方法不僅能獨立探索,也支持人類隨時介入,提供靈感和指令。
澳大利亞悉尼大學數(shù)學家喬迪·威廉姆森強調(diào),探索性思維是數(shù)學的核心。據(jù)英國《新科學家》網(wǎng)站報道,他與Meta合作開發(fā)了PatternBoost AI系統(tǒng),可根據(jù)一個數(shù)學想法生成相似概念,幫助激發(fā)靈感。他說:“這就像是這里有一堆有趣的東西,我不知道是怎么回事,但你能再生成一些類似的東西嗎?”
這種頭腦風暴在數(shù)學中至關重要,它是新想法產(chǎn)生的源泉。以二十面體為例——古希臘人通過純粹推理發(fā)現(xiàn)了它,其形狀并不存在于自然界中,卻深刻影響了數(shù)學的發(fā)展。威廉姆森希望,AI未來也能協(xié)助發(fā)現(xiàn)類似的“新數(shù)學對象”。
不過,目前AI仍缺乏真正的創(chuàng)造力。讓AI贏棋是一回事,讓它發(fā)明圍棋游戲則是另一回事。像AlphaEvolve和PatternBoost這樣的工具或許能作為人類直覺的“偵察兵”,幫助人們發(fā)現(xiàn)路徑、避開死路,但專家普遍認為,真正的創(chuàng)新與突破,仍然屬于人類。
關鍵詞:
凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨家版權所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。
- AI成為數(shù)學家得力助手還要多久2025-06-19
- AI成為數(shù)學家得力助手還要多久2025-06-19
- 真皮沙發(fā)多久保養(yǎng)一次比較好?真皮沙發(fā)保養(yǎng)2025-06-19
- 2025海峽科技專家論壇舉辦2025-06-19
- 基因編輯技術構建出人類抗衰老細胞2025-06-19
- 國產(chǎn)航空明星產(chǎn)品齊聚巴黎航展2025-06-19
- 國產(chǎn)航空明星產(chǎn)品齊聚巴黎航展2025-06-19
- AI成為數(shù)學家得力助手還要多久2025-06-19
- 加濕器出霧量小是什么原因?加濕器霧量一般2025-06-19
- 全鏈條構建智算人才生態(tài)2025-06-19
- 膩子怎么刮又快又平?刮膩子一般幾天能干?2025-06-19
- 全鏈條構建智算人才生態(tài)2025-06-19
- 聆聽和獨攀是什么梗?聆聽和獨攀是什么意思2025-06-19
- 開盒是什么意思?開盒是什么梗?2025-06-19
- momo是什么梗?什么是momo?2025-06-19
- 496工作制是什么梗?什么是496工作制?2025-06-19
- 嫵媚大主播是什么梗?什么是嫵媚大主播?2025-06-19
- 人形機器人產(chǎn)業(yè)向?qū)嵱眠M化2025-06-19
- 北京市推動人工智能賦能新型工業(yè)化2025-06-19
- 股票天地板和地天板是什么意思?2025-06-19
- 借助高科技 “慧眼”識文物2025-06-19
- 基金認購和申購有什么不同?什么是基金認購2025-06-19
- 借助高科技 “慧眼”識文物2025-06-19
- 云養(yǎng)貓是什么意思?什么是云養(yǎng)貓?2025-06-19
- 稅收數(shù)據(jù)顯示:“人工智能+”行動深入推進2025-06-19
- 肺霧小狗是什么意思?肺霧小狗是什么梗?2025-06-19
- 長城炮是什么意思?長城炮是什么梗?2025-06-19
- 房山季鳥猴是什么意思?房山季鳥猴是什么梗2025-06-19
- 跳科目三是什么意思?跳科目三是什么梗?2025-06-19
- IEEE專家展望人工智能機器人如何助力養(yǎng)老2025-06-18
資訊
焦點
- 海量學校和專業(yè)怎么選?出分前要做哪些準備?招辦主任支招
- 第三屆數(shù)字新疆創(chuàng)新發(fā)展論壇在克拉瑪依舉辦
- 中國選手首奪攀巖世界杯攀石項目冠軍
- 吃了粒“減肥神藥”,連吐3天去急診 濫用處方藥減肥現(xiàn)象調(diào)查
- 快閃再次開進三里屯 業(yè)績放緩的瓏驤如何突圍輕奢困局
- 規(guī)范“6·18”促銷 市場監(jiān)管總局發(fā)布合規(guī)提示
- 臺風“蝴蝶”生成!瓊州海峽全線停運,海南多景區(qū)暫停營業(yè)
- 北京學者出新書 探尋中國式現(xiàn)代化的文化之“根”
- 定價發(fā)行對股票市場有什么影響?定價發(fā)行是好事還是壞事?
- YP是什么意思?YP是什么梗?