科大訊飛登上Nature子刊:AI解化學(xué)奧賽題超越人類選手平均水平
近日,科大刊國際學(xué)術(shù)期刊《通訊-化學(xué)》(Communications Chemistry)刊發(fā)了一項(xiàng)引發(fā)業(yè)界關(guān)注的訊飛研究成果。來自科大訊飛研究院與認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室的登上聯(lián)合團(tuán)隊(duì),構(gòu)建了一套面向化學(xué)領(lǐng)域的解均水多模態(tài)評(píng)測(cè)基準(zhǔn),系統(tǒng)檢驗(yàn)了當(dāng)前主流大模型的化學(xué)科學(xué)推理能力,并首次揭示了AI在處理科學(xué)圖像時(shí)存在的奧賽“視覺失配”現(xiàn)象。
這一發(fā)現(xiàn)被認(rèn)為對(duì)未來科學(xué)智能的題超發(fā)展具有重要參考價(jià)值。
讓AI“看懂”化學(xué)圖表,越人難在哪里?類選
化學(xué)研究離不開分子結(jié)構(gòu)式、反應(yīng)機(jī)理圖、手平實(shí)驗(yàn)裝置示意圖等視覺信息??拼罂c普通圖像識(shí)別不同,訊飛理解這些科學(xué)圖像需要AI同時(shí)具備符號(hào)解析與邏輯推演能力——這恰恰是登上當(dāng)前多模態(tài)大模型的薄弱環(huán)節(jié)。
研究團(tuán)隊(duì)構(gòu)建的解均水USNCO-V評(píng)測(cè)基準(zhǔn),收錄了二十余年美國化學(xué)奧林匹克競(jìng)賽中的化學(xué)473道圖文結(jié)合題目,覆蓋分子結(jié)構(gòu)、實(shí)驗(yàn)裝置、反應(yīng)曲線等多種類型。這一基準(zhǔn)填補(bǔ)了AI for Science領(lǐng)域在化學(xué)視覺推理系統(tǒng)性分析方向的空白。
測(cè)試結(jié)果:頂尖模型超越人類選手平均成績(jī)
研究對(duì)包括GPT-5、OpenAI o3、Gemini-2.5-Pro在內(nèi)的40款主流多模態(tài)大模型進(jìn)行了系統(tǒng)評(píng)估。結(jié)果顯示,表現(xiàn)最佳的GPT-5以93.2%的準(zhǔn)確率位居榜首,顯著超越參賽選手44.6%的平均成績(jī)。
然而,研究也發(fā)現(xiàn)了一個(gè)耐人尋味的現(xiàn)象:部分模型在移除圖像輸入后,答題準(zhǔn)確率反而提升。這一“視覺干擾效應(yīng)”表明,當(dāng)前AI在處理科學(xué)圖像時(shí),視覺與語言模塊尚未實(shí)現(xiàn)真正的協(xié)同工作。
業(yè)內(nèi)專家指出,這一發(fā)現(xiàn)對(duì)于改進(jìn)下一代多模態(tài)模型具有重要指導(dǎo)意義。
人工智能國家隊(duì)的AI for Science版圖
作為國內(nèi)人工智能領(lǐng)域的代表性企業(yè),科大訊飛近年來在AI for Science方向持續(xù)布局。依托認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室和國家新一代人工智能開放創(chuàng)新平臺(tái),該公司已在多個(gè)科學(xué)領(lǐng)域取得進(jìn)展。
據(jù)公開資料顯示,科大訊飛與中國科學(xué)院共建的“星火科研助手”平臺(tái),目前已服務(wù)全國1300余所高校的17萬余名科研人員;在化工領(lǐng)域,其與中科院大連化物所合作研發(fā)的智能化工大模型已迭代至3.0版本;在核聚變研究方向,其團(tuán)隊(duì)聯(lián)合中國科學(xué)技術(shù)大學(xué)在《Nuclear Fusion》發(fā)表的PaMMA-Net模型,突破了等離子體磁測(cè)量演化建模的技術(shù)瓶頸。
值得關(guān)注的是,科大訊飛在推進(jìn)全國產(chǎn)技術(shù)路線方面的努力。該公司強(qiáng)調(diào)其星火大模型實(shí)現(xiàn)了全棧自主可控,從底層算力到上層應(yīng)用均采用國產(chǎn)化方案,這在當(dāng)前國際技術(shù)競(jìng)爭(zhēng)背景下具有特殊意義。
從“語言理解”到“科學(xué)理解”
有分析人士認(rèn)為,此次研究成果的發(fā)表,標(biāo)志著國內(nèi)大模型企業(yè)正從通用智能向科學(xué)智能縱深拓展。當(dāng)AI不僅能夠處理日常對(duì)話,還能理解復(fù)雜的科學(xué)圖表、進(jìn)行專業(yè)領(lǐng)域的邏輯推演時(shí),其應(yīng)用價(jià)值將發(fā)生質(zhì)的飛躍。
不過,研究也坦承當(dāng)前技術(shù)仍存在明顯短板——在分子結(jié)構(gòu)識(shí)別與實(shí)驗(yàn)裝置理解等任務(wù)上,即便是最先進(jìn)的模型也表現(xiàn)欠佳。這意味著AI真正成為科學(xué)家的得力助手,仍有相當(dāng)長(zhǎng)的路要走。
隨著國內(nèi)多家科技企業(yè)加速布局AI for Science賽道,這一領(lǐng)域的競(jìng)爭(zhēng)正在升溫。而此次Nature子刊論文的發(fā)表,或許只是國內(nèi)人工智能國家隊(duì)在科學(xué)智能領(lǐng)域發(fā)力的一個(gè)縮影。
相關(guān)文章

五菱宏光MINI EV失控沖進(jìn)河里 女車主身亡!官方通報(bào)
12月29日消息,湖北天門市公安局日前發(fā)布警情通報(bào)稱,12月27日上午7時(shí)許,我市接官路發(fā)生一起車輛落水事件。接警后,公安機(jī)關(guān)迅速趕往現(xiàn)場(chǎng),聯(lián)合消防部門開展打撈搜救工作。目前,落水車輛已打撈上岸,車內(nèi)2025-12-29
神二十乘組乘神二十一號(hào)飛船回家 返回過程有四組關(guān)鍵動(dòng)作
11月14日消息,據(jù)中國載人航天工程辦公室消息,北京時(shí)間2025年11月14日11時(shí)14分,神舟二十一號(hào)載人飛船與空間站組合體成功分離。后續(xù),神舟二十一號(hào)載人飛船返回艙將在地面指令控制下?lián)駲C(jī)再入返回,2025-12-29
夸克AI眼鏡又一重要專利曝光 合像距可調(diào)節(jié)提升用戶體驗(yàn)
11月14日,記者獲悉,夸克AI眼鏡已經(jīng)提交了一項(xiàng)與近眼顯示調(diào)節(jié)相關(guān)的發(fā)明專利——《智能眼鏡、合像距離調(diào)節(jié)方法和存儲(chǔ)介質(zhì)》公開號(hào):CN120335166A)。該專利使得AI眼鏡2025-12-29
空姐連平底鞋都不用穿了!日航宣布:?jiǎn)T工可自選運(yùn)動(dòng)鞋執(zhí)勤
11月14日消息,據(jù)媒體報(bào)道,昨日,日本航空正式推出重大制服改革——放寬鞋類限制。允許空乘人員、地勤人員穿運(yùn)動(dòng)鞋執(zhí)勤,運(yùn)動(dòng)鞋也可自選。日航表示,不會(huì)統(tǒng)一配發(fā)運(yùn)動(dòng)鞋,而是允許員工2025-12-29
一汽37.44億元入股零跑汽車,將在聯(lián)合研發(fā)、協(xié)同生產(chǎn)及全球布局等領(lǐng)域深化合作
新浪科技訊 12月29日早間消息,中國一汽與零跑汽車舉行簽約儀式,中國一汽全資子公司一汽股權(quán)投資天津)有限公司下稱“一汽股權(quán)”)和一汽旗新動(dòng)力長(zhǎng)春)科技有限公司下稱“旗新動(dòng)力”)分別與零跑汽車簽署投資2025-12-29
男子花3000多元網(wǎng)購顯卡 收到卻是兩本書 店方:退一賠三 正自查原因
11月14日消息,據(jù)媒體報(bào)道,近日,江蘇一網(wǎng)友發(fā)布的一條開箱視頻引起廣泛關(guān)注。據(jù)悉,在視頻中,男子描述稱他“雙十一“花了3000多元網(wǎng)購了電腦顯卡,到貨了卻是兩本書。14日上午2025-12-29
