大模型為科學研究裝上“加速器”
來源:科技日報 作者:崔 爽
日期:2025-04-07 16:58:32
人工智能驅動的科學研究(AI for Science)是加速我國科學研究范式變革和能力提升,提高我國科技創新能力,搶占全球科技制高點的重要支撐。中國工程院院士、之江實驗室主任、阿里云創始人王堅認為,人工智能不是一次工具的革命,而是一次科學革命的工具或者是科學革命性的工具。
監測青藏高原水資源,對珊瑚礁進行生態分析,實現自主天文觀測……在AI for Science浪潮下,中國科學院多個研究所正通過接入阿里通義千問QwQ-32B推理大模型,開啟從“上天”到“入地”,從“觀星”到“察水”的科研智能化遠征。
精準預測太陽耀斑爆發
耀斑是太陽最劇烈的活動現象之一,每隔約11年就會大爆發。為了破解耀斑爆發之謎,近年來,學者們從數據驅動角度出發,開始用深度學習、機器學習等技術開展研究。然而,隨著觀測數據的不斷積累和數據特征維度的不斷增加,對算法規模的要求越來越高,研究人員亟需對海量多模態數據進行有效處理。
大模型的出現帶來新解法。在中國科學院國家天文臺,科研人員利用QwQ-32B構建的太陽物理大模型“金烏”,對太陽耀斑活動進行精準預測。
國家天文臺人工智能小組核心成員李瑀旸對科技日報記者介紹,在阿里通義千問系列模型的基礎上,團隊通過監督學習、強化學習,訓練模型理解、回答太陽物理問題,以及認識、分析太陽圖像的能力。其中,太陽耀斑爆發預報任務以SDO(太陽動力學天文臺)衛星公開數據、懷柔基地35厘米磁場望遠鏡數據、“夸父一號”(ASO-S)全日面矢量磁像儀數據為主要數據源進行訓練和測試,預測準確率達到領域內前沿水平。
“天文大模型‘星語3.0’則接入國家天文臺興隆觀測站望遠鏡陣列Mini‘司天’,可自主控制觀測、分析數據并推薦后續計劃。”李瑀旸介紹,“全新升級的‘星語’大模型正在向智能體方向發展,將吸收更多細分領域知識,融合現有科研模型、算法,進一步提升科研效率。”
他還提到,科研對數據安全要求極高,因此,部分科研場景會把模型部署在本地。QwQ-32B可提供相對更低的部署成本,并能滿足相關研究對模型能力的要求。
探尋青藏高原“水密碼”
青藏高原是“世界屋脊”“亞洲水塔”,也是全球對氣候變化響應最敏感的區域之一。第二次青藏科考發現,青藏高原固態水正在快速融化、液態水呈增加趨勢。氣候變化導致的不確定性,會造成青藏高原潛在的水資源和能源保供風險。
面對這一挑戰,中國科學院青藏高原研究所聯合阿里云打造了首個專注于氣候變化適應領域的水—能—糧多模態推理大模型——“洛書”。
水—能—糧耦合是指水資源、能源系統和糧食生產之間復雜的相互依存和影響關系,研究水—能—糧耦合對制定更有韌性的應對策略至關重要。
中國科學院青藏高原研究所助理研究員夏萃慧介紹,“洛書”以研究所自研的科學模型“思源”為底層,依托青藏高原的時空數據訓練而成。其輸出結果包含兩部分:一部分是直接支撐水電生產預測的徑流量,另一部分是精準描繪水文過程的高維數據。“但人類無法直接理解和使用這些數據。‘思源’接入通義千問后,可實現自然語言的查詢和輸出,實現高維數據可視化呈現,一線人員可據此直接進行決策。”夏萃慧說。
更值得一提的是,“洛書”結合“思源”和QwQ-32B,可直接對數據進行推理分析,得出結論。“比如,在枯水期要觀測什么、未來要做哪些工作來適應氣候變化等問題,都可以通過推理大模型得到解釋,從而輔助決策。”夏萃慧說,在這項研究中,團隊還借助阿里云提供的AI計算資源、數據存儲和深度學習平臺,高效處理海量數據和復雜的計算任務,實現對模型的快速實驗和迭代,大幅提升科研效率。
未來,“洛書”還將接入Qwen-VL以實現高效識別圖像數據,并與智能體、具身智能觀測和空天地一體化動態數據中心相協同,共同為青藏高原生態保護與可持續發展提供科技支撐。