近期,通用大語言模型DeepSeek的橫空出世,標志著人類在人工智能領域前進一大步。未來,智能助手和自動化工具將深刻改變人們的生活和工作方式。
得益于通用AI模型的蓬勃發展,近日,松山湖材料實驗室發布了一件材料科學領域的重磅AI工具:MatChat AI智能體。它是一款專注于材料科學領域的智能問答引擎,基于大語言模型(LLM)與增強搜索技術(RAG),提取了超過28萬篇專業論文構建知識庫。
這款被稱為“材料科學界的DeepSeek”的AI平臺,憑借其專業性和精準性迅速引發行業關注。觀察人士認為,MatChat的發布不僅是技術突破,更標志著垂類科學研發范式的轉變——從經驗驅動轉向“數據+AI驅動”。
當AI能夠將海量文獻轉化為可操作的知識,并鏈接實驗與產業時,垂類科學的創新速度將不再受限于人類個體的認知邊界。對于東莞這座“制造業名城”而言,MatChat或是其從制造躍向“智造”的關鍵拼圖。
從“幻覺回答”到精準溯源
隨著DeepSeek的爆火,不少網友發現,當使用R1模式時,大模型總是在“一本正經地胡說八道”。這并非錯覺,在Vectara HHEM人工智能幻覺測試中,DeepSeek—R1顯示出14.3%的幻覺率。
何謂“幻覺”?幻覺的本質是補白,是腦補。通俗來說,就是AI“胡編亂造”的信息,即AI在回答用戶問題時,對于不知道正確答案的問題,不是明確告知用戶“我不知道”,而是根據已有的知識編出一個聽起來像是對的答案,但實際上是假的、錯誤的,甚至完全不存在的信息。
對于普通咨詢而言,這種腦補無傷大雅,甚至還饒有趣味。但對于科學研究來說,“幻覺”是最大的敵人。中國科學院物理研究所研究員、博士生導師劉淼直言:“科學領域需要的是真實、可驗證的知識,而非想象力。”
正如劉淼所言,MatChat AI基于大語言模型(LLM)與增強搜索技術(RAG),從28萬篇材料科學、物理、化學論文中提取知識,構建了一個垂直領域的知識庫。用戶通過對話即可獲取高度結構化的學術信息,并附有參考文獻和原文鏈接,徹底解決了通用模型中常見的“虛構答案”問題。
例如,當用戶詢問“鈣鈦礦光伏材料的產業應用”時,MatChat不僅能總結關鍵信息,還能精準定位到相關論文的段落與圖表,甚至預測合成路徑。
這種“精準溯源”能力,讓MatChat迅速吸引了4700多名用戶,上線一周即完成27萬次問答,成為科研工作者的智能文獻助手。未來,松山湖材料實驗室將把Atomly材料科學數據庫平臺、“機器人科學家”與MatChat結合起來,掀起一場垂類科學領域“AI+材料”的范式革命。
厚積薄發的“奇襲”
100多年前,當泰坦尼克號航行在大西洋海面上時,出現在船員望遠鏡中的僅是冰山的一角。而船員們看不見的,是冰山之下規模龐大的隱藏部分。
MatChat的發布看似是一次技術“奇襲”,但其根基卻深埋在松山湖實驗室多年的數據積累中。
早在MatChat誕生前,材料實驗室已建成全球領先的材料數據庫Atomly.net,收錄了35萬種材料的晶體結構、熱力學穩定性等計算數據。值得一提的是,這些數據通過密度泛函理論等物理模型生成,精度接近實驗驗證結果,可以直接作用于企業新材料的研發。
劉淼如此描述這一技術迭代:“我們相當于用算力換數據,再用數據訓練AI模型——這是左腳與右腳的交替前進。”
劉淼還介紹,MatChat的研發并非孤立項目,而是材料實驗室“AI+材料”生態的一部分。在人員配備方面,松山湖材料實驗室整合了中國科學院多個院所的力量,形成了跨學科的技術網絡;在平臺建設方面,材料實驗室把Atomly材料科學數據庫平臺、“機器人科學家”與MatChat結合起來,實現從數據預測到實驗驗證的閉環。
值得一提的是,“冰山下的支撐”既包含技術生態的構建,也暗含城市資源與制度創新的深層互動。
一方面,東莞的制造業基礎為材料實驗室提供了試驗場。2023年,實驗室四大公共技術平臺服務企業超400家,創新樣板工廠孵化企業35家,其中靶材、新能源等項目已落地本地產業鏈,為源頭創新提供大量生動熱辣的“材料命題”。
另一方面,東莞積極探索科技體制改革,鼓勵松山湖材料實驗室將科技成果轉化收益的80%分配給科學家團隊,這種“風險共擔、收益共享”的模式,讓無數優秀科技人才魚躍進莞,劉淼介紹,MatChat項目中的代碼構建人員正是來自一線城市的知名“大廠”。
不難發現,“技術+城市”的雙重稟賦,正在重構垂類科學創新范式。從單點突破轉向系統能力競爭,而東莞有望成為中國版“橡樹嶺”的候選者。
從“兩張皮”到產業閉環
在訪談中,劉淼描述了傳統的材料研發模式:假如有一名研發人員在研究一種新型材料,他需要3—5個月時間來檢索了解文獻;然后再驗證這些材料中哪種最穩定,進一步縮小研究范圍;最后進入打樣環節,通過反復測試樣本后,最終得到配適的材料。
在這一過程中,研發人員需耗費數月閱讀文獻、設計實驗,而企業則苦于無法快速獲取可信的科學支持。實驗室和產線之間,似乎總橫亙著一條難以跨越的天塹,這便是人們常說的科技與產業“兩張皮”的問題。
而MatChat的終極目標,是致力于解決科研與產業脫節的“兩張皮”問題。
如何解決?首先是AI帶來的“知識平權”。企業研發人員可直接用自然語言提問,例如“磷酸鐵鋰電池的優化方向”,AI系統將快速提供文獻綜述與數據支撐,降低專業門檻。
其次,材料實驗室將數據庫、MatChat與“機器人科學家”整合為“材料CRO(合同研發組織)”模式。用戶可在線提交需求,由機器人完成合成與測試,形成“數據—模擬—實驗”的工業化流程。這一流程帶來的直接影響是,企業不再受限于自有研發能力,而可以與科研院所、新型研發機構“無縫銜接”,資源共享,從而提升其源頭創新能力。
由于新的理論、方法、技術或觀念的出現,導致原有的研究范式或實踐模式發生根本性變革的過程,被稱為“范式革命”。當通用大語言模型打響第一槍后,眾多以其為“養料”的垂類大模型將層出不窮,深度改變人們的生產和生活方式。在材料領域,“AI驅動的研發”模式正成為新能源、半導體行業的效率引擎,未來,我們或將進入一個“高速創新”的時代。
(記者 唐卓 策劃 戴雙城)
掃一掃,分享到微信朋友圈