在人們的傳統(tǒng)印象里,在實驗室搞研究的都是穿白大褂的科研人員。但在中國科學技術大學(以下簡稱“中國科大”)機器化學家實驗室里,卻是另一番景象:這里沒有一個人,只有動作靈活的機器人在操作臺之間來回穿梭,伸出機械手臂配制試劑。它不僅能夠做實驗,還會自主設計實驗步驟和方案。
這款全球首個集閱讀文獻、設計實驗、自主優(yōu)化等功能于一體,覆蓋化學品開發(fā)全流程的機器化學家平臺,被科研人員形象地稱為“機器化學家”。
實驗室負責人、中國科大化學物理系教授江俊介紹:“從數(shù)百萬種材料的可能組合中找到最優(yōu)解,科研人員也許一生都做不完;有了機器化學家,可能只需要一兩周時間。”
機器化學家融合了大數(shù)據(jù)、人工智能和自動化的強大優(yōu)勢,為化學這一傳統(tǒng)學科提供了新的研究范式。
那么,這款如此聰慧的機器化學家是如何誕生的?時任中國科大化學物理系執(zhí)行主任、現(xiàn)任中國科大合肥微尺度物質科學國家研究中心主任羅毅說:“這是天時、地利、人和的結果?!?/p>
機器化學家“小來”在做實驗。中國科大供圖
天時:科研發(fā)展的必然
2011年底,江俊決定回國加入中國科大,與他在瑞典皇家理工學院攻讀博士學位的導師羅毅再次攜手。
兩人都從事理論和計算化學方面的研究,但各有側重。羅毅主攻解析高分辨單分子化學成像,江俊則更關注材料設計和微觀機理的研究。
2013年底的一天,羅毅與江俊一起出差。在路上,羅毅拋出一個問題:基于獨立事例的理論計算,雖然符合傳統(tǒng)研究范式,但效率太低。有沒有可能通過大數(shù)據(jù)技術提高效率?
江俊經過調研后發(fā)現(xiàn),我國嚴重缺乏科學數(shù)據(jù)的積累,在學術上非常被動。
“我們做了大量研究工作,但最終成果發(fā)表在外文期刊上。引用這些論文數(shù)據(jù)時還得花錢買,并且只有訪問權,不允許大量下載?!苯≌J為,要用好大數(shù)據(jù)技術,必須首先建立數(shù)據(jù)系統(tǒng)。
從2014年起,江俊帶領學生收集教科書、論文、專利中“沉淀”的化學經驗和知識,用3年搭建起“中國人自己的化學材料大數(shù)據(jù)庫”。
有了足夠的數(shù)據(jù)后,接下來的問題就是如何使用。在技術上,人工智能是處理大數(shù)據(jù)最好的手段。然而,這對羅毅、江俊而言是一個全新的工具。
不懂就學,知難而上。他們以自己熟悉的譜學、催化為抓手,應用人工智能方法開展研究,取得了良好的效果。值得一提的是,江俊發(fā)現(xiàn)的多個功能強大的描述符,被《科學》雜志兩次專文推薦。
雖然融合了人工智能技術,但如何用大數(shù)據(jù)解決實際的化學問題,依舊是個挑戰(zhàn)。“因為數(shù)據(jù)本身缺乏知識邏輯的關聯(lián)。”羅毅說。
2017年的一天,羅毅想到一個好點子:可否借助本校兩位教授在發(fā)光材料、催化劑領域的深厚積累,將他們的知識與大數(shù)據(jù)庫融合?
他激動地將江俊叫到辦公室,說:“你把張國慶、熊宇杰發(fā)表的論文全部讀一遍,這樣就能形成一個‘張國慶大腦’、一個‘熊宇杰大腦’。研究發(fā)光材料時,就調用‘張國慶大腦’;設計催化劑時,就調用‘熊宇杰大腦’。這樣一來,我們這些化學知識不足的人也可以用好數(shù)據(jù)了。”
就這樣,江俊和同學們一起對海量文本數(shù)據(jù)進行人工標注,逐步賦予計算機自主閱讀并分析文獻資料的能力,僅用兩年就成功培育出一顆“化學大腦”。
“化學大腦”有了,下一步就是想辦法給大腦配上可以實際操作的“雙手”。
2020年,英國利物浦大學安德魯·庫珀團隊建造了世界首個移動機器人實驗員。研讀完他們發(fā)表的相關文章,江俊信心滿滿地對羅毅說:“我們不但可以讓機器人做實驗,還可以給機器人配上‘化學大腦’?!?/p>
同年,在中國科大的一次交叉學科論壇上,江俊認識了該校信息科學技術學院從事機器人研究的副教授尚偉偉,兩人在聯(lián)手研發(fā)機器化學家上一拍即合。
于是,在江俊的帶領下,他們迅速組織了一個青年團隊,夜以繼日協(xié)同攻關。
2021年12月,全球首個數(shù)據(jù)智能驅動的機器化學家,終于在中國誕生了。它融合“化學大腦”,集成了兩臺移動機器人、19個智能化學工作站和高通量計算系統(tǒng),覆蓋科學研究方法論全流程。
2022年9月,相關研究成果發(fā)表在《國家科學評論》上。審稿專家如此評價:這款機器化學家的“機器人系統(tǒng)、工作站和智能化學大腦都是最先進的”,“將對化學科學產生巨大影響”。
“機器化學家不是某天一拍腦袋就能做出來的?!绷_毅說,“這是我們與時俱進、吸納新知識、利用新技術解決問題的過程,也是持續(xù)進行科研探索的必然結果?!?/p>
地利:多學科交叉的優(yōu)勢
創(chuàng)造出這樣一位能閱讀、能思考、能實踐、能最終解決問題的機器化學家,并非易事。
江俊認為,這主要得益于中國科學院集成攻關的傳統(tǒng)和中國科大寬松的科研環(huán)境、多學科交叉的優(yōu)勢。
他回憶,大數(shù)據(jù)模型建立后,需要在實驗中進一步驗證,這意味著更大的投入。
2021年初,中國科學院發(fā)布了當年基礎前沿和關鍵核心技術中的重大科學問題清單,“數(shù)據(jù)驅動的化學、材料和生物科學的機器科學家”是46個項目之一。
江俊鼓起勇氣,決定“揭榜掛帥”。很快,他的項目申請獲得通過。從2021年到2025年,中國科學院將拿出2000萬元經費,給予江俊團隊連續(xù)5年的穩(wěn)定支持。
也是在2021年,江俊向中國科大提交了一份“‘雙一流’學科重點項目建議表”。學校研究后,給予1000萬元經費支持。同時,中國科大合肥微尺度物質科學國家研究中心、化學與材料科學學院出手相援,為研發(fā)團隊提供了研發(fā)場地、調配了研究設備。
“這種快速決策、快速支持、快速撥款的響應機制給了我很大激勵,也為研究提供了及時、充分的保障。在人工智能領域,技術迭代速度極快,一步落后就會步步落后?!苯≌f。
中國科大還有一個天然優(yōu)勢:這里會聚了不同學科背景的科研人員,他們可以優(yōu)勢互補、協(xié)同攻關,更加快速地把構想變成現(xiàn)實。
例如,機器人是整個平臺中的重要一環(huán)。當初,尚偉偉與江俊商量后,愿意改變團隊的研究方向,專門研發(fā)實驗機器人。
安德魯·庫珀在參觀機器化學家實驗室時,最羨慕的就是江俊他們擁有自己的機器人研發(fā)團隊。江俊頗為自豪地說:“化學機器人指令集的每一行代碼都是我們團隊自己寫出來的,如果要做一個新的動作,可以隨時調整代碼。安德魯·庫珀則必須請公司改代碼,因為他的機器人是買來的?!保ㄓ浾咄趺簦?/p>
研究團隊在控制室分析電催化機器實驗數(shù)據(jù)結果。張大崗 攝
(未完待續(xù))
責任編輯:魏敏