走進(jìn)中科院上海有機(jī)化學(xué)研究所綜合樓一樓,一條人工智能(AI)化學(xué)實驗線正在進(jìn)行測試。如果一切順利,它將在今年上半年正式投入使用。一位博士生花五年時間才能獲得的數(shù)據(jù),在這里只需一個月就能完成。而且,實驗不會受到個人的實驗技術(shù)水平、心情好壞、數(shù)據(jù)偏好等影響,可以確保實驗數(shù)據(jù)規(guī)范準(zhǔn)確。
人工智能驅(qū)動的科學(xué)研究(AI for Science)正在推動科研范式變革。AI在解放科學(xué)家雙手、提高科研效率和準(zhǔn)確性的同時,也在催生更多創(chuàng)新。在科學(xué)數(shù)據(jù)、算法、算力的支撐下,面向科研“第五范式”的智能化科學(xué)設(shè)施,將實現(xiàn)“AI科研助手+操作機(jī)器人+智能實驗環(huán)境+可信多方協(xié)作”的高效迭代。
常規(guī)實驗觀察高度依賴人的體力和經(jīng)驗,而基于AI算法的無人實驗將顛覆這一切。比如這條由上?茖W(xué)家研發(fā)的AI化學(xué)實驗線猶如一位“機(jī)器化學(xué)家”,讓人類專家告別簡單勞動,將智力集中于最前沿的創(chuàng)新探索。而這種“身邊的變革”不僅發(fā)生在化學(xué)合成領(lǐng)域,不少新材料、藥物發(fā)現(xiàn)等領(lǐng)域的實驗室都已經(jīng)與AI融合相伴,一個全新的科研時代已然來臨。
告別搖試管、守儀器,節(jié)省三分之二的時間精力
根據(jù)實驗方案,稱量取樣、放入通風(fēng)櫥開始實驗,再將樣品送入儀器分析——實驗數(shù)據(jù)在送達(dá)研究者手中的同時,也進(jìn)入數(shù)據(jù)庫。無需多時,實驗分析報告就傳到了研究人員手中。這就是AI化學(xué)實驗線未來的工作模式。
負(fù)責(zé)搭建AI化學(xué)實驗線的上海有機(jī)所研究員左智偉覺得,實驗線最大的優(yōu)點之一就是可以把博士生從搖試管、守儀器這類簡單重復(fù)勞動中解脫出來,“至少可以節(jié)省他們?nèi)种臅r間和精力”。
事實上,無論有機(jī)、無機(jī)材料,抑或生物制藥,實驗步驟具有相當(dāng)?shù)墓餐ㄐ,主要以取樣、順序加料、設(shè)定反應(yīng)條件、分析實驗結(jié)果為主。這些程序性事務(wù)正是機(jī)器所擅長的。
之所以決定將引入AI這件事付諸行動,基于左智偉的一個粗略計算:五年學(xué)習(xí)畢業(yè)時,一名碩博連讀生通常會有15本實驗記錄本,多的可能有30本。按每本100頁計算,一般平均每頁會有兩條有效數(shù)據(jù),那就相當(dāng)于可以積累6000條反應(yīng)數(shù)據(jù)。而AI化學(xué)實驗線可以24小時運(yùn)轉(zhuǎn),同時進(jìn)行多個實驗,只需一個月就能完成一個博士生五年的積累。
從事熱電材料研究的中國科學(xué)院上海硅酸鹽研究所陳立東研究員也有同樣的感觸。在國家科技部和上海市科委的支持下,上海多所高校與硅酸鹽所聯(lián)合開展了基于材料基因工程的新材料探索研究。得益于高通量計算、數(shù)據(jù)挖掘研究平臺的建立,新型熱電材料的篩選與性能優(yōu)化的速度獲得了成倍提升。
科研提速的同時,實驗室收獲的還有寶貴的研究智力。在左智偉看來,科研“體力活”的大幅減少,可讓實驗室里的年輕人把更多精力投入到對科學(xué)問題的思考中。而且,有AI幫助,人類專家萌生的各種科研想法能夠更快地執(zhí)行,“預(yù)測—分析—改進(jìn)—再實驗”的認(rèn)知螺旋式上升也會推進(jìn)得更快。最為重要的是,年輕人的科研興趣不會被枯燥重復(fù)的實驗所消磨,這會吸引更多人投身科研,從整體上加速科技創(chuàng)新。
從存量數(shù)據(jù)中“淘寶”,突破數(shù)據(jù)和算法瓶頸
人類從事科學(xué)研究的范式一直在“迭代”。幾千年前是經(jīng)驗范式,幾百年前是理論范式,幾十年前是計算范式,十幾年前是數(shù)據(jù)范式,而今是AI范式。近年來,“AI for Science”正在引發(fā)一場科學(xué)革命。AI在預(yù)測蛋白質(zhì)結(jié)構(gòu)、自然語言學(xué)習(xí)上的表現(xiàn),不斷在社會上引發(fā)高度關(guān)注。在這股變革大潮下,科學(xué)家們最關(guān)心的是如何實現(xiàn)數(shù)據(jù)和算法這兩大核心要素的突破。
為發(fā)展AI化學(xué),從2021年起,中科院上海有機(jī)所從國內(nèi)外引進(jìn)了多位青年人才,組成了20多人的研究團(tuán)隊,專攻AI驅(qū)動的有機(jī)合成。薛小松就是其中之一。“數(shù)據(jù)庫是目前面臨最大的難題。”他坦言,機(jī)器學(xué)習(xí)需要大量數(shù)據(jù),應(yīng)用也受限于數(shù)據(jù)。國外很久之前就開始布局科研數(shù)據(jù)庫,在這方面有著豐厚的積累;相比之下,國內(nèi)大量優(yōu)秀論文發(fā)表在國外期刊上,有些“先天不足”。
為此,左智偉正帶領(lǐng)團(tuán)隊努力挖掘存量實驗數(shù)據(jù)。畢竟,“發(fā)表論文只會用到一小部分?jǐn)?shù)據(jù),而且往往帶有結(jié)果導(dǎo)向的偏見”。而實驗過程中會對成千上萬種新催化劑、新配體進(jìn)行研究,從這些存量數(shù)據(jù)中“淘”到AI訓(xùn)練所需要的“寶”,概率相當(dāng)高。同時,他們也期待實驗線早日啟動,因為AI實驗所產(chǎn)生的大量數(shù)據(jù),也可用來“投喂”訓(xùn)練算法模型。“計算除了需要數(shù)據(jù)輸入,還需要給出算法、模型和判據(jù)。”陳立東說,早在十年前,國外就提出了“材料基因”的概念,而這正是如今“AI+材料”的前身,“可以說,材料就在那里,就看你用哪種工具去挖掘、去發(fā)現(xiàn)”。比如,北京科技大學(xué)謝建新教授就通過大數(shù)據(jù)挖掘,發(fā)現(xiàn)了一些傳統(tǒng)合金性能最好的區(qū)域,使其長期以來未獲突破的材料力學(xué)性能得到了進(jìn)一步提升。
AI加盟科研,科學(xué)家的發(fā)現(xiàn)意識比以往更重要
“AI已這么能干了,還需要科學(xué)家嗎?”面對這樣的疑問,大多數(shù)科學(xué)家似乎并未驚慌失措。他們很清楚,AI是一種得力工具,可讓更多研究者將智力集中于最前沿的創(chuàng)新。
大約十年前,中科院上海硅酸鹽所研究員史迅的一位學(xué)生,在實驗中無心插柳發(fā)現(xiàn)了一種“砸不碎”的半導(dǎo)體,具有金屬延展性。后來,研究組發(fā)現(xiàn)其中蘊(yùn)藏著一些新機(jī)制,可惜用傳統(tǒng)試錯的實驗方法很難獲得有效結(jié)果。于是,研究組運(yùn)用高通量篩選的方法,很快得到了一批具有類似性能的材料。
史迅認(rèn)為,“AI+材料”還處于起步階段,需要廣泛的學(xué)科交叉來建立研究體系。目前,上海硅酸鹽所已建立起了計算材料研究中心、材料基因研究中心,為所內(nèi)外不同方向的研究團(tuán)隊提供合作平臺,拓展人工智能與材料研發(fā)的融合場景。
在迎接AI助手的同時,科學(xué)家愈發(fā)認(rèn)識到“發(fā)現(xiàn)意識”的重要。不少研究者認(rèn)為,在日?蒲杏(xùn)練中,學(xué)生仍需要學(xué)會動手做實驗,善于發(fā)現(xiàn)實驗中的“秘密”。因為基礎(chǔ)研究中的許多重大發(fā)現(xiàn),往往就隱藏于“異常”的實驗結(jié)果中。
“有了‘機(jī)器化學(xué)家’,可能會影響學(xué)生對于實驗的深刻理解,因為對實驗現(xiàn)象的觀察被AI的加入屏蔽掉了,我們還需要找到其他訓(xùn)練方式來彌補(bǔ)這些隱性損失。”左智偉說,AI目前看來還無法主動思考實驗過程中的機(jī)理,所以在為AI建立實驗?zāi)P蜁r,需要學(xué)生對科學(xué)問題的本質(zhì)有更深入的了解與思考,未來一部分不具備獨立思考能力的學(xué)生,很可能會被淘汰。
中國-博士人才網(wǎng)發(fā)布
聲明提示:凡本網(wǎng)注明“來源:XXX”的文/圖等稿件,本網(wǎng)轉(zhuǎn)載出于傳遞更多信息及方便產(chǎn)業(yè)探討之目的,并不意味著本站贊同其觀點或證實其內(nèi)容的真實性,文章內(nèi)容僅供參考。