當(dāng)前位置：首頁 > 新聞資訊 > 機(jī)器人開發(fā) > 由主動學(xué)習(xí)和AI驅(qū)動的智能自主實驗[Nature Reviews Materials評論文章]

由主動學(xué)習(xí)和AI驅(qū)動的智能自主實驗[Nature Reviews Materials評論文章]

來源：CAAI認(rèn)知系統(tǒng)與信息處理專委會編輯：創(chuàng)澤時間：2023/9/11 主題：其他 [加盟]

近日，MIT材料科學(xué)與工程系李巨、Tonio Buonassisi、任之初等人在Nature Reviews Materials的Comment欄目發(fā)表題為“Autonomous experiments using active learning and AI”的文章，介紹了由主動學(xué)習(xí)和AI驅(qū)動的智能自主實驗。

主動學(xué)習(xí)和自動化并不能讓人類輕松地擺脫實驗室的工作。在它們對新材料研究產(chǎn)生實質(zhì)性的影響之前，我們必須非常仔細(xì)地部署人工智能系統(tǒng)，確保它們能夠穩(wěn)定地運(yùn)行，并且能夠應(yīng)對各種偏差，包括隨機(jī)噪聲（stochastic errors）和因人類對所研究的問題認(rèn)知不足而導(dǎo)致的認(rèn)知性偏差（epistemic errors）。如今，隨著自動化和AI逐漸普及，我們需要認(rèn)真考慮自主實驗室的可重復(fù)性、可重配置性和實驗互通性這些關(guān)鍵因素。

探索新材料是一個勞動密集型過程。愛迪生為了發(fā)明白熾燈泡，測試了數(shù)千種燈絲�，F(xiàn)如今，便宜的自動化設(shè)備讓結(jié)合機(jī)器人和主動學(xué)習(xí)算法的新研究方法成為可能。雖然在預(yù)算和空間有限的情況下，構(gòu)建完全自動化的實驗平臺是非常具有挑戰(zhàn)性的，但是在半自動化的工作流上也可以取得不錯的進(jìn)展。例如，在儀器之間完全可以保留傳統(tǒng)的手動轉(zhuǎn)移樣品，并不一定要使用機(jī)械臂或者是傳送帶之類的自動化。只要實驗結(jié)果高度可重復(fù)，即使使用一些基本的機(jī)器學(xué)習(xí)方法，比如高斯過程回歸和貝葉斯優(yōu)化，就已經(jīng)能很好地解決許多材料優(yōu)化問題。

就像把孩子養(yǎng)大需要幾十年時間，并且在這過程中需要教他們各種各樣的東西一樣，人們不應(yīng)該期望在知識基礎(chǔ)比較有限的情況下，由主動學(xué)習(xí)（active learning）驅(qū)動的實驗一開始就非常有效。這個學(xué)習(xí)過程在開始時往往是非常脆弱的。教一個小孩子走路需要很多手把手的引導(dǎo)，同樣地，驅(qū)動實驗的人工智能在一開始也需要很多指導(dǎo)，即使其調(diào)用的自動化平臺看似十分“穩(wěn)定高效”。

01 認(rèn)知性偏差的挑戰(zhàn)

能夠獲得長期可復(fù)現(xiàn)的數(shù)據(jù)集是自動化平臺有能力開展主動學(xué)習(xí)的衡量標(biāo)準(zhǔn)。當(dāng)一個實驗重復(fù)兩次產(chǎn)生不同的結(jié)果時，差異主要來自兩個方面：偶然性偏差和認(rèn)知性偏差。偶然性偏差源于隨機(jī)性，可以通過提升自動化占比和在模型中引入高斯過程噪聲核來有效緩解，因此相對容易處理。相比之下，認(rèn)知性偏差則可能會影響自主化實驗的成功，尤其是在主動學(xué)習(xí)算法還未經(jīng)過優(yōu)化調(diào)整的情況下。認(rèn)知性誤差，從本質(zhì)上講，就是由于我們科研工作者的“知識偏見”——我們認(rèn)為一些變量在多次試驗中是恒定的，但實際上它們在“悄悄”地變化。

以我們實驗室的自動化滴涂碳基底樣品過程為例，有段時間我們發(fā)現(xiàn)即便是重復(fù)同樣的實驗，樣品的性能差異也很大。直到有一天，我們注意到碳基底可能是各向異性的，也就是說我們切割它的方式（從市場上買來的片狀切成條狀）是一個重要的變量，直接決定了滴涂后樣品擴(kuò)散的方向和最終面積。而在此之前，我們一直很自信地默認(rèn)這個基底是各向同性的。諸如此類的知識偏見，很可能將直接導(dǎo)致整個機(jī)器學(xué)習(xí)項目失敗。

為什么可復(fù)現(xiàn)性對主動學(xué)習(xí)特別關(guān)鍵？手動實驗不也面臨這個問題嗎？答案是肯定的，但人類的經(jīng)驗和靈活性大大緩解了這個問題。想象一個學(xué)生發(fā)現(xiàn)了一種合成方法，重復(fù)了10次，其中2次得到了非常令人興奮的結(jié)果。學(xué)生會怎么做？誤差區(qū)間太大，無法發(fā)表，所以學(xué)生和導(dǎo)師會討論、調(diào)整設(shè)置，最終找出統(tǒng)計異常背后的原因（例如，中間反應(yīng)產(chǎn)品的外來水分含量）。

統(tǒng)計上的異常源于我們沒能找齊決定了實驗結(jié)果的變量全集。如果我們選擇忽略而不是去深入調(diào)查和試圖理解我們漏了哪個隱藏變量，其結(jié)果就是，我們發(fā)現(xiàn)自己的實驗難以復(fù)現(xiàn)。《自然》雜志的一項調(diào)查顯示，文獻(xiàn)中不可復(fù)現(xiàn)性的主要原因是選擇性報告，其本質(zhì)也是類似的——文獻(xiàn)只披露了實驗變量全集的一個子集（也許作者自身也未意識到）。如果我們還沒搞清楚誤差來源就輕率地啟動一個主動學(xué)習(xí)項目，這可能會浪費(fèi)大量時間和金錢。算法會錯誤地將特殊的噪聲視為信號，從而給出糟糕的建議，正所謂“garbage in, garbage out”。

另一方面，如果我們仔細(xì)地去排除認(rèn)知性偏差，找出隱藏變量，可能會有意想不到的科學(xué)發(fā)現(xiàn)，就像青霉素是由于意外真菌污染而未能培養(yǎng)細(xì)菌培養(yǎng)物所發(fā)現(xiàn)的。人類非常擅長扭轉(zhuǎn)“實驗失敗”，因為我們有著出色的因果推理能力（用福爾摩斯的話說，“一旦排除了所有可能性，無論剩下的是多么看似不現(xiàn)實的推論，必定就是事實”）。可惜的是，樸素的主動學(xué)習(xí)方法并做不到這些，因為它們被設(shè)定了過于簡化的世界觀，而且沒有太多先驗的物理知識。

與傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)不同，大型語言模型如ChatGPT能生成科學(xué)上合理的猜想。未來，我們有望利用更先進(jìn)和全面的自主實驗室來驗證這些由大模型生成的假說。比如，我們可以在受控的氣氛反應(yīng)室內(nèi)自動重復(fù)合成程序，以探究實驗結(jié)果對不同氣體分壓的依賴性。隨著自動實驗引入計算機(jī)視覺（在某些方面已超過人類視覺），以及借助于龐大的先驗知識庫，AI系統(tǒng)將能更精確地跟蹤實驗室條件（例如濕度、背景輻射、前體材料的紋理和不均勻性）。因此，隨著AI系統(tǒng)逐漸整合多模態(tài)傳感器，弄清認(rèn)知誤差的可能原因并針對性地調(diào)整工作流程只是時間問題。大型語言模型結(jié)合具有通用感覺運(yùn)動功能的強(qiáng)化學(xué)習(xí)，以及下文所述的“新控制論”，很可能是實驗室自動化革命的下一個步驟。

02 AI驅(qū)動的自主實驗室網(wǎng)絡(luò)

隨著AI系統(tǒng)變得更加復(fù)雜和強(qiáng)大，預(yù)算和空間的限制，模塊化的云實驗室設(shè)施將變得有必要。這類新型實驗室不僅需要能重新編譯和鏈接各種實驗設(shè)備，還需要確保多個自動實驗室之間的互通性。一個包括實驗和理論兩個方面的龐大的AI網(wǎng)絡(luò)將被建立，以實現(xiàn)實驗室級的勞動分工、規(guī)模經(jīng)濟(jì)和互相制衡。例如，當(dāng)某個AI實驗室制備出了具有突破性性能的樣品后，AI網(wǎng)絡(luò)會負(fù)責(zé)將（i）該制備方案發(fā)送至負(fù)責(zé)理論研究的AI實驗室進(jìn)行分析，（ii）在該實驗室本地復(fù)制多份物理樣品并傳送至多個專門負(fù)責(zé)測試的AI實驗室，（iii）制備方案本身分發(fā)至負(fù)責(zé)制備同類型材料的AI實驗室以進(jìn)行對抗性的復(fù)現(xiàn)測試。

今天的材料合成、表征和性能測試的設(shè)備主要是為人類用戶設(shè)計的。未來，自主實驗室每臺設(shè)備都需要具有兩個接口，一個主接口服務(wù)于物聯(lián)網(wǎng)上的AI系統(tǒng)，另一個用于人類操作。每個設(shè)備模塊將更像是軟件庫中的子程序，其物理樣品輸入/輸出規(guī)范將被明確且嚴(yán)格地定義。設(shè)備鏈將具備快速和自動的重配置能力，以滿足不同科研項目的需求。值得注意的是，重新配置并不意味著需要將設(shè)備物理移動以組成一條流水線，因為輪式機(jī)器人和小型無人機(jī)將負(fù)責(zé)模塊之間的樣品傳送。

雖然自主材料研究實驗室的概念早在1950年代就已經(jīng)出現(xiàn)，但至今成功的案例仍然較少。目前在學(xué)術(shù)界，實驗室大多還是以人為核心，且每個實驗室的建設(shè)預(yù)算僅限于幾百萬美元或更少。這通常意味著單個實驗室只有自家“一招鮮”或“幾招鮮”的手段，這使得它們在識別認(rèn)知誤差或迅速適應(yīng)工作流變化方面表現(xiàn)不佳。當(dāng)懷疑有些不尋常的情況發(fā)生時，人類研究員會向校園內(nèi)從事不同領(lǐng)域的同事尋求幫助，請他們進(jìn)行補(bǔ)充測量。這種靈活性在科研探索過程中是非常重要的，反觀我們今天的以機(jī)器和AI為核心的自主實驗室案例，由于規(guī)模太小，還無法做到類似的靈活性。

為了解決這個問題，不同的自主實驗室需要實現(xiàn)更好的協(xié)同工作。例如，讓AI有能力將一個物理樣品及其對應(yīng)的元數(shù)據(jù)從一個實驗室傳送到另一個實驗室。這樣的任務(wù)需要我們建立標(biāo)準(zhǔn)化的數(shù)據(jù)和樣品傳輸協(xié)議，比如規(guī)定用于傳輸液體、粉末、凝膠、顆粒和單晶材料的膠囊，它們需要與易于稱重、尺寸測量以及光學(xué)和化學(xué)表征設(shè)備相兼容，還需要能有效防止外界污染。此外，我們可能還需要重新考量設(shè)計建筑和基礎(chǔ)設(shè)施，例如無人或者是機(jī)器人和人類研究人員共同工作的全新的建筑架構(gòu)。

AI時代已經(jīng)來臨。為了在實驗研究和材料發(fā)現(xiàn)中充分釋放AI的潛力，為硅基智慧提供“手”（材料合成加工/樣品轉(zhuǎn)移/設(shè)備模塊重組）和“眼睛”（材料表征/多模態(tài)感測）至關(guān)重要。建立一個穩(wěn)健的AI對于現(xiàn)實世界的感知反饋系統(tǒng)絕非易事。但是，隨著AI實驗室的正確配置和相互鏈接（核心是標(biāo)準(zhǔn)化接口和模塊化設(shè)備），以及全球廣泛共享的專業(yè)知識，強(qiáng)大的AI自主實驗室可能會徹底改變材料研究。

未來云端實驗室可以被建設(shè)在太陽能/風(fēng)能充足的荒漠中，科研人員可以從全世界任意一個地方控制云端實驗室。園區(qū)內(nèi)的兩大主體——數(shù)據(jù)流和物質(zhì)流，將分別由互聯(lián)的AI網(wǎng)絡(luò)和機(jī)器人網(wǎng)絡(luò)負(fù)責(zé)運(yùn)載。（本圖由MidJourney + Adobe Firefly生成）

云端實驗室內(nèi)部由一個個的模塊組成。每一個模塊就像一個代碼中的函數(shù)，有著清楚的輸入輸出規(guī)范，例如輸入的材料樣品必須符合某個標(biāo)準(zhǔn)化的尺寸/形態(tài)。不同模塊之間由輪式機(jī)器人或小型無人機(jī)進(jìn)行樣品傳送。

由主動學(xué)習(xí)和AI驅(qū)動的智能自主實驗[Nature Reviews Materials評論文章]

Nature Materials: 膠體機(jī)器人，小小身體卻無窮潛力

大模型與智能機(jī)器人結(jié)合,用語言指導(dǎo)機(jī)器人抓取物體

控制器在機(jī)器人運(yùn)動控制系統(tǒng)中發(fā)揮核心作用

機(jī)器人整體電子電氣結(jié)構(gòu)以電控系統(tǒng)為基礎(chǔ)

氣壓/液壓驅(qū)動型機(jī)器人靈巧手特點(diǎn)

電機(jī)驅(qū)動型機(jī)器人靈巧手特點(diǎn)

驅(qū)動器混合置型機(jī)器人靈巧手特點(diǎn)

驅(qū)動器內(nèi)置型機(jī)器人靈巧手特點(diǎn)

驅(qū)動器外置型機(jī)器人靈巧手特點(diǎn)

機(jī)器人多指靈巧手經(jīng)歷了三個階段

機(jī)器人靈巧手是指數(shù)≥3，自由度≥9 的末端執(zhí)行器

智能類人機(jī)器人特斯拉擎天柱 (Optimus) 執(zhí)行機(jī)構(gòu)分析

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺

由主動學(xué)習(xí)和AI驅(qū)動的智能自主實驗[Nature Reviews Materials評論文章]

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)