研究背景
在材料科學領域,數據驅動方法已成功應用于結構明確的硬材料的發現和預測。粘附水凝膠作為一類重要的軟材料,在高端應用中需求廣泛。
關鍵問題
然而,數據驅動軟材料的設計主要存在以下問題:
1、軟材料的設計極具挑戰性
凝膠和彈性體等軟材料的復雜多尺度結構-性能關系以及弱分子相互作用和熱波動的影響,使得開發準確的預測理論或計算模型變得困難,材料發現往往依賴于反復的實驗試錯。
2、粘附水凝膠的水下粘附性能受限
盡管粘附水凝膠應用前景廣闊,但實現即時、牢固且可重復的水下粘附仍是一個長期挑戰。現有研究中單體類型多樣,難以形成一致的數據集或簡單的設計原則來優化性能。將生物學洞察(如粘附蛋白)轉化為合成策略并實現機器學習的外推預測,仍然是端到端設計模型的主要難題。
新思路
有鑒于此,北海道大學龔劍萍、范海龍、Wei Li、Ichigaku Takigawa等人提出了一種數據驅動的方法,集成了數據挖掘、實驗和機器學習,從頭開始設計高性能的粘附水凝膠,以適應苛刻的水下環境。通過利用蛋白質數據庫,開發了一種描述符策略,通過理想的隨機共聚在聚合物鏈中統計復制蛋白質序列模式,從而實現了有針對性的水凝膠設計和數據集構建。利用機器學習,從180個仿生水凝膠的初始數據集中優化了水凝膠配方,實現了粘附強度的顯著提高,最大值超過1?MPa。這些超粘合水凝膠在從生物醫學工程到深海探測等不同的應用中具有巨大的潛力,標志著軟材料在數據驅動創新方面的顯著進步。
技術方案:
1、提出了一種全新的數據驅動方法
本研究提出新數據驅動方法,通過整合數據挖掘、實驗驗證和機器學習,成功設計出高性能水下粘附水凝膠,助力多領域應用。
2、詳述了數據挖掘過程
作者從NCBI數據庫提取24,707個粘附蛋白數據,分析前200個物種,通過多序列比對和氨基酸分類,設計出180種水凝膠配方。
3、闡述了180種數據挖掘驅動水凝膠的合成過程
作者合成180種水凝膠,通過1H NMR確認競聚率,蒙特卡洛模擬驗證序列特征,16種水凝膠表現出強大粘附力,證明數據驅動方法有效。
4、展示了如何利用機器學習進一步提高水凝膠的粘附強度
作者利用機器學習優化水凝膠粘附強度,通過高斯過程和隨機森林回歸模型,結合序貫優化,發現BA、PEA和ATAC協同作用可顯著增強粘附性。
5、評估了性能最佳的ML驅動水凝膠與最佳DM驅動水凝膠的性能
結果表明。ML驅動水凝膠(R1-max)性能優于DM驅動水凝膠(G-max),在多種基材上展現高粘附性、耐久性和生物相容性,適用于惡劣環境。
技術優勢:
1、首次提出并實施了一個端到端設計框架
作者首次提出并實施了一個整合數據挖掘、實驗驗證和機器學習迭代優化的端到端設計框架,成功解決了軟材料復雜結構-性能關系帶來的設計難題。通過從生物粘附蛋白中提取序列特征并結合機器學習模型優化,實現了高性能水凝膠的從頭設計,使得水凝膠的粘附強度達到了超過1 MPa的“超級粘附”水平。
2、成功設計并合成了超粘附水凝膠
通過統計復制生物粘附蛋白的特征序列,成功指導了合成水凝膠的設計,并明確了特定單體組合對水下粘附性能的關鍵貢獻。所開發的超粘附水凝膠不僅在嚴苛的水下環境(如深海、高壓水泄漏)中表現卓越,而且具有良好的生物相容性。
技術細節
數據驅動的超粘附水凝膠從頭設計
研究提出了一種全新的數據驅動方法,巧妙地整合了數據挖掘(DM)、實驗驗證和機器學習(ML),旨在實現高性能水下粘附水凝膠的從頭設計。首先,通過挖掘蛋白質數據庫,作者開發了一種描述符策略,以統計學方式在聚合物鏈中復制蛋白質序列模式,從而指導了水凝膠的設計并構建了初始數據集。隨后,利用機器學習對由180種生物啟發水凝膠組成的初始數據集進行了優化,最終使得水凝膠的粘附強度取得了顯著突破,最高值超過1 MPa。這種超粘附水凝膠在生物醫學工程和深海探索等多樣化應用中具有巨大潛力,標志著軟材料數據驅動創新的一項重要進展。
![]()
圖 水下粘性水凝膠的數據驅動從頭設計
粘附蛋白的數據挖掘
作者詳述了數據挖掘過程。從NCBI蛋白質數據庫中編譯了包含24,707個粘附蛋白的數據集,并選擇了前200個物種進行分析,以識別最具代表性的蛋白質序列并最小化個體差異的影響。使用Clustal Omega工具進行多序列比對以確定每個物種的共有序列。為降低變量維度,將20種標準氨基酸根據其理化性質分為六類:疏水、親核、酸性、陽離子、酰胺和芳香族。統計分析顯示,粘附蛋白的序列即使在粗粒度的功能類別水平上也表現出顯著的序列異質性,并且不同物種之間在這些功能類別的成對頻率上存在獨特模式,暗示著潛在的順序性。基于這些見解,作者設計了一種水凝膠策略,使用六種功能單體來代表六種功能類別的氨基酸,并通過統計復制功能類別的序列特征,最終得到了180種獨特配方用于水凝膠合成。
![]()
圖 粘附蛋白的DM和制劑設計
DM驅動水凝膠的合成
作者選取了六種功能單體,每種代表一種氨基酸的功能類別,并通過1H NMR分析確認了它們在DMSO中共聚時的近乎統一的競聚率,這表明聚合過程中組分漂移極小。基于這些實驗確定的競聚率和推導出的單體比例,蒙特卡洛模擬驗證了所得異聚物的單體嵌段長度和成對頻率分布與粘附蛋白的觀察結果高度匹配。按照推導出的配方,通過一鍋法自由基共聚合成了180種DM驅動凝膠,并通過觸針測試評估了其水下粘附強度。值得注意的是,其中16種水凝膠表現出強大的粘附力(Fa > 100 kPa),G-042達到了最高的147 kPa,這充分證明了數據驅動方法在指導粘附水凝膠從頭設計方面的有效性。通過與非理想共聚(在DMS中進行)的G-004變體進行比較,結果顯示統計序列(在DMSO中合成)的變體表現出明顯更高的Fa,強調了理想隨機共聚在實現模仿蛋白質功能所需的統計序列特征方面的重要性。
![]()
圖 用于水下粘附的DM驅動水凝膠
通過機器學習優化水凝膠
作者從180個水凝膠數據集中開始,評估了九種機器學習模型,最終確定高斯過程(GP)和隨機森林回歸(RFR)是預測Fa的最有效基礎模型。基于這些模型,實施了序貫模型優化(SMBO)工作流,并以期望改進(EI)作為采集函數,以分批次的方式提出新的水凝膠配方,從而減少了實驗輪次。驗證結果顯示,所有SMBO方法都實現了比訓練數據更高的Fa,其中RFR-GP表現最佳,取得了最高的Fa。通過SHAP分析,發現高含量的BA和PEA單體能顯著提高Fa,而HEA、CBEA和AAm則傾向于降低Fa。ATAC則表現出雙重效應,適度含量至關重要。這些發現為設計強水下粘附水凝膠提供了明確的設計原則:結合BA、PEA和ATAC是關鍵,它們協同利用疏水效應和靜電相互作用來增強水下粘附性。
![]()
圖 水下粘合劑水凝膠的ML優化
超粘附水凝膠的性能
與G-max相比,ML驅動水凝膠在鹽水中平衡后表現出更高的疏水性BA和芳香族PEA含量,導致不透明度增加、粘彈性和模量增強,這表明共聚物鏈在水介質中形成了更強的關聯,從而促進了能量耗散并提升了機械強度。R1-max在玻璃上達到了超過1 MPa的最高Fa,并在200次附著-脫離循環中保持了穩定的粘附性。它還對多種基材表現出強粘附力,包括無機材料、塑料和金屬,并通過剪切和剝離測試得到證實。值得注意的是,R1-max能夠使不同材料的板在1公斤剪切載荷下維持連接超過1年,展現出卓越的耐久性。在不同水溶液中,粘附性能略有差異,體現了生物系統中“適應性而非普遍優化”的原則。研究還通過實際案例展示了其應用潛力,例如將橡膠鴨固定在海邊巖石上和密封高壓水泄漏的管道,突顯了其在惡劣環境下的適用性。這些水凝膠也表現出良好的生物相容性。
![]()
圖 通過DM和ML優化鑒定的水凝膠的表征和性能
展望
總之,本文引入了一種數據驅動的方法,該方法集成了從蛋白質中提取有價值的序列信息,可擴展的聚合物合成和迭代ML,以解決軟材料從頭設計和開發中的長期挑戰。除了粘合劑水凝膠,這種數據驅動的設計框架為開發各種功能軟材料提供了系統的,可擴展的端到端方法。然而,挑戰仍然存在,主要是由于單體多樣性、控制單體序列到適合材料開發的規模的聚合物合成技術和數據集的可擴展性等方面的限制,克服這些挑戰將需要擴展模塊化單體庫、推進聚合技術,并開發可在稀疏、多尺度數據集上推廣的物理學ML模型。
參考文獻:
Liao, H., Hu, S., Yang, H. et al. Data-driven de novo design of super-adhesive hydrogels. Nature 644, 89–95 (2025).
https://doi.org/10.1038/s41586-025-09269-4
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.