材料結(jié)構(gòu)是決定材料性能的重要因素,明析材料微觀結(jié)構(gòu)是認(rèn)識(shí)材料特性、建立構(gòu)效關(guān)系、理性設(shè)計(jì)材料并支撐實(shí)驗(yàn)改性的重要基礎(chǔ)。近年來(lái)隨著材料基因組研究模式的發(fā)展,通過(guò)理論方法預(yù)測(cè)材料結(jié)構(gòu)已經(jīng)成為探索新材料結(jié)構(gòu)與性能的方法之一。目前,這些方法已經(jīng)成功應(yīng)用于完美晶體和二維材料等體系的結(jié)構(gòu)預(yù)測(cè),并取得了重要的進(jìn)展。然而對(duì)于化學(xué)無(wú)序材料(chemical-disordered materials)微觀結(jié)構(gòu)的認(rèn)識(shí)仍然面臨挑戰(zhàn)?! ?/p>

  化學(xué)無(wú)序材料是一類(lèi)晶格是周期性(有序)的但元素種類(lèi)和原子空間占據(jù)是非周期性(無(wú)序)的材料,廣泛存在于半導(dǎo)體、高溫超導(dǎo)、金屬合金、陶瓷和催化劑等材料體系中。從化學(xué)組成上看,化學(xué)無(wú)序材料可分為陰離子無(wú)序、陽(yáng)離子無(wú)序和缺陷無(wú)序等類(lèi)型,可以簡(jiǎn)單看作是陰離子、陽(yáng)離子和空位等占據(jù)了非周期位點(diǎn)。從結(jié)構(gòu)類(lèi)型上看,化學(xué)無(wú)序材料包含了分?jǐn)?shù)占據(jù)、摻雜取代、間隙填充、空位缺陷等不同類(lèi)型的體系?! ?/p>

  由于部分晶格位點(diǎn)的原子占據(jù)不確定性,材料微觀結(jié)構(gòu)(構(gòu)型)數(shù)隨著位點(diǎn)數(shù)、元素種類(lèi)、原子個(gè)數(shù)、體系尺寸等的增加呈指數(shù)級(jí)增加?;瘜W(xué)無(wú)序材料微觀結(jié)構(gòu)的快速采樣問(wèn)題一直尚未解決,雖然之前已有利用先驗(yàn)知識(shí)、晶體對(duì)稱(chēng)性、集團(tuán)展開(kāi)和經(jīng)驗(yàn)勢(shì)函數(shù)等技術(shù)加速,但仍面臨大量且昂貴的第一性原理電子結(jié)構(gòu)計(jì)算。  

  針對(duì)化學(xué)無(wú)序材料微觀結(jié)構(gòu)高效獲取問(wèn)題,中科院山西煤化所908課題組溫曉東團(tuán)隊(duì),聯(lián)合中科合成油技術(shù)股份有限公司和中科院力學(xué)所共同開(kāi)發(fā)了基于高通量計(jì)算、機(jī)器學(xué)習(xí)和主動(dòng)學(xué)習(xí)的高效結(jié)構(gòu)預(yù)測(cè)方法——LAsou(辣搜),它是Large space sampling and Active labeling for searching(大空間采樣和主動(dòng)標(biāo)注搜索算法)的簡(jiǎn)稱(chēng)。

基于主動(dòng)學(xué)習(xí)的辣搜(LAsou)方法進(jìn)行材料結(jié)構(gòu)預(yù)測(cè)的流程圖

  利用LAsou方法對(duì)三種典型的有限尺寸體系進(jìn)行了測(cè)試,包括陰離子無(wú)序BaSc(OxF1?x)3 (x=0.67)材料、陽(yáng)離子無(wú)序Ca1?xMnxCO3 (x=0.25)材料和缺陷無(wú)序ε-FeCx (x=0.5)。與傳統(tǒng)枚舉法相比,“辣搜”(LAsou)方法在僅需要非常少的第一性原理計(jì)算就可以快速找到熱力學(xué)穩(wěn)定的結(jié)構(gòu)。

傳統(tǒng)枚舉法和辣搜(LAsou)法在BaSc(OxF1?x)3 (x=0.667)體系預(yù)測(cè)的表現(xiàn)。(a)2664個(gè)枚舉結(jié)構(gòu)和最穩(wěn)定結(jié)構(gòu)的總能量散點(diǎn)圖。(藍(lán)色圓圈代表每個(gè)結(jié)構(gòu)的能量,紅色虛線圓圈代表能量最低的結(jié)構(gòu)。)(b) 辣搜(LAsou)方法搜索過(guò)程中總能量隨搜索代數(shù)的演化。(紅色三角代表歷史上搜索的最低能量結(jié)構(gòu)。)

傳統(tǒng)枚舉法和辣搜(LAsou)法在Ca1?xMnxCO3 (x=0.25)體系預(yù)測(cè)的表現(xiàn)。(a)1033個(gè)枚舉結(jié)構(gòu)和最穩(wěn)定結(jié)構(gòu)的總能量散點(diǎn)圖。(b)辣搜(LAsou)方法搜索過(guò)程中總能量隨搜索代數(shù)的演化。

傳統(tǒng)枚舉法和辣搜(LAsou)法在ε-FeCx (x=0.5)體系預(yù)測(cè)的表現(xiàn)。(a)10496個(gè)枚舉結(jié)構(gòu)和最穩(wěn)定結(jié)構(gòu)的總能量散點(diǎn)圖。(b)辣搜(LAsou)方法搜索過(guò)程中總能量隨搜索代數(shù)的演化。

  對(duì)于化學(xué)無(wú)序材料體系的結(jié)構(gòu)預(yù)測(cè)問(wèn)題,計(jì)算預(yù)測(cè)的復(fù)雜度隨著體系尺寸、位點(diǎn)及元素等呈現(xiàn)多體體系的“指數(shù)墻”問(wèn)題(exponential wall problem),辣搜(LAsou)方法在解決此問(wèn)題上顯示出巨大的潛力。在辣搜(LAsou)方法中,機(jī)器學(xué)習(xí)用于構(gòu)建勢(shì)函數(shù)模型可以對(duì)大采樣空間采樣結(jié)構(gòu)進(jìn)行預(yù)測(cè)和篩選,通過(guò)主動(dòng)標(biāo)記“優(yōu)勢(shì)”候選結(jié)構(gòu),從而大大減少第一性原理的計(jì)算量;同時(shí)集成學(xué)習(xí)算法可以顯著提高勢(shì)函數(shù)模型對(duì)能量計(jì)算和結(jié)構(gòu)弛豫計(jì)算的穩(wěn)定性,主動(dòng)學(xué)習(xí)算法則可以在線地逐步標(biāo)記和搜集訓(xùn)練樣本并提高機(jī)器學(xué)習(xí)勢(shì)函數(shù)模型的精度,從而不需要預(yù)先準(zhǔn)備大量的訓(xùn)練數(shù)據(jù)。LAsou方法具有很強(qiáng)的算法穩(wěn)健性(robustness),多個(gè)參數(shù)、策略、初始值的測(cè)試表明,不同體系均能保持很高的預(yù)測(cè)效率。基于這些優(yōu)點(diǎn)和特性,辣搜(LAsou)方法將在更大、更復(fù)雜、準(zhǔn)無(wú)限尺寸材料(如納米顆粒、催化劑、高熵合金、高熵氧化物、固溶體等)體系中得到廣泛應(yīng)用?! ?/p>

  該研究成果近期以“Active learning to overcome exponential-wall problem for effective structure prediction of chemical-disordered materials”為題發(fā)表于npj Computational Materials, 2023, 9, 12。山西煤化所溫曉東研究員、中科合成油周余偉博士和中科院力學(xué)所彭慶研究員為共同通訊作者,袁曉澤博士(山西煤化所博士、力學(xué)所特別研究助理)為第一作者。該工作得到國(guó)家杰出青年科學(xué)基金、中科院基礎(chǔ)研究領(lǐng)域青年團(tuán)隊(duì)計(jì)劃、中科院網(wǎng)信應(yīng)用示范等項(xiàng)目的資助與支持?! ?/p>

  論文鏈接:https://www.nature.com/articles/s41524-023-00967-z

附件: