文章信息
文章題目:Advancing protein evolution with inverse folding models integrating structural and evolutionary constraints
期刊:Cell
發(fā)表時(shí)間:2025 年 7 月 7 日
主要內(nèi)容:中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所高彩霞團(tuán)隊(duì)在 Cell 雜志發(fā)表題為“Advancing protein evolution with inverse folding models integrating structural and evolutionary constraints”的研究論文。該研究基于整合了結(jié)構(gòu)與進(jìn)化約束的通用逆折疊模型,開發(fā)了一種新型人工智能蛋白質(zhì)工程計(jì)算模擬方法 AiCE (AI-informed Constraints for protein Engineering)。該方法無需訓(xùn)練專屬人工智能模型,即可實(shí)現(xiàn)蛋白質(zhì)高效進(jìn)化模擬和功能設(shè)計(jì)。研究團(tuán)隊(duì)利用 AiCE 對(duì)多種基因編輯工具進(jìn)行進(jìn)化優(yōu)化,成功實(shí)現(xiàn)了其效率和精度的快速提升。
原文鏈接:
https://www.cell.com/cell/abstract/S0092-8674(25)00680-4
使用TransGen產(chǎn)品:
TransDetect? PCR Mycoplasma Detection Kit (FM311)
背景介紹
蛋白質(zhì)工程通過人工改變氨基酸序列修飾改造蛋白質(zhì)結(jié)構(gòu)和功能,相比基因組工程能直接操縱蛋白質(zhì)分子,借助突變迭代積累快速優(yōu)化創(chuàng)新蛋白功能,速度遠(yuǎn)超自然演變,市場(chǎng)潛力巨大。但目前主要改造策略存在依賴經(jīng)驗(yàn)、實(shí)驗(yàn)周期長、成本高的問題,限制規(guī)?;瘧?yīng)用,而近年來興起的基于特定蛋白專有 AI 模型的方法,又面臨通用性欠佳及模型訓(xùn)練和下游驗(yàn)證成本高的問題,因此有必要開發(fā)高效、普適且無需復(fù)雜模型訓(xùn)練的蛋白質(zhì)工程計(jì)算模擬策略,以減少計(jì)算負(fù)荷、實(shí)現(xiàn)性能最大化,這對(duì)推動(dòng)蛋白質(zhì)改造意義重大。
文章概述
蛋白質(zhì)逆折疊是借助 AI 模型,根據(jù)給定三維結(jié)構(gòu)預(yù)測(cè)可兼容序列的過程,像 ESM-IF1 和 ProteinMPNN 這類通用逆折疊模型,通過對(duì)天然蛋白質(zhì)結(jié)構(gòu)和序列的訓(xùn)練,能隱式學(xué)習(xí)蛋白質(zhì)骨架的幾何與物理特性,捕捉由進(jìn)化動(dòng)力學(xué)塑造的蛋白質(zhì)序列的復(fù)雜分布模式。研究團(tuán)隊(duì)基于現(xiàn)有通用逆折疊模型開發(fā)出 AiCEsingle 模塊,具體是依據(jù)給定的蛋白質(zhì)三維結(jié)構(gòu),對(duì)逆折疊模型輸出的氨基酸序列進(jìn)行采樣,提名高頻出現(xiàn)的氨基酸類型,再通過結(jié)構(gòu)約束對(duì)氨基酸頻率進(jìn)行差異篩選,得到最終預(yù)測(cè)的單個(gè)氨基酸替換類型。團(tuán)隊(duì)用 60 個(gè)深度突變掃描(DMS)數(shù)據(jù)測(cè)試該模塊性能,發(fā)現(xiàn)其預(yù)測(cè)準(zhǔn)確率達(dá) 16%;通過消融實(shí)驗(yàn)和邏輯回歸分析,證實(shí)結(jié)構(gòu)限制在該方法中的必要性,相比無限制方案性能提升 37%;進(jìn)一步平行比較分析顯示,其性能較其他常見 AI 模型提升 36%-90% 以上。從蛋白類型而言,AiCEsingle 能有效進(jìn)化復(fù)雜蛋白和蛋白質(zhì)-核酸復(fù)合物(如 CRISPR 蛋白、SARS-CoV-2 病毒蛋白等),通用性廣泛。為克服突變組合中常見的負(fù)向上位效應(yīng),研究團(tuán)隊(duì)假設(shè)存在進(jìn)化耦合的氨基酸位置可能具有功能協(xié)同性,進(jìn)而構(gòu)建了通過預(yù)測(cè)進(jìn)化耦合性來確定突變組合位置的 AiCEmulti 模塊。對(duì) 6 個(gè)突變文庫的分析結(jié)果表明,AiCEmulti 與蛋白質(zhì)大模型 SaProt 的預(yù)測(cè)能力相當(dāng),但計(jì)算成本很低。團(tuán)隊(duì)建立的包含這兩類模塊的 AiCE 方法,可快速有效預(yù)測(cè)單突和組合突變,該方法利用現(xiàn)有通用逆折疊模型,無需重新或遷移訓(xùn)練專有蛋白模型,大大降低了計(jì)算成本,僅需 1.15 個(gè) CPU 時(shí)就能識(shí)別 SpCas9 蛋白(>1000 個(gè)氨基酸)的單突和雙突變體。
利用這一方法,研究團(tuán)隊(duì)進(jìn)一步在濕實(shí)驗(yàn)層面完成了對(duì)脫氨酶、核定位序列、核酸酶和逆轉(zhuǎn)錄酶等 8 種結(jié)構(gòu)與功能各異的蛋白質(zhì)的 AiCE 功能驗(yàn)證,由此證明了該方法具有簡單、高效且通用的特點(diǎn)。依托優(yōu)化后的脫氨酶,團(tuán)隊(duì)深入研發(fā)出可應(yīng)用于精準(zhǔn)醫(yī)療和分子育種的新型堿基編輯器,其中包括編輯窗口縮小近一半的新型胞嘧啶堿基編輯器 enABE8e、保真度提升 1.3 倍的新型腺嘌呤堿基編輯器 enSdd6-CBE,以及活性提升 13 倍的新型線粒體堿基編輯器 enDdd1-DdCBE。
綜上所述,這項(xiàng)研究開發(fā)了一種基于人工智能的新型蛋白質(zhì)工程計(jì)算模擬方法 AiCE。與傳統(tǒng)蛋白質(zhì)工程方案相比,該方法在效率、可擴(kuò)展性和通用性方面均展現(xiàn)出顯著優(yōu)越。通過計(jì)算模擬甚至替代濕實(shí)驗(yàn),是當(dāng)前生命科學(xué)領(lǐng)域的重要發(fā)展趨勢(shì)和前沿方向,而本研究在此方面開展的探索具有積極意義。當(dāng)前,基于人工智能的蛋白質(zhì)分析工具往往依賴大量計(jì)算資源,這對(duì)許多實(shí)驗(yàn)室而言難以獲取。而本項(xiàng)工作表明,通過開發(fā)更高效的生物信息學(xué)工具,能夠最大限度降低計(jì)算負(fù)荷,從而讓更多生物學(xué)家切實(shí)享受到人工智能技術(shù)帶來的科研便利。
常見蛋白質(zhì)工程方法的示意圖和 AiCE 方法概述
全式金生物產(chǎn)品支撐
優(yōu)質(zhì)的試劑是科學(xué)研究的利器。全式金生物的支原體檢測(cè)試劑盒(PCR法)(FM311)助力本研究。產(chǎn)品自上市以來,深受客戶青睞,多次榮登知名期刊,助力科學(xué)研究。
TransDetect? PCR Mycoplasma Detection Kit (FM311)
一款通過 PCR 方法檢測(cè)培養(yǎng)細(xì)胞等生物材料中的支原體,針對(duì)支原體 16S rRNA 序列保守區(qū)域設(shè)計(jì)特異引物,直接使用細(xì)胞培養(yǎng)液作為模板,特異性擴(kuò)增支原體 DNA。
產(chǎn)品特點(diǎn)
? 檢測(cè)靈敏度高、準(zhǔn)確性好。
? 特異性強(qiáng),只擴(kuò)增支原體 DNA。
? 操作簡便,無需提取基因組 DNA。
全式金生物的產(chǎn)品再度亮相 Cell 期刊,不僅是對(duì)全式金生物產(chǎn)品卓越品質(zhì)與雄厚實(shí)力的有力見證,更是生動(dòng)展現(xiàn)了全式金生物長期秉持的“品質(zhì)高于一切,精品服務(wù)客戶”核心理念。一直以來,全式金生物憑借對(duì)品質(zhì)的執(zhí)著追求和對(duì)創(chuàng)新的不懈探索,其產(chǎn)品已成為眾多科研工作者信賴的得力助手。展望未來,我們將持續(xù)推出更多優(yōu)質(zhì)產(chǎn)品,期望攜手更多科研領(lǐng)域的杰出人才,共同攀登科學(xué)高峰,書寫科研創(chuàng)新的輝煌篇章。
使用 TransDetect? PCR Mycoplasma Detection Kit (FM311) 產(chǎn)品發(fā)表的部分文章:
? Liu J L, Yan X Q, Wu H, et al. RNA codon expansion via programmable pseudo uridine editing and decoding[J]. Nature, 2025.(IF 50.5)
? Fei H Y, LI Y J,Liu Y J, et al. Advancing protein evolution with inverse folding models integrating structural and evolutionary constraints[J]. Cell, 2025.(IF 45.6)
? Nian Z, Dou Y, Shen Y, et al. Interleukin-34-orchestrated tumor-associated macrophage reprogramming is required for tumor immune escape driven by p53 inactivation[J]. Immunity, 2024.(IF 25.5)
? Xu J, Liang Y, Li N, et al. Clathrin-associated carriers enable recycling through a kiss-and-run mechanism[J]. Nature Cell Biology, 2024.(IF 17.3)
? Wang J, An Z, Wu Z, et al. Spatial organization of PI3K-PI (3, 4, 5) P3-AKT signaling by focal adhesions[J]. Molecular Cell, 2024.(IF 14.5)
? Nian Z, Zheng X, Dou Y, et al. Rapamycin pretreatment rescues the bone marrow AML cell elimination capacity of CAR-T cells[J]. Clinical Cancer Research, 2021.(IF 11.4)
? Xu D, Zhao H, Jin M, et al. Modulating TRADD to restore cellular homeostasis and inhibit apoptosis[J]. Nature, 2020.(IF 50.5)