国产丶欧美丶日本不卡视频_a篇片在线观看_性欧美乱妇COME_亚洲aⅴ男人的天堂在线观看

芬蘭Kibron專注表面張力儀測量技術,快速精準測量動靜態表面張力

熱線:021-66110810,66110819,66110690,13564362870 Email: info@vizai.cn

當前位置首頁 > 新聞中心

使用深度學習方法高通量預測代謝酶的 kcat,或揭開細胞工廠秘密

來源:ScienceAI 瀏覽 676 次(ci) 發布時間:2022-09-14

酶周轉數(kcat)是(shi)了解細(xi)胞代謝、蛋(dan)白質組分配和生(sheng)理多樣性的(de)關鍵,但實驗測量的(de)kcat數據往往稀疏且嘈雜。

查爾姆斯理工大(da)學(xue)(Chalmers University of Technology)的(de)(de)研究團隊提供了一種深(shen)度學(xue)習方(fang)法(DLKcat),用(yong)于僅(jin)根(gen)據(ju)底物(wu)結構和蛋白(bai)質序列對(dui)來自任(ren)何生物(wu)體(ti)的(de)(de)代謝(xie)酶進行高(gao)通量(liang)kcat預測(ce)。DLKcat可以捕獲(huo)突變酶的(de)(de)kcat變化并識別對(dui)kcat值有強烈影(ying)響的(de)(de)氨基酸(suan)殘(can)基。研究人員應(ying)用(yong)這種方(fang)法來預測(ce)300多(duo)種酵母物(wu)種的(de)(de)基因組規模kcat值。


此外,該團隊設計了一(yi)個貝(bei)葉斯管(guan)道(dao),以根(gen)據(ju)預測的(de)kcat值參數(shu)化酶(mei)(mei)約束(shu)的(de)基因組規(gui)模代(dai)(dai)謝(xie)模型(xing)。由此產(chan)生的(de)模型(xing)在預測表型(xing)和(he)蛋白(bai)質組方面優于先前(qian)管(guan)道(dao)中相(xiang)應的(de)原始酶(mei)(mei)約束(shu)基因組規(gui)模代(dai)(dai)謝(xie)模型(xing),并使研究人員能夠解釋表型(xing)差(cha)異。DLKcat和(he)酶(mei)(mei)約束(shu)的(de)基因組規(gui)模代(dai)(dai)謝(xie)模型(xing)構建管(guan)道(dao)是揭示酶(mei)(mei)動力學和(he)生理多樣性的(de)全球(qiu)趨勢,并進一(yi)步闡(chan)明大規(gui)模細胞(bao)代(dai)(dai)謝(xie)的(de)寶貴(gui)工具。


該研究以「Deep learning-based kcat prediction enables improved enzyme-constrained model reconstruction」為題,于2022年6月(yue)16日發布在《Nature Catalysis》。

酶(mei)轉換數(kcat)定義了反應的(de)(de)(de)(de)最(zui)大(da)化(hua)學轉化(hua)率,是了解特定生物體的(de)(de)(de)(de)新陳代謝、蛋白(bai)質組分配、生長(chang)和生理學的(de)(de)(de)(de)關鍵參數。酶(mei)數據(ju)庫BRENDA和SABIO-RK中有(you)(you)大(da)量可用的(de)(de)(de)(de)kcat值集(ji)合,然而,與(yu)現有(you)(you)的(de)(de)(de)(de)各(ge)種生物體和代謝酶(mei)相比(bi),這些值仍然稀少,這主要是因為缺乏用于kcat測(ce)量的(de)(de)(de)(de)高通量方法。


此外,由于不同的(de)測定條件(例如pH值、輔因子可(ke)用(yong)性和(he)實(shi)驗(yan)方法(fa)),實(shi)驗(yan)測量(liang)的(de)kcat值具有相當(dang)(dang)大的(de)可(ke)變(bian)性。總之,稀疏的(de)收集和(he)相當(dang)(dang)大的(de)噪聲(sheng)限制了kcat數據在全局分析(xi)中的(de)使用(yong),并(bing)可(ke)能掩蓋酶進化趨勢。


特(te)別是酶約(yue)束的(de)基(ji)因(yin)組(zu)規模(mo)代(dai)(dai)謝模(mo)型(ecGEM),其中(zhong)(zhong)全細(xi)胞(bao)代(dai)(dai)謝網(wang)絡受到酶催(cui)化(hua)能(neng)力(li)的(de)約(yue)束,因(yin)此(ci)能(neng)夠(gou)準(zhun)確模(mo)擬最大生(sheng)長(chang)能(neng)力(li)、代(dai)(dai)謝變(bian)化(hua)和蛋白質組(zu)分(fen)配,特(te)別依賴于(yu)基(ji)因(yin)組(zu)-縮放kcat值。在(zai)過(guo)去的(de)十年中(zhong)(zhong),ecGEM(或(huo)遵循酶約(yue)束概念的(de)模(mo)型)已分(fen)別針(zhen)對幾(ji)種經過(guo)充分(fen)研(yan)究的(de)生(sheng)物(wu)體開(kai)發(fa)(fa),包括大腸桿菌、釀酒酵(jiao)母、中(zhong)(zhong)國倉(cang)鼠卵巢細(xi)胞(bao)和智(zhi)人。由(you)于(yu)kcat測(ce)量的(de)局限性和依賴酶委員會(EC)編號(hao)注(zhu)釋來(lai)搜索這些已開(kai)發(fa)(fa)管道中(zhong)(zhong)的(de)kcat值,為研(yan)究較少的(de)生(sheng)物(wu)體重建(jian)ecGEM或(huo)為多種生(sheng)物(wu)體進行大規模(mo)重建(jian)仍然(ran)是一個挑(tiao)戰。


此外,即使對于那些(xie)經過充(chong)分研究的(de)(de)生(sheng)物,kcat的(de)(de)覆(fu)蓋范圍也遠未完(wan)成。在釀酒(jiu)酵母ecGEM中(zhong),只有5%的(de)(de)酶促反(fan)應在BRENDA中(zhong)具有完(wan)全(quan)匹配的(de)(de)kcat值。當數據(ju)缺(que)失時,以(yi)(yi)前的(de)(de)ecGEM重建流程通常假設kcat值來自類似的(de)(de)底(di)物、反(fan)應或其他生(sheng)物,這可能(neng)導致模型(xing)(xing)預測(ce)偏離實(shi)驗觀察。明確(que)要求獲得大規(gui)模的(de)(de)kcat值以(yi)(yi)提高(gao)模型(xing)(xing)準(zhun)確(que)性并產生(sheng)更可靠(kao)的(de)(de)表(biao)型(xing)(xing)模擬(ni)。


深度學(xue)(xue)習已被(bei)應(ying)(ying)用(yong)并在模擬化(hua)學(xue)(xue)空間、基因表(biao)達、酶相(xiang)關參數(如酶親和(he)力(li)和(he)EC數)方(fang)面表(biao)現出(chu)出(chu)色的(de)(de)性(xing)能。此(ci)前,有研究(jiu)人(ren)員采用(yong)機器學(xue)(xue)習方(fang)法,根據從蛋白質結(jie)構中獲(huo)得的(de)(de)平均代(dai)謝(xie)通(tong)量和(he)催(cui)化(hua)位(wei)點等特征(zheng)(zheng)來預測(ce)大腸桿(gan)菌kcat值(zhi)。然而,這些特征(zheng)(zheng)通(tong)常很難獲(huo)得,這使(shi)得這種方(fang)法只能應(ying)(ying)用(yong)于研究(jiu)最充分的(de)(de)生物體,如大腸桿(gan)菌。


在(zai)這里,查爾姆斯理(li)工大學(Chalmers University of Technology)的(de)研究(jiu)團隊提出了深度學習方法DLKcat來(lai)預測所有代謝酶與其底(di)物的(de)kcat值,只(zhi)需要(yao)底(di)物SMILES信息(xi)和酶的(de)蛋白質序列作(zuo)為(wei)輸(shu)入,從而(er)為(wei)任(ren)何物種產(chan)生通用的(de)kcat預測工具。

圖示:用于(yu)ecGEM參數化的(de)kcat深度學(xue)習。(來(lai)源:論文)


DLKcat可(ke)以捕獲kcat向(xiang)精確(que)的(de)單個氨(an)基(ji)(ji)酸(suan)替代方(fang)向(xiang)的(de)變化(hua),從而(er)能夠(gou)計(ji)算注意(yi)力(li)權重(zhong),從而(er)識別對酶(mei)活(huo)(huo)性(xing)產生重(zhong)大(da)(da)影(ying)(ying)響的(de)氨(an)基(ji)(ji)酸(suan)殘基(ji)(ji)。氨(an)基(ji)(ji)酸(suan)取代是(shi)酶(mei)進化(hua)領域(yu)的(de)一項強大(da)(da)技術(shu),通常用于探測酶(mei)催化(hua)機制。特別是(shi),大(da)(da)多數替代實驗在(zai)底(di)物(wu)結合(he)位(wei)點區域(yu)進行誘變,因(yin)為假(jia)設結合(he)區域(yu)將對催化(hua)活(huo)(huo)性(xing)產生很大(da)(da)影(ying)(ying)響。然而(er),據報道,偏遠(yuan)地區會對催化(hua)活(huo)(huo)性(xing)產生深遠(yuan)影(ying)(ying)響。


研究人(ren)員不(bu)僅確(que)(que)定(ding)了(le)人(ren)PNP酶肌苷結合區域中(zhong)氨(an)基酸殘基的高關(guan)注權(quan)重,而且(qie)還確(que)(que)定(ding)了(le)具(ju)有高關(guan)注權(quan)重的各種(zhong)非(fei)結合殘基位點,這(zhe)表明這(zhe)些殘基也可(ke)(ke)能對催化活性(xing)產生重大影(ying)響,值得進(jin)一步驗證。DLKcat因此可(ke)(ke)以(yi)作(zuo)為蛋(dan)白(bai)質工程工具(ju)箱的重要組成(cheng)部分。


預(yu)測(ce)的(de)(de)基(ji)因(yin)組規模的(de)(de)kcat譜可以(yi)促進(jin)酶(mei)約束代謝模型的(de)(de)重建,從策劃和自動(dong)生成的(de)(de)基(ji)本(非(fei)ec)GEM中(zhong)(zhong)。事實證明(ming),深度(du)學習預(yu)測(ce)的(de)(de)kcat過(guo)程比匹配來自BRENDA和SABIO-RK數據(ju)庫(ku)的(de)(de)體(ti)外kcat值更全面但仍然實用;這在(zai)GECKO和MOMENT等原始ecGEM重建管道中(zhong)(zhong)很常見。


通過(guo)不依賴EC編號注釋,DLKcat還(huan)能(neng)夠預測同工酶特異性kcat值,而SMILES的(de)使用避免了原始(shi)ecGEM重建(jian)管(guan)道(dao)可能(neng)遇到的(de)GEM和(he)BRENDA之間底物命名不統一的(de)問(wen)題。隨后(hou)可以通過(guo)貝葉斯方法將DL-ecGEM調整為現有(you)的(de)實(shi)驗(yan)生(sheng)長數(shu)(shu)據,該方法產(chan)生(sheng)具(ju)有(you)生(sheng)理相關解空間的(de)后(hou)均值ecGEM。結合起來,當前基于(yu)DLKcat的(de)管(guan)道(dao)因(yin)此適用于(yu)幾乎(hu)任(ren)何(he)生(sheng)物體的(de)ecGEM重建(jian),其中蛋白(bai)質序列(lie)FASTA文件和(he)基本GEM可用。他們的(de)管(guan)道(dao)因(yin)此提高(gao)了適用性,與以前構(gou)建(jian)的(de)原始(shi)ecGEM相比,它甚至提高(gao)了具(ju)有(you)酶促約束的(de)反應數(shu)(shu)量(liang)。

圖示:kcat預測的深度(du)學(xue)習模(mo)型性能。(來源:論文)


盡管(guan)基于DLKcat的(de)(de)管(guan)道產生的(de)(de)ecGEM性(xing)能(neng)優于原始(shi)ecGEM,但仍(reng)然(ran)存在各種挑(tiao)戰(zhan)。例(li)如,雖然(ran)深度學習模型可以將混雜酶的(de)(de)替代(dai)物(wu)(wu)與隨機選擇的(de)(de)底物(wu)(wu)區分開來(lai),但它(ta)仍(reng)然(ran)預測(ce)了可能(neng)過高的(de)(de)隨機底物(wu)(wu)的(de)(de)動力學活性(xing)水(shui)平。


這種行為可以(yi)通過負面(mian)數據(ju)的(de)(de)(de)有(you)限可用性(xing)來(lai)解釋:酶-底物(wu)對(dui)沒有(you)產生催化作(zuo)用的(de)(de)(de)情況。增(zeng)加(jia)對(dui)陰性(xing)數據(ju)集的(de)(de)(de)報告,其(qi)中酶-底物(wu)對(dui)的(de)(de)(de)未檢測(ce)到(dao)的(de)(de)(de)活性(xing)由酶數據(ju)庫報告和(he)收集,可以(yi)增(zeng)強未來(lai)深度學習模(mo)型(xing)在(zai)定義真陰性(xing)方面(mian)的(de)(de)(de)能力。


此(ci)外(wai),DLKcat并未考慮pH和溫(wen)度等環(huan)境(jing)(jing)因素的(de)影響,但(dan)將(jiang)DLKcat與其他新興機器學習工具(例(li)如酶的(de)最佳溫(wen)度預測)相結合(he),將(jiang)有助于未來(lai)研究環(huan)境(jing)(jing)參數對酶活性(xing)的(de)影響。


另一(yi)(yi)個(ge)挑戰涉及涉及多種底(di)物(wu)和(he)(he)由異聚(ju)酶(mei)(mei)復合(he)物(wu)催化(hua)的(de)反應。可(ke)以為此類反應定(ding)義的(de)多底(di)物(wu)SMILES和(he)(he)蛋白質(zhi)序列都可(ke)以與(yu)DLKcat一(yi)(yi)起發(fa)揮作(zuo)用,從而為一(yi)(yi)個(ge)反應產生(sheng)多個(ge)預測的(de)kcat值。目(mu)前在(zai)這些情況下,研究人(ren)員會選擇最(zui)大kcat值,但最(zui)好設(she)計一(yi)(yi)種方法來預測每(mei)種多底(di)物(wu)和(he)(he)異聚(ju)酶(mei)(mei)的(de)一(yi)(yi)個(ge)kcat值。

圖示:用于預測和(he)解(jie)釋突變(bian)酶kcat的深度學習模型(xing)。(來源:論文)


此外,DLKcat衍生(sheng)的(de)(de)(de)DL-ecGEM和后驗均值ecGEM繼承了基本GEM的(de)(de)(de)局限性,其(qi)中基于約束(shu)的(de)(de)(de)建模的(de)(de)(de)核心穩態(tai)假設允許(xu)人們確(que)定代(dai)謝(xie)(xie)通量(liang),但不(bu)容(rong)易考(kao)慮調節(jie)行(xing)為。雖然ecGEM極大地(di)將基于約束(shu)的(de)(de)(de)模型的(de)(de)(de)解(jie)空間減少到(dao)細(xi)胞(bao)可行(xing)容(rong)量(liang),但kcat并不(bu)是決定反應(ying)速率的(de)(de)(de)唯(wei)一動(dong)力(li)學參數(shu),例如,親(qin)和常數(shu)起著重要的(de)(de)(de)作用。然而,由于基于約束(shu)的(de)(de)(de)模型無法預(yu)測內部(bu)代(dai)謝(xie)(xie)物濃(nong)度(du),因此目前無法輕易考(kao)慮這些(xie)參數(shu)的(de)(de)(de)影(ying)響。


盡管如此,kcat值也(ye)是其(qi)(qi)他資源分(fen)配模(mo)(mo)型(xing)(xing)中的(de)重(zhong)要參數,例如蛋(dan)白(bai)質(zhi)(zhi)組(zu)(zu)約束的(de)GEM和(he)代謝/大分(fen)子表達模(mo)(mo)型(xing)(xing)。盡管改(gai)進(jin)的(de)預測和(he)更(geng)(geng)多的(de)應用,如何定義kcat值也(ye)仍然(ran)是重(zhong)建這些模(mo)(mo)型(xing)(xing)的(de)挑戰。這種(zhong)資源分(fen)配模(mo)(mo)型(xing)(xing)和(he)ecGEM都認為(wei)細胞(bao)需要將其(qi)(qi)有(you)限(xian)的(de)蛋(dan)白(bai)質(zhi)(zhi)組(zu)(zu)分(fen)配到不(bu)同的(de)途徑以實現更(geng)(geng)快的(de)生(sheng)長或更(geng)(geng)好的(de)適(shi)應度,而每個反應的(de)蛋(dan)白(bai)質(zhi)(zhi)組(zu)(zu)成本(ben)同樣由酶的(de)通量和(he)動力學速率定義。


因此(ci),這些模(mo)(mo)型的(de)(de)代謝部分的(de)(de)深(shen)度(du)(du)學(xue)習(xi)預測(ce)kcat值可(ke)以(yi)提(ti)高其質(zhi)量和性能,盡管無法(fa)(fa)從DLKcat獲得(de)在(zai)這些模(mo)(mo)型公式(shi)中(zhong)確定的(de)(de)其他具有挑戰(zhan)性的(de)(de)動(dong)力學(xue)參數(shu),例如核糖體(ti)催化率。此(ci)外,特別關注(zhu)描述酶動(dong)力學(xue)的(de)(de)模(mo)(mo)型公式(shi)可(ke)以(yi)受(shou)益于深(shen)度(du)(du)學(xue)習(xi)預測(ce)的(de)(de)kcat值,因此(ci)DLKcat方(fang)法(fa)(fa)可(ke)以(yi)在(zai)建(jian)模(mo)(mo)領域找到廣泛的(de)(de)應用。


總之,DLKcat產(chan)生了(le)現實的(de)(de)(de)(de)kcat值,可用(yong)(yong)于(yu)指(zhi)導(dao)未來的(de)(de)(de)(de)基(ji)因工程、了(le)解(jie)酶進(jin)化和(he)(he)(he)重(zhong)建(jian)ecGEM以預測(ce)代謝通量(liang)和(he)(he)(he)表型(xing)。除此之外(wai),這種基(ji)于(yu)深度學(xue)習的(de)(de)(de)(de)kcat預測(ce)工具的(de)(de)(de)(de)許(xu)多其(qi)他潛在用(yong)(yong)途(tu),例(li)如基(ji)因組(zu)(zu)挖掘(jue)和(he)(he)(he)全(quan)基(ji)因組(zu)(zu)關聯研究分析中的(de)(de)(de)(de)工具。開發的(de)(de)(de)(de)自動貝葉斯ecGEM重(zhong)建(jian)管道將有助于(yu)進(jin)一(yi)步(bu)用(yong)(yong)于(yu)ecGEM重(zhong)建(jian),用(yong)(yong)于(yu)組(zu)(zu)學(xue)數據合(he)并(bing)和(he)(he)(he)分析。


論(lun)文鏈接(jie)://www.nature.com/articles/s41929-022-00798-z