新聞中心Info

> 公司新聞

> 行業資訊

> 產品百科

合作客戶/

拜耳公司.jpg

拜耳公司

同濟大學

聯合大學.jpg

聯合大學

寶潔公司

美國保潔

強生=

美國強生

瑞士羅氏

使用深度學習方法高通量預測代謝酶的 kcat，或揭開細胞工廠秘密

來源：ScienceAI 瀏覽 676 次(ci) 發布時間:2022-09-14

酶周轉數（kcat）是(shi)了解細(xi)胞代謝、蛋(dan)白質組分配和生(sheng)理多樣性的(de)關鍵，但實驗測量的(de)kcat數據往往稀疏且嘈雜。

查爾姆斯理工大(da)學(xue)（Chalmers University of Technology）的(de)(de)研究團隊提供了一種深(shen)度學(xue)習方(fang)法（DLKcat），用(yong)于僅(jin)根(gen)據(ju)底物(wu)結構和蛋白(bai)質序列對(dui)來自任(ren)何生物(wu)體(ti)的(de)(de)代謝(xie)酶進行高(gao)通量(liang)kcat預測(ce)。DLKcat可以捕獲(huo)突變酶的(de)(de)kcat變化并識別對(dui)kcat值有強烈影(ying)響的(de)(de)氨基酸(suan)殘(can)基。研究人員應(ying)用(yong)這種方(fang)法來預測(ce)300多(duo)種酵母物(wu)種的(de)(de)基因組規模kcat值。

此外，該團隊設計了一(yi)個貝(bei)葉斯管(guan)道(dao)，以根(gen)據(ju)預測的(de)kcat值參數(shu)化酶(mei)(mei)約束(shu)的(de)基因組規(gui)模代(dai)(dai)謝(xie)模型(xing)。由此產(chan)生的(de)模型(xing)在預測表型(xing)和(he)蛋白(bai)質組方面優于先前(qian)管(guan)道(dao)中相(xiang)應的(de)原始酶(mei)(mei)約束(shu)基因組規(gui)模代(dai)(dai)謝(xie)模型(xing)，并使研究人員能夠解釋表型(xing)差(cha)異。DLKcat和(he)酶(mei)(mei)約束(shu)的(de)基因組規(gui)模代(dai)(dai)謝(xie)模型(xing)構建管(guan)道(dao)是揭示酶(mei)(mei)動力學和(he)生理多樣性的(de)全球(qiu)趨勢，并進一(yi)步闡(chan)明大規(gui)模細胞(bao)代(dai)(dai)謝(xie)的(de)寶貴(gui)工具。

該研究以「Deep learning-based kcat prediction enables improved enzyme-constrained model reconstruction」為題，于2022年6月(yue)16日發布在《Nature Catalysis》。

酶(mei)轉換數（kcat）定義了反應的(de)(de)(de)(de)最(zui)大(da)化(hua)學轉化(hua)率，是了解特定生物體的(de)(de)(de)(de)新陳代謝、蛋白(bai)質組分配、生長(chang)和生理學的(de)(de)(de)(de)關鍵參數。酶(mei)數據(ju)庫BRENDA和SABIO-RK中有(you)(you)大(da)量可用的(de)(de)(de)(de)kcat值集(ji)合，然而，與(yu)現有(you)(you)的(de)(de)(de)(de)各(ge)種生物體和代謝酶(mei)相比(bi)，這些值仍然稀少，這主要是因為缺乏用于kcat測(ce)量的(de)(de)(de)(de)高通量方法。

此外，由于不同的(de)測定條件（例如pH值、輔因子可(ke)用(yong)性和(he)實(shi)驗(yan)方法(fa)），實(shi)驗(yan)測量(liang)的(de)kcat值具有相當(dang)(dang)大的(de)可(ke)變(bian)性。總之，稀疏的(de)收集和(he)相當(dang)(dang)大的(de)噪聲(sheng)限制了kcat數據在全局分析(xi)中的(de)使用(yong)，并(bing)可(ke)能掩蓋酶進化趨勢。

特(te)別是酶約(yue)束的(de)基(ji)因(yin)組(zu)規模(mo)代(dai)(dai)謝模(mo)型（ecGEM），其中(zhong)(zhong)全細(xi)胞(bao)代(dai)(dai)謝網(wang)絡受到酶催(cui)化(hua)能(neng)力(li)的(de)約(yue)束，因(yin)此(ci)能(neng)夠(gou)準(zhun)確模(mo)擬最大生(sheng)長(chang)能(neng)力(li)、代(dai)(dai)謝變(bian)化(hua)和蛋白質組(zu)分(fen)配，特(te)別依賴于(yu)基(ji)因(yin)組(zu)-縮放kcat值。在(zai)過(guo)去的(de)十年中(zhong)(zhong)，ecGEM（或(huo)遵循酶約(yue)束概念的(de)模(mo)型）已分(fen)別針(zhen)對幾(ji)種經過(guo)充分(fen)研(yan)究的(de)生(sheng)物(wu)體開(kai)發(fa)(fa)，包括大腸桿菌、釀酒酵(jiao)母、中(zhong)(zhong)國倉(cang)鼠卵巢細(xi)胞(bao)和智(zhi)人。由(you)于(yu)kcat測(ce)量的(de)局限性和依賴酶委員會（EC）編號(hao)注(zhu)釋來(lai)搜索這些已開(kai)發(fa)(fa)管道中(zhong)(zhong)的(de)kcat值，為研(yan)究較少的(de)生(sheng)物(wu)體重建(jian)ecGEM或(huo)為多種生(sheng)物(wu)體進行大規模(mo)重建(jian)仍然(ran)是一個挑(tiao)戰。

此外，即使對于那些(xie)經過充(chong)分研究的(de)(de)生(sheng)物，kcat的(de)(de)覆(fu)蓋范圍也遠未完(wan)成。在釀酒(jiu)酵母ecGEM中(zhong)，只有5%的(de)(de)酶促反(fan)應在BRENDA中(zhong)具有完(wan)全(quan)匹配的(de)(de)kcat值。當數據(ju)缺(que)失時，以(yi)(yi)前的(de)(de)ecGEM重建流程通常假設kcat值來自類似的(de)(de)底(di)物、反(fan)應或其他生(sheng)物，這可能(neng)導致模型(xing)(xing)預測(ce)偏離實(shi)驗觀察。明確(que)要求獲得大規(gui)模的(de)(de)kcat值以(yi)(yi)提高(gao)模型(xing)(xing)準(zhun)確(que)性并產生(sheng)更可靠(kao)的(de)(de)表(biao)型(xing)(xing)模擬(ni)。

深度學(xue)(xue)習已被(bei)應(ying)(ying)用(yong)并在模擬化(hua)學(xue)(xue)空間、基因表(biao)達、酶相(xiang)關參數（如酶親和(he)力(li)和(he)EC數）方(fang)面表(biao)現出(chu)出(chu)色的(de)(de)性(xing)能。此(ci)前，有研究(jiu)人(ren)員采用(yong)機器學(xue)(xue)習方(fang)法，根據從蛋白質結(jie)構中獲(huo)得的(de)(de)平均代(dai)謝(xie)通(tong)量和(he)催(cui)化(hua)位(wei)點等特征(zheng)(zheng)來預測(ce)大腸桿(gan)菌kcat值(zhi)。然而，這些特征(zheng)(zheng)通(tong)常很難獲(huo)得，這使(shi)得這種方(fang)法只能應(ying)(ying)用(yong)于研究(jiu)最充分的(de)(de)生物體，如大腸桿(gan)菌。

在(zai)這里，查爾姆斯理(li)工大學（Chalmers University of Technology）的(de)研究(jiu)團隊提出了深度學習方法DLKcat來(lai)預測所有代謝酶與其底(di)物的(de)kcat值，只(zhi)需要(yao)底(di)物SMILES信息(xi)和酶的(de)蛋白質序列作(zuo)為(wei)輸(shu)入，從而(er)為(wei)任(ren)何物種產(chan)生通用的(de)kcat預測工具。

圖示：用于(yu)ecGEM參數化的(de)kcat深度學(xue)習。（來(lai)源：論文）

DLKcat可(ke)以捕獲kcat向(xiang)精確(que)的(de)單個氨(an)基(ji)(ji)酸(suan)替代方(fang)向(xiang)的(de)變化(hua)，從而(er)能夠(gou)計(ji)算注意(yi)力(li)權重(zhong)，從而(er)識別對酶(mei)活(huo)(huo)性(xing)產生重(zhong)大(da)(da)影(ying)(ying)響的(de)氨(an)基(ji)(ji)酸(suan)殘基(ji)(ji)。氨(an)基(ji)(ji)酸(suan)取代是(shi)酶(mei)進化(hua)領域(yu)的(de)一項強大(da)(da)技術(shu)，通常用于探測酶(mei)催化(hua)機制。特別是(shi)，大(da)(da)多數替代實驗在(zai)底(di)物(wu)結合(he)位(wei)點區域(yu)進行誘變，因(yin)為假(jia)設結合(he)區域(yu)將對催化(hua)活(huo)(huo)性(xing)產生很大(da)(da)影(ying)(ying)響。然而(er)，據報道，偏遠(yuan)地區會對催化(hua)活(huo)(huo)性(xing)產生深遠(yuan)影(ying)(ying)響。

研究人(ren)員不(bu)僅確(que)(que)定(ding)了(le)人(ren)PNP酶肌苷結合區域中(zhong)氨(an)基酸殘基的高關(guan)注權(quan)重，而且(qie)還確(que)(que)定(ding)了(le)具(ju)有高關(guan)注權(quan)重的各種(zhong)非(fei)結合殘基位點，這(zhe)表明這(zhe)些殘基也可(ke)(ke)能對催化活性(xing)產生重大影(ying)響，值得進(jin)一步驗證。DLKcat因此可(ke)(ke)以(yi)作(zuo)為蛋(dan)白(bai)質工程工具(ju)箱的重要組成(cheng)部分。

預(yu)測(ce)的(de)(de)基(ji)因(yin)組規模的(de)(de)kcat譜可以(yi)促進(jin)酶(mei)約束代謝模型的(de)(de)重建，從策劃和自動(dong)生成的(de)(de)基(ji)本（非(fei)ec）GEM中(zhong)(zhong)。事實證明(ming)，深度(du)學習預(yu)測(ce)的(de)(de)kcat過(guo)程比匹配來自BRENDA和SABIO-RK數據(ju)庫(ku)的(de)(de)體(ti)外kcat值更全面但仍然實用；這在(zai)GECKO和MOMENT等原始ecGEM重建管道中(zhong)(zhong)很常見。

通過(guo)不依賴EC編號注釋，DLKcat還(huan)能(neng)夠預測同工酶特異性kcat值，而SMILES的(de)使用避免了原始(shi)ecGEM重建(jian)管(guan)道(dao)可能(neng)遇到的(de)GEM和(he)BRENDA之間底物命名不統一的(de)問(wen)題。隨后(hou)可以通過(guo)貝葉斯方法將DL-ecGEM調整為現有(you)的(de)實(shi)驗(yan)生(sheng)長數(shu)(shu)據，該方法產(chan)生(sheng)具(ju)有(you)生(sheng)理相關解空間的(de)后(hou)均值ecGEM。結合起來，當前基于(yu)DLKcat的(de)管(guan)道(dao)因(yin)此適用于(yu)幾乎(hu)任(ren)何(he)生(sheng)物體的(de)ecGEM重建(jian)，其中蛋白(bai)質序列(lie)FASTA文件和(he)基本GEM可用。他們的(de)管(guan)道(dao)因(yin)此提高(gao)了適用性，與以前構(gou)建(jian)的(de)原始(shi)ecGEM相比，它甚至提高(gao)了具(ju)有(you)酶促約束的(de)反應數(shu)(shu)量(liang)。

圖示：kcat預測的深度(du)學(xue)習模(mo)型性能。（來源：論文）

盡管(guan)基于DLKcat的(de)(de)管(guan)道產生的(de)(de)ecGEM性(xing)能(neng)優于原始(shi)ecGEM，但仍(reng)然(ran)存在各種挑(tiao)戰(zhan)。例(li)如，雖然(ran)深度學習模型可以將混雜酶的(de)(de)替代(dai)物(wu)(wu)與隨機選擇的(de)(de)底物(wu)(wu)區分開來(lai)，但它(ta)仍(reng)然(ran)預測(ce)了可能(neng)過高的(de)(de)隨機底物(wu)(wu)的(de)(de)動力學活性(xing)水(shui)平。

這種行為可以(yi)通過負面(mian)數據(ju)的(de)(de)(de)有(you)限可用性(xing)來(lai)解釋：酶-底物(wu)對(dui)沒有(you)產生催化作(zuo)用的(de)(de)(de)情況。增(zeng)加(jia)對(dui)陰性(xing)數據(ju)集的(de)(de)(de)報告，其(qi)中酶-底物(wu)對(dui)的(de)(de)(de)未檢測(ce)到(dao)的(de)(de)(de)活性(xing)由酶數據(ju)庫報告和(he)收集，可以(yi)增(zeng)強未來(lai)深度學習模(mo)型(xing)在(zai)定義真陰性(xing)方面(mian)的(de)(de)(de)能力。

此(ci)外(wai)，DLKcat并未考慮pH和溫(wen)度等環(huan)境(jing)(jing)因素的(de)影響，但(dan)將(jiang)DLKcat與其他新興機器學習工具（例(li)如酶的(de)最佳溫(wen)度預測）相結合(he)，將(jiang)有助于未來(lai)研究環(huan)境(jing)(jing)參數對酶活性(xing)的(de)影響。

另一(yi)(yi)個(ge)挑戰涉及涉及多種底(di)物(wu)和(he)(he)由異聚(ju)酶(mei)(mei)復合(he)物(wu)催化(hua)的(de)反應。可(ke)以為此類反應定(ding)義的(de)多底(di)物(wu)SMILES和(he)(he)蛋白質(zhi)序列都可(ke)以與(yu)DLKcat一(yi)(yi)起發(fa)揮作(zuo)用，從而為一(yi)(yi)個(ge)反應產生(sheng)多個(ge)預測的(de)kcat值。目(mu)前在(zai)這些情況下，研究人(ren)員會選擇最(zui)大kcat值，但最(zui)好設(she)計一(yi)(yi)種方法來預測每(mei)種多底(di)物(wu)和(he)(he)異聚(ju)酶(mei)(mei)的(de)一(yi)(yi)個(ge)kcat值。

圖示：用于預測和(he)解(jie)釋突變(bian)酶kcat的深度學習模型(xing)。（來源：論文）

此外，DLKcat衍生(sheng)的(de)(de)(de)DL-ecGEM和后驗均值ecGEM繼承了基本GEM的(de)(de)(de)局限性，其(qi)中基于約束(shu)的(de)(de)(de)建模的(de)(de)(de)核心穩態(tai)假設允許(xu)人們確(que)定代(dai)謝(xie)(xie)通量(liang)，但不(bu)容(rong)易考(kao)慮調節(jie)行(xing)為。雖然ecGEM極大地(di)將基于約束(shu)的(de)(de)(de)模型的(de)(de)(de)解(jie)空間減少到(dao)細(xi)胞(bao)可行(xing)容(rong)量(liang)，但kcat并不(bu)是決定反應(ying)速率的(de)(de)(de)唯(wei)一動(dong)力(li)學參數(shu)，例如，親(qin)和常數(shu)起著重要的(de)(de)(de)作用。然而，由于基于約束(shu)的(de)(de)(de)模型無法預(yu)測內部(bu)代(dai)謝(xie)(xie)物濃(nong)度(du)，因此目前無法輕易考(kao)慮這些(xie)參數(shu)的(de)(de)(de)影(ying)響。

盡管如此，kcat值也(ye)是其(qi)(qi)他資源分(fen)配模(mo)(mo)型(xing)(xing)中的(de)重(zhong)要參數，例如蛋(dan)白(bai)質(zhi)(zhi)組(zu)(zu)約束的(de)GEM和(he)代謝/大分(fen)子表達模(mo)(mo)型(xing)(xing)。盡管改(gai)進(jin)的(de)預測和(he)更(geng)(geng)多的(de)應用，如何定義kcat值也(ye)仍然(ran)是重(zhong)建這些模(mo)(mo)型(xing)(xing)的(de)挑戰。這種(zhong)資源分(fen)配模(mo)(mo)型(xing)(xing)和(he)ecGEM都認為(wei)細胞(bao)需要將其(qi)(qi)有(you)限(xian)的(de)蛋(dan)白(bai)質(zhi)(zhi)組(zu)(zu)分(fen)配到不(bu)同的(de)途徑以實現更(geng)(geng)快的(de)生(sheng)長或更(geng)(geng)好的(de)適(shi)應度，而每個反應的(de)蛋(dan)白(bai)質(zhi)(zhi)組(zu)(zu)成本(ben)同樣由酶的(de)通量和(he)動力學速率定義。

因此(ci)，這些模(mo)(mo)型的(de)(de)代謝部分的(de)(de)深(shen)度(du)(du)學(xue)習(xi)預測(ce)kcat值可(ke)以(yi)提(ti)高其質(zhi)量和性能，盡管無法(fa)(fa)從DLKcat獲得(de)在(zai)這些模(mo)(mo)型公式(shi)中(zhong)確定的(de)(de)其他具有挑戰(zhan)性的(de)(de)動(dong)力學(xue)參數(shu)，例如核糖體(ti)催化率。此(ci)外，特別關注(zhu)描述酶動(dong)力學(xue)的(de)(de)模(mo)(mo)型公式(shi)可(ke)以(yi)受(shou)益于深(shen)度(du)(du)學(xue)習(xi)預測(ce)的(de)(de)kcat值，因此(ci)DLKcat方(fang)法(fa)(fa)可(ke)以(yi)在(zai)建(jian)模(mo)(mo)領域找到廣泛的(de)(de)應用。

總之，DLKcat產(chan)生了(le)現實的(de)(de)(de)(de)kcat值，可用(yong)(yong)于(yu)指(zhi)導(dao)未來的(de)(de)(de)(de)基(ji)因工程、了(le)解(jie)酶進(jin)化和(he)(he)(he)重(zhong)建(jian)ecGEM以預測(ce)代謝通量(liang)和(he)(he)(he)表型(xing)。除此之外(wai)，這種基(ji)于(yu)深度學(xue)習的(de)(de)(de)(de)kcat預測(ce)工具的(de)(de)(de)(de)許(xu)多其(qi)他潛在用(yong)(yong)途(tu)，例(li)如基(ji)因組(zu)(zu)挖掘(jue)和(he)(he)(he)全(quan)基(ji)因組(zu)(zu)關聯研究分析中的(de)(de)(de)(de)工具。開發的(de)(de)(de)(de)自動貝葉斯ecGEM重(zhong)建(jian)管道將有助于(yu)進(jin)一(yi)步(bu)用(yong)(yong)于(yu)ecGEM重(zhong)建(jian)，用(yong)(yong)于(yu)組(zu)(zu)學(xue)數據合(he)并(bing)和(he)(he)(he)分析。

論(lun)文鏈接(jie)：//www.nature.com/articles/s41929-022-00798-z

国产丶欧美丶日本不卡视频_a篇片在线观看_性欧美乱妇COME_亚洲aⅴ男人的天堂在线观看

芬蘭Kibron專注表面張力儀測量技術，快速精準測量動靜態表面張力

新聞中心Info

> 公司新聞

> 行業資訊

> 產品百科

合作客戶/

相關新聞Info

> 表面張力儀的參數有哪些

> 做完核酸檢測身體變磁鐵？實則是身體出汗造成摩擦力和表面張力增加

> 表面活性劑對氣體水合物界面張力的影響

> 旋轉滴法表面張力儀的概述

> 表面張力儀的優點與參數

> 氨基酸表面活性劑在機用洗碗劑中的應用

> 采用蒸餾水或乙醇校準表面張力儀的方式正確嗎

> 農藥中加入表面活性劑可以降低液體的表面張力提高潤濕分散性能

> 石墨烯與磷脂之間的作用——實驗部分

> 用一滴水向孩子解釋什么是水的表面張力

推薦新聞Info

> 全自動表面張力儀測定原理和使用方法【表面活性劑烷醇酰胺】

> 硝磺草酮懸浮劑制劑不同稀釋倍數的動態表面張力測定結果

> 原油中活性物質與堿作用下對界面張力的影響

> 揭示界面張力在鈣鈦礦晶體生長過程中作用機理

> 超細纖維：固體表面能的測量過程與操作步驟

> 便于調節的表面張力儀結構組成及原理

> 一文了解什么是?馬蘭格尼效應及其原理、現象和工程應用

> 基于脈沖焊接研究表面張力活性元素對Marangoni力的影響

> 變壓器油界面張力檢測方法之準確性對比

> 超聲協同殼聚糖處理對蛋黃液界面張力的影響

使用深度學習方法高通量預測代謝酶的 kcat，或揭開細胞工廠秘密