上海高校建立全球最大蛋白質序列數(shù)據(jù)集
中新社上海3月22日電 (記者 許婧 鄭瑩瑩)上海交通大學洪亮教授團隊22日發(fā)布其最新成果:建立了全球最大的蛋白質序列數(shù)據(jù)集,并利用其訓練了Venus(啟明星)系列模型。
肉、蛋、奶,這些食物中含有豐富的蛋白質,可以提供人類身體所需營養(yǎng)。但天然的蛋白質難以發(fā)揮這些功能,科研人員需要對天然蛋白質的功能進行設計和改造,才能使它成為滿足應用需求的產品。長期以來,蛋白質設計改造一直面臨時間長、成本高等難題。
據(jù)介紹,洪亮團隊建立了全球最大的蛋白質序列數(shù)據(jù)集,包含36.2億條陸地微生物蛋白質序列、26.4億條海洋微生物蛋白質序列、24.3億條抗體蛋白質序列,以及0.6億條病毒蛋白質序列。
研究團隊表示,基于該數(shù)據(jù)集訓練的模型,可以把蛋白質生產從“緩慢的試錯”變?yōu)椤案咝实木珳试O計”。
研究團隊基于該數(shù)據(jù)集訓練了Venus系列模型,該系列模型有“AI定向進化”與“AI挖酶”兩大核心功能。
“AI定向進化”指 Venus系列模型可以對一個不盡如人意的蛋白質產品的多種性能進行優(yōu)化。
“AI挖酶”則指 Venus系列模型基于該數(shù)據(jù)集可精準找到具備超常規(guī)功能的蛋白質,比如極度耐熱、耐酸、耐堿、耐胃腸消化的蛋白質等。而這些超常規(guī)功能的蛋白質在生物技術、醫(yī)藥研發(fā)和工業(yè)生產中具有可觀的應用潛力。(完)


社會新聞精選:
- 2025年03月27日 00:38:28
- 2025年03月27日 00:28:20
- 2025年03月27日 00:14:11
- 2025年03月27日 00:04:10
- 2025年03月26日 15:35:26