上海高校建立全球最大蛋白质序列数据集

11

中新社上海3月22日电 (记者 许婧 郑莹莹)上海交通大学洪亮教授团队22日发布其最新成果:建立了全球最大的蛋白质序列数据集,并利用其训练了Venus(启明星)系列模型。

肉、蛋、奶,这些食物中含有丰富的蛋白质,可以提供人类身体所需营养。但天然的蛋白质难以发挥这些功能,科研人员需要对天然蛋白质的功能进行设计和改造,才能使它成为满足应用需求的产品。长期以来,蛋白质设计改造一直面临时间长、成本高等难题。

据介绍,洪亮团队建立了全球最大的蛋白质序列数据集,包含36.2亿条陆地微生物蛋白质序列、26.4亿条海洋微生物蛋白质序列、24.3亿条抗体蛋白质序列,以及0.6亿条病毒蛋白质序列。

研究团队表示,基于该数据集训练的模型,可以把蛋白质生产从“缓慢的试错”变为“高效率的精准设计”。

研究团队基于该数据集训练了Venus系列模型,该系列模型有“AI定向进化”与“AI挖酶”两大核心功能。

“AI定向进化”指 Venus系列模型可以对一个不尽如人意的蛋白质产品的多种性能进行优化。

“AI挖酶”则指 Venus系列模型基于该数据集可精准找到具备超常规功能的蛋白质,比如极度耐热、耐酸、耐碱、耐胃肠消化的蛋白质等。而这些超常规功能的蛋白质在生物技术、医药研发和工业生产中具有可观的应用潜力。(完) 【编辑:胡寒笑】

科幻期刊拒收AI创作的小说 ChatGPT是文学灾难还是福音?

学者们为当代青年解惑:请将世界作为参考答案

黑龙江佳木斯发现2例初筛阳性,4个主城区今起3天静默管理

《通胀削减法案》,为何被质疑无法降低美国通胀?

北京特大暴雨已致33人遇难

陇原儿女手足相亲守望相助 民族团结进步之花常开长盛——铸牢中华民族共同体意识的“甘肃实践”

探访四川西昌地震监测中心站:“全链条”监测提升防震减灾现代化水平

陕西渭南一幼儿园保育老师涉针扎多名学生 已被刑拘

广州南沙区部分区域实施临时封控、管控政策

海南公安持续发力筑牢禁毒防线

老司机奥运速成手册丨中国队历届奥运首金,你知道几个?

两岸中医春日养生市集福州开市 台胞医生助力义诊

金句|健全全面从严治党体系,总书记阐明要旨

中考试卷出现彩礼题算不算“超标命题”

理财搭售、转嫁费用、营销诱导 如何识别身边的金融消费陷阱?

文章版权声明:除非注明,否则均为JAVA编程随记原创文章,转载或复制请以超链接形式并注明出处。