蛋白质和自然语言:人工智能使新型蛋白质的设计成为可能

人工智能 (AI) 为设计定制蛋白质创造了新的可能性,以解决从医学到生态问题的所有问题。 由 Birte Höcker 教授领导的拜罗伊特大学研究小组现已成功地将基于计算机的自然语言处理模型应用于蛋白质研究。 ProtGPT2 模型完全独立地设计了能够稳定折叠的新蛋白质,并且可以在更大的分子环境中超越定义的功能。 该模型及其潜力在《自然通讯》中进行了科学详述。

自然语言和蛋白质实际上在结构上相似。 氨基酸以多种组合排列,形成在生物体中具有特定功能的结构——类似于单词以不同组合形式表达某些事实的句子的方式。 近年来,因此开发了许多方法来使用控制蛋白质研究中自然语言的计算机辅助处理的原理和过程。 “由于新的人工智能技术,自然语言处理取得了非凡的进步。今天,语言处理模型使机器不仅能够理解有意义的句子,而且能够自己生成它们。这样的模型是我们研究的起点。大约 5000 万个天然蛋白质序列,我的同事 Noelia Ferruz 训练了这个模型,让它自己生成蛋白质序列。天然蛋白质,”拜罗伊特大学蛋白质设计小组负责人 Birte Höcker 教授说。

转移到蛋白质进化的语言处理模型称为“ProtGPT2”。 它现在可用于设计通过折叠采用稳定结构并在这种状态下具有永久功能的蛋白质。 此外,拜罗伊特的生物化学家通过复杂的调查发现,该模型甚至可以创造出自然界中不存在的蛋白质,并且可能在进化史上从未存在过。 这些发现揭示了可能的蛋白质的不可估量的世界,并为以新颖和未经探索的方式设计它们打开了大门。 还有一个优势:迄今为止从头设计的大多数蛋白质都具有理想化的结构。 在此类结构具有潜在应用之前,它们通常必须经过复杂的功能化过程——例如通过插入扩展和空腔——以便它们可以与环境交互并在更大的系统上下文中执行精确定义的功能。 另一方面,ProtGPT2 生成的蛋白质天生就具有这种不同的结构,因此已经在它们各自的环境中发挥作用。

“我们的新模型是蛋白质设计和自然语言处理的系统亲和力的另一个令人印象深刻的证明。人工智能为使用语言处理方法生产定制蛋白质开辟了非常有趣和有希望的可能性。在拜罗伊特大学,我们希望以这种方式为生物医学、制药和生态问题的创新解决方案做出贡献,”Birte Höcker 教授说。

有所作为:赞助机会

故事来源:

材料 由…提供 拜罗伊特大学. 注意:内容可能会根据样式和长度进行编辑。

资讯来源:由0x资讯编译自SCIENCEDAILY,版权归作者所有,未经许可,不得转载
你可能还喜欢