蛋白質和自然語言:人工智慧使新型蛋白質的設計成為可能

人工智慧 (AI) 為設計定製蛋白質創造了新的可能性,以解決從醫學到生態問題的所有問題。 由 Birte Höcker 教授領導的拜羅伊特大學研究小組現已成功地將基於計算機的自然語言處理模型應用於蛋白質研究。 ProtGPT2 模型完全獨立地設計了能夠穩定摺疊的新蛋白質,並且可以在更大的分子環境中超越定義的功能。 該模型及其潛力在《自然通訊》中進行了科學詳述。

自然語言和蛋白質實際上在結構上相似。 氨基酸以多種組合排列,形成在生物體中具有特定功能的結構——類似於單詞以不同組合形式表達某些事實的句子的方式。 近年來,因此開發了許多方法來使用控制蛋白質研究中自然語言的計算機輔助處理的原理和過程。 「由於新的人工智慧技術,自然語言處理取得了非凡的進步。今天,語言處理模型使機器不僅能夠理解有意義的句子,而且能夠自己生成它們。這樣的模型是我們研究的起點。大約 5000 萬個天然蛋白質序列,我的同事 Noelia Ferruz 訓練了這個模型,讓它自己生成蛋白質序列。天然蛋白質,」拜羅伊特大學蛋白質設計小組負責人 Birte Höcker 教授說。

轉移到蛋白質進化的語言處理模型稱為「ProtGPT2」。 它現在可用於設計通過摺疊採用穩定結構並在這種狀態下具有永久功能的蛋白質。 此外,拜羅伊特的生物化學家通過複雜的調查發現,該模型甚至可以創造出自然界中不存在的蛋白質,並且可能在進化史上從未存在過。 這些發現揭示了可能的蛋白質的不可估量的世界,並為以新穎和未經探索的方式設計它們打開了大門。 還有一個優勢:迄今為止從頭設計的大多數蛋白質都具有理想化的結構。 在此類結構具有潛在應用之前,它們通常必須經過複雜的功能化過程——例如通過插入擴展和空腔——以便它們可以與環境交互並在更大的系統上下文中執行精確定義的功能。 另一方面,ProtGPT2 生成的蛋白質天生就具有這種不同的結構,因此已經在它們各自的環境中發揮作用。

「我們的新模型是蛋白質設計和自然語言處理的系統親和力的另一個令人印象深刻的證明。人工智慧為使用語言處理方法生產定製蛋白質開闢了非常有趣和有希望的可能性。在拜羅伊特大學,我們希望以這種方式為生物醫學、製藥和生態問題的創新解決方案做出貢獻,」Birte Höcker 教授說。

有所作為:贊助機會

故事來源:

材料 由…提供 拜羅伊特大學. 注意:內容可能會根據樣式和長度進行編輯。

資訊來源:由0x資訊編譯自SCIENCEDAILY,版權歸作者所有,未經許可,不得轉載
你可能還喜歡