从预测进化
AI能“构想”新蛋白质结构
科技日报北京12月2日电 (实习记者张佳欣)半个世纪以来,科学家一直在寻找解决“蛋白质折叠问题”的方法。这是生物学领域的一项重大挑战,难倒了几代科学家。但现在,人工智能(AI)解决了这一问题。据《自然》杂志1日发表的论文,包括美国华盛顿大学、伦斯勒理工学院和哈佛大学的研究人员在内的研究小组描述了一种升级的阿尔法折叠系统,该系统由深度思维(DeepMind)公司开发,会“构想”出具有稳定结构的新蛋白质。
研究人员表示,这是AI网络在解决生物学领域最大的挑战之一——根据氨基酸序列确定蛋白质三维(3D)结构方面取得的巨大飞跃,是生命科学和医学的福音,极大地促进了人们对细胞基本结构的理解,并将推动更快、更先进的药物制造进程。
蛋白质存在于每个细胞中,是一种线状分子,会自发折叠成复杂的3D形状,其形状与功能密切相关。例如,抗体蛋白折叠的形状能使它们精确识别和瞄准特定的异物,就像一把钥匙插入锁中一样。在细胞发育、DNA修复和新陈代谢等几乎所有生物学过程中,这种折叠非常关键。因此,了解蛋白质折叠结构对于了解生物体的功能以及最终生命的运作方式至关重要。
然而,蛋白质根据其氨基酸序列可能折叠成的不同构型的数量是个天文数字。在阿尔法折叠出现之前,科学家只知道人体大约2万种蛋白质中约17%的3D结构。已知的蛋白质结构是几十年来科学家在实验室里通过X射线结晶学和核磁共振等方法煞费苦心计算出来的,这些方法需要数百万美元的设备和数月乃至数年的反复试验。近年来,神经网络和深度学习等AI技术使这项工作的准确性发生了革命性变化。
利用阿尔法折叠,科学家获得了几乎所有(98.5%)人类蛋白质组的3D结构。其中36%的预测准确率非常高,另外22%的预测准确率较高。
此次,研究人员向AI提供了完全随机的蛋白质结构的氨基酸序列,并向其中引入一些突变,直到AI神经网络预测到它们能将其折叠成稳定的结构为止,最终共产生了2000种全新的蛋白质序列。
研究论文共同作者、美国华盛顿大学医学院蛋白质设计研究所贝克实验室的博士后学者伊万·阿尼先科表示:“任何时候,我们都没有引导AI得出特定结果,这些新的蛋白质结构完全是计算机‘构想’出来的。”
研究人员表示,AI深度学习网络极大简化了蛋白质的设计。未来,希望利用AI设计具有功能的新蛋白质,包括基于蛋白质的药物、酶等。