人工智能破解蛋白质结构可能引发医学革命

  • 保罗·林肯(Paul Rincon)
  • BBC新闻网科学事务编辑
蛋白质结构

图像来源,Karen Arnott

到现在为止,我们只研究出人类基因组极少数蛋白质的构造

人工智能被用来预测人体产生的几乎每一种蛋白质的结构。

这一重大科研发展能够加速推进研发治疗疾病的新药物,还能用在其他许多地方。

蛋白质是所有生物有机体的组成部分,我们体内的每一个细胞都充满蛋白质。

了解蛋白质的结构和形状对医药研究的进步至关重要,但是到现在为止,我们只研究出少数蛋白质的构造。

研究人员用一个名为“AlphaFold”的人工智能软件来预测人体和其他有机体的35万种蛋白质的结构。

人类蛋白质如何组成是由我们体内的基因组决定,也就是人类细胞核里面的遗传物质DNA,能够决定大约两万种蛋白质。

“AlphaFold”的人工智能软件是谷歌旗下的DeepMind人工智能公司开发的,该公司共同创办人兼首席执行官哈萨比斯(Demis Hassabis)表示,这是迄今为止人类蛋白质最完整、最准确的图像。

“我们认为这代表了人工智能对科学知识进展所做的最大贡献。”

他表示,这是人工智能有助于社会的最佳范例,未来还会有更多激励人心的发展。

塑料污染

图像来源,Getty Images

这项研究可以用来开发能够消化塑料的酵素

蛋白质由氨基酸按一定顺序结合形成的多肽链组成,它们以无数方式折叠成各种独特的三维形状,蛋白质的三维形状决定其在人体内的功能。

AlphaFold 预测的35万种蛋白质结构包含了人体的两万个蛋白质组成,还有所谓的“模式生物”的蛋白质,而所谓的模式生物是在实验室中被用来进行科学研究的有机体,例如大肠杆菌、酵母、果蝇和白老鼠。

DeepMind 的研究人员和欧洲分子生物学实验室(European Molecular Biology Laboratory)的团队在《自然》期刊上发表研究报告。

试验结果显示,AlphaFold 人工智能软件能够准确预测人类蛋白质的58%的氨基酸结构,另外有35.7%的蛋白质结构准确率更高,是实验室研究结果的两倍。

传统上研究蛋白质结构的方法包括X射线晶体学,低温电子显微技术等,但是用传统方法进行研究非常困难,朴茨茅斯大学(University of Portsmouth)的结构生物学家马克吉汉(John McGeehan)教授表示,传统方法需要大量金钱和资源。

因此,传统方法研究蛋白质结构通常是有目标的科学研究的其中一部分,在此之前从来没有任何研究项目能够系统性的研究出人体所有蛋白质的结构。

事实上,在这之前,实验室中只研究了17%的蛋白质结构。

马克吉汉教授表示,人工智能的速度非常快,从一开始研究一种蛋白质的结构需要6个月的时间,到现在只需要几分钟就好,这是传统方法做不到的。

“我们一开始给DeepMind研究团队送过去7个序列,其中两个已经有实验室研究出结构,所以等他们将结果送回来的时候我们可以对照测试其准确性。”

“我们看到AlphaFold预测出的结构,竟然和我们实验室得出的结构一模一样,坦白说实在令人震惊。”

制药厂

图像来源,Getty Images

这一重大科研发展能够加速推进研发治疗疾病的新药物

欧洲分子生物学实验室的赫德(Edith Heard)教授表示,蛋白质是有机体最基本的组成部分,人工智能研究出蛋白质结构,完全改变了我们如何理解生命的运作。

这个发展结果未来的应用非常广泛,包括开发能够用于各种疾病的新的药物和治疗方法,设计或改造未来能够抵抗气候变化的农作物,创造能够消化塑料的酵素。

马克吉汉教授的研究团队已经开始用AlphaFold的数据来开发能够更快消化塑料的酵素,他表示这个人工智能软件提供的蛋白质结构预测是实验室无法做到的,为他们的项目加速了好几年的时间。

DeepMind已经和欧洲分子生物学实验室共同合作,将AlphaFold的编码和蛋白质结构预测开放给全球科研团体使用。

DeepMind的哈萨比斯计划大幅扩展数据库资料,最终要包括科学界已知的超过一亿种蛋白质的结构。