人工智能技术突破或引发生物科研革命
发布时间: 2021-07-23
人工智能正在被用于预测人体几乎每一种蛋白质的结构。这一技术应用将有助于加速发现治疗疾病的新药,以及其他应用。
蛋白质是人体的重要组成部分;我们身上的每一个细胞都充满了蛋白质。而了解蛋白质结构对推动医学的发展至关重要,直至今日,人们只研究出了极小一部分的蛋白结构。
近期,研究人员开始使用一个名程序来预测属于人类和其他生物体的35万个蛋白质结构。
制造这些蛋白质的指令包含在我们的基因组,也就是细胞核的DNA当中。人类基因组所表达的这些蛋白质大约有2万种,生物学家们将之统称为 "蛋白质组"。
人工智能公司Deep Mind的首席执行官兼联合创始人Demis Hassabis博士在评论这一举措时说:“我们相信这是迄今为止人类蛋白质组最完整和准确的图景。这项科技应用代表了人工智能迄今为止对推进科学研究做出的最重大的贡献。而且我认为这是一个很好的例子来说明人工智能可以为社会带来什么样的好处。”
目前人工智能预测的35万个蛋白质结构不仅包括人类蛋白质组中的2万个,还包括科学研究中使用的实验对象的蛋白结构,如大肠杆菌、酵母、果蝇和老鼠。
DeepMind研究人员和欧洲分子生物学实验室(EMBL)的一个团队在《自然》期刊上描述了这一蛋白结构解析能力的巨大飞跃。目前的人工智能能够对人类蛋白质组中58%氨基酸(蛋白质的组成成分)的结构位置做出较准确的预测。其中35.7%的位置被预测为具有非常高的可信度--是实验证实的数字的两倍。
不同蛋白质的结构布局可以用各种技术来计算,包括X射线晶体学、低温电子显微镜(Cryo-EM)等等,但这些工具往往耗费不菲,且需要大量资金资源来维护。
因此,复杂的三维结构通常是蛋白研究非常重要的部分,但直到现在还没有一个项目系统地确定人体制造的所有蛋白质的结构。事实上,只有17%的蛋白结构是被已经实验确认的。一些科研人员表示:“以前每个蛋白结构需要我们花六个月的时间去研究和实验,而现在通过AI只需要几分钟,我们真的不可能预测到这项变革来得如此之快。AI已经为一些无法通过实验确定结构的蛋白质提供了预测--帮助相关项目加速“多年”。”EMBL的Edith Heard教授也声称:“这对我们了解生命如何运作将是一个变革,因为蛋白质是构成生物体的基本材料。”
这项科技将有极其广泛的应用场景,包括开发新的药物和疾病治疗方法,设计未来能够抵抗气候变化的作物,或能够分解弥漫在环境中的塑料的酶。
EMBL欧洲生物信息学研究所所长Ewan Birney博士说,人工智能预测的结构是“自人类基因组图谱绘制以来最重要的数据集之一”。
DeepMind已经与EMBL合作,向全球科学界公开提供结构预测代码和蛋白质结构预测结果,并计划将数据库的覆盖范围大大扩展到科学界已知的几乎所有测序蛋白质,即超过1亿个蛋白结构。
本文转载自:BBC www.bbc.com
原文作者:Paul Rincon
原文地址:https://www.bbc.com/news/science-environment-57929095
-