HelixFold-Single:百度飞桨螺旋桨引领生物计算新时代
经过数十年的努力,科学家们终于揭示了生物细胞中DNA、RNA和蛋白质这三种大分子的奥秘。其中,DNA和RNA承载着生物的遗传信息,而蛋白质则在细胞内发挥着实际功能。人体内的10万种以上蛋白质均由20种氨基酸按不同比例组合而成,这些氨基酸在蛋白质中折叠成特定的三维结构,从而决定了每种蛋白质的独特功能。因此,解析蛋白质的三维结构对于深入了解蛋白质功能、人体生理现象、内在机制、疾病原因以及药物研发等方面具有重要意义。
尽管大多数蛋白质看似一团混乱的原子,但实际上它们遵循一定的层次结构。在底层,氨基酸通过肽键结合形成多肽链,构成蛋白质的一级结构。接着,多肽链通过氢键连接,折叠成螺旋状或环状等简单形状,形成二级结构。再往上,这些形状进一步折叠成三维空间中的紧凑结构,即三级结构。部分蛋白质还具有四级结构。
过去,科学家主要采用核磁共振、X射线晶体学和冷冻电镜等方法来观测蛋白质结构,这些方法通常需要昂贵设备和反复试验。为了加速蛋白质结构研究,人工智能技术应运而生。2018年,人工智能开始在蛋白质三维结构预测领域崭露头角,显著提高了预测速度和准确性。
2023年10月9日,国际顶级学术期刊《自然》旗下的《机器智能》发表了一项重大成果——百度飞桨螺旋桨联合百图生科研发的文心生物计算大模型推出了全球首个开源、提供在线服务的HelixFold-Single蛋白结构预测大模型。这一突破性的成果打破了AlphaFold2等主流模型依赖MSA检索的速度瓶颈,创新了人工智能训练方案,将蛋白结构预测速度平均提高数百倍,实现秒级别预测。例如,使用HelixFold-Single预测门蛋白7et2_H结构只需11秒,而AlphaFold2则需要超过21分钟。
HelixFold-Single百度飞桨螺旋桨引领生物计算新时代
人工智能大模型技术的飞速发展为生物计算领域带来了革命性变革,助力生命科学研究人员更便捷、高效地开展研究工作,如针对特定癌症、病毒感染疾病的治疗方法探索,新型抗生素、靶向药的开发,以及高效工业酶的研发等。百度飞桨螺旋桨携手百图生科共同推动生物计算领域的创新与发展,为人类健康和产业发展创造持续价值。
本文主题词: