来源:新闻 发布时间:2024-11-22 02:57:03
蛋白质作为生命活动的物质根底,就像一块块精巧的「乐高积木」,支撑着生物体内简直一切的化学反应和生命进程。
从肌肉的收缩到大脑的思想,从病毒的侵染到免疫系统的防护,简直都依靠这些功用多样的分子。
但是,自然界中的天然蛋白质并不能彻底满意人类日益多样化的需求,因而科学家们致力于经过规划与定制蛋白质,赋予其更多杂乱的功用。
跟着生成式AI和生物技能的加快速度进行展开,科学家们在蛋白规划范畴取得了显着打破。华盛顿大学的 David Baker 教授因其在这一范畴的开创性奉献,荣获2024年诺贝尔化学奖。
在此布景下,我国科学技能大学认知智能全国重点试验室教授辅导的博士生张载熙,与哈佛大学医学院 Marinka Zitnik 教授课题组协作,开发了深度生成算法 PocketGen。
这一算法在蛋白质生成功率和成功率上全面逾越了新晋诺贝尔化学奖得主 David Baker 教授试验室的生成模型 RFDiffusion 和 RFDiffusionAA,成为当时功用最快、成功率最高的蛋白质口袋规划算法之一。
PocketGen 能够根据蛋白质结构和结合小分子,生成蛋白质口袋的序列和结构(图 2a)。该模型的中心架构由两部分组成:
遭到蛋白质固有的层级结构启示,PocketGen 的编码器规划为氨基酸层级和原子层级的双层图 Transformer。
原子层级编码器:捕捉更细粒度的原子级相互作用,并动态更新氨基酸和原子表明及其空间坐标。这一层级规划有用整合了蛋白质多标准的结构特性,为生成高质量的口袋规划奠定了根底。
PocketGen 在蛋白质言语模型 ESM2 的根底上进行高效微调,经过固定大部分模型层,仅微调部分习惯层参数,结合序列-结构穿插注意力机制,逐步增强序列与结构的和谐一致性。这种战略不只降低了练习开支,还显着提高了猜测精度。
PocketGen的一起长处是结合了多层次信息和预练习模型的才能,完成了序列与结构规划的一体化。
在试验中,PocketGen 不只在亲和力和结构合理性等要害目标上优于传统办法,还在核算功率上取得了革命性前进,相较传统办法功率提高逾越 10 倍。
这使得 PocketGen 成为当时蛋白质口袋规划范畴的前沿东西,为药物研制和分子规划供给了新技能计划。
图 2:(a)用 PocketGen 进行蛋白质序列-结构一起规划。(b) 双层图 Transformer 编码器;(c)蛋白质预练习言语模型用于序列猜测及高效微调技能。(来历:论文)
PocketGen 在核算功率和成功率方面均体现优异,成为现在全球最顶尖的蛋白质口袋规划算法之一。
在核算功率上,PocketGen 体现尤为亮眼。比较传统办法,核算功率提高逾越 10 倍,显着缩短了蛋白质口袋规划的时刻(图 3)。
在蛋白质口袋规划的成功率方面,PocketGen 相同取得了突出成绩。蛋白质口袋的亲和力是评价蛋白质与小分子结合成功率的重要目标。亲和力越高,意味着蛋白质与小分子结合得越严密、安稳,就像两块吸铁石间的吸引力。
PocketGen 在亲和力目标上的体现逾越了传统办法 5 个百分点,显着提高了蛋白质与小分子结合的或许性。
PocketGen 的归纳体现使其在蛋白质口袋规划范畴树立了新标杆,为药物研制和分子规划等范畴供给了更高效、精准的东西。
图 3:(a)生成功率比较。(b)生成多样性比较。(c)PocketGen能够灵敏生成不同巨细的蛋白质口袋。(来历:论文)
PocketGen 推进了深度生成模型用于功用蛋白质规划,为进一步了解蛋白质规划规则并展开生物试验验证奠定了根底。
未来,在药物开发、生物传感器、酶催化等范畴具有广泛的使用远景。这种跨范畴、跨技能的协同立异,不只为生物工程和药物研制供给了全新思路,也展示了AI与自然科学交融的无限或许。