日期:2022-10-31 来源:本站 供稿:工业生物技术处 作者:管理员 类别:译文
Alphaflod和Rosettafold等深度学习模型的开发使得基于蛋白质氨基酸序列预测蛋白质结构取得重大进展。然而,通过蛋白质结构逆向设计氨基酸序列仍是难点。针对这一难点,科学家们试图开发新型的深度学习算法帮助研究人员解决蛋白质逆向问题。
近日,来自美国华盛顿大学的研究团队在《Science》发表题为“Robust deep learning – based protein sequence design using ProteinMPNN”的研究论文,开发了一种基于深度学习的蛋白质序列设计方法,适用于单体、环状低聚物、蛋白质纳米颗粒和蛋白质-蛋白质界面等设计领域。
研究人员从具有3个编码器和3个解码器以及128个隐藏维度的消息传递神经网络(MPNN)开始,将蛋白质骨架特征-Ca-Ca原子之间的距离,相对-Ca-Ca-Ca框架方向和旋转,以及骨架二面角作为输入,以自回归的方式预测从N到C末端的蛋白质序列。针对应用于单链和多链的设计问题,研究团队使用了灵活的解码顺序来固定相应位置集合中的残差恒等式;用非正规化概率与一些正负数的线性组合来提升或降低特定主干状态,以实现明确的正负序列设计。这种多链和对称感知模型的架构称之为ProteinMPNN。实验评估结果表明,ProteinMPNN的高实验设计成功率和计算效率,适用于几乎所有蛋白质序列设计问题。从折叠到天然蛋白质主干的观察结果表明,ProteinMPNN算法可有效改善重组表达天然蛋白质的表达性和稳定性。这一方法的提出使得深度学习可以更准确、更快速地创建蛋白质分子,有利于研发更多新的疫苗、疗法和生物材料。
原文链接:https://www.science.org/doi/10.1126/science.add2187
注:此研究成果摘自《Science》,文章内容不代表本网站观点和立场,仅供参考。