合成生物催化剂:https://www.science.org/doi/10.1126/science.abn9422
近日,来自斯坦福大学霍华德休斯医学院的Axel T. Brunger教授团队在Science上发表评论性文章“The protein-folding problem: Not yet solved”认为蛋白质折叠的问题并没有因为AlphaFold等机器学习软件的开发而得到解决。作者同意H. H. Thorp和许多其他人的观点认为计算软件AlphaFold和RoseTTAfold在蛋白质结构预测方面取得的进展是值得被特别注意的。这些使用机器学习的新方法,利用蛋白质结构的实验数据和序列数据库中包含的序列和结构之间关系的信息提供预测的准确性远优于以前的方法。
但是,作者并不同意H. H. Thorp关于蛋白质折叠问题已经解决的观点。AlphaFold在CASP14(Critical Assessment of Structure Prediction 14)中取得了Cα的均方根差为1Å左右的准确性。这种精度对应于X射线晶体学或单颗粒冷冻电镜在极低分辨率下确定的结构精度。这些实验方法的准确性比机器学习方法还是要好几倍;比如在3Å分辨率下,经典实验方法解析的结构的C-α均方根差准确度远优于1 Å。目前,对于最好的情况下,AlphaFold预测结构的C-α均方根差精度大致对应于在不超过4 Å的分辨率下实验方法确定的结构精度。因此,尽管AlphaFold和RoseTTAfold的结构预测可能足够准确以协助实验结构的解析,但它们本身并不能提供分子机制研究和基于结构的药物设计研究所需的分子和化学相互作用的细节。
结构预测的另一个复杂因素是预测给定序列的动态结构变化。显著不同的变构状态可能处于内在平衡或取决于结合伴侣,该结合伴侣可以是配体或辅因子(如,ATP或钴胺素),也可以是另一种大分子(如,DNA或蛋白质伴侣)或异常自聚集(如,致病性淀粉样蛋白)。解决蛋白质复合物的工作正在进行中,但对于那些复杂分子机器以及那些结合配体后构象受到影响的结构预测仍有待实现。因此,应该将最近的结构预测方面的进展视为进一步发展的一个号召。此外,大家应该从以往的发展历史中吸取教训。1990年,Alwyn Jones和Carl-Ivar Brändén发表了一篇关于X射线晶体结构误差的评论文章,激发了结构生物学交叉验证和验证工具的开发,这最终使得实验结构数据更加可靠。因此,应该开发工具来评估预测结构的准确性。
最后,作者提出有必要思考一下“解决”这个词在蛋白质折叠问题的背景下可能意味着什么。有些人可能认为,一旦找到任何能够从蛋白质序列中准确预测蛋白质结构的方法,这个问题就得到了解决,Nature Method还将蛋白质结构预测评选为2021年的代表方法,“Method of the Year 2021: Protein structure prediction ”。AlphaFold和RoseTTAfold代表了朝着这个方向迈出的重要一步,但它们并不是最终的答案。但是,包括作者在内的其他人则认为,解决蛋白质折叠问题意味着从氨基酸序列中准确预测结构是基于基本物理和化学的第一性原理。尽管在蛋白质结构预测方面取得了这些重大进展,但实验结构测定仍然必不可少。2021年Justin L. MacCallum等在Science上也发表了类似的评论性文章“The Protein-Folding Problem, 50 Years On”,认为“Is the protein-folding problem “solved” yet ?”这样的提问是不合适的,因为蛋白质折叠的问题是一个庞大、不断发展且多元化的研究领域,比任何单独的研究问题都大,还有很多方面的问题有待解决。
(吴联 摘译)
地址:浙江省湖州市红丰路1366号 湖州市南太湖科技创新中心1-3楼 邮编:313000
电话:0572-2165708 传真:0572-2165708 Email:info@cibt.ac.cn