元素百科为您介绍与蛋白质有关的更简单的模型。计算模型在模拟最基本的生物过程的能力方面已经取得了长足的进步,比如蛋白质是如何折叠的。莱斯大学的研究人员发明了一项新技术,使科学家能够比以往更精确地模拟更大的分子。
计算化学家塞西莉亚·克莱门蒂的实验室开发了一种分子建模框架,通过简单的粗粒度模型来模拟蛋白质动力学,可以更准确地再现实验结果。
该框架是有效分子模型的可观察驱动设计,在粗粒度模拟模型的定义中包含了可用的实验数据。对于给定的粗粒度模型,通过对模型参数进行增量更改来重复模拟,可以提高算法的预测能力,例如,预测蛋白质将如何找到其功能形式。
克莱门蒂说:“了解蛋白质,特别是它们的动力学,对了解生命是至关重要的。”要做到这一点,有两种互补的方法:要么通过模拟,要么通过实验。在实验中,你测量的是真实的东西,但是你可以直接测量的量是非常有限的。这就像用很少的碎片拼出一道难题。
她说,模拟可以让研究人员观察蛋白质动力学的各个方面,但包含每个原子特性的模型可能需要超级计算机花费数月或数年的时间来计算,即使蛋白质本身在体内几秒钟内折叠。为了获得更快的结果,科学家们经常使用粗粒度模型,简化了模拟,其中一些有效的“珠子”表示蛋白质中的一组原子。
克莱门蒂说:“在非常简单的模型中,你必须进行强近似,结果可能与实际情况不同。”“我们将这两种方法结合起来,利用模拟的力量再现实验。这样,我们就能两全其美了。”获取初始数据不是问题,陈说。“关于蛋白质已经有了大量的实验数据,所以不难找到,”他说,“这只是找到一种方法在模拟数据中建模的问题。”
克莱门蒂说,这些数据可以来自任何一个或多个来源,如福斯特共振能量转移(FRET)、诱变或核磁共振。该计算框架利用马尔可夫模型,结合多个短蛋白质模拟,获得在ODEM中使用的蛋白质配置的平衡分布。“马尔可夫模型让我们结合和探索蛋白质构型空间的不同部分,”她说。“这是一种分而治之的聪明方式。”
根据研究人员的说法,关键是要包含尽可能多的物理细节,以精确地建模这个过程。克莱门蒂说:“有些模型非常准确,但计算成本太高。”“这些模型中有太多的信息,所以你不知道什么是最重要的物理成分。”
“在我们的简化模型中,我们只包括我们认为重要的物理因素,”她说。如果通过使用ODEM模拟来改善他们与实验的一致,这意味着这个假设是正确的。如果他们不这样做,那么我们就知道缺少原料了。”
研究人员发现他们的技术可以揭示未预料到的分子特性。在测试算法的过程中,研究人员发现了一个关于FiP35折叠机制的新细节。FiP35是一种常见的WW蛋白,是一种较大的信号传递和结构蛋白。FiP35只有35个氨基酸,是很容易理解的,经常用于折叠研究。
FiP35的ODEM模型基于模拟的FRET结果的实验数据,揭示了局部挫折迫使折叠过程发生变化的几个区域。他们的分析表明,这种相互作用对整个过程很重要,而且很可能进化上是保守的,但他们表示,如果模拟的FRET数据没有在粗粒度模型中使用,那么得出这个结论的数据就不会出现。
“现在我们把它扩大到更大的系统,比如400余种蛋白质,大约是我们测试蛋白质的10倍,”陈说,“你不能对这些大型运动和长时间尺度进行全原子模拟,但是如果你用ODEM对粗粒度模型进行10到11次迭代,它们只需要几个小时。这大大缩短了人们看到合理结果的时间。