您现在的位置是:首页 >新闻频道新闻 2019-10-09 10:24:32

独立于数据的采集使您可以跨非常大的同类组可重复地测量单个分析物信号

与数据无关的采集模式相比,数据无关的采集模式的主要优势是什么?主要优点是可重复性。独立于数据的采集使您可以跨非常大的同类组可重复地测量单个分析物信号。这与依赖数据的采集相反,在数据采集中,您使用随机方法对分析物池中的肽进行采样。这样可以防止在每个单个样品中对同一肽库进行可重复的采样。

借助与数据无关的采集,您可以获得每个样品中特定分析物的定量答案,而且您没有这种随机因素会在定量数据矩阵中引入缺失值,而在缺失数据中您经常会看到与数据相关的采集。

什么是timsTOF Pro,您如何使用它来分析复杂的生物样品?

timsTOF Pro是一种新颖的仪器,基于传统的Q-TOF体系结构,但在光谱仪前还具有捕获离子迁移率设备。这允许我们做两件事:首先,它允许我们在将离子发送到分析之前在特定的时间段内积累离子;其次,它允许我们通过离子迁移率分离离子。

这意味着离子会集中在非常窄的离子带中,这会提高灵敏度并提供额外的细胞活性,因为离子将被其碰撞截面所分隔。

timsTOF Pro使用并行累积串联碎片(PASEF)采集方法,该方法利用捕获的离子迁移率将测序速度提高了10倍。它是基于使用四极杆的位置并将其与离子一起移动的。

测序速度的提高对于复杂的蛋白质组确实至关重要,因为它使我们能够更深入地研究复杂的蛋白质组,并在很短的时间内获得非常复杂的样品的定量答案。

您的研究小组专注于计算质谱的应用。请您告诉我们有关Röst实验室以及您的团队正在从事的项目的更多信息吗?

我们目前正在研究质谱法的两个主要支柱。第一个支柱是新技术的发展,因为我们意识到在解决大规模问题和想要解决的同类人群类型之前,质谱技术的当前技术将需要改进。

为了增加质谱方法的可重复性和可扩展性,我们花费了大量时间来开发新软件和新实验方法。同时,我们采用这些方法并将其应用于我们的研究计划的第二个支柱,该计划的重点是个性化医学。

在这里,我们正在尝试以非常密集的采样设置纵向跟踪各个患者,以便我们可以看到患者生物流体中的分子概况在其一生中以及健康和疾病期间的变化。借此,我们希望了解是什么驱动了从健康状态向疾病状态的转变。

什么是diaPASEF,您如何将此技术应用于个性化医疗?

diaPASEF是一种新方法,它将离子迁移率成分纳入数据独立采集(dia)中。我们目前正在使用diaPASEF分析大型患者队列或大型石化,这是个性化医学方法的任何类型的系统生物学所必需的。

如果我们能够分析非常大的实验扰动并量化每个扰动中的分析物,我们就可以了解生物系统如何工作,它们如何对扰动做出反应以及如何处理信号。

另一方面,如果将其应用于个别患者和患者队列,我们​​可以长期追踪单个患者的分子谱,并且我们可以了解其分子谱随环境和生活方式的变化而随时间变化。最终,我们将能够观察到从健康状况到疾病状况的转变,并能更早地进行诊断。

纵向研究这些患者队列为何重要?

纵向方面是关键,因为它使我们能够将各个患者与其过去的自我进行比较。我们希望摆脱将个体患者与人口平均值进行比较的范式,因为该人口平均值可能无法将您当前患病的自我与过去的健康自我进行比较。

您分析物的水平可能是10年前的两倍,这是一个不好的信号,因为这意味着您可能正在患某种疾病。分析物的这一水平可能仍在总体差异之内,因此您当前的医生可能会错过该水平。

机器学习如何增强使用diaPASEF获得的碎片模式,您是否相信我们可以对碰撞横截面值做同样的事情?

是。机器学习是一种在几年前进入蛋白质组学的技术。人们一直在将蛋白质组学和代谢组学中的深度学习应用于目标,以跳过我们目前为独立于数据采集而必须执行的一些非常繁琐且费力的步骤。

这些步骤之一是光谱或测定库的生成。现在我们有了第一个迹象,即可以完全预测这些光谱库,这将使我们能够更有效,更直接地挖掘dia数据,而无需依赖通常必须由数据完成的先前实验测量中的先前实验证据。依存收购。

这使我们能够断开繁琐的链接,在此之前我们总是需要进行数据依赖的采集,然后才能进行数据独立的采集,而我们可以直接进入数据独立的采集数据。

下一个前沿领域将是直接预测碰撞横截面值,因为这是挖掘diaPASEF数据所必需的。从我们与马克斯普朗克研究所的合作,我们已经看到,这是可能的,我们将很快开始朝着这个方向努力。

计算质谱法的主要挑战是什么,我们如何克服这些问题?

我认为,目前计算质谱法的主要挑战之一(尤其是与数据无关的采集有关)是庞大的数据量。timsTOF Pro再次使这一点爆炸式增长,与传统的Q-TOF仪器相比,我们的数据要多一千倍。这是因为现在将每个单独的TOF扫描分为1000个单独的TOF推送,我们都可以单独对其进行分析。

在扩展我们的算法以及解释大量数据方面,这是一个巨大的挑战。当前,我们记录的数据量超出了我们的解释能力,因此我们希望朝着利用全部数据(而不仅仅是一小部分)的方向迈进。

我认为与数据无关的采集面临的第二个挑战是,因为我们使用的是采集大量数据的方法,因此我们需要有一种对这些数据进行反卷积并将各个前体迹线与碎片离子迹线一起分配回去的方法。在我们添加离子迁移率作为分离技术之前,这是不可能的。

因为您在TOF中使用质谱仪,数据是否大一千倍?

它更大,是因为在所有以前的方法中,我们都使用单独的TOF推力将它们平均到一个单一的光谱中,而现在,每个TOF推力都与离子迁移率相关。我们曾经进行大约一千次单独的测量,然后将它们平均为一个测量值,这使我们可以压缩数据。

现在,每个单独的TOF推力都与离子迁移率相关联,这意味着我们需要保留该信息,而不能再简单地合并数据了。这意味着我们拥有更多的信息,但在数据分析中也面临着巨大的挑战。

为什么您认为使开发的程序成为开放访问很重要?

在我们的研究团队中,我们非常重视开发开源软件。造成这种情况的主要原因之一是透明度。我们希望人们能够准确地理解和重现他们的数据所发生的一切,这只有在开源软件中才能做到。

只有使用开放源代码软件,您才能阅读并处理可处理数据的代码,从而可以了解如何从原始数据文件到达特定的输出定量值。

第二个原因是围绕我们正在生产的软件发展与数据无关的采集社区。通过使该软件开放并可供开发人员使用,它使我们可以创建一个开发人员社区,这些社区可以利用我们的算法并在此基础上构建一些东西。

我们正在努力使它尽可能开放并向社区公开,以使其他人可以使用它并以此为基础,而不是在我们各自的孤岛上工作并尝试保护我们的研究。

您如何看待未来十年计算质谱领域的发展?

目前,我们在计算质谱法中要解决几个挑战。挑战之一是如何解释获得质谱仪记录的全部信息所需的各个数据集。

我也认为我们需要进入数据采集的第二个维度,即样本数量。我们需要能够可重复地进行这种类型的分析,以便可以为每位患者找到一次运行中分析物的定量值。为了使它起作用并克服批处理效果,我们仍然需要全新的算法。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

相关文章