您现在的位置是:首页 >新闻频道 > 医学前沿 > 2020-04-01 10:30:14

科学家找到了一种改进差异基因表达分析的实用方法

鉴定差异表达基因(DEG)是许多生物医学研究的基本步骤。RNA测序是用于此目的的最流行方法,已被广泛使用。例如,已有超过10,000次引用了两种用于RNA序列差异表达(DE)分析的算法edgeR和DESeq2。

重复性不足的DE分析会影响准确性,并可能使以这种方式得出的许多结论无效。生物统计学家长期以来一直鼓励使用更多的生物复制品来获得足够的统计能力,以正确地调用DEG。但是,由于当前RNA测序分析方法的局限性,包括相对较高的成本和复杂的处理,大多数研究仅使用了2至3个重复。在此复制水平上,只能识别变化最大的基因。因此,缺乏实用的实验方法使生物学家无法采用足够的复制品来在DEG发现研究中获得足够的功效。

最近,由中国科学院遗传与发育生物学研究所涂强博士领导的研究小组开发了一种实用的方法Decode-seq(条形码SEQuencing的差异表达分析),以克服目前RNA-seq的局限性DE分析并实现更准确的DEG发现。

Decode-seq使用分子条形码在一个文库中同时分析几十个样品,从而大大减少了文库制备的时间和成本。它丰富了用于测序的5'cDNA末端,与全长测序相比,减少了所需的测序深度,并克服了3'末端测序的困难。解码序列库与标准Illumina测序设置兼容。因此,它不需要定制的测序循环编号或引物,并且用户不必将整个流通池或泳道专用于测序。

这些功能大大降低了分析成本,降至传统RNA-seq方法的约10%。在验证实验中,当重复数从3增加到30时,灵敏度从31%增加到95%,错误发现率从34%下降到14%。解码序列也可与少量的RNA兼容。

研究人员在性别确定的早期将这种方法用于分析高aka鱼,并进行了30对重复实验。他们发现了多个新颖的性二态表达基因,其中一些是生殖细胞发育所必需的。

简而言之,增加重复数会大大提高DE分析的性能,而Decode-seq为此提供了一种实用的方法。除非样品很珍贵,否则就需要进行全长测序,否则就不存在功率不足的问题,因此没有足够的理由使用不充分的重复样品。因此,科学家呼吁,如果可能的话,应避免在DE分析中使用三个重复的常规做法。可从TU实验室的主页上获得实验协议和计算管道。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

相关文章