scRNA-seq数据差异基因表达分析的有效方法有哪些?

scRNA-seq数据差异基因表达分析的有效方法有哪些?

我们知道RNA-seq即转录组测序,是某个物种或者特定细胞类型产生的所有转录本的集合,而单细胞RNA测序(single-cell RNA-seq,简称scRNA-seq)则是以单个细胞为特定研究对象,提取其mRNA进行逆转录并进行高通量测序分析,可体现出个体细胞内表达水平的具体变化,目前已广泛应用在生物学、医药研发、临床医学等各个领域。

除此之外,scRNA-seq分析相比RNA-seq分析还具有多模态性、大量的零计数和稀疏性。

多模态性:

单细胞基因表达是一个随机过程,因此其表达值存在高度变异性。换句话说,表达水平与细胞亚型和细胞在整个细胞周期中的状态有关。因此,细胞之间的生物学差异,如不同的细胞类型、不同的mRNA含量和不同的细胞状态,导致基因表达值的多模态和异质性。

 

大量的零计数和稀疏性:

scRNA-seq数据的另一个特点是大量的零计数。但是并非所有从样本单元检测到的零计数都是真正的零表示。这只是意味着在测序过程中可能无法检测到一些真正表达的基因。这是由于少量的起始RNA导致许多转录物低于检测阈值。此外,低捕获效率可能会错过大量的逆转录过程。因此,我们可以观察到“drop-out”现象,即在这些细胞处于相同的条件下,其中一些转录物在某些细胞中强烈表达,但在其他细胞中未表达。

正是由于这些特性才推动了scRNA-seq数据分析鉴别差异基因表达方法的发展,以下举几个专门针对scRNA-seq数据提出的新方法新模型的例子:

1、使用两部分联合模型来检测差异表达基因,以适应多模态表达值和“drop-out events”;一部分模型对应于正常观察到的基因,另一部分模型对应于“drop-out events”。

(参考文献:Bayesian approach to single-cell differential expression analysis.)

2、MAST:使用hurdle model来表示零计数和阳性表达值,然后使用逻辑回归和线性回归分别识别每个部分的DE基因(differentially expressed genes)。

(参考文献:MAST: a flexible statistical framework for assessing transcriptional changes and characterizing heterogeneity in single-cell RNA sequencing data.)

3、使用线性模型——广义加性模型(GAMS)来识别DE基因。

(参考文献:The dynamics and regulators of cell fate decisions are revealed by pseudotemporal ordering of single cells.)

4、scDD:考虑了四种不同模式的分布在生物和跨生物条件下的基因表达值。

(参考文献:A statistical approach for identifying differential distributions in single-cell RNA-seq experiments.)

5、非参数方法:D3E,使用两个非参数方法,Cramer-von Mises实验和Kolmogorov Smirnov实验,比较每个基因在不同条件下的表达值的分布,以确定DE基因。

(参考文献:A statistical approach for identifying differential distributions in single-cell RNA-seq experiments.)

6、SigEMD:结合数据填补方法、逻辑回归模型和非参数方法,精确有效地识别scRNA-seq数据中的DE基因,

(参考文献:SigEMD: A powerful method for differential gene expression analysis in single-cell RNA sequencing data.)

你们还知道哪些方法,或者有什么新的idea,来与小编聊聊吧。

基金标书服务(科研课题方案设计、课题申报、国家级/省/市及基金标书协助申请)

实验外包服务(动物实验、转录调控、高通量测序、细胞实验、病理学实验、分子生物学实验、蛋白质研究、基因芯片等服务)
专业人做专业事
免费热线:400-080-3779

官网:
http://www.nambou1-bio.com/

主页

丁香通商铺:https://www.biomart.cn/61929/index.htm

 

Posted in 技术文章.

发表评论

电子邮件地址不会被公开。 必填项已用*标注