• edgeR
  • DESeq2
  • GFOLD

1. no replicates with edgeR

当没有重复样本时,edgeR给出了以下四条建议,这并不是说以下建议是完美的.而且他也不推荐以这种方式来替代样本的重复.此外,最好是在数据分析的阶段执行以下建议,2-4条建议最好是在没有生物差异时使用.

  1. 只画一个MDS-plot图,统计分析一下fold change, 但是不做差异性分析.

  2. 根据以往类似实验的经验,选择一个可信的离散值(dispersion vlaue),用这个离散值做exactTest和glmFit. Typical values for the common BCV (square-root-dispersion) for datasets arising from well-controlled experiments are 0.4 for human data, 0.1 for data on genetically identical model organisms or 0.01 for technical replicates.

1
2
3
4
bcv <- 0.2
counts <- matrix(rnbinom(40, size=1/bcv^2,num=10), 20, 2)
y <- DGEList(counts=counts, group=1:2)
et <- exactTest(y, dispersion=bcv^2)
  1. 把某个/些可解释的因子从线性模型里面移除
  2. 从大量稳定转录的转录本数据中估测离散值,用这个离散值进行统计.

2.DESeq2

由于差异分析基于离散度的负二项分析方法,没有重复样本时的离散度计算不准确,DESeq2已经不支持无重复样本的差异分析.

3.GFOLD

1
gfold diff -s1 Sample1.count -s2 Sample2.count -o Sample1VSSample2.diff

Comments