1.链特异性的基本知识

在建库的时候,选择的建库方法可以是链特异性的,链特异性的文库可以清楚地分出reads的方向是否与转录本相同;常用的链特异性文库方法是基于dUTP的方法.

文库类型 PE SE 建库方法
非特异性 Standard Illumina
fr-firststrand RF R dUTP,NSR,NNSR
fr-secondstrand FR F Ligation,Standard SOLiD

2.链特异性与软件

在许多软件中,需要设置链特异性的参数,设置错了会导致结果与预期大相径庭.常用软件的参数设置如下。

  • Trinity: 链特异性的文库需要设置–SS_lib_type, dUTP法值为RF
  • cufflinks: 链特异性的文库需要设置–library-type=fr-firststrand(RF时)
  • tophat: dUTP, –library-type fr-firststrand
  • hisat2: dUTP, –rna-strandnes RF
  • eXpress: dUTP, –rf-stranded
  • RSEM: dUTP, –strandness reverse

3.如何判断测序数据是否是链特异性

  1. samtools建立索引
1
2
# aim.bam, 生成aim.bai
samtools index aim.bam
  1. 判断链特异性
    进入IGV软件
    右键选择color alignments by first-of-pair strand, 红蓝分布就是链特异性的

  2. 判断链特异性的种类
    在链特异性的样本上右键选color alignments by read strand, 或者鼠标放在read上, 如果信息显示first of pair的那个read的箭头方向与基因的方向相反,就是dUTIP的建库

  3. 用途
    在STAR运行结束后的ReadsPerGene.out.tab文件中, 非特异性链的reads数是在第二列;链特异性的reads数要选第四列.

Comments