2018-10-15
扩增子测序 mothur使用示例

1 初始说明

  • 测序数据类型

Illumina Miseq paired-end reads

  • 实验设计

断奶后365天(dpw 365)的小鼠排泄物,比较初始10天(dpw 10)和中间10天(dpw140-150)的排泄物的微生物组的稳定性(肠道微生物组的变化情况)。为了简化操作,只用到一只小鼠的十个时间点(前5后5)的数据。这里还有模拟了由21种细菌组成的菌群的全基因组测序数据。先用小鼠的排泄物测序数据学习分析微生物群落,然后用模拟的菌落判断分析的错误率和它在其他分析中的作用。

  • 关于软件

mothur既提供交互模式(像python),也提供命令行模式;后者可以进行批量操作。

Read More

2018-10-14
基因组变异检测(Variance Calling with GATK)

一、基本概念

1.1 名词解释

  • 基因组:个体全部DNA序列的无重复集.这里的基因组不仅仅包含了基因在内,由于目前尚有许多DNA序列不编码蛋白,也可能不会转录,反正就是这些序列的功能还没有研究清楚, 这些序列也都包含在基因组这个范畴里面.
  • Reads:二代测序中的一个专有名词,表示着测序仪对某个DNA片段的一次测序结果,是该DNA序列的序列组成. 其长度依据测序仪不同而不同.
  • 变异:variants, 变异是一个相对的概念,产生于比较之中, 比较是指同耳熟能详的参考基因组相比较. 对于人类基因组的变异来讲,参考基因组是经过“人类基因组”计划测序所得到的最终人类基因组序列.
Read More

2018-10-14
ChIP-seq专题 MACS2_ChIPSeeker_deeptools

ChIP-seq是使用抗体捕获富集DNA片段和高通量测序技术来获得某些marker与DNA的结合位点的一项综合技术。ChIP是染色质免疫共沉淀, 通过特异抗体将DNA结合蛋白免疫沉淀, 用于捕获蛋白质的DNA靶点, 比如转录因子啊, 组蛋白修饰啊. 它主要分为以下四步:cross-linking、sonication、IP、Sequencing。在DNA与蛋白交联以后, 通过超声的方式随机打断染色体, 在利用抗体将目的交联物筛选出来, 再反交联获取DNA,最后上机测序.获取到测序数据后,典型的分析流程如图.

ChIP分析流程

Read More

2018-10-12
差异分析 limma

limma最开始是用于芯片数据分析的,不过现在也支持RNA-seq等数据的差异分析,但是需要通过voom函数进行校正表达矩阵。

Read More

2018-10-12
差异分析 Ballgown

Ballgown是一款灵活的用于RNA-seq数据差异分析的软件,除了差异分析,他还可以进行转录本的组织、可视化和分析表达程度。

Read More

2018-10-12
比对 Bowtie2

bowtie2是个超快的、内存占用少的序列比对工具,善于比对相对较长的基因组。bowtie2有gapped、pair-end和local比对模式,可以多线程进行。它是许多pipeline的首个步骤,例如变异检测,CHIP-seq,RNA-seq,BS-seq等等。
bowtie2不像常规目的的比对工具如MUMmer,Blast等。它在大的参考基因组的比对上表现更好,因为它针对当前各个测序平台的测序reads进行过优化。如果你的目的是比对很大的两个序列,比如基因组之间的比对,你应考虑使用MUMmer。如果你的目的是比对相对较短的序列如大肠杆菌的基因组,用bowtie2可以大大减少你的时间。

Read More

2018-10-12
比对 STAR

STAR 的比对速率要比 bowtie 快那么一丢丢。

Read More

2018-10-12
比对 subread

subread是个套件,里面有subread aligner, subjunc aligner, featureCounts, exactSNP.

subread aligner可以用于DNA-seq和RNA-seq.当用于RNA-seq时,subread只适用于差异分析;对于检测基因组变异如可变剪接之类的,需要reads的完全比对,这时候可以使用subjunc进行比对.在比对RNA-seq数据时,subread不会取检测exon-exon junctions的存在,只会把exon-spanning eads的最大可比对区域作为比对结果.但是,如果只是进行差异分析的话,subread的结果足以进行.subread的比对上reads可能会比subjunc多.

Read More

2018-10-12
比对软件 Hisat2

hisat2是快速灵敏的比对软件,可用于全基因组测序,转录组测序,外显子测序的数据比对.基于GCSA(bwt的拓展),我们设计了graph FM index用于比对。hisat2的比对结果是sam格式文件,你可以使用samtools,GATK等软件进行后续的分析.

Read More

2018-10-12
GO_KEGG富集分析 clusterProfiler

首先呢,要详细了解的话,需要看这篇文献(Ten Years of Pathway Analysis: Current Approaches and Outstanding Challenges),他把基本的信号通路分析方法进行了总结.

Read More