RNAseq数据分析实用方法

RNA-seq数据分析实用方法

鉴于目前RNA-seq应用的广泛性,小编着手将RNA-seqDataAnalysisAPracticalApproach这本书翻译成中文,供大家入门使用。同时小编也会融入最新的一些技术方法,供大家学习。另外有想加入小编翻译团队的请留言,小编拉你进群。

数学和计算生物学系列丛书

目标和范围:

本系列旨在整个数学、计算生物学和医学的范围内捕捉新的发展并总结我们已知的知识。通过发表广泛的教科书,参考书和手册,鼓励将数学,统计学和计算科学应用到生物学中。丛书中主要对象是数学,统计学,计算科学,基础生物学和生物工程研究以及跨学科领域相关的学生,研究人员和专业人士。包含具体的例子和应用程序,以及编程技术和例子是非常值得推荐的。

丛书编辑

N.F.Britton

数学科学系,巴斯大学

XihongLin

生物统计学系,哈佛大学

HershelM.Safer

计算机科学学院,特拉维夫大学

MariaVictoriaSchneider

欧洲生物信息研究所

MonaSingh

计算机科学系,普林斯顿大学

AnnaTramontano

物理系,罗马大学

目录

第1章RNA-seq介绍1

1.1引言1

1.2RNA的分离3

1.3RNA的质量控制4

1.4文库准备6

1.5主要RNA-SEQ平台9

1.5.1Illumina9

1.5.2SOLID10

1.5.

1.5.4IonTorrent11

1.5.5PacificBiosciences

1.5.6NanoporeTechnologies13

1.6RNA-SEQ应用14

1.6.1蛋白质编码基因结构14

1.6.2新的蛋白质编码基因16

1.6.3基因表达定量和比较

1.6.4表达数量性状位点(eQTL)17

1.6.5单细胞RNA-seq18

1.6.6融合基因18

1.6.7基因变异19

1.6.8长链非编码RNA19

1.6.9小的非编码RNA(miRNA-seq)20

1.6.10扩增产物测序(Ampli-seq)20

1.7RNA-SEQ平台选择21

1.7.1RNAseq测序平台和模式选择的八个一般性原则21

1.7.1.1准确性:测序准确度如何?21

1.7.1.2Read:我需要多少?22

1.7.1.3长度:Read要多长?23

1.7.1.4SR或PE:单端测序还是双端测序?23

1.7.1.5RNA或DNA:测序RNA还是DNA?23

1.7.1.6材料:用多少样品?24

1.7.1.7成本:能花多少钱?24

1.7.1.8时间:需要多长时间完成?24

1.7.2小结25

参考文献25

第2章RNA-seq数据分析介绍27

2.1引言

2.2差异表达分析工作流程30

2.2.1步骤1:Read的质量控制31

2.2.2步骤2:Read的预处理31

2.2.3步骤3:将Read与参考基因组比对31

2.2.4步骤4:基因组引导的转录组组装32

2.2.5步骤5:计算表达量32

2.2.6步骤6:不同条件表达量比较33

2.2.7步骤7:在基因组中进行数据的可视化33

2.3下游分析34

2.3.1基因注释34

2.3.2基因组富集分析34

2.4自动化的工作流程35

2.5硬件要求35

2.6例子36

2.6.1使用命令行工具和R36

2.6.2使用Chipster软件37

2.6.3示例数据集39

2.7总结40

参考文献40

第3章质量控制和预处理41

3.1引言41

3.2质量控制和预处理软件42

3.2.1FastQC42

3.2.2PRINSEQ43

3.2.3Trimmomatic44

3.3Read质量问题44

3.3.1基本质量44

3.3.1.1过滤45

3.3.1.2裁剪49

3.3.2不明确的碱基52

3.3.3接头54

3.3.4Read长度55

3.3.5随机六聚体引物引起序列偏差和不匹配56

3.3.6GC含量57

3.3.7复制比例57

3.3.8序列污染59

3.3.9低复杂度序列和PolyA尾巴59

3.4总计60

参考文献61

第4章将Read与参考序列比对63

4.1引言63

4.2比对程序64

4.2.1Bowtie64

4.2.2TopHat68(HISAT)

4.2.3STAR73

4.3比对结果统计和对比结果文件操作77

4.4在基因组环境中可视化测序Read81

4.5总结82

参考文献83

第5章转录组组装85

5.1引言85

5.2方法87

5.2.1转录组装与基因组组装不同87

5.2.2转录本重建的复杂性88

5.2.3组装过程89

5.2.4deBruijnGraph90

5.2.5丰度信息的使用91

5.3数据预处理92

5.3.1Read错误纠正93

5.3.2Seecer93

5.4基于mapping的组装95

5.4.1Cufflinks95

5.4.2Scripture97

5.5从头组装98

5.5.1Velvet+Oases98

5.5.2Trinity

5.6总结

参考文献

第6章基于定量和注释的质量控制

6.1引言

6.2基于注解的质量指标

6.2.1基于注释的质量控制工具

6.3基因表达定量

6.3.1计数每个基因的读数

6.3.1.1HTSeq

6.3.2计数每个基因的Read

6.3.2.1Cufflinks

6.3.2.2eXpress

6.3.3每个外显子Read计数

6.4总结

参考文献

第7章RNA-seq分析中的R和Bioconductor

7.1引言

7.1.1安装R和附加软件包

7.1.2使用R

7.2Bioconductor概述

7.2.1软件包

7.2.2注释包

7.2.3实验包

7.3Bioconductor的特征

7.3.1R中的OOP特性

7.4在R中表示基因和转录本

7.5R中的基因组

7.6在R中表示SNP

7.7制作新的注释包

7.8总结

参考文献

第8章差异表达分析

8.1引言

8.2技术VS.生物学重复

8.3RNA-SEQ测序数据的统计分布

8.3.1生物学重复,计数分布和软件选择

8.4标准化

8.5软件使用示例

8.5.1使用Cuffdiff

8.5.2使用Bioconductor包:DESeq,edgeR,limma

8.5.3线性模型,设计矩阵和对比矩阵

8.5.3.1设计矩阵

8.5.3.2对比矩阵

8.5.4差异表达前的准备分析工作

8.5.4.1从BAM文件开始

8.5.4.2从个别计数文件开始

8.5.4.3从现有计数列表开始

8.5.4.4独立过滤

8.5.5DESeq(2)的代码示例

8.5.6可视化

8.5.7参考:其他Bioconductor代码示例

8.5.8Limma

8.5.9SAMSeq(samr包)

8.5.10edgeR

8.5.11多因子的DESeq2代码示例

8.5.12参考:edgeR代码示例

8.5.13Limma代码示例

8.6总结

参考文献

第9章外显子差异表达分析

9.1引言

9.2为DEXSeq准备输入文件

9.3取数据到R

9.4访问ExonCountSet对象

9.5标准化和估计方差

9.6差异表达测试

9.7可视化

9.8总结

参考文献

第10章注释结果

10.1引言

10.2检索附加注释

10.2.1使用特定物种的注释包检索基因的注释

10.2.2使用BioMart检索基因注释

10.3使用GO注释

10.4基因分析更多细节

10.4.1GOstats包

10.4.2Globaltest包

10.4.3长度偏差修正方法

10.5总结

参考文献

第11章可视化

11.1引言

11.1.1图像文件类型

11.1.2图像分辨率

11.1.3颜色模型

11.2R中的图形

11.2.1热图

11.2.2火山图

11.2.3MA图

11.2.4Idiogram

11.2.5可视化基因和转录本结构

11.3定位图形

11.4总结

参考文献

第12章小的非编码RNA

12.1引言

12.2MICRORNA(miRNA)

12.3MICRORNAOFF-SETRNAS(moRNA)

12.4piRNA

12.5内源沉默RNA(endo-siRNA)

12.6外源沉默RNA(exo-siRNA)

12.7tRNA

12.8snoRNA

12.9snRNA

12.10增强子衍生的RNA(eRNA)

12.11其他小的非编码RNA

12.12小的非编码RNA测序方法

12.12.1microRNA-seq

12.12.2CLIP-seq

12.12.3降解组测序

12.12.4总体的核不分段测序(GRO-seq)

12.13总结

参考文献

第13章小的非编码RNA测序数据的的分析

13.1引言

13.2miRDeep0

13.2.1GFF文件

13.2.2已知miRNA的FASTA文件

13.2.3设置运行环境

13.2.4运行miRDeep6

13.2.4.1miRDeep2输出

13.3miRNA目标基因分析

13.3.1运行miRanalyzer

13.4miRNA目标分析

13.4.1计算预测方法

13.4.2人工智能方法

13.4.3基于实验支持的方法

13.5miRNA-SEQ和mRNA-SEQ数据联合分析

13.6小RNA数据库和资源

13.6.1在miRBase中RNAseq测序中的miRNA

13.6.2miRNA的表达图谱

13.6.3CLIP-seq和Degradome-seq的数据库

13.6.4miRNA和疾病的数据库

13.6.5研究领域的一般数据库和资源

13.6.6miRNAblog

13.7总结

参考文献

索引

欢迎



转载请注明地址:http://www.teyulian.com/tlxx/4695.html
  • 上一篇文章:
  • 下一篇文章:
  • 热点文章

    • 没有热点文章

    推荐文章

    • 没有推荐文章