RNA-Seq
RNA-seq analysis pipeline四個主要的任務為:
- alignment,把讀到的序列跟參考序列做比對
- 把reads組合成完整的transcripts
- 量化每個基因或transcript的表現量
- 將不同組別的定序資料做比對(ex:控制組與實驗組比較)
pipeline~
1.Tophat2 + Cufflinks
較舊,較慢,但是比較多人用。
2.HISAT2 + StringTie + Ballgown
新,速度快了50倍,甚至可以在桌機上面跑,但是很新所以用的人還不多。
HISAT2
- 把reads對到genome上,並找出splice sites。
StringTie
- 把alignments組合成transcripts(完整或部分長度)、產生isoform。
- 估計各基因、transcript的表現量。
Ballgown
- 比對各組實驗之間的表現量差異。