最近使用三代+三代做无参转录组测序,感觉公司算的表达量不怎么靠谱,决定亲自算一算。摸索了好久,做个笔记,供大家参考。
1,安装RESM软件:
下载地址则http://deweylab.github.io/RSEM/,下载最新版的安装吧!
安装:make
make install
没有root权限使用make install 可能出错,使用 make DESTDIR=/install/directory install安装到指定目录。
建议吧RESM的bin文件加入环境中,调用的时候简单一些。
2,安装bowtie2软件:
下载地址:https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.3
安装:解压后进入bowtie2目录:make
然后赋予绝对权限:chmod 777 bowtie
把bowtie2加入环境内,方便调用。
3,开始使用RSEM来计算表达量了
(1),建立索引:我这里是无参的,所有先建立基因与转录本的对应表mouse_ref_mapping.txt,如官方给定格式:
运行索引命令:
rsem-prepare-reference --transcript-to-gene-map mouse_ref_mapping.txt --bowtie2 mouse_ref.fa mouse_ref
其中mouse_ref.fa是三代测序得到的unigene或是二代组装得到的unigene。而mouse_ref是建立索引输出文件,供下一步使用。
(2),计算表达量:
rsem-calculate-expression -p 8 --paired-end \
--bowtie2 --bowtie2-path software/bowtie2-2.2.6 \
--estimate-rspd \
--append-names \
data/SRR937564_1.fastq data/SRR937564_2.fastq \
ref/mouse_ref exp/LPS_6h
这里用到二代测序的两个原始文件和上一步索引文件,LPS_6h是你输出文件的文件名。
开始写博客没多久,如果有用请给一个赞支持一下。