macs2的输出文件解读

转载自:https://www.jianshu.com/p/21e8c51fca23

NAME_peaks.xls
包含peak信息的tab分割的文件,前几行会显示callpeak时的命令。输出信息包含:

  • 染色体号
  • peak起始位点
  • peak结束位点
  • peak区域长度
  • peak的峰值位点(summit position)
  • peak 峰值的高度(pileup height at peak summit, -log10(pvalue) for the peak summit)
  • peak的富集倍数(相对于random Poisson distribution with local lambda

NAME_peaks.narrowPeak
*narrowPeak文件是BED6+4格式,可以上传到UCSC浏览。输出文件每列信息分别包含:

  • 1;染色体号
  • 2:peak起始位点
  • 3:结束位点
  • 4:peak name
  • 5:int(-10*log10qvalue)
  • 6 :正负链
  • 7:fold change
  • 8:-log10pvalue
  • 9:-log10qvalue
  • 10:relative summit position to peak start(?)

  • NAME_summits.bed
    BED格式的文件,包含peak的summits位置,第5列是-log10pvalue。如果想找motif,推荐使用此文件。

Remove the beginning track line if you want to analyze it by other tools.???

  • .bdg
    bedGraph格式,可以导入UCSC或者转换为bigwig格式。两种bfg文件:treat_pileup, and control_lambda.
  • NAME_peaks.broadPeak
    BED6+3格式与narrowPeak类似,只是没有第10列。

summits.bed,narrowPeak,bdg, xls四种类型输出文件的比较:

  • xls文件
    文件包含信息还是比较多的,和narrowPeak唯一不同的是peak的起始位置需要减1才是bed格式的文件,另外还包含fold_enrichment 和narrowPeak的fold change 对应,-log10pvalue,-log10qvalue,peak长度,peak 峰值位置等。
  • narrowPeak文件
    和xls文件信息类似
  • summits.bed文件
    包含峰的位置信息和-log10pvalue
  • bdg文件
    bdg文件适合导入UCSC或IGV进行谱图可视化,或者转换为bigwig格式再进行可视化。
    为什么染色体号后面会出现其他的字符串????



 

作者:六六_ryx
链接:https://www.jianshu.com/p/21e8c51fca23
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

猜你喜欢

转载自blog.csdn.net/fengleqi/article/details/83176279