1. 数据来源文章
文章:
研究方法:
本实验研究对像为智利北部的阿塔卡马沙漠。 此地为世界上最干旱的地区之一,其中有些地方十年降水量不足1毫米。尽管这里极端干旱,但仍有微生物生活在这里。我们的采样地点为东部的Baquedano和西部的Yungay,发现土壤温度与降水量正相关。在这两个地点,我们挖坑,并在不同深度取三组样品。
软件版本:
qiime2-2018.4
2. 数据准备
source activate qiime2-2018.4
mkdir qiime2-atacama-tutorial
cd qiime2-atacama-tutorial
# 实验设计表
wget http://bailab.genetics.ac.cn/markdown/QIIME2/atacama-soils/sample-metadata.tsv
# 10%的原始数据,正向,反向,barcode
mkdir emp-paired-end-sequences
wget -O "emp-paired-end-sequences/forward.fastq.gz" "https://data.qiime2.org/2018.4/tutorials/atacama-soils/10p/forward.fastq.gz"
wget -O "emp-paired-end-sequences/reverse.fastq.gz" "https://data.qiime2.org/2018.4/tutorials/atacama-soils/10p/reverse.fastq.gz"
wget -O "emp-paired-end-sequences/barcodes.fastq.gz" "https://data.qiime2.org/2018.4/tutorials/atacama-soils/10p/barcodes.fastq.gz"
3. 双端数据分析方法
# 双端数据导入,数据建库类型为EMP双端序列(本示例来自EMP项目)
qiime tools import \
--type EMPPairedEndSequences \
--input-path emp-paired-end-sequences \
--output-path emp-paired-end-sequences.qza
# 数据拆分
# 按Barcode进行样品:--m-barcodes-file为含有样品与barcode信息对应的实验设计,--m-barcodes-category指定含有barcode信息的列名称,--i-seqs输入文件,--o-per-sample-sequences输出文件, --p-rev-comp-mapping-barcodes为barcode方向,是用实验设计的barcode与测序文件比对确定方向,此分析中为反向互补
qiime demux emp-paired \
--m-barcodes-file sample-metadata.tsv \
--m-barcodes-category BarcodeSequence \
--i-seqs emp-paired-end-sequences.qza \
--o-per-sample-sequences demux \
--p-rev-comp-mapping-barcodes
# 对拆分样品的结果和质量进行统计
qiime demux summarize \
--i-data demux.qza \
--o-visualization demux.qzv
# 展示统计分析结果
qiime tools view demux.qzv
4. 回答问题
1. 接下来OTU表标准化参数–p-sampling-depth应该选多少?有多少样品应该从实验中剔除?过滤后核心矩阵中有多少数据量?
2. 实验设计中的那种分级方式中微生物组成差异最大?采用那种距离计算方法分开更明显,是unweighted UniFrac还是Bray-Curtis?考虑尝试使3. 用qiime diversity beta-correlation and qiime diversity bioenv分析结果,可以使用--help查看详细帮助。
4. 使用qiime diversity alpha-correlation分析样品间的相关性,看看能得到什么结论?
5. 按组分析Alpha多样性,并比较是否有显著差异?
6. 在门水平查看不同温度下微生物组成?看那些种类与湿度相关?
7. 在有无植被的取样地点,什么菌门差异明显?