16S是指16S rDNA(或16S rRNA),16S rRNA 基因是编码原核生物核糖体小亚基的基因,长度约1542bp,包括9个可变区和10个保守区,保守区序列反映了物种间的亲缘关系,而可变区序列则能反映物种间的差异。
qiime分为三大部分: 1.核心程序:uclust ,pynast,blast等; 2.脚本:check_id_map.py ,split_libraries.py(454测序)/split_library_fasta.py(ion torrent,illumina测序)等; 3.流程 :pick_open_reference_otus.py , core_diversity_analyses.py等。 数据处理 1.join_paired_ends.py 将pairend reads 连接起来 2.check_id_map.py 检查创建的mapping.txt文件有没有错误 3.identify_chimeric_seqs.py 去除嵌合体 4.split_libraries.py 利用barcode分离样品与数据过滤 5.count_seqs.py 统计文件 OTU聚类 1.pick_otus.py——从fasta文件中提取OTUs,提取方法有cd-hit ,blast ,Mothur,usearch。 2.make_otu_table.py——将提取出的OTUs制作成out_table,即.biom文件。 3.assign_taxonomy.py——使用reference中的reference_seqs和taxonomy文件对序列分类。 4.biom add-metadata——将taxa数据加入到,biom文件 biom summarize 统计otu biom convert 格式转换 多样性分析 1.single_rarefaction.py——随机抽样 2.beta_diversity.py——beta分析 3.principal_coordinates.py——pCoA图形化 4.alpha_diversity.py——alpha多样性 5.summarize_taxa.py ——物种分类统计 系统发育分析 1.align-seqs.py 2.filter_alignment.py 3.filter_fasta.py 4.make_phylogeny.py 绘图类 make_emperor.py plot_taxa_summary.py beta_diversity_through.py categorized_dist_scatterplot.py make_2d_plots.py make_distance_boxplots.py make_distance_comparison_plots.py make_rarefaction_plots.py plot_rank_abundance_graph.py plot_semivariogram.py plot_taxa-summary.py quality_scores_plot.py summarize_taxa_through_plots.py