根据物种注释结果,选取每个样品在各分类水平(Phylum、Class、Order、Family、Genus)上相对丰度大于等于1%的物种,生成物种相对丰度分布图,以便直观查优势微生物类群在不同样品间的相对丰度变化情况。
对各层级物种相对丰度进行排序,选取排序在前30的物种,进行物种和样品两个层面的聚类。对样品进行聚类(依据是不同样品中各 OTU 的序列数越相近,即所含菌属数量越相近,样品间相似性越高),对聚类后各样品中不同 OTU(不同菌属)所含序列的丰度作heatmap图,能够反映出在菌属水平上各样品菌落结构的相似性和差异性。
选取总体相对丰度排在前50且有属分类信息的OTU的代表性序列,构建系统发育树。每个分支末尾的名称由属名和对应的OTU编号组成,若属名相同则使用同种颜色进行标记。该图可以看出相对丰度较高的属主要是哪些,此外,也包含了物种之间的进化分类关系,即不同的分支结构。
主成分分析是一种应用方差分解方法,对多维数据进行降维,从而提取出数据中最主要的元素和结构。应用PCA分析,能够提取出最大程度反映样品间差异的两个坐标轴,即主成分1(PC1)和主成分2(PC2),并以百分数的形式体现主成分主要影响程度,从而将多维数据的差异反映在二维坐标图上,进而揭示复杂数据背景下的简单规律。如果样品的群落组成越相似,则它们在PCA图中的距离越接近。
NMDS(Nonmetric Multidimensional Scaling)非度量多维尺度法,是一种将多维空间的研究对象(样本或变量)简化到低维空间进行定位、分析和归类,同时又保留对象间原始关系的数据分析方法。适用于无法获得研究对象间精确的相似性或相异性数据,仅能得到他们之间等级关系数据的情形。其特点是根据样品中包含的物种信息,以点的形式反映在多维空间上,而对不同样品间的差异程度,则是通过点与点间的距离体现的,最终获得样品的空间定位点图。
LEfSe分析即LDA Effect Size分析,可以实现多个分组之间的比较,同时也可进行分组内部亚组之间的比较分析从而找到组间在丰度上有显著差异的物种(即biomaker)。
该图表示在大于设定的LDA值(LDA>= 2)的条件下不同组中丰度有显著差异的物种,柱状图的长度代表显著差异物种的影响大小。
该图由内至外辐射的圆圈代表了由门至属(或种)的分类级别。红色区域和绿色区域表示不同分组,在不同分类级别上的每一个小圆圈代表该水平下的一个分类,小圆圈直径大小与相对丰度大小呈正比。其中无显著差异的物种以黄色进行标记,差异物种以组的颜色进行着色。某一颜色(如红色)节点表示在红色组别中起到重要作用的微生物类群。圆圈中的物种名称以字母数字等做标记,并在右侧图例中对应展示。
将biomaker丰度最高的样本的丰度设定为1,其他样品中该biomarker 的丰度为相对于丰度最高样品的相对值。
此分析是主要用来反映菌群与环境因子之间关系。分析可以检测环境因子、样品、菌群三者之间的关系或者两两之间的关系。图中箭头代表不同的环境因子,射线越长表示该环境因子影响越大。环境因子之间的夹角为锐角时表示两个环境因子之间呈正相关关系,钝角时呈负相关关系。不同的圆点表示不同样品,三角形表示相对丰度大于1%的物种。