开学了,暑假期间送的微生物样品16s/18s/its扩增子测序实验报告到手了,打开一看,哇!数据分析结果有几十项之多,那么问题来了,我们如何从这么多项结果中快速判断自己实验结果是好是坏,如何按发表文章的逻辑层次理出一个大概呢?今天小编就给大家展示一下。
step1 了解微生物多样性文章的逻辑层次
微生物多样性文章无论是医学样本还是农牧、环境样本其实写作套路是固定的,基本上是按如下逻辑层次进行:
1. 数据质控与统计:统计每个样本的测序数据量和测序质量
2. alpha多样性分析:比较不同样本间物种多样性的差异(谁多谁少)
3. 群落组成分析:比较不同样品间物种组成差异(哪个菌种增多,哪个菌种较少)
4. beta多样性分析:比较不同样品间整体物种组成的相似性远近(组间是否分开,组内是否聚在一起)
5. 环境因子分析:分析样本菌种与环境因子或临床指标之间的相关性(哪些菌种与环境因子是正相关,哪些是负相关)
step2 了解扩增子测序实验报告的结果层次
了解了微生物多样性文章的逻辑层次,那么再看看16s/18s/its扩增子测序实验报告中的数据分析流程图,您是不是就一目了然了呢,感觉契合度很高呢!
当然每一项分析根据目录从交付文件中具体查看。
step3 抓看文章发表重点图表
逻辑层次了解了,下一步就要从每个层次中重点看一下文章发表所需的常用图表了。
part1 数据质控与统计
首先我们需要重点看每个样本的有效测序数据量(即表格中的优化序列条数)和q30,这些是需要在文章中做简单描述的,例如质量控制后,扩增子测序共产生_个reads,平均每个样本产生_个reads。
|
结果目录:statistics/seqstat.xlsx
part2 alpha多样性分析
1、 多样性指数统计表(文章必需图)
目的:用于度量群落生态中的每个样本的物种丰富度和多样性。
计算菌群丰富度的指数:
(1)observed_species :直接观测到的otu的个数,数值越大代表物种越多。
(2)chao1:用于估计样品中物种总数,数值越大代表物种越多。
(3)ace:用于估计样品中物种总数,数值越大代表物种越多。
计算菌群多样性的指数:
(1)shannon:数值越大代表群落多样性越高。
(2)simpson:数值越大代表群落多样性越低。
(3)invsimpson:1-simpson指数值,数值越大代表群落多样性越高。
计算菌群多样性的覆盖率:
(1)coverage:用来评估样本序列覆盖度。数值越大代表越能捕捉样品的完整多样性。
结果目录:alphadiversity/diversityindex/alpha.diversity.index.xls
2、 多样性指数差异分析
目的:用以评估组间物种多样性是否存在显著差异,在文章中一般是这样描述的:与健康人群相比,患者肠道菌群多样性指数显著增加或减少。
图形解释如下:
结果目录:alphadiversity/diversityindex/alphadiversity
3、 稀释性曲线(文章必需图)
目的:1)通过对比不同样本的稀释曲线(画一条垂直线)可以比较不同样本间物种丰富度的差异;2)可以用来说明样本的测序数据量是否合理:如果样本曲线趋向平坦,说明测序数据量合理,如果样本曲线没有平坦,说明测序数据量不足。
结果目录:alphadiversity/rarefaction/samples_rarefaction_curves.pdf
part3 群落组成分析
1、 多样本群落结构柱状图(文章必需图)
目的:在某一分类水平上将每个样本的物种组成绘制成柱状图展示在一张图上,可以寻找所有样本的优势菌种、组间物种组成差异,一般在文章中分别在门、纲、目、科、属、种水平上寻找组间的差异菌种。
问题解疑:
unclassified:没有被研究的新物种或者所测区段太短不足以在某个分类水平获得分类
no_rank: 因为数据库没有收录相应序列信息,导致在某个分类水平上没有获得明确分类
结果目录:community/barplot /*.taxon.community.barplot.pdf
part4 beta多样性分析
1、 pca/pcoa分析 (文章必需图)
目的:用来分析不同样品群落组成的差异,组间样本距离越远,表明组间群落组成差异越大;同一组内各生物学重复样本距离越近,表明群落组成越相似。
常见问题:组间差异不明显,组内样本不能聚成一团,这个问题有可能是样本个体间差异大,没有严格按统一标准筛选样本导致的,这就需要前期加大样本量从而可以把异常样本删除掉,为了保证删除异常样本后还具有统计学意义,因此建议:医学样本:每组最少30个个体;鼠:每组最少10个样本;土壤样本:每组至少5个样本。
结果目录:
pca分析:betadiversity/pca
pcoa分析:betadiversity/pcoa
2、 lefse分析 (文章必需图)
目的:找到每组中丰度显著富集的差异物种,条形图越长代表这个物种越显著富集,因此要着重看一下排名最高的前几位菌属与样品表型是否相关。
结果目录:betadiversity/lefse
part5 环境因子分析
1、 物种与环境因子显著相关性分析(文章档次提升必需图)
目的:分析各物种与环境因子间的相关性,可以评估环境因子具体影响到了哪些物种。不同颜色表示两两间相关系数的大小,蓝色越深表示负相关性越强,橙色越深表示正相关性越强。
结果目录:environmentfactors/correlation
常见问题:医学样本取样时往往会忽略收集环境因子(临床指标)信息,一篇好的微生物文章要把微生物和疾病真正联系起来,不但要看组间的群落结构差异,还要把临床指标和微生物进行相关性分析,确定哪个菌种与疾病相关指标呈相关还是负相关,下面我们就看几个案例。
2、rda/cca分析(环境文章必需图)
目的:用来反映菌群与环境因子(环境样本理化指标)之间关系。箭头射线代表不同的环境因子,射线越长表示该环境因子影响越大。
结果目录:environmentfactors/rda_cca
看完这些,相信您已经抓住微生物多样性实验报告的精髓,可以在很短时间内就可以快速判断自己的实验结果是否达到预期,当然我们天昊微生物扩增子报告中除了这些常见的图表,还有很多其它精彩而又个性化的图表等待您来探究,让您的微生物文章更上一层楼。
|