qiime(quantitative insights into microbial ecology)是于2010年发表于nature methods的一款进行微生物群落结构分析的开源生物软件,是微生物组研究领域使用最广泛的扩增子测序数据分析流程。
而于2018年全面接替qiime的qiime 2,是一个经过完全重新设计和重写的系统(https://qiime2.org/)(源代码见 https://github.com/qiime2),可实现对微生物组数据的可重复性和模块化分析,是代表未来趋势的微生物组分析方法最新标准,相关结果于2019年7月已经发表于顶级期刊nature biotechnology[1]!
qiime2优点
1)生成的图表文件类型.qzv 保证了分析结果的交互式可视化2)统一的分析过程文件格式.qza保证了每一步分析结果可重复,可追溯3)支持自定义分析插件加入分析流程保证了系统功能的可扩展性4)安装非常方便5)分析流程化标准化6)使用方式更加多样
qiime2流程之dada2插件
因为目前qiime2流程有很多插件,下面就为大家着重介绍其中的明星插件dada2。qiime2就是采用dada2插件对原始数据进行降噪,拼接及去嵌合体,其质控条件更严格,仅去重复序列,不再对序列进行相似度聚类,用扩增序列变体(amplicon sequence variant,asv)替代操作分类单元(operational taxonomic units,otu),提高了分类学分辨率,得到结果更加真实可靠,为什么这么说呢,传统的otus相似聚类阈值是97%,而dada2分析则是以100%的相似度聚类,2016年发表在nature method [2]上的相关研究结果表明,dada2分析可以获得单碱基精度的代表序列,这不但大大提高了样本中真实的种甚至菌株水平的鉴别率,同时降低假阳性otus的几率,这对后续开展特定单菌的功能验证实验打下坚实可靠的基础。
表1 通过与这些模拟群体的已知序列(参考菌株)进行比较,并与核酸序列进行比较以鉴定污染物,将输出序列分为reference 或者 exact(真阳性)和one off 或者other(假阳性)。 结果发现dada2检测到最多的参考菌株和序列,同时输出最少的假阳性。
图1 dada2推断的序列变体与uparse构建的otus比较。结果表明dada2推断的序列变体与uparse输出的otus(黑色)基本一致,但是,dada2发现了额外真实的物种(蓝色),同时输出了更少的假阳性序列(one off and other)。
图2 怀孕期间人类生殖道群落中的lactobacillus crispatus序列变体。结果表明dada2可以鉴定到多个样品中原本存在但是传统otus聚类没有发现的六个乳杆菌16s rrna序列变体。
参考文献:
1、bolyen e, rideout jr, dillon mr, et al. reproducible, interactive, scalable and extensible microbiome data science using qiime 2. nature biotechnology. 2019 aug;37(8):852-857.
2、callahan bj, mcmurdie pj, rosen mj, et al.
dada2:high-resolution sample inference from illumina amplicon data. nature
methods, 2016 jul;13(7):581-3.
看完上述描述,是不是感觉qiime2平台很强大呢,是不是特别想尝试一下这一革命性的创新分析流程呢,不用着急,天昊生物紧跟生信分析新趋势,已将公司原有的相对定量扩增子数据分析流程和绝对定量扩增子数据分析流程全面升级为基于qiime 2的分析流程,从而让老师们的研究成果符合行业最新标准,能够更快更好的发表研究成果,心动不如行动,欢迎各位老师与我们沟通联系!