摘要: ssr软件应用分析
ssr (simple sequence repeats,简单序列重复)是一种常用的遗传分子标记。关于ssr特点和检测方法,我们之前写过不少的文章(具体请见文末链接),那么当我们获得了样本间ssr的基因分型信息后又该如何分析呢,今天小编就给大家介绍一下ssr分析中最常用的生信软件“三件套”。
1、powermarker软件
powermarker相关文章最早发表在2005年的bioinformatic上。用powermarker软件可以进行基因型遗传多样性分析,获得等位基因频率、等位基因数、基因多样性指数及基因型多态性信息含量(pic),其中的pic可以用来衡量基因变异程度的高低,一般认为,当pic<0.25 时,为低度多态性信息引物,0.25<pic<0.50 时,为中度多态性信息引物,pic>0.50 时为高度多态性信息引物。通常群体的遗传多样性较高时ssr 标记多态性较好。
网址:http://statgen.ncsu.edu/powermarker/
软件界面举例
2、structure软件
网址:http://web.stanford.edu/group/pritchardlab/structure.html
利用structure软件可以进行群体结构估计。通常参数设置为k值选取1~10,重复次数为5;将mcmc(markov chain monte carlo)开始时的不作数迭代设为50000次,再将不作数迭代后的mcmc设为50000次,其余参数采用软件默认的设置。根据lnp(d)计算δk,依据δk值选择一个合适的k值,并得到该k值对应的q矩阵(第i材料的基因组变异来源于第k群体的概率)。
3、tassel软件
网址:https://tassel.bitbucket.io/
tassel软件相关文章最早发表在2007年的bioinformatic上,利用tassel软件可以将基因型数据生成亲缘关系矩阵(k矩阵),结合等位变异数据、基因型数据、各个环境的表型值、q矩阵, 利用mlm (mixedlinear model)进行性状和标记之间的关联分析,并计算标记位点在p<0.05 和p<0.01 时对表型变异的贡献率(r2)。在已获得关联位点的基础上, 再进行优异等位变异的发掘,通过对ssr 位点等位变异表型效应计算,最终获得与表型性状显著关联的位点等位变异、表型效应及典型品种。
案例分析:
下面分享一篇2017年刚刚发表的文章“genetic diversity, population structure and association analysis in coconut (cocos nucifera l.) germplasm using ssr markers”,本研究利用48个ssr分子标记探讨了79种椰子的遗传多样性,种群结构以及与果实产量相关性状的关联分析。
表1、本研究所用的椰子材料情况
表2、连续三年对椰子果实性状表型评价数据
以上是对研究的椰子群体的表型信息进行了统计分析,下面的部分就是结合所测ssr基因分型数据,利用生信工具“三件套”进行的遗传多样性、种群结构以及与性状关联分析,具体如下:
表3、利用powermarker软件对椰子基基因型多态性信息含量等指标的统计
图1、群体遗传关系的聚类分析结果
图2、利用structure软件对椰子群体进行遗传结构分析
表4、利用tassel软件进行的椰子果实产量关联ssr标记分析
可见,只要大家手上有好的实验材料,在记录统计好表型数据并且准确获得ssr基因分型信息后,就可以利用powermarker、structure和tassel这“三件套”工具,进行遗传多样性、群体遗传结构和性状关联的探讨了, 只要学好这三种软件,或许ssr的分析并没有想象中的那么难!
往期精选文章:
关于天昊:
天昊生物拥有多种ssr检测平台!值得一提的是,我们自主研发的基于二代高通量测序平台的ssrseq技术,更是具有高准确性和高通量的特点,是ssr检测的“终极”太阳成tyc7111cc的解决方案,我们期待成为您ssr基因分型的优质服务提供商!