摘要:水稻品种分析最新研究进展
水稻是世界上最重要的农作物之一,约为世界一半人口的主食。野生稻作为一个巨大基因库,在水稻品种改良过程中起到重要作用。如何准确、快速地鉴定这些品种,便成为有效利用野生稻种质资源的关键。在本研究中,研究人员通过比较水稻叶绿体基因组进行品种鉴定,开发出具有应用价值的叶绿体分子标记。本研究利用illumina hiseq平台,对4个水稻品种叶绿体基因组进行测序,并从genbank数据库中获得另外14种水稻叶绿体基因组序列,之后进行比较分析。研究对18种水稻叶绿体基因组中的ssr类型及分布进行了统计,并且发现有5个可变区(rps16-trnq,trnteyd,psbe-petl,rpoc2和rbcl-accd)可以作为dna条形码进行检测,单个基因最高检测的分辨率可达到72.22%,是通过rpoc2和rbcl-accd的基于距离方法得到的,而通过rps16-trnq trnteyd rbcl-accd, rps16-trnq trnteyd rpoc2和 rpoc2 trnteyd psbe-petl这三种标记组合则可达到100%的品种分辨率。通过比较品种间叶绿体基因组序列,从中鉴定出最易变的区域,并评估分歧焦点区域,是开发物种特异性dna条形码的有效方法。基于对水稻叶绿体基因组资源的评价,研究人员认为利用叶绿体基因组序列开发分子标记来鉴定用于水稻改良的野生稻遗传资源是可靠和有用的。
发表时间:2017年10月 发表期刊:frontiers in plant science 影响因子:4.3
研究背景:
1、野生稻蕴藏着宝贵的遗传多样性资源,对水稻作物的改良具有巨大作用。野生稻的分类仍然存在问题。例如,a-genome分组中包含了8个二倍体品种,它们大多缺乏明确的形态学特征。
2、dna条形码技术可以提供一种新的用于准确鉴定物种的方法。常用的植物dna条形码包括叶绿体基因rbcl和matk或ycf1b和核基因its等。但是作为水稻系统发生研究,目前仍无十分有效的dna条形码可以用。
研究内容:
叶绿体基因组测序、ssr及dna条形码分析。
具体方法:
1、提取植物基因组总dna,超声获得400-600 bp片段,利用nebnext® ultratm dna建库试剂盒构建测序文库,illumina hiseq测序平台进行双末端测序(2 x 150 bp)。
2、利用spades 3.6.1软件对测得的reads进行定性评估和组装,blast比对所用的水稻叶绿体参考序列genbank登录号为jn861110。用sequencher 5.4.5 软件对得到的contigs进行叶绿体基因组组装。对剩余的gap设计引物进行一代补充测序,最终获得完整叶绿体基因组序列。利用plann软件对叶绿体基因组进行注释,并用genome vx软件绘制叶绿体基因组图谱。
3、利用microsatellite (misa)在叶绿体基因组中寻找ssr,.参数标准为单核苷酸重复>10,二核苷酸重复>5,三核苷酸重复>4,四、五、六核苷酸重复>3。基于回文结构,利用网络reputer软件进行分散重复序列开发。
4、利用叶绿体基因组对18种稻属植物的平均成对序列差异进行分析。所有水稻叶绿体基因组的比对用mafft v7软件进行,假设共线性基因组完全一致,然后使用se-al 2.0软件手动调整。利用mega 6软件计算变异和简化的碱基位点,并且通过计算水稻叶绿体基因组的p-距离来估计水稻品种的分化程度。
利用全叶绿体基因组序列数据,采用最大简约法(mp)、最大似然法(ml)和贝叶斯推理法(bi)构建系统树。mp分析使用paup v4b10软件进行,利用启发搜索的“multrees”选项,以及树平分重联分支交换方法。为了评估节点支持度,进行带有10个随机分类和启发搜索的1000次重复自举分析。对所有碱基进行权重分析,gaps标记为缺失,其字符状态视为无序。ml分析采用raxml v.8.1.24软件,选择一般时间可逆(gtr)及g模型。对节点的支持度用1000次快速自举重复进行评估。bi分析使用mrbayes v3.2软件,通过进行1000000代计算及每1000代取样一次方法进行分析,先丢弃构建的前25%的树作为预实验数据,对剩下的数据构建50%多数规则一致性的树,估计贝叶斯后验概率。
5、分歧热点识别使用spider软件的slideanalyses函数命令,对叶绿体基因组高变区进行鉴定。这个函数提取所有选定窗口大小的比对dna序列,并对每个窗口进行两两距离(k2p)分析。对高变区的识别需要考虑两个因素:第一是每个窗口平均距离;第二是矩阵中每个物种零成对距离的比例。
6、本研究对高变区条形码进行了分析,用两种方法比较了叶绿体rbcl、matk和trnh-psba。为了评估条形码分辨率,其距离和建树采用不同分析方法。距离采用条形码分析最常见的dna序列分类方法,利用spider软件的nearneighbour函数进行。建树分析可以提供了一种方便、直观的方法,通过计算单种群物种的比例来评价差异的表现。利用mega 6.0软件,对每个高变区marker及不同的marker组合进行mp树构建,通过1000次自举重复对分支相对支持度进行评估,当所有种内个体形成单一排它分支时,即被认定为一个物种。
研究结果:
1、水稻叶绿体基因组测序及注释
14种水稻genbank数据如表1所示。表2为本研究进行的4种水稻叶绿体基因组测序数据结果,可见测序深度达到117x – 556x,注释可见这些叶绿体基因组表现出经典的四部分结构,包括成对irs区、lsc区和ssc区。所有4种水稻叶绿体基因组平均gc含量为39.0%,包含的基因数量、排布顺序和名称相同,均包含了110个不同的基因,其中77个为蛋白编码基因,29个trna和4个rrna基因(图1)。
表1、本研究所用14种水稻及genbank数据库登陆号列表
表2、4种水稻叶绿体基因组测序概况表
图1、水稻叶绿体基因组图谱
环内基因转录为顺时针方向,外环基因转录为逆时针方向。不同功能分组显示不同颜色,粗黑线表明反向重复区域
2、ssr和重复序列分析
研究人员分析发现每个水稻品种叶绿体基因组有22-31个ssr(图2),这些ssr大多数位于lsc/ssc区(92.0%)。ssr主要为a/t单碱基重复。分散重复序列大约有50-63个,包括30-42个正向重复和19-22个反向重复,它们在叶绿体基因组重排中发挥重要作用,主要分布在非编码区域。
图2、18种水稻叶绿体基因组ssr分析
图3、18种水稻叶绿体基因组重复序列分析
3、系统发育树分析
利用三种分析方法,能够很好的得到18种水稻的系统发育树结果(图4)。18种水稻可以根据不同基因组类型分为7组,即aa、bb、cc、ccdd、ee、ff和gg。
图4、基于全叶绿体基因组序列,采用最大似然法、贝叶斯推理法和最大简约法重建系统发育树
4、dna条形码开发及分析
根据spider对叶绿体基因组遗传距离的分析,发现3个区域具有显著的高遗传距离和低零成对距离比例,一个位于rpoc2编码区,另外两个位于rps16-trnq和rbcl-accd的基因间区。另外还有aa组中的trnteyd和psbe-petl区域。
图5、dna条形码开发
(a)18种水稻数据集中每个窗口的平均距离。(b)18种水稻数据集中每种零成对距离比例。(c)aa基因组数据集中每个窗口的平均距离。(d)aa基因组数据集中每种零成对距离比例。
条形码分析结果如表3所示,单个基因检测最高达到72.22%( rpoc2和rbcl-accd),而组合检测结果则可以达到100%区分的效果,并于图6建树结果相同。
表3、水稻5个新marker及通用叶绿体dna条形码变化情况
图6、利用水稻rbcl matk及rps16-trnq rpoc2 rbcl-accd trnteyd psbe-pet dna条形码组合构建的mp树
结论:
关于天昊
天昊生物具有丰富的动植物叶绿体、线粒体细胞器基因组和dna条形码检测项目经验,帮助客户发表文章近30篇,影响因子50多分,我们期待成为您细胞器基因组测序和dna条形码检测的优质服务太阳成tyc7111cc的合作伙伴。
链接: