短串联重复序列(short tandem tepeats, str)的扩增常常导致多种遗传疾病的发生。近年来随着下一代测序(next generation sequencing, ngs)的发展,以illumina为代表的短读序数据(short-read data)急剧增长,如何通过对ngs数据的挖掘高效的寻找str的扩增,发现更多遗传疾病的遗传病因,便成了人们关心的热点之一。
表1、部分由str扩增导致的遗传疾病列表
去年在f1000research上刊登的一篇综述性文章,就对4种str扩增分析方法(expansionhunter、exstra、stretch和tredparse)进行了比较。
表2、四种生信工具的比较
而2018年底的ajhg文章通过评估后表明,exstra相比其他三种方法表现出更强的的性能,可以有效地用作从wes和wgs数据中筛选str扩增的工具。
随后,在2019年7月,同样发表在ajhg的文章,基于生物信息学方法从导致canvas疾病的rfc1中成功的鉴定出无参考序列的五碱基str重复扩增突变。
发表期刊:am j hum genet. 发表时间:2019-7-3 影响因子:9.924
图1、canvas基因座与4号染色体的连锁及rfc1中exp内含子插入的鉴定
图2、(aaagg)exp的重复引物pcr验证
(重复引物pcr的代表性图像展示了一种锯齿产物,其具有5个碱基对的重复单位大小,从来自canvas1(b)和canvas9(c)个体的gnda扩增获得,(d)为未得病对照样本,(e)为无模板阴性结果。)
本研究综合运用5中生信分析工具:exstra、eh、tredparse、stretch和gangstr,从9个canvas病人wgs数据中,筛选出rfc1 中的(aaagg)exp基序可能与canvas疾病相关联。最后研究人员利用重复引物pcr以及一代测序等方法,验证了(aaagg)exp这个str扩增的存在。
关于天昊
天昊生物长期从事基因及遗传分析,可以提供包括全基因组测序、外显子组测序、str毛细管检测及基于二代测序技术的ssrseqtm等多项验证服务,欢迎联系太阳成tyc7111cc具体咨询!邮箱:techsupport@geneskies.com 电话:400-065-6886