背景介绍
罕见遗传性疾病的临床诊断仍然面临诸多问题:
● 外显子组测序的诊断率仅为25%-30%。
●全基因组测序获得的非编码区序列可占90%,但破坏mrna正常剪切模式的非编码区突变因难以准确鉴定而常常被忽略。
● 尚没有非常准确的工具可预测单个核苷酸变异而引起的剪切变化
人工智能软件spliceai
人工智能软件的飞速进步,或能帮助我们从新一代测序(ngs)数据中发现与罕见遗传病相关的非编码突变。spliceai工具由illumina团队与加州大学旧金山分校和斯坦福大学的合作者共同开发,基于深度学习预测单个核苷酸变异而引起的剪切变化, 从任意mrna前体序列对剪切位点进行准确预测(位置、异常剪切概率),从而对非编码rna区域的突变所导致的异常剪切进行预报,相关文章于2019年1月发表在cell期刊。
文章图片摘要
● spliceai软件,基于32个卷积的深度神经网络, 从mrna前体序列对剪切位点进行准确预测
● 75%的预测异常剪切突变通过rna-seq数据被证实
● 在神经发育障碍患者中,约10%的致病突变可能为剪切非编码突变,这种突变会导致异常剪切。
● 异常剪切点突变经常导致可变剪切
● 参考文献:jaganathan k , kyriazopoulou panagiotopoulou s , mcrae j f , et al. predicting splicing from primary sequence with deep learning[j]. cell, 2019.
软件下载
python包: https://github.com/illumina/spliceai
运行过程
● 用法
spliceai -i input.vcf -o output.vcf -r genome.fa -a grch37 -d 50
-i: vcf 文件
-o: vcf文件,预测结果spliceai=allele|symbol|ds_ag|ds_al|ds_dg|ds_dl|dp_ag|dp_al|dp_dg|dp_dl
-r: 参考基因组fasta文件(grch37/hg19 or grch38/hg38)
-a: grch37 or grch38,还可自定义文件,格式同“基因数据库文件grch37.txt or grch38.txt”
-d: 突变位点和剪切位点的最大距离(default: 50)
-m: 0: raw files; 1: masked file (default: 0)
● 基因数据库示例
● 输入文件示例(vcf文件:存储检测的变异位点信息)
input.vcf
● 输出文件示例
output.vcf
● 结果解读--太阳成集团tyc7111cc官网
● 结果解读--示例
突变2:179415988 c>ca的输出ca|ttn|0.07|1.00|0.00|0.00|-7|-1|35|-29可以解释如下:
位置179415981(179415988-7) 突变导致当前位点作为剪切受体的概率增加0.07;
位置179415987(179415988-1) 突变导致当前位点作为剪切受体的概率降低1.00;
位置179416023(179415988 35) 突变导致当前位点作为剪切供体的概率增加0.00;
位置179415959(179415988-29 ) 突变导致当前位点作为剪切供体的概率降低0.00。
延伸阅读-非编码区内含子变异导致可变剪切的文章
● 在来自挪威、法国和美国的20个家庭中发现了遗传性乳腺癌卵巢癌综合征1型的致病基因brca1新的致病突变c.5407-25t>a,在此之前,该突变一直被判定为临床意义未明。
参考文献:høberg-vetti, h., ognedal, e., buisson, a. et al. the intronic brca1c.5407-25t>a variant causing partly skipping of exon 23—a likely pathogenic variant with reduced penetrance?. eur j hum genet (2020).
● vhl基因2号外显子上的同义突变或可导致外显子跳跃,从而引发家族性红细胞增多症或或von hippel-lindau病。
参考文献:marion lenglet,et al.new lessons from an old gene: complex splicing and a novel cryptic exon in vhl gene cause erythrocytosis and vhl disease. blood 2018 :blood-2018-03-838235; doi: https://doi.org/10.1182/blood-2018-03-838235
天昊wgs服务升级!
目前,天昊全基因组测序个性化分析流程已纳入spliceai分析内容,针对新的wgs分析项目或者已完成的wgs分析,可开展基于spliceai软件预测可引起rna剪切变化的非编码区突变。
spliceai,助力天昊生物wgs平台给您更好的突变解读,欢迎老师体验!