摘要:微卫星与癌症风险分类
肺癌是一种发病率和死亡率都很高的癌症。之前的研究更多关注了肺癌中单核苷酸的变异,而忽略了重复的dna片段差异,即微卫星序列(mst)长度变化与肺癌之间的联系。最近的一篇oncogene文章,就揭示出高深度、高精度微卫星基因分型可以帮助我们更加精确的进行肺癌风险分类,具有十分重要的理论研究和临床指导意义。
发表时间:2017年7月发表期刊:oncogene影响因子:7.519
研究背景:
微卫星是一些包括短重复单位(1~6 bp)的串联dna序列。最近的研究表明,微卫星在多种癌症的遗传发生的复杂过程中起了重要的作用。
本研究的目的是通过比较肺癌患者与正常人群生殖细胞外显子序列,发现可以用于肺癌风险分类评估的一些微卫星markers。
研究方法:
tcga肺癌特异性msi位点挖掘 347个位点的靶向捕获芯片定制 30个肺癌样本及89个对照样本的捕获测序位点的基因分型及肺癌风险分类分析
研究内容:
本研究的流程如下(图1):
图1、位点识别与标记验证流程图
该项工作主要分为两个阶段,即(1)mst位点识别阶段和(2)标记验证阶段。阶段1:通过对来自tcga中的488个非小细胞肺癌生殖细胞肿瘤样本和从1000 genomes中获得的399个非癌对照样本数据进行分析,发现癌症和对照样本中有显著基因型差异的119个mst位点。用相同方法发现其他癌症中的144个mst标记。阶段2:将263(119 144)个mst标记外加84个对照mst标记定制目标富集试剂盒,进行靶向捕获测序。对30份肺癌样本和89份非癌症对照样本的高深度测序(579x ± 315),发现在这263个mst标记中,有21(13 8)个mst标记具有明显的不同。
图2、通过对mst位点的统计可以高灵敏度区分肺癌样本(肺腺癌(luad,a)、肺鳞癌(lusc,b)与非癌症样本
本研究分析了两种肺癌中具有的mst位点数及风险值。图2中蓝色条代表对照样本,橙色条代表肺癌样本。其中图2-a中,当样品中存在39%(经roc分析得到的垂直的黑线)及其以上的luad特意mst位点时,则该样品认为“存在肺腺癌风险”。同样,图2-b中,当样品中存在37%及其以上的lusc特异mst位点时,则该样品认为“存在肺鳞癌风险”。
最近研究表明,不同的癌症类型可以具有一些共同的致癌特征谱。本研究除了从肺癌及非癌症数据中发现13个可用于肺癌风险分类的mst位点之外,还从乳腺癌、卵巢癌、黑色素和髓母细胞瘤等癌症中筛选出144个mst位点,经过验证发现8个可以用于肺癌风险分类中。
表1、肺癌和非癌症样本精确分类的21个mst位点列表
图3、筛选出的特异性mst(13个肺癌特异性 8个其他癌症特异性)可以区分肺癌与非癌症样本
图3中蓝色条代表非癌症样本,红色条代表肺癌样本。其中图3-a表明,当具有肺癌表型样品中存在13个特异性mst位点中的61%(经roc分析得到的垂直的黑线)及其以上时,则该样品被认为“存在肺癌风险”,其灵敏性达到0.90,特异性达到0.94。同样,图3-b中,当具有肺癌表型样品中存在21个特异性mst位点中的57%(经roc分析得到的垂直的黑线)及其以上时,则该样品认为“存在肺癌风险”,其灵敏性达到0.93,特异性达到0.97。
图4、肺癌发生潜在机制示意图。
通过对13个mst位点深入研究发现,这13个mst都处于基因的intron区域。之前的研究发现intron区域的mst可以影响基因的选择性剪接和转录过程,通过对david数据库中这13个基因聚类分析发现,它们选择性剪接和剪接产物都有显著富集情况。
对这13个基因与肺癌的关联分析发现,只有rel和arid1b在以前的研究中与癌症有关。tcga分析暗示了rel和arid1b可能通过dna损伤和染色质重塑机制导致肺癌的发生(图4)。
结论: