(一)
tumor mutational load predicts survival after immunotherapy across multiple cancer types
肿瘤突变负荷可预测多种癌症类型的免疫治疗后存活率
免疫检查点抑制剂(ici)治疗使一些转移性癌症患者受益,但临床急需治疗有效性的预测生物标志物。在部分癌症类型中,前期研究发现肿瘤突变负荷(tmb)可预测对ici治疗的临床反应。为了更广泛地研究这种关联,研究者分析了1,662名接受ici治疗的晚期癌症患者和5,371名非ici治疗患者的临床和基因组数据,这些患者的肿瘤组织完成了目的区域二代测序(msk-impact)。在所有患者中,较高的体细胞tmb(每个组织学样本中最高20%)与更好的总体存活率相关。对于大多数癌症样本组织学结果,都观察到较高tmb与更好的存活率之间的关联。在不同的癌症类型中,与改善生存相关的tmb切点是显著不同的。这些数据表明tmb与多种癌症类型接受ici治疗的患者的存活率提高有关,但可能尚没有一种高tmb的通用定义。
(二)
acquired her2 mutations in er metastatic breast cancer confer resistance to estrogen receptor–directed therapies
her2突变的er 转移性乳腺癌对雌激素受体定向疗法表现抗性
百分之七十的乳腺癌表达雌激素受体(er),靶向er的药物是治疗的主要方法。然而,实际上所有患有er 乳腺癌的人都会在转移性环境中对er指向性药物产生耐药性。除了er本身的突变(占芳香酶抑制剂治疗人群的25-30%),关于临床耐药机制的知识仍然不完整。研究者在8例er 转移性乳腺癌患者的转移性活检组织中发现新的her2突变,这些患者对芳香酶抑制剂,他莫昔芬或氟维司群产生耐药性。对5名未接受治疗患者的原发性肿瘤的检查显示,5名患者中有4名没有预先存在突变的证据,这表明这些突变是在er定向治疗的选择压力下获得的。 her2突变和er突变是相互排斥的,表明er指向性治疗抗性的独特获得机制。体外分析证实,与er突变不同,her2突变导致肿瘤的雌激素不依赖,对他莫昔芬,氟维司群和cdk4,cdk6抑制剂palbociclib都产生抗性。需要将er导向治疗与不可逆的her2激酶抑制剂奈拉替尼组合来克服抗性。
(三)
gadd45a binds r-loops and recruits tet1 to cpg island promoters
gadd45a结合r环并将tet1募集到cpg岛启动子
r环是富含cpg岛(cgis)的dna-rna杂交体,可以调节染色质状态。如何通过特定的表观遗传学读码器识别和解读r-环目前仍然是未知。在这里,我们的研究显示gadd45a(生长停滞和dna损伤蛋白45a)直接结合r环并通过募集tet1介导局部dna去甲基化。通过研究肿瘤抑制因子tcf21,我们发现反义长非编码(lncrna)tarid(tcf21反义rna诱导启动子去甲基化)在tcf21启动子处形成r-环。 gadd45a与r环的结合触发局部dna去甲基化和tcf21表达。 tarid转录,r-环形成,dna去甲基化和tcf21表达在细胞周期中顺序进行。氧化的dna去甲基化中间体在基因组r-环中富集,并且它们的水平在rnase h1消耗时增加。胚胎干细胞的基因组分析鉴定了cgi处的数千个r-环依赖性tet1结合位点。我们提出gadd45a是一种表观遗传r-环读取器,它将去甲基化机制引入启动子cgis。
(四)
reference genome sequences of two cultivated allotetraploid cottons, gossypium hirsutum and gossypium barbadense
两种栽培异源四倍体棉花陆地棉和海岛棉的参考基因组序列
异源四倍体棉花品种(陆地棉gossypium hirsutum 和海岛棉gossypium barbadense)是在世界范围内长期种植。这两个物种的基因组序列草图已有,但是它们高度碎片化不完整。在这里,我们通过整合单分子实时测序、bionano光学作图和高通量染色体构象捕获技术,报道了陆地棉tm-1和海岛棉3-79的参考级基因组组装和注释。与先前组装的基因组草图相比,这些基因组序列在具有高重复含量的区域如着丝粒的连续性和完整性方面显示出显著的改进。比较基因组学分析确定了多倍体化后可能发生的广泛结构变化,突出表现为14条染色体大的对心/近心反转。我们构建了一个渐渗系群体,从海岛棉到陆地棉引入有利的染色体片段,使我们能够鉴定出13个与优良纤维品质相关的数量性状基因座。这些资源将加速棉花的进化和功能基因组研究,并为未来的纤维改良育种项目提供信息。
(五)
identification of new therapeutic targets for osteoarthritis through genome-wide analyses of uk biobank data
通过对英国生物银行数据进行全基因组分析,确定骨关节炎的新治疗靶点
骨关节炎是最常见的肌肉骨骼疾病,也是全球致残的主要原因。在这里,我们进行了一项关于骨关节炎的全基因组关联研究(77,052例病例和378,169例对照),分析了四种表型:膝关节骨性关节炎,髋关节骨关节炎,膝关节和/或髋关节骨关节炎以及任何类型骨关节炎。我们发现了64个疾病相关信号,其中52个是新的位点,比已建立的疾病位点数增加了一倍多。六个信号通过精细定位确定出了单个变异位点。我们通过整合表达数量性状基因座(eqtl)共定位,精细定位,人类罕见疾病信息,动物模型和骨关节炎组织表达数据来鉴定可能的效应基因。我们发现这些基因富集了单基因形式的骨发育疾病致病基因,以及胶原形成和细胞外基质组织生物通路的相关基因。 10种可能的效应基因,包括tgfb1(转化生长因子β1),fgf18(成纤维细胞生长因子18),ctsk(组织蛋白酶k)和il11(白细胞介素11),已经被批准用于治疗或在临床试验中被证明具有骨关节炎治疗作用。
(六)
association studies of up to 1.2 million individuals yield new insights into the genetic etiology of tobacco and alcohol use
基于多达120万人的关联研究提出对于抽烟和饮酒行为的遗传病因学新见解
烟草和酒精使用是影响许多复杂疾病和病症风险的主要死亡原因。它们是可遗传的病原学相关行为,但是难以发现与这种行为相关的基因。在样本量高达120万个体的人群中,我们在406个位点发现了566个遗传变异,这些变异与多个阶段的烟草使用行为(起始,停止和重度吸烟)以及酒精使用相关,其中150个位点证明了具有多效性关联。吸烟表型与许多健康状况呈正相关,而酒精使用与这些状况呈负相关,因此酒精使用的遗传风险增加与较低的疾病风险相关。我们的研究提示许多系统参与烟草和酒精使用的相关证据,包括涉及烟碱,多巴胺能和谷氨酸能神经传递的基因。该结果为评估这些基因座在模式生物体中的作用和更精确的烟草和酒精相关物质使用策略提供了坚实的起点。
(七)
a loss-of-function variant in alox15protects against nasal polyps and chronic rhinosinusitis
alox15中的一个功能缺失变异可以降低鼻息肉和慢性鼻窦炎患病率
鼻息肉(np)是鼻和鼻窦粘膜上的病变,是慢性鼻 - 鼻窦炎(crs)的危险因素。我们对冰岛和英国的np和crs进行了全基因组关联研究(使用英国生物银行数据),共有4,366例np病例,5,608例crs病例和> 700,000例对照。我们发现了10个与np相关的位点和2个与crs相关的位点。我们还测试了210个与嗜酸性粒细胞计数相关的位点,获得了17个额外的np关联位点。在27个np信号中,7个与crs相关,13个与哮喘相关。最值得注意的是,alox15中的错义变异导致花生四烯酸15-脂氧合酶(15-lo)的p.thr560met改变,这个变异赋予对np的全基因组显著性保护作用(p = 8.0×10e-27,or= 0.32; 95%ci= 0.26,0.39)和crs(p = 1.1×10e-8,or= 0.64; 95%ci= 0.55,0.75)。 p.thr560met突变,大约每20个欧洲人中有1个人携带,导致 15-lo酶活性的几乎全部丧失。我们的研究结果确定15-lo是np和crs治疗干预的潜在目标。
(八)
sumher better estimates the snp heritability of complex traits from summary statistics
sumher软件可以从汇总统计中更好地估计复杂性状的snp遗传力
本研究汇报了新开发的sumher工具,可以使用全基因组关联研究的汇总统计数据,用于估计混杂偏倚,snp遗传率,遗传力丰富度和遗传相关性。 sumher与现有软件ld score regression(ldsc)之间的关键区别在于sumher允许用户指定遗传模型。我们使用推荐的遗传模型将sumher应用于24项大规模关联研究(平均样本量为121,000)。我们发现这些研究过度纠正了混杂因素,因此汇报的全基因组显著位点的数量降低了约四分之一。我们还估计了由功能注释定义的24类snp。先前的研究使用ldsc工具显示,保守区域富集13倍,并且发现另外六个类别具有三倍以上的富集。相比之下,我们使用sumher的分析发现,没有一个类别具有超过两倍的富集情况。因此,sumher工具提供了对复杂性状遗传结构的更好诠释,可以更有效地分析未来的遗传数据。
(九)
molecular landmarks of tumor hypoxia across cancer types
不同癌症类型肿瘤缺氧的分子标志
许多原发肿瘤亚区分子氧含量低,称为缺氧。缺氧性肿瘤局部衰竭和远处转移的风险较高,但肿瘤缺氧的分子特征仍未明确。为了填补这一空白,我们对19种肿瘤类型中的8006种肿瘤进行了缺氧量化。在10种肿瘤类型中,缺氧与基因组不稳定性升高有关。在所有19种肿瘤类型中,缺氧肿瘤都显示出特有的驱动突变特征。我们观察到癌症中广泛存在的与缺氧相关的mirnas失调,并在功能上证实mir-133a-3p是缺氧调节的mirnas。在局限性前列腺癌中,缺氧与chromothripsis增多、pten等位基因丢失和端粒变短有关。这些关联在多克隆肿瘤中特别丰富,代表了一系列类似邻盘肿瘤的特征,一种侵袭性细胞表型。总的来说,这项研究证实,肿瘤缺氧可能会驱动肿瘤的侵袭性分子特征,并形成单个肿瘤的临床轨迹。
(十)
genebank genomics highlights the diversity of a global barley collection
基因库基因组学强调全球收藏大麦的多样性
基因库收集了所有主要粮食作物的品种、地方品种和野生近缘种,但迄今为止,它们的详细特征仅限于少量的核心种质集合。对德国基因库几乎所有大麦品种的全基因组测序基因分型数据的分析,提供了对全球驯化大麦种群结构的深入了解,并指出了世界主要基因库之一的冗余和覆盖缺口。我们的大样本量和密集标记数据为全基因组关联扫描提供了重要信息。我们检测了区分大麦基因库的形态学性状的已知和新的基因座,发现了大麦和水稻中无倒钩芒的会聚选择证据及抗bymovirus感染的主要效应抗性基因座。这项研究概述了基因组学辅助的基因库管理的未来方向,以及在作物进化过程中如何利用种质资源将自然变异与人类选择联系起来。
11
(十一)
repurposing large health insurance claims data to estimate genetic and environmental contributions in 560 phenotypes
调整大型健康保险数据用途来估计560种表型的遗传和环境贡献
我们分析了一个大型健康保险数据集,以评估居住在美国的44,859,462人中56,396对双胞胎和724,513对兄弟姐妹中560种疾病相关表型的遗传和环境贡献。我们估计了环境风险因素(社会经济地位、空气污染和气候)在每个表型中的贡献。平均遗传力和共有环境方差高于特定环境因素造成的方差,如邮政编码水平ses、每日空气质量和平均气温,以及个体表型。我们发现一些共有病和平均月费用有显著的遗传性和共有环境所有的结果都可以通过我们的双相关性和遗传力网络应用程序获得。
(十二)
an evolutionary framework for measuring epigenomic information and estimating cell-type-specific fitness consequences
测量表观基因组信息和估计细胞类型特异性适应结果的进化框架
在这里,我们提出了一个问题,即“表观基因组数据集提供了多少关于人类基因组功能的信息?”我们考虑了115种细胞类型中的9种表观基因组特征,并在一个适合人类和非人类灵长类基因组的概率进化模型下,将功能信息作为熵的减少来衡量。几个表观特征结合在一起比单独产生更多的信息。我们发现人类遗传变异中的熵主要反映了变异和中性漂移之间的平衡。我们的细胞类型特异性评分揭示了细胞类型之间的关系,并表明约8%的核苷酸位点受到自然选择的限制。
(十三)
garfield classifies disease-relevant genomic features through integration of functional annotations with association signals
garfield通过将功能注释与关联信号相结合,对疾病相关的基因组特征进行分类
全基因组关联研究发现的基因座主要分布在蛋白质编码基因之外。通过细胞系和原始组织中的调节基因组区域分析,可以大大增强对非编码变体功能后果的解释。然而,仍然缺乏可靠且易于应用的方法来系统地评估这些区域对疾病或数量性状中遗传变异的贡献。在这里,我们提出了一种新的方法,利用全基因组关联研究的发现和调控或功能注释来分类与感兴趣表型相关的特征。在我们的框架内,我们解释了当前方法没有提供的主要混淆来源。我们进一步评估调控区中19个性状的全基因组关联研究的丰富程度。我们描述了独特的特征和注释丰富模式,推动了新的生物学见解。该方法在独立软件和r包中实现,以方便研究人员的应用。
(十四)
fast and accurate genomic analyses using genome graphs
使用基因组图快速准确地进行基因组分析
人类参考基因组作为基因组学的基础,为测序读数的比对提供了一个支架,但目前只反映了一个一致的单倍型,因此削弱了分析的准确性。在这里,我们展示了一个图表参考基因组的实现,它能够跨越2800个二倍体基因组进行读取比对,包括1260万个snps和400万个插入和缺失(indels)。该管道使用一个具有36 cpu核心的系统处理6.5h的一个全基因组测序样本。我们表明,使用图基因组参考提高了阅读作图的敏感性,并在不影响特异性的情况下,使变体调用召回率增加了0.5%。结合到图基因组中的结构变异可以在统一的框架下精确地进行基因分型。最后,我们展示了图形基因组的迭代扩增在变量调用精度上产生了增量增益。我们的实现是实现图基因组承诺的重要进展,从根本上提高基因组分析的可扩展性和准确性。