(一)
genomic characterization of human brain metastases identifies drivers of metastatic lung adenocarcinoma人类脑转移的基因组特征确定了转移性肺腺癌的驱动因素肺腺癌的脑转移经常导致患者死亡。为了确定促进脑转移的基因组改变,我们对73例bm-luad患者进行了全外显子组测序。通过病例对照分析,我们发现了脑转移的候选驱动因素,通过与503个原发性淋巴细胞白血病相比,发现了骨髓淋巴细胞白血病中拷贝数异常更频繁的基因。我们确定了三个在骨髓基质细胞白血病中扩增频率明显更高的区域,包括myc (12对6%)、yap1 (7对0.8%)和基质金属蛋白酶13 (10对0.6%),以及cdkn2a/b中明显更频繁的缺失(27对13%)。我们证实,在105名bm-luad患者的独立队列中,myc、yap1和mmp13的扩增频率升高。对患者来源的异种移植小鼠模型的功能评估证实了myc、yap1或mmp13过表达增加脑转移发生率的观点。这些结果表明,体细胞改变导致脑转移,并且对足够数量的转移肿瘤进行基因组测序可以揭示以前未知的转移驱动因素。
(二)
dna methylation disruption reshapes the hematopoietic differentiation landscapedna甲基化破坏重塑了造血分化的景观参与脱氧核糖核酸甲基化的基因突变(例如,在恶性血液病和克隆性造血中经常观察到tet2和dnmt3a)。将单细胞测序应用于小鼠造血干细胞和祖细胞,我们观察到这些突变破坏了造血分化,导致tet2或dnmt3a缺失后红系祖细胞相对于粒-单核细胞祖细胞的频率发生相反的变化。值得注意的是,这些转变可追溯到未支配造血干细胞的转录启动偏斜。为了使全基因组dname变化与特定的红系和粒-单核细胞偏斜相一致,我们提供证据支持转录因子的不同敏感性,这是由于cpg在其结合基序中的富集存在偏差。具有靶向基因分型的单细胞转录组在dnmt3a突变的人克隆造血骨髓祖细胞的转录启动中显示出相似的偏斜。这些数据表明,脱氧核糖核酸形成了造血分化的地形,并支持一个模型,在该模型中,全基因组的甲基化变化通过转录因子结合基序的cpg富集的偏差被传导到分化偏斜。
(三)
three-dimensional chromatin landscapes in t cell acute lymphoblastic leukemiat细胞急性淋巴细胞白血病的三维染色质景观三维(3d)染色质结构的差异会影响拓扑相关结构域(tads)的完整性和重组特异性增强子-启动子相互作用,影响基因表达并导致人类疾病。在这里,我们通过使用原始人类白血病标本研究了t细胞急性淋巴细胞白血病(t-all)的三维染色质结构,并检测了该结构对药物的动态反应。匹配的原位hi-c、rna-seq和ctcf chip–seq数据集的系统整合揭示了肿瘤坏死因子相关凋亡配体内染色质相互作用和肿瘤坏死因子相关凋亡配体边界绝缘在肿瘤坏死因子相关凋亡配体内的广泛差异。我们的研究确定并聚焦于一个与ctcf介导的缺失相关的tad“融合”事件,使得myc启动子和远端超级增强子之间能够直接相互作用。此外,我们的数据还表明,靶向致癌信号转导或表观遗传调控的小分子抑制剂可以改变白血病中发现的特定3d相互作用。总之,我们的研究强调了人类急性白血病中三维染色质结构的影响、复杂性和动态性。
(四)
meta-analysis of 542,934 subjects of european ancestry identifies new genes and mechanisms predisposing to refractive error and myopia对542,934名欧洲血统受试者的荟萃分析确定了导致屈光不正和近视的新基因和机制屈光不正,尤其是近视,是全世界发病率和残疾的主要原因。基因研究可以提高对导致眼睛发育异常和视力受损的分子机制的理解。我们对全基因组关联研究(gwas)进行了荟萃分析,涉及542,934名欧洲参与者,确定了336个与屈光不正相关的新基因位点。总的来说,所有相关的遗传变异解释了18.4%的遗传率,并提高了近视预测的准确性(曲线下面积(auc) = 0.75).我们的结果表明,屈光不正在遗传上是异质的,是由参与眼睛每个解剖成分发育的基因驱动的。此外,我们的分析表明,控制昼夜节律和色素沉着的遗传因素也与近视和屈光不正的发展有关。这些结果可能有助于预测屈光不正和未来个性化近视预防策略的发展。
(五)
using antagonistic pleiotropy to design a chemotherapy-induced evolutionary trap to target drug resistance in cancer利用拮抗多效性针对靶向肿瘤耐药性设计化疗诱导的进化陷阱局部适应通过获得积极选择的特征,引导种群达到特定环境的最大适应值。然而,快速的环境变化可以识别隐藏的适应权衡,将适应转变为不适应,导致进化陷阱。癌症是一种容易产生耐药性的疾病,原则上容易受到这种陷阱的影响。因此,我们对接受各种化疗的急性髓细胞白血病(aml)细胞进行了crispr-cas9基因敲除筛选,以绘制适应度权衡的药物依赖遗传基础图,这一概念被称为拮抗多效性(ap)。我们确定了一个prc2–nsd2/3介导的myc调控轴作为一个药物诱导的ap通路,其赋予溴域抑制抗性和对bcl-2抑制模板敏感性的能力是一个进化陷阱。在不同的aml细胞系和患者来源的异种移植模型中,我们发现通过这一途径获得对溴域抑制的抗性暴露了对bcl-2抑制的一致超敏反应。因此,可利用药物诱导的急性胰腺炎设计进化陷阱,选择性靶向癌症中的耐药性。
(六)
gene network transitions in embryos depend upon interactions between a pioneer transcription factor and core histones胚胎中的基因网络转变依赖于先驱性转录因子和核心组蛋白之间的相互作用胚胎和其他改变命运的环境中的基因网络转变涉及转录因子的组合。改变命运的转录因子的子集充当先锋;它们扫描并瞄准核小体的dna,并引发合作事件,从而打开局部染色质。然而,在理解分子与核小体的相互作用是如何导致染色质开放现象方面,仍然存在差距。在这里,我们确定了一个短的α螺旋区,在foxa先锋因子中保守,它与核心组蛋白相互作用,并有助于体外染色质开放。在小鼠早期胚胎正常发育的染色质开放中也涉及到相同的结构域。因此,通过先驱因子和核心组蛋白之间的相互作用,染色质的局部开放促进了基因编程。
(七)
stepwise selection on homeologous prr genes controlling flowering and maturity during soybean domestication大豆驯化过程中控制开花和成熟的同源prr基因的逐步选择植物物候的适应性变化通常被认为是所谓的“驯化综合症”的一个特征,它将现代作物与其野生祖先区分开来,但是很少有详细的证据支持这一观点。大豆是一种主要的豆类作物,开花时间的变化在驯化种质中有很好的表现,对现代生产至关重要,但其在驯化过程中的重要性尚不清楚。在这里,我们确定了两个同源响应调节假基因tof12和tof11对古代开花时间适应的顺序贡献,并证明它们通过lhy同源物促进豆类特异性e1基因的表达和在长光周期下延迟开花。我们表明,在大豆驯化过程中,依赖于tof12的成熟加速伴随着休眠和种子扩散的减少,这可能导致最初的作物向纬度方向扩展。更好地理解作物进化的这一早期阶段将有助于识别驯化过程中丧失的功能变异,并发掘其未来作物改良的潜力。
(八)
minimal phenotyping yields genome-wide association signals of low specificity for major depression最小的表型产生了对重度抑郁症低特异性的全基因组关联信号最小表型是指依赖于使用少量自报项目进行疾病病例鉴定,越来越多地用于全基因组关联研究(gwas)。在这里,我们报道了由最小表型定义的抑郁症和严格定义的重度抑郁症(mdd)在遗传结构上的差异:前者具有较低的基因型衍生遗传力,这不能用包括较轻的病例来解释;与严格定义的mdd相比,更高比例的基因组导致了这种与其他疾病共享的遗传易感性。基于最小表型定义的gwas优先识别不特定于mdd的基因座,尽管它能产生高度预测性的多基因风险评分,但预测能力完全可以通过大样本量而不是mdd的特异性来解释。我们的结果表明,依赖于最小表型的结果可能会对mdd的遗传结构产生偏见,并阻碍识别mdd特异途径的能力。
(九)
a harmonized meta-knowledgebase of clinical interpretations of somatic genomic variants in cancer癌症体细胞基因组变异临床解释的统一元知识库精确肿瘤学依赖于基因组变异的精确发现和解释,从而实现个体化诊断、预后和治疗选择。我们发现六个突出的体细胞癌变异知识库在内容、结构和支持性原始文献方面有很大差异,阻碍了在临床环境中评估变异及其相关性的共识。我们开发了一个协调不同解释的框架,以产生12,856个综合解释的元知识库。由于这种协调,我们证明了在变体、疾病和药物之间的资源重叠方面的巨大收益。随后,我们证明了患者队列和潜在临床意义的统一解释之间的匹配得到了改善,观察到每个个体知识库的平均匹配率从33%增加到57%。我们的分析阐明了开放的、可互操作的不同解释数据共享的需求。我们还提供了一个免费的网络界面(search.cancervariants.org),用于探索这六个知识库的统一解释。
(十)
evaluating and improving heritability models using summary statistics使用汇总统计评估和改进遗传力模型目前有很多关于遗传性在基因组中如何变化的最佳模型的争论。gcta的作者推荐了gcta-ldms-1模型,ld分数回归的作者推荐了基线ld模型,我们推荐了ldak模型。在这里,我们提供了一个统计框架,使用全基因组关联研究的汇总统计来评估遗传力模型。基于对复杂人类特征的31项研究(平均样本量为136,000),我们表明基线ld模型比其他现有的遗传力模型更符合实际,但它可以通过结合ldak模型的特征进行改进。我们的框架还提供了一种从汇总统计中估计选择相关参数α的方法。我们发现了强有力的证据,证明对包括身高、收缩压和大学教育在内的性状进行负基因组范围的选择,而且选择的影响在功能类别中更强,例如编码snps和启动子区域。