南通大学医学院近日开发了一款数据库shiny pan-cancer accessible chromatin explorer (space),即“泛癌种可接近的染色质浏览器”,这款数据库将染色质可及性和临床表型及免疫微环境联系起来,便于泛癌种的分析。小编试了一把果然酸爽啊!
非编码“垃圾dna”占我们基因组的98%,目前普遍认为它在精确调控编码基因以建立细胞身份方面发挥着基础性作用。功能性“垃圾dna”的一个特征是它的可接近性。在癌细胞中,异常的染色质可及性被认为是主要的标志之一。理解这些事件需要高通量筛选,例如使用测序检测转座酶可接近的染色质(atac-seq),这将生成令生物学家感到困惑的大规模数据。然而,现有的web工具只支持细胞系数据,缺乏高质量的临床表型或相应的转录组数据。因此,研究人员开发了space数据库,作为一个包含23个癌种404位患者的562,709个调控元件的全能web服务器。据我们所知,space是第一个支持atac-seq分析的web应用程序,并且具有相应的临床表型和转录组数据。
space数据库链接:。
目前能够提供6大分析模块:
1.搜索模块:该模块允许用户根据基因symbols或基因组区域搜索atac-seq peaks (n = 562,709)。在搜索结果中,用户可以根据标准化的峰值评分、注释(如远端增强子、启动子和内含子),以及癌症类型对查询的peaks进行排序(如下图所示)。
2.调控模块:在此模块中,用户可以轻松探索自己感兴趣的peaks的调控作用。用户可以确定该peak是否与超级增强子或癌症表达的增强子重叠(如下图所示)。tf板块中整合了encode项目的tfs的chip-seq数据和geo的其他公共chip-seq数据。在顺式调控板块中,服务器自动筛选与输入基因共可接近的peaks,并预测潜在的顺式调控peaks。在eqtl板块中,用户可以搜索自己感兴趣的peaks的cis或trans eqtl。文献挖掘板块集成了已发表的、实验支持的增强子和从全文出版物中提取的变体。
3.临床模块:该模块整合了23种癌症类型404个样本的atac-seq数据,以及匹配的转录组数据和临床表型。用户可以查看peaks的表达谱,并测试这些peaks是否与癌症亚型、患者预后和临床分期相关(如下图所示)。t-sne板块允许用户确定404个样本中peaks的得分分布。用户也可以进行生存cox回归分析,其在临床中被广泛使用。
4.pathway模块:该模块计算20,932个预先计算的通路特征与peak之间的关联。用户还可以对peak相关的基因进行基因集富集分析。space提供了热图、交互式火山图和散点图以可视化结果(如下图所示)。
5.免疫微环境模块:在该模块中,用户可以查询peak,计算其与免疫微环境的关联(64个免疫细胞或基质细胞、24个免疫抑制剂、45个免疫刺激因子)。
6.相关性模块:用户可以探索输入peak的潜在合作者(mrna、lncrna和mirna)。同时还记录了95个组蛋白(16个亚组,如染色质重构)和1664个tfs(72个亚组,如t-box和myb)。