2022-07-18 14:11:52
医疗数据合规热点速递-2022-第二季度
多组学数据资源体系建设取得系列进展
2022-07-18 14:11:52

在《核酸研究》(Nucleic Acids Research)出版的2022年度数据库专刊上,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)共有10篇论文集中发布,包括1篇整体介绍和9篇数据库论文,展示了国家生物信息中心多组学数据资源体系建设的最新成果。

2021年,国家基因组科学数据中心与共建单位及30多家合作单位密切协同,进一步更新和完善核心数据库资源(BioProject、BioSample、GSA、GWH、GVM、GEN、MethBank、非编码RNA、新冠病毒资源信息库、生物多样性等),同时开发出脑疾病知识库BrainBase、癌症单细胞表达谱数据库CancerSCEM、细胞药物反应知识库CeDR Atlas、细胞分类库Cell Taxonomy、分子序列组分数据库CompoDynamics、表观基因组关联分析平台EWAS Open Platform、再生知识库Regeneration Roadmap、单细胞甲基化库scMethBank、生命科学文献库OpenLB等,涉及单细胞组学和精准医学研究等多个前沿领域,建成涵盖国家人类遗传资源、重要战略生物资源、在线分析工具等在内的多组学数据资源体系,形成组学“数据—信息—知识”一体化资源系统。该资源体系的建设为国家基因组科学数据的汇交共享、安全管理和挖掘利用提供了重要支撑。

目前,国家基因组科学数据中心汇聚全球数据,可为国内外用户提供一站式数据递交和中英文服务,发布的数据编号被Springer Nature、Elsevier、Wiley、Taylor & Francis、Cell等全球主要出版集团认可。截至2021年底,组学原始数据管理体系(GSA Family)已汇交科技项目4200多个,数据量超11 PB,来自471家单位2082个用户,相关数据发表在276种国内外期刊的841篇文章上。

【来源:生物谷】