清华大学自动化系江瑞团队研究成果入选2025年度“中国生物信息学十大进展” 【ZiDongHua 之“自动化学院派”标注关键词:清华大学,清华 清华大学自动化系,大学 生物信息学】 导语 2026年3月23日,自动中国《基因组蛋白质组与生物信息学报(英文)》(Genomics,化系 Proteomics & Bioinformatics, 简称GPB)公布了2025年度“中国生物信息学十大进展”评选结果。清华大学自动化系江瑞教授团队发表在《自然·方法》(Nature Methods)期刊的江瑞进展论文《单细胞表观基因组基础模型—EpiAgent》(EpiAgent—foundation model for single-cell epigenomics)入选。 单细胞表观基因组基础模型—EpiAgent 表观基因组是团队连接DNA序列与人体表型、解析致病机制的研究关键桥梁。清华大学自动化系江瑞团队建立了国际上首个单细胞表观基因组基础模型EpiAgent,成果原创性地将单个细胞的入选百万调控元件压缩为“细胞语句”,构建14亿参数的年度大模型统一解析复杂的基因调控规律。该模型通过独创的生物预训练任务,在涵盖500万细胞、信息学350亿调控元件的清华自建超大规模人类染色质开放性图谱(Human-scATAC-Corpus)上完成训练。 EpiAgent不仅使大规模表观基因组数据整合分析成为可能,大学更在肿瘤细胞中实现了内外源扰动响应与调控元件虚拟敲除的自动中国精准推演,从而全面开启了表观基因组虚拟细胞研究与应用的新范式。 EpiAgent预训练数据、词元化过程、模型架构及预训练任务 推荐理由 首个单细胞表观基因组基础大模型,通过14亿参数的细胞压缩语言模型解决数据分析与建模难题,开创了表观基因组研究新范式。 工具链接: https://github.com/xy-chen16/EpiAgent https://doi.org/10.5281/zenodo.16562787 原文信息: Chen X, Li K, Cui X, Wang Z, Jiang Q, Lin J, et al. EpiAgent: foundation model for single-cell epigenomics. Nature Methods 2025;22:2316–2327. PMID: 40999099. 原文链接: https://www.nature.com/articles/s41592-025-02822-z 编辑 | 田佳辉 审核 | 周亚 终审 | 石宗英喜讯!自动化系江瑞团队研究成果入选2025年度“中国生物信息学十大进展”

010-80480708