中心新闻
开发深度神经网络用于单细胞转录组配准

  单细胞转录组数据的配准对于多个单细胞转录组测序数据集的联合分析非常重要,对阐明特定生物过程的全面图景至关重要。尽管针对这个问题已经提出了许多方法,但大多数方法在配准时只考虑计算互近邻细胞,而不考虑将已知的细胞类型注释引入配准过程。为此赵兴明教授团队联合厦门大学研究团队,开发了MAT2方法,建立一个使用对比学习策略的深度神经网络在低维流形空间中进行单细胞转录组数据的配准。与其他基于流形配准的方法相比,MAT2有两个优势。首先,基于已知的细胞类型注释定义细胞三元组,使得对于细胞类型不完全相同的数据集,配准过程产生的一致流形表示具有更强的鲁棒性。其次,通过MAT2的重建过程可产生无批次效应的基因表达结果,更好地进行细胞类型注释。对真实scRNA-seq数据集的测试结果表明,MAT2优于现有的流行方法。此外,MAT2重建的一致基因表达谱可以用于后续分析,如轨迹分析和差异基因表达分析。研究发现,由MAT2重建的转录组可以帮助揭示人类和小鼠造血干细胞之间的基因表达保守和差异性。后续计划进一步研究,将MAT2扩展到单细胞多模态数据的配准中,以期更深入地了解细胞状态及其转录调控机制。该研究也将为今后脑细胞图谱的构建提供算法支持。MAT2可在https://github.com/Zhang-Jinglong/MAT2上公开获得(Bioinformatics, 2021, btab250)。