科学家研发可整合多个单细胞RNA测序数据集的新算法

2021年04月02日 来源:科学网 作者:小柯机器人

美国阿尔伯特爱因斯坦医学院Deyou Zheng课题组近日取得一项新成果。经过不懈努力,他们研究发现可使用单个参考空间整合多个单细胞RNA测序(scRNA-seq)数据集。2021年3月25日,国际学术期刊《自然-生物技术》发表了这一成果。

在本研究中,研究人员研发了一种新算法,该算法使用参考数据集中的基因特征向量来建立用于分析的整体框架。使用模拟和真实的数据集,研究人员证明了这种称为参考主成分整合(RPCI)方法在多个指标上都优于其他算法,在保留匹配细胞类型中真正的跨样本基因表达差异方面也具有明显优势,例如应用于处于不同发育阶段的细胞中或处于摄动与对照研究中时。

此外,当整合多个数据集时,RPCI仍可保持这种强大的性能。最后,研究人员将RPCI应用于小鼠肠道内胚层发育的scRNA-seq数据集,揭示了瞬时出现的遗传基序有助于建立内脏内胚层的前后轴。

据悉,在许多生物学应用单细胞RNA测序时需要对多个批次或研究的数据进行综合分析。当前的分析方法通常使用共享细胞类型或数据集之间的协方差相关性来完成,但这会造成生物信号失真。