关键词:单细胞 RNA 测序,最优输运理论,神经微分方程,基因调控网络,细胞命运决定,复杂系统动力学建模
论文题目:Reconstructing growth and dynamic trajectories from single-cell transcriptomics data
论文来源:Nature Machine Intelligence
论文链接:https://www.nature.com/articles/s42256-023-00763-w
在细胞科学探究中,了解单个细胞随着时间推移如何生长、分化和变化,是揭示生命奥秘的关键。单细胞 RNA 测序(scRNA-seq)技术使科学家能够详细分析单个细胞的基因表达情况,从而揭示细胞在不同状态下的动态变化。然而,由于测序过程会破坏细胞,导致无法追踪同一细胞在不同时间点的变化,这给研究细胞的成长轨迹和动态过程带来了挑战。
为了解决这一难题,Nature Machine Intelligence 近期发表的一项研究介绍了一种名为 TIGON(Trajectory Inference with Growth via Optimal transport and Neural network,通过最优输运和神经网络生长进行轨迹推断)的新方法,不仅为单细胞转录组数据的动态解析提供了全新的工具,也为深入理解细胞群落的动态变化开辟了新视角。
TIGON 将细胞的动态变化与群落增长整合于统一框架内,采用深度学习与最优输运(optimal transport)理论,精准重建细胞状态转变及增殖过程,并揭示驱动这些变化的基因调控机制。具体而言,首先基于 Wasserstein-Fisher-Rao(WFR)距离构建动态非平衡最优输运模型,并对其进行无量纲化处理,使其能够同时捕捉每个细胞在基因表达空间中的速度和生长率;其次,利用神经微分方程(Neural ODEs)解决动态非平衡最优输运问题,Neural ODEs 能高效模拟连续时间下的动态过程,适用于处理时间序列数据;最后,通过模型获得的细胞速度和生长信息,推断潜在的时间因果基因调控网络,并通过分析生长梯度,识别与细胞生长密切相关的关键基因。
TIGON 突破了传统单细胞动态追踪的瓶颈,提供了高鲁棒性和高准确性的细胞状态转变与增殖预测工具,推动了细胞发育和疾病机制研究的发展,该框架不仅适用于单细胞 RNA 测序数据,还具备广泛的应用前景,可扩展至其他类型的单细胞数据和复杂系统的动力学建模,对细胞命运的理解和刻画有重要意义。
图 1. TIGON 的示意图。
a. 细胞谱系动态的示意图,包括细胞生长、转变和基因调控网络(GRNs)。b. 连续的细胞动态由时间依赖的密度 ρ ( x,t ) 描述。时间序列单细胞 RNA 测序快照的输入在离散时间点生成密度 ρ。c. 密度 ρ 由涉及速度 v 和生长 g 的偏微分方程控制,这些量由两个神经网络建模。d,e.TIGON 的输出和下游分析。d. 左上角,速度图,每个点代表一个细胞,颜色表示采集时间,箭头的长度表示速度的大小。右上角,每个细胞的轨迹。左下角,选定细胞或细胞类型的基因调控矩阵。右下角,GRN,其中指向箭头(钝箭头)表示源基因对目标基因的正(负)调控,箭头的宽度表示调控强度。e. 左侧,推断的生长值 g 用颜色表示。红色箭头表示 g 的梯度,其长度对应于大小。右侧,g 的梯度决定了基因对生长变化的贡献。基于梯度最大的基因选择与生长相关的基因。
图 2. TIGON 在三基因模拟数据集上的表现
图 3. TIGON 在谱系追踪数据集上的表现
图 4. TIGON 在 EMT 单细胞 RNA 测序数据集 ( scRNA-seq ) 上的表现
图 5. TIGON 与轨迹推断或增长推断方法在单细胞 RNA 测序数据集 ( scRNA-seq ) 上的比较
王婷 | 编译
生命复杂性读书会:
生命复杂系统的构成原理
在生物学中心法则的起点,基因作为生命复杂系统的遗传信息载体,在生命周期内稳定存在;而位于中心法则末端的蛋白质,其组织构成和时空变化的复杂性呈指数式增长。随着分子生物学数十年来的突飞猛进,尤其是生命组学(基因组学、转录组学、蛋白质组学和代谢组学等的集合)等领域的日新月异,当代生命科学临近爆发的边缘。如此海量的数据如何帮助我们揭示宇宙中最复杂的物质系统—— " 人体 " 的构成原理和设计原理?阐释人类发育、衰老和重大疾病的发生机制?
集智俱乐部联合西湖大学理学院及交叉科学中心讲席教授汤雷翰,国家蛋白质科学中心(北京)副研究员常乘、李杨,香港浸会大学助理教授唐乾元,北京大学前沿交叉学科研究院研究员林一瀚,中国科学院分子细胞科学卓越创新中心博士后唐诗婕,共同发起「生命复杂性:生命复杂系统的构成原理」读书会,从微观细胞尺度、介观组织器官尺度到宏观人体尺度,梳理生命科学领域中的重要问题及重要数据,由生物学家提问,希望促进统计物理、机器学习方法研究者和生命科学研究者之间的深度交流,建立跨学科合作关系,激发新的研究思路和合作项目。读书会从 2024 年 8 月 6 日开始,每周二晚 19:00-21:00 进行,持续时间预计 10-12 周。欢迎对这个生命科学、物理学、计算机科学、复杂系统科学深度交叉的前沿领域感兴趣的朋友加入!
详情请见:
登录后才可以发布评论哦
打开小程序可以发布评论哦