对细胞信号网络的深度学习为单细胞生物学建立了AI

2021-10-08 08:23:46
来源:文章来源于网络

  模拟人类问题解决关键方面的计算机系统通常被称为人工智能(AI)。过去几年,该领域取得了巨大进展。最值得一提的是,深度学习使无人驾驶汽车,计算机在战略游戏(围棋,国际象棋),计算机游戏,扑克以及诊断医学的最初应用中击败了最优秀的人类玩家,从而取得了突破性的进展。深度学习基于人工神经网络-迭代地重新组织数学函数的网络,直到它们将描述给定问题的数据准确地映射到其解决方案为止。

  在生物学中,深度学习已经成为基因组数据(如基因表达谱)预测表达形式(即细胞或个人可观察特征)的强有力方法。深度学习通常是一种“黑匣子”方法:当神经网络提供足够的训练数据时,它们是非常强大的预测器。例如,根据基因表现谱预测细胞类型,根据DNA序列数据预测蛋白质结构。但是,标准的神经网络不能用人类理解的方法说明输入和输出之间的学习关系。因此,迄今为止,深入学习对提高细胞内分子功能的机械理解贡献很小。
  为了解决这种缺乏解释性的问题,CeMM博士后研究员NikolausFortelny和CeMMMCEO研究员ChristophBock追求在生物网络上直接深入学习的想法,而不是在通常的深入学习中使用的通用性、完全连接的人工神经网络。他们建立了基于信号通路和基因调控网络的“知识型神经网络 ”(KPNN)。在KPNN中,每个节点对应一个蛋白质或基因,每个边缘都有机械的生物学说明(例如蛋白质a调节基因b的表现)。
  CeMM研究人员在《基因组生物学》新研究中表明,对生物网络的深入学习在技术上是可行的,在实践中是有用的。通过强迫深度学习算法保持接近生物网络中编码的基因调控过程,KPNN在深度学习的力量和我们快速增长的对复杂生物系统的知识与理解之间架起了一座桥梁。毕竟,该方法提供了对研究生物系统的具体见解,同时保持了较高的预测性能。这种功能强大的新方采用优化的深度学习方法,在冗余的情况下稳定节点权重,增强节点权重的定量可解释性,控制生物网络固有的不均匀连接性。
\
  CeMM研究人员在大型单细胞数据集中展示了新的KPNN方法,包括人类细胞图像协会设立的免疫细胞483,084个单细胞转录组的简要编辑。该数据集中,科学家发现来自骨髓和脐带血的免疫细胞之间的细胞类型定义控制网络中意想不到的多样性。
  KPNN方法将深度学习的预测能力及其推断多个隐藏层的活动水平的能力与生物网络的功能可解释性相结合。KPNN对单细胞RNA序列数据特别有用,该数据由单细胞序列分析大规模生成。此外,KPNN广泛适用于生物学和生物医学的其他领域,其中相关的先验知识可以表示为网络。
  KPNNs获得的预测和生物学见解有助于分析健康和疾病中细胞信号的传导和基因控制,鉴定新药的目标,从单细胞的顺序数据中获得可检测的生物学假设。更广泛地说,这项研究表明,随着科学界学习如何使人工智能结果具有生物学的可解释性,人工智能和深度学习对机械生物学未来的影响。