Press "Enter" to skip to content

密歇根州立大学的研究人员开发了名为“DANCE”的Python库,用于支持大规模分析单细胞基因表达的深度学习模型

密歇根州立大学的研究人员开发了名为“DANCE”的Python库,用于支持大规模分析单细胞基因表达的深度学习模型 四海 第1张密歇根州立大学的研究人员开发了名为“DANCE”的Python库,用于支持大规模分析单细胞基因表达的深度学习模型 四海 第2张

从单模态分析(RNA、蛋白质和开放染色质)到多模态分析和空间转录组学,近年来,分析单个细胞的技术发展迅速。机器学习为基础的大量计算方法应运而生,这是由于该领域的迅速扩展所推动的。

研究人员指出,由于当前方法的多样性和复杂性,很难复制原始文章中显示的结果。超参数调整、编程语言之间的不兼容以及缺乏公开可用的代码库都提供了重大障碍。由于大多数现有作品仅在有限的数据集上报告了其性能,并与不足的方法进行了比较,因此需要进行系统的基准测试程序来全面评估方法。

作为最近一项研究的一部分,来自密歇根州立大学、华盛顿大学、浙江工业大学、斯坦福大学和强生公司的研究人员介绍了DANCE,这是一个用于加速单个细胞分析进展的深度学习库和基准。

DANCE提供了一套全面的工具,用于大规模分析单个细胞的数据,使开发者能够更轻松高效地创建他们的深度学习模型。此外,它还可以用作比较各种计算模型在单个细胞分析中性能的基准。DANCE目前包括对3个模块、8个任务、32个模型和21个数据集的支持。

目前,DANCE提供以下功能:

  1. 单模态分析。
  2. 多模态分析。
  3. 空间转录组学分析。

自动编码器和GNN是广泛使用的深度学习框架,适用于各个领域。根据他们的论文,DANCE是第一个全面的单细胞分析基准平台。

在这项工作中,研究人员使用了创新的组件。他们通过编制任务特定的标准基准数据集并通过单个参数调整使其可立即使用来开始工作。为每个任务实现了基线的经典和深度学习算法。所有收集到的基准数据集都被用于微调基线,直到它们达到与原始研究相同或更好的结果。最终用户只需运行一条命令行,其中预先包装了所有超参数,就可以获得微调模型的性能。

团队使用PyTorch Geometric (PSG)框架作为基础。此外,他们通过将其转化为适应-预测-评分的框架,使其基线标准化。对于每个任务,通过网格搜索在所有收集到的标准基准上对所有实现的算法进行微调,以获得最佳模型。相关的超参数存储在单个命令行中,以便用户能够重现实验结果。

团队认为他们的工作使整个单细胞社区受益于DANCE平台。最终用户不需要花费太多时间和精力来实现和微调模型。相反,为了复制他们的结果,他们只需要运行一条命令行。此外,研究人员还为基于深度学习的模型的快速训练提供了图形处理单元(GPU)的支持。

目前,DANCE缺乏用于预处理和图形创建的统一工具集。团队计划在未来进行改进。他们还表示,DANCE将作为一项SaaS服务提供,这样用户就不必完全依赖自己设备的处理能力和存储容量。

本文是MarkTechPost员工根据研究论文“DANCE:用于单细胞分析的深度学习库和基准”的研究摘要文章编写的。所有关于这项研究的荣誉归功于这个项目的研究人员。查看论文、代码和工具。
请别忘记加入我们的机器学习Subreddit

这篇文章最初发表于MarkTechPost网站,标题为《密歇根州立大学的研究人员开发了一种名为“DANCE”的Python库,支持单细胞基因表达大规模分析的深度学习模型》。

Leave a Reply

Your email address will not be published. Required fields are marked *