Press "Enter" to skip to content

NYU与NVIDIA合作开发大型语言模型以预测患者再次住院

从医院出院对于患者来说是一个重要的里程碑,但有时,这并不意味着他们的康复之路已经结束。在美国,近15%的住院患者在初始出院后的30天内再次入院,这通常与患者和医院都面临更糟糕的结果和更高的成本有关。

纽约大学(New York University)的医学中心纽约大学朗格尼医疗中心(NYU Langone Health)的研究人员与英伟达专家合作,开发了一个大型语言模型(LLM),可以预测患者未来30天内再次入院的风险,以及其他临床结果。

在该医疗系统的6个住院设施中部署的NYUTron模型——今天在科学杂志《自然》上亮相——为医生提供了人工智能驱动的洞见,可以帮助他们识别需要临床干预以减少再入院风险的患者。

“当你从医院出院时,你不希望他们需要返回,否则你可能应该让他们在医院里待更长时间,”NYU Grossman School of Medicine的放射学和神经外科助理教授Eric Oermann博士说,并且他是NYUTron的主要合作者之一。“使用AI模型的分析,我们可以很快赋予临床医生防止或修复使患者再次入院风险增加的情况的能力。”

到目前为止,该模型已经应用于纽约大学医疗系统中超过50,000名患者,通过电子邮件通知与医生共享再入院风险的预测结果。Oermann的团队接下来计划进行一项临床试验,以测试基于NYUTron的分析是否能够降低再入院率。

解决快速再入院等威胁

美国政府跟踪30天再入院率作为医院提供的医疗质量的指标。具有高再入院率的医疗机构将受到罚款,这种监管程度促使医院改善其出院流程。

有很多原因使最近出院的患者可能需要再次入院,其中包括感染、抗生素过度开药、手术引流管早期拆除等。如果这些风险因素能够更早地被发现,医生可以通过调整治疗计划或在医院内对患者进行更长时间的监测来进行干预。

“虽然自1980年代以来就有计算模型来预测患者再入院,但我们将其视为一项自然语言处理任务,需要具有临床文本的健康系统规模语料库,”Oermann说。“我们训练了LLM,让它在电子健康记录的非结构化数据上进行学习,以查看它是否能够捕捉到人们之前未考虑的见解。”

NYUTron是在纽约大学朗格尼医疗中心的10年健康记录上进行预训练的LLM:超过40亿字的临床笔记,代表近40万名患者。该模型的准确性比预测再入院的最先进机器学习模型提高了10%以上。

在LLM针对30天再入院的初始使用案例进行了训练后,该团队能够在大约一周内推出其他四种预测算法。这些算法包括预测患者住院时间的长度、住院期间死亡的可能性以及患者保险理赔被拒绝的机会。

“经营医院在某些方面就像管理酒店,”Oermann说。“帮助医院更有效地运营的见解意味着有更多病床和更好的护理服务,可以为更多的患者提供帮助。”

从训练到部署的LLM

NYUTron是一个具有数亿参数的LLM,使用NVIDIA NeMo Megatron框架在大型NVIDIA A100 Tensor Core GPU集群上进行训练。

“当前关于语言模型的大部分讨论都是围绕着数十亿参数的庞大通用模型,使用数百或数千个GPU训练混乱的数据集,”Oermann说。“我们正在使用中等规模的模型,用高度精炼的数据进行训练,以完成特定于医疗保健的任务。”

为了将模型优化为在现实医院中进行推理,该团队开发了NVIDIA Triton开源软件的修改版本,以使用NVIDIA TensorRT软件开发工具简化AI模型的部署。

“要在实时医疗环境中部署这样的模型,它必须运行高效,”Oermann说。“Triton提供了推理框架中的所有功能,使我们的模型运行得非常快速。”

该团队发现,预先训练他们的LLM后,在具体医院的数据上进行微调有助于显著提高准确性,这是其他医疗机构部署类似模型的一个特点。

“并不是所有医院都有足够的资源进行大规模语言模型的自主培训,但他们可以采用像NYUTron这样的预训练模型,然后使用云中的GPU对本地数据进行微调以获得更好的效果,”他说。“几乎所有医疗机构都可以实现这一目标。”

了解更多关于NYUTron的信息,请阅读《自然》论文并观看这个NVIDIA和NYU的在线讲座。

Leave a Reply

Your email address will not be published. Required fields are marked *