2025-05-13 16:02

ChatGPT在临床决策中具有很高的准确性

  

  

  麻省总医院布里格姆的研究人员领导的一项新研究发现,从提出可能的诊断到做出最终诊断和护理管理决策,ChatGPT在整体临床决策中的准确率约为72%。大语言模型(LLM)人工智能聊天机器人在所有医学专业的初级保健和急诊环境中表现同样出色。该研究小组的研究结果发表在《医学互联网研究杂志》上。

  通讯作者Marc Succi医学博士说:“我们的论文全面评估了ChatGPT的决策支持,从一开始与患者一起工作到整个护理场景,从鉴别诊断一直到测试、诊断和管理。”Marc Succi医学博士是麻省总医院布里格姆创新与商业化副主席和战略创新领导者,也是MESH孵化器的执行董事。“没有真正的基准,但我们估计这种表现达到了刚从医学院毕业的人的水平,比如实习生或住院医生。这告诉我们,法学硕士总体上有潜力成为医学实践的增强工具,并以令人印象深刻的准确性支持临床决策。”

  人工智能技术的变化正在迅速发生,并正在改变包括医疗保健在内的许多行业。但法学硕士在全面临床护理中的辅助能力尚未得到研究。在这项关于法学硕士如何用于临床建议和决策的综合、跨专业研究中,Succi和他的团队验证了ChatGPT能够通过与患者的整个临床接触,推荐诊断检查,决定临床管理课程,并最终做出最终诊断的假设。

  该研究是通过将36个标准化的、已发表的临床小片段的连续部分粘贴到ChatGPT中来完成的。首先,该工具被要求根据患者的初始信息(包括年龄、性别、症状以及病例是否紧急)提出一组可能的或不同的诊断。然后,ChatGPT被给予额外的信息,并被要求做出管理决策以及给出最终诊断——模拟看一个真正的病人的整个过程。该团队比较了ChatGPT在鉴别诊断、诊断测试、最终诊断和管理方面的准确性,对正确答案进行了打分,并使用线性回归来评估ChatGPT的表现与小故事的人口统计信息之间的关系。

  研究人员发现,总体而言,ChatGPT的准确率约为72%,在最终诊断中准确率最高,为77%。它在鉴别诊断方面表现最差,准确率只有60%。它在临床管理决策方面的准确率只有68%,比如在得到正确诊断后,确定用什么药物治疗病人。该研究的其他值得注意的发现包括,ChatGPT的答案没有显示出性别偏见,其在初级和紧急护理中的总体表现都很稳定。

  苏奇说:“ChatGPT在鉴别诊断方面遇到了困难,当医生必须弄清楚该怎么做时,鉴别诊断是医学的关键。”“这很重要,因为它告诉我们,在病人护理的早期阶段,当需要一系列可能的诊断时,医生是真正的专家,并增加了最大的价值。”

  作者指出,在像ChatGPT这样的工具可以被考虑整合到临床护理之前,需要更多的基准研究和监管指导。接下来,suci的团队正在研究人工智能工具是否可以改善医院资源有限地区的患者护理和结果。

  卫生领域人工智能工具的出现具有开创性,并有可能积极地重塑护理的连续性。作为美国顶尖的综合学术卫生系统和最大的创新企业之一,麻省总医院在对新兴技术进行严格研究方面处于领先地位,为将人工智能负责任地纳入医疗服务、劳动力支持和行政流程提供信息。

  “麻省总医院看到了llm在帮助改善护理服务和临床医生体验方面的巨大前景,”合著者亚当·兰德曼(Adam Landman)说,他是医学博士、MS、MIS、MHS,麻省总医院数字部门首席信息官和高级副总裁。“我们目前正在评估LLM解决方案,以协助临床文档和起草患者信息的响应,重点是了解其准确性、可靠性、安全性和公平性。在我们将法学硕士工具整合到临床护理之前,需要像这样的严格研究。”

  信息披露:没有宣布。

  经费:本研究部分由美国国家普通医学科学研究所资助(T32GM144273)。

  论文引用:Rao, A.等。“评估ChatGPT在整个临床工作流程中的效用:开发和可用性研究。”医学互联网研究杂志。DOI: 10.2196/48659

  /公开发布。来自原始组织/作者的材料可能具有时点性质,并根据清晰度,风格和长度进行了编辑。海市蜃楼。新闻不受机构限制

  所有的位置或侧面,以及所有的视图、位置等

  此处表达的结论仅代表作者的观点。点击此处查看全文。

本内容为作者翻译自英文材料或转自网络,不代表本站立场,未经允许不得转载
如对本稿件有异议或投诉,请联系本站
想要了解世界的人,都在 火互百读

相关推荐