国内首次!AI医生与真人医生一起义诊
记者亲测体验问诊结果一致性达96%
(相关资料图)
国内首次AI医生与真人医生一致性评测结果正式揭晓!
6月30日,医联于成都举行了国内首次AI医生与真人医生一致性评测,并进行了全天候实时直播。现场有120多位真实患者及10位来自四川大学华西医院的主治医师共同参与了这场评测研究。
最终,经过来自北大人民医院、中日友好医院、阜外医院和友谊医院的7位专家教授针对评测形成的91份有效病例进行审核,并且针对AI医生的问诊准确性、诊断准确性、治疗建议准确性、辅助检查方案准确性、数据分析准确性、提供可解释信息、自然语言问诊与交互这7个评价维度的打分之后,最终,真人医生综合得分为 分,AI 医生综合得分为 分。
AI医生与三甲主治医生在比分结果上的一致性达到了96%。
【AI医生义诊现场】
问诊过程中,真人医生和AI医生都没有与患者直接接触,患者与医生助理接触,医生助理通过电脑输入文字分别与真人医生和AI医生联系,真人医生和AI医生的问题也经由医生助理传递给患者。
引导患者说出完整病情、收集足够多决策因子后,真人医生与AI医生为患者开具检查单或诊断,患者直接在成都高新海尔森医院完成检查;获得检查结果后,患者再复诊,并由AI医生及真人医生提供临床诊断及治疗方案。
从开始问诊到评审结果,整个过程在网上直播。
8个小时的问诊结束后,形成有效病例91份,由北大人民医院、中日友好医院、阜外医院和友谊医院的7位专家教授进行审核。7位专家教授的专业与前述科室对应,评价维度包括7个——问诊准确性、诊断准确性、治疗建议准确性、辅助检查方案准确性、数据分析准确性、提供可解释信息、自然语言问诊与交互。
最终,真人医生综合得分为分,AI 医生综合得分为分。AI医生与真人医生在比分结果上的一致性为96%。5位专家给真人医生的打分都高于AI医生,只有2位专家给AI医生的打分高于真人医生,一位差,一位差。
此次AI医生义诊活动主办方医联的工作人员表示:“这次评测绝不是一次AI与真人的PK,开发MedGPT的目的,是希望通过不断优化,将来可以将这款‘AI医生’应用到辅助真人医生问诊中。”该名工作人员表示,MedGPT主要是解决病患的首诊问题,比如常见病中的头疼脑热等,帮助真人医生了解并判断病患可能得病的范围。
(真人医生(左)与AI 医生(右)为患者开具检验检查并进行解读)
在专家评审环节
▽
北大人民医院骨科主任医师薛峰表示,总体不错,稍稍有些超出预期。MedGPT是一项非常有发展前景的技术,应该定位在常见病和基础病的诊断上。
对于AI医生的不足,薛峰认为,AI医生无法查体,但AI医生也没有关注查体结果,比如关节的活动度、有无压痛点等等。此外,对检查结果,AI医生只会读报告,报告怎么写的就会认为是什么样的,但专科医生要自己会看片子,“片子上的细微改变,报告有时候是体现不出来的”。
中日友好医院呼吸科主任医师刘国梁表示,“AI医生能想到所有的患病可能性和诱因,在药物过敏等各个维度都会考虑到,这一点有利于帮助真人医生自身的知识结构完善和拓展。但AI医生容易出现重复推荐检查项目,有一些检查项目是没有必要的。”
中日友好医院心内科主任医师任景怡说:我觉得最好的一点是,当诊断尚不明确时,AI医生并不会轻易给出结论,而是要坚持通过继续问诊或检查收集更多信息。尽管AI医生还存在一些问题,但迈出了重要的一步,这是里程碑式的结果。
多位专家认为,AI医生虽然问诊详细,但是针对性不够强,系统性和逻辑性也不够强,还有待训练。
“AI医生”一致性评测
给医疗增添更多可能性
▽
此次比较理想的一致性评测结果,增强了我们开发“AI医生”信心,也给未来医疗增添更多可能性。“AI医生”广泛参与诊疗,不仅将大幅提升真人医生的工作效率,而且对真人医生还有拓宽思路和纠错的作用。尤其在医生比较缺乏的基层,“AI医生”有可能成为基层医生的重要帮手,帮助基层大幅提升诊疗水平。
在给予“AI医生”美好期待的同时,对其局限性也决不能忽视。
“AI医生”擅长推理和理性思维,但医学既属自然科学,又包含了丰富的人文色彩,医生诊疗要给患者以人性的温暖,与患者沟通需要深入对方心灵,并设身处地替他们着想。“AI医生”在这方面存在巨大的短板甚至缺陷,只能作为真人医生的助手,不能喧宾夺主。正因如此,《互联网诊疗监管细则(试行)》明确,人工智能软件等不得冒用、替代医师本人提供诊疗服务。
由于互联网具有隐匿性和跨距离等特点,线上医生和患者隔着屏幕,对方是人还是智能机器,患者极难辨别。因此,在互联网诊疗日益普及的当前,尤其需要防范功能日益强大的“AI医生”,在网上冒充真人医生行医。并且“AI医生”越先进,防范措施就应该越完备。
“AI医生”深度学习的数据质量问题,也需要引起高度重视。正规的科研机构和医疗机构可以开发“AI医生”,不法分子同样可以,“AI医生”若被某些“神医”所用,会导致医疗欺诈具有更高的技术含量。此外,人工智能的存储与记忆功能强大,“AI医生”所掌握的诊疗信息一旦管理和使用不当,就会对患者产生巨大的杀伤力。
首次“AI医生”与真人医生的一致性评测,这本身就是一件极具开创意义的事。将来应该针对如何评测和怎么利用评测结果等,进行广泛探索,并制定一个科学的规则。除了评测,“AI医生”的认证、使用场景、日常管理等,也亟待出台管理规范。如此才能趋利避害,让“AI医生”最大限度发挥好正面作用,避免患者反而被其所伤。(罗志华)
- END -
热门视频
更多资讯欢迎关注我们
声明:文章信息综合自央广网,版权仍归原创者所有,转载此文出于传播更多资讯之目的,如涉著作权事宜请联系删除。
同时点“在看”和“赞”
推文会第一时间推送给您