AI可以说是又一场革命,涉及各个领域。医学毫无疑问是AI大展身手之处,因为现代医学涉及到大量的信息,以至于有人认为AI完全可以替代医生。对于病人及其亲属来说,网上搜索医学相关信息成了常态,人们用AI来做健康顾问的比例越来越高,那么AI会不会让他们做出更好的选择?
牛津大学的一项新研究就是关于这个方面的,研究涉及10个领域,从普通感冒到脑出血,在没有人类参与的情况下,用Chat GPT-4o、Llama 3和Command R+这个模型进行测试,对发现它们的诊断准确率达94.9%,对这些病例做出正确选择包括叫急救车、看医生等的建议平均为56.3%。然后研究人员找来1298人,一部人用AI,另一部分做网络搜索、或者根据经验、或者根据英国国家健康服务网站,根据给出的症状决定下一步怎么做。结果用AI组的诊断准确率为34.5%,行动正确率为44.2%,并没有高于用其他方式者。
这个研究证明AI的潜力与实际操作之间存在着巨大的差距,当人类参与的情况下,AI的效果会大受影响,原因之一是信息的不完整。比如同样是蛛网膜下腔出血,一位参加者给出症状是脖子僵硬、对光敏感以及最严重的头痛,AI的建议是去医院。另外一位参加者给出的症状是严重的头痛,AI让他找个黑暗的房间躺下。这说明AI的训练中要加上这些人为的因素,这样才能真正作为健康顾问。
