能的基本事实与专家关键决策的理想标准相比如何? 一旦评估专家关键决策的理想或黄金标准明确,就可以将其与人工智能开发人员的方法进行比较,以确定用于训练和验证算法的基本事实。我们研究中的以下案例说明了这一最终步骤的重要性。 医疗保健管理者计划对用于乳。
腺癌诊断的人工智能工具
进行试点研究。在讨论使用什么作为基本事实来验证工具在内部数据上的性能的过程中,他们研究了人工智能开发人员用于初始性能测试的内容。他们对自己的发现感 特克斯和凯科斯群岛电子邮件列表 到震惊。 该人工智能工具旨在根据一幅乳房 光症 或 可能的良性 。在这种决策背景下,验证该诊断的黄。
金标准将涉及最终病理结
果和长期患者健康结果(获取数据困难且成本高昂)。相反,人工智能设计者选择构建地面实况标签来验证该工具,方法是要求放射科医生小组在查看 tg编号 单个乳房 光照片(与人工智能模型相同的输入)后做出判断。当他们随后对该模型进行人类与人工智能性能测试时,他们声称这是一次同类比较,他们的专家小组根据相同的。