dprime
最后更新于
最后更新于
如何计算d-prime以及推导
信号检测论中的核心指标是d'(dprime),它反映了个体辨别信号和噪音的能力。
d'的计算方式是信号的均值减去噪音的均值再除以两者分布的标准差。我们一般认为,当真实的信号和噪音分布离得越近(图1左),两者重叠越多,我们辨别两者的能力越差。如果两者的分布离得越远,两者重叠越少,我们辨别两者的能力越强(图1右)。越大的情况之下,那我们认为个体能辨别出信号和噪音的可能性就越大。同时,个体辨别信号和噪音的能力也会受到分布的标准差的影响:当两者的分布处于相同的距离时,如果标准差越大,那么二者重叠的部分越多,个体辨别出两者的可能性越小。所以d'既要考虑均值差异,还得考虑标准差大小。d'比正确率要好,因为正确率还会受反应标准的影响。有时候我们会为了计算简便,我们会直接假设两个分布的标准差为1,这个时候d'就直接等于两个均值的差异。
接下来我们将学习如何基于实验计算出的四种情况(hit,miss,false alarm,correct reject)的数据来计算d'。首先我们先来看正态分布和正态分布的累积函数之间的关系。一般来说,均值为零,标准差为1的正态分布称为标准正态分布。标准正态分布的概率密度函数用表示,
标准正态分布的累积分布函数函数用表示,
如图2所示,概率密度函数中,z值左边阴影的面积,等于在累积分布函数中z对应的纵坐标大小。故标准正态分布的概率密度函数与累积函数之间存在积分关系,即
标准正态分布的累积分布函数的纵坐标是从0到1逐渐变化。由于标准正态分布曲线以均值为中心左右对称,所以当z正好等于零的时候,累积分布函数的纵坐标等于0.5,且:
当我们知道后,如果想知道对应的z值,则可以将其去z分数,将其转换为对应的z值,则
现在我们假定信号和噪音均为标准正态分布,那么d'为两者均值之间的距离,即图3b中绿线到左边虚线的距离与绿线到右边虚线的距离相加。当我们由实验数据计算得到误报率false alarm,其对应为图3a中蓝色阴影的面积,而图3a中白色区域的面积则对应正确拒绝的概率correct reject,由此我们计算得到绿线到左边虚线的距离为:
同理,当我们由实验数据计算得到击中率hit,其对应为图3a中红色阴影的面积,而图3a中白色区域的面积则对应漏报率miss,由此我们计算得到绿线到右边虚线的距离为:
转换为用击中率表示则为:
所以,当信号和噪音都服从标准正态分布的时候,