2AFC的应用
信号检测论一个非常重要的应用就是从刺激中选出信号相关的任务,即二选一迫选任务(two alternative forced choice, 2AFC)。2AFC任务比如在实验中每次呈现两个刺激,在其中一个一定是信号、另一个一定是噪音的情况,被试如何设置一个判断标准进行判断。
在2AFC中,每个试次会先后呈现两个刺激,其中一个必定是信号,另一个必定是噪音,刺激呈现的顺序是随机的,被试需要判断那个刺激是信号。那么,被试应该使用怎样的策略做出判断?
因为信号的刺激强度总体高于噪音(图1),所以最简单的判断策略是将刺激强度更高的判断为信号,刺激强度更低的判断为噪音。然而由于信号分布和噪音分布存在重叠,因此信号的刺激强度有时也会低于噪音,导致被试的判断可能出现错误。

那么被试的总体判断的正确率等于多少?如上一节所描述,假设每个trial中的信号和噪音刺激都是从相应的高斯分布中随机选择的,被式的判断标准是哪一个刺激更大,就认为哪一个是信号。所以正确率为我从信号的分布中抽取的刺激强度高于从噪音分布中抽取的刺激强度的概率,即:
目前,我们涉及的所有的例子,都假设信号和噪音分布方差是相等的。然而,并不是在所有的实验里信号和噪音分布的方差都是相等的。在记忆领域中,有一种特殊的信号检测任务。在这项任务中,在学习阶段,我们要求被试学习一系列的词语;在学习完这些词语后,被试需要尝试记忆一系列词语。在测试阶段,每个试次屏幕上会呈现一个词,有的词学过,有的词没学过。被试需要判断哪些词是他学过的“旧词”,哪些词是没有学过的“新词”。那么新词相当于噪音,旧词就是信号,根据等方差信号检测模型的计算公式,可以计算出d’和C的值,并把d’作为记忆力的指标。
然而研究者发现,旧词(信号)分布的标准差要大于新词(噪音)分布。平均而言,旧词分布的标准差是新词的1.25倍左右(Mickes et al., 2007)。这有可能是因为所有的新词都是没有学过的,被试对这些词的记忆强度比较相似;虽然被试学过所有的旧词,但不同词语的学习程度之间存在明显差异。所以我们需要信号和噪音分布的方差不相等的信号检测模型,被称为不等方差信号检测模型(unequal-variance signal detection model)。
在不等方差信号检测模型中,我们通常定义噪音分布的标准差为1,信号分布的标准差为σ,信号和噪音分布的均值之间的距离为d’(如图2所示)。不等方差信号检测模型包含σ大于1和小于1的情况,但σ > 1比较常见。在不等方差模型中,直接使用d’作为辨别力指数是不合适的,因为辨别力还会受到σ的影响。当d’维持恒定时,σ越小,辨别信号和噪音的能力越强;当σ维持恒定时, d’越大,辨别信号和噪音的能力越强。但是我们仍然可以使用ROC曲线下面积来代表个体的辨别力。

在不等方差信号检测模型中,ROC曲线下面积(AUC)和d’与σ的对应关系如下:
所以只要知道d’和σ的值,就能计算AUC,进而量化个体辨别信号和噪音的能力。然而,如果我们只有击中率和虚报率的数据,则没办法通过两个数据计算出d’、σ和C这三个自由参数的值。
我们只能通过尝试改变被试的C值,保证d'和σ不变的情况下,才有可能把这些参数全部都求出来。在一个特定的实验里,我们可以通过某些操作去改变C值,但维持d'不变。比如,在一个信号辨别的任务中,被试有一个判断标准。在第一种实验条件下,我们告知被试,假设你成功辨别出信号,你就会获得很高的奖金;如果你虚报一个试次则没有惩罚;这个时候被试会倾向于设置一个非常宽松的标准,即C的位置较为靠左,此时只要多把刺激判断为信号的话,被试就可以获得高奖金。而另一种实验条件中,如果我们告知被试虚报会带来很大的惩罚,这个时候C值会较为靠右,被试就会很谨慎,不愿意虚报,就会很少将刺激判断为信号。
现在,我们有四个未知数:两个C值,一个d'和一个σ。同时,我们也有四个数据,即两种条件下各有一个击中率和一个虚报率。这时候我们就可以将四个未知数一一求出来,然后结合d'和σ求出AUC,AUC越大,被试的辨别力越强。
最后更新于