2012GG心理学背诵宝典（100小时搞定）【第二版完成！！！】（不会再出新版）

光爱哈赫 · 发表于 11-8-11 00:59:06

本帖最后由光爱哈赫于 2011-8-31 15:46 编辑

四、心理物理法(一般两个选择题，注意会考计算)
（一）阈限的测量
心理物理学的终极目标是揭示物理刺激与心理变化之间的函数关系，这也就是为什么心理学能成为一门科学的原因。（将心理现象给量化了）要做到这一点就必须实现，感觉阈限的测量和阈上感觉的量化。
1860年费希纳的巨著《实验心理学纲要》轰动了整个心理学界，不仅标志着心理物理学的诞生，而且直接导致心理学作为一门学科的出现，后来也有科学家认为费希纳才是心理学之父。（当然公认还是冯特）
阈限是刚刚能引起反应的刺激量，操作定义是50%的实验次数能引起反应的刺激量
差别阈限是刚刚能引起差别感觉的刺激量，操作定义50%的实验次数能引起反应的刺激量
费希纳设计了三种测量方法：
1.极限法
也叫最小变化法，序列探索法。将刺激按递增或递减系列的方式，以间隔相等的小步变化，寻求阈限的位置（瞬时转换点）
绝对阈限的测量方法：由刺递增和递减两个系列组成，每次刺激后让被试报告他是否有感觉。刺激的增减应该尽可能地小，然后找转折点，即从有到无或者从无到有。
绝对阈限的计算方法：1、计算每个刺激系列的阈限，被试的反应转折点触对应的两个刺激强度的中点就是这个系列的阈限。2、求出所以系列阈限的均值，这就是绝对阈限值。（注意递增递减交替进行以免被试形成定势）
差别阈限的测量方法：每一次实验中比较两个刺激，一个是标准刺激，一个是比较刺激。被试可能出现，大了，小了或无法区分三种报告。无法区分那一部分的一半就是差别感觉阈限。
差别阈限的计算方法：从小到等的转折点记为下限，从等到大的转折点记为上限。各取平均值。得到平均上限和平均下限，他们之差就是不肯定间距（无法区分的那一部分）。不肯定间距的一半就是差别阈限（符合50%报告差别的操作定义）。主观相等点是不肯定间距的中点。（上限加上下限的一半）
误差及控制（自己画个图很容易判断）（把阈限想成转变的刺激）
期望效应和习惯误差。期望效应是你对刺激的来领抱有期望，过早的就报告转变了。造成递增过程中，阈限偏低。而递减过程中，阈限偏高的现象。
习惯误差：因为被试习惯于实验的刺激而过晚报告实验转变了。造成递增过程中，阈限偏高，递减过程中，阈限偏低的现象。
控制方法是采用ABBA法
2.平均差误法
又叫调整法，在测定差别阈限的实验中，标准刺激由主试呈现，随后被试开始调整比较刺激。在测定绝对阈限时，此时的标准刺激为零。
计算方法：绝对阈限就是被试每次调节结果的算术平均数。差别阈限是用不肯定间距的中点（调整结果的平均数即主观相等点），主观相等点与标准刺激的差就是常误（即估计的差别阈限）
误差及控制
动作误差：由于是被试自己操纵实验仪器来调整比较刺激，会因为各被试所采用的方式不同而产生误差。
时间误差：标准刺激和比较刺激是相继出现的，会造成误差
控制方法：多层次ABBA法，还可以式比较刺激从小到大，从大到小两方面来进行调整。
优点是被试可以保持较高的积极性不觉厌烦，缺点是动作误差和时间误差
3.恒定刺激法及其变式（最准确，应用最广的方法）
主试选取5——7个刺激，在实验中保持恒定不变。每种刺激随机呈现50—200次，测量绝对阈限不需要标准值，测量差别阈限需要一个标准值。最后求出各个刺激变量引起某种刺激反应的次数。最大刺激被感受出来的可能性不低于95%，最小刺激被感受出来的可能性不高于5%，在范围内取距离相等的刺激。
计算方法：
直线内插法（S-P作图、S-Z作图）
平均Z分数法（将P值转换为Z分数，这种方法比直线内插精确）
最小二乘法（建立回归方程，这是最为精确的方法）
斯皮尔曼分配法（用次数分布计算，梯级间距够大时可用）
差别阈限的测量
二类反应：我们取25%和75%处的刺激的差的一半作为差别阈限，即75%差别阈限。
75%差别阈限：当只要求被试进行两类反应时，“大于”标准刺激和“小于”标准刺激的两条直线将相交于50%处，上限与下限值相等，此时则要选取75%处求其上限与下限，这种阈限与操作定义不符，因此常被成为75%差别阈限
将75%重于标准刺激的量（差别阈限的上限）减去25%重于标准刺激的量，也就是75%轻于标准刺激的量（差别阈限的下限）即得75%绝对差别阈限
三类反应：用50%的“+”反应的刺激与50%“-”反应刺激的差的一半作为差别阈限，也就是不肯定间距的一半。
恒定刺激法的变式
1.分组法：即将刺激分组匹配，减少不停调整刺激的操作
2.用对数单位的比较刺激系列：即刺激系列采用对数梯级，此法尤其针对差别阈限较大的领域
3.单一刺激法：即准备一系列刺激，用随机顺序反复呈现，指示被试将其分为一定的类别，省掉了标准刺激，节省时间。
三种方法的比较：最小变化法最符合操作定义，但会出现习惯误差和期望误差。平均差误法被试最为配合，效率最高。但会出现动作误差和时间误差。恒定刺激法实验结果最为可靠，但三类反应时容易受被试态度的影响。
（二）心理量表法
前面通过阈限的测量，知道了多大的刺激才能引起我们的感觉和差别感觉。现在通过这一系列数据就可以建立物理刺激与心理变化之间的函数关系。这就是心理量表法。
1.量表的类型
从心理量表是否等距和有无绝对零点来分，将心理量表分为命名量表，顺序量表，等距量表，比例量表
命名量表：变量分不同的类型（性别，头发卷与否）
顺序量表：没有相等单位和绝对零（只能排名，但不能进行加减乘数，如比赛的名次）
等距量表：有相等单位但没有绝对零（知道彼此间的差距，但没有倍数关系，不能乘除，如比赛到达的时间）
比例量表：既有相等单位也有绝对零（兼有前面所以的特点还有倍数关系，可以乘除。如比赛选手，从起点到终点的时间）【是较理想的量表】
2.感觉比例法与数量估计法（比例量表）
感觉比例法又称分段法，通过物理量所引起的感觉量加倍或减半或按照某一特定的比例变化来建立的物理量与心理量之间的关系。（声音强度与主观响度量表，如定义100db的主观响度是100，通过变化声音物理强度获得主观强度50的物理强度数值，以此类推）
数量估计法是制作感觉比例量表的一种直接方法。先呈现一个标准刺激，并赋予一个主观数值（如100），然后变化物理刺激的强度，让被试自己根据刚才的标准刺激，主观估计该刺激的数值。最后得到一个心理物理量表。【斯蒂文斯定律就是用这个方法的出来的】(朱P76)
3.感觉等距法与差别阈限法（等距量表）
感觉等距法：把两个刺激所引起的感觉的连续体按照主观上相等距离区分开来。【最常见的是二分法】采用二分法制作心理量表时，通常将感觉量作为等距单位，并以等距的感觉量作为纵坐标，以刺激的物理强度为横坐标作图。
差别阈限法：以绝对阈限为起点，以差别感受阈限为最小单位制作的心理量表。每一个最小可觉差在心理上都是相等的，因此可以用最小可觉差作为心里物理量标的等距单位；随着心理感受梯级的提高，为了产生下一个最小可觉差，在刺激方面需要的增加量越来越大【韦伯定律；费希纳定律】
4.对偶比较法与等级排列法（顺序量表）
对偶比较法：是把所有要比较的刺激配成对，然后一对对地呈现，让被试者对于刺激的某一特性进行比较，并做出判断，这种特性的两个刺激中哪一个更为明显或者更喜欢哪个刺激，如果有n个刺激，配成的书面应该是 n（n-1）/2。这个实验会产生顺序误差（或时间误差）和空间误差，因此每对刺激需要比较两次，互换时间顺序或空间位置，因此总的顺序应该是n（n-1）。【七种颜色的喜爱度】（用肯德尔U系数来计算相关，相关越高越一致）
等级排列法：是一种制作顺序量表的直接方法；把许多刺激同时呈现，让许多被试者按照一定标准，把这些刺激排成一个顺序，然后把许多人对同一刺激评定的等级加以平均；（斯皮尔曼等级相关法）
（三）信号检测论（和统计的两类错误结合起来）
还记得前面讲到阈限的测量，要用到不肯定间距么。每个人的不肯定间距都是不一样的，因为每个人都有不同的判断标准，有的人认为明显听得见声音才报告有，有的人隐约听得见一点也报告有，正因为每个人的判断标准不一样，所以求出来的阈限其实是存在误差的。过去费希纳没能解决这个问题，但是随着科技的进步，这个问题也得到解决了，就是信号检测论。
1.信号检测论的由来
电子侦察系统中信号检测的问题与人类感知过程的信号检测联系起来了
最早是在电子通信领域提出来的信号识别理论，主要是依据电子通信理论、统计决策论和概率论。最初运用在雷达（判断敌机）和通信技术（手机降噪技术）。后来心理学受到了，信息论，系统论和控制论，及计算机技术的发展的影响，逐渐使人们对感知觉的认知加工过程有了更深层次的认识。信号检测论主要应用在人们在对刺激做判断时，对不确定的情况做出某种决定时的决策理论。
2.信号检测论的基本原理
信号检测论的数学基础是统计决策理论。在信号检测实验中，被试者对有无信号出现的判定，可以有四种结果：
①击中：当信号出现时（SN），被试报告为“有”，以y/SN表示。我们把这个判定的概率称为击中率，以P（Y/SN）表示。
②虚报：当只有噪音出现时（N），被试报告“有”，以y/N表示。我们把这个判定的概率称为虚概率，以P（Y/N）表示。
③漏报：当有信号出现时，被试报告为“无”，以n/SN表示。把这种判定概率称为漏率，以P（n/SN）表示。
④正确拒绝：当无信号而只有噪音出现时，被试报告为“无”，以n/N表示。我们把这个判定的条件概率称为正确拒绝率，以P（n/N）来表示。

击中率+漏报率=100% 虚报率+正确否定率=100%		反应
击中率+漏报率=100% 虚报率+正确否定率=100%		有	无
输入	有信号（SN）	击中	漏报（β错误）
输入	无信号（N）	虚报（α错误）	正确拒绝

统计学上也就是H0是无信号，H1是是信号。

通常根据被试对信号的击中率和虚报率，来计算被试的判断标准和感受性，进而对被试判断标准的严格性和感受性高低进行分析和判断。

最优决策与判断原则

个体在对信号或噪音进行判断时，一般以判断标准为依据的，这个判断标准是按最有原则确定的，即提高击中率、降低虚报率，也就是要求个体反应快而且准确。人在判断信号标准时，受到如下几个因素的影响：

1、信号和噪音的先验概率

2、个体判定结果的奖惩的严格程度

3、被试的主观目标、信号与噪音的强度差异等

4、速度与准确性权衡

β = P(N)/P(S)× (正确否定的奖励数+虚报的惩罚数) /（击中的奖励数+漏报的惩罚数）

3.辨别力指数d’及接收者操作特征曲线
信号检测论的实验方法可以通过反应倾向性（β），判断标准（C）和感受性（d’）三个指标来反应。
反应倾向性（β）：可以解释被试对刺激进行判断时所持的标准的严格性，一般越大判断越严格（β>1），越小判断越宽松（β<1）
计算方法：β=（信号击中率转换成Z分数再转换成概率密度值除以信号虚报率转换成Z分数再转换成概率密度值）
判断标准（C）：C越大越严格，C越小越宽松
计算方法：C=[(高强度刺激的强度值-低强度刺激的强度值)/被试的感受性] *低强度刺激的正确拒绝率+低强度刺激的强度值
辨别力指数（d’）：与传统心理物理法最大的区别在于能对被试的反应倾向和感受性进行区分。因为被试感受性高时，击中率提高，虚报率下降。辨别力就高，击中率和虚报率接近时，辨别率居中，当被试击中率低，虚报率高时，辨别力就低。
d’=信号击中率转换成Z分数-信号虚报率转换成Z分数
接收者操作特征曲线（ROC曲线）
也叫等感受曲线，以击中率为纵坐标，虚报率为横坐标，就可以得到几个点，连接各点记得到一条曲线，就叫ROC曲线。
4.信号检测论的应用
信号检测论产生100多年来，在理论与应用领域均得到了广泛的应用
1、医学研究与临床诊断中
研究仪器对疾病的判断能力（疾病是信号，正常是噪音）
药物对疾病的作用（疾病是型号，正常是噪音）
避免误诊
2、心理学研究中的应用
感知觉方面：个体视知觉，听觉和各种皮肤知觉等方面的感受性
认知研究：被试对不同特征的刺激的编码与判断
个体反应倾向的评价
内隐记忆、阈下知觉和意识领域的研究
3、在工业心理学中的应用
主要用于研究人们的警戒水平，避免各种操作和作业的失误造成人员和财产的损失。
附加：信号检测论的三种实验方法：有无法、迫选法和评价法（张学民P235）
有无法：事先确定信号（SN）和噪音（N）和先验概，然后以随机方式呈现SN或N让被试判断信号是有还是无。
迫选法：前面和有无法一样，呈现方式不一样，这里是呈现几个刺激（其中有一个是信号），让被试选出信号（被迫选出信号），是最精确的方法，可计算若干击中率和虚报率
评价法：前面和有无法一样，呈现方式也一样，但是反应方式不一样，这里不仅要被试回答是否有信号，而且还要回答是肯定或否定的程度（对信号进行评价）

后记

这一章内容涉及到统计的相关知识，要结合在一起看，事半功倍。信号检测论一定要结合课本上的图，把图弄懂了，也就OK了。看个真题，用极限法测定差别阈限时，在每次渐增系列试验中，其阈限的下限值应取 A. 第一次非正到正的对应值 B．第一次非负到负的对应值 C．最后一次正到非正的对应值 D．最后一次负到非负的对应值
介绍：S.S.Stevens：斯蒂文斯(1906-1973)，美国心理物理学家，以研究声音强度的感觉性而闻名。他提出了新的感觉等级评定方法，这种方法可以用来比较不同感官的感觉强度；还提出了心理物理的幂函数定律，弥补了传统心理物理学的不足。1946年当选为国家科学院院士，1960年获美国心理学会颁发的杰出科学贡献奖。

光爱哈赫 · 发表于 11-8-11 00:59:10

本帖最后由光爱哈赫于 2011-9-1 23:57 编辑

五、主要的心理学实验（一般五个单选和一个多选）【这部分和普心结合在一起看】
（一）听觉实验
1.听觉现象的测定
（1）声音的心理特性
响度：主要反映声音能量的强弱程度，是由声波振幅的大小决定的。主观心理量的单位是宋（Sone），1宋就是1000赫兹，40分贝的纯音。响度的相对量感受的心理物理量称为响度级，单位是（口方）【1000赫兹时等响的分贝数】
声音持续时间越短，阈限值就越高。声音持续时间越越长，阈限值就越低。
年龄越大听觉能力衰退的就越明显
音调：是人贰对音调高低的主观感受。主要取决于声波基频的高低，频率高则音调高，频率低则音调低。音调的主观单位是（口美）【40口方的1000赫兹纯音的音高定义为1000口美】
音色：由声音波形的谐波频谱决定的。
（2）声音的掩蔽
听觉掩蔽效应是指两个声音同时呈现时，一个声音因受到另一个声音的影响而减弱的现象。
纯音掩蔽：掩蔽音强度提高，掩蔽效果随之增加；掩蔽音对于频率相接近声音的影响最大；低频对高频的掩蔽效果大于高频对低频的掩蔽效果。
噪音掩蔽：噪音强度提高时，各种纯音的差别阈限缩小；80分贝时噪音对高频音的掩蔽范围更大。
噪音和纯音对语言的掩蔽：噪音的掩蔽效果比纯音要好
（3）听觉疲劳与适应
听觉疲劳：声音刺激强度大大超过听觉感受器的正常限度，或声音长时间作用于听觉器官而引起的听觉阈限暂时提高的现象。
听觉适应：持续的声音刺激引起听觉感受性下降的过程。
注意区别是前者是具有破坏作用的
2.声音的空间定位实验
（1）声音方向定位线索
对于生源的判断，主要有三种双耳线索：强度差、时间差和相位差
强度差：当双耳离生源的距离不同时就会产生强度上的差异。强度差不仅和方向有关还和波长有关，波长越短（频率越高），强度差越大。和前方60度和120度时，双耳强度差最大。
时间差：是辨别声音方向的重要线索，声波到达双耳的时间不一样，来分析。
相位差：因为声波是由一些列的正压和负压组成的，因此任何瞬间，最大的正压到达双耳的时间不同，就会产生相位差。
（2）听觉空间方向定位的实验方法
音笼实验
让被试戴上眼罩坐在隔音房间的音笼内，音笼内各点到被试头部保持同样距离，随即在各个方位呈现声音让被试报告声源方位，主试来记录报告是否正确。
结果：来自身体两侧的声音方位容易分辨；来自头部中切面上声音容易混淆；如果以两耳连线的中点为顶点做一个圆锥，在圆锥面上的点发出的声音容易混淆
结论：双耳线索在听觉定向中起主要作用
3.语音知觉实验
（1）语音及其声学特点
语音是特殊的复合音。由元音和辅音所构成。元音是一种能连续发出的乐音，辅音主要是是不能连续发出的短促的噪音，元音和辅音合成汉语音节。
（2）语音知觉的声学线索和语音知觉的范畴性
语图仪：能将复合音或语言分析为组成频率，也叫可见言语。
依赖的声学线索包括：1、发音部位不同的辅音 2、发音方式不同的辅音
语音知觉的范畴性指语音知觉可以将语音刺激识别为相对小量的范畴，人们识别语音时对不同范畴的语音很容易识别，表现出非此即彼的特点，而对同一范畴中语音刺激的变化则不容易察觉。
（二）视觉实验
1.基本视觉现象的测定
（1）明适应和暗适应的研究
明适应
从暗处到亮处，眼睛大约经过一分钟就能适应，这是明适应。明适应的感受性不是提高而是降低。
暗适应
从亮处到暗处，需要经过一段时间才逐渐适应，感受性缓慢提高，这是暗适应。
过程：白光照射时，椎体细胞开始适应（约5分钟），然后棒体细胞再适应（约20分钟）
（2）视敏度的测定
视敏度是指分辨物体细节和轮廓的能力。医学中用视力表测定视敏度，它是以视角的倒数来表示的。V（视敏度）=1/α（视角）
（3）闪光临界融合频率的测定（CFF）
闪烁刚刚达到融合时的光刺激的间歇频率称为闪光临界融合频率。
闪光临界融合频率最早是用制作成扇形的圆盘在光源前旋转来测定的。顾名思义叫转盘闪烁法
实验：测试时由被试者控制转速，旋转慢时，可以看到间断的闪光，但是达到一定的速度就可以感觉到连续的光亮，即闪光临界融合频率。
不过那种方法现在不用了，现在用电子仪器。
影响因素：闪光临界融合频率随光相的强度而增高；刺激面积（小面积比大面积低）；椎体细胞比棒体细胞有更高的空间视觉视觉敏度。
2.颜色视觉
（1）视觉的颜色现象实验
颜色是光波作用于人眼产生的视觉经验。视觉感受颜色取决于三个特性：亮度、色调和饱和度。亮度是物体的光线反射系数。越亮越白，越暗越黑。色调是由物体表面反射的光线中什么波长占优势所决定的。饱和度是颜色的纯洁性（没混入什么杂色）
色光混合：加法过程（RGB，红绿蓝称为基色）
遵循：补色律（每一种颜色都有另一种与它相混合而产生白色或灰色）
居间律（混合色圈上两个非互补的颜色产生介于两种颜色之间的中间色）
代替律（不同颜色混合后产生相同的颜色可以彼此互相代替）
颜料混合：减法过程（黄青紫称为基色）
颜色混合的方法：把色轮（不同颜色扇形所组成的圆盘），套在旋转器的轴上，在转速超过闪光临界频率（30秒/转）即产生一种均匀的混合色。
（2）颜色的知觉现象实验
颜色对比：是不同的色光同时作用于视网膜的相邻区域，或者相继作用于视网膜的同一区域。颜色视觉所发生的变化。（红色被黄色所包围，红色会偏向紫色）
颜色适应：研究者把先看到的色光对后看到的色光的影响叫做色适应。朝互补色变化。
实验：以每秒钟一次的黄色小闪光投射在注视点上，观察者注视红色强光视野，待适应后在回头看原来的黄色闪光。开始闪光变成了绿色，然后再逐渐恢复黄色。
麦克洛的视觉适应实验：让眼睛交替适应蓝背景上的水平栅条和橙色背景上的垂直栅条之后，紧接着让被试看无色背景上的同样黑白栅条，被试把水平栅条看成橙色，而把垂直栅条看成蓝色。
（三）知觉实验
1.知觉组织的实验研究
格式塔学派在这方面很有影响力，一般认为维特海默关于四栋现象的研究奠定了格式塔学派的基础。知觉组织是图形和背景方面的具体研究。早期专门从事这个研究的是丹麦心理学家鲁宾，他确定了图形从背景中分出的一些原则，后来由考夫卡发展并提出来一些新的原则。概括下来有以下几种：
接近法则：空间接近的容易合成一组
相似法则：形状方面相同或相似，以及在亮度和色彩方面相同或相似的图形倾向于合成一组构成图形
好图形法则：连续，对称，闭合，共同变化的容易知觉为图形
过去经验和定势：依个人的主观条件而改变（两可图形）
2.知觉恒常性的实验研究
（1）经验和知觉恒常性实验
知觉不单是客观事物的映像，而且还包含着对客体的解释。人的过去经验在知觉中起着重要作用。
1、艾默特定律（知觉到得后像的大小与眼睛和后像所投射的平面之间的距离成正比）
实际物体在网膜上成像的大小（a）=物体的大小（A）／人眼和物体之间的距离（D）
2、布伦斯维克比率（测量恒常性程度）
布伦斯维克比率（百分比）=（知觉到物体的大小R-物体映像大小S）/（实际大小A-物体映像大小S）
3、邵勒斯比率（和布伦斯维克相同，只不过先对每个值取了对数）
（2）大小恒常性实验
不因对象距离的改变，把它知觉为平常大小的倾向，叫做大小恒常性。
霍威和波灵（A.N.Holway E.C.Boring）在 1941 年作了一个大小知觉恒常性的实验，较好地说明了大小恒常性的形成过程，实验是在 L 形走廊中进行，实验者站在走廊的交叉处，在一边走廊内放着标准剌激，在另一边走廊内放着比较剌激，比较剌激是距离被试 1 尺的用幻灯映射在白幕上的亮圆点，圆点的大小可以随意改变。标准剌激亦是用幻灯映在白幕上的亮圆点，圆点的大小永远保持视角 1 度，离被试长度的距离从 10 尺～120 尺可供选择。主试用园点渐增和渐减法改变比较剌激，让被试先注视标准剌激，然后再注视比较剌激，并加以来回比较，直到认为比较剌激和标准剌激大小相等时为止。
结论是深度线索和视觉结构共同对大小恒常性起决定作用
（3）形状恒常性实验
形状恒常性是指从不同角度观看一个熟悉的物体时，虽然这个物体在视网膜上的映像都不同，但是我们我们仍然把它知觉为一个恒常的形状。
莱博维茨研究了年龄与形状恒常性的关系。在他们的所用的实验仪器中，首先呈现给被试一个物体，这是一个可以倾斜成各种角度的图形，实验让被试在四种倾斜角度的比较刺激中选择一个与观察刺激看起来相同的形状。比较刺激是一些列从圆形到逐渐拉长的椭圆形。被试的年龄从4—21岁。
结果是：形状恒常性随年龄呈下降趋势。
3.空间知觉和运动知觉的实验研究
（1）空间知觉实验
空间知觉是在二维的网膜上看到了三维的空间，而且是后天形成的。依赖于各种线索
生理线索：眼睛的调节和双眼视轴的辐合
单眼线索：遮挡，透视，运动视差，高度和纹理梯度
双眼线索：双眼视差
双眼视差的实验
对象的映像一般落在中央窝上，由于两眼间距2.5英寸，同一立体对象得到不完全相同的映像。距离越近差别就越大。从这些差别中我们得到了深度线索，称为立体视觉
惠斯通发明了立体镜。原理是先把每只眼睛的角度所看到的画面制作出来，然后再把两张略有不同的画面分别呈现给左右眼，从而形成一个立体图像。
美国贝尔电话公司的朱里兹曾做了一个实验，成功的将双眼视差与其他深度线索分离开，用计算机制作了一对随机点子图两张图除了右图比左图的中央略向左移动一些外，其余相同。单独呈现时均不产生深度知觉，但是放在立体镜上看时，被试产生深度知觉。
结论：在完全缺乏但眼线索的情况下，双眼视差依然能产生深度知觉
（2）运动知觉实验
真动知觉：我们见到的物体确实在运动，而且其速度达到知觉阈限。
似动：在静止的物体间看到了运动。
普拉提制作了第一个动景盘。就是一个圆盘，上面刻画了连续舞蹈动作的分解图。转动过快时会出现多余动作，转动过慢时，只看得到图案。在时间间隔和空间间距刚刚时，可以看到连续的舞蹈动作。
诱发运动：浮云边上的月亮在动
自主运动：晚上你点一根蜡烛，一直盯着看，你会觉得它动了
运动后效：由于前面知觉到的运动在运动刺激停止之后仍然存在，使人觉得静止的物体仍在运动（瀑布错觉）
4. 知觉与觉察实验
知觉在意识层面以下发生
（1）无觉察知觉的测定
斯特鲁普效应
斯特鲁普1935年报告了一项有趣的实验，实验中呈现的刺激，是用黑色墨水笔，写的黑，房子，白三个字。要求被试快速报告书写每个单词所使用的墨水颜色，结果一致时快，不一致时慢。
斯特鲁普启动实验（马歇尔，1983）
将斯特鲁普的实验改成了启动形式，先是呈现一个启动词（红），马上呈现一个色块（绿色），要求被试报告色块的颜色。一致时报告快，不一致时报告慢。这就是启动效应。这里马歇尔测算了操纵启动词和色块颜色一致的出现概率，获得了觉察和无觉察水平的实验性分离。
遗忘症病人的实验性分离实验
对遗忘症病人和正常人进行四种回忆测验（自由回忆，再认，模糊字辨认，词干补笔）
结果，遗忘症病人的前两项比正常人差，后两项和正常人差不多。
结论：外显记忆与内隐记忆有各自独立的记忆机制
错误再认实验
让被试记忆一些单词，并随后进行再认的测验。在呈现一个词让被试判断是否记忆过之前，闪现一个背景词，用于干扰被试的反应，而背景词与测验词可能是相同或完全不同的，也可能只是非词字母串。背景词闪现时间有两种可能，一种可以让被试觉察，另一种不能。
结果：当呈现时间很短被试不能觉察背景词时，如果背景词与测验词相同，则一个没学过的单词更有可能被给出学过的反应。而如果呈现时间很长以至于能被觉察则会适得其反。
结论：不论有无觉察的知觉都能产生熟悉感，若有觉察则被试将熟悉感完全归结于背景词的闪现，而当没有觉察时被试会错误地将熟悉感归结于之间的记忆。
（2）盲视实验
韦斯克兰茨报告了一例盲视病人，那位病人因病切除了左侧视野对应的视觉皮层，但是他能够定位处在他盲区视野内的物体。虽然他看不见具体的物体，但是能报告它的存在和方位。
这就是无觉察知觉存在的证据。
（其实正常人也有，不信你把眼睛闭上，然后拿样物体放在眼前，看看是不是有感应）
（四）学习实验（教育心理学中全都有）
1.条件性学习实验
经典性条件反射
巴甫洛夫最早提出，并以狗为实验对象，研究铃声与狗的进食反应之间建立的联系，这样经过反复强化，狗在铃声和进食之间逐渐建立起了条件反射。经典性条件反射的获得是需要不断的强化的，如果没有很好和长时间的强化，就会逐渐消退。
操作性条件反射
桑代克的工具性条件反射
通过尝试——错误学习的研究提出的，他采用了迷笼的装置进行实验，将饥饿的猫放在笼子内，如果触碰到开关就有食物出来，猫经过反复尝试逐渐学会了触动某种装置与食物之间的联系。于是会主动地通过触动该装置获得食物，这样就建立起了操作性条件反射
斯金纳的操作性条件反射
斯金纳设计了一种叫做“斯金纳箱”的装置，认为有两种类型的学习（经典性条件反射）和操作性条件反射（反应由个体自发行为得到强化后引起条件反射）
生物反馈训练
基本原理是通过生物反馈训练仪器实现的，具体的训练方法是让个体在学习控制和调节心理、行为、情绪或者生理反应时，及时的给个体生理、心理和情绪指标的反馈。这样经过反复的训练，就会提高个体对自己心理，行为，情绪和生理状态和控制能力。
2.认知性学习实验
先进之处在于研究了刺激——反应的中间认知加工过程，即刺激怎样引起行为反应的内在机制。
柯勒的大猩猩取香蕉实验（顿悟说）
将大猩猩放到一个封闭的屋子里，屋顶挂上香蕉，角落里放着一个箱子，开始大猩猩不知道如何能够到香蕉，过了一会儿，大猩猩突然顿悟了，把箱子挪到香蕉西面，并爬上箱子取到了香蕉。（具有情境性，重复性和迁移的特点）
学习迁移实验
D。Starch，用镜画仪描图实验对动作学习进行了研究，他让被试通过镜子看一个图形，并用铅笔将图形画出来。由于镜中的图形与原画图形比较，上下，左右的空间位置发生了变化，因此，看镜中的图形来描画图形时，描绘线条眼手协调与平时刚好相反。结果表明：优势手的练习对非优势手产生了积极促进作用，这就是学习迁移。
学习迁移是指先学习的知识和技能对新知识和技能的学习与获得的影响，简而言之就是，先学习的对后学习的产生影响。阻碍作用的叫负迁移，积极作用的叫正迁移。
（五）记忆实验
1.感觉记忆的实验
感觉记忆是感觉刺激停止之后所保持的瞬间映像。看电视，动画，可以将相继静止的画面看成运动的图像，人们在看东西时可以不受眨眼和眼动的干扰而保持知觉的连续等。这些都有赖于感觉记忆。
感觉记忆最突出的特征在于，它的容量几乎容纳了所有进入感觉器官的信息，但是保持时间只有0.5—3s。这一特征是由斯柏林的部分报告法实验解释出来的。此前的研究运用整体报告法，认为感觉记忆的容量只有4—5个，而斯柏林认为这个数字被大大低估了，认为也许有很多信息还没来得及报告就已经消退了。于是斯柏林设计了部分报告法实验。
实验过程：用速视器呈现3*4的字母卡片，呈现时间为50ms，与传统房方法不同的是，部分报告法并不要求被试努力报告所有的12个字母，而是在每次刺激呈现完毕后给出随机的声音提示，指定被试报告某一行。
由于被试在观察字母时不知道接下来报告哪一行所以被试还是需要记忆12个字母的，因此可以无偏估计被试对所有12个项目的记忆容量。
结果：达到平均9.1个项目。
结论：感觉记忆的容量远远超过此前整体报告法的结论，鉴于报告过程中仍然占用时间，实际的感觉容量恐怕还要更大。
后来达文同样用部分报告法证明的听觉系统感觉记忆中能保存4.9个项目，也高于全部报告法的成绩
2.短时记忆的实验
短时记忆是指在刺激作用终止后，对信息保持到十几秒到一分钟左右的记忆。（打电话记下的号码，事过之后就记不清）
米勒提出短时记忆的容量为7±2个组块，后来认为将其他可用资源去掉只有2-4个，记忆保持的有效策略是复述，机械复述不能加强记忆，只有精细复述才是短时记忆的有效策略。
斯滕伯格认为短时记忆的提取方式是完全系列扫描。
3.长时记忆的实验
是保持时间在一分钟以上的记忆，编码是来自于短时记忆的内容，并经过进一步的加工而获得的。（某些强烈的刺激除外）
自由回忆法体现系列位置效应（迪斯）
他们以每秒一个的速度向被试者念刺激词，刺激词的长度为10个或32个词不等，获得的结果可画成一条曲线。揭示了近因效应，最后的记忆最好。首因效应，最前面的回忆效果次之。中间部分起伏不大，处于最低部位。
4.工作记忆的实验
工作记忆由三个子系统构成：
中枢执行系统：由注意控制的系统，它与集中注意、计划和行为有密切的关系
Baddeley认为其主要功能包括：提取计划的切换、双重任务的时间共享、选择性地注意某些刺激而忽略另一些刺激、长时记忆信息的暂时兴奋
视觉空间模板：保持和处理视觉的和空间的映像
语音回路：储存和复述以言语为基础的信息
双重作业实验（检验这三种成分在功能上的独立性）
给被试安排两个需要同时执行的任务：一个是涉及中央执行的言语推理任务；另一个运用语音回路部分，即不断地从一数到六。第二次进行实验时，将第二个任务改为大声重复一个六个数字的随机数列任务。比较两次同时完成任务的成绩与单独完成时的差别。
结果：第一次两个任务能很好的同时完成，而第二次的言语推理的成绩则明显低于单独完成时的成绩。
结论：大声读随机数列涉及中枢执行系统，中枢执行系统和语音回路是互相独立的。
5.内隐记忆的实验
内隐记忆是一个相对于独立的记忆系统，被试并非有意识地知道自己拥有这种记忆，但可以再对特定任务的操作中自然表现出来，并且这种任务的操作不依赖于被试对先前经营的有意识恢复。
测量记忆方法有两种，一种是直接测量（回忆和再认），另一种是间接测量。
测量内隐记忆的方法主要有三种：知觉辨认，词干补笔，残词补笔
知觉辨认
在实验中，被试首先学习一系列单字，然后要求他在速示条件下（30ms）辨认学过的单字以及另外一些未学过的单字。通常的结果是，学过的单字辨认率显著高于未学过。因变量是反应时。
模糊字辨认
指在测试时呈现单字的字母不大清楚，要求被试辨认是什么字。
词干补笔
指被试学过一系列单字后，测验时提供单字的头三个字母，让被试补写其余二或三个字母构成一个有意义的单字。例如（juic_填写成juice）
残词补笔
和上面那种一样，只不过把缺一些字母的缺笔字填上适当的字母成为有意义的单字（a_a_in填成assassin）
遗忘症病人的实验（沃林顿和韦斯克朗茨）
实验组为4位遗忘症病人，控制组为16位无脑损伤的其他病人。对被试进行四种记忆测验，即自由回忆、再认、模糊字辨认、词干补笔。
结果：遗忘症病人在前两种外显记忆的测验中成绩明显比控制组差，而后两项内隐记忆的测验成绩却和控制组病人一样好。
结论：外显记忆与内隐记忆是完全不同的记忆过程，有各自独立的记忆机制。
实验性分离的逻辑：如果变量影响被试在一种任务的操作，但不影响另一种任务的操作，或者变量对两种任务的操作的影响有不同方向，这就说明有实验性分离了。
内隐记忆的两种理论解释：
多重记忆系统
其实就是图尔文的SPI理论，认为记忆系统中存在不同的子系统，内隐记忆和外显记忆分别代表了不同的子系统，他们编码串行，并行存储，提取独立。
传输适当认知程序观点
由Roediger等人提出的这种观点与多重记忆理论不同，不认为外显记忆和内隐记忆分别代表着不同的系统。主张记忆系统只有一个，分离现象知识反映了两类测验所要求的认知程序不同而已。包括四种基本假设：
1、测验所要求的认知过程与学习时要求的认知过程一致则成绩好
2、外显记忆与内隐记忆的提取过程不同
3、外线记忆测验是要求概念驱动加工
4、内隐记忆测验严重依赖于学习时与测验时的知觉过程。
6.前瞻记忆实验
根据记忆内容在时间轴上的指向，可以将记忆分为前瞻记忆和回溯记忆。前瞻记忆是对未来要指向的行为的记忆，它反映了将来的情况，使我们记得去做一些事情（例如，每天早上去图书馆看书）回溯记忆是对过去事件的记忆（例如,昨天的菜真难吃）
前瞻记忆包括两种成分，一种是自发启动先前意向的前瞻成分，另一种是对意向内容进行提取回溯成分。也就是说前瞻记忆依赖于回溯记忆。
前瞻记忆的实验研究（爱因斯坦和麦克丹尼尔）
实验开始告诉被试短时记忆（回溯记忆）任务；接着告知被试前瞻记忆的任务，即在完成一些列短时记忆任务时若碰到某个特定单词就按下反应键。短时记忆的任务开始前先要被试完成一些干扰任务，以免前瞻记忆任务保存在工作记忆中，并产生一定程度的遗忘。最后根据按下反应键的正确率评估前瞻记忆和记忆任务的执行情况。
结果表明：前瞻记忆任务比回溯记忆任务处于更高激活水平，更容易记忆和提取。
7.错误记忆实验
按照提取的准确性可以将记忆划分为错误记忆和真是记忆，错误记忆是指错误地声明一个以前未呈现过的词或从未发生过的事曾经出现或发生过。
错误记忆的经典研究范式（DRM范式）【Deese-Roediger-McDermott】
通常会向被试呈现多个学习词表，每个词表由一个目标词，也被称作关键诱饵（如寒冷），和与它相联系的15个学习项目（如冬天、冰雪、霜冻、感冒、发抖等）组成。然后再测试阶段，让被试对呈现过的词进行自由回忆和再认
结果：虚报率（识别错误）接近击中率（识别正确）
结论：错误记忆发生了
理论解释：
内隐激活反应理论（安德伍德）
在DRM范式中，关键项目的激活不是因为其真实的呈现，而是因为词表中相关项目的激活所导致，而且词表项目与关键项目的关联程度越高，错误回忆或再认的次数也就越多。
模糊痕迹理论（布雷纳德和雷纳）
字面及要点的痕迹是再认判断的基础。字面痕迹代表的是物理刺激的表面细节，而要点的痕迹是再认判断的基础。当增加词表项目和关键项目之间的关联以提高关键项目的痕迹要点时，便会增加错误记忆的可能性。
8.定向遗忘实验；朱滢P245
指遗忘有意性和指向性，是一项有效控制意识内容的方法，不同于自然遗忘
Bjork提出了有意遗忘的研究范式，认为有意遗忘的关键在于实验材料呈现完毕后，向被试给出指导语，要求记住一些材料而忘记其他材料。如果确实存在有意遗忘现象，那么要求被试只回忆指定的项目时，只有非常少的指定遗忘的项目掺杂进来；当要求被试回忆所以项目时，指定遗忘的项目被回忆出的可能性将低于指定记忆的项目。
单字方式研究范式
先呈现一个项目，让被试进行编码加工，然后告诉被试这个是需要记忆的还是遗忘的。一定间隔后呈现下一个
字表方式研究范式
将一组材料分出前半部分和后半部分，两部分材料分别呈现。R实验（记忆），对前后部分都进行记忆。F实验（遗忘）对前半部分进行遗忘，对后半部分进行记忆。最后对所有项目进行自由回忆。
Basden和Basden的研究中采用3*2*2的混合设计运用运用上面两种研究方式，自变量材料形式（图片，单词伴随想象和单词不伴随想象）、定向遗忘范式（单字，字表）实验条件（R条件，F条件）前两个自变量组间设计，后两个自变量为组内设计，每一种材料形式实验条件都设一个控制组，控制组被试不接受定向遗忘指导语。
结果：进行多因素方差分析后，指导语要求记住的部分其自由回忆成绩均高于指导语要求遗忘的部分。
9. 提取诱发遗忘实验；朱滢P247
指回忆部分记忆材料时往往会使得相关记忆材料的回忆量降低
提取诱发遗忘范式（Anderson）
1、学习阶段。安排被试学习若干词对，以类别名称—样例（类包含）的形式出现，如fruit-apple、furniture-sofa
2、提取练习。从全部类别中选出一半的类别，再从这些类别所组成的“类别名称—样例”词对中选出一半进行线索提取，形式是呈现“Fruit-ap___”，要求被试根据线索回忆出完整的样例单词。
这样，所有学习材料就被分为三大类：一类是进行过提取练习的词对（如fruit-apple，记为Rp+）；一类是与Rp+同属一类但没有进行过提取练习的词对（如fruit-orange，记为Rp-）；第三类是类别和样例都没有进行提取练习的词对（如furniture-sofa，记为Nrp）
3、干扰阶段
4、回忆测验：给出全部类别名称，要求被试回忆出在学习阶段见到的所有样例单词。
结果：进行过提取练习的词对最好，类别和样例都没有进行提取练习的词对次之，同属一类但没有进行过提取练习的词对最差。
结论：当不同项目被一个线索同时激活时，为了成功提取目标项，我们主动抑制了分心项目。
记忆过程的抑制对人的作用：1、防止过时信息和痛苦经历的侵入2、汶川地震创伤的消除
（六）情绪实验
1.情绪的生理指标测量
皮肤电反应
自主神经活动引起的皮肤内血管的收缩或舒张，以及交感神经节前纤维支配的汗腺活动变化，皮肤电反应的是汗腺分泌反应，而不同与出汗量。（愉快与不愉快能引起不同的皮肤电）
受到觉醒水平，温度，活动的影响
循环系统的指标
脉搏（紧张，心跳加速），血管容积（害羞时脸红），血压（愤怒血压上升）
呼吸
（剧痛呼吸会加深加快，惊恐时呼吸中断，狂喜时呼吸痉挛）
语图分析法
借助于语图仪中的声音应激分析器，可用于测谎。由于人说话时发音的颤动不能人为控制，所以描述准确，可靠。
脑电波
在强烈情绪下，人的脑电波活动与正常状态下脑电波活动不同。此时α波小时。
在焦虑状态下枕叶的α波消失。
可用于老年痴呆症等精神疾病的诊断。
生化指标
紧张时肾上腺素分泌增加
2.面部表情的测量（看过lie to me的同学应该喜欢）
表情是情绪的外部表现，是传递具体信息的外显行为。测量方法必须严格遵守解剖学基础。
面部表情的直线量表（费勒基）
用伍德沃斯经过100名被试判断86张照片的成绩制成的单维直线量表（愉快——不愉快）
面部表情的圆形量表（伍德沃斯的助手施洛斯贝格）
发展为二维量表（愉快——不愉快；注意——拒绝）
面部表情的三维模式图（施洛斯贝格）
（愉快——不愉快；注意——拒绝；睡眠——紧张）
表情判断的早期方法
可以概括为：由未经训练的被试对情绪的面部表情进行整体判断
面部表情的现代测量技术
面部动作编码系统（艾克曼）
实际测量时，它以面容活动为单位，称为活动单位。一个单一的活动单位可以包括一块或几块肌肉组织。由于多数面容变化是几个活动单位叠加发生的，从而又可以把那些可以明显辨认的叠加的活动单位列成复合活动单位，面部动作编码系统共列出了二十八种单一活动单位。是迄今为止最为详尽，最为精细的面部运动测量技术。
两个测量系统（伊扎德）
前面讲到得系统，只是利用解剖学对面部各部位进行测量，还不是对情绪的测量。为了对情绪进行解释，伊扎德等人提出了两个互为补充的系统，最大限度辨别面部肌肉运动编码系统：以面部肌肉运动为单位，是用以测量区域性面部肌肉运动的精确图式。
表情辨别整体判断系统提供关于面部表情模式的总概貌。
3. 情绪的主观体验测量
形容词检表（心境形容词检表和情绪-心境查量表）
形容词检表是选用一系列描述情绪的形容词，如镇静的、神经质、害怕的、忧郁的等等并列为检表。被试通过内省，从检表中选出符合自身当时情绪状态的词汇用来确认自身的情绪体验。
维度等级量表（伊扎德）
是一个四维量表，有愉快度，紧张度，冲动度，确信度。量表还应包括情绪体验，认知和行为。因此实际上还有三个分量表。每个分量表由四维组成。
你感受到愉快吗？情绪体验分量表愉快维度
你认识到自己的紧张吗？认知分量表紧张维度
你有冲动的行为吗？行为量表冲动维
分化情绪量表（伊扎德）
要求被试描述某一情绪发生的具体情境，填写分化情绪量表和维度等级量表。得出5个强度计分。两个量表同时使用。（例如，让被试想起引起惊奇情绪的情境，用维度等级量表测量其惊奇情绪的维度。）
（七）注意实验
1.过滤器模型以及双耳分听实验
该模型认为，注意瓶颈位于信息加工的早期阶段，以避免中枢系统超载。在这个瓶颈中作为过滤器的注意对进入的信息加以调节，选择一些信息进入高级分析阶段，其余信息则可能暂存于记忆中，然后迅速衰退。通过过滤器并进入高级分析水平的信息再接受进一步的加工，从而被识别和存储。这种过滤器类似于高保真听力设备中的交叉滤波器。它是按“全或无”方式进行工作的，即接通一个通道的同时关闭所有其他通道。后来布罗德本特又强调期待的作用，凡为人所期待的信息容易受到注意。另外，他还进一步指出，该过滤器位于语义分析（知觉）之前。故而布罗德本特的过滤器模型被称为早期选择模型。
双耳分听实验（布罗德本特）
双耳分听就是指让被试的双耳同时分别听到两个分离的相互独立的声音，通常用立体声耳机来实现。在布罗德本特的一个实验中，被试两耳同时听到一定的刺激，例如，左耳—6、2、7，右耳—4、9、3，“6和4”、“2和9”、“7和3”是分别同时出现的。数字的呈现速度为2个／秒。要求被试或是以耳朵为单位分别再现，或是以双耳同时接收的信息顺序成对再现，或是随意再现。
结果发现，分别再现的正确率为65%，成对再现的正确率为20%；而随意再现时则被试多采取分别再现。
结论：布罗德本特认为这样的实验结果支持了早期选择模型：每只耳朵都可以看成一个通道，每一个通道的信息都是单独储存的，过滤器允许每个通道的信息单独通过，所以以耳朵为单位的分别再现被优先选择，且其效果也优于通道之间不停转换的成对再现的效果。
双耳分听实验（格雷）
牛津大学的两名学生格雷和韦德伯恩发现，当在双耳分听实验中安排一些有意义的材料时，例如，左耳—OB、2、TIVE，DEAR、5、JANE；右耳—6、JEC、9，3、AUNT、4，
结果：被试不是按耳朵为单位再现，而多是按意义再现，即从两只耳朵分别接收的音节组成词（objective），或由单词组成一个短语（dear aunt Jane）。
结论，过滤器可能通过不止一个通道的信息。由于早期选择模型无法解释此类实验结果，因此有关注意机制的理论不久就被更新了：在新的理论中，尽管注意的功能仍然被比作信息加工系统中的瓶颈，但该瓶颈的位置后移了。
中期选择模型（衰减模型）
特雷斯曼对双耳分听技术进行改进，设计了追随耳实验，并提出了注意的衰减模型。所谓追随耳实验，其实就是要求被试在双耳分听过程中始终复述某一个耳朵听到的信息，并且忽略所有来自另一耳朵的信息。这两个耳朵被分别称为“追随耳”和“非追随耳”。按照早期选择模型，非追随耳信息应当完全被忽略，不可能得到高级的语义加工。但是追随实验的结果却显示：非追随耳的信息也可以得到高级分析。由此特雷斯曼认为，过滤器并非依“全或无”的原则工作，而是按衰减方式进行的；不是只允许一个通道（追随耳）的信息通过，而是既允许追随耳的信息通过，也允许非追随耳的信息通过，只是非追随耳的信号受到衰减，强度减弱了。但若这些减弱的非追随耳信号具有特别的意义（比如自己的名字），具有较低的阈值，那么仍可得到高级加工而被最终识别。特雷斯曼与布罗德本特不同，她重视中枢系统的二次选择功能。
双耳分听实验（特雷斯曼）
实验中，当她给被试两耳呈现的材料同为英文小说时，非追随耳的信息可以得到一定的识别；但当给非追随耳呈现的信息为生物化学材料时，则难以识别。前者是因为追随耳信号所激活的项目使非追随耳的相同或相近项目的阈限降低了。在英法双语被试的实验中，她再次证明了这个问题。因为法语差者中只有2%的被试知道非追随耳中的法语信息，而法语好者则为55%。
总之，特雷斯曼的模型强调：（1）信息是大量输入的，这与早期选择模型一致；（2）加工过程是“衰减”式的；（3）过滤器的位置有两个，一为语义分析之前的外周过滤器，一为语义分析之后的中枢过滤器。可见，特雷斯曼强调了中枢过滤器的作用，因而又被称为中期选择模型。
晚期选择模型
由多伊奇等首先提出的。他们认为，多个输入通道的信息均可进入高级分析水平，得到全部的知觉加工。信息加工瓶颈位于知觉和工作记忆之间。因此，注意不在于选择知觉刺激，而在于选择对刺激的反应。他们设想，中枢的分析结构可以识别一切输入，但输出是按其重要性来安排的，只对重要的刺激反应，而对不重要的刺激则不反应。此外，这种重要性的安排有赖于长期的倾向、上下文和指示语等，并且其衡量标准还随新刺激的不断输入而变动。后来，诺曼又进一步对此模型进行了修订。他认为，一些东西之所以未被注意、未被说出，是因为个体一味地注意和反应其他东西，从而使它们在识别之外未得到继续加工（如从记忆中提取等）的缘故。晚期选择模型由于强调反应的选择，因而又被称为反应选择模型
双耳分听（哈德威克）
哈德威克的实验中，让被试同时注意双耳，当从右耳或左耳听到随机呈现的靶子词时，要分别作出反应。结果两耳对靶子词的反应率都超过50%，达到59%～68%，且两耳差异不显著。无论是单耳还是双耳都能识别输入的信息，只要所处的条件相同，就能有相同的识别率。
2.注意资源有限理论及其实验
由卡内曼最初提出的。他把注意看做心理资源，认为人的心理资源总量是有限的，注意的有限性不是过滤器作用的结果，而是受到了从事操作的有限心理资源的限制。注意的功能就是资源分配（因此该理论也称为资源分配理论）。如果一个任务没有用尽所有的资源，那么注意可以同时指向另外的任务。
后来，诺曼和博布罗又通过对资源限制的区分进一步精确化了心理资源的概念。他们提出了“材料限制”和“资源限制”的划分。所谓材料限制是指其作业受到任务的低劣质量或不适宜的记忆信息的限制，因而即使分配到较多的资源也不能改善其作业水平。例如，在强噪音背景下觉察某一特定声音，如果该声音过弱，那么即使分配较多的资源，也是难以觉察的。而资源限制是指其作业受到所分配资源的限制，一旦得到较多的资源，这种过程便能顺利进行。因此，两个同时进行的作业，若对资源的总需求量超过中枢能量，就会发生干扰。这时的两个作业水平受互补原则决定，即一个作业应用的资源增加多少就会使另一个作业可得的资源减少多少
双耳分听实验（约翰逊和海因茨）
实验中，他们要求被试追随靶子词（不固定在某一只耳朵中出现）。自变量为靶子词与非靶子词之间的感觉可辨度（高/低）和语义可辨度（高/低）。因变量为被试对非靶子词的回忆情况。结果发现，不管语义可辨度的高低，非靶子词回忆的数量，在低感觉可辨度下的多于高感觉可辨度下的。其原因在于，低感觉可辨度下，非靶子词应用了较多的资源，进行了较深的加工。
3.双加工理论及其实验
在认知资源理论的基础上，谢夫林等提出了双加工理论，该理论认为，人类的信息加工分为自动化加工和有意识的加工两种情况。其中自动化加工具有无意识的特点因此只要很少的认知资源就可以完成认知任务，受认知资源的限制程度低，很大程度上是自动化完成的，加工效率高。而有意识的注意加工则需要更多的注意资源，并需要不断经过的熟练才能达到自动化过程。
记忆扫描实验（谢夫林）
首先让被试识记1—4个项目，然后再通过呈现1—4个再认项目。识记项目和再认项目分别有两种实验条件：不同范畴条件（其中识记项目均为字母，而再认项目只有一个字母，其余项目均为数字或再认项目均为数字，实验中被试只需从数字或字母中发现是否有字母或数字）相同范畴条件（其中识记项目均为字母或均为数字，再认项目中也全部为字母或数字，在再认项目中可能包含识记项目，也可能不包含识记项目，实验中被试需要从字母或数字中发现是否有记过的字母或数字呈现）。要求被试按键反应Yes或No。
结果：相同范畴下随识记项目的增多，反应正确率下降，反应速度变慢。不同范畴下识别随识别项目增多，反应正确率和反应速度都很好。
结论：自动化加工不需要占用认知资源
4.注意的促进和抑制及其正负启动实验
启动效应是指先前的加工活动对随后的加工活动所起的促进或抑制作用。
起促进作用的启动效应被称为正启动效应。
起抑制作用的启动效应称为负启动效应。
启动实验由启动显示与探测显示组成，启动显示在先，探测显示在后。每种显示都包含目标（T）和分心物（D）。在实验中，要求被试只对两个显示中的目标（T0、T1）反应，而不理会分心物（D0、D1）。若启动显示中的目标（ T0 ）与探测显示（T1）中的目标相同，称为目标重复启动（TT），它往往产生正启动效应。即对T1的的反应时间比控制条件下短。所谓控制条件是指两种显示中的目标物和分心物是无关的。注意的负启动效应
正启动效应
词汇判定实验（Meyer）。
Meyer向被试呈现一串字母，要求被试判定字母串是否是英语单词。字母串是成对地呈现的。被试对第一个字母串作反应后，立即呈现第二个字母串。所采用的字母串是各式各样的，其中有英语单词，也有无意义字母的组合；成对呈现的两个单词之间的意义联系也不同，其中有语义联系的如nurse—doctor”，也有无语义联系的如“bread—doctor”。结果发现，在“护士—医生”这一字母串判定“医生”是单词的反应时间要比在“面包—医生”这一对字母串中判定“医生”为单词的反应时短。
结论：探测显示中的目标与启动显示中的目标有某种联系，如语义等联系，那么也会出现类似的正启动效应
扩散激活理论对启动效应的解释
在启动显示中目标被激活了，那么在重复启动中，该目标反应阈限已降低，所以反应时缩短。在有意义联系的词之间，一词被激活，这种激活会使与之有联系的词也从静止向激活状态转化，从而降低了激活的反应阈限，因而反应时缩短，这种现象被称为扩散激活
负启动效应
Stroop色词任务的变式实验
Neill使用Stroop色词任务的变式进行实验，首次关注无关信息一旦完成选择性注意过程后命运如何的问题。Neill对两种条件下的实验进行了比较。一种条件下，当前刺激颜色与先前刺激词并不匹配，但是，另一种条件下，二者是匹配的。例如，先向被试呈现用红色墨水印刷的GREEN（绿），紧接着再向被试呈现用绿色墨水印刷的BLUE（蓝）。Neill要求被试说出Stroop 刺激的颜色。他发现，在后一种条件的实验中，被试的颜色命名完成得特别困难。Neill认为一定是起干扰作用的Stroop刺激词（如GREEN一词）受到了抑制。其逻辑是，如果被抑制的词后来变得与任务有关，例如后来的刺激是用绿色墨水印刷的，那么，被试对后来的刺激的颜色命名要相对困难。Tipper将上面这种现象命名为负启动。
这种加工表现为分心物的内部表征受到抑制，亦即当启动显示中的分心物作为随后的探测显示中的目标时，被试对其的反应时间延长。这种现象称为负启动效应，也称为分心物抑制效应。
负启动效应的两种理论：
一种观点认为选择的主要作用是使专注信息得到进一步加工即目标激活，被忽略的信息可能很快地衰退。
另一观点认为，选择具有双重机制，即专注信息的进一步加工和被忽略信息的积极抑制相结合即目标激活和分心物抑制。
5.注意的返回抑制实验（关于这个内容找了很多书上都没提到，估计是选自李晓轩王玉改《注意中的返回抑制》这篇论文）
返回抑制是指在空间某一位置呈现一线索，一定时间之后（一般为自线索呈现后约300毫秒），对再次出现在该线索化位置刺激的反应比出现在非线索化位置刺激的反应慢，这与线索在出现初期（约100毫秒以内）引起的易化作用正好相反。就是是指对原先注意过的物体或位置进行反应时所表现出的滞后现象。
典型的返回抑制研究范式是即在屏幕的中央出现三个大小相同的小框，中间小框有注意点，要求被试始终盯住该注意点；之后，外侧某一小框迅速呈现闪烁以引起注意，此即是对外侧小框的线索化；然后，以同样的方式对中间的小框线索化，使注意脱离外侧小框而被吸引到中间小框；最后，靶子出现在某个外侧小框，并要求被试迅速作出反应。称为线索—靶子范式
6.刺激反应一致性理论及其冲突效应实验
在特定的环境下根据任务需要，对相应的感知觉刺激进行加工，并选择恰当的反应表征并加以执行是人类高级认知功能的一项重要内容。研究者很早就发现在空间探测和辨别任务中，当目标刺激呈现的空间位置与正确的反应按键位置一致时，行为反应时明显小于他们不一致情况。这种空间维度的刺激-反应的同侧易化现象就是刺激-反应一致性效应。研究发现，反应选择可能会在上述的各个阶段受到冲突的影响，包括任务空间反应规则（任务直接相关维度）的影响，刺激的任务无关维度信息的影响，以及刺激-反应的任务相关维度的匹配规则影响。
对于冲突控制的传统研究而言 , 经典研究范式主要有四种: Stroop 干扰任务(书写颜色与词义信息间的冲突) , Simon任务(目标位置和反应方位间的冲突) , Flanker 任务(侧抑制效应)以及反眼动任务等。
（八）常用心理实验技术
1.眼动技术
眼动的基本形式包括注视、跳动和追随运动
研究领域：阅读和语言、问题解决概述
通过分析注视位置、次数、时间、回扫、眼跳等眼动指标来研究各个水平的阅读问题。
开窗法:设置有界限的窗口让被试阅读，可度量阅读广度，都涉及到注视跟随技术。
移动窗口法：跟随注视点的窗口不断移动，其余部分被遮蔽。即时加工、边界效应；眼音距测量。
移动遮蔽法：刚好相反，探索阅读策略。阅读知觉广度的不对称性。
阅读中的主要眼动模式：注视、眼跳、回扫、回视。
2.事件相关电位技术（ERP）
ERP技术是一种从人类被试头皮上无损记录脑电位来提取人类认知相关信号的功能性认知成像技术.ERP信号具有很高的时间分辨率,因而使ERP技术在众多认知研究获得广泛的应用。
优缺点：
1，无创性。对于心理过程的内隐性与连续测量能力。
2，可以用于确定哪个或是哪些处理阶段受到特定实验操作的影响。
3，在没有行为反应的情况下，提供一种关于刺激处理的实时测量，对不要求反应的忽略刺激进行“内隐”监测。
4，ERPs成分的功能意义实质上远没有行为反应的功能意义那样清楚。
5，大量的实验次数，才能累加出来太小的ERPs。50~100甚至1000次。
6，具有时间分辨率高（1ms），但空间分辨率基本不确定。
7，费用低，操作简单易学。
8，适应于探索受某种操作影响的某一神经认知过程。
3.功能性磁共振成像技术（fMRI）
MRI技术用于观察某些与学习记忆相关脑区的结构变化，是因为MRI能够检测出血红氧合水平的微小电磁差异，即利用各个脑区静脉内血红蛋白氧合水平的差异，因之各个脑区电磁水平不同，从而显示某种精神活动条件下，兴奋脑区的网络影象。该技术的优点是影象逼真而可靠，空间分辨力比PET还要高，其空间分辨力能够分辨间隔2毫米以下的活性神经元的位置；时间分辨力也相当高。在廿世纪90年代里获得迅速改进的功能性磁共振成像技术(fMRI)已成为脑成像的常规工艺。

附：主要的心理学实验仪器（这部分来源于小白修订MJ大纲解析，总结的很好！）
脑成像技术
（1）正电子发射层描记术（PET）
PET技术是基于由放射性核素发射的正电子与负电子碰撞而产生的一对高能光子的测量和定位，由于这一对光子的运动方向相反，可用至于头两侧的探测器探测。因此实验时需要给被试注入含有特定放射性元素标记的化合物。
优：可用于测查脑的深层部位；缺：①成像时间较长，时间分辨率差；②有创伤性；③造价很高
（2）脑磁图（MEG）
理论上讲，电场的变化必定会引起磁场的变化，因此可以通过测量大脑磁场的变化来获得脑机能运动的相关数据。但脑磁场的信号很弱，因此只有在超导量子干扰技术的辅助下才可以记录到MEG。目前世界上已有成熟的商品，只是价格不菲。从技术上看MEG也可用于认知的事件关联研究，且在三维空间定位方面要大大优于ERP法。
优：时间、空间分辨率都很高；缺：造价很高，且只对某些流向的兴奋源敏感。
常用仪器
（1）长度与面积估计器：用以制作长度和面积的心理比例量表
（2）闪光融合频率仪
（3）变速色轮（混色轮）：用于颜色混合、彩色对比、亮度匹配、螺旋后效、马赫带、似动、闪光融合频率的研究
（4）明度辨别仪：用于研究不同颜色明暗辨别能力，人眼的明度差别阈限
（5）视野计：测定眼睛在不动的瞬间所能看到的空间范围
（6）暗适应仪（夜间视力检查仪）：研究暗适应能力，视网膜光感绝对阈限的测定，眩光照眼后暗适应的回复时间等
（7）照度计与亮度计：是测定光强度的物理测量仪器，常用来调节实验环境
（8）大小恒常性估计器：用以测定大小恒常性、制作面积的心理比例量表
（9）缪勒错觉仪
（10）深度知觉仪
（11）棒框仪：测量场依存与场独立（09单）
（12）动景盘与似动仪：研究似动现象
（13）声级计：用来分析测量环境噪声，也可测定声源的声压和声级，分析隔音技术，进行听力校准等
（14）示波器
（15）听觉实验仪、听力计：用于提供不同频率、不同强度的声音刺激，其中听力计更精确
（16）音笼：测定人对声音定位能力的仪器
（17）反应时测定仪（计时器）用于反应时或以反应时为指标的其他研究
（18）电子节拍器：用于测试对不同节拍反应的阈值，节拍辨别的准确性等，也可用于计时/控制仪器
（19）动作稳定测量器（九孔仪）：测量简单动作的稳定性，以及检验情感对动作稳定的影响（10单）
（20）手指灵活性测试仪：测试指尖、手、臂的灵活性，以及手眼的协调性
（21）动觉方位辨别仪：测量动觉感受性的差异
（22）敲击板：测量手的敲击速度，了解个人的坚持性和疲劳速度，可作为一种能力测验使用
（23）两点阈量规：测量肤觉感受性
（24）数字镜画仪：用于练习效果的研究，动作技能的迁移研究
（25）双手调节器：供注意分配、技能练习实验及相关选拔测验用
（26）注意集中能力测定仪（追踪仪）
（27）划销测验仪（注意稳定性测试仪）用以测定注意稳定性、灵活性
（28）注意分配实验仪：可用于注意的分配性研究，也可研究动作、学习的进程和疲劳现象
（29）速示器：用于知觉、记忆、学习等方面研究
（30）记忆仪：用于研究记忆，以固定间歇不断地向被试呈现材料
（31）触棒迷宫：用于研究运动学习、动作技能的迁移等
（32）学习迁移广度仪：用于测定数字的记忆广度和进行学习迁移实验
（33）时间知觉测量仪：用于检查各种因素对时间知觉的影响
（34）辨别反应时测验：用于研究不连续动作技能
（35）旋转追踪测验：用于研究连续动作技能
（36）镜画实验：用于研究负迁移。

后记

《实验心理学》可以算是最难整理的一章，并不是因为它的内容多，而是因为它的内容杂，就大纲而言，几乎没有一两本书能涵盖大纲中的内容。甚至有些内容教材中都没有提到，而是从某些心理学论文中选取的。有人说得人心者得天下，我认为得实验心理学者得心理学的天下。所以学好这一门至关重要。实验心理学除了掌握最基本的实验方法外，就是经典的实验心理学范式了，这些范式务必记牢，考试的时候绝对会用到的。
另外，对于ERP和fMRI的加入，也彰显了实验心理学开始注重前沿的科学发展，所以不要只顾到一本书，也要了解下最新的心理学发展趋势。最后，有人问道时间分辨率和空间分辨率是什么，我认为空间分辨率就是你拍照后照片有多高的像素；而时间分辨率就是照相机连拍的时候的时间间隔。

介绍
杨治良，男，江苏江阴人，1938年10月生，华东师范大学教育科学学院心理学系终身教授、博士生导师，中共党员。1961年，毕业于北京大学哲学系心理学专业。曾任华东师范大学心理系副主任、心理系主任，现任国务院学位委员会心理学科评议组成员、中国心理学会常务理事、中国心理学会《心理科学》杂志主编、上海市心理学会理事长、华东师范大学学位委员会委员、华东师范大学心理学博士后流动站负责人、国家重点学科基础心理学学科带头人。杨治良一直从事实验心理学、认知心理学的研究与教学工作。几十年来，他一共主持了十二项包括自然科学基金、教育部教育科学“九五”规划重点项目在内的国家级科研项目，发表论文几十篇，出版学术专著多部。由他主编的教材《实验心理学》，系统全面地概述了实验心理学的理论和研究框架，为我国心理学学科的建设奠定了基础。
朱滢，男，广西柳州人。1939年1月2日生.现为北京大学心理系教授、博士生导师。1957年在北京大学哲学系心理专业学校；1962年毕业成为研究生；1966年研究生毕业并留校；1983--1984年在美国密西根大学进修；1988--1996年任北京大学心理系主任；1993年至今任中国心理学会常务理事；1995--2000年任国家教育委员会心理教授指导委员会主任；2000--2007年任国务院学位委员会心理学科评议组成员。2000年前从事记忆研究；发表文章50余篇。2000年至今开展自我的社会认知神经科学研究，发表文章20余篇，关于自我的研究朱滢将文化、自我与大脑三者的相互联系作为中心点开展。

光爱哈赫 · 发表于 11-8-11 00:59:15

本帖最后由光爱哈赫于 2011-9-4 23:53 编辑

注意：由于公式都是以图片形式保存的，所以这里显示不出来，Word和PDF版本是带全部公式的

《心理统计学》

前言

这门课占35分，结构一般是（9个单选+1个多选+1个简答或综合），不过每年可能不一样，分值权重感觉比测量要大一些，特别是大题，不过大致差不多。
心理统计学在心理学中的重要性不言而喻，如果说实验心理学的建立让心理学成为一门独立的科学，那么心理统计学可谓是最大的功臣。没有心理统计学提供强有力的科学数据。心理学的理论就仅仅是个理论，上不了台面。世界上只有一个东西不会撒谎，那就是数据，一个理论如果没有强大的数据支持，那么这个理论的可信度也就大打折扣了。所以心理统计学就承担了这么一个工作，为你的理论在数学上提供可靠的科学依据。
总所周知，高等数学是心理学本科的必修课之一，很多人认为心理统计学难学和数学不好有关，虽说心理统计和数学都是和数字打交道。不过，他们确真没多大联系。打个比方，学心理统计学就好比是学电脑，会使用就行（office的使用）。学数学就好比学编程，掌握程序的来龙去脉（编写office的程序）。心理统计学对于心理学是一种工具。学好这个是为了将来运用SPSS这些统计软件做准备的。
（当然，如果你追求更高层次的数理统计，硬要搞清楚这些公式怎么来的，也好，不过最好等考上了，再慢慢研究也不迟）
本宝典也好比是心理统计学这个工具的使用手册，不过还需两件神器：智力正常的人脑+按键正常的计算器（带统计功能）
这部分参考书目如下：
《心理学专业基础综合考试大纲》（2011年版）教育部考试中心
《心理学专业基础综合考试大纲解析》（2011年版）高教
《现代心理与教育统计学》张厚粲徐建平北师大出版社（2004年版）
《心理与教育统计学》邵志芳上海科学普及出版社（2004年版）
《心理学统考重难点手册》 2011第三版
《MJ心理大纲详解》（小白修订版）白云子
《心理统计常用公式总结》

开始

一、描述统计

所谓描述描述统计，就是描述一组数据的全貌。（集中趋势，离中趋势，相关关系），也是推论统计的基础。

（一）统计图表

我们随便拿来一片实证研究的论文，里面都有统计图和统计表。可以把你整理的数据以最直观的方式呈现给读者，让读者一目了然。

在做统计图和统计表之前要先对你搜集来的资料进行初步的整理，对数据进行排序和统计分组

1、统计图

统计图一般采用直角坐标系，通常横轴表示自变量（类别），称为分类轴。纵轴表示因变量（次数），称为数值轴。

统计图一般由下面几个部分组成：（这个书上有图，一看便知）张奶奶P29

图号及图题；图目；图尺；图形；图例；图注

次数分布图
根据次数分布表绘制的图，更为直观。
直方图
矩形面积表示连续性随机变量次数分布的图性。没画矩形叫组织图。
次数多边形图
是一种表示连续性随机变量次数分布的线形图

累加次数分布图

根据累加次数分布表绘制而成，分为累加直方图和累加曲线图

2、统计表

统计表一般由下面几个部分组成：（这个书上有图，一看便知）张奶奶P28

表号；标目；数字；表注

次数分布表
简单次数分布表（数据个数和分布范围比较小的时候用）
依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。
分组次数分布表（数据个数和分布范围比较大的时候用）
数据量很大时，应该把所有的数据先划分在若干区间，然后按其数值大小划分到相应区域的组别内，分别统计各个组别中包括的数据的个数，再用列表的形式呈现出来。
编制步骤：
1、求全距，就是最大数和最小数之间的差距。
2、决定组距和组数，
组距（i），任意一组的起点和终点的距离，根据全距来定。全距大，组距也可以大一些，一般取2、3、4、5、10、20等。便于计算。如果先确定了组数，那么全距除以组数后取整也可以。
组数（K），分组数目，要根据数目的多少来确定，如果数据在100个以上，一般分10—20组。
分组最优关系公式（总体正态）： （N为数据个数，K为近似取整）
3、列出分组区间
就是组限，一组起点和终点之间的距离。组限有表述上下限（10—19；20—29）和精确上下限（9.5—19.499；19.5—29.499），一般书写时按照表述上下限，计算和分组时按照精确上下限。
4、登记次数（将数据等级到相应的组别内）
5、计算次数（计算各组次数和总次数并核对，然后写出组中值、次数、频数和百分次数）
相对次数分布表：用频数比率或百分数来表示次数
累加次数分布表：把各组的次数由下而上，或由上而下加在一起。最后一组的累加次数等于总次数。
双列次数分布表：对有联系的两列变量用同一个表表示其次数分布。
不等距次数分布表：工资级别，年龄分组
其它的统计图表
简单表
只列出统计指标名称
分组表
只有一个分类标志的统计表也叫单向表
复合表
分组标志有两个以上
条形图
主要用于表示离散型数据
圆形图
也叫饼图，用于表示间断性资料
线形图
更多用于表示连续性资料
（二）集中量数
用于描述数据分布中大量数据朝某个方向集中的程度
1、算术平均数

平均数的特点：
在一组数据中每个变量与平均数之差（离均差）的总和等于0

在一组数据中，每一个数都加上一个常数C，则所得的平均数为原来的平均数加常数C

在一组数据中，每一个数都乘以一个常数C，所得的平均数为原来的平均数乘以常数C

平均数的意义：
算术平均数是应用最普遍的集中量数，是“真值”最佳的估计值。所谓真值就是观测事物真值的值。当观测次数趋于无穷时，算术平均数趋于真值。
平均数的优缺点：
优点：
1、反应灵敏（任何一个值变动，都能反应出来）
2、计算严密（有确定的公式）
3、计算简单（简单的四则运算）
4、简明易解（概念容易理解）
5、较少受抽样变动的影响（观测样本的大小或个体大小的变化，对计算的影响很小）
缺点：
1、易受极端数据的影响（正因为反应灵敏，所以受极端数据影响大，可以通过剔除极端值的方法解决）
2、若出现模糊不清的数据时，无法计算平均数（如果缺少数据，一般采用中数代替）
书写时，注意比原来测量的数据多一位数字
计算和运用平均数的原则
同质性原则（不同质的数据不能算）
平均数与个体数值相结合的原则（不要忘记结合个体数值给予参考）
平均数与标准差、方差相结合原则（标准差小，平均数的代表性好）
2、中数
中数符号是以Md或Mdn，表示按顺序排列在一起的一组数据中居于中间位置的数，在这组数据中，有一半数据比它大，一半数据比它小。
计算方法：

一组数据中有重复数值的情况（算法不一样）【我用SPSS算过，其实还是直接算的】
重复数列不在中间时，没关系
重复的数列在中间时，有点难算，我总结了一种方法，保证做对。
无论是奇数偶数都适合，叫画线法，首先将数列排序，然后再中数的位置画一条线，奇数的会穿过数字，偶数的会划在两个数字之间，然后对这个数取精确上下限。标出下限所在的位置和上限所在的位置。最后中数就是精确下限加上这条线分隔的位置的比例（画线位置占了全距的几分之几）。就可以了。
(偶数)举个例子：11,11,11,11,13!13,13,17,17,18
线划在感叹号那，13的精确下限是12.5，叹号的位置是第一个三分之一处，所以就是12.5+0.33=12.83
中数的优缺点：
优点：
计算简单，容易理解
中数概念简单明白
缺点：
不是每个数据都参与计算，不能反映全体
反应不够灵敏，极端值的变化对中数不产生影响
中数受抽样影响较大，不如平均数稳定
中数不能进行代数运算
使用条件：
出现极端数据
分布两端数据或个别数据不清楚
需要快速估计时
3、众数
出现次数最多的那个数。掩盖的信息比揭示的多，一般应用不广泛。
计算方法：（皮尔逊公式需要接近正态，金式公式适合偏态）

众数的优缺点：
优点：概念简单明了，较少受极端数目的影响
缺点：不稳定，受样本变动的影响，反应不够灵敏，并能进行代数运算
使用条件：
快速粗略的寻找一组数据的代表值
当一组数据出现不同质情况时
次数分布中有两极端数目时，除了用中数还可以用众数
当粗略估计次数分布形态时，有时用平均数与众数之差
平均数，中数，众数三者的关系
正态分布中：平均数，中数，众数相等
正偏态分布：Mo < Mdn < M
负偏态分布：M < Mdn < Mo
（记住众数最高就行）
（三）差异量数
用于描述数据分布中大量数据彼此分散的程度
1、离差和平均差
离差就是离均差，是某一数据与平均数的差，表示每一个观测值与平均数距离的大小，正负号说明了偏差的方向，所以观测值离差的总和总是为0。
平均差就是所以离差绝对值的平均值。平均差充分考虑了每个数值的离中情况，完整的反应了全部数值的分散程度，在反应离中趋势方面比较灵敏，计算方法也比较简单。
计算公式：

2、方差和标准差
方差也叫变异数，均方。作为样本统计量用符号s2表示，作为总体参数用符号σ2表示，是离均差平方后的平均数。
标准差是方差的平方根。作为样本统计量用符号s表示，作为总体参数用符号σ表示。
计算方法：
方差：

标准差：

总标准差的合成
，
其中

方差和标准差的性质和意义
性质：方差是对一组数据中各种变异的总和的测量，具有可加性和可分解性特点。方差分析就是利用方差的这个特点。并进一步说明各种变异对总结过的影响
标准差是方差的平方根，不可以进行代数运算，但有如下特点：
每一个观测值都加一个相同的常数C之后，计算得到的标准差等于原来的标准差
每一个观测值都乘以一个相同的常数C，所得到的标准差等于原标准差乘以这个常数
以上两点结合如果先乘以一个常数，再加上一个常数，所得到的标准差等于原标准差乘以这个常数
意义：
方差与标准差是表示一组数据离散程度的最好指标，其值越大，说明次数分布的离散程度越大。它们是统计描述与统计推断分析中最常用的差异量数。
标准差的特点：
优点：反应灵敏；公式严密；计算容易；适合代数运算；受抽样变动小，简单明了
确定：易受极端数据影响
3、变异系数
变异系数又称差异系数，他是一种相对量数。
适用条件：
两个或两个以上样本所使用的观测工具不同，所测的特质不同
两个或两个以上样本使用的是同种观测工具，所测的特质相同，但样本间水平差异较大
计算方法：

使用须知：测量数据必须等距；测量工具具备绝对零；由于尚无有效的检验方法，目前不能进行推理统计。
（四）相对量数
1、百分位数
百分位数是指量尺上的一个点，在此点以下，包括数据分布中全部数据个数的一定百分比。第P个百分位数就是指在其值P的数据以下，包括分布中全部数据的百分之p。
2、百分等级
指一个分数在整个数据分布中所处的百分位置
3、标准分数
标准分数（Z分数）：以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数，离平均数有多远，表示原始分数在平均数以上或以下几个标准差的位置，从而明确该分数在团体中的相对位置。
简而言之，标准差解决了一个大问题，分数经过标准化就可以放在一起比较了。高考分数就是经过标准化以后，所以可以直接相加。
计算方法：
，其中 X 为原始数据，为平均数， S 为标准差
把原始分数转换成标准分数，就是把单位不等距和缺乏明确参照点的分数转换为以标准差为单位，以平均数为参照点的分数
标准分数的性质：
标准分数无单位，以标准差为单位，以平均数为参照点的分数
转换得到的标准分数可以是正值也可以是负值，所有原始分数的Z分数之和为0，，Z分数的平均数也为0.
将原始分数，转换为标准分数，是线性转换，不改变原有的分数的性质和分布。标准分数的形态和原分布相同。
若原始分数呈正态分布，则转换得到的均值为0，标准差为1的标准正态分布
标准分数的优点：可比性；可加性；明确性；稳定性
标准分数的应用：
比较几个分属性质不同的观测值在各自分布中的相对位置
计算不同质的观测值的总和或平均值，以表示在团体中的相对位置
表示标准测验分数
异常值的取舍（正负3个标准差以外的数据）
常用变式
T分数：T=10*Z+50 平均数：50 标准差：10
CEEB分数：CEEB=100*Z+500平均数：500 标准差：100
智商：IQ=15*Z+100（韦氏智力量表）平均数：100 标准差：15
（五）相关量数
前面讲的都是单变量数据资料的分布特征，相关则是用于描述双变量数据相互之间的关系。
相关就是变量间的不精确，不稳定的相互关系。
相关系数：相关关系强度的指标。作为样本的统计量用r表示，作为总体参数一般用ρ表示。是和平均数，标准差一样应用广泛的统计量。取值范围是[-1,1]。我们这里讲的相关是线性相关。当然即使是线性相关为0仍可能存在曲线相关。
1、积差相关
使用条件：两个呈线性关系的正态连续变量（正态，双变量，成对，连续，大样本）
计算方法：
，其中
N 为成对数据的数目， S x 、 S y 分别为 X 和 Y 的标准差
（变式）
原始数据：

计算积差相关系数的差法公式

关于平均数估计的方法，因为计算机的普及，这种方法已不再使用，考试应该也不会考
2、等级相关
使用条件：这是非参数相关方法，要求两个变量至少有一个是顺序水平。也就是积差相关不满足的，您就用这个。但是注意，凡符合积差相关的不用等级相关。这个精度低些。
计算方法：
，其中 D 为各对偶等级之差
直接用等级序数计算：，其中 R X 、 R Y 分别为二变量各等级数
有相同等级时：

3、肯德尔等级相关
当要同时研究三个或三个以上变量的一致性或相关性时，可以使用肯德尔和谐系数
使用条件：至少是顺序水平
形式：
多个评定者对一组被试或评定等级的一致性
同一个评定者对同一组被试多次评定
计算方法：
有相同等级：

肯德尔U系数
适用于对K个评价者的一致性进行统计分析，处理的问题和W系数是一样的，知识所处理的资料不一样。还记得实验心理学的对偶比较法么，就是用该方法来计算相关系数
计算方法：

4、点二列相关与二列相关
当两列变量，一列是等比或等距数据，另一列是类别变量。要求这样的相关就需用到者两种方法
所谓二分变量指取值只有两种变量。包括客观二分变量和人为二分变量
客观二分变量：如性别，只有男女两种
人为的二分变量：如考试成绩分为及格和不及格。如果及格线是65分，有些人的成绩就会由及格变为不及格。所以说这种变量是人为的。
点二列相关
使用条件：一列总体正态，至少等距数据，另一列是客观的二分变量
计算方法：
，其中是两个二分变量对偶的连续变量的平均数，
p 、 q 是二分变量各自所占的比率， p+q=1 ， S t 是连续变量的标准差
二列相关
使用条件：一列总体正态，至少等距数据，另一列是人为的二分变量

，其中 S T 与是连续变量的标准差与平均数， y 为 P 的正态曲线的高度
5、Φ相关
适用条件：当两个互相关联着的变量分布都是真正的二分变量时
计算方法：

后记

描述统计是推论统计的基础，所以必须认真看，认真背。有人问，要不要背公式，我认为基础公式必须牢记于心，就好像你上战场打仗，枪很好，但是却没子弹一般尴尬。掌握了统计原理，还怕背几个公式。其实也不多的。统计一旦考大题那可是30分那，所以千万不可掉以轻心。

介绍：
弗兰西斯·高尔顿（Francis Galton，1822年2月16日—1911年1月17日），查尔斯·达尔文的表亲（高尔顿为达尔文的表兄），是一名英格兰维多利亚时代的文艺复兴人、人类学家、优生学家、热带探险家、地理学家、发明家、气象学家、统计学家、心理学家和基因学家。高尔顿一生中发表了超过340篇的报告和书籍，他在1909年被授与爵士。他在1883年率先使用「优生学」（eugenics）一词。在他于1869年的著作《遗传的天才》（Hereditary Genius）中，高尔顿主张人类的才能是能够透过遗传延续的。此外，他在统计学方面也有贡献，高尔顿在1877年发表的关于种子的研究结果中指出了回归到平均值（regression toward the mean）现象的存在，这个概念与现代统计学中的“回归”并不相同，但是却是回归一词的起源。在此后的研究中高尔顿第一次使用了相关系数（correlation coefficient）的概念。他使用字母“r”来表示相关系数，这个传统一直延续至今。同时他也发表了关于指纹的论文和书籍，被认为对于现代利用指纹进行犯罪搜查方面有很大的贡献。

光爱哈赫 · 发表于 11-8-11 00:59:20

本帖最后由光爱哈赫于 2011-9-4 23:54 编辑

注意：由于公式都是以图片形式保存的，所以这里显示不出来，Word和PDF版本是带全部公式的
二、推断统计（核心）
科学研究的目的是，通过对样本数据的研究来推测总体，并对推断的正确性如何进行概率检验。他的基础是概率论。
（一）推断统计的数学基础
1、概率
后验概率：出现概率与观测概率的比值稳定在一个常数P上
先验概率：直接计算的比值，是真实的概率，而不是估计值
经过多次观测时，后验概率基本接近先验概率
概率的基本性质：任何一个随机事件的概率都是非负的；在一定条件下必然发生的必然事件的概率为1；在一定条件下，不可能事件的概率为0
概率的加法定理：互不相容事件之和等于两个事件概率之和
概率的乘法定理：两个独立事件发生的概率等于两事件概率的乘积
2、正态分布
正态分布呈倒挂的钟形，两头小，中间大；正态分布的中央点最高，然后逐渐向两侧下降，曲线的形式是先向内弯，然后向外弯。平均数μ和标准差σ决定着曲线的位置和形状：σ越大，曲线越是“低阔”；σ越小，曲线越是“高窄”。
标准正态分布
平均数为0，标准差为1的正态分布，就是标准正态分布。
3、二项分布
二项分布是指仅有两种不同性质结果的概率分布。
二项分布的形态
离散型分布，概率直方图是阶跃式
p=q的时候，对称。否则出现偏态
n趋于无穷大时，二项分布趋于正态
二项分布的平均数：标准差：
一般认为，当p＜q，np≥5（或p＞q，nq≥5），二项分布接近正态
4、t分布
特点：钟形，单峰对称。与正态分布相比，中间低而陡峭，两边高而平坦。平均数为0
t分布与标准差无关，而与n-1（自由度df）有关，随自由度得变化而变化，当自由度趋于无穷时，t分布趋于正态分布，且方差为1。我们认为自由度大于30，可近似正态分布。自由度是t分布中独立随机变量的数目。
5、F分布
特点：正偏态分布，他的分布曲线随分子，分母的自由度不同而不同，当两个自由度都趋近于无穷时，F分布趋于正态分布。F总为正值，因为是两个方差的比率。当分子自由度为1时，F值与分母自由度相同概率的t值的平方相等。F分布常用于有关方差的研究当中。
6、样本平均数分布
总体分布为正态，方差未知时，样本平均数的分布为t分布
总体分布非正态，其方差又未知时，如果n＞30，认为是近似正态分布
7、抽样原理与抽样方法
抽样原理
随机化是抽样研究的基本原则，随机抽样可以控制掉大多数额外变量。
我们都说通过样本来推测总体，那什么样的样本才能推测出总体呢，当然是具有代表性的样本喽，怎么找到具有代表性的样本呢，那就需要运用抽样原理与抽样方法
简单随机抽样
抽取时，总体的每个个体应有独立的、等概率被抽取的可能。比如抽签法和随机数字法。
优点：最符合随机原则，分析抽样误差比较简明
缺点：总体很大时，操作困难。忽略总体已有的信息，降低样本代表性。
等距抽样
也叫系统抽样，是在简单随机抽样中，每隔一段取一个。
优点：简便易行
缺点：如果总体具有周期性变化，则不能用。
分层随机抽样
按照总体已有的某些特征，将总体分成几个不同部分，在分别在每一部分中随机抽样。
优点：充分利用了总体的信息，样本代表性及推论的精确性更好
分阶段抽样
如果总体很大，样本很小，中间层次有较多单位，但并无过大区别，也可采取分阶段的方法。
（二）参数估计
1、点估计、区间估计与标准误
点估计：是用样本统计量来估计总体参数，因为样本统计量为数轴上的一点值，估计的结果也以一个点的数值表示，所以称为点估计。
良好估计量的标准：无偏性，有效性，一致性，充分性
区间估计：就是根据估计量以一定可靠程度推断总体参数所在区间范围，他是用数轴上一段距离表示未知参数可能落入的范围，它虽不具体指出总体参数等于什么，但能指出未知总体参数落入某一区间的概率有多大。
置信区间：在某一置信信度时，总体参数所在的区域或区域长度。
显著性水平：指估计总体落在某一区间的时，犯错误的概率。
区间估计的原理：样本分布理论
标准误：反应样本均数之间的变异，是多个样本平均数的标准差。用来衡量抽样误差，标准误越小，样本对总体就越有代表性。推断总体也就越可靠。
平均数分布的标准误：（总体方差已知时）
2、总体平均数的估计
总体平均数的估计方法大致有三种，对比如下：（小白修订版整理）

	正态法（Z）	t分布法	近似正态法（Z’）
条件	已知	未知
条件	总体正态，n不论大小；或总体非正态，n≥30		总体不论正态与否，n≥30
标准误
求得置信区间

* 注：未知，n<30时，必需用t分布法
3、标准差与方差的区间估计
标准差分布的区间估计
根据抽样分布理论，n＞30时，样本标准差分布近似正态分布，且，则有：

方差分布的区间估计
由于样本方差与总体方差之比的分布呈χ2分布，因此有：

（df=n-1）

在对标准差的总体进行估计时，可先对其方差进行估计（用χ2），求得方差置信区间后，再开平方。其正平方根，便是标准差的相当于方差置信水平的置信区间。
（三）假设检验
1、假设检验的原理
在统计学，通过样本统计量得出的差异做出一般性结论，判断总体参数之间是否存在差异，这种推论过程称作假设检验。假设检验包括参数检验（总体分布已知）和非参数检验（总体分布未知）
假设检验的基本思想是概率性质的反证法。
假设检验的过程简而言之，就是三步走：
1、确定研究假设H1
2、确定与研究假设对立的假设，虚无假设（H0），将H0作为直接检验的假设
3、进行检验，H0真H1假或H0假H1真
费舍曾说过：每一实验的存在，仅仅是为了给事实一个反驳虚无假设的机会。
注意：假设检验是依据小概率原理来推翻原假设的，也就是在统计学上成立。是百分之99或百分之95的情况下成立的。
假设检验的两类错误（后来应用于信息论的信号检测论）

击中率+漏报率=100% 虚报率+正确否定率=100%		反应（注意：在这里H0是无信号，H1是有信号）
击中率+漏报率=100% 虚报率+正确否定率=100%		接受H1（拒绝H0）	接受H0（拒绝H1）
输入	有信号（H1）	击中	漏报（β错误）
输入	噪音（H0）	虚报（α错误）	正确拒绝

其实很简单，我们用反证法进行假设检验的时候，所作出的推断不可能百分之一百正确，那么我们就们就可能犯错误。一项研究，如果我们的一项研究其实是假的，但是检验出来是真的，那么虚报了，犯了I类错误（拒绝了真的虚无假设H0），如果是真的，但是检验出来是假的，那么就是漏报了，犯了II类错误（接受了假的虚无假设H0）
那么看着上图我们来看看α和β的关系
α+β≠1；其他条件不变时，α和β，一个增加，另一个必然减少。但是样本容量增大，则他们同时变小。
我们需要的是在样本容量一定的情况下，同时减少两种错误。一般我们控制I类错误，所以就将犯I类错误的概率α称为假设检验的显著性水平。
单侧检验（既强调大小又强调方向）与双侧检验（强调大小不强调方向）
2、样本与总体平均数差异的检验（表格来自小白修订版，已经完美了！）

检验方法	总体情况		标准误	检验值
Z检验	正态	已知
t检验	正态	未知
Z’检验	非正态且n≥30	已知
Z’检验	非正态且n≥30	未知

3、两样本平均数差异的检验
既然是两个样本的话，那么就存在独立（样本彼此间无关，往往是组间的），相关（样本彼此间存在关联，往往是组内的）
两个总体都是正态分布，两个总体方差都已知
独立样本的平均数差异检验用Z检验：

相关样本间平均数差异的检验也是Z检验

两个总体都是正态分布，两总体方差未知
方差齐性，独立样本的平均数差异检验用独立样本t检验（求联合方差）
；

（）

方差不齐性，独立样本的平均数差异检验用柯兰克-柯克斯t检验（了解就好）
相关系数未知的相关样本的平均数差异检验用t检验
其中D为每一对对应数据之差
（，n为对子数）
相关系数已知的相关样本的平均数差异检验用t检验
：
（）
两个总体都是非正态分布
当n1和n2都是大样本（大于等于30）时，不管方差是否齐性，都可用近似Z’检验：

4、方差齐性检验
通常求F值得时候，将较大的样本方差放在分子，较小的样本方差放在分母

5、相关系数的显著性检验
由于当ρ=0时（近似正态）和当ρ≠0时（不是正态），的分布相差很大，所以要分开检验
积差相关的显著性检验
当ρ=0时,总体上并无相关，用t检验
其中
当ρ≠0时，总体上是相关的，先通过查表将r和ρ转化为费舍Zr和Zρ然后进行Z检验。

（四）方差分析（重点）
1、方差分析的原理与基本过程
使用条件：总体正态分布，变异间相互独立，各实验出的方差要一致
方差齐性检验，采用哈特莱最大F比率法（上面有）
一般Z检验和t检验只能比较两组数据的平均数差异的显著性，而方差分析可以比较多组平均数差异的显著性检验，还向下兼容，是个多面手。
我们现在讲的方差分析是单因素方差分析，也就是只有一个自变量的方差分析。比较它们不同水平之间的显著性。
方差分析的基本原理是方差的可分解性。方差分析把实验数据的总变异分解成若干不同的来源分量。要想两组数据差异显著，很明显，就是两个数据之间的变化要比两个数据内部的变化要大才行，所以只需要组间的变异显著大于组内就可以了。这就很好办了。因为总变异=组内变异+组间变异。把它们三个算出来就OK了。
注意：这里的平方和指观测数据与平均数据离差的平方总和
总平方和=组内平方和+组间平方和
很多人就奇怪了，这不是方差分析么？怎么是平方和呢？
别着急，还记得方差是离均差平方和的平均数么？放心，再除以样本容量就是方差了。
当然不能直接除以n，因为自由度df才是总体方差的无偏估计量，那么就是
总方差=组内方差+组间方差（这里方差一般叫均方）
那么比较组间变异和组内变异，就变成了，比较组间方差和组内方差了。由于他们只比应该用F检验来进行的，下面的又到大家熟悉的内容了
下面是计算方法：
平方和的计算式
总平方和：
组间平方和：
组内平方和：
自由度的分解
总自由度：
组间自由度：
组内自由度：
变异的分解
总变异：
组间变异：
组内变异：

结论：如果F＜1，说明数据的总变异中，组内的只占很少一部分。F=1，组间变异还不是够大。F＞1而且落入F分布的临界区域才表面差异显著。
2、完全随机设计的方差分析
看懂了上面的，接下来就容易多了。只要把变异搞清楚就可以了。这个是被试间设计，这里的变异只有组间和组内，所以直接按照上面算就行了。
3、随机区组设计的方差分析
这个好多人说不懂，区组就是按区分组的意思，每个区组的被试都是同质的，同一区组的被试接受所以实验处理。也叫组内设计，这样就把个别差异的影响也考虑在内，最后可以将这种变异分离出来以提高效率。就把组内变异=区组变异+误差项变异。那么组间变异只要显著大于误差项变异就可以认为差异显著了。另外区组变异显著大于误差项变异说明区组效应显著，分组是有必要的。
最后，要是考到了方差分析千万别忘记了最后还有个方差分析表要写！！！
4、协方差分析
关于这部分内容据《重难点手册》上说是来自左任侠的《教育与心理统计学》华师大1982年，有兴趣的同学可以去看看，我找了没找到。
协方差分析是方差分析与回归的综合使用法，是方差分析的引申与扩大，其目的是为了控制误差。如果你认真看实验心理学的话，在额外变量的控制中，就有用协方差分析的方法来控制误差。
原理是，因为实验中很多被试在测试时都不在同一个起始位置（如阅读速度，有的人天生阅读快，有的人天生阅读慢），这时我们可以现根据回归，使各被试都校正到同一初始位置，然后再进行方差分析。
5、多因素方差分析
这个内容，几乎凡是实验处理，都会用到的。计算应该不会考大题，因为不用电脑的话估计个把小时还算不出来。就算考了，也没几个做得出来。所以知道原理和简单的计算就可以了
所谓多因素方差分析是对多个自变量之间进行显著性检验，这里面我们不但要研究各个因素内各水平之间有无显著性差异（主效应），还要研究因素之间是否有相互作用（交互作用）
后面其实好办，还是进行变异分析。
SS处理间：指所有由实验处理引起的变异。
SSA：A因素的处理效应。
SSB：B因素的处理效应。
SSAB：AB间的交互作用。
SS处理内：随机区组设计中，处理平方和被进一步分解为区组效应和残差平方和两部分
SS区组：区组效应；
SS残差：即误差变异，其均方用作其他均方F检验时的误差项。
一般记到这个公式：SS总= SSA+SSB+SS（AB）+SSE
6、事后检验
方差分析只告诉你那些水平之间到底显著还是不显著，要是不显著也没事，一旦显著了，你总得知道是谁和谁发生显著关系的吧，这就需要进行事后检验。注意可不能用t检验或者z检验哦，这样会导致反α类错误的概率增加。所以就要使用多重比较的方法进行显著性检验，目前比较流行的是N-K检验法（也叫q检验）这个一般不太可能考大题。
（五）统计功效与效果量
看了这么多，我们也学了不少检验的方法，但是我们往往在检验过后只知道检验的结果，显著或不显著，但是却不知道，检验的效果怎么样。这时候大纲的这个考点就展现出魅力了。一份论文最终的结果有没有说服力，不单单是一个差异显著就完事了，最好还要说明这个差异有多么，显著。
1、统计功效

击中率+漏报率=100% 虚报率+正确否定率=100%		反应（注意：在这里H0是无信号，H1是有信号）
击中率+漏报率=100% 虚报率+正确否定率=100%		接受H1（拒绝H0）	接受H0（拒绝H1）
输入	有信号（H1）	击中	漏报（β错误）
输入	噪音（H0）	虚报（α错误）	正确拒绝

从这个图我们很容易就看出了，要想效果好，这个击中率就必须提高。击中率是1-β，它反映着正确辨别真实差异的能力，统计学把它称为统计功效。
2、效果量
效果量是反应统计检验效果大小的指标。一般用d表示。
是一种比率，本质上等同于信号检测论中的（辨别力指数），计算公式为：
独立样本：；
相关样本：

（六）一元线性回归方程
1、一元线性回归方程的建立、检验及应用
还记得前面讲到的相关关系么，相关关系是一种不稳定不确定的相互关系。线性回归是对相关关系的进一步研究。这里就是要确定相关关系之间的数学模型，使之更好的为我所用。实验心理学了其实也讲过回归，当然这两个还是有点区别的，回归指的是极端数据向平均数据靠拢的趋势，比如两个高个子的结婚，小孩可能比两人矮而趋近人类种族的平均身高。后来回归被用于描述这种不确定的关系
一元线性回归方程（两个变量间的线性相关）

回归方程建立的方法
1、做散点图观察是否能成一条直线
2、设回归方程
3、选用适当方法，求出a，b
4、将a，b代入后得到回归方程
平均数法（粗略，几乎不用）【我用这个算过彩票，无果】
最小二乘法
由于做散点图，任意两点就可以画出一条直线，多以有很多条，必须找一条代表性最好。
简而言之就是要使误差的平方和最小

最后求出来的方程叫y对x的一元线性回归方程
回归模型的检验
有效性的高低指标
测定系数，是回归离差平方和在总离差平方和中所占的比例，是回归方程的有效性高低的指标。就是R的平方
显著性检验
就是对于回归系数b进行显著性检验，如果b是显著的，同样也表明所建的回归方程是显著的，或者说X与Y之间存在显著的线性关系。一般用t检验

（）

从上述公式可以看出，知道相关系数就可以对回归系数进行显著性检验
回归方程的应用
回归分析的目的，就是在测定自变量X与应变量Y的关系为显著性相关后，借助拟合的较优回归模型来预测在自变量X为一定值时因变量Y的发展变化。运用建立的回归模型进行估计和预测是它主要的应用。
点预测：就是将确定自变量x的值直接代入回归模型，得到y值
区间预测：是以一定概率为保证，预测当自变量x取一定值x时，因变量y的可能范围。
2、可化为一元线性回归方程的曲线方程
对数函数

令，则曲线转化为：

指数函数
或（）
对方程两端求对数，得：
令 , ，则方程转化为：

幂函数
（）
对方程两端取对数，得：
令 , , ，得：

双曲线函数

令，得：

（七）卡方检验
前面讲到的数据，都是通过测量所得的计量数据，但是心理研究有很多是计数数据，我们这时就可以使用卡方检验，当然这时一种非参数的检验方法。
使用条件：
分类相互排斥，互不包容
观测值相互独立
期望次数的大小至少在5个以上
1、拟合度检验
用途：主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近，由于它检验的内容仅涉及一个因素多项分类的计数资料也算是单因素检验。
这里主要是考虑某总体分布和某种分布相符合，不涉及总体参数的问题。所以卡方检验的本质就是检验实测次数与期望次数是否一致
计算方法：先根据样本的分布情况求出理论次数。
自由度=分类项数-用到统计量的个数
我们查表时，得到的概率是双侧概率，但是因为卡方总为正值，所以看上去像单侧。
如果小样本的话（期望次数的小于5个）应该进行校正
耶茨连续性校正公式：

2、独立性检验
用途：主要用于两个或两个以上因素多项分类的计数资料分析（血型与性格是否有关系），多用于我们说的RXC表（列联表）的格式。
1、提出假设
2、理论次数的计算

3、卡方检验

4、自由度的确定

其中为该格的次数；为该格所在行的总次数；为该格所在列的总次数
如果是四格表（2×2列联表）的话，可以用更简单的公式一步求解。
独立样本

列联表中若某格的理论次数小于5，一般需要进行叶茨校正：

相关样本

列联表中若某格的理论次数小于5，同样需要校正:

（八）非参数检验
如果说参数检验是正规军的话，非参数检验可算是预备役了，也就是参数检验不行时，在上。一般参数检验都有严格的要求，不是正态分布，就是方差齐性啥的。而非参数检验则没有严格要求。
优点：特别适合顺序变量，特别适合小样本，计算很快。
缺点：未能利用数据的全部信息，将数据转换成顺序变量时会丢失一部分信息，精度不高。而且不能处理交互作用。
1、独立样本均值差异的非参数检验
秩和检验法
用法：与参数检验独立样本t检验相对应
两样本容量均小于10
将两样本数据混合，从小到大排序，求秩次；
对容量较小的样本求秩和，记为T；
查表，若T≤T1或T≥T2则两样本差异显著；若T1<T<T2则差异不显著（注意这里的否定域与一般假设检验的否定域是相反的）。
两样本容量均大于10时
接近于正态分布，用Z检验

中数检验法
用途：对应着两独立样本平均数之差的t检验，用中数作为集中趋势的量度
计算：将两个样本数据混合从小到大排列
求混合排列的中数
分别找出每一样本中大于混合中数及小于混合中数的数据个数，列成四个表
对四个表进行卡方检验（怎么检验？刚刚还讲过卡方检验，别说不知道。）
克-瓦氏单向方差分析
用途：对应于方差分析的完全随机设计
计算方法：
当组数k=3，ni≤5时
将所有数据混合，排序，求出各个水平的秩和，记为
计算H值：
查表，查H表
当组数k=3，ni＞5时
算法同上，算出H值，再用张P357的校正公式进行校正后查卡方表。但是如果未校正时已达显著，则可以不使用校正公式
2、相关样本均值差异的非参数检验
符号检验法
用法：相关样本显著性t检验对应，也是以中数作为集中趋势的量度
计算方法：
当对子数N≤25
1、对于没对数据之差，不计大小，只记符号。正号的记为n+，负号的记为n-，0不用管。数值较小的记为r，n+加n-等于N。
2、根据N与r查符号检验表，若r大于表中临界值，则差异不显著，即接受虚无假设（又是与一般参数检验相反，要特别注意）。
可以看出n+与n-差的越多，越显著。
当对子数N＞25
分成的正负号的分布符合二项分布，且大样本时服从正态分布，故可用Z检验
根据二项分布：

符号等级检验法
用途：和上面的是一样的，但是从名字上也可以看出，不但考虑了符号，还考虑了等级，所以有着更高的精度
计算方法：
当对子数N≤25
1、把相关样本对应数据之差值按绝对值从小到大作等级排列
2、在各个等级前面添上原来的正负号
3、分别求出带正号的等级和（T+）与带负号的等级和（T-），取两者之中较小的记作T。
4、根据N查附表，当T值大于临界值时表明差异不显著，小于临界值时说明差异显著
当对子数N＞25
一般认为T分布接近正态分布，可以用Z检验

弗里德曼两因素等级方差分析
用途：对应于方差分析的随机区组设计
流程：先把每一个个体的K个观测值的大小赋予相应等级，以这些等级为基础，计算卡方值作为检验统计量
计算方法：
1、将每一区组的K个数据（K个实验处理数）从大到小排除等级
2、每种实验处理n个数据等级和，以Ri表示
3、代入公式

若K=3且n≤9，或K=4且n≤4，则查表；
若K=3且n>9，或K=4且n>4，查df=K-1的χ2表。

（九）多元统计分析初步
如果说多因素方差分析还有可能出计算题的话，那么下面这些几乎是不可能出计算的，姑且不说有多少本科生上过这个内容，就算上过也未必做得来，更不要说还有大量的跨考生了。所以对他们做些了解就可以了。
1、多元线性回归分析
我们前面看到的一元线性回归，其实一个因变量只受到了一个自变量的影响，变化是按照就是一条直线。但是你也知道，一件事的产生往往是由很多原因导致的，所以往往大量情况时多个自变量影响一个因变量，这就是多元线性回归，往往是曲线。
多元线性回归模型的一般式为：

2、主成分分析
主成分分析实际上就是一种数据简化技术，由于在数据评价中常常会用到多个指标，但是指标越多，就越难以评价，所以我们希望能把多个指标转换成少数几个综合指标。这就是主成分分析。这些综合指标称为主成分。主要目的是降维，一般而言保留的主成分尽量少点，最好只有一个。
3、因素分析
是处理多变量数据的一种统计方法，他可以揭示多变量之间的关系，其主要目的是从为数众多的可观测的变量中概括和综合除少数几个因子，用较少的因子变量来最大程度地概括和解释原有的观测信息，从而建立起简洁的概念系统，揭示出事物之间本质的联系。

附：假设检验总表（来源于小白修订MJ大纲解析）

数据类型		单样本问题	独立样本比较	相关样本比较	多组样本的比较		相关问题
					独立样本	重复测量
等距型	总体正态分布	单样本t/z检验	独立样本t/z检验	相关样本t检验	独立样本方差分析	重复测量方差分析	Pearson积差相关
	分布形态未知	大样本下相应的t/z检验	大样本下相应的t/z检验	大样本下相应的t检验	转化为顺序型		转化为顺序型
顺序型		符号检验法	曼-惠特尼U检验	维尔克松T检验	克-瓦氏单向方差分析	弗里德曼双向等级方差分析	Spearman等级相关
命名型		χ2匹配度检验	χ2独立性检验	符号检验法	χ2独立性检验		Φ相关

后记

心理统计学，只要弄清楚一般的特点和原理，知道什么情况下使用什么公式就足够应付统考了。平时一定要多做些题目，不要光背不练，光背不练，就是白背了。统计，学起来就像笔版所说的，关键是要培养统计思想。有了这种思想再难的题咱也不怕了。最后一点就是要把统计和实验心理学的实验设计捆绑在一起以应对综合题。
介绍
张厚粲现任北京师范大学心理系教授，博士生导师，校务委员，北京师范大学珠海分校教育学院首席教授，身兼国务院参事，全国政协委员，中国心理学会常务理事，全国教育科学规划委员会学科评议组成员，教育考试研究会副会长和国际心理科学联盟(IUPsyS)副主席等多种重要职务。主编了我国最早的《心理与教育统计学》教材，率先开设“心理测量”课程，并应用心理统计和心理测验的理论是中国心理学界的领头人之一，具有很高的学术水平及影响。学识渊博，学术思想活跃，富于开创精神，科研成果斐然。在振兴中国心理科学，推动高等师范学校心理学科和建设上做出许多开创性的工作。

光爱哈赫 · 发表于 11-8-11 00:59:30

本帖最后由光爱哈赫于 2011-9-7 00:50 编辑

注意：由于公式都是以图片形式保存的，所以这里显示不出来，Word和PDF版本是带全部公式的

《心理测量学》

前言

这门课占35分，结构一般是（8个单选+1个多选+1个简答），不过每年可能不一样，分值权重相对统计来说会小一些，毕竟内容摆在那里。而且像项目反应理论和概化理论，那么难，考起来也没几人懂。所以一般都是对于基本的知识点进行考察。
心理测量估计是目前应用最为广泛的一门学科。还记得你们一来到大学，辅导员就给你们做了份量表吧，以至于很多人认为心理测验就是测你有没有精神病的？还有一类人认为心理测验就是我们平时买的时尚杂志中的“心理测验”比如，测爱情指数，今日运势等。有些姑且还有些道理，有些简直十分荒诞，毫无信效度可言。当然，作为平时消遣还是可以的。另外，你们作为未来的研究生，一定要把普及心理学文化作为己任，因为人们对心理学的误解太大了。如果真能一眼就把你给看穿了就好了!
其实，心理测量不限于我们平时所说的对于心理疾病诊断的测量（MMPI），我们的很多考试，如公务员考试等，各种人才选拔，如航天员的选拔。其实也都是运用了心理测量的相关原理。
大家如果有兴趣报考心理测量相关方向的专业，务必要把这一门学好。
这部分参考书目如下：
《心理学专业基础综合考试大纲》（2011年版）教育部考试中心
《心理学专业基础综合考试大纲解析》（2011年版）高教
《心理与教育测量》戴海琦等暨南大学出版社（2007年修订本）
《心理测量学》郑日昌人民教育出版社（1999年版）
《心理学统考重难点手册》 2011第三版
《MJ心理大纲详解》（小白修订版）白云子

开始

一、心理测量的基本理论

（一）心理测量的基础
1、心理测量的基本概念
要搞清楚心理测量，先要知道什么是测量
测量：就是依据一定的法则使用量具对事物的特征进行定量描述的过程。
例：考研成绩就是依据考研答案使用阅卷老师和计算机对你的试卷答案进行打分的过程
（可能不是很准确，差不多就是这么个意思）
所以心理测量就是依据心理学原理使用量表对心理活动的特征进行定量描述的过程。
测量的两大基本要素：参照点（有绝对零和没有绝对零）和单位（有确定意义和相等价值）
构成了下面四种量表：（来源于小白修订MJ大纲解析，我加了个例子）

量表类型	称名量表	顺序量表	等距量表	比率量表
单位和零点	无（名字）	无（名次）	有相等单位（温度）	有相等单位，绝对零点（时间）
四则运算	无	无	加减	加减乘除
统计方法	百分比、次数、众数、卡方检验	中位数、百分位数	均数、标准差、积差相关、t检验等	几何平均数、变异系数
例子	职业	名次	温度	重量

注意：高级量表可以向下兼容，但低级量表不能向上兼容。
心理测量的理论依据：
桑代克（1918）：凡客观存在的事物都有其数量
麦柯尔（1939）：凡是其数量的事物都可以测量
心理量表：本质上属于顺序量表。因为参照点是相对参照点。测量单位的意义也不明确，往往达不到等距量表。但是很多都通过统计方法转换成了等距量表
心理测验定义（阿纳斯塔西的）：她认为心理测验实质上是对行为样本的客观的和标准化的测验应具备4个基本条件
行为样本：测量外部行为来推测心理特质（间接测量）
标准化：（内容，施测条件，评分规则，常模的标准化）【常模是用来弥补心理测验没有绝对参照点的缺陷】
难度或应答率（难度适中，应答率符合统计计算）
信度和效度（结果一致且可靠）
2、心理测量的特征与分类
心理测量的特征
间接性：心理属性是内在的不可直接测量到的特质，但可表现为一系列具有内在联系的外显行为，测量者可以通过一定的方法测量这些外显行为，并由这些行为判别特质的性质。
相对性：对人的行为进行比较，没有绝对的标准，亦即没有绝对零点，有的只是一个连续的行为序列。所有的心理测量都是看每个人处在这个序列的什么位置上，也就是只有顺序量表的特征。
客观性：实际上就是测验的标准化问题。测验用的项目，说明、言语、态度、评分、分数转换、解释都需要标准化。
心理测量的分类
1、按测量对象
智力测验：一般认知能力（斯坦福-比内，韦克斯勒智力量表，瑞文推理属此类）
能力倾向测验：预测能力发展方向（一般能力倾向测验，特殊能力倾向测验）
成就测验：个人在接受教育后的学业成就（学科成就测验，综合成就测验）
人格测验：16PF，EPQ，MMPI
2、按测量方式
个别测验：同一时间只能测量一个被试，智力测验（斯坦福-比内，韦氏）和投射测验
团体测验：同一时间能够测试许多被试，绝大多数自陈式人格问卷
3、按内容的形式
文字（纸笔）测验：通过文字形式表现出来的。
非文字（操作）测验：通过指认、手工操作表现出来。
4、按测验功能所作的分类
成就测验与预测测验
难度测验与速度测验
描述测验与诊断测验
5、按评价所参照的标准分类
1、常模参照测验（被试与常模比较，以评价被试在团体中的相对位置）
2、目标参照测验（被试与绝对标准相比较，以评价被试有无达到该标准为目的）
3、潜力参照测验（被试水平与自身潜力相比较，以评价被试有无充分发挥自身潜力为目的
历史人物
孔子将人的智力分成三个等级，中之上人、中人和中下之人
三国时期刘邵《人物志》是一部研究能力的著作
高尔顿第一个大规模系统测量人的个别差异，还是评定量表、问卷法及自由联想法的先驱
卡特尔在《心理测验与测量》这篇论文中，首次提出了“心理测验”
1904年比内与其助手合作完成了世界上第一个智力量表（比内-西蒙量表）
（二）经典测量理论（CTT）
1、经典测量理论模型
真分数（T分数）：反映心理特质的真正水平的那个值
观测分数（X分数）：实际测量到的那个值
于是乎，经典测量理论就假定，观察分数和真分数之间是一种线性关系，并只相差一个随机误差即
X=T+E（经典测量理论的数学模型）
根据这一模型，我们可以引申出3个假设公理
（1）若经过平行测验反复测量足够多次，则观察分数的平均值会接近于真分数
E(X)=T或E(E)=0 （换句话说就是测量足够多的话，随机误差就趋近于0了，误差服从均值为0的正态分布，所以就被抵消了）
（2）真分数和误差分数之间的相关为零
ρ(T,E)=0 （说明真值和随机误差是独立的）
（3）各平行测验上的误差分数之间的相关为零
ρ（E1,E2）=0（平行测验造成的随机误差之间无关，误差无从均值为0的正态分布）
平行测验是测量特质不同，但题目不同的测验（高考的A，B卷）
事实上，我们在实际运作时，并不是许多平行测验来反复测查同一批被试，而是用一个测验来同时测查许多被试。
根据模型，我们可得
(观察分数的方差=真分数方差+误差分数方差)
系统误差的变异包含在真分数的变异之中，所以真分数还可以分成两部分：与测量目的有关的变异和与测量目的无关的变异
（真分数的方差=有关方差+无关方差）
最后：观测分数的变异=测量目的有关的变异数（有效变异）+稳定的但出自无关来源的变异数+测量误差变异
其实就是观测变异=有效变异（心理真值，我们要的）+系统误差变异（朝一个方向偏）+随机误差变异（朝各个方向偏）
2、测量的信度与效度
信度的定义
信度就是测量结果的稳定性程度。也就是用同一测量工具反复测量的一致性程度。就是打靶能不能每次打在同一个位置，也叫可靠性。
信度有三种等价定义：
信度乃是真分数变异与观测分数之比
信度乃是真分数与观测分数的相关系数的平方
信度乃是两个平行测验间的相关系数
信度的作用
信度是随机误差的反应（与系统误差无关）
信度可以解释个人测验分数的意义

信度可以帮助进行不同测验分数的比较（Z检验）

信度的估计
重测信度
同一个量表对同一组被试施测两次所得结果的一致性程度。（相对稳定性）
使用条件：所测量的心理特性必须是稳定的；遗忘和练习的效果基本上相互抵消（智力测验间隔6个月左右）；两次施测之间，被试在所要测查的心理特质方面没有获得更多的学习和训练。
计算方法：皮尔逊积差相关

复本信度
两个平行的测验测量同一批被试所得结果的一致性程度。
使用条件：构造出两份及以上平行测验（A、B卷）；尽量缩短间隔时间，排除记忆和练习的干扰
缺点：严格的平行测验很难造出来；容易受到练习，记忆和迁移的影响
计算：两个复本测验上所得分数的皮尔逊积差相关。
分半信度
将一个测验分成对等的两半后，所以被试在这两半上所得分数的一致性程度。
使用条件：通常在只能施测一次或没有复本的情况下使用；当一个测验无法对等分半时，不能用；（可以按奇偶分半，题目难度分半，题目内容分半）
计算：可以看成是短时距内实施的两个平行测验。和复本信度一样，但是由于算出来只有半个信度，多以应该用斯皮尔曼-布朗公式加以矫正。
（rhh两半分数间的相关系数，rxx为整个测验的信度值）
两个测验的方差相等时才能使用，否则应该用弗朗那根公式或卢仑公式。
同质性信度
内部所有题目的一致性程度。就是一个测验所测内容或特质的相同程度
计算方法：克龙巴赫α系数：
结果解释：一致性高，说明所测的都是同一心理特质，而且题目得分之间也有高的正相关
特质单一，同质性信度不一定高，但同质性信度高，特质一定单一
评分者信度
多个评分者给同一批人的答卷进行评分的一致性程度
计算：评分者2人用积差相关或等级相关，评分者多于两人时用肯德尔和谐系数（W系数）来算，但被评对象多于7个，可以用卡方检验。
信度的影响因素与改进
影响信度的主要因素有：
1、被试方面
个体而言是，被试的心理特质水平的稳定性
团体而言是，离散程度和团体的平均水平都会影响
2主试方面
施测人员不按规定施测，故意制造紧张气氛，或给考生一定的暗示，协助等，则测量信度会大大降低
3、施测情境方面
考场是否安静、光线和通风是否良好、设备是否齐全、桌面是否合乎要求
4、测量工具方面
测量工具是否稳定，试题取样、试题之间的同质性程度、试题难度等
5、两次施测的时间间隔
重测信度，越短越好
提高测量信度的常用方法：
1、适当增加测验长度（项目同质，数量适宜）【看病时，医生只问你一两个问题就做出诊断，你信吗？】
2、难度适中，分布正态
3、提高区分度
4、选取恰当的被试团体
5、主试严格执行实测程序，评分者严格按标准给分，场地按要求布置
效度的定义
效度是指一个测验或量表实际能测出其所要测的心理特质的程度。也就是能不能打中靶心。是随机误差和系统误差的综合反映，判断是否有效要从多方面搜集证据
效度的数学定义：效度=有效变异除以总变异，由观测变异=随机误差变异+系统误差变异+有效变异可知，信度高效度不一定高，效度高信度一定高，测验效度受信度制约。
内容效度
一个测验实际测到的内容与所要测量的内容之间的吻合程度。（考研时全是超纲题，内容效度就低）
用途：成就测验，职业测验（选拔和分类）。不适用于能力倾向测验和人格测验
与表面效度区分开来，表面效度是外行人认为高就高
结构效度
一个测验实际测到所要测量的理论结构或特质的程度，也就是说能够说明心理学理论的某种结构或特质的程度。（卡特尔根据他的人格理论制作了16pf，结构效度应该是高的）
特点：结构效度大小首先取决于心理特质理论；实测资料无法证实理论时，并不一定结构效度不高；结构效度是通过测量的内容的选择积累起来以确定的。
确定方法：1、提出理论假设并分成细小的纲目，以解释被试测验上的表现。2、依据理论框架，推演出有关测验成绩的假设。3、用逻辑的和实证的方法来验证假设
用途：智力测验，人格测验
实证效度（效标关联效度）
一个测验对处于特定情境中的个体的行为进行估计的有效性。说明应该以实践的效果来作为检验标准（研究生考试选拔的人才，具备高的科研能力，说明实证效度高）
效标指被估计的行为是检验效度的标准，简而言之就是衡量一个测验是否有效的外在标准。（就是你测定的行为，会不会在实践中发生）
常用效标：学业成就、等级评定、临床诊断、专门的训练成绩、实际的工作表现、对团体的区分能力以及其它现成的有效测验。
效度的估计
实证效度确定的步骤：明确观念效标，确定效标测量，考察测验分数与效标测量关系
实证效度的估计方法：
相关法：计算测验分数（瑞文推理）与效标测量（高考）的相关系数
区分法：接受测验后，先工作一段时间，根据工作成绩（效标测量）分成好坏两组。在回过头来分析两组被试原先接受测验的分数差异，若这两组人的测验分数差异显著，则说明该测验有较高的效度
命中率：
总命中率，测验选出且工作合格和测验淘汰且工作不合格的人数与总人数之比
正命中率，测验选出且工作合格与总人数之比
效度的影响因素与改进
影响因素
测验的构成（样本对预测内容和结构的代表性，难度，指导语，题目编制，测验长度）
测验的实施过程（不遵守指导语，或出现意外干扰，计分出错）
被试情况：个体：身心状态；团体：是否同质（大学生测验混进几个小学生）
所选效标的性质：不同测验选择不同效标，效标与测验分数间必须符合线性关系。
测量的信度：测验效度受信度制约
提高方法：
精心编制测验量表，避免出现较大的系统误差
妥善组织测验，控制随机误差
创设标准的应试情景，让每个被试都能发挥正常的水平
选择正确的效标、定好恰当的效标测量，正确地使用有关公式
信度和效度的关系
信度是随机误差的反映；效度是系统误差和随机误差的综合反映
信度高是效度高的必要非充分条件，信度高效度不一定高，效度高信度一定高。
信度是关于打靶总打同一个点，说明随机误差小。
效度是打到靶心，说明系统误差小，随机误差也小。
3、心理测量的误差
测量误差的定义
测量误差是指在测量过程中由那些与测量目的无关的变化因素所产生的一种不确定或不一致的测量效应。
随机误差就是那种与测量目的无关的，偶然因素引起的而又不易控制的误差（不确定朝哪里偏）
系统误差是指那种由与测量目的的无关变量的变因引起的一种恒定而有规律的效应。（稳定的朝一个地方偏）
测量误差的来源及控制
测量工具（样本太小或有偏。样本小，不稳定，样本偏，不准确）
被测对象（身心状态，如过渡焦虑和紧张会低于正常成绩出现测量误差）
施测过程（物理环境，外面突然放鞭炮，估计····，意外事件，考场停电）
主试方面（主试的年龄，性别，外表，言谈举止，表情动作，是否按规定实验）
测量误差的估计
4、心理测验的项目分析
难度
难度是指测验项目的难易程度。大部分人答对，难度小。大部分人都答错，难度大。
难度的计算（计分方法不同，项目难度的计算方法也不同）
二分法计分项目的难度（客观题，只有答对答错两种）
通过率（不考虑被试作答是猜测成功的机遇）
计算方法：答对人数的百分比（与我们通常的理解相反）

其中代表项目难度；为全体被试数；为答对通过该项目的人数
极端分组法（被试人数较多时）
先按总分从高到低排列，分成三组，总分最高的27%作为高分组，总分最低的27%作为低分组，分别计算高分组和低分组的通过率，然后求项目的难度。
其中和分别代表高分组合低分组的通过率
非二分法计分项目的难度（主观题，从满分到零分的多种可能结果）
其中为被试在某项目上的平均分；为该项目的满分
测验难度水平的确定
测验的目的是为了了解被试在某方面知识技能的掌握情况，可以不必过多的考虑难度，内容合适即可（目标参照测验）
测验的目的是用于选拔、录用人员，就应该将难度控制在录取率附近（常模参照测验）
难度的等距变换
由于难度是顺序变量，不能指出差异的大小和代数运算，所以一般都转换成等距量表。样本很大时，近似正态，可以转换成标准分数。但是转换后往往会有小数和符号，所以可以采用美国教育测验服务中心的难度指标 (Z是P值转换得来的难度指标)
难度对测验的影响
分布形态：难度过大，分数集中在低分端，呈正偏态分布；难度过小，分数普遍较高，集中在高分端，呈负偏态分布
离散程度：难度集中在0.5附近时，分数分布广，方差大。难度集中在两端时，过易或过难，分数分布范围最小。
对信度的影响：分数分布广，信度高，反之信度低。
对区分度的影响：分布分布广，区分度高
区分度
区分度（D）是指测验项目对被试心理品质水平差异的区分能力。（水平高的得分高，水平低的得分低，区分度就好），取值范围[0,1]，区分度的效标分数更多是测验总分。
区分度的计算
1、项目鉴别指数法（适用于二分法记分的测试项目）
其中和分别代表高分组合低分组的通过率。（两端各选27%的被试）
正态分布时，很有效，如果团体人数过少时，应该加大选择的比率。
2、相关法
以项目分数与效标分数或测验总分的相关作为项目区分度的指标。比项目鉴别指数法有更高的精度。常用的计算方法：点二列相关，二列相关，Φ相关，积差相关
难度和区分度的关系
难度接近0.5时，项目潜在的区分度越大，而难度D越接近1或0时，项目潜在的区分度就越小。所以一般保持中等难度
区分度的相对性
不同的计算方法，所得区分值不同
样本容量大小影响相关法区分度值的大小（样本越大越靠谱）
分组标准影响鉴别指数（D）（分组越极端，区分度越大，一般取前后27%）
被试样本的同质性程度（水平接近区分度小）
项目的综合分析与筛选
1、根据难度挑选项目（一般难度在0.35-0.65，平均难度则要0.5左右）
2、根据区分度挑选项目（区分度在0.3以上比较理想，有些在0.2-0.3的也可以）
3、由于分布广，信度高，所以尽量使成绩分布均匀，难度梯度应该大些，最好呈正态分布
（三）项目反应理论（IRT）
首先，前面的经典理论是有不足的（真分数与观测分数存在线性关系的假设不合理，平行测验也难以成立），于是为了弥补它的缺陷，项目反应理论和概化理论应运而生了。
简单的说，IRT在处理微观问题（被试水平与答题目之间的实质性关系）优势明显，CTT在处理中观问题（常见的标准化考试）时更方便易懂，GT则在处理宏观问题（如对结果做出推断）时更显出色。
项目反应理论是为了克服CTT理论的局限而提出来的，从测验的内部入手，采取数学建模和统计调整的方式，重点讨论被试能力与测验项目之间的实质性关系，测验的每一个项目都有自己的项目特征曲线，描述了每一个特定能力水平的被试答对或答错该项目的概率。
潜在特质理论（和经典理论一样，认为潜在特质不能观测和测量，只能借助于行为）
潜在特质：制约人的行为的心理特征
潜在特质空间：对于某一特殊行为的发展起作用的所有潜在特质的集合，潜在特质空间可能是多维的也可能是单维的（和人格特质理论的维度差不多）
【你的行为是由潜在特质决定的，查明了潜在特质空间的维度，以及各维度在决定你行为时所作贡献的大小，建立了维度模型后，只要找到你在维度模型上的位置，就知道你的发展方向和水平了】
1、单维性假设与项目特征曲线
单维性假设：单维性是指测验测量的是单一特质而非多元特质，即被试对测验中任一项目的反应是其单一特质的函数。
项目特征曲线：IRT假设正确反应率与特质变量之间存在规律性变化关系，这种关系可以用一个数学函数形式表示出来（回归方程），这一函数称为项目特征函数，这一曲线称为项目特征曲线。
2、单参数模型、双参数模型和三参数模型（正态卵形模型，很有喜感的名字）
正态卵形模型将前面的项目特征曲线视为一条S形的正态积累函数曲线，除了含有被试特质参数外，均还含有三个位置参数a、b、c，这三个参数决定曲线走向和形态的参数。
单参数模型：难度参数，答对题目的概率，除了个自己有关还和难度有关
双参数模型：难度参数和区分度参数，答对题目的概率，除了个自己有关还和难度和区分度有关
三参数模型：难度参数和区分度参数和猜测参数。答对题目的概率，除了个自己有关还和难度和区分度和猜测有关。
3、项目信息函数与测验信息函数
项目信息函数：反应了每个项目对每个被试进行评价时所提供信息的大小。用项目信息函数计算出来的值叫项目信息量。项目信息量越大，说明进行评价时所提供的信息量越大。，测量误差越小。双参数模型时，特质参数与难度参数相等时，误差最小。说明题目要与能力相匹配。
测验信息函数：把一个测验中所有的项目信息函数都累加起来，就得到了测验信息函数。测验提供的信息量越大，则该测验在评价该被试的特质水平时就越准确。
（四）概化理论
CTT理论仅以一个E就概括了所有误差，并不能指明哪种误差或在总体中各种误差的相对大小如何。针对性不强，所以克伦巴赫等人提出了概化理论。
概化理论的基本思想是：任何测量都处在一定的情境关系之中，应该从测量的情境关系中具体地考察测量工作，提出了多种真分数与多种不同的信度系数的观念，并设计了一套方法去系统辨明与实验性研究多种误差方差的来源。
1、方差分量的估计
测量的总方差可以分解为代表目标测量的方差成分（要测的心理特质，如阅读能力）和构成误差的种种方差成分（测量侧面即构成测量条件与具体情境关系的因素，如指导语，试题水平）。因此，对测验进行标准化对是对测量侧面进行固定，比如把阅读内容定位科技文，这时所测的特质就变成了科技文的阅读能力。测量目标在具体关系条件下的分数叫全域分数（就是真分数）。同一测验资料有多种全域分数。
2、概化系数与可靠性指数
概化系数G和可靠性指数Ψ，这两个指数相当于CCT理论中的信度
概化系数G=测量目标方差/（测量目标方差+相对误差方差）
可靠性指数Ψ=测量目标方差/（测量目标方差+绝对误差方差）
相对误差方差是所有与测量目标有关的交互效应方差之和，绝对误差方差是出了目标主效应以外的所有效应方差之和
3、G研究与D研究
概化理论分析的具体过程（以双侧面交叉设计模型为例）【例子是一种情境关系】
一个有几个元素的测验目标；两个测验侧面，以及它们的若干个水平。交叉设计是指，测验目标的每一个元素都要接受所有水平组合的处理。（运用方差分析）
第一步：G研究（估计出各种效应的期望均方就可以了）【就是找到各种潜在的误差来源，算出方差分量】
第二部：D研究（根据G研究的结果做出决策）【利用G研究的资料，对各种调整了测验情境的关系进行分析，优选测验方案】
目前概化理论在我国还处于实验研究阶段，在面试、考核等主观性测评中有一些应用。

后记

大家看到这里基本上已经接近尾声了，测量的内容很杂，大家最好对着书看，记得10的一道题目坑了不少人，估计最后很多人考完连在哪里都不知道吧。
1937年，施瑞奥克(J．K．Shryock)将我国三国时期刘邵关于人的能力研究的著作翻译成英文在美国出版。该著作是
A．《人物志》 B．《心书》 C．《吕氏春秋》 D．《学记》
介绍
克隆巴赫(1916—2001)，美国心理学家、教育学家。他创建了一套常用的衡量心理或教育测验可靠性的方法——“克隆巴赫系数”(Cronbach’s coefficient alpha)，并在此基础上建立了一个用于确定测量误差的统计模型。1957年当选为美国心理学会主席，1973年获美国心理学会颁发的杰出科学贡献奖，1974年当选为国家科学院院士。

光爱哈赫 · 发表于 11-8-11 00:59:35

本帖最后由光爱哈赫于 2011-9-7 00:55 编辑

注意：由于公式都是以图片形式保存的，所以这里显示不出来，Word和PDF版本是带全部公式的

二、心理测验及其应用

（一）心理测验的编制技术

1、心理测验编制的基本程序

（1）确定测验目的：明确测量对象（明确测验哪些个体或团体）；确定测量目标（测何种心理特质）；明确测量用途（用于心理诊断还是选拔人才）；

（2）制定编题计划（编制测验的总体构思）

第一，全面而具有代表性的测验内容；第二，对各个内容点的相对重视程度，通常用百分比来表示

（3）编辑测验项目（选定测验题目）：收集测验资料（丰富，普遍，有趣味）；测验项目形式（书写的，还是操作的）；编写测验项目

（4）预测与项目分析：预测（小样本施测），项目分析（对预测结果进行统计分析，确定区分度和难度）

（5）合成测验（把预测后有价值的题目编排成测验）

测验项目的选择（根据，测验的性质，难度和区分度来选）

测验项目的编排（并列直进式，混合螺旋式）

编制复本（至少要有等值的两份）

（6）测验的标准化：测验内容标准化；施测过程标准化；测验评分标准化；测验分数的解释标准化；

（7）鉴定测验：信度、效度、测验量表及常模（转换成等距量表）

（8）编写测验说明书（向测验使用者说明如何使用该测验以保证信度和效度

2、测验目标与命题双向细目表

测验目标：测验何种心理特质

命题双向细目表：列表形式的编制计划，它指出了测验所包含的内容所要测定的各种技能，以及对每一个内容、技能的相对重视程度。编制命题双向细目表有两个用途：

（1）在编题阶段，命题双向细目表指出应该编制多少和编制哪些种类的题目。题目编号后可将题目的实际分布情况与命题双向细目表对照，以确定测验题目是否恰当地代表了所要测量的领域与核对重要方面的内容是否有遗漏。

（2）在计分时，可按表中的百分比确定每类题目的分数。

3、题目编制技术

题目编制的一般原则如下：

（1）测试题要符合测验目的

（2）内容取样要有代表性

（3）题目格式不要使被试产生误解

（4）文句简明扼要，要避免使用晦涩难懂的字词

（5）应有不至引起争论的答案（创造力测验、人格测验除外）

（6）各个题目必须彼此独立

（7）题目中不可含有暗示本题或其他题答案的线索

（8）题目内容不要超出受测团体的知识和能力

（9）所提问题应避免涉及社会禁忌与个人隐私

（10）施测与评分省时

4、测验标准化

是指对影响测验目的的无关变量的控制过程，具体包括四个方面：

（1）内容标准化有两层含义：其一，测验题目必须能测量所要测量的目标，题目内容应是总体的代表性取样；其二，对所有的被试必须实施相同的或等值的测验。

（2）施测标准化是指让所有的被试都在相同的情绪条件下接受测验，产生真是的行为反应。这就要求施测时必须有统一的指导语和统一的时间限制。

（3）评分标准化是指评分的客观性。客观性意味着在两个或两个以上的受过训练的评分者之间有一致性。如对主观试题的评分，要有标准答案和评分细则，使评分有客观依据。

（4）建立常模是为了能标准化地解释测验分数，常模分数是使用测验的人用来解释被试分数的唯一依据。个人的分数只有在和常模分数作比较中，才能显示出它所代表的真正意义。5、测验等值技术

这货是怎么来的？假设，你参加了一次自学考试，去年比你成绩还差的学长都过了，今年你去考，结果题目好难，只考了59分没过。由于每年的形式都不等，所以会造成这种不公平的现象。如何解决呢？我们可以把不同形式的测验分数都转换到同一个分数系统上，就OK了，这就是我们的测验等值技术。

等值测验的实质：通过对考核同一心理品质的多个测验形式做出测量分数系统转换，进而使得这些不同测验形式的测验分数之间有可比性。

当然不是什么测验都可以转换，不同形式的测验转换，必须符合一定的条件：

（1）同质性（测同一种特质）

（2）等信度（两信度相等）

（3）公平性（你参加任何一个考试，结果都是一样的）

（4）可递推性（不能递推的，也不等值）

（5）对称性（无论等值转换从哪个测验出发，等值对应关系是相同的）

（6）样本不变性（不受样本影响）

各种等值的种类

经典理论等值和项目反应等值（根据不同的理论指导）

测验分数等值与项目参数等值（根据操作对象的不同）

水平等值与垂直等值（根据难度和被试能力分布）

等值测验的专用名词

测验设计等值（在寻找等值关系之前，预先进行周密的安排）

锚测验（一组测验试题来关联两个待等值的测验形式）【两张卷子有几道题目是一样的】

数据平滑法（由于条件限制，分数分布波动较大，可以利用复杂的数学技术使之变平滑）

等值标准误差（由抽样引起的等值误差）

等值偏差（等值处理方法不当造成）

测验结果的表示方法：列表法，公式法和图示法

经典测验中的等值计算方法：等百分位等值和线性等值

（二）心理测验的实施

1、测验的设计

测验的设计应该包括题目、前言和指导语、问题、选择答案和结束语等几部分的设计，设计内容有测验结构的确定、测验题目的表述方式的设计，问题排列方式的设计、回答方式的设计等。测验设计的好坏直接决定测验回收率和有效率，直接设计研究结果的科学性。

2、实施的程序和步骤

施测前的准备工作：准备好测验材料；熟练掌握施测手续；熟记测验指导语并能用口语清除流利地说出来；

指导语：主要作用是使受试者按正确的形式对题目做出反应；测试的主持者和指导语都应保持中立，不倾向于答案的任何一种方向；

测验情景：测验场地（通风，光线，噪音），座位，答案纸型等都会影响测验分数；

测验焦虑：会影响结果的真实性。测试时要稳定被试的情绪。另外能力越高，测验焦虑越低（有自信嘛），越渴望得高分的人，测验焦虑越高。竞争性测验焦虑高，经常接受测验的人的焦虑低。轻微焦虑会增加测验效果，焦虑太高或毫无焦虑则会降低测验效果。

与受测者建立良好的协调关系：以保证他能按指导语行事

评分技术：严格标准

（三）测验常模

为什么要有常模？很简单，今天期末考试成绩出来了，老师第一个报你的名字，说你考了95分，你正在沾沾自喜，然后老师说，除了这位同学，其余同学都是100分，这时你会是什么感受。所以没有参照点的分数，我们很难看出它的价值。

1、常模与常模团体

常模：根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测验量表。（其实就是用于比较的参考标准）

常模团体：由具有某种共同特征的人所组成的一个群体，或是该群体的一个样本。

确定常模团体的注意事项

群体构成的界限必须明确；常模团体必须是所测群体的一个代表性样本；常模团体的取样过程必须明确且有详尽的描述；样本大小要适当；常模团体必须是近时的；注意一般常模与特殊常模相结合。

2、分数的转换与合成

原始分数：被试接受测验后的根据计分标准算出来的分数。无法反应个体在团体中的位置。

导出分数：在原始分数的基础上按照一定的规则经过统计处理获得的具有明确参照点和单位，并能表示个体在团体中相对位置的分数。

常见导出分数：百分等级，标准分数，标准九分数

百分等级分数

在一个群体的测验分数中，得分低于这个分数的人的百分比

计算方法：

未分组分数资料：
其中为百分等级，为排名顺序的序号，为被试总人数
分组分数资料：（团体人数过大分数以次数分布表的形式呈现）

其中为被试原始分数，为被试所在组分数下限，为被试所在组次数，为组距，为被试所组以下各组次数和

优点：百分等级是一种相对位置量数，具有可比性，且具有易于计算，解释方便等优点；另外百分等级不受原始分数分布状态的影响，即使是非正态，也不会影响百分等级的解释能力

缺点：

1、单位不等，分数稀疏区域反应迟钝，在分数密集区域反应过分敏感

2、百分等级只有顺序性，无法用它来那说明不同被试之间分数差异的数量。

标准分数

一种具有相等单位的量数，又称Z分数。

计算方法：

优点：相对位置量数，等距量表，有可加性。

缺点：计算时常出现小数和负数，单位间距过大（1个标准差），不改变分数形态，难以推广

标准分数的变式：（解决计算时常出现小数和负数）

T分数：T=100Z+50

CEEB分数：100Z+500

韦氏智力测验分数：IQ=15Z+100

EPT分数=20Z+90（我国出国人员英语水平）

优点：具有等单位，正态分布下可导出各种百分等级，正态化的Z分数转换后可以直接分析比较

缺点：过于抽象，不易理解。非正态分布下不能外推。

标准九分数

标准九分数是将原始分数分成几个部分的标准分数系统。若原始分数服从正态分布，它是以0.5个标准差为单位，将正态曲线下的横轴分为9段，最高一端为9分，最低一端为1分，中间一段为5分，每段均有半个标准差宽

常模的合成

3、常模的编制

前面所介绍的分数转换，通常都是对一个测验分数而言的，实践中只处理单一测验分数的情况很少，常常需要将几个分数或几个预测源组合起来，以获得一个合成分数或作总的预测。

1、临床诊断（直觉合成）【比如你父母帮你选大学，就是根据一系列因素】

优点：具有高度综合性；具有灵活的针对性，就能特定的个人做具体的结论。

缺点：主观加权受决策这的偏见的影响，不够客观；缺乏精确的数据分析，没有精确的数量分析，没有精确的数量指标

2、加权平均就和（根据权重加起来）

条件：特质间能相互代偿；测验分数是连续资料

3、多重回归（研究一种事物或现象与其他多种事物或现象在数量上相互联系和互相制约的统计方法）

条件：特质间能相互代偿；测验分数是连续资料，预测源分数与效标分数是线性关系且能同时获得

4、多重划分

在各个特质上都确定一个标准，从而把成绩划分为合格与不合格两类。然后将最有效的预测源放在前面，紧接着第二个有效测试。只有通过的前面一个测试，才能进行下一个测试。也叫“连续栅栏”（玩游戏不打败BOSS不能进入下一关）

3、常模的编制

第一步：确定测验将用于哪一个群体。根据测验群体，选定最基本的统计量，决定抽样误差的允许界限，在此基础上设计具体的抽样方法，并对该群体进行抽样，得到常模团体

第二步：对常模团体进行施测，并获得该团体成员的测验分数及分数分布。

第三步：确定常模分数类型，把原始分数转化为量表分数，制作常模量表

4、几种常用的常模

发展量表

将个人的成绩与各种发展水平的人的平均成绩相比较，制定出发展量表

心理年龄

就每个年龄水平制定适当的题目，可得到一个可评价儿童智力发展水平的年龄量表。一个儿童在年龄量表上所得的分数，就是最能代表他的智力水平的年龄，这样的分数就称作智力年龄，简称智龄。

年级当量

就是将被试的测验成绩与某一年级的学生的平均分数做比较，而说成相当于某一年级水平。与年龄量表类似，所不同的是用年级水平代替了年龄。

商数

用两个分数的比率来制定量表

智力商数

是智力年龄与实际年龄的比值

教育商数（表示发展水平与速率）

教育年龄可以由年级当量直接得到，如果一个成人的测验分数相当于小学生，那么他的教育年龄就是10岁。

成就商数（评价学生的努力程度和教师的教学效果）

智龄：反映智力教龄：反映学业成就

智力不够，但努力学习，成就商数高（很努力）

成就商数低：教龄小于智龄，不够努力，反映教学效果不好

存在问题：智力与学业成就只有中等相关，智力较好且刻苦学习，并不是一定能获得好成就

（四）标准参照测验（同目标参照测验）

前面讲了常模参照测验，都是以被试在团体中的相对位置来评定和解释预测结果。这是一种只关心个体差异的测验，忽视了个体在测验内容上掌握的绝对水平。（像我们的期末考试，各种资格考试都属于此类，只要合格就可以了）

1、标准参照测验的定义与作用

定义：所谓目标参照测验，是根据某一明确界定的内容范围而缜密编制的测验，并且，被试在测验中所得结果，也是根据某一明确的行为标准直接进行解释的。（就是要掌握什么，就考什么）

内容范围：首要的，必须对所欲测的内容范围作出清晰的界定，并给予严格的操作定义

行为标准：了解绝对水平以判定是否达到了从事此项行为的最低标准

作用：在于了解个体在所规定的测量内容上的行为水平，因此其出发点是个体本身的绝对水平，而不再是个体差异。

2、标准参照测验的题目分析

内容范围的确定（边界明确：合格的分界点；每一内容范围均可分成几类，每一类还可分为更小的类，每一类的内容及其在此内容范围的相对重要性确定以后，内容范围就有了明确的结构）命题细目表（包括教学目标，教学内容，整个内容范围中每一类内容和每一种目标相结合所占的比重，这一要素主要通过专家评定）【边界明确，结构明确，指导编制测验】

测验项目的内容效度分析

对构成测验的每一个题目是否合适以及有效进行分析，即检验题目与测验内容范围所要求的内容与目标的一致性，这一过程缺乏客观的统计分析手段，通常采用专家评定的方法。

测验的预测

测验编制完成后，须选取一定数量的被试进行预测，由此获得预测数据，然后才能在此数据的基础上对项目的难度和区分度进行量化分析。有三种方法：

前测——后测方法（同一组被试教学前和教学后各测一次）

已接受教学组——未接受教学组方法（有两组被试，一组是已接受教学的，另一组是未接受教学的，同时施测）

对照组法（有两组被试，一组为掌握组，一组为为掌握组，同时施测）

测验项目的难度分析

一般以通过率来表示，但是目标参照测验注重在所测验内容以及在内容上的掌握程度，所以无论难易都应保留，难度往往只是作为区分度项目分析的基础

测验项目的区分度分析

由于目标参照测验应该能将其内容范围上的已掌握和未掌握内容作出最大限度的区分，因而，每一测试项目的区分度是个很重要的内容。衡量的指标有难度差值和相关系数。

3、标准参照测验的信度与效度

信度

任何测验都应保证测验结果的信度和效度，目标参照测验也不例外。

分类一致信度

考察被试在同一测验的两次施测（或两个复本）中是否被在同一类中。【意思是第一次及格了，第二次也及格了那么信度就高，只管分界点】

计算方法：团体施测就是两次施测后均及格和均不及格人数占总人数的比例

a.两次都及格；d.两次都不及格；a+b+c+d=N即总人数

优点：计算方便，直观易懂

缺点：受测验长度和分布形态的影响，分界点的确定十分重要

另外，必须同时报告分界点和测验长度

荷伊特信度（方差分析法）

最符合信度定义，利用方差分析找到个体有效变异占总变异的比例。可以不考虑分界点的位置，更具有普遍性。

效度

内容效度（和常模参照的一样，但是目标参照测验更加注重）

测验题目对预测内容的代表性程度

效标关联效度（实证）

根据测验划分的及格或不及格，对未来学习工作表现的预测程度。（英语六级过了是不是英语真的没问题？）

4、标准参照测验的分数解释（分数分界点的确定）

其实就标准参照测验本身来说，确定分界点不是必须的，可以用掌握了测验内容范围的百分之多少来解释。但是实际应用中，我们往往是通过分界点来做出决策，是否达到了从事特定工作的最低标准。（六级425以上合格，而424和0分几乎一个性质）所以分数解释也就变成了分界点的确定。

专家判定法（由专家来判断处于临界水平的被试在每一题上正确回答的可能性，进而确定分界点）

效标组预测法（临界组法，由专家判定处于临界水平的被试，计算它们在测验上的平均成绩和对照组法，由专家判定那些明确的掌握组及未掌握组，而把模棱两可的剔除掉，两组分数分布的交叉点就是分界点）

（五）常用心理测验（务必要认真看，考的比较细）

1、成就测验

成就测验一般也叫学绩测验，是世界上应用最为广泛，最为频繁的心理与教育测验。我们从小到大经历的无数次考试。以及我们将要经历的研究生入学考试，都属于学绩测验。

学绩测验是对个体在一个阶段的学或训练之后知识、技能的发展水平的测定。【是经过学习以后，知识技能的发展水平，如果不经过专门训练，那么测值应该是0】

学绩测验属于最佳行为测验，所测得是认知性的心理品质

标准化学绩测验：由测量学专家与学科教师根据测验学原理编制，质量可靠，客观性强，有常模做比较，适合于大规模施测。（全国高考）

标准化学绩测验的基本要求：命题组卷标准化，施测标准化，评分标准化，分数解释标准化

标准化学绩测验的编制程序：1、确定测验题目，选定测验编制的方法。2、分析测量目标，拟定测验编制计划3、编提征题与组卷选题4、调查测验质量参数，编制测验常模5、编写测验指导书，正式出版发行

国外常用标准化学绩测验：斯坦福成就测验；关键数学算术诊断测验（KMDAT）

2、智力测验

智力：是从经验中学习和获益的能力，抽象思维和推理的能力，适应不断变化，模糊多样世界的能力以及激励自己有效地完成应该完成的任务的能力（斯滕伯格，1981）【智力三元论】

智力理论（还记得当年大明湖畔的那本普心么）

比内量表

1、比内-西蒙量表

1905年量表：比内和他的助手西蒙，为了诊断弱智儿童编制了世界上第一个智力量表

1908年量表：第一个年龄量表，增加项目和年龄分组，用智力年龄来评估个体年龄

1911年量表：增设成人组

理论基础是能力二因素理论

2、斯坦福-比内量表（推孟 Terman）

1916年量表：适用于3-13岁的儿童，首次引入比率智商，以IQ作为个体智力水平的指标

1937年量表：将年龄扩展为1.5岁—18岁

1960年量表：适用于2岁到成人，舍弃了比率智商，引入了离差智商，以平均数100，标准差16的离差智商作为智力评估的标准。

1972年量表：样本代表性有了很大的提高，并沿用至今

3、中国比内量表（陆志伟和吴天敏）

斯坦福—比内中国版的修订工作，使用离差智商，于1982年完成《中国比内测验》

韦克斯勒量表

由于斯—比量表是针对儿童设置的，过分强调速度而又缺乏难度。所以不很适合与成人。

成人量表

他于1939年发表了韦克斯勒—贝尔韦智力量表I型，是第一个成人智力测验。于1949年增加了II型，主要用于10—60岁的被试。1955年又编制出版了韦氏成人智力量表（WAIS），1981年又进行了修订，称为韦氏成人智力量表修订版（WAIS-R）【平均数为100，标准差为15】，韦氏成人量表中国版的修订工作是1982年由湖南医学院的龚耀先主持完成的。

儿童量表

韦氏儿童智力量表（WISC）是在W-B I的基础上修订而成，知识对测验降低了难度，和增加了迷津分测验。后来经过修订后（WISC-R）使用与6—16岁的儿童

韦氏幼儿智力量表（WPPSI）出版于1967年，适用于4—5岁半的儿童

三种量表相互衔接可以使用于全年龄。

优点：能较好的反应智力的各个侧面；最早使用离差智商代替比率智商（智商是由施特恩提出来的）

团体智力测验

陆军测验

用于选拔士兵

陆军甲种测验：包括8个分测验。

陆军乙种测验：包括7个分测验，属于非文字测验，可以用于不识字的和有阅读障碍的人

瑞文推理测验（应该好多人都做过吧）

瑞文推理测验是由英国心理学家瑞文编制的一种团体智力测验，是非文字的图形测验。

1、瑞文标准推理测验（1938年）

适用于5.5岁以上智力发展正常的人，属于中等水平的瑞文推理测验。

2、瑞文采图推理测验（1947年）

适用于幼儿和智力低于平均水平的人，属于瑞文推理测验的三个水平中最低水平的测验

3、瑞文高级推理测验（1941年）

适用于智力水平高于平均的人，是最高水平的瑞文推理测验

认知能力测验（桑代克）

初级型，适合于小学低年级儿童

文字测验，适合于小学4年级以上

非文字测验，适合于小学4年级以上

数字测验，适合于小学4年级以上

3、能力倾向测验

我们前面讲到的智力测验，往往注重于智力的整体考察，而且多半是测抽象思维能力的，相当于宏观范畴，而能力倾向测验更多是对于具体能力的测验相当于微观范畴。另外成就测验是个体对于过去学习经验的总结，而能力倾向测验是指个体在不同能力因素上潜在的优劣倾向，主要在于预测。

学术能力倾向测验（SAT）：相当于我国的高考，但是他不是总结学到多少知识，而在于预测学生是否具备大学学习和研究的能力。

分辨能力倾向测验（DAT）：主要适用于初中高中学生的教育咨询及就业指导。

一般能力倾向成套测验（GATB）：测你适合什么职业的

注：以上三个都是美国的，所以我国也要大力研究心理学造福人类啊~~

4、特殊能力测验

前面的是测你倾向什么能力，这是是测你是不适合这种能力。具有很强的针对性。

音乐能力测验

西肖尔音乐才能测验：是一组最充分的调查音乐才能的测验，适用于小学至成人

音乐能力测验图（戈登）：以真正的音乐题材为材料（250个原版的大提琴和小提琴选段）

美术能力测验

梅尔美术判断力测验：测验由两幅美术作品组成，一幅是公认的杰作；另一幅是对此杰作稍有歪曲的作品，让你选出更好的

格雷福斯图案判断测验：取材不是名家杰作，而是一些二维或三位的抽象图形，他们在整体性、平衡性和对称性方面有所区别，要求判断那幅图形最好

霍恩美术能力问卷：由两部分组成：一部分是要求被试画出20种常见的物体和几何图形；另一部分是要求被试在长方框内给定的圆点和线条基础上作画，属于操作型测验

机械能力测验

空间关系测验

明尼苏达机械拼合测验：主要测动作敏捷性和空间知觉

明尼苏达空间关系测验：主要考察对空间关系的知觉速度

明尼苏达书面形式拼版测验：以纸笔形式进行，采用多重选择题，选出哪一个能和原图形拼合起来

机械理解能力测验：机械理解能力是指实际生活情境中的机械原理的能力（本奈特机械理解测验）

5、创造力测验

创造力是发散思维的能力（吉尔福特说的）

吉尔福特发散思维测验：根据他自己的理论，分出了与发散思维关联30种能力因素，最后编制出14个分测验对11种能力进行测量。适用于初中水平以上的人，从思维的流畅性、变通性和独特性3个方面进行评分。

托伦斯创造性思维测验：在吉尔福特发散思维测验的基础上，编制而成，目的是从流畅性，变通性，独特性，和精确性4个方面评估。

6、人格测验

高尔顿最早提出用科学的方法测量人格

人格测验就是通过一定的方法，对在人的行为中起稳定的调节作用的心理特质和行为倾向进行定量分析，以便进一步预测个人未来的行为。

1892年克雷培林将联想测验用于临床诊断

1919，伍德沃斯发表了第一个自陈式人格量表（个人资料调查表）

1920年，罗夏克墨迹测验问世，投射测验由此诞生

自陈测验

根据测量的人格特质，编制许多有关问题，要求被试根据自己的实际情况一一作答，然后根据答案来衡量它的人格。（依据只有自己才了解自己）

特点：题量叫道，纸笔测验，计分简单而客观

明尼苏达多项人格调查表 MMPI

由明尼苏达大学临床心理系主任哈撒韦和心理治疗加麦金利编制而成，有566个题目，重视被试的主观感受，而不是客观事实，主要用于临床上精神疾病的诊断，但也可以用于评定正常的人格。

卡特尔16种人格因素量表 16PF

经过科学实验、系统观察以及因素分析统计后逐渐形成，可在45分钟内测量16中主要的人格特质。

艾森克人格问卷 EPQ

艾森克认为支配人行为的人格结构是由少数几个人格维度构成的。

该量表由四个分量表构成，用于测量受测者在精神质（P）、外倾性（E）、神经质（N）这三个人格维度上的特征。问卷分为成人与儿童两种，儿童（7～15岁），成人16岁以上。

爱德华个性偏好量表 EPPS

美国心理学家爱德华根据默瑞提出的人格需要理论中15个潜在人格需要作基础，于1954年编制而成，EPPS可作为心理咨询工具，在职业指导和人才选拔中应用广泛。量表通过项目的社会赞许性配对，很大程度消除了社会赞许的影响，并创新地使用了迫选法

学生性格量表（11—18岁） SPS，我国编制，用于测量我国中小学生的性格特征。

投射测验

投射测验是向受测者提供预先编制的一些未经组织的、意义模糊的标准化刺激情境，让受测者在不受任何限制的情况下，自由的对刺激情境做出他的反应，然后通过分析受测者的反应，推断受测者的人格特征。【就是给你个情景，让你自由发挥，把内心特质投射在客体事物上，再由专家来判断】

罗夏克墨迹测验RIT

让被试看墨迹图形，然后问被试看时联想到的东西，来判断被试的心理特质。

四个阶段：1.自由反应阶段（让被试自己想，不干扰被试）；2.提问阶段（有针对地提问题）；3.类比阶段（进一步的商讨）；4.极限测验阶段（进一步确认）

解释依据：1.反应区位；2.反应内容3.反应的独创性4.它们间的数量关系

主题统觉测验 TAT 莫瑞

给被试呈现一系列意义相对模糊的图卡，然后让被试根据图卡不假思索的编故事。

基本假设：人们在解释模糊情境时，总是按照自己过去的经历和目前的愿望。在讲故事过程中也用了他们过去的经历，并在故事中表达了他们的感情和需要。（就是将个人的过去和未来投射在故事中）

7、态度测验

态度是指个体对人或事所持有的一种较为持久而又一致的心理倾向，它包括认识、情感和行动倾向三种成分。

等距量表法瑟斯顿

围绕某一态度主题，选取能代表该方面的态度语或项目若干，由专家对这些项目进行等级排列，并把专家排列的结果进行项目分析，保留有效的项目以及根据专家的反应确定项目等级。要了解某个受调查者的某方面态度，只需看其对该量表的反应，最后运用对全部项目反应结果的等级求中位数，以中位数表示该受调查者的态度状况。

利克特量表

属于总加量表法，不用花钱请专家，每个项目之间是等价的，只要把被试对每个项目的评定登记相加得出一个总分数就可以了。其实就是我们现在所说的5点量表，7点量表。（强烈不赞同，不赞同，无所谓，赞叹，强烈赞同）

哥特曼量表

哥特曼量表试图确立一个单向性的量表。所谓单向性即项目之间的关系或排列方式是有序可循的。如果你赞同第N个项目，那么你一定赞成该项目之前的全部项目。（你认为这部电影应该怎么分级：全年龄、指导级、13岁以下需要家长陪同、限制级）

8、兴趣测验

兴趣是探究某种事物的认识倾向，表现在兴趣的指向性，兴趣的广度和兴趣的稳定性上。

斯特朗职业兴趣问卷

世界上最早的兴趣问卷，是根据经验编制的问卷，让两组被试（一组是从事且喜欢的，另一组是一般人）进行选择反应，根据他们的回答差异而编制成的问卷。

库德职业兴趣调查表

把所有职业分成10个兴趣领域，然后确定与之相应的10个同质性量表，受测这的结果按这10个量表及den，通过分数的高低来确定兴趣的职业领域。

自我指导问卷霍兰德

根据自己的人格特点查找适合自己的职业。

9、心理健康量表

就他这六个字，都不知道包括多少量表，当然主要掌握scl90和书上的焦虑量表就可以了

症状自评量表-SCL90

世界上最著名的心理健康测试量表之一，是当前使用最为广泛的精神障碍和心理疾病门诊检查量表，将协助您从十个方面来了解自己的心理健康程度。本测验适用对象为16岁以上的用户。

本测验共90个自我评定项目。测验的九个因子分别为：躯体化、强迫症状、人际关系敏感、抑郁、焦虑、敌对、恐怖、偏执及精神病性。每一个项目均采取5级评分制。

焦虑量表

焦虑是人们面对不明朗因素或威胁时所作出的正常反应。医学心理学理论认为适度的焦虑有利于人的成长与发展，但长期、超负荷的焦虑则会损害人的健康。

显性焦虑量表(MAS)

泰勒按理论构建的量表。5位专家根据卡墨尼的显性焦虑概念来评价MMPI由中的项目，并按照一定标准从中选取了 65 个能够反映显性焦虑的项目。

贝克焦虑量表(BAI)

由美国阿隆贝克等于1985年编制，是一个含有21个项目的自评量表。该量表用4级评分，适合具有焦虑症状的成年人，主要用于测量受测者主观感受到的焦虑程度

测验焦虑量表(TAI)

由美国佛罗里达州大学的著名临床心理学家施皮尔伯格于1980 年编制完成，是目前国际上最有效且应用最广泛的考试焦虑量表。中文版 TAI 由叶仁敏修订，有较好的重测信度、内在一致性与稳定性。

10、发育量表

发育量表的主要作用在于评估婴幼儿心理发育水平，早期发现儿童心理发育迟滞，为及时进行早期干预提供依据和指导。

格赛尔发展量表

是世界上第一个婴儿智力量表，适用于4周至3岁的婴儿，主要诊断四个方面的能力：动作能力、应物能力、语言能力、应人能力。四种能力对于每个时期的儿童都有相应的行为范型。测得的结果以发育商数（DQ）表示，DQ=（测得的发育成熟年龄÷实际年龄）×100

贝利婴幼儿发育量表 BSID

该量表用于评估2月～2岁半婴幼儿的智力发育水平，确定婴幼儿智力发育迟滞或偏离正常水平的程度，并帮助制定相应的早期干预措施。评估婴幼儿智力发育水平相对较全面和精确，但不用于预测其未来的智力或行为。实施方法较复杂，需专业培训。

丹佛发育筛查测验 DDST

此测验旨在早期发现儿童（2月～6岁）的智力发育的问题，如是否有精神发育迟滞。其特点为个别实施测验，易于实施，评分和解释方便，检查时间短，一般只需10分钟～半小时。可作为医务工作者进行儿童行为发育检查或精神发育迟滞的筛查工具。

（六）心理测验的应用

测量在心理咨询中的应用

自我认识、人生规划、神经症、人格障碍等

测量在人事测评中的应用

人的心理特点的评估、工作人员的绩效评估

测量在教育评价中的应用

测量学生的学习与发展状况、对教师与管理者的评价

后记

心理测量由于是应用心理学的范围，所以起点会比较高，难度看上去似乎挺大，不过我们考研只是对基础知识的掌握，针对书中很多具体编制方法和原理，一时搞不懂可以跳过，以免把时间浪费在无关紧要的东西上，对于很多东西主要了解就可以了，很多心理学家研究一辈子的东西，我们也不可能在短时间内就全部掌握，知道个大概，就能应付掉考试了。看一道2011年的真题吧。
从测量内容上来看，SCL-90属于（）
A、智力量表 B、人格量表 C、兴趣量表 D、心理健康量表
这题目几乎是送分题了，所以基础知识才是考研的核心所在。以后没事就多练练题。

介绍
林传鼎（1913.10.29-1996.3.11），中国心理学家。 1913年10月29日生于福建省闽侯县。1938年毕业于清华大学心理学系。1944年获辅仁大学硕士学位，1949年获比利时卢万大学博士学位。回国后任辅仁大学心理系主任、教授。现任北京师范学院心理学教授、教育科学研究所名誉所长，兼任中国社会心理学会副会长。他专长心理测验与情绪研究。在开拓和发展中国心理测验的研究工作方面有很多成果。40年代初期，他与王征葵合著《心理测验增注目录》，编入了3575个心理与教育测验，是当时较完备的心理测验的工具书。他还对中国古代唐宋至清朝34位历史人物通过历史评估与心理测量的方法进行了心理特质的心志图。

光爱哈赫 · 发表于 11-8-11 00:59:40

本帖最后由光爱哈赫于 2011-8-11 00:59 编辑

占楼备用

光爱哈赫 · 发表于 11-8-11 01:01:28

本帖最后由光爱哈赫于 2011-8-31 23:24 编辑

勘误楼（备忘）
已知的错误已经在网页版上改正了，word和PDF等修订时统一改正。
教育心理学成熟不是学习
实验心理学 *低强度刺激的正确拒绝率+低强度刺激的强度值
普通心理学不随意注意

光爱哈赫 · 发表于 11-8-11 01:01:33

占楼备用

暮雨残剑 · 发表于 11-8-11 12:31:01

楼主辛苦啊～

		自动登录	找回密码
密码			注册

[考研笔记] 2012GG心理学背诵宝典（100小时搞定）【第二版完成！！！】（不会再出新版）

评分

评分

评分

评分

评分

评分