Free考研资料

标题: 张厚粲《现代心理与教育统计学》中的一些问题解答 [打印本页]

作者: 东菱要考研 时间: 14-7-9 16:19
标题: 张厚粲《现代心理与教育统计学》中的一些问题解答
本帖最后由东菱要考研于 14-7-30 09:52 编辑

【声明】未得允许，禁止转载……粘贴到考试点的请尽快删除

1.书上92面说”标准差是平方根，不可以进行代数运算“，93面提到它的有点”适合代数运算“，哪个是对的，为什么？
答：总标准差的合成是先转化为方差进行合成，再开平方转化为标准差的。第一个说的是“不可以”进行代数计算，这应当是准确的。第二个地方实际是说标准差和方差的共同特征，看它举例时就说“方差或标准差”，标准差也有很多用途的，也可以将其平方转化为方差进行运算，所以用了“适合”二字。其实进一步的“运算”应当指的是“可加性”和“可分解性”，方差具备而标准差不具备。这个问题其实可以忽略的。不会考到这种程度。

【笔版点评】1、教材前后自相矛盾，我等能怎么办？只好跳过。考试命题也会尽量避开这种有争议的地方。

2.P97标准分数的有点中提到”稳定性“：原始分数转换成标准分数后，规定标准差为1，保证了同性质的分数在总分中的权重一样。
---为什么标准差为1就保证了权重一样？
这个老师有举例，两科原本都100分，一科平均85，一科平均5，相加时权重就变了。这个理解，但是跟上面的解释对不上。

答：这里不是说标准差为1，就保证了权重一样。只要标准差相同，则权重一样。标准分数的标准差为1，分布中的每一个个体与标准之间的距离相等，所以权重是一样。先要理解什么是权重（权重是指该指标在整体评价中的相对重要程度。），标准差基本概念。
例子中，两科平均数不同，相加的时候首先要转化为Z分数，标准分数不同，加权时候权重自然不一样。例如99页例题考试成绩几门科目平均数不同，标准差不一样，加权时候权重也不相同。

通俗来说所谓权重呢就是重要性。比如一次考试中考了：英语、语文、还有选修的法律，可是在计算总分的时候这些数据的重要性不同。比如大学时候的学分，必修课乘以80%选修课乘以20%，这样必修课和选修课权重是不同的。
必修课的语文英语都是80%，那么这里权重是一样的。
标准差为1占了分布中的34.13%，那么相乘的时候都是这一个比率，重要性一样，所以说标准差相同权重一样。不理解？仔细回忆下分布图。
标准差描述了分布中的每一个个体与某一标准之间的距离，也就是每一个个体偏移某一标准的距离。这个标准便是分布中的均值。标准分数的标准差都是1，这样一来，标准差相同了，也就是每一个个体与分布中的标准之间的距离相等。

3.P172正态分布的应用中有一点是”测验分数的正态化“：当原始分数不服从正太分布时，先将原始分数的频数转化为百分等级，将其视为正态分布的概率，找对应Z值，转换成Z分数，达到正态化目的。正态化是利用改变次数的方法，将原来偏态分布中众数锁片的一边拉长。
---”改变次数的方法“要怎么理解呢？为什么转为百分等级--P---Z，就正态化了？p--Z,是标准正态分布中相对应的我理解。
答：正态化，采用一定的统计方法将非正态的原始数据转化为正态。将数据转化为百分等级p，然后就可以查表—正态分布表知道了p数值，就可以查到对应的z值，这样就正态化了。
【笔版解答】将原始分数转化为百分等级，并没有将分数正态化。根据百分等级去查标准正态分布表，这一步才是将分数正态化。

4.“态度”是不是可以根据不同的标准划分为称名数据和顺序数据？
----因为讲义中在顺序数据是提到态度，顺序数据中（分成赞成，倾向赞成，中立，倾向反对，反对）也提到。如果按照这个意义的话，顺序数据，等距数据，等比数据都可以转为称名数据吗？（会丢失信息）
称名数据，等距数据，等比数据，顺序数据，这四个是按测量水平区分的，那是不是这四个都属于测量数据？“测量数据既可以是离散型数据也可以是连续型数据”是这么理解的吗？
答：顺序数据、等距数据、等比数据可以转化为称名数据。也不都属于测量数据，离散或连续，这是按照不同标准来划分的。有些数据类型或可以划分到其他。
【笔版解答】称名数据、顺序数据、等距数据、等比数据这四种数据的精度依次提高，高精度的数据可以转化为低精度的数据，但要损失一定信息。比如我可以把1米8以上的人全部称为“高个子”。

5.讲义P214提到统计表的种类中的第二种分组表：只有一个分类标志分组的统计表。但下面的例子是不是错了，有两个分类标志，一个是性别，一个是班别？
例子错误。复习中就应该有这样的批判性思维，哪怕书本老师都有可能出错。甚至久已形成的理论，做学问研究批判性思维是必不可少的。

6.关于条形图，老师讲的例子是“各年级英语通过率”，讲义中是“智商分布理论百分比”和“不同地区四季销售百分比”
----条形图是用于表示离散型数据，老师说“通过率”是离散型数据，我觉得不对。
另外关于被表示的离散型数据是指用横轴表示的是吗？比如年级，季度。如果是这样的话，智商怎么会是离散型数据呢？
答：条形图横轴表示类别，比如学习中优良中差，纵轴是数量轴。
离散型数据，这类数据任何两个数据点之间所取的数值个数是有限的。通过率显然并不适用此概念。
智商按照理论上来说，从最高到最低都可以细分，所以属于连续性数据。一般情况下计数数据大都是离散数据。

智商理论上来说是连续数据。不过仔细一想，也是可以用条形图。因为我们在普心中将人的智商分为7类：天才、优异、中上、中下、中才、中下、临界、智力落后。若是按照这一标准来划分，在这一情况下可以用条形图。
条形图横轴分类轴，分类就是类别，比如学习的优良中差，上述智商中的7等。季节属于离散数据，因为只有春夏秋冬嘛。类别不一定非要是“等级”。年级一二三四是分类，季节、智商七等都是类别。通过率肯定不是离散数据，这里所说的离散主要是分类轴。
（我手中并无那些讲义，所以上次回答欠周全）

7.确定测验题目难易度第四步把Z分数加5“得到从0-10的十选制。。”这个若不是十选制，比如100，那应该怎么处理呢？
答：同样方法。那个比如100，难度分数值不可能那么大。你可以结合实际思考。
测量中题目难度，难度计算公式通常用通过率表示，通常都是小数。加5只是为了去掉负号。

8.P186概率分布讲到样本平均数分布中总体分布为正态，方差未知，样本平均数的分布为t分布。
-----但是，前面提到t分布的平均值为0，而样本平均数的平均值是总体平均数，并不为0，这要怎么理解呢？

答：t分布的特点均值为零，这点没问题。
在总体分布为整体，方差未知的情况下，样本平均数的分布为t分布。t分布的形式随样本容量的变化而变化。无限多个样本平均数平均数就是总体平均数。
这里的t分布指的是典型的，但是从中抽取的样本随样本容量的不同形式也有所变化。样本的平均数有无限多个可能，但在做统计推断的时候是用样本估计总体。样本平均数只要计算就可以了，无论是何种类型数据。
所以t分布的均值为0,样本平均数的均值计算就可以了（有多做情况，有可能为0，跟样本容量有关的）。
【笔版解答】t分布和正态分一样，是一簇分布而不是一个分布，其平均数不一定是0.

9．P234例8-5用Z’检验，为什么分母不是除以n-1？
答：z检验和t检验基本公式。近似Z检验，公式同z检验。t检验分母才是n-1.
基本公式这是。

追问：——我理解的是，总体方差未知，用样本标准差代替总体标准差时是n-1。图上的这道题就是总体方差未知，用样本标准差代替总体标准差，那为什么不出于无偏估计，除以n-1呢？还是说由于样本容量较大，可以直接替代?
答：你有混淆了分类。
平均数的显著性检验分为三种情况：
第一种是：总体正态分布总体方差已知这时候用Z检验；
第二种：总体为正态分布，总体方差未知用t检验；也就是你说的n-1。
第三种情况总体非正态，这时候只有n≥30时才可以用近似z检验，n＜30时，只能用非参数检验法.
近似Z检验。题目中的例题属于第三类情况，只有n≥30时，这里根本不会用t检验。样本容量小也只能用非参数检验方法了。Zt检验基本公式。N-1的那是t检验公式。
【笔版解答】可以参看帖子http://bbs.freekaoyan.com/forum. ... tid=749847#lastpost

10.我们说用T检验，Z检验，F检验等是因为相关分布属于或近似T分布，正太分布,F分布是吧？
P248积差相关系数显著性总体相关系数等于0时检验用T检验是因为这时样本相关系数r的分数是t分布吗？书上说是近似正态分布，为什么不用Z检验呢。
答：为什么不用z检验？因为总体ρ=0时候，r分布近似正态，ρ不等于零时候，r分布不是正态分布。
例题中总体相关系数是否为零未知，可能为0或许相关，所以才要对样本显著性检验，不用z检验。
【笔版解答】其实在“近似正态分布”的时候，用Z检验和t检验的结果是很接近的，两个方法都可以用。你可以试一试。

11.P300 例10-3卡方值为什么查0.005水平的呢？后面有一些例题也是这样。
答：为什么查0.005？这是根据检验所要求的标准，也可以用0..或0.05，但是用0.005，拒绝虚无假设时候犯错误概率为0.005不是更低？为了科学性。

12.
一元线性回归方程的检验
总自由度是N-1，误差自由度为N-2
---对于N-2的解释，有说“Y尖的计算用到Y拔和b，所以是去两个自由度”有说“用到a和b”哪一种是正确的呢？（我想的是用到X拔和Y拔）
答：嗯，像这样基本的公式记住就可以了，毕竟是应试。你若要细究，自由度指的是计算某一统计量时，取值不受限制的变量个数。这个公式中残差的和方，用到Y拔和b去两个自由度。

13.
回归方程的应用
用样本回归方程推算因变量的回归值，老师的PPT用到的是t，而书上用1.96,2.58，Z检验。到底是哪一个呢？
答：回归方程的应用有点预测和区间预测，点预测只需要带入回归模型；区间预测，要用t见教材377页公式。

14.
“对于适合用参数检验的资料，如用非参数检验会造成信息的丢失，犯第二类错误的概率增大”这么说是β增大，为什么这个概率会增大呢？
答：第二类错误又称取伪错误，虚无假设原本错误却接受。
似乎教材原文是说如果所得材料不满足参数检验前提条件，若冒险使用会增大错误结论的概率。答：第二类错误，也就是取伪错误，虚无假设原本错误却接受。
适合于参数检验的资料，用了非参数检验，丧失了很多有用信息，原本显著的具有可能变为不显著，这样犯第二类错误的概率增大。
这里重点在于丢失信息，（通俗的理解，比如有一个沙漏，一堆砂砾和细沙（数据），你有两种工具选择：一、小玻璃杯（参数检验），或网状杯子（非）。原本用玻璃杯去乘那些细沙就不会丢失，杯子能够装满。若是用了网状杯，里面细沙（一些信息）丢失了。那么原本可以满的就可能不满。（对于这题……统计实在复习不到位，只能类比，是否恰当？）
【笔版解答】这个问题过于复杂，本科生无法理解，建议不要追究。简单地说就是，在能用参数检验的时候用了非参数检验导致部分信息丢失，精度下降，所以犯错误的概率增大，所以β增大，α是你自己设定可以不变。

这里特意感谢笔版的解答，为了大家方便阅读，把笔版的解答放在了一起。另外，大家若发现有错误地方，欢迎指正交流……

作者: 笔为剑 时间: 14-7-9 16:26
这些问题都提得很好。欢迎大家多多发表自己的见解！

我在12楼给出了一些解答。

作者: 筱雨一 时间: 14-7-9 19:26
我才刚看完行为科学统计

作者: 东菱要考研 时间: 14-7-10 13:48
15、心理统计中p322提到的简单合并法的条件之一是相应比率相近。如p323中的例子。什么才算是比率相近呢？我觉得那个例子差别挺多的……
答：这个不能是用觉得来说……因为统计学中差别是否多（准确说是差异显著或样本齐性）都要用某种统计方式来检验；所以，323页中的例子用了方检验，差异未达到显著水平，所以属于样本齐性，也就是比率相近，故可以合并。
比率相近，换句话来讲就是比率之间差异不显著，检验差异是否显著要用到不同的显著性检验方法……参数非参数检验根据数据不同类型选取。

作者: 东菱要考研 时间: 14-7-10 13:50
16：1.心理统计p321例10—13 步骤6中提到“合并之后，因自由度为1,卡方值的计算应该使用连续性校正公式” 为什么这么做呢？求解！
2.统计327分表理论次数合并法中，如表10—8，合并前和合并后的显著水平是不同的。是不是说明只要合并后可以显著就行？其实不用考虑合并前后的卡方值比较的显著水平是否相同呢？是这样吗？求！！！
答：在统计学中每一种统计方法的使用必须要满足一定的条件，卡方检验需要满足三个条件，其中之一便是期望次数大小，当自由度等于1时，每一个单元期望次数至少不应该低于10，这样才能保证检验的准确性。在需要精确值时，应用卡方连续性矫正公式可以得到满意的结果。（或许是为了精确吧，因为例子中的值都大于10）……
第二个问题，几个表数据的合并，只有合并后齐性或者说差异不显著，也就是说同质性数据这样才能合并，因此如果合并后差异显著数据就不能合并，数据不同质。合并后的卡方检验，正是为了检验一组数据是否适合合并，就是说是否满足合并的条件——数据同质。

作者: ZwjLoVeSxn 时间: 14-7-12 19:46

楼主好人

作者: 华丽逆袭 时间: 14-7-13 05:44
谢谢楼主，，，，，，

作者: 东菱要考研 时间: 14-7-16 11:47
17、平均数差异检验什么时候用t 检验，什么时候用z检验啊。。什么大于30用t，z小于30用t之类的

答：平均数的显著性检验分为三种情况：
第一种是：总体正态分布总体方差已知这时候用Z检验；
第二种：总体问正态分布，总体方差未知用t检验；
第三种情况总体非正态，这时候只有n≥30时才可以用近似z检验，n＜30时，只能用非参数检验法
（如果会有提问的问题，还会跟帖）

作者: 东菱要考研 时间: 14-7-24 13:04

华丽逆袭发表于 14-7-13 05:44
谢谢楼主，，，，，，

一些回答还是欠妥……

作者: 东菱要考研 时间: 14-7-25 15:21
18、假设已知一个区间5到8，求它的组中值可以用二分之五加八吗？
答：不可以。
组中值的计算有两种方法：
（1）精确下限加上1/2组距 4.5+3/2=6
（2）精确上限下限之和的一半（4.5+7.5）/2=6
如果按照（5+8）/2 计算的组中值就成了6.5
5-8实际上代表的是【5-8）前开后闭
再不明白可参看教材《心理与行为科学统计》北京大学出版社第15页或者张厚粲教材。

作者: 东菱要考研 时间: 14-7-29 16:42
19题.某学生某次数学测验的成绩的标准分为2.58，则全班同学中成绩在他以下的人数百分比是多少？
答：这道题目跟2013年统考真题61题一样，【某测验用百分等级表示测验结果，某受测者的测验结果低于平均分一个标准差，他在该组被试中的百分等级是】
答案为16
同理，在这道题目中，理既然是正的2.58 也就是高于平均数2.58个标准差按照正态分布曲线正负2.58个标准差之间，包含总面积的99% 那么正的2.58包含49.5
所以答案为：50%+49.5%=99.5

【再次声明，未经允许不要私自转载，这里仅用来学习交流，考试点粘贴过去的请尽快删除】

作者: 笔为剑 时间: 14-7-29 16:55
逐一回答。
不过有时候本人并不喜欢直接告知答案，
而喜欢用启发思考的方式来回答：

1、教材前后自相矛盾，我等能怎么办？只好跳过。考试命题也会尽量避开这种有争议的地方。

2、这是一个很绕的概念，多数人搞不清楚。什么叫“权重一样”？这个请你思考。

3、将原始分数转化为百分等级，并没有将分数正态化。根据百分等级去查标准正态分布表，这一步才是将分数正态化。

作者: bashanhu 时间: 14-7-29 23:27
看看管理员的回复

作者: 东菱要考研 时间: 14-7-30 09:09
本帖最后由东菱要考研于 14-7-30 09:56 编辑

笔为剑发表于 14-7-29 16:55
逐一回答。
不过有时候本人并不喜欢直接告知答案，
而喜欢用启发思考的方式来回答：

多谢版主解答……为了便于大家浏览，将解答的内容放在了帖子里了并标出【笔版解答】

作者: 大宝的梦 时间: 14-7-31 09:34
这个必须点赞，对自己太有帮助了

作者: kerbosun 时间: 14-8-12 21:24
dung!!!!!!!!!!!!!!!!

作者: babybreath1 时间: 14-8-23 21:13
提示: 作者被禁止或删除内容自动屏蔽

作者: 韩梅梅李雷 时间: 14-8-26 23:14
131页的例题里面的求相同等级的个数第三个和第四第五个评价者是不是写错了?

作者: lcc2017 时间: 14-8-27 02:37
楼主大好人~~感谢分享支持好贴

作者: chuanyuxxx 时间: 14-9-7 00:02
求解：张厚粲P133页，肯德尔U系数r ij =111 怎么计算得来的？
P131页:∑T的算式，书上第三个开始12分之23-2，23-2，33-3怎么得来的？我数了很多次也不知道怎么得来的，我觉得是4、3、0，按照讲解。这本书看的稀里糊涂的，实在困难啊！
问各位：心理统计学还有其他易于理解的教材么？考试怎么考，考案例计算么？按照这样的理解进度，到考试还要复习其他的，真的是学不懂啊@

作者: 方块小心 时间: 18-6-20 16:26
好的

欢迎光临 Free考研资料 (http://bbs.freekaoyan.com/)