本帖最后由 robin526 于 2013-10-3 09:48 编辑
胡菠萝油 发表于 2013-10-2 23:50
谢谢答复!
对于第一点,我还是不太理解,如果总体方差未知与否不影响样本均值分布形态,那么t检验的存在 ...
因为总体方差未知时需要用样本方差对总体方差进行估计,虽然这是无偏估计但也会存在误差,由于误差的存在导致这时估算出来的参数与正态分布的参数模型吻合度不够,但与t分布的参数模型相对比较吻合,所以在做相关的统计推断的时候采用t检验进行统计会比用正态分布好. 同样的数据经过不同处理计算出来的参数最终会有不同的性态,因此需要用不同的理论模型来对新得到的参数进行相关的推断检验.比如同样两列数据,可以直接t检验看平均数是否有差异,但也可以对数据进行相关处理整理成其他类型,比如整理成次数数据,然后我们可以对新得到的统计参数计算卡方值从而进行卡方检验,但是数据本身没有变,变的是我们处理数据的方法.
要分清楚采取的统计方法和样本本身的性态之间的区别,统计推断本身就是一个不完全精确的方法,统计是根据现有掌握的数据的情况来选择比较适合所掌握数据的统计模型,事实上任何数据都能使用任何统计方法,只不过是精度和统计效度不同罢了,其实如果你深入去分析各种统计模型会发现其实各种模型是相通的,一种是另一种的特殊情况,只不过每种模型对不同的数据类型符合程度不一样.之所以规定什么情况使用什么统计方法和统计模型是因为这样做统计效度最大,结论也就最可靠,但并不代表样本本身也发生了改变,一旦总体和抽样确定了样本也就确定了,因此性态比如说分布情况也就确定了.不用太深究这些,因为这是数理统计讨论的东西,不做相关的理论研究的话不需要考虑这些问题,只要知道什么数据该用什么方法就对了
|