悠弥北北 发表于 2013-11-1 18:59
那你看看A是怎么排除的?除了常识以外,你用公式是怎么推出A的呢?
对于统计结果的可靠性计算比较复杂,对于不同的系统要建立其相应的可靠性模型.并且还需要相应的可靠性数据,在这个基础才上可以进行可靠性计算。目前来说可以简单直接确定显著检验的可靠性的标准只有显著水平α,这也是显著水平的实际意义,代表着结论的可靠性,这就是检验前为什么要确定显著水平的大小.但0.05水平的α不管怎么说都说不上是不可靠的水平.因此出题目的人有点概念混乱和想当然了
B的说法本身就是不对的,不可能会存在样本越大显著结果越不可靠.事实上正好相反,样本越大统计结果会越可靠,因为样本越大由于随机误差造成的影响就会越小,样本也会越好的代表总体,而且样本越大抽样会越接近理论分布模型,因此应用理论分布模型进行推断统计的结果也就越可靠.理论上是样本趋于无穷大统计结果是最完美的,而现实意义的样本无穷大就是全面抽样调查,这是最可靠的结果.
当然样本大了可能会存在一种情况就是很小的差异也显著了,但很小的差异大多情况下是没有现实意义的.但这不代表统计检验的显著是不可靠的,假设检验只是实际统计的一个步骤,衡量一个实验不仅仅要看结果是否显著,还要考虑结果是否有实际意义,而这个实际意义不是假设检验做的,而是通过计算效应值大小来确认的.因为经济和现实的原因存在实际中不可能做到完全调查,因此需要在考虑各方面因素的前提下确定最小样本量然后用部分取样来对总体进行推断,但推断的过程中会存在因为随机因素而造成的差异带来的误差,假设检验的目的是用来检验差异到底是因为随机误差产生的还是因为真正的实验操作产生的,当确认差异不是因为随机误差造成的,这时候就可以计算此时的效应值,以确定这个差异是否有现实意义.两者是数据分析的两个方面,就好比测量的信度和效度,通过假设检验确定的东西至少证明是否存在并且稳定可靠,而是否有效则是通过处理效应大小来衡量.因此统计检验的可靠性和处理结果的有效性是不同的两个方面.
要真说这个研究存在什么问题的话,问题不在于因为样本过大可能会造成显著检验不可靠,问题在于因为样本大了,选取的显著水平太低了.0.05的显著水平一般是用在不是很大的样本统计中的,这样可以统计工具更敏锐.但在大样本统计中由于样本很大,统计工具本身就很敏锐了,这时候为了保证结果的实际意义一般会选用更严格的显著水平,比如0.01 ;0.001甚至0.0001,这样就能使统计工具只对我感兴趣的变量尺度产生反应,而对于那些小的但实际存在的处理效应予以忽略.但就跟上面所说的,这不表示显著就不可靠了. |