Free考研资料

标题: 【即将复试的同学来看看】什么是p？ [打印本页]

作者: seeya9 时间: 14-3-6 12:32
标题: 【即将复试的同学来看看】什么是p？
本帖最后由 seeya9 于 14-3-6 13:57 编辑

今天上课，老师抛出了一个问题
p<0.05
这个p是什么意思？
更高的要求是，请用三句话，向一个完全不懂统计的人解释。

最后本科生，硕士生全灭
只有博士几个回答的还不错。

如果要我出复试题，我就问这个
你知道什么是p么？
（先不要查书哦，不要怕错，可能我的想法也不对）

作者: wf9 时间: 14-3-6 12:56
拒绝原假设，接受备择假设可能犯的错误率？

作者: 常无道天 时间: 14-3-6 13:12
本帖最后由常无道天于 14-3-6 13:18 编辑

1. 我们进行了一项研究，得出了一个结论。
2. 研究条件有限，没有办法对所有要研究的对象进行研究，因此这个结论是通过对总体中一部分人研究后获得的。
3. 把一部分的结论推广到全体有风险，比如，虽然对这一部分人的研究支持该结论，而在事实上对于全体研究对象而言结论是不成立的。发生这种错误的可能性就是p。

作者: seeya9 时间: 14-3-6 13:34
本帖最后由 seeya9 于 14-3-6 13:38 编辑

wf9 发表于 14-3-6 12:56
拒绝原假设，接受备择假设可能犯的错误率？

这个是背书……面对的人可能根本不知道什么原假设和备择假设

作者: seeya9 时间: 14-3-6 13:37
本帖最后由 seeya9 于 14-3-6 13:42 编辑

常无道天发表于 14-3-6 13:12
1. 我们进行了一项研究，得出了一个结论。
2. 研究条件有限，没有办法对所有要研究的对象进行研究，因此这 ...

我再考虑一下……

作者: 常无道天 时间: 14-3-6 13:48

seeya9 发表于 14-3-6 13:37
我再考虑一下……

我明白p是发生一类错误的概率…

这么表述确实不太精确。不过要再特别分开有差异的结论和没差异的结论就很难用三句话说完了。因为之少得分两种情况……
其实我是假设得出结论就是有差异来着，不过确实不太严谨。

作者: seeya9 时间: 14-3-6 13:56

常无道天发表于 14-3-6 13:48
我明白p是发生一类错误的概率…

这么表述确实不太精确。不过要再特别分开有差异的结论和没差异的结论 ...

上面说的没有看出问题；但是假设检验的范围是很广的。
例如我们会判断；两组人的身高是否相同？也会有一个p值；就很难对应到你说的框架里面

作者: 常无道天 时间: 14-3-6 14:04

seeya9 发表于 14-3-6 13:56
上面说的没有看出问题；但是假设检验的范围是很广的。
例如我们会判断；两组人的身高是否相同？也会有 ...

具体来说呢？两组人是不是全体被试…？

如果是，而且对这两组人的全体进行身高测量然后得出两组人平均身高相同或不同的结论的话，那么这里本来就不存在抽样…也就根本没有p值一说了吧。相同就是相同，不同就是不同。

如果这两组人很多，从每组人中抽取10个人测量身高，然后看这10个与那10个是不是相同的话。这中间也就存在了抽样。假如对样本测量结果是两组身高不同，那么这里不也就有个p值了么。

不知道我这样有没有理解错你的假设检验……如果理解错了的话还请具体说一下……

作者: govycm 时间: 14-3-6 14:07
哪天的YY没录音吗？求

作者: hankyoung1324 时间: 14-3-6 14:42
本帖最后由 hankyoung1324 于 14-3-6 15:01 编辑

以样本推测总体分布的情况，假设各组之间无差异，经过检验判定原假设时犯错误的概率

作者: qz2004 时间: 14-3-6 14:57
可以参考Nature上去年的一篇东西：
Scientific method: Statistical errors

P values, the 'gold standard' of statistical validity, are not as reliable as many scientists assume.

作者: 团子小球 时间: 14-3-6 18:14
重做这个实验100次，有95%的可能会再得到这个结果。。

作者: lssj815 时间: 14-3-6 18:27
我们通过实验得出了一个结论，这个结论可能符合事实，也可能不符合。符合的概率是95%，而犯错误也就是没有正确反映实际情况的概率是5%。

作者: qz2004 时间: 14-3-6 18:41

团子小球发表于 14-3-6 18:14
重做这个实验100次，有95%的可能会再得到这个结果。。

错了，见我给的那篇文章

作者: qz2004 时间: 14-3-6 18:42

lssj815 发表于 14-3-6 18:27
我们通过实验得出了一个结论，这个结论可能符合事实，也可能不符合。符合的概率是95%，而犯错误也就是没有 ...

错了，第一类和第二类错误都是错误，0.05只是犯其中一种的概率

作者: heady大头娇 时间: 14-3-6 19:10
有一件事情发生的概率小于0.05，基本上可认为它不会发生。我们做了一个小假设，如果计算结果却发生了这只有0.05概率会发生的事情。所以不好意思你的假设可能要被推翻了。
不知道这样理解行不行。我还是去翻翻书先

作者: qz2004 时间: 14-3-6 19:17

heady大头娇发表于 14-3-6 19:10
有一件事情发生的概率小于0.05，基本上可认为它不会发生。我们做了一个小假设，如果计算结果却发生了这只有 ...

你这个说法是对的

我们的原假设（比如两个或者多个总体，没有差异/不存在相关）为事件A
我们的实验结果（基于样本的实际计算出的统计量）为事件B

那么
P（B|A）<0.05则拒绝原假设，即我们认为A是不成立的。

很多人可能会把P值理解成P(A|B)，这实际上是一种非常严重的误解。

作者: qz2004 时间: 14-3-6 20:04

yd340532999 发表于 14-3-6 20:02
你说的很对但是P(A|B)和P(B|A) 我没听说过啊这个可以解释一下吗

概率论常见的写法
P(X|Y)指已知发生Y事件的条件下，X事件为真的概率

作者: qz2004 时间: 14-3-6 20:23

yd340532999 发表于 14-3-6 20:11
那你说的是在原假设的条件下得出拒绝原假设的结果的概率?

恩，我是这么理解的
“h0正确时，它被拒绝的概率不超过α，称α为显著性水平。”

p<0.05的那个p值实际上是h0正确，但被拒绝的概率
P（B|A）在我说的例子里，是指h0正确，但得到一个p<0.05的样本的概率。
因为得到这样的样本等价于被拒绝，所以P（B|A）就是P值对应的那个概率。

如果有错误请指正，因为我也并非统计相关专业背景的~
——————————————————
P（A|B）对应的是，已知得到现在的样本，h0成立的概率。这个概率实际上和P（B|A）很不一样。
p值小于0.05，不意味着h0不成立，也就是h1成立的概率是95%，但很多人潜意识里是这样理解的。。。

作者: qz2004 时间: 14-3-6 20:56

yd340532999 发表于 14-3-6 20:51
时间A是假设无差别？事件B是p小于0.05 ？那 p ba 是说在假设无差别的前提下得出小于0、05的结论 ...

恩，差不多是这个意思
犯一类错误概率小不意味着你再做一次，重复出同样结果的概率大（至少不是95%）。
但很多时候大家是会有这样的误解的。

作者: 胡菠萝油 时间: 14-3-7 15:26
第一句话：我们得出了一个结论
第二句话：这个结论有可能是对的，也有可能是错的
第三句话：但是我们用统计的方法可以证明，这个结论错误的概率小于5%

作者: seeya9 时间: 14-3-7 17:20

胡菠萝油发表于 14-3-7 15:26
第一句话：我们得出了一个结论
第二句话：这个结论有可能是对的，也有可能是错的
第三句话：但是我们用统 ...

但是我们用统计的方法可以证明，这个结论错误的概率小于5%
你不知道这个结论是不是对的，也不知道概率是多少，因为同时包含了一、二类错误。二类错误无法估计

作者: cdcdcdcdcd1 时间: 14-3-7 22:05
看头像就知道都是90后拉····

作者: 胡菠萝油 时间: 14-3-7 22:56

seeya9 发表于 14-3-7 17:20
但是我们用统计的方法可以证明，这个结论错误的概率小于5%
你不知道这个结论是不是对的，也不知道概率是 ...

p值的定义包含了二类错误么？

作者: seeya9 时间: 14-3-7 22:56

胡菠萝油发表于 14-3-7 22:56
p值的定义包含了二类错误么？

不能包含……但是你的答案和前面的人相比，没有强调出它必须是一类错误

作者: seeya9 时间: 14-3-7 22:57

cdcdcdcdcd1 发表于 14-3-7 22:05
看头像就知道都是90后拉····

噗噗~我么？

作者: 胡菠萝油 时间: 14-3-7 22:57

seeya9 发表于 14-3-7 22:56
不包含……

既然不包含二类错误，那就可以直接说结论错误的概率小于5%吧？

作者: seeya9 时间: 14-3-7 23:01

胡菠萝油发表于 14-3-7 22:57
既然不包含二类错误，那就可以直接说结论错误的概率小于5%吧？

逻辑反了~是你要解释p，所以你必须说明p只能是一类错误，而不能含有其他错误类型的才是p

作者: 胡菠萝油 时间: 14-3-7 23:02
本帖最后由胡菠萝油于 14-3-8 10:02 编辑

seeya9 发表于 14-3-7 22:56
不能包含……但是你的答案和前面的人相比，没有强调出它必须是一类错误

我是这样觉得的，“p值是一类错误概率”是统计学规定，如果要给一个不知道统计学的人介绍p值，不必要把“一类错误”这个概念强调出来，不然对方可能会更加不明所以。所以我说“我们得出的结论可能是错的”，因为这实际上就是一类错误的通俗表达。

（之前没看到你回复的后半句，所以重新编辑了一下）

作者: qz2004 时间: 14-3-8 00:34

胡菠萝油发表于 14-3-7 23:02
我觉得在解释p值的时候不必提及二类错误。
因为二类错误和一类错误的前提是不一样的。二类错误的前提是 ...

不从1类2类错误的角度来说

首先，正确的描述是这样的：
如果原假设为真，则我们的实验观测到了小概率事件（0.05），所以我们拒绝原假设。
这里，0.05是“原假设为真的条件下，发生我们实际观测到的样本的概率”

和
我们观测到某个事件，并依据这个事件下了结论原假设为假的结论出错的概率是多少？
这个概率是“我们观测到这个样本的条件下，原假设为真/假的概率”

这两个概率本身是不一样的，所以你下的结论出错的概率不是0.05

作者: 胡菠萝油 时间: 14-3-8 10:09

qz2004 发表于 14-3-8 00:34
不从1类2类错误的角度来说

首先，正确的描述是这样的：

“这两个概率本身是不一样的，所以你下的结论出错的概率不是0.05”——p值的定义就是第一个概率呀。
我觉得这个问题讨论至此，已经变成了“请说明p值的定义为什么是一类错误？为什么不能包括二类错误？”就我的理解而言，这种基础概念的定义就是为了使用方面而设定的，更多的讨论或许意义不大。

作者: lssj815 时间: 14-3-8 17:20

qz2004 发表于 14-3-6 18:42
错了，第一类和第二类错误都是错误，0.05只是犯其中一种的概率

恩是我考虑不周了
还是基础不过关%>_<%

作者: lssj815 时间: 14-3-8 20:18

qz2004 发表于 14-3-8 00:34
不从1类2类错误的角度来说

首先，正确的描述是这样的：

仔细把后面这两面的帖子都看了感觉重点是要强调P的前提是可能发生一类错误，或者说，P的前提是我们做出了拒绝H0的决定。改成这样，请教是否可行：
1、我们选取了一个样本进行研究，并且事先按照一般情况假定了这个样本的可能值。（即H0)
2、但我们实际得到的数据，按照原假设推算，发生的概率比0.05还要小（即发生小概率事件）
3、在这种情况下，我们可以认为原假设是错的，这个样本与所谓的一般情况并不一样。(当然也可能确实发生了小概率的事件，样本和总体是一致的，但这个概率只有0.05.）

作者: lssj815 时间: 14-3-8 20:21

胡菠萝油发表于 14-3-8 10:09
“这两个概率本身是不一样的，所以你下的结论出错的概率不是0.05”——p值的定义就是第一个概率呀。
我 ...

这两个概率是不一样的，所以如果用”结论错误“的说法的话就把这两种情况都包括进去了，既可能是第一种情况，也可能是第二种情况。你也说了p就是第一种情况，但是第二种情况（也就是不是p的情况）也被包括在这个说法之内了，所以笼统的说”结论错误“是不行的。我犯的错和你一样。

作者: qz2004 时间: 14-3-8 22:48
查了下资料，仔细想了下
首先是
第一类和第二类错误
第一类错误 H0成立但你认为不成立，即你拒绝了实际为真的假设
第二类错误h0不成立但你认为成立，即你接受了实际上不成立的假设
——————————————————————————
而“推断出错的概率”的意思，和两类错误都有关系
首先这取决于你的推断是什么：

第一种情况，你认为h0不成立，即拒绝原假设的情况下
p1概率你认为h0不成立但实际上是成立的推断错误
1-p1概率你认为h0不成立，实际上确实h0不成立推断正确

第二种情况，你认为h0成立，即接受原假设的情况下
1-p2概率你认为h0成立实际上确实成立推断正确
p2概率你认为h0成立，实际上不成立，推断错误

记住，“推断错误的概率”，是已知推断，而事实未知，可能事实和推断相同也可能不同，各自有个概率。
——————————————————————
再看p值
“h0成立，那么我们得到这样的样本的概率小于0.05，于是我们拒绝原假设”
实际上
p 是 h0成立，我们做出h0不成立的推断概率
对应的另一部分
1-p 是 h0成立，我们做出h0成立的推断的概率

这样对比就一目了然了，p和p1、p2均不相等！
因为p指的是已知事实（假设h0成立），样本未知（等同于推断未知），给出拒绝和不拒绝两种可能，各自有个概率。
————————————————————————————
所以简单的说
“p值是指我做了一个假设，根据样本做了推断，推断出错的概率是0.05”
的描述是绝对有问题的
——————————————————————————————

@ lssj815
@ 胡菠萝油

作者: lssj815 时间: 14-3-9 01:09

qz2004 发表于 14-3-8 22:48
查了下资料，仔细想了下
首先是
第一类和第二类错误

学长你的意思我应该是明白了，其实也就是说，p和结论是否错误的概率是不一样的，因为结论错误的概率是P（A|B），而P是P（B|A），对吧？
但是讨论到这里我觉得还是有一点疑问和一点悬而未决
疑问是：在张厚粲老师的教材里，对于一类错误的概率是这样说的：“阿尔法（p）是拒绝H0时犯错误的概率，这时前提是H0为真”。但依照P（A|B）来考虑，我们实际实验的时候都是不知道事实、只能以结果来推断事实的，那么H0为真也就无从考证，这样子的话一类错误还能用来解释实验结果么？
悬而未决的是：貌似seeya9学长提出的问题还没解决啊……之前的回答无论正确与否似乎从第二页开始就只是努力地把P合理嵌套进三句话里而不是用三句话来解释P了……

P.S.学长这个论坛是没有@系统的，你@我和胡菠萝油我们也不会收到通知的说

作者: 胡菠萝油 时间: 14-3-9 13:11

lssj815 发表于 14-3-9 01:09
学长你的意思我应该是明白了，其实也就是说，p和结论是否错误的概率是不一样的，因为结论错误的概率是P（ ...

P(A|B)和P(B|A)的总结一针见血，我明白你的意思了:-)
对于你提出的悬而未决，我想只需把我们原来的表述中的“结论"更精确地表述为”差异显著”或是"处理具有显著的效果"等说法即可。
而对于你提出的第一个问题，就我的理解而言，本质上是：为什么我们只强调一类错误的概率？既然H0也有可能是错的，为什么我们不进一步讨论一类错误和二类错误可能性的总和？（如果误解了你的原意，还请留言指正~）
对于这个问题，我的看法是：因为每一次推论只可能得出一个结论（差异显著/差异不显著，二者择其一），所以结论只可能对应一种错误（一类错误/二类错误，二者择其一）。于是，在计算结果差异显著的情况下，我们只需关注一类错误的概率（p值）即可；没有必要再去考虑二类错误概率，因为二类错误的前提是“计算结果差异不显著”，已经不可能存在二类错误。在计算结果差异不显著的情况下，则相应反之。
综上，在一次具体的计算中，不会出现一类错误和二类错误同时存在的情况，所以也不需要从H0真伪的角度出发分别讨论两种情况。我们所需做的，只是从计算结果的角度出发，核查这个结果的前提是否足够牢靠而已。

欢迎光临 Free考研资料 (http://bbs.freekaoyan.com/)