为什么经常有人黑中医，而黑心理学的较少呢？

上帝偏爱的被试 · 发表于 14-5-7 22:16:12

在知乎看到这个问题，里面一个回答有关统计的P值问题，值得探讨，所以转发到这里给大家看看学习一下。

中医为什么被黑无需赘述了，心理学为什么被黑呢？无论是正说也有理反说也有理的陆琪语录（你逗我玩呢？），看似分析人心鞭辟入里实则泛泛而谈打太极的情感砖家一席谈，还是是打着“心理学”名义挂羊头卖狗肉的等“XX心理学”系列鸡汤文，都给了人们一种心理学是多么漏洞百出的错觉，俨然成为了人们攻击心理学的活靶子。可是，这些活靶子只不过是贴着心理学标签贩卖私货的个人观点罢了，即使把它们黑出翔来也丝毫没有伤到心理学的真身，心理系的学生与学者们依然可以躲在“我们在做科学，你们懂什么”的大旗后面高枕无忧。

但其实，严肃来讲，学术圈里讨论的一部分心理学研究的确是漏洞百出的，对，就是自诩是在严肃做科学的心理学。可惜的是这些最该被黑的地方不仅不为大众所了解，甚至是许多在心理行业的的业内人士也一叶障目，深陷歧途而不自知。

问题出在哪里呢，问题就在于大多数心理学家统计学学的太差，根本就没有理解最基本的贝叶斯公式，完全没搞清P(evidence| hypothesis)和P（hypothesis| evidence）之间的区别就堂而皇之的狸猫换太子，以至于大多数人不假思索的抓起p value 就用时根本就不知道自己到底在讨论什么，差之毫厘谬之千里。

下面开启地图炮模式，攻击范围是正在使用p value的亲们，数死早与玻璃心者止步。

如果你是正在使用p value，并且用的不亦乐乎，那么，请节哀，我要黑的就是你最爱的假设检验。因为用这种方法做出来的研究成果离你们真正要探求的问题南辕北辙，不折不扣就是一坨意义不明的那啥。

为什么呢？让我们来看看p value 是什么。度娘百科云，p值是一种概率，是在原假设为真的前提下出现观察样本以及更极端情况的概率。

让我们用条件概率复述一下这个定义, p value计算的是： P（evidence| null hypothesis）

通常，当p value小于显著值(0.05 or 0.001)时,我们就认为在该显著性水平下拒绝原假设。
这个背后的逻辑是，在原假设为真的前提下，出现了我所观察到的样本的概率是如此之小（<0.001）,那么，不相信小概率事件的客观您是不是该承认您的前提假设错了呢？承认了“原假设为真”的前提是错的，那么就自然而然的接受替代的假设吧？

慢着！

P（evidence|null hypothesis）很小并不是我们一拍脑门直接拒绝原假设的天经地义的理由。别忘了我们的最终目标是什么？我们是要判断几种假设中究竟哪个才是最合理的，我们需要寻找的是在当前给定证据下最有可能的那种假设。所谓在当前给定证据下最有可能的假设，是指P（hypothesis| evidence）最高的那个假设，也就是最能被当前证据所支持的假设。

换言之，假设只有假设1与假设2二选一。那么，在假设1和假设2的角逐比较之中，能让假设1胜出的终极标准是：
P(hypothesis1 | evidence) > P(hypothesis 2| evidence) -----------(1)

那么假设2的p value小与上述所说的这个标准有什么关系呢？

让我们用贝叶斯公式重新改写一下最终的判断标准不等式(1)：
P(hypothesis1| evidence) = P(evidence|hypothesis1) * P(hypothesis1) / P(evidence) ------(2)
P(hypothesis2| evidence) = P(evidence|hypothesis2) * P(hypothesis2) / P(evidence) -------(3)
将（2）（3）代入（1），既得：
P(evidence| hypothesis1) * P(hypothesis1) / P(evidence) >
P(evidence|hypothesis2) * P(hypothesis2) / P(evidence)

消去公因子：
P(evidence| hypothesis1) * P(hypothesis1) > P(evidence|hypothesis2) * P(hypothesis2)
其中如果计算的是假设2的 p value，则p value = P(evidence|hypothesis2)
P(evidence| hypothesis1) * P(hypothesis1) > p value * P(hypothesis2)

从这个式子来看光凭p value很小这一点是根本不足以判断hypothesis 1与hypothesis 2谁更合理的，那么当我们求p value时我们到底在干什么？天知道。。。。

事实上，p value，假设检验这一套早已被真正搞统计的人摒弃，我所知道的UCLA统计系的一个大老板就never give a shit of it.倒是心理系社科系众生们用的不亦乐乎，全然不知不顾不解其背后的巨大逻辑谬误。反正每个人都在用，我用也没错，不是吗？就是这种心态和不求甚解的态度使得心理方面的灌水文大把大把的出，请问，这种情况下的心理学得出的结论究竟有什么用？不过是自欺欺人而已。

所幸，学术界正在意识到这个问题，其中bayesian statistics学派已经开始向心理学界纠正这个巨大的谬误，并且也有研究者们也开始系统的调查评估过去的几十年间用这种方法获得的研究结论到底有多少经得起推敲。

下面给出两个贝叶斯统计量学派的教授的lab link，有兴趣的同学可以自行研究~
Zoltan Dienes' Home Page
Cognition and Individual Differences（这位教授对p value的评价很直接,就一个词，bullshit）

再补充一句，我吐槽的只是对统计学一知半解视糟粕如珍宝的某些心理学家们，他们多见于数学基础停留于石器时代，对统计背后的理论知之甚少又不求甚解坐井观天的人中；更多的心理学家们本身可能就是数学、物理、统计学、计算科学背景出身的，或者是能够虚心意识到自己的错误进而与时俱进修正自己错误的，对这些人我充满敬意与尊重。

总的来说，我看好打好数理模型基础，从计算建模角度来研究脑科学/心理学，心理学的范围是广阔的，但应该看到的一个大趋势是以现代统计学为理论基础，机器学习为强大后盾的认知科学cognitive science正在征讨并革新传统心理学的领地。因为归根结底，大脑就是一个信号加工处理系统，脱离了扎实的数学功底与计算科学原理想要弄清楚这个不可思议的果壳里的宇宙无疑于缘木求鱼。

说到这儿似乎有些歪楼了，想感谢题主的问题，让我得以吐槽一下长久以来对部分落伍的心理学的鄙视之情。自己曾经也身陷其中，幸得高人指点，迷途知返。致还在坑里的xdjm们，早点跳出井口，去迎接新的世界吧~

来源链接：http://www.zhihu.com/question/23414982/answer/25328937

15083846943 · 发表于 14-5-7 23:39:55

这么深奥，多学习学习，争取先看懂中间那串。

hankyoung1324 · 发表于 14-5-8 11:30:07

看不懂，
猪=吃+睡，研究生=吃+睡+看文献做实验
所以，
研究生=猪+看文献做实验

永远飘荡 · 发表于 14-5-8 11:55:59

本帖最后由永远飘荡于 14-5-8 12:54 编辑

谈一点拙见：

   我觉得写这个文章的人是整个的没有理解做研究进行假设检验的目的。我们做研究，进行假设检验，从本质来说是基于“验证性”的，不是“探索性”的。也就是说，在研究中，我们是预先做好一个备择假设（比如μ0≠μ1），然后去检验所得到的样本数据是否有充分证据去推翻零假设（比如μ0=μ1），然后再决定是否接受这个备择假设。换句话说，因为拒绝掉H0犯错的概率十分小，而H0和H1是对立的，所以我们才去接受H1。另外H0和H1的地位本身就是不对等的，H0在现实中的地位应该是“没有充分证据不能轻易推翻的结论”，而不是和H1一样的同等需要选择的结论。所以，检验一个假设并非文章作者所认为的我们应该探索性的去看结果到底是接受μ0=μ1还是μ0≠μ1。从逻辑上来说，假设检验的原理是不存在问题的，而且是严谨的。

   写这个文章的人的意思就是要直接比较I型错误和II型错误的概率大小，从而决定接受哪个假设。但是这种做法其实才是更有问题。我们知道I型错误和II型错误的概率相加是不一定为1的，两者很可能出现都很大的情况。那假设两种错误概率都很高，于是我们就想当然去接受一个犯错概率稍微低一点的假设么？这样的话何以体现严谨性？又假设I型错误和II型错误概率十分“不幸”的是相等的，那怎么下结论，同时接受H0和H1么？最重要的是，I型错误和II型错误的概率完全是两个前提下的概率，有什么可比性可言。

   我觉得做学术的人对待学术应该保持非常高度的严谨性和批判性。这种批判性不仅仅在于对待别人的结论批判，而且在于充分的认识自己结论可能的局限性和适用性，对自己的研究观点也进行批判。在学术问题上，一味的说别人是傻逼，那和网络上的那种喷子和流氓没有任何区别。有些东西你觉得别人傻，很可能是因为你自己的了解还不到位。对于争议性的问题，千万不要轻易说别人是bullshit，如果有一天被打脸了，那种感觉会是跌落地狱的。

   整个标题还充斥着“你们自以为你们用的东西是科学，但是实际上并不科学，所以你们和不科学的东西没什么区别”的情绪。我觉得这也是很可笑的结论。科学本身就不是一个一定是“对”的东西，而是一种人类向探索事物本质、更接近事物真相的一种努力和手段。就算某些地方有问题，那在以后我们也可以慢慢修正。但是相比于不科学的方法来说，我们至少做出了努力，即使要修正也有充分的实证和理论基础。有些伪科学根本没有做出这种努力，那又有什么资格去嘲笑所谓的科学的东西可能是错的，这和所谓的屌丝心态有什么区别。即使是真的没法证明用有些科学手段接近真实的效力要强过非科学手段，你非科学手段同样没法证明这个相同的结论。既然是这样，有些东西自娱自乐就可以了，完全不必上升到非要拉科学的方法下水。非要去拉这个方法下水证明你们还是和需要科学找存在感的。

遥远的拂晓 · 发表于 14-5-8 12:28:05

只看到P值，没看待统计检验力。。。这还能交流吗。。。

		自动登录	找回密码
密码			注册