读万卷书,行万里路,阅人无数。且行且思,一路吟唱,莫要辜负,青春一场。
——题记
台湾行思
2014,8.21-8.25
1 引言
1.1 本次台湾之行的目的
目的是参加“第十一届海峡两岸心理与教育测验学术研讨会”。由于是以学术会议的名义去台湾,故入台证的有效期只有5天。只有时间开会,没时间去旅游景点,开完会就得立刻离开台湾。
1.2 行程
8月21日早晨7点半离开宿舍楼,8点20分到达广州东站,随后过海关,9点04分乘火车前往九龙红磡,10点56分到达九龙红磡,入境香港。坐地铁前往一个购物商场,短暂停留后坐机场城铁前往香港国际机场,过海关,登机,18点35分飞机起飞,20点16分左右飞机降落在台中清泉岗机场。22点入住兆品酒店。
22日早晨在宾馆吃早餐,8点10分坐大巴前往台中教育学院会场。上午9点,大会开幕。晚上,鸡尾酒会(本人没参加)。然后逛逢甲夜市。
23日,张华华、Douglas教授先后演讲。然后是“全球华人测验发展交流平台构建座谈会”。下午,“知性之旅”(本人没参加)。晚上是大会宴席。
24日,上午做报告,下午是de la Torre认知诊断讲座、郭伯臣讲座、de la Torre与张华华讲闭幕式、颁奖。随后返回宾馆,晚上再次去逛小夜市,然后再次去逛逢甲夜市。
25日,上午10点退房,打车离开宾馆,中途下车买点午餐,然后继续上车到达清泉岗机场。
1.3 同行者
包含本人在内,共有华南师大心理学院计量心理学的博士生4人(3男1女)、硕士生1人(女)。
本人的导师张敏强教授是本次会议的重要人物,不过他的行程路线和我们不同。
2 会场上
2.1 8月22日:大会第一天
2.1.1开幕式
台中教育大学校长王如哲演讲。他说他曾经去大陆开会,组织者安排他住疗养院,把他吓了一跳。因为在台湾,疗养院的意思就是精神病医院。当他离开大陆的时候,他对大陆朋友说自己很“窝心”,弄得在场的人都变了脸色。其实“窝心”在台湾是“温暖”的意思。同样的词语在大陆和台湾可能有着不同的含义,这也是两岸文化差异所在。(结果在此后的几天里,大陆代表团都经常使用“窝心”这个词,每次都招来一片笑声。)
张敏强教授演讲:大陆有368所学校开设心理学专业,每年招500多名心理学博士,各校都缺统计测量老师。计量心理学在企业中的作用也越来越大,这个方向的毕业生在企业里的薪水很可观。
2.1.2 台湾“教育部”郭淑芳副司长演讲,王如哲主持。
主要内容:台湾在进行一项教育改革,把九年义务教育改为十二年。教师要有专业力、教育爱、执行力。专业教师要帮助学生学会分析能力。已有研究表明,背井离乡的孩子普遍成绩下滑,现在要把每所高中都建成优质高中。教师素质是预测学生学习表现的最关键因素。
我深感台湾的教育领先大陆几十年。以大陆目前的经济基础,要实现十二年义务教育怎么说也得再过几十年,毕竟有些地方连初中教育都没完全落实。
随后王如哲用英语对刚才的演讲做了摘要,并说“I summarize it because I have listened to you”,引来大家哄笑。
2.1.3 北京教育科学院张咏梅谈教育评价。
为了学习的评价,强调对于学习的改进。基于国家义务教育课程的核心问题有:教育教学质量、均衡性与公平性、相关影响因素、基于现状的改进。定量研究(测验、问卷调查)和质性研究(录像课编码系统、个案研究、教学叙事研究)都反映了教育教学质量。在上海,经济地位对于学业成绩的解释率为12%,其他省份的数据也类似。
教育是一个国家的大事,教育的很多工作都需要由政府来做。我们的统计测量专业技能,在教育工作中将会得得到充分的发挥,大展拳脚的日子终将到来。而我们现在要做的就是练好自己的本事。
2.2 8月23日:大会第二天。
2.2.1 伊利诺大学香槟分校教授、APM杂志主编张华华演讲:从智慧测验到智慧学习(From Smart Testing to Smart Learning)。
IBM提出“智慧地球”的概念,其中包括在线课程、在线测评。MOOCs是以学为主的在线课堂,强调的是“学”而不是“教”。以前的因材施教只适合少数人,因为这需要大量的老师。CAT使所有人的因材施教成为可能。Knewton是世界上最大的自适应学习平台。Knewton is based on what you can do, not what the class can do. It adapts to you, so it starts easy and then gets harder.现在自适应测验的技术已经成熟,先用区分度低的题大致定位,再用区分度高的题精确定位。Large scale CD-CAT也在试验之中。北京、郑州的小学生在试用CD-CAT之后多数表示它对自己的学业有用。
这个演讲让我深感自己正在从事的CD-CAT研究是大有可为的。它的商业价值以后肯定会被开发出来,而这是巨大的商机。不知道到时候我能否从这里分得一杯羹?
2.2.2 Douglas教授演讲
大家都说Douglas教授的口音是伦敦腔。可是,台湾教授王如哲的英语我全听懂了,而Douglas的演讲我至始至终就没听懂几句话。这个是怎么回事?不过,好像CCTV的英语新闻也比BBC的新闻要好懂。
2.2.3 全球华人测验发展交流平台构建座谈会
华人学者们打算新建一个学术杂志,专门用于介绍华人在心理统计测量方面的研究。
张华华发言:如果你测量得不好,你得到的数据就是垃圾。对垃圾进行统计分析,最后得到的还是垃圾。
侯杰泰发言:要建立新的刊物,做中文的还是英文的?我看,只是要有大量的英文,否则这个刊物很快会死。这几年,无论是香港还是大陆,中文杂志都在走下坡路,一流学者都往英文杂志投稿去了,在英文杂志发不出的论文才改投中文杂志。要让世界知道中国人在做什么,一定要用英文来写。
我突然明白了为什么现在《心理科学》要求中文摘要200汉字而英文摘要长达600单词。
2.3 8月24日:大会第三天
2.3.1 王文中演讲:测验理论新进展
Raw score cannot represent ability difference between persons and ability difference between different items. Multiple-facet models有三个facet: person, item and rater.根据这些,提出一堆模型:Testlet (Bi-factor) models, Multiple (Higher)- order models, Multiple-level models (schools and students), Multiple-Latent-Class (Mixture) models, Unfolding (Ideal-point) models, Multiple-Timepoint models, Missing-Data models, Multi-dimensional Pairwise- Comparison models…… 还有Random-Effect DINA model,这个模型的意思是g和s都跟theta有关。总结:一定要先把原始数据转化为线性模型。
台下,坐在我旁边的刘玥说:王文中就喜欢发明模型,发明了一大堆。
2.3.2 彭恒利演讲:民族汉考MSK。
MSK是对少数民族量体裁衣开发的国家级标准化考试,考察被试的汉语应用能力。它由教育部民族教育司主持,以北京语言大学为主。分为四个等级:一级是小学毕业,二级是初中毕业,三级是高中毕业(这是最主要的),四级是大学毕业。少数民族的汉语水平:朝鲜族>蒙古族>藏族、彝族>维吾尔族。因此,朝鲜族专家认为应该把题目出难一些,而维吾尔族专家认为应该把题目出容易一些。口试满分为6分,得3分的人最多;作文满分为6分,得1分的人最多,占40%。少数民族汉语教学存在的问题:(1)未建立适合少数民族的教学体系;(2)缺乏统一的课程标准(大纲),各自治区各自为政。几点思考:(1)MSK是少数民族第二语言的考查工具,要符合少数民族心理;(2)要突出应用;(3)考试可为教学、招生服务;(4)兼顾科学性与可行性;(5)用统计测量的方法;(6)由教材翻译模式转化为交际模式,由注重书本转化为注重口语。少数民族只有学好母语才能站起来,只有学好汉语才能走出了,只有学好外语才能走向世界。MSK让很多少数民族青年进入大学、留在大城市,再也不回去,这会不会耽误少数民族地区的发展?MSK到底是功在千秋还是千古罪人?
本人思考:做事情一定要记住自己的初衷。彭恒利教授最后的反思,体现了知识分子的良心。
2.3.3 本人演讲:用4PLM-Robust法使潜在能力估计稳健化。
讲完以后,刘红云教授问我:“你的P*和P**这两个参数都是预设的。在实际工作中,它们该怎么估计呢?”我回答:“这两个参数跟IRT里的a、b、c一样,都是属于项目参数。以后需要开发联合估计算法,这是下一步的工作。”回答完了以后,自己都觉得“尚未开发联合估计算法”弄得自己底气不足。
2.3.4 de la Torre演讲:When Simpler is Better: Impact of Appropriate Model Selection on Attribute Classification.
认知诊断模型可分为两大类:(1)特殊(specific)模型,又叫缩减模型,包括DINA,DINO,A-CDM,LLM,RRUM等;(2)广义模型,又叫饱和模型,包括G-DINA,LCDM,GDM等。从各种可能的模型当中选择最合适的模型,并不是明显的。一方面,广义模型:(1)只要认知诊断模型合适,广义模型总是正确的;(2)有更好的模型-数据拟合。另一方面,特殊模型:(1)更稳定;(2)有更明确的解释;(3)如果模型为真,则有更好的分类;(4)基于节省原则,优先选择这类模型。在实际中,真模型总是未知的,但是可以通过Wald检验来选择最合适的模型。本文的主要目的是,评估基于Wald检验而选出的模型能否比G-DINA模型提供更好的属性分类。本文也将Wald检验推广到其它缩减模型。Wald检验的特征:(1)是item-level的统计;(2)不需要估计缩减模型;(3)对DINA、DINO、A-CDM模型,它的效果已经验证了;(4)但是,尚不确定它对其它缩减模型是否同样有效,尤其是LLM和RRUM。然后就做了两个研究。Study 1: Evaluating the Wald test for LLM and RRUM. 结果发现:当题目质量较高时,DINA和DINO近似。一般说来,A-CDM、LLM和RRUM近似。这是因为它们的参数配置可以相互转化。Study 2: Classification rate of selected models based on the Wald test.结果:当样本小且题目质量不好时,Wald和之间的分类率相差较大。当样本大或题目质量高时,这个差异可以忽略。最后的结论:(1)在所有条件中,selected models using the Wald test performed better than G-DINA model,尤其是当样本小或题目质量不好时。(2)虽然有时候相加模型在有些情况下难以识别,但这些选择的模型仍然比G-DINA模型更好。(3)这些说明,除了便于解释之外,Wald检验还可以用于提高属性分类准确性。(4)本文还将Wald检验推广到LLM和RRUM。(5)With more reduced CDMs,在题目水平的模型选择可以有更好的灵活性。
我想起了那句老话:好的模型是要既拟合数据又尽量简单。
2.3.5 de la Torre和张华华的讲座:帮你发论文。
de la Torre:投稿之前先看清各家杂志的投稿要求,有助于加快发文速度。如果投了不合适的期刊,或者没有按照目标期刊的要求来做,那么会浪费很多时间。
张华华:要找到好的研究题目,不要为写而写。一开始不要野心太大。引言要让编辑看懂,要通俗。投稿前先看投稿要求。人家辛辛苦苦看你的文章,把你骂一顿,不收一分钱,你要感谢他。如果审稿人的修改意见是你做不成的,要说清理由,但要委婉。中国人写文章,困难在于表达和逻辑,要确保逻辑清楚。翻译公司不会管你的逻辑。可以适当地向高手请教逻辑,而且可以分成小段落多次向高手请教。高手帮你改了以后,你要体会。有两种文章比较容易发:(1)伟大人物的文章,改善其中一个条件,使结果更好,使其方法应用更广泛。(2)自己找出的问题,和传统方法不同,这种情况下花时间更多,但引用率更高。当到副教授以后,更要注重文章的质量而不是数量。要为了research而写文章。文中不要自我吹嘘,不要过于贬低前人。如果要推荐审稿人,不要推荐跟自己同一单位的,也不能推荐你叔叔。一般不要“回避审稿人”,除非他是打压不同意见的学霸。投稿时,要找出投这个期刊的依据,参考文献里最好有几篇文献来自你投稿的杂志。
这个讲座实在是很高端,APM和JEM的主编一起亮相。不知道我的论文能否入这两位主编的法眼?
2.3.6 闭幕式
组委会宣布了本次会议的优秀论文奖。台湾“中国测验学会”的许天维理事长为获奖者颁奖。郭磊是获奖之一,他站在台上手捧奖状意气风发。想到几年前我们是同班同学,住同一个宿舍,那时候常常在一起切磋,两个人的水平不相上下,而如今他已经把我远远低甩在身后了。顿时有些汗颜。不得不说,读博使人进步大,在SSCI的压力之下人的进步更大。
3 会场下的交流
3.1 与de la Torre教授的交流
第一天上午,茶叙时间遇到了。我跟他打了个招呼,然后介绍自己,说自己去年听过他在中山大学的工作坊。随后我告诉他,我最近做了什么研究。再然后,悲剧的事情发生了:有些东西我不知道如何用英文表述,他也听不懂我的英文,我也听不懂他的话!这时他突然冒出了几句中文。我没想到他会说中文,大喜过望。他说“我也在努力学习中文,否则到了中国的饭馆都没法点菜。”我遂用中文跟他交流。可是刚说几句,他就说“你说得太快,我理解不了。”经过一番连说带比划,他拿出了平板电脑,叫我把想说的话用中文写到电脑上,再用智能翻译软件翻译成英文。太丢人了!
第三天上午,我邀请他去听我的演讲。然后他问我,是用中文还是英文讲?我说是中文。他说,那不去听了,因为听不懂,也看不懂PPT。不过,他说他稍微能看懂一点繁体字。(这时我突然明白老外学汉语的困难在哪里了。其中一个大麻烦是:多数汉字都有简体和繁体两种写法,而且习惯于用繁体字的港台人以及海外华人基本上不认识简化字,而惯用简化字的大陆人也认不全繁体字。)
3.2 与侯杰泰教授的交流
第一天下午,在会场门外,我遇见了侯杰泰。一阵寒暄以后,我问他:中国的心理学至今没有SSCI杂志,即使是《心理学报》这样的杂志都做不成SSCI,这是怎么回事?他说:因为这些杂志都是中文的,所以影响力有限。要让世界知道中国人做了什么,中国人必须多写英文论文。
第二次见面。我问他:香港澳门台湾有没有适合发统计测量论文的SSCI杂志?他说没有,只能去往APM那几个杂志挤。
看见附近的一张桌子上放着大大的咖啡桶,侯杰泰就提议去接点咖啡。我们拿着杯子走过去,他拧桶子的龙头,没有咖啡流出来。我说:“看来是喝完了。”可是侯教授抱着咖啡桶把它倾斜了过来,于是咖啡流出来了。侯教授一边喝着咖啡一边对着我笑。我想,我和他的差距就体现在这个小事上。然后我也用同样的办法喝到了咖啡。
3.3 与郭磊的交流
会议的第二天中午,我和郭磊一起在分会场(台中教育大学的一个教室)里吃着盒饭。郭磊对我说:“在北师读博,让我有了质的飞跃。以前在江西师大期间都没怎么学习,光顾着生活了。”
我也觉得,如果他是在江西师大读博,现在一定不会有这么多成就。所以说环境还是很重要的。
3.4 晚宴
6个华南师大的人跟几个贵州师大、西南大学的人坐在一张桌子前。一聊,发现A和B的本科是同一个学校,C和D的老师是同学,E认识F的同学/师妹……于是饭局变成了认亲大会。其实,心理学的圈子就是那么小,统计测量的圈子更是小。
向罗照盛老师敬酒。我说:“一日为师,终生为父。”罗老师笑着说:“别,我可不敢当。”
4 台湾行程中的故事
4.1 在飞机上
当飞机在平稳飞行的时候,如果你只盯着机翼,你是难以意识到飞机正在前进的。如果你往下方看,而下方是茫茫大海,你可能也意识不到飞机正在前进。我想,读博士也是这样吧。
飞机在蓝天上飞翔,朵朵白云在身边飘过,颇有一番诗情画意。突然,一朵白云迎面撞过来!飞机立刻一阵颠簸,机翼大幅摇摆,我们也跟着上下晃动、左右倾斜、心跳加速,就像过山车那样刺激。要想获得漫步云端的成就感和惬意,就必须要在乱云飞渡的险境中经受住考验,还要冒着从云天坠落、粉身碎骨的危险。成功只属于勇敢者。
4.2 出租车司机
离开台中清泉岗飞机场,我们6个人打了两辆出租车前往宾馆。在车上,司机师傅听说我们是大陆来的,就很关切地问“安徽现在发展怎么样?”原来,他父亲是安徽人,随着国民党军队一起撤到了台湾。他的父亲曾经回过大陆探亲,现已去世,而他从未去过大陆。到他这一辈,已经变成了土生土长的台湾人,但还在惦记着安徽老家。内战和分裂,是整个民族的悲剧,而这个悲剧还在子孙身上延续。但中国人的心中始终有个“根”的情结,这个情结不会因为政治而割裂。
另外几个同学坐的出租车,那位师傅姓师,也是国民党老兵后裔,他父亲是山东人。由于聊得开心,后面几天我们都打电话叫这位师师傅开车来带我们。
到了要离开台湾的那天,师师傅早上10点出现在我们宾馆楼下。一见面,他就拿出一盒煎饼送给我们,感谢我们这几天坐他的车。不得不说,这点小礼物还真的让人很“窝心”。开车经过东海大学,风景优美,建筑都很有特色。师傅一边开车一边给我们介绍,后来兴起了,干脆说:“我把车停下来,带你们下车逛逛吧!”我们一听也来了劲,于是跟着下了车。师傅高高兴兴地带着我们在东海大学里逛了好大一圈,然后又带我们去吃小吃,等我们都吃饱以后才回到车上继续开车前行。在车上,我们谈到台湾大选,师傅说“其实现在的投票率已经越来越低了。大家都发现,如果制度不改,谁上台都差不多。这个党干几年,换个党再干几年,这样更能给大家一点新鲜感。”
到了飞机场,我们发现带的台币不够支付车钱了,大囧。无奈只好请师傅稍等片刻,一名同学带着人民币去机场的货币兑换点兑换台币,再跑回来给钱。好在师傅也是通情达理之人。然后我们愉快地挥手告别。
4.3 刨冰摊的老板
晚上,我们在逢甲夜市的一个摊点吃刨冰。老板一听我们是大陆来的,就跟我们聊柯震东的事情。我告诉他,在微博上有很多人为柯震东开脱,甚至有人说大陆不该抓台湾人。这位老板严肃地说:“不管是在大陆还是台湾,吸毒都是犯法的,犯法了就该被抓起来。在大陆犯法就该按大陆法律来处理。”老板还说“21世纪是中国人的世纪,大陆和台湾的中国人应该联手发展。”他说自己曾经在海军、空军服役,当时的口号是反攻大陆,但后来发现战争解决不了问题。“希望两岸的中国人能好好谈谈,找到一个和平统一的方法。”
4.4 合影
四个博士一起在台中教育大学门口合影。由于计量心理学这个二级学科每年在全中国(准确地说是大陆)也就只招两个人,因此这张照片就是“中国计量心理学2012、2013级全体博士生合影”。很酷吧?
在东海大学,看见一棵树趴着,树上还有块牌子“我老了,站不起来了,请不要伤害我”。我感慨:我们的教育就是缺少这种人文关怀啊!然后,五个人(四个博士加一个硕士)一起在这棵树前面合影。
4.5 打印店
一个师弟需要打印海报。不料,跑了几条街,找了多个打印店,却发现这些店都不支持优盘,甚至那些店老板连优盘都没见过。这是怎么回事?
此外,这里的打印店在周六周日根本不上班(不知道是不是因为是暑假)。
4.6 在夜市
台中的夜市实在是很繁华,人来人往,摩肩擦背,好一派热闹景象。四个晚上,我们三次去夜市,买了不少东西。而所有的店老板,不论男女老少,都对我们很热情。我注意到,他们总是用双手给我们递物品,也用双手接过我们的钞票。而且,每次在我们消费之后,他们都会笑着说谢谢。一个小的细节,让人体会到了礼貌与尊重。
在台湾的最后一个晚上,我们又一次去了夜市。我和师弟一起去玩了碰碰车,在一次次的碰撞当中充分享受了乐趣,我们都玩得很开心。一时间,仿佛又回到了童年。
在射箭的地方,我拉满了弓,做出一副成吉思汗射大雕的姿势,然后连续三箭都没射中气球,其中最后一箭偏得离谱。然后我看着自己的战果乐了好一阵。管他射中不射中,开心就好。人生得意须尽欢,因为博士的生活实在是太苦闷太寂寞了。
4.7 黑社会
到台中的第三天,负责安排此次会议食宿的工作人员告诉我们:在台湾,台中是黑社会最厉害的,大家夜行要小心点。可是我想,我这两天只看见一片和谐稳定的景象,到处是其乐融融,哪里有黑社会的影子啊?
结果在离开台中的那天,在媒体上看见一个令人震惊的事件:台中一位大富豪被绑架,虽然家人已经支付巨额赎金,但富豪依然被撕票,身中28刀弃尸果园!随后台中市长胡志强向黑社会宣战。
然后民众翻出旧事,说胡志强已经至少向黑社会宣战20次了!
和谐稳定的表面之下,隐藏着恐怖的暗流。看问题不能只看表面。
4.8 混账
由于几个人的账都混到一起去了,因此在台湾的最后一夜我们一起在师妹下榻的房间里算账。这个时候悲剧发生了:四个统计博士和一个统计硕士算不清这几天的账!在一番折腾以后,我们还是没完全理清,于是在回学校以后继续算账,弄得几个人都挺郁闷的。这时候我突然明白“混账”这个词是什么意思了。
5 途径香港的故事
5.1 过海关
在香港海关,我听不懂工作人员说的香港话,工作人员也听不懂我的大陆普通话。最后,我用英语跟他们交流,总算把事情搞定了。中国人和中国人之间不得不用英语对话,这是不是民族的悲剧?
5.2 走在香港自己的土地上
邓小平说过:“我要活到1997年,到香港自己的土地上去走一走,看一看。”他活到了1997年,但没有活到7月1日香港回归的那一天,这是一个巨大的遗憾。 而此时此刻,我正在香港的土地上走着,这是已经回归的香港。百年沧桑,换了人间。
5.3 与一个香港人的交流
从香港九龙回广州的火车上,遇到了一个在广州工作的香港人,目测年龄跟我差不多,但社会阅历丰富。他看见我在用红米的手机,就问我好不好用,我说很好用。然后我们谈到了其他手机品牌,然后共同说酷派的手机很烂。他说“做一个产品有没有用心,一看就看得出来。酷派手机在很多细节上不如别人,因此它做不大。不论是创意还是技术,都要差一些。”
谈到香港奶粉限购、一些大陆人由于多买了奶粉而遭受牢狱之灾,他说“大陆人买的太多了,把奶粉都买光了,而生产能力就那么多,搞得香港人都没的吃了。所以不得不制定限购令。”这时候我突然明白了这个法令的依据,还真的不是霸道。我们在批评香港的时候,也该想想为什么香港会这样做。
谈到文革,我告诉他,文革其实没打算搞那么久,后面几年都是在收拾残局,想掉头却掉不过来。他说“掉头不是你想掉就能掉的。比如开车上了高速,要掉头还得先往前走很远。”的确,很多事情都不是我们想象得那样容易。
想起前几天刚在红磡火车站下车的时候,车站外就有轮子功的横幅。于是我问他:“香港是不是有很多人练轮子功啊?”他笑了:“哪里有那么多轮子功的人啊?多半都是一些打工仔,受轮子的雇佣,拿钱办事的。”看来轮子的控制力并没有表面上那么大。
6 收获总结
这一趟台湾之行,我们有什么收获?
听了许多学者的演讲,跟一些业内人士当面交流,开拓了眼界,结交了朋友。如果不走出去看看,根本不知道别人已经领先我们多少;如果不多结交志同道合之士,根本不知道自己和别人的差距在哪里;如果不是亲自到了台湾和香港,根本不知道这两个世界跟媒体上的宣传有多大差别。要想搞清楚真相,就必须亲自获取第一手的信息。
师弟说,参加会议以后觉得自己抑郁了,因为发现自己跟别人差得太远。但我想,知道自己孤陋寡闻,总比不知道自己孤陋寡闻要好。成熟的过程就是一个不断发现自己很傻逼的过程。要成长,就必须直面自己的不足,然后让自己更加强大。
|