1心理测验学技术发展史(述评)_通信技术的发展史探析
1心理测验学技术发展史(述评)由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“通信技术的发展史探析”。
《中国健康心理学杂志》2005年1期 编号13203
心理测验学技术发展史(述评)
郑建民 中国.福建医科大学 第一临床学院 心理卫生科(福建福州)350005
张璐斐中国.中山大学教育学院(广州)车洪生中国.北京师范大学心理学院(北京)
摘要• 本文对心理测量学技术史作了回顾与评价,发现心理量表技术的发展有三条线索:一是评定法、二是作业量表法、三是问卷法。三种技术都可用于人格、智能、症状、人才选拔等不同目的,但各有各的优势和弱势。量表法是心理测量科学的基础。观察法是比较低级的方法,后来发展为评定法在精神科还大有用处。问卷法对多数人格测验是有效的,但要测量症状还需结合校标法,避免采用因素分析法。心理测量是有用但又不易掌握的行为技术,心理学家在使用和评价或研制心理量表的同时,要注意自己知识结构可能存在盲区无法超越。
关键词:心理测量;科学技术史;科学批判
Clew of Development in Psychometric Technique Zheng Jianmin, No.1 Hospital of Fujian Medical
University.FuZhou 350005.Zhang Lufei,School of Education, Sun Yat-sen University, Guangzhou.Che Hongsheng, School of Psychology, Beijing Normal University, Beijing.ABSTRACT The theories about psychometric technique are reviewed in the present study and it is found that there are three clews in psychometric technique development: Rating method, performance scaling and survey method.They all can be used in various purpose such as for personality, intellectual ability, symptom, personal selection and so on.Scaling method is scientific based of psychometry.Observation is more low-level method but is useful in psycho-medicine even though it was developed as a rating scale lately.Survey method is valid for most personality measurement but is not for symptoms.When it is used, psychologists should choose the criterion rather than factor analysis.Psychometryis a useful behavioral technique but it is not easy to be mastered.Psychologists must pay attention to the self-awarene blind zone of knowledgewhen they use or evaluate a psychometric scale。
Key words: Psychometry;Technology history;Science-criticize
请看《2003版国家执业医师资格考试考点精编》P873—874页关于心理测验的教材解说:“智力测验能测单一智力因素,结果不能用智商表示。智力量表可以测多种智力因素,结果可以用智商表示”;“人格测验主要对人格特征或类型进行描述,没有量化单位。临床上主要用于诊断、咨询和心理治疗”;“评定量表分为自评或陈述和他评量表”。这种说教对于初出茅庐的非专业医生还算能够理解;但对于心理测量专家来说,真是越看越糊涂了。使用心理量表的过程叫心理测验;任何心理测量都是定量的。智商与单一量表分及人格测验都有标准分且可以互相转换的。在学术届,还经常可以听到一些大专家关于心理测量的奇谈怪论,如“50%的被试IQ是在100点上,另外50%的被试得分在100的上或下”;“MMPI采用美国常模比中国常模更有效”。甚至心理测量的专著或国家课题,也可见到一些微妙的概念混乱遣词。误区的关键是将测量方法与测量内容混为一谈了。
心理测量的行业现状是99%的人使用1%的人编制的量表。但使用者应对量表的研制原理有起码的理解,否
则众多的专家还会成为测量技术进步的绊脚石。各家学说在哲学界是好事,但心理学是实证科学,不能因为概念混乱误导社会对心理测量的更多微词;在编制量表的课题设计时,概念混乱还会浪费很多科研资源;会使评审专家成为反学科发展的力量。毕竟心理测量学已经是相当成熟的一门高深技术,以致不少心理学家一辈子还搞不清其中的奥妙;或有人迷信或滥用心理测量;或身为心理学家或精神科医生却反对使用和研制心理量表。
本文从方法学上追索心理测量的技术发展史,澄清一些望文生义的谬误,使读者学会按逻辑关系来理解心理测量的属性,哪些情况下能行,哪些情况下不行。
1、观察法是心理测量的早期技术
在探索精神世界的历程中,古今中外都是以观察法开始的。古代西方的占星术和中国的生辰八字或手相看命,其实是与中国周易同类的古代命运或揣度人心的预测术。心理测验目的是快速有效定量测量个体差异,并依据这些差异来值来推测个体未来的行为,这是与古代算命不同点之一。最早的古代人格测量是西方的颅相学,它假设个人大脑不同区域的大小与功能有关,试图
测量个体的颅脑形态差异来推测个人行为和成就倾向。此后又根据体质人类学思想出现体液/体型/血型学说,以及中国的五态人格学说。这些方法是没有定量的早期心理行为的观察法技术,至今在临床医学和人才选拔中还被广泛使用,如招聘面试和精神科的诊断分类标准(美国的DSM、WHO的ICD、中国的CCMD)。此外社会学调查是有定量没有标准化的观察法。观察法的最大问题是观察者误差,往往是复杂学科的早期技术落后的替代方法,但这种主观方法被专家使用惯了就会成瘾,形成原始的思维定势,就像画圈圈的领导那样得心应手。
2、量表法及标准化技术使心理测量进入科学行列 定量思想是受教育学考试百分制启示的,但考试的试卷不是固定的条目,答案和配分是老师主观临时确定的,考试成绩在不同学校或不同学科之间是没有可比性的,这是心理测量很排斥的非标准化测验。最早将观察法做定量研究的是英国生物心理学家Francis Galton,1883年他出版了《人的能力研究》提出了等级量表法和问卷法,扩充了Guetele的百分位数法,创造了一种粗浅的相关系数法。量表法(scale method)是一种标准化心理、行为定量测评技术,也就是通称心理测量或心理测验。最早的量表法源于1879年法国实验心理学家W.Wundt,当时人们注意的是人类的共同特性方面,并没意识到个体差异,以后无数试验均说明个体差异的存在,经过几代心理学家的发展,成为现代的标准化心理测量技术。主要目的是测评个体差异的,它要求:量表呈现的刺激或条目内容和形式是固定的,每个条目的答案是明确且已知的,每个条目的配分相对难度或通过率是近似等值的,将同类、同质的小条目得分累加,得到一个指标积分(量表粗分),再将不同指标的个人粗分与同组均数的差值除于群体的标准差,得到标准Z分数,这样处理后语文和数学的成绩之间是可比的了,如果测题相同,在不同班级之间的成绩也是可比的。由此可以同时将多个指标集成为统一计量单位的成套心理量表,不同指标的高低比值就是测图或剖析图,成套量表比单一量表可更稳定地反映深层的心理结构。如果扩大均数与标准差的样本取样范围,就是所谓的常模,常模包括均数和标准差,可对更大范围的同类人群的某些个体作出心理、行为的个别预测。
因为多数心理行为指标与物理化学数据不同,是没有绝对0起始点的,因此心理学设定均数=0 的相对参照点,标准差为1的标准Z分数,即Z=0±1为统一计量单位。为了消除0分导致的负数给计算带来不便,便有了各种线性转换法如IQ=100±15;T分数=50±10;标准10=10±3等,这些不同计量单位是可以相互转换的不同起始基点,这就是心理测量单位的标准化。
标准化的深层涵意是量表的编制技术,特别是条目的设计思想(详见后述量表宽容度)和条目分析技术(因素分析和效标法),而后是条目配分与量表分的合成及标化,最后是测验指标的质量评价,即信度、效度的检验技术。
三类心理测量方法是评定量表法、作业量表法和问卷量表法,它们都是基于量表法派生出来的。
3、评定量表法是观察法的现代定量技术 用于对行为定量的测评叫评定量表法,如HAMD、BPRS、各种幼儿发育评定量表等等;评定量表法是将一类症状或综合征细化表述为20-30个观察条目或问题,每个条目有固定配分标准,由医生或家长评定后合成总分或量表分。1921年瑞士精神病学家洛夏发明的墨迹投射测验,该测验依据深层的精神分析理论,通过呈现定式刺激来观察被试的反应并做定式纪录,也是观察法与量表法相结合的雏形。后来有了量表法,观察法就发展成现在精神科众多的评定量表(rating scale)。评定法的逻辑前提假设是医生看到的(观察法)比病人自己报告的(问卷法)更可靠,这种方法显然需要一定的住院观察期,不是门诊就能定夺的。其次评定法本身还是无法摆脱观察法的观察者误差,需要做两个评定者之间一致性培训和信度检验。如果要验证疗效,医生总是自我评价偏高,但事实上就心理疾病的疗效来说,家属和病人的自我报告比医生的评分更可靠。评定法是精神科医生的最爱,因为这种定量的行为观察法与精神科的临床诊断思维一脉相承,如果依据现行的精神科诊断标准,医生获得的分类诊断是没有数据的资料,写文章会很成问题的。何况DSM-Ⅳ的描述标准操作性很不理想,同一个病人经过不同医生的眼睛看到的结果会有很大的不同,这种现象在临床上比比皆是。评定法很像是医生用“内容量表法”,每个指标的解释意义明确,但信度、效度均不理想。评定量表多数是单一指标的,不能反映A指标与B指标之间的关系,例如HAMD量表高分只能说明抑郁状态,不能区分是何种抑郁?因此单一量表的评定法用于诊断,效度很有限,主要用于专业精神科的病情和疗效评估,以及业绩考核领域。评定法也不是都用于症状评估的,如纽约纵向研究—儿童气质量表NYLS就是家长用的儿童气质评定量表。
评定法一般也不注重量表内部条目的同质性信度,因此心理测量书上很少涉及评定法。但评定法的最大有点是对不合作的病人、不能阅读的病人、高防御的贵族阶层以及敏感的品行问题同样是有效的。近年WHO依据ICD-10和DSM-Ⅲ—R诊断标准编制的多指标精神障碍诊断评估系统SCAN,其诊断效度高,但需要专业医生的才能使用。1981年又将NIMH—DIS与PSE合并,编
制了一套功能类似SCAN的问卷量表CIDI,结果效度、信度非常理想,而且非专业人员使用信度同样很高(Kappa0.87-1.00),是目前国际上精神病流行学的调查工具。
4、作业量表法是心理测量技术成熟的标志 用于对作业成绩的定量测评叫作业量表法(performancemeasure),如TOFFO考试、学能测验、韦氏智力量表等;最早的作业量表是1905年的比内—西蒙智力测验,这个测验是由30个标准试题按不同难度等级排列的,测验类似爬楼梯,每个试题有标准配分,最高得分点一下成绩累加就是智商粗分,将个人粗分与群体常模标化后得到离差智商。但比内量表的题目是由数学、文字和图形测验题型交替混合呈现的,结果只有一个混合的智商指标。此后又有无数适用于不同年龄段的幼儿、儿童发育量表,这些智能量表的题目内容是分别归类积分的,构成4-12个分量表的成套量表,然后再合并成总智商或发育商数。每个分量表的高低构成所谓的智能结构,这种测图可具有分类诊断效度。作业量表法是最可靠的行为效能定量技术,主要用于智能和业绩评估,被试只能装坏不能装好,因此效度通常没有异议。包括精神科诊断智力障碍也采用了作业量表法的IQ标准。多数作业量表法用于智力测验,但情景模拟测验和洛夏投射测验是作业量表法用于能力与人格测验的例子。
但不少幼儿评定量表是作业法和评定法的混合,题型归类是人为的,并没有经过统计学一致性检验,尽管量表内部的题目同质性较高,但不少发育量表的题目分类现在看来是不合逻辑的,如DDST(丹弗幼儿发育量表),著名的韦氏智力量表均只有表面的同质性效度。对于智能测量目的来说,内部同质性不是很重要,但要测量人格或症状,条目的同质性就非常重要了。
5、自陈量表法是最有活力的心理测验法 用于调查个人心理感受差异的叫自我报告自陈量表法(self-report measure)或问卷法(questionaire),如16PF、EPQ、SCL-90、MMPI等等;自陈量表也可用于社会群体的定量研究,又称问卷量表法;但社会问卷调查法和民意调查或市场调查没有采用标准化量表技术,因此不属于心理测量范畴而是社会定量观察法。
最早的自我陈述量表是1917年美国心理学家武德沃斯编制的神经质问卷,其目的是筛查哪些容易在战场上精神崩溃的应征入伍者。以后自陈量表多用于人格测验的目的,如16PF、EPQ等等。人格是正常人的心理指标,与智力测验一样,其量表特性符合正态分布的数学原理,粗分转换为标准分采用线性转换是可行的。但久
而久之,人们竟然将问卷量表法等同于人格测验了,很多人至今将MMPI与人格量表混为一谈。MMPI之所以标称“人格问卷”是出于对被试动机的控制,并不是编制者的本意,也不是MMPI的特性。因为MMPI的10个临床量表有8个是偏态分布的病理指标,粗分转换为标准分不能采用线性转换公式。同样道理,国际通用人格障碍检查表IPDE也不是人格问卷而是症状诊断量表。很多症状量表也可以采用问卷法的,如SCL-90;Zung抑郁量表等,不能说这些也是人格测验吧。
量表的编制法与量表测验内容是两码事,要说明这个道理,须涉及健康的等级概念问题:郑建民指出生理—心理—社会健康(内容)都可分为超常—正常—亚健康—疾病四个健康等级,心理量表适用和对应的健康等级称量表的宽容度,在智力量表称适用年龄。例如针对症状的量表是症状或诊断量表,如MMPI、成人智残评定量表;指向正常人的是人格量表,如16-PF;指向亚健康的是预测量表,如EPQ;指向杰出素质的是人才选拔量表,如GABA(一般职业能力倾向成套测验)。这时有读者会问:“MMPI不也可以用于人才选拔吗?”笔者的回答是:MMPI的一些人格条目对某些人才有区分度,但对多数职业人才是没有区分效度的。反过来设想,GABT对某些精神病可能也有区分效度,但对多数病种肯定没有效度。宽容度的概念对于心理量表的编制太重要了,缺乏这个概念将会导致整个研究课题的策略性错误,例如用人格问题试图编制中国的MMPI;还有人希望将16-PF用于心理疾病诊断的,这都是一种设计思想的错误,结果会得不偿失的。
题目分析主要是针对问卷量表法的,包括因素分析、效标法。项目反应理论主要用于作业量表法。
6、因素分析是题目分析的主流技术
自陈量表是发展最快、应用范围最广泛、内容最丰富的经典心理量表法。但自陈量表的效度历来受到众多专业和非专业人士的质疑,如1946年Ellis对人格问卷提出26条可能技术误差来源,主要是被试的误差,如被试动机、理解偏差、条目的社会赞许值性等等。至今心理测量学家还不时会遭遇同类问题的质询,回答这类问题需要介绍一下条目分析技术的概念。
条目分析(item analysis)是题目筛选的多元统计技术,1890年美国心理学家J.M.Cattell在相关系数的基础上发展了因素分析法来检验初试条目的同质性,后来有了计算机的帮助,因素分析成为主流的项目分析技术。通俗的解释是:问卷法多数包含多个心理指标,每个指标包括15-70个可操作性小问题(条目),这些条目可以是文献法收集来的,更多是专家依据理论构想编制的,然后我们将每个条目混合一起编制成初试问卷
清单,假如每个条目是一只天上的飞鸟,这清单就是天上一大片飞翔的候鸟,但分属不同的家庭成员。因素分析就是要找到不同运动倾向的群体行为,这些群体就叫做因素群。然后给各个群体命名并解释其种的属性,依据这些属性就可以推测某些新的未知个体应该归属哪种群体,并预测其行为特性。可见,因素分析是发现和研究正常人复杂心理特性的有效手段,其因素内部的每个条目是同质的,假设有两个条目是同语反复的句子,因素分析的结果肯定会被归结为同类,这些条目的配分是可以累加积分成量表粗分的。
但对于病态心理,因素分析的指标特异性就不高,因为一个人格因素内部通常只有少数几个条目对某种疾病是有区分度的,多数条目是无效的信息。如果将多因素的少数有效条目集合起来,组成一个针对某种疾病的特征指标,这些条目对于正常人来说是不同质的,但对于某种病的比较标准组却是同质的!这种方法就叫校标法。
7、效标法心理诊断的顶峰技术
采用效标法(criterion)做题目分析的典型是MMPI,1939年由美国精神病学家Hathaway和Mckinley收集了上千个问题小条目,先后用8个病种的标准组与正常人群对比,1946年完成现有的550个有效条目的筛选,加上Mf和Si两个人格量表,简称10个临床量表。经过近60年的时代变迁,直至现在新版的MMPI-2,这些临床量表的计分键仍然纹丝不动!可见其效度在西方文化中的稳定性。MMPI的条目取材于精神科的临床资料,目的是编制成套多功能的精神病自陈诊断量表,帮助精神科医生提高收集精神病诊断信息的效率和客观性。原先的编制者希望每个临床量表与对应的病种有特异的关系,即抑郁症只在D量表得高分,其他量表不得分,但结果是多数病种不止一个量表高分,而是2-6个量表高分,但同一病种的高分有相对固定的模式,由此从测图判读是可以诊断某些疾病的,并符合精神科临床诊断分类概念。MMPI还有一个特殊的动机检测指标K量表,用来对哪些有装好动机的被试的临床量表分作补分矫正,所以MMPI有心理CT的美称。以后各国专家根据效标法又从MMPI的550个题库中筛选出800多种不同组合的校标量表,但多数是人格或人才选拔的指标,也就是说,校标法除了诊断也可用于人格研究,特别是人才选拔方面,以及MMPI-Mf、Si量表。效标法还能够发现ICD-10的专家们没能发现的症状或人格线索,换句话说,研究MMPI题目分析的专家对精神症状的认识比精神科医生还多。这是MMPI鲜为人知的精彩所在!1956年加州Gough用效标法编制了CPI成套人格量表。五十年代明尼苏达大学又用效标法编制了与MMPI指标
类似的儿童人格量表,这是父母评定法与校标法结合的特殊产品,但名声没有MMPI大。
由于效标法的标准组和正常人都有地域文化的烙印,因此效标法的条目关系比因素分析法或作业量表法及评定法都更多地受民族文化背景的制约,西方文化的MMPI引进中国后,多数量表的内部校标结构都破坏了,修订MMPI的关键是按原有量表概念选定中国自己的标准组,筛选适合中国文化的条目,然后再取本国常模;而因素分析法在不同文化背景中多数条目还是同质的,忽略题目分析仅仅取常模的标化是勉强够的。MMPI的国际地位不能用来证明MMPI在中国本土的效度。研究MMPI的数学方法并不复杂,但对研究者的专业素养要求比较特殊,包括心理学、心理测量学、精神病学、临床医学的背景是缺一不可的。例如用因素分析法分析MMPI的量表结构,看似高等统计技术却是最伪劣的结果。
参考文献
1.邱章乐著:《人心可测 :古今探心术》安徽教育出
版社1989年4月
2.唐绒译:《西方心理学史大纲》北京大学出版社,1982年
3.郑日昌编著:《心理测量》 湖南教育出版社 1987
年 10月第一版
4.王晓钧编著:《当代心理测量》 江西科学技术出版
社 1997年年1月第一版
5.周谦主编:《心理科学方法学》 中国科学技术出
版社 1994年12月第一版
6.张厚粲主编:《心理与教育统计学》 北京师范大学
出版社 1988年
7.叶佩华,邹有华,刘蔚成译:《心理与教育的测量
与评价》,人民教育出版社,1987年 8.John
Rusan,Susan
Colombox:
《
Modem
Psychometrics: The Science of Psychological aement》 Routledge 11 New Fetter lane,1989 9.Michael Cowles:《 Statistics in Psychology:An
Historical Inventory》Lawrence Erlbaum Aociates Inc 1989 10.A.Angleitner,J.S.Wiggins
Edite:of
《Personality Aement Via Questionaires》Springer-Verlag Belin Heidelberg 1986 11.Stanley
L.Brodsky,H.O’Neal
Smitherman:
《Handbook of Scales for Research in Crime and Delinguency》1983 Plenum Pre, New York 12.宋 杰 朱月妹:《小儿智能发育检查》 上海科学出
版社 1987年10月 第二版
13.汪向东等:《心理卫生评定量表手册》 中国心理卫
生杂志社 1999年12月 第二版
14.张明圆主编:《精神科评定量表手册》。湖南科学技
术出版社,1993.15.MMPI全国协作组:《明尼苏达多项人格测查表使用
指导书》 中国科学院心理研究所 1989年1月 16.纪术茂 戴郑生:《明尼苏达多项人格调查表——最
新研究与多量表解释》 科学出版社2004年1月 第一版
17.郑建民:MMPI在中国的问题与修订策略美国中
华心身医学杂志 1997年第一卷 第2期
18.郑建民:健康的定义与健康的等级标准 医学与
哲学 1998年增刊
04.9.26录用通知已经发出,编号13203,请尽快把发表费寄来,争取在2005年1期发表。健康心理学杂志编辑部 10.11:郑老师
您好,论文录用通知收到了吧,论文编号13203,请尽快把发表费寄来,争取安排在2005年第1期上。李建明