心理测量复习_心理测量复习整理
心理测量复习由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“心理测量复习整理”。
心理测量
第一章 绪论 高尔顿(英)
1893年在《人类才能及其发展的研究》中首先提出“测验”和“心理测量”这两个术语。直接推动测验运动发展的第一人,最早实际从事测验活动,采用评定量表,问卷法,自由联想技术的先驱,发展出分析个别差异资料的统计方法。
受到洛克感觉论思想的影响,认为“外部世界的任何信息欲传至个人,唯一的途径是经过我们的感官。” 卡特尔
1890年《心理测验与测量》使“心理测验”第一次出现于心理文献中 文中提及了评定学生的智力水平:10项测试
与高尔顿观点相同:认为唯有通过对感觉器官的辨别力与反应时的测量才可测得智力的功能。
比奈(法)
心理测验的鼻祖,世界上第一个真正意义上的智力测验诞生
1903年《智力的实验研究》中智力是广义的,包括一切高级心理过程。
比奈观点:智力是人所具有的及其复杂的能力,非简单的方法所能测量,因此要直接选择广泛而复杂的课题才能测量智力。
与西蒙合作,完成了世界上第一个智力测验量表——比奈-西蒙量表 1905年在《心理学年报》发表《诊断异常儿童的新方法》介绍次量表,因此该量表也称1905年量表。
1908年,1911年修正,分别称1908年量表,1911年量表
在美国,最著名的修订:斯坦福大学教授推孟1916年执导修订,即S-R量表 心理测验在我国的发展:
昌盛时期:从“五四”前后至1928年,1931年6月,由艾伟,陆志伟,陈鹤琴,肖孝嵘等组织的中国测验学会在南京正式宣告成立。停止发展:1949年至1978年 重新发展:20世纪70年代后期 第二章 心理测量和测验的一般介绍
测量定义:依据一定的法制使用量具对事物的特征进行描述的过程。测量最基本特征:把事物进行区分的过程
测量三要素:测量的对象-事物的属性和特征;测量的规则或法制-给事物的属性分派数字的依据;测量的结果-描写事物属性的数字或符号。
法制有好有坏,当测量的其他条件相同时,使用不同的法制会产生不同的测量效果。测量的要素:参照点和单位。
参照点包括绝对的零点和人定的零点。不以绝对的零点为参照点的计算只能进行加减运算,不能进行乘除运算。
心理测量多采用人定的相对零点,因此其结果只有高低之分,没有倍数之分。理想的单位:有确定的意义;有相等的价值。
一般来说,心理测量的单位不够完善,既无统一的单位,也不符合等距的要求。测量水平:类别测量,等级测量,等距测量,比率测量 测量量表:类别量表,等级量表,等距量表,比率量表
类别量表又称名称量表,等级量表又称顺序量表,比率量表又称等比量表 心理量表均为顺序量表,采用相对参照点
心理测验:依据一定的心理学理论,使用测验对人的心理特质进行定量描述的过程。(依据一定的心理学理论,使用一定的操作程序,给人的行为和心理属性确定出一种数量化的价值)心理测量的特点:间接性,相对性,客观性
间接性是指无法直接测量人的心理,只能测量人的外显行为(特质理论)相对性是没有绝对零点
心理测量运用测验为工具,达到了解人类心理的实践活动,是动词 心理测验是了解人心理的工具,是名词
心理测验三要素:行为样组,标准化及客观性
行为样组:为了正确地,可靠地推论所要测量的东西,就得凭借一组行为,这一组行为即行为样组。
一个测验的好坏,首先决定于测题编制的好坏,即必须要求这些测题能够引发和测量出具有高度代表性的行为样组。
标准化:测验的一致性,包括测验用品的一致性,测验指导语的同一性,测验中主试与被试关系的稳定性,测验评价的一致性等
客观性:测验不受主观支配,其测量方法可以重复,测验的实施,记分和解释都是客观的。客观性是衡量科学性的一个根本标志,对心理测验来说,决定一个心理测验能否存在的必要条件。行为样组的代表性和测验程序的标准化都是为了保证这种客观性。心理测验客观性指标:信度,效度,难度,鉴别力 中等难度的项目鉴别力最高
信度:测验结果的可靠程度(信度问题实质是一组被试两次测量的一致性问题)信度的高低可用相关系数来表示,信度包括:重测信度,复本信度,内在一致性信度
一般来说,标准智力测验信度应达到0.85以上,个性测验和兴趣测验应达0.70-0.80水平,学业成就测验0.90以上。
效度:一个测验实际测量出所测特征或功能的真实性程度,心理测验最重要的客观性指标。鉴别一个测验的好坏,其首要指标是效度。效度是针对测验的目的而言的 效度分为:内容效度,结构效度,效标关联效度
内容效度:测验所选的项目测题符合所欲测验内容的程度,运用逻辑法,经验法 结构效度:测验实际测量出所欲测量的心理结构或特征的程度 效标关联效度:又称实证效度或准则关联效度 根据测验对象:认知测验(能力测验),人格测验 根据人数分类:个别测验,团体测验
根据测验材料:语言或文字测验,非语言测验或操作性测验
测验应用的功能:了解个别差异;诊断,预测和评价;甄选,分类和安置;为心理辅导和心理咨询服务;心理和教育科研的辅助手段。第三章 智力测验
智力测验也就智力测量,目的在于测量智力的高低。指在一定条件下,使用特定的标准化的测验量表对被试施加刺激,从被试的一定反应中测量其智力的高低。也指由经过专门训练的研究人员采用标准化的测验量表对人的智力水平进行科学测量的一个过程。智力测验就是对表现一个人智力水平的行为样组进行测量,用数字对之加以描述,它的结果是给人的智力行为确定一种数量化的值
智力测验结果用智商(IQ)表示,比奈提出智龄-比率智商-离差智商
智龄(MA)是由儿童答对测题的多少确定的,然后通过智龄与实龄(CA)的比较来衡量儿童智力水平的高低 智龄只能表示一名儿童智力的绝对水平,不能比较实龄不同的儿童智力的高低 智商(比率智商)首先由德国汉堡大学斯腾教授提出的 智商能表示智力的相对水平,成为比较儿童聪明程度的指标 比率智商公式:智商(IQ)=智龄(MA)/实龄(CA)*100 比率智商的基本假设:智力发展和年龄增长成正比。
离差智商,1949年韦克斯勒首次采用IQ=100+15(Z)
韦克斯勒儿童智力量表修订版(WISC-R)特点:是当今国际心理学界公认的已被广泛运用的个别智力测验量表;适用范围是6岁至16岁少年儿童;在结构上言语(文字)和操作(非文字)测验兼而有之;第一次在用于儿童的,个别实施的,汇合性的测验中采用了离差智商。韦克斯勒把全量表分为言语量表,操作量表两大部分
WISC-R将形式相同的测题分别组成份测验,每一项分测验内测题有难易之分并按难度的递增依次排列。共有12项分测验,言语量表由常识,类同,算术,词汇,理解,背数6个分测验组成,操作量表由填图,排列,积木,拼图,译码,迷津6个分测验组成,其中背数和迷津是补充测验。斯比量表第四版特点:在内容上涵盖较广泛的认知技能及信息处理能力方面的测试,突破早期版本较偏重语言的倾向,范围扩大至数量,空间及短时记忆;采用“分测验”的形式;15个分量表,主要评估四个较大领域的认知技能-语言推理,数量推理,抽象视觉推理,短时记忆;施测程序上,保存了原先适应性测验特点;提供代表一般推理能力的总分及上述四个领域的分数,四个领域中任何组合的分数,以及15个分测验的个别分数。斯比量表全量表的标准分:T=100+16(Z)瑞文测验原名渐进矩阵,是英国心理学家瑞文与1938年创制 已发展出标准型,彩色型,高级型,联合型四种 瑞文测验标准型(瑞文测验的最初型)由ABCDE五个单元构成,每单元12个测题,共60题,测题按从易到难原则依次排序 AB单元主要测量儿童直接观察辨别的能力
CDE三个单元主测一个人对矩阵(3*3)的系列关系进行类别推理的能力 这五个单元的渐进矩阵的构图说明其中的系列关系越来越隐蔽,因素越来越多,解决这类问题越来越依靠间接的抽象概括的思维能力——类比推理 瑞文推理彩色型
为了适应测量幼儿及智力低下者而设计的,共36题,将原来黑白的标准型中的AB两单元加上色彩以突出图形的鲜明性,并插入一个彩色AB单元,共12题 瑞文推理高级型
适用于智力超常者,共60题,包括渐进矩阵Ⅰ型(12题)及Ⅱ型(48题)瑞文推理联合型,简称CRT 由标准型与彩色型联合而成,由72幅图案构成72个测题的一本图册,内有A, AB,B,C,D,E六个单元,每单元12题,前三个单元彩色,后三个单元黑白,适用于5-75岁以内的幼儿,儿童,成年人及老年人。
较高的信度,中等的效度,但不能完全代替多方面相的智力测验 智力测验的优点:就评价内容来说,智力测验中严格选定的测题比较有利于考察被试的各种能力;就被评价者的范围来看,智力测验把一个人的分数与更广大的地区内的同龄人进行比较;评定学生智力发展水平的快速和有效的工具
智力测验在教育上的应用:选拔和安置;筛选,诊断和制定补救工作;教育研究成果效能核定和评价。第四章 人格测验
人格测验是以人格为测量对象的测验 人格:个性中除能力之外的部分,特指那些不同于人的认知能力的情感,动机,态度,气质,性格,兴趣,品德,价值观等。、人格特点:复合型,相对稳定性,差异性,可变性
人格测验分类:结构不明确的投射测验,结构明确的问卷测验 投射测验:罗夏墨迹测验,主题统觉测验(TAT),文字联想测验,画人或画树测验 问卷式人格测验:自陈量表,评定量表 自陈量表方法:合理建构法(逻辑法),因素分析法,实践标准法(经验法)相对应的量表:内容效度人格问卷,因素分析人格问卷,经验效标人格问卷 评定量表:以标准化程序来评定结果,评定法可以看做是观察法与测验法的结合 卡特尔16种人格因素问卷(16PF A,B,C,D,E,F,G,H,I,L,M,N,O,Q1,Q2,Q3,Q4,特点:客观性,标准化,多功能,广泛性,深刻性 明尼苏达多相人格问卷(MMPI)效度量表包括无回答(Q或?),说谎(L)15题,效度(F)64题,修正(K)30题 艾森克人格问卷(EPQ)标准分:T=50+10(Z)四个分量表:E量表(内外向),N量表(精神质,又称情绪性),P量表(神经质,又称倔强性),L量表(效度,测定受测者的掩饰,假托或自身隐蔽等情况)加州心理调查表(CPI)
四类:人际关系适应能力的测验(6个量表);社会化,成熟度,责任心及价值观测验(6个量表);成就潜能与智能效率的测量(3个量表);个人生活态度与倾向方面的测量(3个量表)
三个效度量表:Gi(好印象),Wb(幸福感),Cm(从众)
投射测验特点:使用非结构任务,允许被试有各种各样不受限制的反应(刺激材料越不具有结构化,反应就越能代表被试人格的真正面貌);测量目标具有掩蔽性;解释的整体性。投射测验的不足:评分缺乏客观标准,难以量化;缺少充分的常模资料,测验结果不易解释;信度和效度不易建立;原理复杂深奥,非经专门训练者不能使用。第五章 信度
信度的操作定义:对测量一致性程度的估计。
一般地,性能良好的能力与学习成就测验的信度应达到0.90以上,性格,兴趣,价值观等人格测验的信度系数应达到0.80以上 误差:抽样误差(信度时可忽略),系统误差(与信度无关,与效度有关),测量误差(与信效度都有关)
信度完全受测量误差的影响
真分数:心理测量中的真实值,即测量中不存在测量误差时的真值或客观值 真分数的操作定义:无数次测量的平均值,用X∞或T
Xt= X∞+Xe或X=T+E
Xe或E 表示误差分数,Xt或X表示实测分数
真分数理论的三个基本假设:误差分数的平均数是零;误差分数与真分数相互独立,即相关为零;两次测量的误差分数之间的相关为零
信度的基本定义:一组测验分数中真分数方差与实测分数方差的比率
测量误差来源于:测验本身,测验实施过程,被试本身
估计信度的方法:重测信度;复本信度;内在一致性系数;评分者信度;综合重测信度和复本信度特点的稳定-等值系数
重测信度:也称稳定系数,是一组被试在不同时间用同一测验测量两次,两次测验分数的相关系数。——估计测验中跨时间的一致性
复本信度:又称等值系数,估计两个假定相等的复份测验之间的一致性,是两个平行测验分数的相关。——估计测验跨形式的一致性
内在一致性系数:估计测验跨项目或两个分半测验之间的一致性 评分者信度:估计测验跨评分者的一致性
稳定-等值系数:估计测验跨时间和形式的一致性
估计内在一致性系数的方法:分半法,对项目反应的方差或协方差进行分析 分半法:先把一份测验按题目的奇偶顺序或其他方法分成两个尽可能平行的半份测验,然后计算两半之间的相关,即得到分半信度系数。斯皮尔曼-布朗公式修正:
斯皮尔曼-布朗公式通式:
基于项目协方差的方法:
库德-理查逊公式20(K-R20),库德-理查逊公式21(K-R21),要0,1计分 克朗巴赫
系数,适用于非0,1计分的一种内在一致性系数
斯皮尔曼-布朗方法与库德-理查逊方法假设相同,均要求测题的难度相等,组间相关相等 评分者信度:由多个评分者给一组测验结果评分,所得各个分数之间的一致性 影响信度系数的因素:分数分布范围;测验长度;测验难度 分数分布范围越宽,信度系数就越高
其他条件不变时,测验长度越长,即题目越多,信度就越高
测验的标准误差:测量误差分布的标准差,表示测量误差的大小,用Se表示,又称标准误 测量的标准误差反映的也是一组被试的情况,可以用来估计个人的真分数 用测量的标准误差估计真分数:
第六章 效度
效度操作定义:一个测验对其所要测量的特性测量到什么程度的估计,即测验的准确性 效度理论定义:效度是总变量中由所测量的特性造成的变差所占的百分比
效度的性质:针对测验结果;针对某种特定的测验目的;只能程度上的差异(即高,中,低)效度种类:内容效度,结构效度,准则关联效度
内容效度:测验用的测题对整个测验内容范围的代表性程度。验证和提高内容效度的方法:专家评定,双向细目表 结构效度:测验能说明心理学的理论结构或特质的程度,或用心理学上某种结构或特质来解释测验分数的恰当程度。准则:检验效度的参照标准,用以显示测验所欲测量的特性的变量,通常以一种测验分数或活动来表示。
影响效度的因素:测验本身的因素;测验实施和计分方式;被试的主观方面;进行效度化所依据的有关准则;样组方面
信度与效度的关系:高信度是高效度的必要条件,而不是充分条件;信度系数的平方根是效度系数的最高限度。第七章 项目分析
项目分析:对组成测验的每个测题进行分析
项目难度:表示题目难易程度的指标——等级量表 1.P=R/N 二值计分(只有答对与答错两种情况)P难度,R答对该题的人数,N参加测验者的总数 2.P=X/Xmax 非二值计分
Xmax该题的满分,X全体考生在该题上所得的平均分数 P值越小的项目,难度越大。难度值在0.35-0.65之间为好
3.分组,取得分最高的27%的被试作为高分组,取得分最低的27%被试作为低分组 P=(PH+PL)/2
对不同选项数测题的难度进行比较时,要进行项目难度的矫正
CP=(KP-1)/(K-1)CP矫正后的难度,P 未矫正的难度,K选项的数目 转换为难度的等距量表(查Z值)
避免负号的出现:Z1=Z+5 或△=13+4(Z)
5,13为平均数,1,4为标准差 难度与测验分数的分布:
正偏态分布,大多数被试集中在左侧低分端,接近零分的多,说明测验过于困难,适合于筛选性测验
负偏态分布,大多数被试集中在右侧高分端,接近满分,说明测验很多项目太容易,缺少难得项目,适合于达标测验
一般能力测验和成就测验的平均难度在0.50左右为宜
项目的鉴别力:又称区分度,指项目对不同水平的被试反应的区分程度和鉴别能力
项目鉴别指数:取27%,D=PH—PL
D值越大,项目的鉴别力越大,表示项目的质量越好 D 0.40以上,优良;D 0.30-0.39,良好,如能修改更好;D 0.20-0.29 尚可,仍需修改;D 0.19以下,劣,必须淘汰 第八章 量表与常模
常模:标准化样本的测验作业情况,一般把用作比较的团体叫做常模团体,其一般平均分数叫做常模。
建立常模:通过分析标准化样组的实际作业情况 导出分数:从原始分数转换而来的具有一定参照点和单位的测验量表上的数值,与原始分数等值的量表分数 标准化样组的条件:标准化样组的成员必须给予确切的定义;标准化样组必须是欲测量的全域的一个代表性样组;取样的过程必须有详细的描述;标准化样组的规模要有适当的大小;标准化样组是一定时空的产物。
常用的概率抽样方法:简单随机抽样,等距抽样,分层随机抽样,整群抽样 百分量表是等级量表,标准分数量表可以使测验分数表示为等距量表,即具有相当的单位的量表
标准分数Z是原始分数与平均分数的离差以标准差为单位的分数
常态化的标准分数是通过对原始分数的非线性转换而来的,有一个近似正态曲线的分布 T分数:平均数为50,标准差为10,T=50+10(Z)
百分等级:常模团体中得分在该原始分数以下的被试的百分数
百分等级是对原始分数的一种非线性转换,百分量表时等级(顺序)量表,无法加减乘除。第九章 测验的编制与使用
测验的一般程序:确定测验的目的;分析测量目标;产生测题;测验的标准化;鉴定测验的基本特征;编写测验指导书。
心理测验的使用:选择测验,施测,评分,测验结果的解释和报告及实际运用