还剩20页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
第一章心理测量的理论基础第一节心理测量的理论基础
1.心理测量的基本概念1心理测量的定义根据一定的法则,用数字对人的行为加以确定测量就是根据一定的法则,使用工具对事物的特性进行定量描述的过程2测量的基本要素参照点:在测量工作中,必须有一种量的起点,这个起点就叫做测量的参照点两种绝对参照点,即以绝对的零点作为测量的参照点划分“有无”的界线相对参照点,即以认为确定的零点为测量的起点人为主观规定的原则注心理测量一般为相对零点;物理测量一般为绝对零点物理测量也有相对零点的状况,如温度、时间、海拔等单位:应具有两个条件有确定的意义;有相等的价值一般以原则差为单位3测量的量表命名量表:最低水平的测量量表,只是用数字代表事物或用数字对事物进行分r类名称量表用数字指代个别事物t类别量表用数字指代事物的种类记录措施比例、次数、众数、X2检查次序量表:次低水平的测量量表,不仅可以指代事物类别,并且可以表明不一样事物类别的大小、等级或事物具有某种特性的程度既没有相等的单位,也没有绝对的零点不能进行代数运算心理测量量表一般是在次序量表上进行的记录措施中位数、百分位数、等级有关系数、肯德尔友好系数等距量表:较高水平的测量量表,不仅可以指代事物的类别、等级,并且具有相等的单位,可以进行加减运算没有绝对的零点,是假定的相对零点记录措施平均数、原则差、积差有关系数、t检查、千检查比率量表:最高水平的测量量表,不仅可以懂得测量对象之间的相差程度,并且可以懂得它们之间的比例除了具有类别、等级、等距的特性外,还具有绝对的零点,可以进行加减乘除运算记录措施平均数、原则差、积差有关系数、t检查、千检查、几何平均数、变异系数
2.心理测量的特性与分类1心理测量的特性间接性只能通过一种人对测验项目的反应来推论出他的心理特质规定心理测验的项目分析——难度;辨别度;项目的综合分析和幽(讲义p249)o项目分析包括定性分析及定量分析定性分析包括考虑内容效度、题目编写的恰当性和有效性等,重点在于分析测题的内容和形式;定量分析重要是采用记录措施来分析试题的品质
1.难度
(1)难度的含义难度是指测验项目的难易程度
(2)难度的计算
①二分法记分项目的难度(客观题)通过率法:重要运用项目的通过率作为衡量难度的指标,即以答对或通过该项目的人数的比例P来表达|―o P值越大,题目越轻易极端分组法:当被试的人数较多时,可以先将被试分为三组,取最高的27%被试和最低的27%被试作为高分组和低分组,并分别计算通过率,最终求两个通过率的平均值作为该项目的推
②非二分法记分项目的难度(主观题)计算公式*在对两个非二分法记分的项目进行难度比较时,要对它们分别进行校正,排除由于猜测而答对某些题目致使通过率增大的也许性校正公式为
(3)难度水平确实定项目难度水平确实定取决于测验的目的和性质对于效标参照测验和掌握测验,可不考虑难度对于选拔测验,应将测验的项目难度控制在录取率左右对于选择题,难度应当不小于猜测概率无论何种测验,一般都应防止被试得满分,由于满分的意义是不明确的
(4)难度的等距变换(教材p75)以项目的通过率来表达项目的难度,此类难度指标属于次序变量,不具有相等的单位,所指出的仅仅是项目的相对难度于是需要把次序量表转换成等距量表(仅有名次不能计算,必须要有详细测验分数才可以)当样本容量很大时,测验分数将靠近正态分布根据正态分布曲线表,将试题的难度P作为正态曲线下的面积,转换成具有相等单位的等距量数,即Z分数原则分数(Z分数)具有相等的单位,属于等距量表较难的项目难度为正值,较易的项目难度为负值,P为
0.5时难度为0
(5)难度对测验的影响
①项目难度普遍较大的测验,分数分布将展现为正偏态;项目难度普遍较小的测验,分数分布将展现为负偏态一般能力测验和成就测验的平均难度在
0.5左右为宜,正偏态分布适合于筛选性测验
②过难或过易的测验会使测验分数相对的集中在低分端或高分端,从而使分数的全距缩小项目的难度以集中在
0.5左右为最佳,以集中在两端最差
2.辨别度
(1)辨别度的含义辨别度是指测验项目对被试心理品质水平差异的辨别能力或鉴别能力辨别度被用作评价项目质量,筛选项目的重要指标和根据具有良好辨别度的项目,能将不一样水平的被试辨别开来即在该项目上水平高的被试得高分,水平低的被试得低分把试题的辨别度称为测验与否具有效度的“指示器”辨别度(D)的取值范围介于
7.00至+
1.00之间一般D为正值,称作积极辨别;D为负值,称作消极辨别;D为0称作无辨别作用具有积极辨别作用的项目,其D值越大,辨别的效果越好*评价测验项目辨别度高下依赖于对被试水平的精确测量,一般称作为效标分数测验项目辨别度的效标分数多用测验总分,称为内部效标
(2)辨别度的计算
①项目鉴别指数法——二分法记分当效标成绩是持续变量时,可以从分数的两端各选择27%的被试,分别计算出每道题,工々4“7二,两者之差便是鉴别指数(D)o D值越高项目越有效计-O否才当D=
1.00时,高分组被试所有通过,低分组被试所有失败;假如低分组被试所有通过,高分组被试所有失败,则D=-
1.00;假如两组的通过率相等,则D=0o项目鉴别指数法只运用了一部分信息,挥霍了诸多信息,记录成果精确性差某些并且当项目与效标之间并非为直线关系时,甚至会得出错误的结论
②有关法——大规模或原则化测验以项目分数与效标分数或测验总分的有关作为项目辨别度的指标有关越高,项目辨别度越高a.点二列有关——项目是(0,1)记分或二分变量,效标或测验总分是持续变量b.二列有关--------持续的测量变量,其中一种变量被人为提成两类C.Q有关——两个变量是二点分派,即两个变量都是二分名义变量d.积差有关——论文式测验题目,得分具有持续性(被试团体较大时,可以认为项目分数服从正态分布)
③方差法被试在某一项目上的得分越分散,则该试题鉴别力越大
(3)辨别度的相对性
①不一样计算措施,所得辨别值不一样一种测验的各项目要采用同一种辨别度指标
②样本容量大小影响有关法辨别度值的大小样本容量越小,其记录值越不可靠
③分组原则影响鉴别指数分组越极端,其D值越大
④被试样本的同质性程度影响辨别度值的大小被试团体越同质,即个体之间水平越靠近,其测题的辨别度值越小4辨别度与难度的关系测验项目的难度对测验项目的鉴别力有一定的影响,难度与辨别度有着亲密的联络难度越靠近
0.5时,项目潜在的辨别度越大,而难度越靠近
1.00或0时,项目潜在的辨别度越小为了使项目具有较高辨别能力,应使所有项目都保持在
0.5的难度最为理想在运用项目分析选择试题时,应使项目的难度分布广某些,梯度大某些,使整个测验的难度分布呈正态分布,且平均水平保持在
0.5左右这样才能把多种水平的人都辨别开来,并且分的比较细*难度既影响信度又影响效度;难度影响辨别度
3.选项分析选项分析就是对选择题背面提供的几种答案的分析重要的异常状况有
①对的答案无人选择,或少于其他选项的人数;
②错误答案选的人太多;
③对的选项上的高分组选择人数少于低分组;
④错误选项上的高分组选择人数多于低分组;
⑤某个选项无人选择;
⑥未答的人数较多1原则对的选项精确唯一;错误选项具有干扰性、困惑性第五节心理测验的编制
2.测验编制的基本程序1确定测验目的2制定编题计划3编写测验题目4题目试测与分析5合成测验及复本6测验使用原则化7信度与效度分析8编写测验阐明书
一、确定测验目的
1.明确测量对象——测量哪些个人或团体
2.明确测量目的——测量什么心理功能.*目的详细化
3.明确测量用途——描述?诊断?选拔?验证?
二、制定编题计划要明确的信息:一是全面而具代表性的测验内容,不致使测题偏离了应测的范围;二是对各个内容点的相对重视程度,一般用比例来标明用途:指明编题方向;确定记分原则
三、编写测验题目
1.搜集测验资料原则:1)资料要丰富;【临床观测的资料、已经有的测题】2)资料要有普遍性;3)资料要有趣味性
3.选择项目形式原贝h1)使受测者轻易明了测验措施2)使受测者在完毕测验时不会因测验项目的形式不妥而做错3)测验过程省时4)计分省时省力5)经济
4.编写测验项目注意:1)测验项目的取样对欲测心理品质具有代表性;2)测验项目的取材范围要同编题计划所列项目范围相一致;3)测验项目的难度应有一定的分布范围;4)用语要力争精炼简短,浅显明了5)初编题目的数量要多于最终所需要的数量,以便筛选或编制复本;6)测验项目的阐明必须简要
四、题目试测与分析
1.预测目的:获得被试对测验项目做何反应的资料,包括质的信息与量的指标质题目思想性、逻辑错误、印刷、装订量难度、辨别度、项目分析注意:1)预测对象应取自未来正式测验时准备施用的群体,人数不必太多,但要具有代表性;2)预测的情境应力争同正式测验的情境一致;3)预测的时限可以合适延长,以便每一种受测者都能将题目做完;4)施测者应对受测者的反应加以记录
2.项目分析——对预测成果进行记录分析,确定项目的难度和辨别度
五、合成测验及复本合成测验就是把通过预测后来证明有价值的项目排成有组织的测验
1.测验项目的选择指标(3个)测验的性质;项目的难度;项目的辨别度
2.测验项目的编排总的编排原则:由易到难两种常见百方式:1)并列直进式:依其难度由易到难排列2)混合螺旋式:依难度提成若干不一样的层次,再将不一样性质的测验项目予以组合,作交叉式的排列,其难度则渐次升进
3.编制复本(A、B卷一a等值性)等值需要符合的条件1)各份测验测量的是同一种心理特质;2)各份测验具有相似的内容和形式;3)各份测验不应有反复的项目;4)各份测验项目数量相等,并且有大体相似的难度和辨别度**ABBA的次序——平衡难度►
六、测验使用原则化原则化是指测验的编制、施测、评分以及解释测验分数的程度的一致性
1.测验内容相似的或等值的题目
2.施测过程相似的测验情境;相似的指导语;相似的测验时限
3.测验评分1)对反应要及时清晰的记录;2)要有原则答案或对的反应的表格,即记分键;3)将受测者的反应与记分键比较,确定受测者反应应得的分数
4.测验分数的解释
七、鉴定测验(信度与效度分析)
1.信度——测验的可靠性;即用同一测验多次测量同一团体,所得测验成果之间具有一致性
2.效度——测验的有效性;即一种测验在多大程度上可以测得所要测得的东西
3.测验量表与常模
①按照记录学的原理,把某一原则化样本的测验分数转化为具有一定参照点、等值单位的导出分数,这就是所谓的测量量表常见百分等级量表、原则分数量表、T量表、发展量表、智力商数量表等
②假如将原则化样本的测验分数与对应的某一种或某几种测验量表分数一起用表格的形式展现出来,就是该测验的常模表
八、编写测验阐明书1)本测验的目的与功用;2)本测验的理论根据;3)测验内容及实行测验的措施;4)测验的原则答案和评分措施;5)有关测验的信度、效度资料的阐明;6)常模表,即怎样根据常模解释测验成果
2.测验目的与双向细目表(讲义p250)
3.题目编制技术(讲义p250-p251)第六节心理测验的实行测验的使用重要波及两个问题1)怎样实行测验才能保证测验分数尽量少受施测过程的影响;2)怎样解释测验分数才能保证受测者的心理不受负面影响
一、测验的实行过程通过观测受测者在测验情境中的行为样本,可以推断他平日一般的行为特性
1.施测前的准备工作
(1)准备好测验材料
(2)纯熟掌握施测手续训练的内容包括
①熟悉测验内容;
②掌握施测环节;
③掌握记分措施;
④掌握解释分数的技术
(3)熟记测验指导语并能用口语清晰而流利地说出来
2.指导语指导语一般包括对测验目的的阐明和对题目反应方式的解释注意一般规定测验的主持者和指导语都应保持和表述中立的态度,不倾向于答案中的任何一种方向*一般的能力测验和成就测验都规定有原则严格的时间限制;而人格测验和态度测验一般不规定有时间限制
3.测验情境包括测验场地(通风、光线、噪声)、座位、答案纸型等
4.测验焦急测验焦急是指被试因接受测验而产生的一种忧虑和紧张情绪,它会影响测验成果的真实性主试有时可以运用保证测验成果绝对保密或鼓励被试等措施来消除测验焦
5.与受测者建立良好的协调关系良好的协调关系指的是施测者设法努力引起受测者对测验的爱好,获得他的合作,以保证他能按照原则测验指导语行事
6.评分技术
二、测验分数的解释重要波及两个问题一是怎样看待测验分数的意义;二是怎样将测验分数的意义告诉受测者
1.怎样看待测验分数的意义高德曼的三个维度的解释模型三个维度分别是解释测验分数的类型、资料处理的措施、资料的来源「解释测验分数的4种类型论述的解释、溯因的解释、预测的解释、评价的解释J资料处理的2种措施机械的处理、非机械的处理I资料的2种来源测验资料、非测验资料三个维度加以组合4*2*2=16种不一样的解释方式基本原则:1)主试应充足理解测验的性质与功能2)对导致测验成果的原因的解释应谨慎,谨防片面极端3)必须充足估计测验的常模和效度的局限性4)解释分数应参照其他有关资料5)对测验分数应以“一段分数”来解释,而不应以“特定的数值”来解释6)对来自不一样测验的分数不能直接加以比较
2.怎样将测验分数的意义告诉受测者(教材p131-p132)补充讲义p252第七节测验常模
1、常模与常模团体1)常模用于比较和解释测验成果的原则化样本的分数分布常模是根据原则化样本的测验分数通过记录处理而建立起来的具有参照点和单位的测验量表编制常模需要三步
①确定有关的比较团体;
②获得该团体组员的测验分数;
③把原始分数转化成量表分数2)常模团体常模团体是作为比较原则的具有某些共同特性的人构成的群体或该群体的样本3)确定常模团体的注意事项
①群体构成的界线必须明确;
②常模团体必须是所测群体的一种代表性样本;(遵照随机化原则)e.g.分层抽样
③取样的过程必须明确且有详尽的描述;
④样本大小要合适;(取样误差与样本大小成反比;其他条件相似时样本越大越好)-----------
⑤常模团体必须是近时的;即减低抽样误差,就必须加大样本容量•—
⑥注意一般常模与特殊常模的结合
2、分数转换与合成分数的转换按某种规则将原始分数转化为导出分数的过程1)原始分数从测验中直接获得的分数;被试在接受测验后,根据测验的记分原则,对照被试的反应所计算出的测验分数原始分数反应了被试答对题目的个数或作答对的的程度;不能直接反应出被试之间的差异状况、被试互相比较后所处的地位、被试在其他等值测验上应获得什么样的分值2)导出分数在原始分数转换的基础上,按照一定的规则,通过记录处理后获得的具有一定参照点和单位,且可以互相比较的分数常用的导出分数有百分等级、原则分数、T分数分数的合成将几种分数或几种预测源组合起来,以获得一种合成分数或做总的预测有3种类型1)项目的组合;2)分测验或量表的组合;3)测验或预测源的组合分数合成中的问题:1)采用什么措施来合成分数?取决于构成测验分数的目的与要做何种决定2)什么形式是最合适的分数组合?可用效标效度来评价合成分数3)需要多少及何种测验分数作最合适的组合分数?可用合成体效度来评价分数合成的措施:等量加权,差异加权综合分段1临床判断预测误差,渐进效度,合成体效度轮廓分析推理措施单位加权,多根据经验做出诊断;这种根据直觉的经验,主观地将多种原2因加权,而获得结论或预测的措施叫做临床诊断O重分段持续栅栏,多重3长处
①具有高度的综合性;
②具有灵活的针对性回归基本方程,特殊措4缺陷
①主观加权易受决策者的偏见影响,不够客观;施完形记分,51临床诊断——直觉合成
②缺乏精确的数量分析,没有精确的数量指标2>加权求和合成——推理措施单位加权,等量加权,差异加权1单位,权将各个测验分数直接相加而获得合成分数公式为2等量加权将所有测验分数转换为原则分数,然后采用下式加权组合(合用于各测验对预测效标具有同等重要性的场所)公式为:3差异加权一般状况下,各个变数对预测效标的作用是不一样的因此需要根据各个变数与效标之间的经验关系作差异加权公式为e.g,分数离散程度大的课程,具有较强辨别度,在录取时起的作用大3>多重划分——多重分段持续栅栏,综合分段
①多重划分就是在各个特质上都确定一种原则,从而把成绩划分为合格与不合格两类只有每个测验都合格时,总规定才算合格(同步考察)
②持续栅栏就是在整个测验实行时,是把所有构成这一测验的分测验按一定次序排列起来逐一实行,只有通过了前一次测验,才能继续实行后一种测验4>多重回归基本方程,预测误差,渐进效度,合成体效度多重回归就是研究一种事物或现象与其他多种事物或现象在数量上互相联络和互相制约的记录措施基本方程式为通过对预测源作合适加权,使这些加权的测验分数的合成能以最小的误差来预测效标分数注意:最佳预测源选出与效标有关最高的变量,然后加入另一预测源组合起来以使R的数值增至最大,Esft要加入的预测源应当是与前两个预测源组合起来能使R值增长最多的,飞次类推,当加入额外的预测源不再明显的使有关系数R值增长时,则终止分析和Y有关尽量高,和X1有关尽量低5>特殊措施完形记分,轮廓分析展现常模的措施转化表,剖析图转化表的构成要素有:原始分数、对应的导出分数、对常模团体的详细描述剖析图是把一套测验中几种分测验分数同图表(图形)表达出来
3、几种常模分数发展量表1)年龄量表——所测量的特质随年龄作有系统的变化百分等级一种原始分数的百分等级,是指在一种群体的测验分数中,得分低于这个分数的人数的比例百分等级取值越大,阐明成绩越优秀百分等级分数的计算
(1)未分组分数资料e.g.成绩为80分的百分等级为83,就是说比80分低的原始分数占全体得分的83%,比其高的只占17%2分组分数资料四舍五入对百分等级的评价百分等级是一种相对位置量数,具有可比性,且易于计算,解释以便;但它是一种次序量数,不具有可加性两个缺陷:
①单位不等,尤其在分派的两个极端;
②只具有次序性,无法阐明不一样被试之间分数差异的数量*百分等级是相对于特定的被试团体而言的,解释时不能离开特定的参照团体原则分数原则分数是一种具有相等单位的量数,又称作Z分数,以Z表达原则分数的计算公式为(线性转化)对Z分数的评估Z分数是以平均数为参照点,以原则差为单位的等距量表具有可比性、可加性;由符号与绝对值两部分构成正负符号表达原始分数在平均数之上或之下,绝对值表达原始分数与平均数的距离1)线性转化(如上)2)长期化(T分数、原则
九、原则
十、离差智商)长期化就是正态化,是指使用非线性变换,将非正态分布的分数强制性的扭转成正态分布
①T分数麦柯尔提出,公式为|T在[0,100]之间平均数为50,原则差为10;T分数防止了小数与负号
②原则九以
0.5个原则差为单位,将正态曲线下的横轴分为九段,最高一端为9分,最低一端为1分,中间一段为5分,除两端外,每段均有半个原则差宽
③原则十卡特尔16PF
④离差智商韦氏智力测验采用||平均数为100,原则差为15o第八节原则参照测验
1.原则参照测验的含义与作用原则参照测验是根据某一明确界定的内容范围而缜密编制的测验当一种测验是以某一明确界定的内容范围为基础编制而成,并且其分数是参照该内容范围相对性:测量就是看每个人处在这个序列的什么位置上,由此测得一种人智力的高下、爱好的大小等,都是与所在团体的大多数人的行为或某种人为确定的原则相比较而言的客观性:是对一切测量的基本规定,实际上就是测量的原则化问题
(2)心理测验的分类按功能(测量对象)分能力测验、成就测验(学绩测验)、人格测验按对象分个别测验、团体测验按形式分纸笔测验、操作测验、口头测脸、电脑测验按目的分描述性测验(调查性测验)、诊断性测验、预示性测验按规定分最高作为测验、经典作为测验按速度和难度分速度测验、难度测验按性质分构造性测验、投射性测验按解释分常模参照测验、原则参照测验按应用分教育测验、职业测验、临床测验补充:1)能力测验能力可分为实际能力和潜在能力实际能力指个人目前“所能为者”,代表个人已经有的知识经验与技能潜在能力指个人未来“也许为者“,是也许到达的水平测量潜在能力的测验称为能力倾向测验能力测验又可以分为一般能力测验(一般说的智力)和特殊能力测验(音乐、美术、体育等特殊方面)2)纸笔测验(文字、图形材料);操作测验(不适宜团体实行)3)速度测验——测反应速度;难度测验——测最高能力4)[最高作为测验有对的答案,分数越高越好;(能力测验、成就测验)t经典作为测验没有对的答案,一般的习惯方式;(人格测验)5)[构造性测验刺激和被试的任务是明确的t投射性测验刺激、问题模糊,被试任务不明确;能投射出更真实的成果
3.经典测量理论及其模型
(1)心理特质表目前一种人身上所特有的相对稳定的行为方式
①特质是一组具有内部有关的行为的概括,具有一定的抽象性
②特质是“一种一般的神经心理系统,可以综合不一样刺激,使人对这些刺激做出相似反应”
③特质是一种人身上比较稳定的特点
④一种人的精神面貌是由多种特质分多种层次有机组合而成的
⑤特质可以决定一种人对特定刺激的反应倾向,可以对人的行为进行预测
(2)经典测量理论(CTT)的模型
①观测分数实测分数,记作X
②真分数反应被试某种心理特质真正水平的数值操作定义多次测量成果得到的平均数,记作To(理论上设想出来的抽象概念)
③误差分数这里只是指测量产生的随机误差,记作Eo(E是个服从均值为0的正态分布的随机变量)@X=T+E这就是CTT的数学模型(引申3个假设公理)
⑤观测分数的变异等于真分数的变异与误差分数的变异之和所规定的绝对原则进行解释时,称这一测验为原则参照测验通过原则参照测验,可以理解个体在所规定测量内容上的行为水平,其出发点是个体自身的组对水平
2.原则参照测验的题目分析*测验项目的难度分析与常模参照测验相似,一般以通过率表达*测验项目的辨别度分析
①当采用掌握组-未掌握组的预测措施时,可以使用鉴别系数(D)
②当采用前测-后测措施,可获得在前测中错误回答某项目而在后测中可以对的回答的被试人数比例,此即该项目的个人获得指数
3.原则参照测验的信度与效度1)原则参照测验的信度及其估计
①分类一致性信度——计算两次都被分到一类中的被试占总被试人数的比例
②方差分析措施——荷伊特信度2)原则参照测验的效度及其估计
①内容效度
②效标关联效度
4.原则参照测验的分数解释
(1)专家鉴定法
①NedeI sky法
②Angof千法
(2)效标组预测法
①临界组法
②对照组法详见讲义p256-p258第九节心理测验理论的新发展
一、经典测量理论的局限
1.记录指标依赖于被试样本;(难度、辨别度、信度、效度).
2.分数解释依赖于测验难度;(难度不一样,解释不一样).
3.同一测验相似分数其含义不一样;(做对的题目其难度不一样)
4.信度估计不精确;(没有更精确的总体估计).
5.测验成果不能概化到非原则化情境;(原则化测验不能推广)
6.被试做同样题目无法照顾个别差异(被试水平不一样,相对难易程度不一样)
二、项目反应理论
1.基本假设
①潜在特质空间的单维性假设;
②局部独立性假设;(各项目之间不有关,不影响)
③对的反应概率与特质水平间函数关系假设;
④非速度测验假设(对时间没有限制)
2.项目反应的参数及模型单参数、二参数、三参数「单参数辨别度4二参数难度、辨别度i三参数难度、辨别度、猜测率
3.项目特性曲线及信息函数项目特性曲线(教材p292)信息函数作为信度的指标
4.项目反应理论的应用(题目分析、题库、自适应测验)题目分析可根据图形直接判断——曲线越陡峭,辨别度越高;曲线越往右侧靠,难度越大自适应测验根据不一样被试的水平予以不一样难度的测验;防止天花板、地板效应
5.项目反应理论的长处及局限局限对于现今的测验,单维假设不成立,二分法记分不合用
三、概化理论概化理论是经典测量理论与方差分析结合的产物,其关键是从特定条件下的测量成果来推断更广泛的条件下也许得到的测量成果
1.基本概念题目、被试、主试等多种影响原因测量目的所要测量的心理特质;/测量侧面影响测量过程和成果的多种内在外在虚国(每个影响原因都是一种侧面);测量情境由测量目的和测量侧面构成,即测什么和怎么测的结合
2.基本假设替代信度可靠性与随机平行测验假设-------------——用观测全域中随机抽取的一种样例来推断全域的可靠性作为信度指标
3.概化理论的长处与局限
①用随机平行测验取代严格平行测验,操作以便;
②用方差分析技术能全面估计多种误差成分的相对大小;(能整合起来)
③在措施和应用上均有待完善
四、测验等值
1.含义将不一样测验版本分数统一在一种量表上的过程;使其具有可比性
2.特性等价性、可逆性、组间一致性
3.种类测验分数等值、项目参数等值、横向等值、纵向等值(难度、辨别度)(测验间)(时间)
4.措施
①平均数等值A测验平均分80与B测验平均分70等值
②百分位等值A测验80分为75百分等级,B测验70分为75百分等级,80与70等值
③线性等值用原则差计算一代数公式<用平均数、原则差计算)
④项目反应理论等值参数等值
5.设计
①单组设计一两个测验对同一组人测试
②等组设计一随机抽取两个组,假设为等组
③等组交叉设计一前两种措施结合,一组先A卷后B卷,另一组先B卷后A卷
④共同被试设计一有一部分共同的人做中介,既参与A卷又参与B卷
⑤钾测验设计一用共同的题目作为钏来进行测验
⑥混合设计一以上设计混合
(3)基本假设
①观测分数的平均值靠近于真分数即£(X)=T或者w(E)=0
②真分数与误差分数的有关为零即p(T,E)=0
③各平行测验的误差分数的有关为零即p(E1,E2)=0平行测验假如两个题目不一样的测验测的是同一特质,并且题目形式、数量、难度、辨别度以及测查等值团体后所得分数的分布(均值和原则差)都是一致的,则这两个测验被称作是彼此平行的测验第二节测量的信度与效度
1.测验的信度——受随机误差的影响
(1)信度……一致性、稳定性信度是测量成果的可靠性,等于一组测量分数中真分数的变异与总变异之比信度指的是测量成果的稳定性程度;若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量成果间的一致性程度就叫信度定义1信度乃是一种被测团体的真分数的变异数与实得分数的变异数之比二定义2信度乃是一种被试团体的真分数与实得分数的有关系数的平方定义3:信度乃是一种测验X(A卷)与它的任意一种平行测验X,(B卷)的有关系数______信度的作用:
①信度是测量过程中所存在的随机误差大小的反应
②信度可以用来解释个人测验分数的意义测量的原则误计算公式
③信度可以协助进行不一样测验分数的比较
(2)信度的估计措施1重测信度:用同一种测验,对同一组被试前后两次施测,两次测验分数所得的有关系数为再测信度★皮尔逊积差有关系数注重测信度具有跨时间上的稳定性使用的前提条件:1)所测量的心理特性必须是稳定的2)遗忘和练习的效果基本上互相抵消(适度的时间间隔,几分钟、几小时甚至几年)3)在两次施测间隔期内,被试没有获得更多的学习和训练2复本信度:根据一组被试在两个平行(等值)测验上的得分计算的有关系数即为复本信度★皮尔逊积差有关系数注1)[同步持续施测——等值性系数t相距一段时间分两次施测——稳定性与等值性系数(此种复本信度最小)2)稳定性与等值性系数是对信度最严格的检查,其值最低3)为抵消次序效应,可以二分之一被试TA卷B卷,另二分之一被试B卷A卷使用的前提条件:1)要构造出两份或两份以上真正平行的测验(即A、B卷)真正平行:复本测验之间必须在题目内容、数量、形式、难度、辨别度、指导语、时限以及所用的例题、公式和测验等其他方面都相似或相似2)被试要有条件接受两个测脸3分半信度:按正常的程序实行测验,然后将所有项目分为相等的两半,根据个人在这两半测验的分数计算其有关系数有时也被称作内部一致性系数★斯皮尔曼一布朗公式等价:弗朗那根公式、卢仑公式酉——心有关系数需要校正一//上二/取八*吐]a i1)分半信度一般是在只能施测一次或没有复本的状况下使用2)分半措施诸多(如按题号的奇偶性分半、按题目的难度分半、按题目的内容分半等),同一种测验一般会有多种分半信度值
④同质性信度:也称内部一致性系数,指的是测验内部所有题目间的一致性程度*\ZWWW\/\Z\Z*一致性测的是同一种心理特质;所有题目得分之间都具有较高的正有关*当一种测验具有较高的同质性信度时,阐明测验重要测的是某一单个心理特质,实测成果就是该特质水平的反应;若同质性信度不高,阐明测验成果也许是几种心理特质的综合反应*测量单一特性是同质性高的必要而非充足条件,同质性高是测得单一特质的充足条件*库德一理查逊信度系数克龙巴赫a系数1)KR20公式——合用于(
0、1)记分的测验【客观试题】2)KR21公式——合用于(
0、1)记分的测验【客观试题】3)克龙巴赫a系数——合用于(
0、1)记分的测验【客观试题】和【主观试题】*KR
20、KR21只是a的特例4)荷伊特信度一一用方差分析的措施来计算信度
⑤评分者信度:随机抽取部分试卷,由两个或多种评分者独立按评分原则打分,然后求其间的有关当评分者人数为2时——★积差有关系数、等级有关系数当评分者人数多于2时——★肯德尔友好系数
(3)信度的影响原因
1、被试方面就单个被试而言,被试的身心健康状况、应试动机、注意力、耐心、求胜心、作答态度(猜测)等会影响测量误差就被试团体而言,整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度
2、主试者方面就施测者而言,若不按指导手册中的规定施测,或故意制造紧张气氛,或给以暗示、协助等,则测量信度会大大减少就评分者而言,若评分原则掌握不一,或前紧后松,甚至随心所欲,则也会减少测量信度
3、施测情境方面考场与否安静、光线和通风状况与否良好、所需设备与否齐全、桌面与否合乎规定、空间阔窄与否恰当等都也许影响测量信度
4、测量工具方面测量工具与否性能稳定是测量工作成败的关键一般的,试题的取样、试题之间的同质性程度、试题的难度等都是影响测验稳定性的重要原因
5、两次施测的间隔时间计算重测信度和稳定性与等值性系数时,两次测验相隔时间越短,其信度值越大;间隔时间越长,信度值就也许越小★斯皮尔曼一布朗公式(计算测验项目数量变化对信度的影响)
(4)信度的改善措施1)合适增长测验的长度(测验越长信度越高)【新增项目必须与试卷中原有项目同质;新增项目的数量必须适度】2)使测验中所有试题的难度靠近正态分布,并控制在中等水平3)努力提高测验试题的辨别度4)选用恰当的被试团体,提高测验在各同质性较强的亚团体上的信度5)主试者严格执行施测规程,评分者严格按原则给分,实测场地按测验手册的规定进行布置,减少无关原因的干扰6)间隔时间要合适
2.测验的效度——受随机误差、系统误差的影响
(2)效度的估计措施
①内容效度:指项目对欲测的内容或行为范围取样的合适程度指一种测验实际测到的内容与所要测量的内容之间的吻合程度,它一般包括欲测的知识范围,以及该范围内各知识点所规定掌握的程度【内容范围;题目代表性】注内容效度应用于成就测验和职业测验;不合用于能力倾向测验和人格测验★表面效度不能算是一种效度内容效度确实定措施a.专家判断法(逻辑分析法)——题量合适、题目的代表性、题目覆盖范围广b.复本法(记录分析措施)——平行测验的复本信度<若有关低则两个测验中至少有一种缺乏内容效度;若有关高则测验也旌有较高的内容效度)c.再测法——前测、后测d.经验法
②效标效度:考察测验分数与效标的关系,看测验对我们感爱好的行为预测的怎样效标效度(效标关联效度)也叫实证效度,是指一种测验对处在特定情境中的个体的行为进行估计的有效性也就是说,一种测验与否有效,应当以实践的效果来作为检查原则*效标效度可以分为同步效度(用于诊断现实状况)预测效度(用于预测某个个体未来的行为)效标——存在于测量之外;可以独立进行测量;可以量化1)被估计的行为是检查测验效度的原则,简称为效标效标就是衡量一种测验与否有效的外在原则,它是独立于测验并可以从实践中直接获得我们所感爱好的行为(观念效标)观念效标具有多样性、复杂性、特殊性和时间性2)常用效标有学业成就、等级评估、临床诊断、专门的训练成绩、实际工作体现等例如考察“高考”的效度,用“大学学习成绩”作为效标效标效度确实定措施a.有关法--------计算测验分数与效标测量的有关系数【积差有关法、等级有关法、二列有关法、四分有关法】b.辨别法(分组法)——可以把好坏两组人有效地辨别开来——差异越大,阐明测验越有效思绪被试接受测验后,让他们工作一段时间,再根据工作成绩(效标测量)的好坏分为两组,回过来分析这两组被试原先接受测验的分数差异c.命中率——用于选拔性测验,影响原因录取率、基础率——正命中率的比率越高,测验越有效总命中率:根据测验选出的人当中工作合格的人数,以及根据测验淘汰的人当中工作不合格的人数之和与总人数之比正命中率:用测验选出的人中合格者所占的比例d.预期表法e.功利率法
③设想效度:指测验对理论上的设想或特质的测量程度又称构造效度,是指一种测验实际测到所要测量的理论构造和特质的程度,或者说它是指测验分数可以阐明心理学理论的某种构造或特质的程度选典或构造指心理学理论所波及到的抽象而属假设性的概念或特质,如智力、焦急、动机等注设想效度重要用于智力测验和人格测验设想效度确实定措施a.测验内法(测验内部寻找证据法)•确定测验的内容效度——内容效度高实质上也就阐明构造效度高分析被试对项目做反应的答题过程■考察测验的同质性信度——测验同质只是必要条件b.测验间法(测验之间寻找证据法)•相容数度一考察新编测验与某个已知的能有效测量相似特质的旧测验间的有关避别数度一考察新编测验与某个已知的能有效测量不一样特质的旧测验间的有关原因效度(原因分析)一对一组测验进行原因分析,找出影响测验的共同原因补充:1)相容效度与辨别效度IF相容效度:和测量相似特质的旧测验有高有关、歪韭、?.攵住|必要非充足木件t辨别效度和测量不一样特质的旧测验有低有关2)原因分析每个测验在共同原因上的负荷量(即测验与各原因的有关)就是测验的原因效度c.效标关联法(实证效度法)两种
①根据效标把人提成两类,考察其得分的差异
②根据测验得分把人提成高分组、低分组,考察两组人在所测特质方面与否确有差异d.多种特质一多种措施矩阵法——相容效度和辨别效度的综合运用原理用多种极不相似的措施测量同一种特质有关很高(用极为相似的措施测量不一样特质有关很低),阐明测量效度较高e.试验操作法
(3)效度的影响原因【只要影响信度就一定影响效度】「测验自身项目质量;项目数量测验的实行《被试身心状态;样本特点主试原因I所用效标*但凡与测量目的无关的、稳定的和不稳定的变异来源都会影响测量的效度
①测验的构成当试题样本没有很好的代表欲测内容或构造时,或题目语意不清、指导语不明、题目太难或太易、题目太少或安排不妥时,都会减少测量效度测蜃近度与效度的公式
②测验的实行过程在测验实行过程中,如不遵从指导语的规定,或出现意外干扰,或评分、计分出现差错等,都会减少测量效度
③接受测验的被试就单个被试而言,被试的应试动机、情绪、态度、身体状态等,都会导致较大的随机误差,进而影响测量效度就被试团体而言,假如缺乏必要的同质性年龄、性别、文化程度、职业等,则很也许会得到不恰当的效度资料
④所选效标的性质由于同一种测验可以有不一样的效标,同一种观念效标也可以有不一样的效标测量,因此在评价测量效度时,所选效标的性质是很重要的考虑原因【在考虑效标与分数的有关时,必须注意测验分数与效标之间与否符合线性关系】
⑤测量的信度4效度的改善措施
①通过原则化全面减少多种测量误差
②精心编制测验量表,防止出现较大的系统误差
③妥善组织测验,控制随机误差
④创设原则的应试情境,让每个被试都能发挥正常的水平
⑤选好对的的效标,定好恰当的效标测量,对的地使用有关公式5信度与效度的关系
①信度高是效度高的必要非充足条件一种测验效度高,其信度也必然高;但一种测验信度高,其效度不一定高
②测验的效度受它的信度制约〈信度系数的平方根是效度系数的最高程度,效度永远不不小于信度〉
③效度等于测验信度系数与效标信度系数乘积的开方记录推导公式一第三节心理测量的误差
1.误差的种类与控制1随机误差的来源及控制测验自身、施测情境、主试原因、被试原因2系统误差的来源及控制测验自身、主试原因、被试原因控制原则化施测、严格控制测验条件、取样要有代表性
2.测量误差的估计测量的原则误差异的原则误*误差分数分布的原则差称为愿则送1测量误差的定义测量误差是指在测量过程中由那些与测量目的无关的变化原因所产生的一种不精确或不一致的测量效应它的含义包括
①测量误差是由那些与测量目的无关的变因所致;
②测量误差体现为不精确或不一致两种方式心理测量的误差可分为两类随机误差和系统误差随机误差是由与测量目的无关的、偶尔原因引起的,而又不易控制的误差它使多次测量产生不一致的成果,其方向和大小的变化完全是随机的,只符合某种记录学规律系统误差是由与测量目的无关的变因引起的一种恒定而有规律的效应这种误差稳定的存在于每一次测量中,尽管多次测量成果非常一致,但实测成果仍与真实数字有所差异r系统误差按规律变动,成比例t恒定误差固定数值不变*系统误差只影响精确性,不影响稳定性;随机误差既影响稳定性又影响精确性2)测量误差的来源及控制心理测量的误差重要来自三个方面,即测量工具、测量对象和施测过程在测量工具方面,心理测量与物理测量有所不一样心理测量工具一般是以一套测验(问卷)为关键的刺激反应系统(一般称作量表)当量表在测查人的某种心理特质时,若项目所测的东西与我们欲测的目的之间出现偏差,则测量会出现误差测量工具信度不好、效度不高是导致误差的两种重要原因在测量对象方面,导致测量误差的重要原因是受测者真正水平与否得到正常发挥一般的,受测者的某种心理特质水平是相对稳定的,不过他在接受测量时的生理和心理状态会影响其水平的正常发挥此外,受测者应试动机的强弱、受训时间的长短、受训内容的多少、答题反应的快慢等都会产生测量误差在施测过程方面,产生测量误差的原因重要是某些偶尔原因,包括施测物理环境,主试的某些属性,评分记分环节出现的疏漏,以及意外干扰等懂得了误差的来源,就可以根据来源的不一样,采用针对性的措施减少误差3)测量误差的估计经典测量理论假定X=T+E,X为实得分数或观测分数,T为假设的真分数(一种测量工具在测量没有误差时得到的纯粹值,其操作定义是无多次测量所得成果的平均值),E为测量误差其他有关误差的假设:
①假如对一种人测量无多次,其误差之和为0,平均误差为0,即E=0
②误差与真分数互相独立;其中的误差是指随机误差,只与偶尔原因有关,而与真分数大小无关,即真分数与误差分数的有关系数为0o
③一种团体的平均真分数T等于该团体中所有被试实得分数的平均值Xo在一种团体中,由于每个人的误差都是随机的且方向不一样,只要团体足够大,其误差就会互相抵消因此,其误差和为0
④真分数的变异可以分为两部分与测验目的有关的变异(有效的变异数)和与测验目的无关的变异(无效的变异数),公式则总体的关系式为第四节测验的项目分析。
个人认证
优秀文档
获得点赞 0