心理測量學(xué)筆記——備考北師大.doc
《心理測量學(xué)筆記——備考北師大.doc》由會員分享,可在線閱讀,更多相關(guān)《心理測量學(xué)筆記——備考北師大.doc(36頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
心理測量學(xué) 第一章 心理測量的理論基礎(chǔ) 第一節(jié) 心理測量的理論基礎(chǔ) 1. 心理測量的基本概念 (1) 心理測量的定義 依據(jù)一定的法則,用數(shù)字對人的行為加以確定。 測量就是依據(jù)一定的法則,使用工具對事物的特征進(jìn)行定量描述的過程。 (2) 測量的基本要素 參照點(diǎn):在測量工作中,必須有一個量的起點(diǎn),這個起點(diǎn)就叫做測量的參照點(diǎn)。兩種:絕對參照點(diǎn),即以絕對的零點(diǎn)作為測量的參照點(diǎn)。劃分“有無”的界限。 相對參照點(diǎn),即以認(rèn)為確定的零點(diǎn)為測量的起點(diǎn)。人為主觀規(guī)定的標(biāo)準(zhǔn)。 注:心理測量一般為相對零點(diǎn);物理測量一般為絕對零點(diǎn)。物理測量也有相對零點(diǎn)的情況,如溫度、時間、海拔等。 單位:應(yīng)具備兩個條件:有確定的意義;有相等的價值。(一般以標(biāo)準(zhǔn)差為單位) (3) 測量的量表 命名量表:最低水平的測量量表,只是用數(shù)字代表事物或用數(shù)字對事物進(jìn)行分類。名稱量表:用數(shù)字指代個別事物。 類別量表:用數(shù)字指代事物的種類。 統(tǒng)計(jì)方法:百分比、次數(shù)、眾數(shù)、X2檢驗(yàn)。 順序量表:次低水平的測量量表,不僅能夠指代事物類別,而且能夠表明不同事物類別的大小、等級或事物具有某種特征的程度。既沒有相等的單位,也沒有絕對的零點(diǎn)。不能進(jìn)行代數(shù)運(yùn)算。心理測量量表一般是在順序量表上進(jìn)行的。 統(tǒng)計(jì)方法:中位數(shù)、百分位數(shù)、等級相關(guān)系數(shù)、肯德爾和諧系數(shù)。 等距量表:較高水平的測量量表,不僅能夠指代事物的類別、等級,而且具有相等的單位,可以進(jìn)行加減運(yùn)算。沒有絕對的零點(diǎn),是假定的相對零點(diǎn)。 統(tǒng)計(jì)方法:平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)系數(shù)、t檢驗(yàn)、f檢驗(yàn)。 比率量表:最高水平的測量量表,不僅可以知道測量對象之間的相差程度,而且可以知道它們之間的比例。除了具有類別、等級、等距的特征外,還具有絕對的零點(diǎn),可以進(jìn)行加減乘除運(yùn)算。 統(tǒng)計(jì)方法:平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)系數(shù)、t檢驗(yàn)、f檢驗(yàn)、幾何平均數(shù)、變異系數(shù)。 2. 心理測量的特征與分類 (1)心理測量的特征 間接性:只能通過一個人對測驗(yàn)項(xiàng)目的反應(yīng)來推論出他的心理特質(zhì)。 相對性:測量就是看每個人處在這個序列的什么位置上,由此測得一個人智力的高低、興趣的大小等,都是與所在團(tuán)體的大多數(shù)人的行為或某種人為確定的標(biāo)準(zhǔn)相比較而言的。 客觀性:是對一切測量的基本要求,實(shí)際上就是測量的標(biāo)準(zhǔn)化問題。 (2)心理測驗(yàn)的分類 按功能(測量對象)分:能力測驗(yàn)、成就測驗(yàn)(學(xué)績測驗(yàn))、人格測驗(yàn) 按對象分:個別測驗(yàn)、團(tuán)體測驗(yàn) 按形式分:紙筆測驗(yàn)、操作測驗(yàn)、口頭測驗(yàn)、電腦測驗(yàn) 按目的分:描述性測驗(yàn)(調(diào)查性測驗(yàn))、診斷性測驗(yàn)、預(yù)示性測驗(yàn) 按要求分:最高作為測驗(yàn)、典型作為測驗(yàn) 按速度和難度分:速度測驗(yàn)、難度測驗(yàn) 按性質(zhì)分:構(gòu)造性測驗(yàn)、投射性測驗(yàn) 按解釋分:常模參照測驗(yàn)、標(biāo)準(zhǔn)參照測驗(yàn) 按應(yīng)用分:教育測驗(yàn)、職業(yè)測驗(yàn)、臨床測驗(yàn) 補(bǔ)充: 1)能力測驗(yàn):能力可分為實(shí)際能力和潛在能力。實(shí)際能力指個人當(dāng)前“所能為者”,代表個人已有的知識經(jīng)驗(yàn)與技能。潛在能力指個人將來“可能為者”,是可能達(dá)到的水平。測量潛在能力的測驗(yàn)稱為能力傾向測驗(yàn)。能力測驗(yàn)又可以分為普通能力測驗(yàn)(通常說的智力)和特殊能力測驗(yàn)(音樂、美術(shù)、體育等特殊方面)。 2)紙筆測驗(yàn)(文字、圖形材料);操作測驗(yàn)(不宜團(tuán)體實(shí)施) 3)速度測驗(yàn)——測反應(yīng)速度;難度測驗(yàn)——測最高能力。 4) 最高作為測驗(yàn):有正確答案,分?jǐn)?shù)越高越好;(能力測驗(yàn)、成就測驗(yàn)) 典型作為測驗(yàn):沒有正確答案,通常的習(xí)慣方式;(人格測驗(yàn)) 5) 構(gòu)造性測驗(yàn):刺激和被試的任務(wù)是明確的 投射性測驗(yàn):刺激、問題模糊,被試任務(wù)不明確;能投射出更真實(shí)的結(jié)果 3. 經(jīng)典測量理論及其模型 (1) 心理特質(zhì):表現(xiàn)在一個人身上所特有的相對穩(wěn)定的行為方式。 ①特質(zhì)是一組具有內(nèi)部相關(guān)的行為的概括,具有一定的抽象性。 ②特質(zhì)是“一種一般的神經(jīng)心理系統(tǒng),可以綜合不同刺激,使人對這些刺激做出相同反應(yīng)”。 ③特質(zhì)是一個人身上比較穩(wěn)定的特點(diǎn)。 ④一個人的精神面貌是由多種特質(zhì)分多個層次有機(jī)組合而成的。 ⑤特質(zhì)可以決定一個人對特定刺激的反應(yīng)傾向,可以對人的行為進(jìn)行預(yù)測。 (2) 經(jīng)典測量理論(CTT)的模型 ①觀察分?jǐn)?shù):實(shí)測分?jǐn)?shù),記作X。 ②真分?jǐn)?shù):反映被試某種心理特質(zhì)真正水平的數(shù)值。操作定義:多次測量結(jié)果得到的平均數(shù),記作T。(理論上構(gòu)想出來的抽象概念) ③誤差分?jǐn)?shù):這里只是指測量產(chǎn)生的隨機(jī)誤差,記作E。(E是個服從均值為0的正態(tài)分布的隨機(jī)變量) ④X=T+E 這就是CTT的數(shù)學(xué)模型。(引申3個假設(shè)公理) ⑤觀察分?jǐn)?shù)的變異等于真分?jǐn)?shù)的變異與誤差分?jǐn)?shù)的變異之和。 (3) 基本假設(shè) ①觀察分?jǐn)?shù)的平均值接近于真分?jǐn)?shù)。即ε(X)=T或者ε(E)=0 ②真分?jǐn)?shù)與誤差分?jǐn)?shù)的相關(guān)為零。即ρ(T,E)=0 ③各平行測驗(yàn)的誤差分?jǐn)?shù)的相關(guān)為零。即ρ(E1,E2)=0 平行測驗(yàn):如果兩個題目不同的測驗(yàn)測的是同一特質(zhì),并且題目形式、數(shù)量、難度、區(qū)分度以及測查等值團(tuán)體后所得分?jǐn)?shù)的分布(均值和標(biāo)準(zhǔn)差)都是一致的,則這兩個測驗(yàn)被稱作是彼此平行的測驗(yàn)。 第二節(jié) 測量的信度與效度 1. 測驗(yàn)的信度——受隨機(jī)誤差的影響 (1) 信度……一致性、穩(wěn)定性 信度是測量結(jié)果的可靠性,等于一組測量分?jǐn)?shù)中真分?jǐn)?shù)的變異與總變異之比。 信度指的是測量結(jié)果的穩(wěn)定性程度;若能用同一測量工具反復(fù)測量某人的同一種心理特質(zhì),則其多次測量結(jié)果間的一致性程度就叫信度。 定義1:信度乃是一個被測團(tuán)體的真分?jǐn)?shù)的變異數(shù)與實(shí)得分?jǐn)?shù)的變異數(shù)之比。 定義2:信度乃是一個被試團(tuán)體的真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平方。 定義3:信度乃是一個測驗(yàn)X(A卷)與它的任意一個平行測驗(yàn)X’(B卷)的相關(guān)系數(shù)。 信度的作用: ①信度是測量過程中所存在的隨機(jī)誤差大小的反映。 ②信度可以用來解釋個人測驗(yàn)分?jǐn)?shù)的意義。測量的標(biāo)準(zhǔn)誤計(jì)算公式 ③信度可以幫助進(jìn)行不同測驗(yàn)分?jǐn)?shù)的比較。 (2) 信度的估計(jì)方法 ① 重測信度:用同一個測驗(yàn),對同一組被試前后兩次施測,兩次測驗(yàn)分?jǐn)?shù)所得的相關(guān)系數(shù)為再測信度?!锲栠d積差相關(guān)系數(shù) 注:重測信度具有跨時間上的穩(wěn)定性。 使用的前提條件: 1) 所測量的心理特性必須是穩(wěn)定的。 2) 遺忘和練習(xí)的效果基本上相互抵消。(適度的時間間隔,幾分鐘、幾小時甚至幾年) 3) 在兩次施測間隔期內(nèi),被試沒有獲得更多的學(xué)習(xí)和訓(xùn)練。 ② 復(fù)本信度:根據(jù)一組被試在兩個平行(等值)測驗(yàn)上的得分計(jì)算的相關(guān)系數(shù)即為復(fù)本信度?!锲栠d積差相關(guān)系數(shù) 注:1) 同時連續(xù)施測——等值性系數(shù) 相距一段時間分兩次施測——穩(wěn)定性與等值性系數(shù) (此種復(fù)本信度最?。? 2)穩(wěn)定性與等值性系數(shù)是對信度最嚴(yán)格的檢驗(yàn),其值最低。 3)為抵消順序效應(yīng),可以一半被試A卷 B卷,另一半被試B卷 A卷 使用的前提條件: 1) 要構(gòu)造出兩份或兩份以上真正平行的測驗(yàn)(即A、B卷)。 真正平行:復(fù)本測驗(yàn)之間必須在題目內(nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語、時限以及所用的例題、公式和測驗(yàn)等其他方面都相同或相似。 2) 被試要有條件接受兩個測驗(yàn)。 ③ 分半信度:按正常的程序?qū)嵤y驗(yàn),然后將全部項(xiàng)目分為相等的兩半,根據(jù)個人在這兩半測驗(yàn)的分?jǐn)?shù)計(jì)算其相關(guān)系數(shù)。有時也被稱作內(nèi)部一致性系數(shù)。 ★斯皮爾曼—布朗公式 等價:弗朗那根公式、盧侖公式 注:一般使用奇偶分半法;相關(guān)系數(shù)需要校正。 使用的前提條件: 1)分半信度通常是在只能施測一次或沒有復(fù)本的情況下使用。 2)分半方法很多(如按題號的奇偶性分半、按題目的難度分半、按題目的內(nèi)容分半等),同一個測驗(yàn)通常會有多個分半信度值。 ④同質(zhì)性信度:也稱內(nèi)部一致性系數(shù),指的是測驗(yàn)內(nèi)部所有題目間的一致性程度。 *一致性:測的是同一種心理特質(zhì);所有題目得分之間都具有較高的正相關(guān)。 *當(dāng)一個測驗(yàn)具有較高的同質(zhì)性信度時,說明測驗(yàn)主要測的是某一單個心理特質(zhì),實(shí)測結(jié)果就是該特質(zhì)水平的反映;若同質(zhì)性信度不高,說明測驗(yàn)結(jié)果可能是幾種心理特質(zhì)的綜合反映。*測量單一特性是同質(zhì)性高的必要而非充分條件,同質(zhì)性高是測得單一特質(zhì)的充分條件。 ★庫德—理查遜信度系數(shù) 克龍巴赫a系數(shù) 1)KR20公式——適用于(0、1)記分的測驗(yàn)【客觀試題】 2)KR21公式——適用于(0、1)記分的測驗(yàn)【客觀試題】 3)克龍巴赫a系數(shù)——適用于(0、1)記分的測驗(yàn)【客觀試題】和【主觀試題】 *KR20、KR21只是a的特例 4)荷伊特信度——用方差分析的方法來計(jì)算信度 ⑤評分者信度:隨機(jī)抽取部分試卷,由兩個或多個評分者獨(dú)立按評分標(biāo)準(zhǔn)打分,然后求其間的相關(guān)。 當(dāng)評分者人數(shù)為2時——★積差相關(guān)系數(shù)、等級相關(guān)系數(shù) 當(dāng)評分者人數(shù)多于2時——★肯德爾和諧系數(shù) (3) 信度的影響因素 1、 被試方面 就單個被試而言,被試的身心健康狀況、應(yīng)試動機(jī)、注意力、耐心、求勝心、作答態(tài)度(猜測)等會影響測量誤差。 就被試團(tuán)體而言,整個團(tuán)體內(nèi)部水平的離散程度以及團(tuán)體的平均水平都會影響測量信度。 2、 主試者方面 就施測者而言,若不按指導(dǎo)手冊中的規(guī)定施測,或故意制造緊張氣氛,或給以暗示、協(xié)助等,則測量信度會大大降低。 就評分者而言,若評分標(biāo)準(zhǔn)掌握不一,或前緊后松,甚至隨心所欲,則也會降低測量信度。 3、 施測情境方面 考場是否安靜、光線和通風(fēng)情況是否良好、所需設(shè)備是否齊全、桌面是否合乎要求、空間闊窄是否恰當(dāng)?shù)榷伎赡苡绊憸y量信度。 4、 測量工具方面 測量工具是否性能穩(wěn)定是測量工作成敗的關(guān)鍵。一般的,試題的取樣、試題之間的同質(zhì)性程度、試題的難度等都是影響測驗(yàn)穩(wěn)定性的主要因素。 5、 兩次施測的間隔時間 計(jì)算重測信度和穩(wěn)定性與等值性系數(shù)時,兩次測驗(yàn)相隔時間越短,其信度值越大;間隔時間越長,信度值就可能越小。 ★ 斯皮爾曼—布朗公式(計(jì)算測驗(yàn)項(xiàng)目數(shù)量變化對信度的影響) (4) 信度的改進(jìn)方法 1)適當(dāng)增加測驗(yàn)的長度。(測驗(yàn)越長信度越高) 【新增項(xiàng)目必須與試卷中原有項(xiàng)目同質(zhì);新增項(xiàng)目的數(shù)量必須適度】 2)使測驗(yàn)中所有試題的難度接近正態(tài)分布,并控制在中等水平。 3)努力提高測驗(yàn)試題的區(qū)分度。 4)選取恰當(dāng)?shù)谋辉噲F(tuán)體,提高測驗(yàn)在各同質(zhì)性較強(qiáng)的亞團(tuán)體上的信度。 5)主試者嚴(yán)格執(zhí)行施測規(guī)程,評分者嚴(yán)格按標(biāo)準(zhǔn)給分,實(shí)測場地按測驗(yàn)手冊的要求進(jìn)行布置,減少無關(guān)因素的干擾。 6)間隔時間要適當(dāng)。 2. 測驗(yàn)的效度——受隨機(jī)誤差、系統(tǒng)誤差的影響 (1) 效度的含義……有效性、準(zhǔn)確性 效度是指一個測驗(yàn)或量表實(shí)際能測出其所要測的心理特質(zhì)的程度,等于一組測量分?jǐn)?shù)中與測量目的有關(guān)的變異與實(shí)得變異之比。 注:1)效度是一個相對的概念(相對于測量目的而言;只能通過行為進(jìn)行推測)。 2)效度是測量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。 3)判斷測量是否有效要從多方面搜集證據(jù)。 (2) 效度的估計(jì)方法 ① 內(nèi)容效度:指項(xiàng)目對欲測的內(nèi)容或行為范圍取樣的適當(dāng)程度。指一個測驗(yàn)實(shí)際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度,它通常包括欲測的知識范圍,以及該范圍內(nèi)各知識點(diǎn)所要求掌握的程度?!緝?nèi)容范圍;題目代表性】 注:內(nèi)容效度應(yīng)用于成就測驗(yàn)和職業(yè)測驗(yàn);不適合用于能力傾向測驗(yàn)和人格測驗(yàn)。 ★ 表面效度不能算是一種效度。 內(nèi)容效度的確定方法 a.專家判斷法(邏輯分析法)——題量適當(dāng)、題目的代表性、題目覆蓋范圍廣 b.復(fù)本法(統(tǒng)計(jì)分析方法)——平行測驗(yàn)的復(fù)本信度 <若相關(guān)低則兩個測驗(yàn)中至少有一個缺乏內(nèi)容效度;若相關(guān)高則測驗(yàn)可能有較高的內(nèi)容效度> c.再測法——前測、后測 d.經(jīng)驗(yàn)法 ② 效標(biāo)效度:考察測驗(yàn)分?jǐn)?shù)與效標(biāo)的關(guān)系,看測驗(yàn)對我們感興趣的行為預(yù)測的如何。效標(biāo)效度(效標(biāo)關(guān)聯(lián)效度)也叫實(shí)證效度,是指一個測驗(yàn)對處于特定情境中的個體的行為進(jìn)行估計(jì)的有效性。也就是說,一個測驗(yàn)是否有效,應(yīng)該以實(shí)踐的效果來作為檢驗(yàn)標(biāo)準(zhǔn)。 *效標(biāo)效度可以分為同時效度(用于診斷現(xiàn)狀) 預(yù)測效度(用于預(yù)測某個個體將來的行為) 效標(biāo)——存在于測量之外;可以獨(dú)立進(jìn)行測量;能夠量化。 1) 被估計(jì)的行為是檢驗(yàn)測驗(yàn)效度的標(biāo)準(zhǔn),簡稱為效標(biāo)。效標(biāo)就是衡量一個測驗(yàn)是否有效的外在標(biāo)準(zhǔn),它是獨(dú)立于測驗(yàn)并可以從實(shí)踐中直接獲得我們所感興趣的行為(觀念效標(biāo))。觀念效標(biāo)具有多樣性、復(fù)雜性、特殊性和時間性。 2) 常用效標(biāo)有學(xué)業(yè)成就、等級評定、臨床診斷、專門的訓(xùn)練成績、實(shí)際工作表現(xiàn)等。例如:考察“高考”的效度,用“大學(xué)學(xué)習(xí)成績”作為效標(biāo)。 效標(biāo)效度的確定方法 a.相關(guān)法——計(jì)算測驗(yàn)分?jǐn)?shù)與效標(biāo)測量的相關(guān)系數(shù) 【積差相關(guān)法、等級相關(guān)法、二列相關(guān)法、四分相關(guān)法】 b.區(qū)分法(分組法)——能夠把好壞兩組人有效地區(qū)分開來 ——差異越大,說明測驗(yàn)越有效 思路:被試接受測驗(yàn)后,讓他們工作一段時間,再根據(jù)工作成績(效標(biāo)測量)的好壞分為兩組,回過來分析這兩組被試原先接受測驗(yàn)的分?jǐn)?shù)差異。 c.命中率——用于選拔性測驗(yàn),影響因素:錄取率、基礎(chǔ)率 ——正命中率的比率越高,測驗(yàn)越有效 總命中率:根據(jù)測驗(yàn)選出的人當(dāng)中工作合格的人數(shù),以及根據(jù)測驗(yàn)淘汰的人當(dāng)中工作不合格的人數(shù)之和與總?cè)藬?shù)之比。 正命中率:用測驗(yàn)選出的人中合格者所占的比例。 d.預(yù)期表法 e.功利率法 ③ 構(gòu)想效度:指測驗(yàn)對理論上的構(gòu)想或特質(zhì)的測量程度。又稱結(jié)構(gòu)效度,是指一個測驗(yàn)實(shí)際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度,或者說它是指測驗(yàn)分?jǐn)?shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。 構(gòu)想或結(jié)構(gòu)指心理學(xué)理論所涉及到的抽象而屬假設(shè)性的概念或特質(zhì),如智力、焦慮、動機(jī)等。 注:構(gòu)想效度主要用于智力測驗(yàn)和人格測驗(yàn)。 構(gòu)想效度的確定方法 a.測驗(yàn)內(nèi)法(測驗(yàn)內(nèi)部尋找證據(jù)法) 確定測驗(yàn)的內(nèi)容效度——內(nèi)容效度高實(shí)質(zhì)上也就說明結(jié)構(gòu)效度高 分析被試對項(xiàng)目做反應(yīng)的答題過程 考察測驗(yàn)的同質(zhì)性信度——測驗(yàn)同質(zhì)只是必要條件 b.測驗(yàn)間法(測驗(yàn)之間尋找證據(jù)法) 相容效度—考察新編測驗(yàn)與某個已知的能有效測量相同特質(zhì)的舊測驗(yàn)間的相關(guān) 區(qū)分效度—考察新編測驗(yàn)與某個已知的能有效測量不同特質(zhì)的舊測驗(yàn)間的相關(guān) 因素效度(因素分析)—對一組測驗(yàn)進(jìn)行因素分析,找出影響測驗(yàn)的共同因素 補(bǔ)充: 1)相容效度與區(qū)分效度 必要非充分條件 相容效度:和測量相同特質(zhì)的舊測驗(yàn)有高相關(guān) 區(qū)分效度:和測量不同特質(zhì)的舊測驗(yàn)有低相關(guān) 2)因素分析:每個測驗(yàn)在共同因素上的負(fù)荷量(即測驗(yàn)與各因素的相關(guān))就是測驗(yàn)的因素效度。 c.效標(biāo)關(guān)聯(lián)法(實(shí)證效度法) 兩種:①根據(jù)效標(biāo)把人分成兩類,考察其得分的差異 ②根據(jù)測驗(yàn)得分把人分成高分組、低分組,考察兩組人在所測特質(zhì)方面是否確有差異。 d.多種特質(zhì)—多種方法矩陣法——相容效度和區(qū)分效度的綜合運(yùn)用 原理:用多種極不相同的方法測量同一種特質(zhì)相關(guān)很高(用極為相似的方法測量不同特質(zhì)相關(guān)很低),說明測量效度較高。 e.實(shí)驗(yàn)操作法 (3) 效度的影響因素【只要影響信度就一定影響效度】 測驗(yàn)本身:項(xiàng)目質(zhì)量;項(xiàng)目數(shù)量 測驗(yàn)的實(shí)施 被試:身心狀態(tài);樣本特點(diǎn) 主試因素 所用效標(biāo) *凡是與測量目的無關(guān)的、穩(wěn)定的和不穩(wěn)定的變異來源都會影響測量的效度。 ①測驗(yàn)的構(gòu)成 當(dāng)試題樣本沒有較好的代表欲測內(nèi)容或結(jié)構(gòu)時,或題目語意不清、指導(dǎo)語不明、題目太難或太易、題目太少或安排不當(dāng)時,都會降低測量效度。 &測驗(yàn)長度與效度的公式 ②測驗(yàn)的實(shí)施過程 在測驗(yàn)實(shí)施過程中,如不遵從指導(dǎo)語的要求,或出現(xiàn)意外干擾,或評分、計(jì)分出現(xiàn)差錯等,都會降低測量效度。 ③接受測驗(yàn)的被試 就單個被試而言,被試的應(yīng)試動機(jī)、情緒、態(tài)度、身體狀態(tài)等,都會造成較大的隨機(jī)誤差,進(jìn)而影響測量效度。 就被試團(tuán)體而言,如果缺乏必要的同質(zhì)性(年齡、性別、文化程度、職業(yè)等),則很可能會得到不恰當(dāng)?shù)男Ф荣Y料。 ④ 所選效標(biāo)的性質(zhì) 由于同一個測驗(yàn)可以有不同的效標(biāo),同一個觀念效標(biāo)也可以有不同的效標(biāo)測量,因此在評價測量效度時,所選效標(biāo)的性質(zhì)是很重要的考慮因素。 【在考慮效標(biāo)與分?jǐn)?shù)的相關(guān)時,必須注意:測驗(yàn)分?jǐn)?shù)與效標(biāo)之間是否符合線性關(guān)系】 ⑤測量的信度 (4) 效度的改進(jìn)方法 ①通過標(biāo)準(zhǔn)化全面減少各種測量誤差。 ②精心編制測驗(yàn)量表,避免出現(xiàn)較大的系統(tǒng)誤差。 ③妥善組織測驗(yàn),控制隨機(jī)誤差。 ④創(chuàng)設(shè)標(biāo)準(zhǔn)的應(yīng)試情境,讓每個被試都能發(fā)揮正常的水平。 ⑤選好正確的效標(biāo),定好恰當(dāng)?shù)男?biāo)測量,正確地使用有關(guān)公式。 (5) 信度與效度的關(guān)系 ①信度高是效度高的必要非充分條件。一個測驗(yàn)效度高,其信度也必然高;但一個測驗(yàn)信度高,其效度不一定高。 ②測驗(yàn)的效度受它的信度制約。 <信度系數(shù)的平方根是效度系數(shù)的最高限度,效度永遠(yuǎn)小于信度> ③效度等于測驗(yàn)信度系數(shù)與效標(biāo)信度系數(shù)乘積的開方。 統(tǒng)計(jì)推導(dǎo)公式 第三節(jié) 心理測量的誤差 1. 誤差的種類與控制 (1) 隨機(jī)誤差的來源及控制:測驗(yàn)本身、施測情境、主試因素、被試因素 (2) 系統(tǒng)誤差的來源及控制:測驗(yàn)本身、主試因素、被試因素 控制:標(biāo)準(zhǔn)化施測、嚴(yán)格控制測驗(yàn)條件、取樣要有代表性 2. 測量誤差的估計(jì) 測量的標(biāo)準(zhǔn)誤 差異的標(biāo)準(zhǔn)誤 *誤差分?jǐn)?shù)分布的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。 1) 測量誤差的定義 測量誤差是指在測量過程中由那些與測量目的無關(guān)的變化因素所產(chǎn)生的一種不準(zhǔn)確或不一致的測量效應(yīng)。它的含義包括:①測量誤差是由那些與測量目的無關(guān)的變因所致;②測量誤差表現(xiàn)為不準(zhǔn)確或不一致兩種方式。 心理測量的誤差可分為兩類:隨機(jī)誤差和系統(tǒng)誤差。 隨機(jī)誤差是由與測量目的無關(guān)的、偶然因素引起的,而又不易控制的誤差。它使多次測量產(chǎn)生不一致的結(jié)果,其方向和大小的變化完全是隨機(jī)的,只符合某種統(tǒng)計(jì)學(xué)規(guī)律。 系統(tǒng)誤差是由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng)。這種誤差穩(wěn)定的存在于每一次測量中,盡管多次測量結(jié)果非常一致,但實(shí)測結(jié)果仍與真實(shí)數(shù)字有所差異。 系統(tǒng)誤差:按規(guī)律變動,成比例 恒定誤差:固定數(shù)值不變 *系統(tǒng)誤差只影響準(zhǔn)確性,不影響穩(wěn)定性;隨機(jī)誤差既影響穩(wěn)定性又影響準(zhǔn)確性。 2) 測量誤差的來源及控制 心理測量的誤差主要來自三個方面,即測量工具、測量對象和施測過程。 在測量工具方面,心理測量與物理測量有所不同。心理測量工具通常是以一套測驗(yàn)(問卷)為核心的刺激反應(yīng)系統(tǒng)(通常稱作量表)。當(dāng)量表在測查人的某種心理特質(zhì)時,若項(xiàng)目所測的東西與我們欲測的目的之間出現(xiàn)偏差,則測量會出現(xiàn)誤差。測量工具信度不好、效度不高是造成誤差的兩種主要原因。 在測量對象方面,造成測量誤差的主要原因是受測者真正水平是否得到正常發(fā)揮。一般的,受測者的某種心理特質(zhì)水平是相對穩(wěn)定的,但是他在接受測量時的生理和心理狀態(tài)會影響其水平的正常發(fā)揮。此外,受測者應(yīng)試動機(jī)的強(qiáng)弱、受訓(xùn)時間的長短、受訓(xùn)內(nèi)容的多少、答題反應(yīng)的快慢等都會產(chǎn)生測量誤差。 在施測過程方面,產(chǎn)生測量誤差的原因主要是一些偶然因素,包括施測物理環(huán)境,主試的某些屬性,評分記分環(huán)節(jié)出現(xiàn)的疏漏,以及意外干擾等。 知道了誤差的來源,就可以根據(jù)來源的不同,采取針對性的措施減少誤差。 3) 測量誤差的估計(jì) 經(jīng)典測量理論假定:X=T+E,X為實(shí)得分?jǐn)?shù)或觀測分?jǐn)?shù),T為假設(shè)的真分?jǐn)?shù)(一種測量工具在測量沒有誤差時得到的純正值,其操作定義是:無數(shù)次測量所得結(jié)果的平均值),E為測量誤差。 其他關(guān)于誤差的假設(shè): ①如果對一個人測量無數(shù)次,其誤差之和為0,平均誤差為0,即E=0。 ②誤差與真分?jǐn)?shù)相互獨(dú)立;其中的誤差是指隨機(jī)誤差,只與偶然因素有關(guān),而與真分?jǐn)?shù)大小無關(guān),即真分?jǐn)?shù)與誤差分?jǐn)?shù)的相關(guān)系數(shù)為0。 ③一個團(tuán)體的平均真分?jǐn)?shù)T等于該團(tuán)體中所有被試實(shí)得分?jǐn)?shù)的平均值X。在一個團(tuán)體中,由于每個人的誤差都是隨機(jī)的且方向不同,只要團(tuán)體足夠大,其誤差就會相互抵消。因此,其誤差和為0。 ④真分?jǐn)?shù)的變異可以分為兩部分:與測驗(yàn)?zāi)康挠嘘P(guān)的變異(有效的變異數(shù))和與測驗(yàn)?zāi)康臒o關(guān)的變異(無效的變異數(shù)),公式為 。 則總體的關(guān)系式為 。 第四節(jié) 測驗(yàn)的項(xiàng)目分析 要求:心理測驗(yàn)的項(xiàng)目分析——難度;區(qū)分度;項(xiàng)目的綜合分析和篩選(講義p249)。 項(xiàng)目分析包括定性分析及定量分析。定性分析包括考慮內(nèi)容效度、題目編寫的恰當(dāng)性和有效性等,重點(diǎn)在于分析測題的內(nèi)容和形式;定量分析主要是采用統(tǒng)計(jì)方法來分析試題的品質(zhì)。 1.難度 (1)難度的含義 難度是指測驗(yàn)項(xiàng)目的難易程度。 (2)難度的計(jì)算 ①二分法記分項(xiàng)目的難度(客觀題) 通過率法:主要利用項(xiàng)目的通過率作為衡量難度的指標(biāo),即以答對或通過該項(xiàng)目的人數(shù)的百分比P來表示 。P值越大,題目越容易。 極端分組法:當(dāng)被試的人數(shù)較多時,可以先將被試分為三組,取最高的27%被試和最低的27%被試作為高分組和低分組,并分別計(jì)算通過率,最后求兩個通過率的平均值作為該項(xiàng)目的難度。 ②非二分法記分項(xiàng)目的難度(主觀題) 計(jì)算公式 *在對兩個非二分法記分的項(xiàng)目進(jìn)行難度比較時,要對它們分別進(jìn)行校正,排除由于猜測而答對某些題目致使通過率增大的可能性。 校正公式為 (3)難度水平的確定 項(xiàng)目難度水平的確定取決于測驗(yàn)的目的和性質(zhì)。對于效標(biāo)參照測驗(yàn)和掌握測驗(yàn),可不考慮難度。對于選拔測驗(yàn),應(yīng)將測驗(yàn)的項(xiàng)目難度控制在錄取率左右。對于選擇題,難度應(yīng)該大于猜測概率。無論何種測驗(yàn),一般都應(yīng)防止被試得滿分,因?yàn)闈M分的意義是不明確的。 (4)難度的等距變換(教材p75) 以項(xiàng)目的通過率來表示項(xiàng)目的難度,這類難度指標(biāo)屬于順序變量,不具有相等的單位,所指出的僅僅是項(xiàng)目的相對難度。于是需要把順序量表轉(zhuǎn)換成等距量表(僅有名次不能計(jì)算,必須要有具體測驗(yàn)分?jǐn)?shù)才可以)。 當(dāng)樣本容量很大時,測驗(yàn)分?jǐn)?shù)將接近正態(tài)分布。根據(jù)正態(tài)分布曲線表,將試題的難度P作為正態(tài)曲線下的面積,轉(zhuǎn)換成具有相等單位的等距量數(shù),即Z分?jǐn)?shù)。 標(biāo)準(zhǔn)分?jǐn)?shù)(Z分?jǐn)?shù))具有相等的單位,屬于等距量表。 較難的項(xiàng)目難度為正值,較易的項(xiàng)目難度為負(fù)值,P為0.5時難度為0。 (5)難度對測驗(yàn)的影響 ①項(xiàng)目難度普遍較大的測驗(yàn),分?jǐn)?shù)分布將呈現(xiàn)為正偏態(tài);項(xiàng)目難度普遍較小的測驗(yàn),分?jǐn)?shù)分布將呈現(xiàn)為負(fù)偏態(tài)。一般能力測驗(yàn)和成就測驗(yàn)的平均難度在0.5左右為宜,正偏態(tài)分布適合于篩選性測驗(yàn)。 ②過難或過易的測驗(yàn)會使測驗(yàn)分?jǐn)?shù)相對的集中在低分端或高分端,從而使分?jǐn)?shù)的全距縮小。項(xiàng)目的難度以集中在0.5左右為最佳,以集中在兩端最差。 2.區(qū)分度 (1)區(qū)分度的含義 區(qū)分度是指測驗(yàn)項(xiàng)目對被試心理品質(zhì)水平差異的區(qū)分能力或鑒別能力。區(qū)分度被用作評價項(xiàng)目質(zhì)量,篩選項(xiàng)目的主要指標(biāo)和依據(jù)。 具有良好區(qū)分度的項(xiàng)目,能將不同水平的被試區(qū)分開來。即在該項(xiàng)目上水平高的被試得高分,水平低的被試得低分。 把試題的區(qū)分度稱為測驗(yàn)是否具有效度的“指示器”。 區(qū)分度(D)的取值范圍介于-1.00至+1.00之間。通常D為正值,稱作積極區(qū)分;D為負(fù)值,稱作消極區(qū)分;D為0稱作無區(qū)分作用。具有積極區(qū)分作用的項(xiàng)目,其D值越大,區(qū)分的效果越好。 *評價測驗(yàn)項(xiàng)目區(qū)分度高低依賴于對被試水平的準(zhǔn)確測量,通常稱作為效標(biāo)分?jǐn)?shù)。測驗(yàn)項(xiàng)目區(qū)分度的效標(biāo)分?jǐn)?shù)多用測驗(yàn)總分,稱為內(nèi)部效標(biāo)。 (2)區(qū)分度的計(jì)算 ①項(xiàng)目鑒別指數(shù)法——二分法記分 當(dāng)效標(biāo)成績是連續(xù)變量時,可以從分?jǐn)?shù)的兩端各選擇27%的被試,分別計(jì)算出每道題目上各自的通過率,二者之差便是鑒別指數(shù)(D)。D值越高項(xiàng)目越有效。 計(jì)算公式為 。 當(dāng)D=1.00時,高分組被試全部通過,低分組被試全部失??;如果低分組被試全部通過,高分組被試全部失敗,則D=-1.00;如果兩組的通過率相等,則D=0。 項(xiàng)目鑒別指數(shù)法只利用了一部分信息,浪費(fèi)了很多信息,統(tǒng)計(jì)結(jié)果準(zhǔn)確性差一些。而且當(dāng)項(xiàng)目與效標(biāo)之間并非為直線關(guān)系時,甚至?xí)贸鲥e誤的結(jié)論。 ②相關(guān)法——大規(guī)?;驑?biāo)準(zhǔn)化測驗(yàn) 以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)或測驗(yàn)總分的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)。 相關(guān)越高,項(xiàng)目區(qū)分度越高。 a.點(diǎn)二列相關(guān)——項(xiàng)目是(0,1)記分或二分變量,效標(biāo)或測驗(yàn)總分是連續(xù)變量 b.二列相關(guān)——連續(xù)的測量變量,其中一個變量被人為分成兩類 c.φ相關(guān)——兩個變量是二點(diǎn)分配,即兩個變量都是二分名義變量 d.積差相關(guān)——論文式測驗(yàn)題目,得分具有連續(xù)性 (被試團(tuán)體較大時,可以認(rèn)為項(xiàng)目分?jǐn)?shù)服從正態(tài)分布) ③方差法 被試在某一項(xiàng)目上的得分越分散,則該試題鑒別力越大。 (3)區(qū)分度的相對性 ①不同計(jì)算方法,所得區(qū)分值不同。一個測驗(yàn)的各項(xiàng)目要采用同一種區(qū)分度指標(biāo)。 ②樣本容量大小影響相關(guān)法區(qū)分度值的大小。樣本容量越小,其統(tǒng)計(jì)值越不可靠。 ③分組標(biāo)準(zhǔn)影響鑒別指數(shù)。分組越極端,其D值越大。 ④被試樣本的同質(zhì)性程度影響區(qū)分度值的大小。被試團(tuán)體越同質(zhì),即個體之間水平越接近,其測題的區(qū)分度值越小。 (4)區(qū)分度與難度的關(guān)系 測驗(yàn)項(xiàng)目的難度對測驗(yàn)項(xiàng)目的鑒別力有一定的影響,難度與區(qū)分度有著密切的聯(lián)系。 難度越接近0.5時,項(xiàng)目潛在的區(qū)分度越大,而難度越接近1.00或0時,項(xiàng)目潛在的區(qū)分度越小。為了使項(xiàng)目具有較高區(qū)分能力,應(yīng)使所有項(xiàng)目都保持在0.5的難度最為理想。在利用項(xiàng)目分析選擇試題時,應(yīng)使項(xiàng)目的難度分布廣一些,梯度大一些,使整個測驗(yàn)的難度分布呈正態(tài)分布,且平均水平保持在0.5左右。這樣才能把各種水平的人都區(qū)分開來,并且分的比較細(xì)。 *難度既影響信度又影響效度;難度影響區(qū)分度。 3.選項(xiàng)分析 選項(xiàng)分析就是對選擇題后面提供的幾個答案的分析。主要的異常情況有: ①正確答案無人選擇,或少于其他選項(xiàng)的人數(shù); ②錯誤答案選的人太多; ③正確選項(xiàng)上的高分組選擇人數(shù)少于低分組; ④錯誤選項(xiàng)上的高分組選擇人數(shù)多于低分組; ⑤某個選項(xiàng)無人選擇; ⑥未答的人數(shù)較多。 *標(biāo)準(zhǔn):正確選項(xiàng)準(zhǔn)確唯一;錯誤選項(xiàng)具有干擾性、迷惑性。 第五節(jié) 心理測驗(yàn)的編制 1. 測驗(yàn)編制的基本程序 (1) 確定測驗(yàn)?zāi)康? (2) 制定編題計(jì)劃 (3) 編寫測驗(yàn)題目 (4) 題目試測與分析 (5) 合成測驗(yàn)及復(fù)本 (6) 測驗(yàn)使用標(biāo)準(zhǔn)化 (7) 信度與效度分析 (8) 編寫測驗(yàn)說明書 一、確定測驗(yàn)?zāi)康? 1.明確測量對象——測量哪些個人或團(tuán)體 2.明確測量目標(biāo)——測量什么心理功能 *目標(biāo)具體化 3.明確測量用途——描述?診斷?選拔?驗(yàn)證? 二、制定編題計(jì)劃 要明確的信息: 一是全面而具代表性的測驗(yàn)內(nèi)容,不致使測題偏離了應(yīng)測的范圍; 二是對各個內(nèi)容點(diǎn)的相對重視程度,通常用百分比來標(biāo)明。 用途:指明編題方向;確定記分標(biāo)準(zhǔn)。 三、編寫測驗(yàn)題目 1.收集測驗(yàn)資料 原則:1)資料要豐富;【臨床觀察的資料、已有的測題】 2)資料要有普遍性; 3)資料要有趣味性。 2.選擇項(xiàng)目形式 原則:1)使受測者容易明了測驗(yàn)方法 2)使受測者在完成測驗(yàn)時不會因測驗(yàn)項(xiàng)目的形式不當(dāng)而做錯。 3)測驗(yàn)過程省時 4)計(jì)分省時省力 5)經(jīng)濟(jì) 3.編寫測驗(yàn)項(xiàng)目 注意:1)測驗(yàn)項(xiàng)目的取樣對欲測心理品質(zhì)具有代表性; 2)測驗(yàn)項(xiàng)目的取材范圍要同編題計(jì)劃所列項(xiàng)目范圍相一致; 3)測驗(yàn)項(xiàng)目的難度應(yīng)有一定的分布范圍; 4)用語要力求精煉簡短,淺顯明了 5)初編題目的數(shù)量要多于最終所需要的數(shù)量,以便篩選或編制復(fù)本; 6)測驗(yàn)項(xiàng)目的說明必須簡明。 四、題目試測與分析 1.預(yù)測 目的:獲得被試對測驗(yàn)項(xiàng)目做何反應(yīng)的資料,包括質(zhì)的信息與量的指標(biāo)。 質(zhì):題目思想性、邏輯錯誤、印刷、裝訂 量:難度、區(qū)分度、項(xiàng)目分析 注意:1)預(yù)測對象應(yīng)取自將來正式測驗(yàn)時準(zhǔn)備施用的群體,人數(shù)不必太多,但要具有代表性; 2)預(yù)測的情境應(yīng)力求同正式測驗(yàn)的情境一致; 3)預(yù)測的時限可以適當(dāng)延長,以便每一個受測者都能將題目做完; 4)施測者應(yīng)對受測者的反應(yīng)加以記錄。 2. 項(xiàng)目分析——對預(yù)測結(jié)果進(jìn)行統(tǒng)計(jì)分析,確定項(xiàng)目的難度和區(qū)分度。 五、合成測驗(yàn)及復(fù)本 合成測驗(yàn)就是把經(jīng)過預(yù)測以后證明有價值的項(xiàng)目排成有組織的測驗(yàn)。 1. 測驗(yàn)項(xiàng)目的選擇 指標(biāo)(3個):測驗(yàn)的性質(zhì);項(xiàng)目的難度;項(xiàng)目的區(qū)分度 2. 測驗(yàn)項(xiàng)目的編排 總的編排原則:由易到難 兩種常見編排方式: 1) 并列直進(jìn)式:依其難度由易到難排列。 2) 混合螺旋式:依難度分成若干不同的層次,再將不同性質(zhì)的測驗(yàn)項(xiàng)目予以組合,作交叉式的排列,其難度則漸次升進(jìn)。 3.編制復(fù)本(A、B卷 等值性) 等值需要符合的條件: 1) 各份測驗(yàn)測量的是同一種心理特質(zhì); 2) 各份測驗(yàn)具有相同的內(nèi)容和形式; 3) 各份測驗(yàn)不應(yīng)有重復(fù)的項(xiàng)目; 4) 各份測驗(yàn)項(xiàng)目數(shù)量相等,并且有大體相同的難度和區(qū)分度。 **ABBA的順序 平衡難度 六、測驗(yàn)使用標(biāo)準(zhǔn)化 標(biāo)準(zhǔn)化是指測驗(yàn)的編制、施測、評分以及解釋測驗(yàn)分?jǐn)?shù)的程度的一致性。 1. 測驗(yàn)內(nèi)容:相同的或等值的題目 2. 施測過程:相同的測驗(yàn)情境;相同的指導(dǎo)語;相同的測驗(yàn)時限 3. 測驗(yàn)評分:1)對反應(yīng)要及時清楚的記錄; 2)要有標(biāo)準(zhǔn)答案或正確反應(yīng)的表格,即記分鍵; 3)將受測者的反應(yīng)與記分鍵比較,確定受測者反應(yīng)應(yīng)得的分?jǐn)?shù)。 4. 測驗(yàn)分?jǐn)?shù)的解釋 七、鑒定測驗(yàn)(信度與效度分析) 1.信度——測驗(yàn)的可靠性;即用同一測驗(yàn)多次測量同一團(tuán)體,所得測驗(yàn)結(jié)果之間具有一致性。 2.效度——測驗(yàn)的有效性;即一個測驗(yàn)在多大程度上能夠測得所要測得的東西。 3.測驗(yàn)量表與常模 ①按照統(tǒng)計(jì)學(xué)的原理,把某一標(biāo)準(zhǔn)化樣本的測驗(yàn)分?jǐn)?shù)轉(zhuǎn)化為具有一定參照點(diǎn)、等值單位的導(dǎo)出分?jǐn)?shù),這就是所謂的測量量表。常見:百分等級量表、標(biāo)準(zhǔn)分?jǐn)?shù)量表、T量表、發(fā)展量表、智力商數(shù)量表等。 ②如果將標(biāo)準(zhǔn)化樣本的測驗(yàn)分?jǐn)?shù)與相應(yīng)的某一個或某幾個測驗(yàn)量表分?jǐn)?shù)一起用表格的形式呈現(xiàn)出來,就是該測驗(yàn)的常模表。 八、編寫測驗(yàn)說明書 1)本測驗(yàn)的目的與功用; 2)本測驗(yàn)的理論依據(jù); 3)測驗(yàn)內(nèi)容及實(shí)施測驗(yàn)的方法; 4)測驗(yàn)的標(biāo)準(zhǔn)答案和評分方法; 5)關(guān)于測驗(yàn)的信度、效度資料的說明; 6)常模表,即如何依據(jù)常模解釋測驗(yàn)結(jié)果。 2.測驗(yàn)?zāi)繕?biāo)與雙向細(xì)目表(講義p250) 3.題目編制技術(shù)(講義p250-p251) 第六節(jié) 心理測驗(yàn)的實(shí)施 測驗(yàn)的使用主要涉及兩個問題: 1) 如何實(shí)施測驗(yàn)才能保證測驗(yàn)分?jǐn)?shù)盡可能少受施測過程的影響; 2) 如何解釋測驗(yàn)分?jǐn)?shù)才能保證受測者的心理不受負(fù)面影響。 一、 測驗(yàn)的實(shí)施過程 通過觀測受測者在測驗(yàn)情境中的行為樣本,可以推斷他平日一般的行為特征。 1. 施測前的準(zhǔn)備工作 (1) 準(zhǔn)備好測驗(yàn)材料 (2) 熟練掌握施測手續(xù) 訓(xùn)練的內(nèi)容包括:①熟悉測驗(yàn)內(nèi)容; ②掌握施測步驟; ③掌握記分方法; ④掌握解釋分?jǐn)?shù)的技術(shù)。 (3) 熟記測驗(yàn)指導(dǎo)語并能用口語清楚而流利地說出來。 2. 指導(dǎo)語 指導(dǎo)語通常包括對測驗(yàn)?zāi)康牡恼f明和對題目反應(yīng)方式的解釋。 注意:一般要求測驗(yàn)的主持者和指導(dǎo)語都應(yīng)保持和表述中立的態(tài)度,不傾向于答案中的任何一種方向。 *一般的能力測驗(yàn)和成就測驗(yàn)都要求有標(biāo)準(zhǔn)嚴(yán)格的時間限制; 而人格測驗(yàn)和態(tài)度測驗(yàn)一般不要求有時間限制。 3. 測驗(yàn)情境 包括測驗(yàn)場地(通風(fēng)、光線、噪聲)、座位、答案紙型等。 4. 測驗(yàn)焦慮 測驗(yàn)焦慮是指被試因接受測驗(yàn)而產(chǎn)生的一種憂慮和緊張情緒,它會影響測驗(yàn)結(jié)果的真實(shí)性。 主試有時可以利用保證測驗(yàn)結(jié)果絕對保密或鼓勵被試等方法來消除測驗(yàn)焦慮。 5. 與受測者建立良好的協(xié)調(diào)關(guān)系 良好的協(xié)調(diào)關(guān)系指的是施測者設(shè)法努力引起受測者對測驗(yàn)的興趣,取得他的合作,以保證他能按照標(biāo)準(zhǔn)測驗(yàn)指導(dǎo)語行事。 6. 評分技術(shù) 二、 測驗(yàn)分?jǐn)?shù)的解釋 主要涉及兩個問題:一是如何看待測驗(yàn)分?jǐn)?shù)的意義;二是如何將測驗(yàn)分?jǐn)?shù)的意義告訴受測者。 1. 如何看待測驗(yàn)分?jǐn)?shù)的意義 高德曼的三個維度的解釋模型 三個維度分別是解釋測驗(yàn)分?jǐn)?shù)的類型、資料處理的方法、資料的來源 解釋測驗(yàn)分?jǐn)?shù)的4種類型:敘述的解釋、溯因的解釋、預(yù)測的解釋、評價的解釋 資料處理的2種方法:機(jī)械的處理、非機(jī)械的處理 資料的2種來源:測驗(yàn)資料、非測驗(yàn)資料 三個維度加以組合:4*2*2=16種不同的解釋方式。 基本原則: 1) 主試應(yīng)充分了解測驗(yàn)的性質(zhì)與功能。 2) 對導(dǎo)致測驗(yàn)結(jié)果的原因的解釋應(yīng)慎重,謹(jǐn)防片面極端。 3) 必須充分估計(jì)測驗(yàn)的常模和效度的局限性。 4) 解釋分?jǐn)?shù)應(yīng)參考其他有關(guān)資料。 5) 對測驗(yàn)分?jǐn)?shù)應(yīng)以“一段分?jǐn)?shù)”來解釋,而不應(yīng)以“特定的數(shù)值”來解釋。 6) 對來自不同測驗(yàn)的分?jǐn)?shù)不能直接加以比較。 2. 如何將測驗(yàn)分?jǐn)?shù)的意義告訴受測者(教材p131-p132) 補(bǔ)充:講義p252 第七節(jié) 測驗(yàn)常模 1、 常模與常模團(tuán)體 1) 常模:用于比較和解釋測驗(yàn)結(jié)果的標(biāo)準(zhǔn)化樣本的分?jǐn)?shù)分布。 常模是根據(jù)標(biāo)準(zhǔn)化樣本的測驗(yàn)分?jǐn)?shù)經(jīng)過統(tǒng)計(jì)處理而建立起來的具有參照點(diǎn)和單位的測驗(yàn)量表。 編制常模需要三步:①確定有關(guān)的比較團(tuán)體; ②獲得該團(tuán)體成員的測驗(yàn)分?jǐn)?shù); ③把原始分?jǐn)?shù)轉(zhuǎn)化成量表分?jǐn)?shù)。 2) 常模團(tuán)體 常模團(tuán)體是作為比較標(biāo)準(zhǔn)的具有某些共同特征的人組成的群體或該群體的樣本。 3) 確定常模團(tuán)體的注意事項(xiàng) ①群體構(gòu)成的界限必須明確; ②常模團(tuán)體必須是所測群體的一個代表性樣本;(遵循隨機(jī)化原則)e.g.分層抽樣 ③取樣的過程必須明確且有詳盡的描述; ④樣本大小要適當(dāng);(取樣誤差與樣本大小成反比;其他條件相同時樣本越大越好) ⑤常模團(tuán)體必須是近時的; 即減低抽樣誤差,就必須加大樣本容量 ⑥注意一般常模與特殊常模的結(jié)合。 2、 分?jǐn)?shù)轉(zhuǎn)換與合成 分?jǐn)?shù)的轉(zhuǎn)換:按某種規(guī)則將原始分?jǐn)?shù)轉(zhuǎn)化為導(dǎo)出分?jǐn)?shù)的過程。 1) 原始分?jǐn)?shù):從測驗(yàn)中直接獲得的分?jǐn)?shù);被試在接受測驗(yàn)后,根據(jù)測驗(yàn)的記分標(biāo)準(zhǔn),對照被試的反應(yīng)所計(jì)算出的測驗(yàn)分?jǐn)?shù)。 原始分?jǐn)?shù)反映了被試答對題目的個數(shù)或作答正確的程度;不能直接反映出被試之間的差異狀況、被試相互比較后所處的地位、被試在其他等值測驗(yàn)上應(yīng)獲得什么樣的分值。 2) 導(dǎo)出分?jǐn)?shù):在原始分?jǐn)?shù)轉(zhuǎn)換的基礎(chǔ)上,按照一定的規(guī)則,經(jīng)過統(tǒng)計(jì)處理后獲得的具有一定參考點(diǎn)和單位,且可以相互比較的分?jǐn)?shù)。常用的導(dǎo)出分?jǐn)?shù)有百分等級、標(biāo)準(zhǔn)分?jǐn)?shù)、T分?jǐn)?shù)。 分?jǐn)?shù)的合成:將幾個分?jǐn)?shù)或幾個預(yù)測源組合起來,以獲得一個合成分?jǐn)?shù)或做總的預(yù)測。有3種類型:1)項(xiàng)目的組合; 2)分測驗(yàn)或量表的組合; 3)測驗(yàn)或預(yù)測源的組合。 分?jǐn)?shù)合成中的問題: 1) 采用什么方法來合成分?jǐn)?shù)?取決于組成測驗(yàn)分?jǐn)?shù)的目的與要做何種決定。 2) 什么形式是最適當(dāng)?shù)姆謹(jǐn)?shù)組合?可用效標(biāo)效度來評價合成分?jǐn)?shù)。 3)需要多少及何種測驗(yàn)分?jǐn)?shù)作最適當(dāng)?shù)慕M合分?jǐn)?shù)?可用合成體效度來評價。 分?jǐn)?shù)合成的方法: 1) 臨床判斷 2) 推理方法:單位加權(quán),等量加權(quán),差異加權(quán) 3) 多重分段:連續(xù)柵欄,綜合分段 4) 多重回歸:基本方程,預(yù)測誤差,漸進(jìn)效度,合成體效度 5) 特殊方法:完形記分,輪廓分析 1> 臨床診斷——直覺合成 根據(jù)經(jīng)驗(yàn)做出診斷;這種根據(jù)直覺的經(jīng)驗(yàn),主觀地將各種因素加權(quán),而獲得結(jié)論或預(yù)測的方法叫做臨床診斷。 優(yōu)點(diǎn):①具有高度的綜合性;②具有靈活的針對性。 缺點(diǎn):①主觀加權(quán)易受決策者的偏見影響,不夠客觀; ②缺乏精確的數(shù)量分析,沒有精確的數(shù)量指標(biāo)。 2> 加權(quán)求和合成——推理方法:單位加權(quán),等量加權(quán),差異加權(quán) ① 單位加權(quán):將各個測驗(yàn)分?jǐn)?shù)直接相加而獲得合成分?jǐn)?shù)。 公式為: ② 等量加權(quán):將所有測驗(yàn)分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù),然后采用下式加權(quán)組合。 (適用于各測驗(yàn)對預(yù)測效標(biāo)具有同等重要性的場合) 公式為: ③ 差異加權(quán):通常情況下,各個變數(shù)對預(yù)測效標(biāo)的作用是不同的。因此需要根據(jù)各個變數(shù)與效標(biāo)之間的經(jīng)驗(yàn)關(guān)系作差異加權(quán)。 公式為: e.g.分?jǐn)?shù)離散程度大的課程,具有較強(qiáng)區(qū)分度,在錄取時起的作用大。 3> 多重劃分——多重分段:連續(xù)柵欄,綜合分段 ①多重劃分就是在各個特質(zhì)上都確定一個標(biāo)準(zhǔn),從而把成績劃分為合格與不合格兩類。只有每個測驗(yàn)都合格時,總要求才算合格。(同時考察) ②連續(xù)柵欄就是在整個測驗(yàn)實(shí)施時,是把所有組成這一測驗(yàn)的分測驗(yàn)按一定順序排列起來逐一實(shí)施,只有通過了前一次測驗(yàn),才能繼續(xù)實(shí)施后一個測驗(yàn)。 4> 多重回歸:基本方程,預(yù)測誤差,漸進(jìn)效度,合成體效度 多重回歸就是研究一種事物或現(xiàn)象與其他多種事物或現(xiàn)象在數(shù)量上相互聯(lián)系和相互制約的統(tǒng)計(jì)方法。 基本方程式為: 通過對預(yù)測源作適當(dāng)加權(quán),使這些加權(quán)的測驗(yàn)分?jǐn)?shù)的合成能以最小的誤差來預(yù)測效標(biāo)分?jǐn)?shù)。 注意: 最佳預(yù)測源:選出與效標(biāo)相關(guān)最高的變量,然后加入另一預(yù)測源組合起來以使R的數(shù)值增至最大,下一個要加入的預(yù)測源應(yīng)該是與前兩個預(yù)測源組合起來能使R值增加最多的,依次類推,當(dāng)加入額外的預(yù)測源不再顯著的使相關(guān)系數(shù)R值增加時,則終止分析。 和Y相關(guān)盡可能高,和X1相關(guān)盡可能低 5> 特殊方法:完形記分,輪廓分析 呈現(xiàn)常模的方法:轉(zhuǎn)化表,剖析圖 轉(zhuǎn)化表的構(gòu)成要素有:原始分?jǐn)?shù)、相應(yīng)的導(dǎo)出分?jǐn)?shù)、對常模團(tuán)體的具體描述。 剖析圖是把一套測驗(yàn)中幾個分測驗(yàn)分?jǐn)?shù)同圖表(圖形)表示出來。 3、 幾種常模分?jǐn)?shù) 發(fā)展量表 1) 年齡量表——所測量的特質(zhì)隨年齡作有系統(tǒng)的改變 2) 年級當(dāng)量 商數(shù) 1) 智力商數(shù) 2) 教育商數(shù) 3) 成就商數(shù) 百分等級 一個原始分?jǐn)?shù)的百分等級,是指在一個群體的測驗(yàn)分?jǐn)?shù)中,得分低于這個分?jǐn)?shù)的人數(shù)的百分比。百分等級取值越大,說明成績越優(yōu)秀。 百分等級分?jǐn)?shù)的計(jì)算 (1)未分組分?jǐn)?shù)資料 e.g.成績?yōu)?0分的百分等級為83,就是說比80分低的原始分?jǐn)?shù)占全體得分的83%,比其高的只占17%。 (2)分組分?jǐn)?shù)資料 四舍五入 對百分等級的評價 百分等級是一種相對位置量數(shù),具有可比性,且易于計(jì)算,解釋方便;但它是一種順序量數(shù),不具有可加性。 兩個缺點(diǎn):①單位不等,尤其在分配的兩個極端; ②只具有順序性,無法說明不同被試之間分?jǐn)?shù)差異的數(shù)量。 *百分等級是相對于特定的被試團(tuán)體而言的,解釋時不能離開特定的參照團(tuán)體。 標(biāo)準(zhǔn)分?jǐn)?shù) 標(biāo)準(zhǔn)分?jǐn)?shù)是一種具有相等單位的量數(shù),又稱作Z分?jǐn)?shù),以Z表示。 標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算 公式為: (線性轉(zhuǎn)化) 對Z分?jǐn)?shù)的評估 Z分?jǐn)?shù)是以平均數(shù)為參照點(diǎn),以標(biāo)準(zhǔn)差為單位的等距量表。具有可比性、可加性;由符號與絕對值兩部分構(gòu)成: 正負(fù)符號表示原始分?jǐn)?shù)在平均數(shù)之上或之下,絕對值表示原始分?jǐn)?shù)與平均數(shù)的距離。 1) 線性轉(zhuǎn)化(如上) 2) 常態(tài)化(T分?jǐn)?shù)、標(biāo)準(zhǔn)九、標(biāo)準(zhǔn)十、離差智商) 常態(tài)化就是正態(tài)化,是指使用非線性變換,將非正態(tài)分布的分?jǐn)?shù)強(qiáng)制性的扭轉(zhuǎn)成正態(tài)分布。 ①T分?jǐn)?shù):麥柯爾提出,公式為: T在[0,100]之間。 平均數(shù)為50,標(biāo)準(zhǔn)差為10;T分?jǐn)?shù)避免了小數(shù)與負(fù)號。 ②標(biāo)準(zhǔn)九:以0.5個標(biāo)準(zhǔn)差為單位,將正態(tài)曲線下的橫軸分為九段,最高一端為9分,最低一端為1分,中間一段為5分,除兩端外,每段均有半個標(biāo)準(zhǔn)差寬。 ③標(biāo)準(zhǔn)十:卡特爾16PF ④離差智商:韋氏智力測驗(yàn)采用 平均數(shù)為100,標(biāo)準(zhǔn)差為15。 第八節(jié) 標(biāo)準(zhǔn)參照測驗(yàn) 1. 標(biāo)準(zhǔn)參照測驗(yàn)的含義與作用 標(biāo)準(zhǔn)參照測驗(yàn)是根據(jù)某一明確界定的內(nèi)容范圍而縝密編制的測驗(yàn)。當(dāng)一個測驗(yàn)是以某一明確界定的內(nèi)容范圍為基礎(chǔ)編制而成,并且其分?jǐn)?shù)是參考該內(nèi)容范圍所要求的絕對標(biāo)準(zhǔn)進(jìn)行解釋時,稱這一測驗(yàn)為標(biāo)準(zhǔn)參照測驗(yàn)。通過標(biāo)準(zhǔn)參照測驗(yàn),可以了解個體在所規(guī)定測量內(nèi)容上的行為水平,其出發(fā)點(diǎn)是個體本身的絕對水平。 2. 標(biāo)準(zhǔn)參照測驗(yàn)的題目分析 *測驗(yàn)項(xiàng)目的難度分析:與常模參照測驗(yàn)相同,一般以通過率表示。 *測驗(yàn)項(xiàng)目的區(qū)分度分析: ①當(dāng)采用掌握組-未掌握組的預(yù)測方法時,可以使用鑒別系數(shù)(D) ②當(dāng)采用前測-后測方法,可獲得在前測中錯誤回答某項(xiàng)目而在后測中能夠正確回答的被試人數(shù)比例,此即該項(xiàng)目的個人獲得指數(shù)。 3. 標(biāo)準(zhǔn)參照測驗(yàn)的信度與效度 1) 標(biāo)準(zhǔn)參照測驗(yàn)的信度及其估計(jì) ①分類一致性信度——計(jì)算兩次都被分到一類中的被試占總被試人數(shù)的比例。 ②方差分析方法——荷伊特信度 2) 標(biāo)準(zhǔn)參照測驗(yàn)的效度及其估計(jì) ①內(nèi)容效度 ②效標(biāo)關(guān)聯(lián)效度 4. 標(biāo)準(zhǔn)參照測驗(yàn)的分?jǐn)?shù)解釋 (1) 專家判定法 ①Nedelsky法 ②Angoff法 (2) 效標(biāo)組預(yù)測法 ①臨界組法 ②對照組法 詳見講義p256-p258 第九節(jié) 心理測驗(yàn)理論的新發(fā)展 一、 經(jīng)典測量理論的局限 1. 統(tǒng)計(jì)指標(biāo)依賴于被試樣本;(難度、區(qū)分度、信度、效度) 2. 分?jǐn)?shù)解釋依賴于測驗(yàn)難度;(難度不同,解釋不同) 3. 同一測驗(yàn)相同分?jǐn)?shù)其含義不同;(做對的題目其難度不同) 4. 信度估計(jì)不精確;(沒有更精確的總體估計(jì)) 5. 測驗(yàn)結(jié)果不能概化到非標(biāo)準(zhǔn)化情境;(標(biāo)準(zhǔn)化測驗(yàn)不能推廣) 6. 被試做同樣題目無法照顧個別差異。(被試水平不同,相對難易程度不同) 二、 項(xiàng)目反應(yīng)理論 1. 基本假設(shè) ①潛在特質(zhì)空間的單維性假設(shè); ②局部獨(dú)立性假設(shè);(各項(xiàng)目之間不相關(guān),不影響) ③正確反應(yīng)概率與特質(zhì)水平間函數(shù)關(guān)系假設(shè); ④非速度測驗(yàn)假設(shè)。(對時間沒有限制) 2. 項(xiàng)目反應(yīng)的參數(shù)及模型:單參數(shù)、二參數(shù)、三參數(shù) 單參數(shù):區(qū)分度 二參數(shù):難度、區(qū)分度 三參數(shù):難度、區(qū)分度、猜測率 3. 項(xiàng)目特征曲線及信息函數(shù) 項(xiàng)目特征曲線(教材p292) 信息函數(shù):作為信度的指標(biāo) 4. 項(xiàng)目反應(yīng)理論的應(yīng)用(題目分析、題庫、自適應(yīng)測驗(yàn)) 題目分析:可根據(jù)圖形直接判斷——曲線越陡峭,區(qū)分度越高; 曲線越往右側(cè)靠,難度越大。 自適應(yīng)測驗(yàn):根據(jù)不同被試的水平給予不同難度的測驗(yàn);避免天花板、地板效應(yīng)。 5. 項(xiàng)目反應(yīng)理論的優(yōu)點(diǎn)及局限 局限:對于現(xiàn)今的測驗(yàn),單維假設(shè)不成立,二分法記分不適用。 三、 概化理論 概化理論是經(jīng)典測量理論與方差分析結(jié)合的產(chǎn)物,其核心是從特定條件下的測量結(jié)果來推斷更廣泛的條件下可能得到的測量結(jié)果。 1. 基本概念 題目、被試、主試等各種影響因素 測量目標(biāo):所要測量的心理特質(zhì); 測量側(cè)面:影響測量過程和結(jié)果的各種內(nèi)在外在因素(每個影響因素都是一個側(cè)面); 測量情境:由測量目標(biāo)和測量側(cè)面構(gòu)成,即測什么和怎么測的結(jié)合。 2. 基本假設(shè) 替代信度 可靠性與隨機(jī)平行測驗(yàn)假設(shè) ——用觀察全域中隨機(jī)抽取的一個樣例來推斷全域的可靠性作為信度指標(biāo)。 3. 概化理論的優(yōu)點(diǎn)與局限 ①用隨機(jī)平行測驗(yàn)取代嚴(yán)格平行測驗(yàn),操作方便; ②用方差分析技術(shù)能全面估計(jì)各種誤差成分的相對大??;(能整合起來) ③在方法和應(yīng)用上都有待完善。 四、 測驗(yàn)等值 1. 含義:將不同測驗(yàn)版本分?jǐn)?shù)統(tǒng)一在一個量表上的過程;使其具有可比性。 2. 特性:等價性、可逆性、組間一致性 3. 種類:測驗(yàn)分?jǐn)?shù)等值、項(xiàng)目參數(shù)等值、橫向等值、縱向等值 (難度、區(qū)分度) (測驗(yàn)間) (時間) 4. 方法: ①平均數(shù)等值:A測驗(yàn)平均分80與B測驗(yàn)平均分70等值 ②百分位等值:A測驗(yàn)80分為75百分等級,B測驗(yàn)70分為75百分等級,80與70等值 ③線性等值:用標(biāo)準(zhǔn)差計(jì)算—代數(shù)公式<用平均數(shù)、標(biāo)準(zhǔn)差計(jì)算> ④項(xiàng)目反應(yīng)理論等值:參數(shù)等值 5. 設(shè)計(jì): ①單組設(shè)計(jì)—兩個測驗(yàn)對同一組人測試 ②等組設(shè)計(jì)—隨機(jī)抽取兩個組,假設(shè)為等組 ③等組交叉設(shè)計(jì)—前兩種方法結(jié)合,一組先A卷后B卷,另一組先B卷后A卷 ④共同被試設(shè)計(jì)—有一部分共同的人做中介,既參加A卷又參加B卷 ⑤鉚測驗(yàn)設(shè)計(jì)—用共同的題目作為鉚來進(jìn)行測驗(yàn) ⑥混合設(shè)計(jì)—以上設(shè)計(jì)混合- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
32 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 心理測量學(xué) 筆記 備考 北師大
鏈接地址:http://www.820124.com/p-1573759.html