心理測量學(xué)筆記——備考北師大.doc

上傳人：最***

文檔編號：1573759

上傳時間：2019-10-28

格式：DOC

頁數(shù)：36

大?。?83.50KB

《心理測量學(xué)筆記——備考北師大.doc》由會員分享，可在線閱讀，更多相關(guān)《心理測量學(xué)筆記——備考北師大.doc（36頁珍藏版）》請?jiān)谘b配圖網(wǎng)上搜索。

心理測量學(xué) 第一章心理測量的理論基礎(chǔ) 第一節(jié) 心理測量的理論基礎(chǔ) 1. 心理測量的基本概念（1）心理測量的定義依據(jù)一定的法則，用數(shù)字對人的行為加以確定。測量就是依據(jù)一定的法則，使用工具對事物的特征進(jìn)行定量描述的過程。（2）測量的基本要素參照點(diǎn)：在測量工作中，必須有一個量的起點(diǎn)，這個起點(diǎn)就叫做測量的參照點(diǎn)。兩種：絕對參照點(diǎn)，即以絕對的零點(diǎn)作為測量的參照點(diǎn)。劃分“有無”的界限。相對參照點(diǎn)，即以認(rèn)為確定的零點(diǎn)為測量的起點(diǎn)。人為主觀規(guī)定的標(biāo)準(zhǔn)。注：心理測量一般為相對零點(diǎn)；物理測量一般為絕對零點(diǎn)。物理測量也有相對零點(diǎn)的情況，如溫度、時間、海拔等。單位：應(yīng)具備兩個條件：有確定的意義；有相等的價值。（一般以標(biāo)準(zhǔn)差為單位）（3）測量的量表命名量表：最低水平的測量量表，只是用數(shù)字代表事物或用數(shù)字對事物進(jìn)行分類。名稱量表：用數(shù)字指代個別事物。類別量表：用數(shù)字指代事物的種類。統(tǒng)計(jì)方法：百分比、次數(shù)、眾數(shù)、X2檢驗(yàn)。順序量表：次低水平的測量量表，不僅能夠指代事物類別，而且能夠表明不同事物類別的大小、等級或事物具有某種特征的程度。既沒有相等的單位，也沒有絕對的零點(diǎn)。不能進(jìn)行代數(shù)運(yùn)算。心理測量量表一般是在順序量表上進(jìn)行的。統(tǒng)計(jì)方法：中位數(shù)、百分位數(shù)、等級相關(guān)系數(shù)、肯德爾和諧系數(shù)。等距量表：較高水平的測量量表，不僅能夠指代事物的類別、等級，而且具有相等的單位，可以進(jìn)行加減運(yùn)算。沒有絕對的零點(diǎn)，是假定的相對零點(diǎn)。統(tǒng)計(jì)方法：平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)系數(shù)、t檢驗(yàn)、f檢驗(yàn)。比率量表：最高水平的測量量表，不僅可以知道測量對象之間的相差程度，而且可以知道它們之間的比例。除了具有類別、等級、等距的特征外，還具有絕對的零點(diǎn)，可以進(jìn)行加減乘除運(yùn)算。統(tǒng)計(jì)方法：平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)系數(shù)、t檢驗(yàn)、f檢驗(yàn)、幾何平均數(shù)、變異系數(shù)。 2. 心理測量的特征與分類（1）心理測量的特征間接性：只能通過一個人對測驗(yàn)項(xiàng)目的反應(yīng)來推論出他的心理特質(zhì)。相對性：測量就是看每個人處在這個序列的什么位置上，由此測得一個人智力的高低、興趣的大小等，都是與所在團(tuán)體的大多數(shù)人的行為或某種人為確定的標(biāo)準(zhǔn)相比較而言的。客觀性：是對一切測量的基本要求，實(shí)際上就是測量的標(biāo)準(zhǔn)化問題。（2）心理測驗(yàn)的分類按功能（測量對象）分：能力測驗(yàn)、成就測驗(yàn)（學(xué)績測驗(yàn)）、人格測驗(yàn) 按對象分：個別測驗(yàn)、團(tuán)體測驗(yàn) 按形式分：紙筆測驗(yàn)、操作測驗(yàn)、口頭測驗(yàn)、電腦測驗(yàn) 按目的分：描述性測驗(yàn)（調(diào)查性測驗(yàn)）、診斷性測驗(yàn)、預(yù)示性測驗(yàn) 按要求分：最高作為測驗(yàn)、典型作為測驗(yàn) 按速度和難度分：速度測驗(yàn)、難度測驗(yàn) 按性質(zhì)分：構(gòu)造性測驗(yàn)、投射性測驗(yàn) 按解釋分：常模參照測驗(yàn)、標(biāo)準(zhǔn)參照測驗(yàn) 按應(yīng)用分：教育測驗(yàn)、職業(yè)測驗(yàn)、臨床測驗(yàn) 補(bǔ)充： 1）能力測驗(yàn)：能力可分為實(shí)際能力和潛在能力。實(shí)際能力指個人當(dāng)前“所能為者”，代表個人已有的知識經(jīng)驗(yàn)與技能。潛在能力指個人將來“可能為者”，是可能達(dá)到的水平。測量潛在能力的測驗(yàn)稱為能力傾向測驗(yàn)。能力測驗(yàn)又可以分為普通能力測驗(yàn)（通常說的智力）和特殊能力測驗(yàn)（音樂、美術(shù)、體育等特殊方面）。 2）紙筆測驗(yàn)（文字、圖形材料）；操作測驗(yàn)（不宜團(tuán)體實(shí)施） 3）速度測驗(yàn)——測反應(yīng)速度；難度測驗(yàn)——測最高能力。 4）最高作為測驗(yàn)：有正確答案，分?jǐn)?shù)越高越好；（能力測驗(yàn)、成就測驗(yàn)）典型作為測驗(yàn)：沒有正確答案，通常的習(xí)慣方式；（人格測驗(yàn)） 5）構(gòu)造性測驗(yàn)：刺激和被試的任務(wù)是明確的投射性測驗(yàn)：刺激、問題模糊，被試任務(wù)不明確；能投射出更真實(shí)的結(jié)果 3. 經(jīng)典測量理論及其模型（1）心理特質(zhì)：表現(xiàn)在一個人身上所特有的相對穩(wěn)定的行為方式。 ①特質(zhì)是一組具有內(nèi)部相關(guān)的行為的概括，具有一定的抽象性。 ②特質(zhì)是“一種一般的神經(jīng)心理系統(tǒng)，可以綜合不同刺激，使人對這些刺激做出相同反應(yīng)”。 ③特質(zhì)是一個人身上比較穩(wěn)定的特點(diǎn)。 ④一個人的精神面貌是由多種特質(zhì)分多個層次有機(jī)組合而成的。 ⑤特質(zhì)可以決定一個人對特定刺激的反應(yīng)傾向，可以對人的行為進(jìn)行預(yù)測。（2）經(jīng)典測量理論（CTT）的模型 ①觀察分?jǐn)?shù)：實(shí)測分?jǐn)?shù)，記作X。 ②真分?jǐn)?shù)：反映被試某種心理特質(zhì)真正水平的數(shù)值。操作定義：多次測量結(jié)果得到的平均數(shù)，記作T。（理論上構(gòu)想出來的抽象概念） ③誤差分?jǐn)?shù)：這里只是指測量產(chǎn)生的隨機(jī)誤差，記作E。（E是個服從均值為0的正態(tài)分布的隨機(jī)變量） ④X=T+E 這就是CTT的數(shù)學(xué)模型。（引申3個假設(shè)公理） ⑤觀察分?jǐn)?shù)的變異等于真分?jǐn)?shù)的變異與誤差分?jǐn)?shù)的變異之和。（3）基本假設(shè) ①觀察分?jǐn)?shù)的平均值接近于真分?jǐn)?shù)。即ε（X）=T或者ε（E）=0 ②真分?jǐn)?shù)與誤差分?jǐn)?shù)的相關(guān)為零。即ρ（T，E）=0 ③各平行測驗(yàn)的誤差分?jǐn)?shù)的相關(guān)為零。即ρ（E1，E2）=0 平行測驗(yàn)：如果兩個題目不同的測驗(yàn)測的是同一特質(zhì)，并且題目形式、數(shù)量、難度、區(qū)分度以及測查等值團(tuán)體后所得分?jǐn)?shù)的分布（均值和標(biāo)準(zhǔn)差）都是一致的，則這兩個測驗(yàn)被稱作是彼此平行的測驗(yàn)。第二節(jié) 測量的信度與效度 1. 測驗(yàn)的信度——受隨機(jī)誤差的影響（1）信度……一致性、穩(wěn)定性信度是測量結(jié)果的可靠性，等于一組測量分?jǐn)?shù)中真分?jǐn)?shù)的變異與總變異之比。信度指的是測量結(jié)果的穩(wěn)定性程度；若能用同一測量工具反復(fù)測量某人的同一種心理特質(zhì)，則其多次測量結(jié)果間的一致性程度就叫信度。定義1：信度乃是一個被測團(tuán)體的真分?jǐn)?shù)的變異數(shù)與實(shí)得分?jǐn)?shù)的變異數(shù)之比。定義2：信度乃是一個被試團(tuán)體的真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平方。定義3：信度乃是一個測驗(yàn)X（A卷）與它的任意一個平行測驗(yàn)X’（B卷）的相關(guān)系數(shù)。信度的作用： ①信度是測量過程中所存在的隨機(jī)誤差大小的反映。 ②信度可以用來解釋個人測驗(yàn)分?jǐn)?shù)的意義。測量的標(biāo)準(zhǔn)誤計(jì)算公式 ③信度可以幫助進(jìn)行不同測驗(yàn)分?jǐn)?shù)的比較。（2）信度的估計(jì)方法 ① 重測信度：用同一個測驗(yàn)，對同一組被試前后兩次施測，兩次測驗(yàn)分?jǐn)?shù)所得的相關(guān)系數(shù)為再測信度?！锲栠d積差相關(guān)系數(shù) 注：重測信度具有跨時間上的穩(wěn)定性。使用的前提條件： 1）所測量的心理特性必須是穩(wěn)定的。 2）遺忘和練習(xí)的效果基本上相互抵消。（適度的時間間隔，幾分鐘、幾小時甚至幾年） 3）在兩次施測間隔期內(nèi)，被試沒有獲得更多的學(xué)習(xí)和訓(xùn)練。 ② 復(fù)本信度：根據(jù)一組被試在兩個平行（等值）測驗(yàn)上的得分計(jì)算的相關(guān)系數(shù)即為復(fù)本信度?！锲栠d積差相關(guān)系數(shù) 注：1）同時連續(xù)施測——等值性系數(shù) 相距一段時間分兩次施測——穩(wěn)定性與等值性系數(shù) （此種復(fù)本信度最?。? 2）穩(wěn)定性與等值性系數(shù)是對信度最嚴(yán)格的檢驗(yàn)，其值最低。 3）為抵消順序效應(yīng)，可以一半被試A卷 B卷，另一半被試B卷 A卷使用的前提條件： 1）要構(gòu)造出兩份或兩份以上真正平行的測驗(yàn)（即A、B卷）。真正平行：復(fù)本測驗(yàn)之間必須在題目內(nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語、時限以及所用的例題、公式和測驗(yàn)等其他方面都相同或相似。 2）被試要有條件接受兩個測驗(yàn)。 ③ 分半信度：按正常的程序?qū)嵤y驗(yàn)，然后將全部項(xiàng)目分為相等的兩半，根據(jù)個人在這兩半測驗(yàn)的分?jǐn)?shù)計(jì)算其相關(guān)系數(shù)。有時也被稱作內(nèi)部一致性系數(shù)。 ★斯皮爾曼—布朗公式等價：弗朗那根公式、盧侖公式注：一般使用奇偶分半法；相關(guān)系數(shù)需要校正。使用的前提條件： 1）分半信度通常是在只能施測一次或沒有復(fù)本的情況下使用。 2）分半方法很多（如按題號的奇偶性分半、按題目的難度分半、按題目的內(nèi)容分半等），同一個測驗(yàn)通常會有多個分半信度值。 ④同質(zhì)性信度：也稱內(nèi)部一致性系數(shù)，指的是測驗(yàn)內(nèi)部所有題目間的一致性程度。 *一致性：測的是同一種心理特質(zhì)；所有題目得分之間都具有較高的正相關(guān)。 *當(dāng)一個測驗(yàn)具有較高的同質(zhì)性信度時，說明測驗(yàn)主要測的是某一單個心理特質(zhì)，實(shí)測結(jié)果就是該特質(zhì)水平的反映；若同質(zhì)性信度不高，說明測驗(yàn)結(jié)果可能是幾種心理特質(zhì)的綜合反映。*測量單一特性是同質(zhì)性高的必要而非充分條件，同質(zhì)性高是測得單一特質(zhì)的充分條件。 ★庫德—理查遜信度系數(shù) 克龍巴赫a系數(shù) 1）KR20公式——適用于（0、1）記分的測驗(yàn)【客觀試題】 2）KR21公式——適用于（0、1）記分的測驗(yàn)【客觀試題】 3）克龍巴赫a系數(shù)——適用于（0、1）記分的測驗(yàn)【客觀試題】和【主觀試題】 *KR20、KR21只是a的特例 4）荷伊特信度——用方差分析的方法來計(jì)算信度 ⑤評分者信度：隨機(jī)抽取部分試卷，由兩個或多個評分者獨(dú)立按評分標(biāo)準(zhǔn)打分，然后求其間的相關(guān)。當(dāng)評分者人數(shù)為2時——★積差相關(guān)系數(shù)、等級相關(guān)系數(shù) 當(dāng)評分者人數(shù)多于2時——★肯德爾和諧系數(shù) （3）信度的影響因素 1、被試方面就單個被試而言，被試的身心健康狀況、應(yīng)試動機(jī)、注意力、耐心、求勝心、作答態(tài)度（猜測）等會影響測量誤差。就被試團(tuán)體而言，整個團(tuán)體內(nèi)部水平的離散程度以及團(tuán)體的平均水平都會影響測量信度。 2、主試者方面就施測者而言，若不按指導(dǎo)手冊中的規(guī)定施測，或故意制造緊張氣氛，或給以暗示、協(xié)助等，則測量信度會大大降低。就評分者而言，若評分標(biāo)準(zhǔn)掌握不一，或前緊后松，甚至隨心所欲，則也會降低測量信度。 3、施測情境方面考場是否安靜、光線和通風(fēng)情況是否良好、所需設(shè)備是否齊全、桌面是否合乎要求、空間闊窄是否恰當(dāng)?shù)榷伎赡苡绊憸y量信度。 4、測量工具方面測量工具是否性能穩(wěn)定是測量工作成敗的關(guān)鍵。一般的，試題的取樣、試題之間的同質(zhì)性程度、試題的難度等都是影響測驗(yàn)穩(wěn)定性的主要因素。 5、兩次施測的間隔時間計(jì)算重測信度和穩(wěn)定性與等值性系數(shù)時，兩次測驗(yàn)相隔時間越短，其信度值越大；間隔時間越長，信度值就可能越小。 ★ 斯皮爾曼—布朗公式（計(jì)算測驗(yàn)項(xiàng)目數(shù)量變化對信度的影響）（4）信度的改進(jìn)方法 1）適當(dāng)增加測驗(yàn)的長度。（測驗(yàn)越長信度越高）【新增項(xiàng)目必須與試卷中原有項(xiàng)目同質(zhì)；新增項(xiàng)目的數(shù)量必須適度】 2）使測驗(yàn)中所有試題的難度接近正態(tài)分布，并控制在中等水平。 3）努力提高測驗(yàn)試題的區(qū)分度。 4）選取恰當(dāng)?shù)谋辉噲F(tuán)體，提高測驗(yàn)在各同質(zhì)性較強(qiáng)的亞團(tuán)體上的信度。 5）主試者嚴(yán)格執(zhí)行施測規(guī)程，評分者嚴(yán)格按標(biāo)準(zhǔn)給分，實(shí)測場地按測驗(yàn)手冊的要求進(jìn)行布置，減少無關(guān)因素的干擾。 6）間隔時間要適當(dāng)。 2. 測驗(yàn)的效度——受隨機(jī)誤差、系統(tǒng)誤差的影響（1）效度的含義……有效性、準(zhǔn)確性效度是指一個測驗(yàn)或量表實(shí)際能測出其所要測的心理特質(zhì)的程度，等于一組測量分?jǐn)?shù)中與測量目的有關(guān)的變異與實(shí)得變異之比。注：1）效度是一個相對的概念（相對于測量目的而言；只能通過行為進(jìn)行推測）。 2）效度是測量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。 3）判斷測量是否有效要從多方面搜集證據(jù)。（2）效度的估計(jì)方法 ① 內(nèi)容效度：指項(xiàng)目對欲測的內(nèi)容或行為范圍取樣的適當(dāng)程度。指一個測驗(yàn)實(shí)際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度，它通常包括欲測的知識范圍，以及該范圍內(nèi)各知識點(diǎn)所要求掌握的程度?！緝?nèi)容范圍；題目代表性】注：內(nèi)容效度應(yīng)用于成就測驗(yàn)和職業(yè)測驗(yàn)；不適合用于能力傾向測驗(yàn)和人格測驗(yàn)。 ★ 表面效度不能算是一種效度。內(nèi)容效度的確定方法 a．專家判斷法（邏輯分析法）——題量適當(dāng)、題目的代表性、題目覆蓋范圍廣 b．復(fù)本法（統(tǒng)計(jì)分析方法）——平行測驗(yàn)的復(fù)本信度 <若相關(guān)低則兩個測驗(yàn)中至少有一個缺乏內(nèi)容效度；若相關(guān)高則測驗(yàn)可能有較高的內(nèi)容效度> c．再測法——前測、后測 d．經(jīng)驗(yàn)法 ② 效標(biāo)效度：考察測驗(yàn)分?jǐn)?shù)與效標(biāo)的關(guān)系，看測驗(yàn)對我們感興趣的行為預(yù)測的如何。效標(biāo)效度（效標(biāo)關(guān)聯(lián)效度）也叫實(shí)證效度，是指一個測驗(yàn)對處于特定情境中的個體的行為進(jìn)行估計(jì)的有效性。也就是說，一個測驗(yàn)是否有效，應(yīng)該以實(shí)踐的效果來作為檢驗(yàn)標(biāo)準(zhǔn)。 *效標(biāo)效度可以分為同時效度（用于診斷現(xiàn)狀）預(yù)測效度（用于預(yù)測某個個體將來的行為）效標(biāo)——存在于測量之外；可以獨(dú)立進(jìn)行測量；能夠量化。 1）被估計(jì)的行為是檢驗(yàn)測驗(yàn)效度的標(biāo)準(zhǔn)，簡稱為效標(biāo)。效標(biāo)就是衡量一個測驗(yàn)是否有效的外在標(biāo)準(zhǔn)，它是獨(dú)立于測驗(yàn)并可以從實(shí)踐中直接獲得我們所感興趣的行為（觀念效標(biāo)）。觀念效標(biāo)具有多樣性、復(fù)雜性、特殊性和時間性。 2）常用效標(biāo)有學(xué)業(yè)成就、等級評定、臨床診斷、專門的訓(xùn)練成績、實(shí)際工作表現(xiàn)等。例如：考察“高考”的效度，用“大學(xué)學(xué)習(xí)成績”作為效標(biāo)。效標(biāo)效度的確定方法 a．相關(guān)法——計(jì)算測驗(yàn)分?jǐn)?shù)與效標(biāo)測量的相關(guān)系數(shù) 【積差相關(guān)法、等級相關(guān)法、二列相關(guān)法、四分相關(guān)法】 b．區(qū)分法（分組法）——能夠把好壞兩組人有效地區(qū)分開來 ——差異越大，說明測驗(yàn)越有效思路：被試接受測驗(yàn)后，讓他們工作一段時間，再根據(jù)工作成績（效標(biāo)測量）的好壞分為兩組，回過來分析這兩組被試原先接受測驗(yàn)的分?jǐn)?shù)差異。 c．命中率——用于選拔性測驗(yàn)，影響因素：錄取率、基礎(chǔ)率 ——正命中率的比率越高，測驗(yàn)越有效總命中率：根據(jù)測驗(yàn)選出的人當(dāng)中工作合格的人數(shù)，以及根據(jù)測驗(yàn)淘汰的人當(dāng)中工作不合格的人數(shù)之和與總?cè)藬?shù)之比。正命中率：用測驗(yàn)選出的人中合格者所占的比例。 d．預(yù)期表法 e．功利率法 ③ 構(gòu)想效度：指測驗(yàn)對理論上的構(gòu)想或特質(zhì)的測量程度。又稱結(jié)構(gòu)效度，是指一個測驗(yàn)實(shí)際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度，或者說它是指測驗(yàn)分?jǐn)?shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。構(gòu)想或結(jié)構(gòu)指心理學(xué)理論所涉及到的抽象而屬假設(shè)性的概念或特質(zhì)，如智力、焦慮、動機(jī)等。注：構(gòu)想效度主要用于智力測驗(yàn)和人格測驗(yàn)。構(gòu)想效度的確定方法 a．測驗(yàn)內(nèi)法（測驗(yàn)內(nèi)部尋找證據(jù)法）確定測驗(yàn)的內(nèi)容效度——內(nèi)容效度高實(shí)質(zhì)上也就說明結(jié)構(gòu)效度高分析被試對項(xiàng)目做反應(yīng)的答題過程考察測驗(yàn)的同質(zhì)性信度——測驗(yàn)同質(zhì)只是必要條件 b．測驗(yàn)間法（測驗(yàn)之間尋找證據(jù)法）相容效度—考察新編測驗(yàn)與某個已知的能有效測量相同特質(zhì)的舊測驗(yàn)間的相關(guān) 區(qū)分效度—考察新編測驗(yàn)與某個已知的能有效測量不同特質(zhì)的舊測驗(yàn)間的相關(guān) 因素效度（因素分析）—對一組測驗(yàn)進(jìn)行因素分析，找出影響測驗(yàn)的共同因素補(bǔ)充： 1）相容效度與區(qū)分效度必要非充分條件相容效度：和測量相同特質(zhì)的舊測驗(yàn)有高相關(guān) 區(qū)分效度：和測量不同特質(zhì)的舊測驗(yàn)有低相關(guān) 2）因素分析：每個測驗(yàn)在共同因素上的負(fù)荷量（即測驗(yàn)與各因素的相關(guān)）就是測驗(yàn)的因素效度。 c．效標(biāo)關(guān)聯(lián)法（實(shí)證效度法）兩種：①根據(jù)效標(biāo)把人分成兩類，考察其得分的差異 ②根據(jù)測驗(yàn)得分把人分成高分組、低分組，考察兩組人在所測特質(zhì)方面是否確有差異。 d．多種特質(zhì)—多種方法矩陣法——相容效度和區(qū)分效度的綜合運(yùn)用原理：用多種極不相同的方法測量同一種特質(zhì)相關(guān)很高（用極為相似的方法測量不同特質(zhì)相關(guān)很低），說明測量效度較高。 e．實(shí)驗(yàn)操作法（3）效度的影響因素【只要影響信度就一定影響效度】測驗(yàn)本身：項(xiàng)目質(zhì)量；項(xiàng)目數(shù)量測驗(yàn)的實(shí)施被試：身心狀態(tài)；樣本特點(diǎn) 主試因素所用效標(biāo) *凡是與測量目的無關(guān)的、穩(wěn)定的和不穩(wěn)定的變異來源都會影響測量的效度。 ①測驗(yàn)的構(gòu)成當(dāng)試題樣本沒有較好的代表欲測內(nèi)容或結(jié)構(gòu)時，或題目語意不清、指導(dǎo)語不明、題目太難或太易、題目太少或安排不當(dāng)時，都會降低測量效度。 &測驗(yàn)長度與效度的公式 ②測驗(yàn)的實(shí)施過程在測驗(yàn)實(shí)施過程中，如不遵從指導(dǎo)語的要求，或出現(xiàn)意外干擾，或評分、計(jì)分出現(xiàn)差錯等，都會降低測量效度。 ③接受測驗(yàn)的被試就單個被試而言，被試的應(yīng)試動機(jī)、情緒、態(tài)度、身體狀態(tài)等，都會造成較大的隨機(jī)誤差，進(jìn)而影響測量效度。就被試團(tuán)體而言，如果缺乏必要的同質(zhì)性（年齡、性別、文化程度、職業(yè)等），則很可能會得到不恰當(dāng)?shù)男Ф荣Y料。 ④ 所選效標(biāo)的性質(zhì) 由于同一個測驗(yàn)可以有不同的效標(biāo)，同一個觀念效標(biāo)也可以有不同的效標(biāo)測量，因此在評價測量效度時，所選效標(biāo)的性質(zhì)是很重要的考慮因素。【在考慮效標(biāo)與分?jǐn)?shù)的相關(guān)時，必須注意：測驗(yàn)分?jǐn)?shù)與效標(biāo)之間是否符合線性關(guān)系】 ⑤測量的信度（4）效度的改進(jìn)方法 ①通過標(biāo)準(zhǔn)化全面減少各種測量誤差。 ②精心編制測驗(yàn)量表，避免出現(xiàn)較大的系統(tǒng)誤差。 ③妥善組織測驗(yàn)，控制隨機(jī)誤差。 ④創(chuàng)設(shè)標(biāo)準(zhǔn)的應(yīng)試情境，讓每個被試都能發(fā)揮正常的水平。 ⑤選好正確的效標(biāo)，定好恰當(dāng)?shù)男?biāo)測量，正確地使用有關(guān)公式。（5）信度與效度的關(guān)系 ①信度高是效度高的必要非充分條件。一個測驗(yàn)效度高，其信度也必然高；但一個測驗(yàn)信度高，其效度不一定高。 ②測驗(yàn)的效度受它的信度制約。 <信度系數(shù)的平方根是效度系數(shù)的最高限度，效度永遠(yuǎn)小于信度> ③效度等于測驗(yàn)信度系數(shù)與效標(biāo)信度系數(shù)乘積的開方。統(tǒng)計(jì)推導(dǎo)公式第三節(jié) 心理測量的誤差 1. 誤差的種類與控制（1）隨機(jī)誤差的來源及控制：測驗(yàn)本身、施測情境、主試因素、被試因素（2）系統(tǒng)誤差的來源及控制：測驗(yàn)本身、主試因素、被試因素控制：標(biāo)準(zhǔn)化施測、嚴(yán)格控制測驗(yàn)條件、取樣要有代表性 2. 測量誤差的估計(jì) 測量的標(biāo)準(zhǔn)誤差異的標(biāo)準(zhǔn)誤 *誤差分?jǐn)?shù)分布的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。 1）測量誤差的定義測量誤差是指在測量過程中由那些與測量目的無關(guān)的變化因素所產(chǎn)生的一種不準(zhǔn)確或不一致的測量效應(yīng)。它的含義包括：①測量誤差是由那些與測量目的無關(guān)的變因所致；②測量誤差表現(xiàn)為不準(zhǔn)確或不一致兩種方式。心理測量的誤差可分為兩類：隨機(jī)誤差和系統(tǒng)誤差。隨機(jī)誤差是由與測量目的無關(guān)的、偶然因素引起的，而又不易控制的誤差。它使多次測量產(chǎn)生不一致的結(jié)果，其方向和大小的變化完全是隨機(jī)的，只符合某種統(tǒng)計(jì)學(xué)規(guī)律。系統(tǒng)誤差是由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng)。這種誤差穩(wěn)定的存在于每一次測量中，盡管多次測量結(jié)果非常一致，但實(shí)測結(jié)果仍與真實(shí)數(shù)字有所差異。系統(tǒng)誤差：按規(guī)律變動，成比例恒定誤差：固定數(shù)值不變 *系統(tǒng)誤差只影響準(zhǔn)確性，不影響穩(wěn)定性；隨機(jī)誤差既影響穩(wěn)定性又影響準(zhǔn)確性。 2）測量誤差的來源及控制心理測量的誤差主要來自三個方面，即測量工具、測量對象和施測過程。在測量工具方面，心理測量與物理測量有所不同。心理測量工具通常是以一套測驗(yàn)（問卷）為核心的刺激反應(yīng)系統(tǒng)（通常稱作量表）。當(dāng)量表在測查人的某種心理特質(zhì)時，若項(xiàng)目所測的東西與我們欲測的目的之間出現(xiàn)偏差，則測量會出現(xiàn)誤差。測量工具信度不好、效度不高是造成誤差的兩種主要原因。在測量對象方面，造成測量誤差的主要原因是受測者真正水平是否得到正常發(fā)揮。一般的，受測者的某種心理特質(zhì)水平是相對穩(wěn)定的，但是他在接受測量時的生理和心理狀態(tài)會影響其水平的正常發(fā)揮。此外，受測者應(yīng)試動機(jī)的強(qiáng)弱、受訓(xùn)時間的長短、受訓(xùn)內(nèi)容的多少、答題反應(yīng)的快慢等都會產(chǎn)生測量誤差。在施測過程方面，產(chǎn)生測量誤差的原因主要是一些偶然因素，包括施測物理環(huán)境，主試的某些屬性，評分記分環(huán)節(jié)出現(xiàn)的疏漏，以及意外干擾等。知道了誤差的來源，就可以根據(jù)來源的不同，采取針對性的措施減少誤差。 3）測量誤差的估計(jì) 經(jīng)典測量理論假定：X=T+E，X為實(shí)得分?jǐn)?shù)或觀測分?jǐn)?shù)，T為假設(shè)的真分?jǐn)?shù)（一種測量工具在測量沒有誤差時得到的純正值，其操作定義是：無數(shù)次測量所得結(jié)果的平均值），E為測量誤差。其他關(guān)于誤差的假設(shè)： ①如果對一個人測量無數(shù)次，其誤差之和為0，平均誤差為0，即E=0。 ②誤差與真分?jǐn)?shù)相互獨(dú)立；其中的誤差是指隨機(jī)誤差，只與偶然因素有關(guān)，而與真分?jǐn)?shù)大小無關(guān)，即真分?jǐn)?shù)與誤差分?jǐn)?shù)的相關(guān)系數(shù)為0。 ③一個團(tuán)體的平均真分?jǐn)?shù)T等于該團(tuán)體中所有被試實(shí)得分?jǐn)?shù)的平均值X。在一個團(tuán)體中，由于每個人的誤差都是隨機(jī)的且方向不同，只要團(tuán)體足夠大，其誤差就會相互抵消。因此，其誤差和為0。 ④真分?jǐn)?shù)的變異可以分為兩部分：與測驗(yàn)?zāi)康挠嘘P(guān)的變異（有效的變異數(shù)）和與測驗(yàn)?zāi)康臒o關(guān)的變異（無效的變異數(shù)），公式為。則總體的關(guān)系式為。第四節(jié) 測驗(yàn)的項(xiàng)目分析要求：心理測驗(yàn)的項(xiàng)目分析——難度；區(qū)分度；項(xiàng)目的綜合分析和篩選（講義p249）。項(xiàng)目分析包括定性分析及定量分析。定性分析包括考慮內(nèi)容效度、題目編寫的恰當(dāng)性和有效性等，重點(diǎn)在于分析測題的內(nèi)容和形式；定量分析主要是采用統(tǒng)計(jì)方法來分析試題的品質(zhì)。 1.難度（1）難度的含義難度是指測驗(yàn)項(xiàng)目的難易程度。（2）難度的計(jì)算 ①二分法記分項(xiàng)目的難度（客觀題）通過率法：主要利用項(xiàng)目的通過率作為衡量難度的指標(biāo)，即以答對或通過該項(xiàng)目的人數(shù)的百分比P來表示。P值越大，題目越容易。極端分組法：當(dāng)被試的人數(shù)較多時，可以先將被試分為三組，取最高的27%被試和最低的27%被試作為高分組和低分組，并分別計(jì)算通過率，最后求兩個通過率的平均值作為該項(xiàng)目的難度。 ②非二分法記分項(xiàng)目的難度（主觀題）計(jì)算公式 *在對兩個非二分法記分的項(xiàng)目進(jìn)行難度比較時，要對它們分別進(jìn)行校正，排除由于猜測而答對某些題目致使通過率增大的可能性。校正公式為（3）難度水平的確定項(xiàng)目難度水平的確定取決于測驗(yàn)的目的和性質(zhì)。對于效標(biāo)參照測驗(yàn)和掌握測驗(yàn)，可不考慮難度。對于選拔測驗(yàn)，應(yīng)將測驗(yàn)的項(xiàng)目難度控制在錄取率左右。對于選擇題，難度應(yīng)該大于猜測概率。無論何種測驗(yàn)，一般都應(yīng)防止被試得滿分，因?yàn)闈M分的意義是不明確的。（4）難度的等距變換（教材p75）以項(xiàng)目的通過率來表示項(xiàng)目的難度，這類難度指標(biāo)屬于順序變量，不具有相等的單位，所指出的僅僅是項(xiàng)目的相對難度。于是需要把順序量表轉(zhuǎn)換成等距量表（僅有名次不能計(jì)算，必須要有具體測驗(yàn)分?jǐn)?shù)才可以）。當(dāng)樣本容量很大時，測驗(yàn)分?jǐn)?shù)將接近正態(tài)分布。根據(jù)正態(tài)分布曲線表，將試題的難度P作為正態(tài)曲線下的面積，轉(zhuǎn)換成具有相等單位的等距量數(shù)，即Z分?jǐn)?shù)。標(biāo)準(zhǔn)分?jǐn)?shù)（Z分?jǐn)?shù)）具有相等的單位，屬于等距量表。較難的項(xiàng)目難度為正值，較易的項(xiàng)目難度為負(fù)值，P為0.5時難度為0。（5）難度對測驗(yàn)的影響 ①項(xiàng)目難度普遍較大的測驗(yàn)，分?jǐn)?shù)分布將呈現(xiàn)為正偏態(tài)；項(xiàng)目難度普遍較小的測驗(yàn)，分?jǐn)?shù)分布將呈現(xiàn)為負(fù)偏態(tài)。一般能力測驗(yàn)和成就測驗(yàn)的平均難度在0.5左右為宜，正偏態(tài)分布適合于篩選性測驗(yàn)。 ②過難或過易的測驗(yàn)會使測驗(yàn)分?jǐn)?shù)相對的集中在低分端或高分端，從而使分?jǐn)?shù)的全距縮小。項(xiàng)目的難度以集中在0.5左右為最佳，以集中在兩端最差。 2.區(qū)分度（1）區(qū)分度的含義區(qū)分度是指測驗(yàn)項(xiàng)目對被試心理品質(zhì)水平差異的區(qū)分能力或鑒別能力。區(qū)分度被用作評價項(xiàng)目質(zhì)量，篩選項(xiàng)目的主要指標(biāo)和依據(jù)。具有良好區(qū)分度的項(xiàng)目，能將不同水平的被試區(qū)分開來。即在該項(xiàng)目上水平高的被試得高分，水平低的被試得低分。把試題的區(qū)分度稱為測驗(yàn)是否具有效度的“指示器”。區(qū)分度（D）的取值范圍介于-1.00至+1.00之間。通常D為正值，稱作積極區(qū)分；D為負(fù)值，稱作消極區(qū)分；D為0稱作無區(qū)分作用。具有積極區(qū)分作用的項(xiàng)目，其D值越大，區(qū)分的效果越好。 *評價測驗(yàn)項(xiàng)目區(qū)分度高低依賴于對被試水平的準(zhǔn)確測量，通常稱作為效標(biāo)分?jǐn)?shù)。測驗(yàn)項(xiàng)目區(qū)分度的效標(biāo)分?jǐn)?shù)多用測驗(yàn)總分，稱為內(nèi)部效標(biāo)。（2）區(qū)分度的計(jì)算 ①項(xiàng)目鑒別指數(shù)法——二分法記分當(dāng)效標(biāo)成績是連續(xù)變量時，可以從分?jǐn)?shù)的兩端各選擇27%的被試，分別計(jì)算出每道題目上各自的通過率，二者之差便是鑒別指數(shù)（D）。D值越高項(xiàng)目越有效。計(jì)算公式為。當(dāng)D=1.00時，高分組被試全部通過，低分組被試全部失??；如果低分組被試全部通過，高分組被試全部失敗，則D=-1.00；如果兩組的通過率相等，則D=0。項(xiàng)目鑒別指數(shù)法只利用了一部分信息，浪費(fèi)了很多信息，統(tǒng)計(jì)結(jié)果準(zhǔn)確性差一些。而且當(dāng)項(xiàng)目與效標(biāo)之間并非為直線關(guān)系時，甚至?xí)贸鲥e誤的結(jié)論。 ②相關(guān)法——大規(guī)?；驑?biāo)準(zhǔn)化測驗(yàn) 以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)或測驗(yàn)總分的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)。相關(guān)越高，項(xiàng)目區(qū)分度越高。 a.點(diǎn)二列相關(guān)——項(xiàng)目是（0，1）記分或二分變量，效標(biāo)或測驗(yàn)總分是連續(xù)變量 b.二列相關(guān)——連續(xù)的測量變量，其中一個變量被人為分成兩類 c.φ相關(guān)——兩個變量是二點(diǎn)分配，即兩個變量都是二分名義變量 d.積差相關(guān)——論文式測驗(yàn)題目，得分具有連續(xù)性（被試團(tuán)體較大時，可以認(rèn)為項(xiàng)目分?jǐn)?shù)服從正態(tài)分布） ③方差法被試在某一項(xiàng)目上的得分越分散，則該試題鑒別力越大。（3）區(qū)分度的相對性 ①不同計(jì)算方法，所得區(qū)分值不同。一個測驗(yàn)的各項(xiàng)目要采用同一種區(qū)分度指標(biāo)。 ②樣本容量大小影響相關(guān)法區(qū)分度值的大小。樣本容量越小，其統(tǒng)計(jì)值越不可靠。 ③分組標(biāo)準(zhǔn)影響鑒別指數(shù)。分組越極端，其D值越大。 ④被試樣本的同質(zhì)性程度影響區(qū)分度值的大小。被試團(tuán)體越同質(zhì)，即個體之間水平越接近，其測題的區(qū)分度值越小。（4）區(qū)分度與難度的關(guān)系測驗(yàn)項(xiàng)目的難度對測驗(yàn)項(xiàng)目的鑒別力有一定的影響，難度與區(qū)分度有著密切的聯(lián)系。難度越接近0.5時，項(xiàng)目潛在的區(qū)分度越大，而難度越接近1.00或0時，項(xiàng)目潛在的區(qū)分度越小。為了使項(xiàng)目具有較高區(qū)分能力，應(yīng)使所有項(xiàng)目都保持在0.5的難度最為理想。在利用項(xiàng)目分析選擇試題時，應(yīng)使項(xiàng)目的難度分布廣一些，梯度大一些，使整個測驗(yàn)的難度分布呈正態(tài)分布，且平均水平保持在0.5左右。這樣才能把各種水平的人都區(qū)分開來，并且分的比較細(xì)。 *難度既影響信度又影響效度；難度影響區(qū)分度。 3.選項(xiàng)分析選項(xiàng)分析就是對選擇題后面提供的幾個答案的分析。主要的異常情況有： ①正確答案無人選擇，或少于其他選項(xiàng)的人數(shù)； ②錯誤答案選的人太多； ③正確選項(xiàng)上的高分組選擇人數(shù)少于低分組； ④錯誤選項(xiàng)上的高分組選擇人數(shù)多于低分組； ⑤某個選項(xiàng)無人選擇； ⑥未答的人數(shù)較多。 *標(biāo)準(zhǔn)：正確選項(xiàng)準(zhǔn)確唯一；錯誤選項(xiàng)具有干擾性、迷惑性。第五節(jié) 心理測驗(yàn)的編制 1. 測驗(yàn)編制的基本程序（1）確定測驗(yàn)?zāi)康? （2）制定編題計(jì)劃（3）編寫測驗(yàn)題目（4）題目試測與分析（5）合成測驗(yàn)及復(fù)本（6）測驗(yàn)使用標(biāo)準(zhǔn)化（7）信度與效度分析（8）編寫測驗(yàn)說明書一、確定測驗(yàn)?zāi)康? 1.明確測量對象——測量哪些個人或團(tuán)體 2.明確測量目標(biāo)——測量什么心理功能 *目標(biāo)具體化 3.明確測量用途——描述？診斷？選拔？驗(yàn)證？二、制定編題計(jì)劃要明確的信息：一是全面而具代表性的測驗(yàn)內(nèi)容，不致使測題偏離了應(yīng)測的范圍；二是對各個內(nèi)容點(diǎn)的相對重視程度，通常用百分比來標(biāo)明。用途：指明編題方向；確定記分標(biāo)準(zhǔn)。三、編寫測驗(yàn)題目 1.收集測驗(yàn)資料原則：1）資料要豐富；【臨床觀察的資料、已有的測題】 2）資料要有普遍性； 3）資料要有趣味性。 2.選擇項(xiàng)目形式原則：1）使受測者容易明了測驗(yàn)方法 2）使受測者在完成測驗(yàn)時不會因測驗(yàn)項(xiàng)目的形式不當(dāng)而做錯。 3）測驗(yàn)過程省時 4）計(jì)分省時省力 5）經(jīng)濟(jì) 3.編寫測驗(yàn)項(xiàng)目注意：1）測驗(yàn)項(xiàng)目的取樣對欲測心理品質(zhì)具有代表性； 2）測驗(yàn)項(xiàng)目的取材范圍要同編題計(jì)劃所列項(xiàng)目范圍相一致； 3）測驗(yàn)項(xiàng)目的難度應(yīng)有一定的分布范圍； 4）用語要力求精煉簡短，淺顯明了 5）初編題目的數(shù)量要多于最終所需要的數(shù)量，以便篩選或編制復(fù)本； 6）測驗(yàn)項(xiàng)目的說明必須簡明。四、題目試測與分析 1.預(yù)測目的：獲得被試對測驗(yàn)項(xiàng)目做何反應(yīng)的資料，包括質(zhì)的信息與量的指標(biāo)。質(zhì)：題目思想性、邏輯錯誤、印刷、裝訂量：難度、區(qū)分度、項(xiàng)目分析注意：1）預(yù)測對象應(yīng)取自將來正式測驗(yàn)時準(zhǔn)備施用的群體，人數(shù)不必太多，但要具有代表性； 2）預(yù)測的情境應(yīng)力求同正式測驗(yàn)的情境一致； 3）預(yù)測的時限可以適當(dāng)延長，以便每一個受測者都能將題目做完； 4）施測者應(yīng)對受測者的反應(yīng)加以記錄。 2. 項(xiàng)目分析——對預(yù)測結(jié)果進(jìn)行統(tǒng)計(jì)分析，確定項(xiàng)目的難度和區(qū)分度。五、合成測驗(yàn)及復(fù)本合成測驗(yàn)就是把經(jīng)過預(yù)測以后證明有價值的項(xiàng)目排成有組織的測驗(yàn)。 1. 測驗(yàn)項(xiàng)目的選擇指標(biāo)（3個）：測驗(yàn)的性質(zhì)；項(xiàng)目的難度；項(xiàng)目的區(qū)分度 2. 測驗(yàn)項(xiàng)目的編排總的編排原則：由易到難兩種常見編排方式： 1）并列直進(jìn)式：依其難度由易到難排列。 2）混合螺旋式：依難度分成若干不同的層次，再將不同性質(zhì)的測驗(yàn)項(xiàng)目予以組合，作交叉式的排列，其難度則漸次升進(jìn)。 3.編制復(fù)本（A、B卷等值性）等值需要符合的條件： 1）各份測驗(yàn)測量的是同一種心理特質(zhì)； 2）各份測驗(yàn)具有相同的內(nèi)容和形式； 3）各份測驗(yàn)不應(yīng)有重復(fù)的項(xiàng)目； 4）各份測驗(yàn)項(xiàng)目數(shù)量相等，并且有大體相同的難度和區(qū)分度。 **ABBA的順序平衡難度六、測驗(yàn)使用標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化是指測驗(yàn)的編制、施測、評分以及解釋測驗(yàn)分?jǐn)?shù)的程度的一致性。 1. 測驗(yàn)內(nèi)容：相同的或等值的題目 2. 施測過程：相同的測驗(yàn)情境；相同的指導(dǎo)語；相同的測驗(yàn)時限 3. 測驗(yàn)評分：1）對反應(yīng)要及時清楚的記錄； 2）要有標(biāo)準(zhǔn)答案或正確反應(yīng)的表格，即記分鍵； 3）將受測者的反應(yīng)與記分鍵比較，確定受測者反應(yīng)應(yīng)得的分?jǐn)?shù)。 4. 測驗(yàn)分?jǐn)?shù)的解釋七、鑒定測驗(yàn)（信度與效度分析） 1.信度——測驗(yàn)的可靠性；即用同一測驗(yàn)多次測量同一團(tuán)體，所得測驗(yàn)結(jié)果之間具有一致性。 2.效度——測驗(yàn)的有效性；即一個測驗(yàn)在多大程度上能夠測得所要測得的東西。 3.測驗(yàn)量表與常模 ①按照統(tǒng)計(jì)學(xué)的原理，把某一標(biāo)準(zhǔn)化樣本的測驗(yàn)分?jǐn)?shù)轉(zhuǎn)化為具有一定參照點(diǎn)、等值單位的導(dǎo)出分?jǐn)?shù)，這就是所謂的測量量表。常見：百分等級量表、標(biāo)準(zhǔn)分?jǐn)?shù)量表、T量表、發(fā)展量表、智力商數(shù)量表等。 ②如果將標(biāo)準(zhǔn)化樣本的測驗(yàn)分?jǐn)?shù)與相應(yīng)的某一個或某幾個測驗(yàn)量表分?jǐn)?shù)一起用表格的形式呈現(xiàn)出來，就是該測驗(yàn)的常模表。八、編寫測驗(yàn)說明書 1）本測驗(yàn)的目的與功用； 2）本測驗(yàn)的理論依據(jù)； 3）測驗(yàn)內(nèi)容及實(shí)施測驗(yàn)的方法； 4）測驗(yàn)的標(biāo)準(zhǔn)答案和評分方法； 5）關(guān)于測驗(yàn)的信度、效度資料的說明； 6）常模表，即如何依據(jù)常模解釋測驗(yàn)結(jié)果。 2.測驗(yàn)?zāi)繕?biāo)與雙向細(xì)目表（講義p250） 3.題目編制技術(shù)（講義p250-p251）第六節(jié) 心理測驗(yàn)的實(shí)施測驗(yàn)的使用主要涉及兩個問題： 1）如何實(shí)施測驗(yàn)才能保證測驗(yàn)分?jǐn)?shù)盡可能少受施測過程的影響； 2）如何解釋測驗(yàn)分?jǐn)?shù)才能保證受測者的心理不受負(fù)面影響。一、測驗(yàn)的實(shí)施過程通過觀測受測者在測驗(yàn)情境中的行為樣本，可以推斷他平日一般的行為特征。 1. 施測前的準(zhǔn)備工作（1）準(zhǔn)備好測驗(yàn)材料（2）熟練掌握施測手續(xù) 訓(xùn)練的內(nèi)容包括：①熟悉測驗(yàn)內(nèi)容； ②掌握施測步驟； ③掌握記分方法； ④掌握解釋分?jǐn)?shù)的技術(shù)。（3）熟記測驗(yàn)指導(dǎo)語并能用口語清楚而流利地說出來。 2. 指導(dǎo)語指導(dǎo)語通常包括對測驗(yàn)?zāi)康牡恼f明和對題目反應(yīng)方式的解釋。注意：一般要求測驗(yàn)的主持者和指導(dǎo)語都應(yīng)保持和表述中立的態(tài)度，不傾向于答案中的任何一種方向。 *一般的能力測驗(yàn)和成就測驗(yàn)都要求有標(biāo)準(zhǔn)嚴(yán)格的時間限制；而人格測驗(yàn)和態(tài)度測驗(yàn)一般不要求有時間限制。 3. 測驗(yàn)情境包括測驗(yàn)場地（通風(fēng)、光線、噪聲）、座位、答案紙型等。 4. 測驗(yàn)焦慮測驗(yàn)焦慮是指被試因接受測驗(yàn)而產(chǎn)生的一種憂慮和緊張情緒，它會影響測驗(yàn)結(jié)果的真實(shí)性。主試有時可以利用保證測驗(yàn)結(jié)果絕對保密或鼓勵被試等方法來消除測驗(yàn)焦慮。 5. 與受測者建立良好的協(xié)調(diào)關(guān)系良好的協(xié)調(diào)關(guān)系指的是施測者設(shè)法努力引起受測者對測驗(yàn)的興趣，取得他的合作，以保證他能按照標(biāo)準(zhǔn)測驗(yàn)指導(dǎo)語行事。 6. 評分技術(shù) 二、測驗(yàn)分?jǐn)?shù)的解釋主要涉及兩個問題：一是如何看待測驗(yàn)分?jǐn)?shù)的意義；二是如何將測驗(yàn)分?jǐn)?shù)的意義告訴受測者。 1. 如何看待測驗(yàn)分?jǐn)?shù)的意義高德曼的三個維度的解釋模型三個維度分別是解釋測驗(yàn)分?jǐn)?shù)的類型、資料處理的方法、資料的來源解釋測驗(yàn)分?jǐn)?shù)的4種類型：敘述的解釋、溯因的解釋、預(yù)測的解釋、評價的解釋資料處理的2種方法：機(jī)械的處理、非機(jī)械的處理資料的2種來源：測驗(yàn)資料、非測驗(yàn)資料三個維度加以組合：4*2*2=16種不同的解釋方式。基本原則： 1）主試應(yīng)充分了解測驗(yàn)的性質(zhì)與功能。 2）對導(dǎo)致測驗(yàn)結(jié)果的原因的解釋應(yīng)慎重，謹(jǐn)防片面極端。 3）必須充分估計(jì)測驗(yàn)的常模和效度的局限性。 4）解釋分?jǐn)?shù)應(yīng)參考其他有關(guān)資料。 5）對測驗(yàn)分?jǐn)?shù)應(yīng)以“一段分?jǐn)?shù)”來解釋，而不應(yīng)以“特定的數(shù)值”來解釋。 6）對來自不同測驗(yàn)的分?jǐn)?shù)不能直接加以比較。 2. 如何將測驗(yàn)分?jǐn)?shù)的意義告訴受測者（教材p131-p132）補(bǔ)充：講義p252 第七節(jié) 測驗(yàn)常模 1、常模與常模團(tuán)體 1）常模：用于比較和解釋測驗(yàn)結(jié)果的標(biāo)準(zhǔn)化樣本的分?jǐn)?shù)分布。常模是根據(jù)標(biāo)準(zhǔn)化樣本的測驗(yàn)分?jǐn)?shù)經(jīng)過統(tǒng)計(jì)處理而建立起來的具有參照點(diǎn)和單位的測驗(yàn)量表。編制常模需要三步：①確定有關(guān)的比較團(tuán)體； ②獲得該團(tuán)體成員的測驗(yàn)分?jǐn)?shù)； ③把原始分?jǐn)?shù)轉(zhuǎn)化成量表分?jǐn)?shù)。 2）常模團(tuán)體常模團(tuán)體是作為比較標(biāo)準(zhǔn)的具有某些共同特征的人組成的群體或該群體的樣本。 3）確定常模團(tuán)體的注意事項(xiàng) ①群體構(gòu)成的界限必須明確； ②常模團(tuán)體必須是所測群體的一個代表性樣本；（遵循隨機(jī)化原則）e.g.分層抽樣 ③取樣的過程必須明確且有詳盡的描述； ④樣本大小要適當(dāng)；（取樣誤差與樣本大小成反比；其他條件相同時樣本越大越好） ⑤常模團(tuán)體必須是近時的；即減低抽樣誤差，就必須加大樣本容量 ⑥注意一般常模與特殊常模的結(jié)合。 2、分?jǐn)?shù)轉(zhuǎn)換與合成分?jǐn)?shù)的轉(zhuǎn)換：按某種規(guī)則將原始分?jǐn)?shù)轉(zhuǎn)化為導(dǎo)出分?jǐn)?shù)的過程。 1）原始分?jǐn)?shù)：從測驗(yàn)中直接獲得的分?jǐn)?shù)；被試在接受測驗(yàn)后，根據(jù)測驗(yàn)的記分標(biāo)準(zhǔn)，對照被試的反應(yīng)所計(jì)算出的測驗(yàn)分?jǐn)?shù)。原始分?jǐn)?shù)反映了被試答對題目的個數(shù)或作答正確的程度；不能直接反映出被試之間的差異狀況、被試相互比較后所處的地位、被試在其他等值測驗(yàn)上應(yīng)獲得什么樣的分值。 2）導(dǎo)出分?jǐn)?shù)：在原始分?jǐn)?shù)轉(zhuǎn)換的基礎(chǔ)上，按照一定的規(guī)則，經(jīng)過統(tǒng)計(jì)處理后獲得的具有一定參考點(diǎn)和單位，且可以相互比較的分?jǐn)?shù)。常用的導(dǎo)出分?jǐn)?shù)有百分等級、標(biāo)準(zhǔn)分?jǐn)?shù)、T分?jǐn)?shù)。分?jǐn)?shù)的合成：將幾個分?jǐn)?shù)或幾個預(yù)測源組合起來，以獲得一個合成分?jǐn)?shù)或做總的預(yù)測。有3種類型：1）項(xiàng)目的組合； 2）分測驗(yàn)或量表的組合； 3）測驗(yàn)或預(yù)測源的組合。分?jǐn)?shù)合成中的問題： 1）采用什么方法來合成分?jǐn)?shù)？取決于組成測驗(yàn)分?jǐn)?shù)的目的與要做何種決定。 2）什么形式是最適當(dāng)?shù)姆謹(jǐn)?shù)組合？可用效標(biāo)效度來評價合成分?jǐn)?shù)。 3）需要多少及何種測驗(yàn)分?jǐn)?shù)作最適當(dāng)?shù)慕M合分?jǐn)?shù)？可用合成體效度來評價。分?jǐn)?shù)合成的方法： 1）臨床判斷 2）推理方法：單位加權(quán)，等量加權(quán)，差異加權(quán) 3）多重分段：連續(xù)柵欄，綜合分段 4）多重回歸：基本方程，預(yù)測誤差，漸進(jìn)效度，合成體效度 5）特殊方法：完形記分，輪廓分析 1> 臨床診斷——直覺合成根據(jù)經(jīng)驗(yàn)做出診斷；這種根據(jù)直覺的經(jīng)驗(yàn)，主觀地將各種因素加權(quán)，而獲得結(jié)論或預(yù)測的方法叫做臨床診斷。優(yōu)點(diǎn)：①具有高度的綜合性；②具有靈活的針對性。缺點(diǎn)：①主觀加權(quán)易受決策者的偏見影響，不夠客觀； ②缺乏精確的數(shù)量分析，沒有精確的數(shù)量指標(biāo)。 2> 加權(quán)求和合成——推理方法：單位加權(quán)，等量加權(quán)，差異加權(quán) ① 單位加權(quán)：將各個測驗(yàn)分?jǐn)?shù)直接相加而獲得合成分?jǐn)?shù)。公式為： ② 等量加權(quán)：將所有測驗(yàn)分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù)，然后采用下式加權(quán)組合。（適用于各測驗(yàn)對預(yù)測效標(biāo)具有同等重要性的場合）公式為： ③ 差異加權(quán)：通常情況下，各個變數(shù)對預(yù)測效標(biāo)的作用是不同的。因此需要根據(jù)各個變數(shù)與效標(biāo)之間的經(jīng)驗(yàn)關(guān)系作差異加權(quán)。公式為： e.g.分?jǐn)?shù)離散程度大的課程，具有較強(qiáng)區(qū)分度，在錄取時起的作用大。 3> 多重劃分——多重分段：連續(xù)柵欄，綜合分段 ①多重劃分就是在各個特質(zhì)上都確定一個標(biāo)準(zhǔn)，從而把成績劃分為合格與不合格兩類。只有每個測驗(yàn)都合格時，總要求才算合格。（同時考察） ②連續(xù)柵欄就是在整個測驗(yàn)實(shí)施時，是把所有組成這一測驗(yàn)的分測驗(yàn)按一定順序排列起來逐一實(shí)施，只有通過了前一次測驗(yàn)，才能繼續(xù)實(shí)施后一個測驗(yàn)。 4> 多重回歸：基本方程，預(yù)測誤差，漸進(jìn)效度，合成體效度多重回歸就是研究一種事物或現(xiàn)象與其他多種事物或現(xiàn)象在數(shù)量上相互聯(lián)系和相互制約的統(tǒng)計(jì)方法。基本方程式為：通過對預(yù)測源作適當(dāng)加權(quán)，使這些加權(quán)的測驗(yàn)分?jǐn)?shù)的合成能以最小的誤差來預(yù)測效標(biāo)分?jǐn)?shù)。注意：最佳預(yù)測源：選出與效標(biāo)相關(guān)最高的變量，然后加入另一預(yù)測源組合起來以使R的數(shù)值增至最大，下一個要加入的預(yù)測源應(yīng)該是與前兩個預(yù)測源組合起來能使R值增加最多的，依次類推，當(dāng)加入額外的預(yù)測源不再顯著的使相關(guān)系數(shù)R值增加時，則終止分析。和Y相關(guān)盡可能高，和X1相關(guān)盡可能低 5> 特殊方法：完形記分，輪廓分析呈現(xiàn)常模的方法：轉(zhuǎn)化表，剖析圖轉(zhuǎn)化表的構(gòu)成要素有：原始分?jǐn)?shù)、相應(yīng)的導(dǎo)出分?jǐn)?shù)、對常模團(tuán)體的具體描述。剖析圖是把一套測驗(yàn)中幾個分測驗(yàn)分?jǐn)?shù)同圖表（圖形）表示出來。 3、幾種常模分?jǐn)?shù) 發(fā)展量表 1）年齡量表——所測量的特質(zhì)隨年齡作有系統(tǒng)的改變 2）年級當(dāng)量商數(shù) 1）智力商數(shù) 2）教育商數(shù) 3）成就商數(shù) 百分等級一個原始分?jǐn)?shù)的百分等級，是指在一個群體的測驗(yàn)分?jǐn)?shù)中，得分低于這個分?jǐn)?shù)的人數(shù)的百分比。百分等級取值越大，說明成績越優(yōu)秀。百分等級分?jǐn)?shù)的計(jì)算（1）未分組分?jǐn)?shù)資料 e.g.成績?yōu)?0分的百分等級為83，就是說比80分低的原始分?jǐn)?shù)占全體得分的83%，比其高的只占17%。（2）分組分?jǐn)?shù)資料四舍五入對百分等級的評價百分等級是一種相對位置量數(shù)，具有可比性，且易于計(jì)算，解釋方便；但它是一種順序量數(shù)，不具有可加性。兩個缺點(diǎn)：①單位不等，尤其在分配的兩個極端； ②只具有順序性，無法說明不同被試之間分?jǐn)?shù)差異的數(shù)量。 *百分等級是相對于特定的被試團(tuán)體而言的，解釋時不能離開特定的參照團(tuán)體。標(biāo)準(zhǔn)分?jǐn)?shù) 標(biāo)準(zhǔn)分?jǐn)?shù)是一種具有相等單位的量數(shù)，又稱作Z分?jǐn)?shù)，以Z表示。標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算公式為：（線性轉(zhuǎn)化）對Z分?jǐn)?shù)的評估 Z分?jǐn)?shù)是以平均數(shù)為參照點(diǎn)，以標(biāo)準(zhǔn)差為單位的等距量表。具有可比性、可加性；由符號與絕對值兩部分構(gòu)成：正負(fù)符號表示原始分?jǐn)?shù)在平均數(shù)之上或之下，絕對值表示原始分?jǐn)?shù)與平均數(shù)的距離。 1）線性轉(zhuǎn)化（如上） 2）常態(tài)化（T分?jǐn)?shù)、標(biāo)準(zhǔn)九、標(biāo)準(zhǔn)十、離差智商）常態(tài)化就是正態(tài)化，是指使用非線性變換，將非正態(tài)分布的分?jǐn)?shù)強(qiáng)制性的扭轉(zhuǎn)成正態(tài)分布。 ①T分?jǐn)?shù)：麥柯爾提出，公式為： T在[0,100]之間。平均數(shù)為50，標(biāo)準(zhǔn)差為10；T分?jǐn)?shù)避免了小數(shù)與負(fù)號。 ②標(biāo)準(zhǔn)九：以0.5個標(biāo)準(zhǔn)差為單位，將正態(tài)曲線下的橫軸分為九段，最高一端為9分，最低一端為1分，中間一段為5分，除兩端外，每段均有半個標(biāo)準(zhǔn)差寬。 ③標(biāo)準(zhǔn)十：卡特爾16PF ④離差智商：韋氏智力測驗(yàn)采用平均數(shù)為100，標(biāo)準(zhǔn)差為15。第八節(jié) 標(biāo)準(zhǔn)參照測驗(yàn) 1. 標(biāo)準(zhǔn)參照測驗(yàn)的含義與作用標(biāo)準(zhǔn)參照測驗(yàn)是根據(jù)某一明確界定的內(nèi)容范圍而縝密編制的測驗(yàn)。當(dāng)一個測驗(yàn)是以某一明確界定的內(nèi)容范圍為基礎(chǔ)編制而成，并且其分?jǐn)?shù)是參考該內(nèi)容范圍所要求的絕對標(biāo)準(zhǔn)進(jìn)行解釋時，稱這一測驗(yàn)為標(biāo)準(zhǔn)參照測驗(yàn)。通過標(biāo)準(zhǔn)參照測驗(yàn)，可以了解個體在所規(guī)定測量內(nèi)容上的行為水平，其出發(fā)點(diǎn)是個體本身的絕對水平。 2. 標(biāo)準(zhǔn)參照測驗(yàn)的題目分析 *測驗(yàn)項(xiàng)目的難度分析：與常模參照測驗(yàn)相同，一般以通過率表示。 *測驗(yàn)項(xiàng)目的區(qū)分度分析： ①當(dāng)采用掌握組-未掌握組的預(yù)測方法時，可以使用鑒別系數(shù)（D） ②當(dāng)采用前測-后測方法，可獲得在前測中錯誤回答某項(xiàng)目而在后測中能夠正確回答的被試人數(shù)比例，此即該項(xiàng)目的個人獲得指數(shù)。 3. 標(biāo)準(zhǔn)參照測驗(yàn)的信度與效度 1）標(biāo)準(zhǔn)參照測驗(yàn)的信度及其估計(jì) ①分類一致性信度——計(jì)算兩次都被分到一類中的被試占總被試人數(shù)的比例。 ②方差分析方法——荷伊特信度 2）標(biāo)準(zhǔn)參照測驗(yàn)的效度及其估計(jì) ①內(nèi)容效度 ②效標(biāo)關(guān)聯(lián)效度 4. 標(biāo)準(zhǔn)參照測驗(yàn)的分?jǐn)?shù)解釋（1）專家判定法 ①Nedelsky法 ②Angoff法（2）效標(biāo)組預(yù)測法 ①臨界組法 ②對照組法詳見講義p256-p258 第九節(jié) 心理測驗(yàn)理論的新發(fā)展一、經(jīng)典測量理論的局限 1. 統(tǒng)計(jì)指標(biāo)依賴于被試樣本；（難度、區(qū)分度、信度、效度） 2. 分?jǐn)?shù)解釋依賴于測驗(yàn)難度；（難度不同，解釋不同） 3. 同一測驗(yàn)相同分?jǐn)?shù)其含義不同；（做對的題目其難度不同） 4. 信度估計(jì)不精確；（沒有更精確的總體估計(jì)） 5. 測驗(yàn)結(jié)果不能概化到非標(biāo)準(zhǔn)化情境；（標(biāo)準(zhǔn)化測驗(yàn)不能推廣） 6. 被試做同樣題目無法照顧個別差異。（被試水平不同，相對難易程度不同）二、項(xiàng)目反應(yīng)理論 1. 基本假設(shè) ①潛在特質(zhì)空間的單維性假設(shè)； ②局部獨(dú)立性假設(shè)；（各項(xiàng)目之間不相關(guān)，不影響） ③正確反應(yīng)概率與特質(zhì)水平間函數(shù)關(guān)系假設(shè)； ④非速度測驗(yàn)假設(shè)。（對時間沒有限制） 2. 項(xiàng)目反應(yīng)的參數(shù)及模型：單參數(shù)、二參數(shù)、三參數(shù) 單參數(shù)：區(qū)分度二參數(shù)：難度、區(qū)分度三參數(shù)：難度、區(qū)分度、猜測率 3. 項(xiàng)目特征曲線及信息函數(shù) 項(xiàng)目特征曲線（教材p292）信息函數(shù)：作為信度的指標(biāo) 4. 項(xiàng)目反應(yīng)理論的應(yīng)用（題目分析、題庫、自適應(yīng)測驗(yàn)）題目分析：可根據(jù)圖形直接判斷——曲線越陡峭，區(qū)分度越高；曲線越往右側(cè)靠，難度越大。自適應(yīng)測驗(yàn)：根據(jù)不同被試的水平給予不同難度的測驗(yàn)；避免天花板、地板效應(yīng)。 5. 項(xiàng)目反應(yīng)理論的優(yōu)點(diǎn)及局限局限：對于現(xiàn)今的測驗(yàn)，單維假設(shè)不成立，二分法記分不適用。三、概化理論概化理論是經(jīng)典測量理論與方差分析結(jié)合的產(chǎn)物，其核心是從特定條件下的測量結(jié)果來推斷更廣泛的條件下可能得到的測量結(jié)果。 1. 基本概念題目、被試、主試等各種影響因素測量目標(biāo)：所要測量的心理特質(zhì)；測量側(cè)面：影響測量過程和結(jié)果的各種內(nèi)在外在因素（每個影響因素都是一個側(cè)面）；測量情境：由測量目標(biāo)和測量側(cè)面構(gòu)成，即測什么和怎么測的結(jié)合。 2. 基本假設(shè) 替代信度可靠性與隨機(jī)平行測驗(yàn)假設(shè) ——用觀察全域中隨機(jī)抽取的一個樣例來推斷全域的可靠性作為信度指標(biāo)。 3. 概化理論的優(yōu)點(diǎn)與局限 ①用隨機(jī)平行測驗(yàn)取代嚴(yán)格平行測驗(yàn)，操作方便； ②用方差分析技術(shù)能全面估計(jì)各種誤差成分的相對大??；（能整合起來） ③在方法和應(yīng)用上都有待完善。四、測驗(yàn)等值 1. 含義：將不同測驗(yàn)版本分?jǐn)?shù)統(tǒng)一在一個量表上的過程；使其具有可比性。 2. 特性：等價性、可逆性、組間一致性 3. 種類：測驗(yàn)分?jǐn)?shù)等值、項(xiàng)目參數(shù)等值、橫向等值、縱向等值（難度、區(qū)分度）（測驗(yàn)間）（時間） 4. 方法： ①平均數(shù)等值：A測驗(yàn)平均分80與B測驗(yàn)平均分70等值 ②百分位等值：A測驗(yàn)80分為75百分等級，B測驗(yàn)70分為75百分等級，80與70等值 ③線性等值：用標(biāo)準(zhǔn)差計(jì)算—代數(shù)公式<用平均數(shù)、標(biāo)準(zhǔn)差計(jì)算> ④項(xiàng)目反應(yīng)理論等值：參數(shù)等值 5. 設(shè)計(jì)： ①單組設(shè)計(jì)—兩個測驗(yàn)對同一組人測試 ②等組設(shè)計(jì)—隨機(jī)抽取兩個組，假設(shè)為等組 ③等組交叉設(shè)計(jì)—前兩種方法結(jié)合，一組先A卷后B卷，另一組先B卷后A卷 ④共同被試設(shè)計(jì)—有一部分共同的人做中介，既參加A卷又參加B卷 ⑤鉚測驗(yàn)設(shè)計(jì)—用共同的題目作為鉚來進(jìn)行測驗(yàn) ⑥混合設(shè)計(jì)—以上設(shè)計(jì)混合

下載提示(請認(rèn)真閱讀)

1.請仔細(xì)閱讀文檔，確保文檔完整性，對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
2.下載的文檔，不會出現(xiàn)我們的網(wǎng)址水印。
3、該文檔所得收入（下載+內(nèi)容+預(yù)覽）歸上傳者、原創(chuàng)作者；如果您是本文檔原作者，請點(diǎn)此認(rèn)領(lǐng)！既往收益都?xì)w您。

同意并開始全文預(yù)覽

文檔包含非法信息？點(diǎn)此舉報后獲取現(xiàn)金獎勵！

文檔加載中……請稍候！
如果長時間未打開，您也可以點(diǎn)擊刷新試試。

下載文檔到電腦，查找使用更方便

32 積分

還剩頁未讀，繼續(xù)閱讀

舉報

版權(quán)申訴 word格式文檔無特別注明外均可編輯修改；預(yù)覽文檔經(jīng)過壓縮，下載后原文更清晰！ 立即下載

配套講稿：: 如PPT文件的首頁顯示word圖標(biāo)，表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
特殊限制：: 部分文檔作品中含有的國旗、國徽等圖片，僅作為作品整體效果示例展示，禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
關(guān) 鍵詞：: 心理測量學(xué) 筆記備考北師大

溫馨提示:
1: 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

裝配圖網(wǎng)所有資源均是用戶自行上傳分享，僅供網(wǎng)友學(xué)習(xí)交流，未經(jīng)上傳用戶書面授權(quán)，請勿作他用。

關(guān)于本文

本文標(biāo)題：心理測量學(xué)筆記——備考北師大.doc
鏈接地址：http://www.820124.com/p-1573759.html

相關(guān)資源更多

正為您匹配相似的精品文檔

相關(guān)搜索

心理測量學(xué) 筆記備考 北師大

關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

備案號:蜀ICP備2024067431號-1 川公網(wǎng)安備51140202000466號

本站為文檔C2C交易模式，即用戶上傳的文檔直接被用戶下載，本站只是中間服務(wù)平臺，本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私，請立即通知裝配圖網(wǎng)，我們立即給予刪除！

影音先锋男人资源在线观看,精品国产日韩亚洲一区91,中文字幕日韩国产,2018av男人天堂,青青伊人精品,久久久久久久综合日本亚洲,国产日韩欧美一区二区三区在线

心理測量學(xué)筆記——備考北師大.doc

最新文檔