心理測(cè)量學(xué)筆記——備考北師大.doc
《心理測(cè)量學(xué)筆記——備考北師大.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《心理測(cè)量學(xué)筆記——備考北師大.doc(36頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
心理測(cè)量學(xué) 第一章 心理測(cè)量的理論基礎(chǔ) 第一節(jié) 心理測(cè)量的理論基礎(chǔ) 1. 心理測(cè)量的基本概念 (1) 心理測(cè)量的定義 依據(jù)一定的法則,用數(shù)字對(duì)人的行為加以確定。 測(cè)量就是依據(jù)一定的法則,使用工具對(duì)事物的特征進(jìn)行定量描述的過程。 (2) 測(cè)量的基本要素 參照點(diǎn):在測(cè)量工作中,必須有一個(gè)量的起點(diǎn),這個(gè)起點(diǎn)就叫做測(cè)量的參照點(diǎn)。兩種:絕對(duì)參照點(diǎn),即以絕對(duì)的零點(diǎn)作為測(cè)量的參照點(diǎn)。劃分“有無”的界限。 相對(duì)參照點(diǎn),即以認(rèn)為確定的零點(diǎn)為測(cè)量的起點(diǎn)。人為主觀規(guī)定的標(biāo)準(zhǔn)。 注:心理測(cè)量一般為相對(duì)零點(diǎn);物理測(cè)量一般為絕對(duì)零點(diǎn)。物理測(cè)量也有相對(duì)零點(diǎn)的情況,如溫度、時(shí)間、海拔等。 單位:應(yīng)具備兩個(gè)條件:有確定的意義;有相等的價(jià)值。(一般以標(biāo)準(zhǔn)差為單位) (3) 測(cè)量的量表 命名量表:最低水平的測(cè)量量表,只是用數(shù)字代表事物或用數(shù)字對(duì)事物進(jìn)行分類。名稱量表:用數(shù)字指代個(gè)別事物。 類別量表:用數(shù)字指代事物的種類。 統(tǒng)計(jì)方法:百分比、次數(shù)、眾數(shù)、X2檢驗(yàn)。 順序量表:次低水平的測(cè)量量表,不僅能夠指代事物類別,而且能夠表明不同事物類別的大小、等級(jí)或事物具有某種特征的程度。既沒有相等的單位,也沒有絕對(duì)的零點(diǎn)。不能進(jìn)行代數(shù)運(yùn)算。心理測(cè)量量表一般是在順序量表上進(jìn)行的。 統(tǒng)計(jì)方法:中位數(shù)、百分位數(shù)、等級(jí)相關(guān)系數(shù)、肯德爾和諧系數(shù)。 等距量表:較高水平的測(cè)量量表,不僅能夠指代事物的類別、等級(jí),而且具有相等的單位,可以進(jìn)行加減運(yùn)算。沒有絕對(duì)的零點(diǎn),是假定的相對(duì)零點(diǎn)。 統(tǒng)計(jì)方法:平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)系數(shù)、t檢驗(yàn)、f檢驗(yàn)。 比率量表:最高水平的測(cè)量量表,不僅可以知道測(cè)量對(duì)象之間的相差程度,而且可以知道它們之間的比例。除了具有類別、等級(jí)、等距的特征外,還具有絕對(duì)的零點(diǎn),可以進(jìn)行加減乘除運(yùn)算。 統(tǒng)計(jì)方法:平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)系數(shù)、t檢驗(yàn)、f檢驗(yàn)、幾何平均數(shù)、變異系數(shù)。 2. 心理測(cè)量的特征與分類 (1)心理測(cè)量的特征 間接性:只能通過一個(gè)人對(duì)測(cè)驗(yàn)項(xiàng)目的反應(yīng)來推論出他的心理特質(zhì)。 相對(duì)性:測(cè)量就是看每個(gè)人處在這個(gè)序列的什么位置上,由此測(cè)得一個(gè)人智力的高低、興趣的大小等,都是與所在團(tuán)體的大多數(shù)人的行為或某種人為確定的標(biāo)準(zhǔn)相比較而言的。 客觀性:是對(duì)一切測(cè)量的基本要求,實(shí)際上就是測(cè)量的標(biāo)準(zhǔn)化問題。 (2)心理測(cè)驗(yàn)的分類 按功能(測(cè)量對(duì)象)分:能力測(cè)驗(yàn)、成就測(cè)驗(yàn)(學(xué)績(jī)測(cè)驗(yàn))、人格測(cè)驗(yàn) 按對(duì)象分:個(gè)別測(cè)驗(yàn)、團(tuán)體測(cè)驗(yàn) 按形式分:紙筆測(cè)驗(yàn)、操作測(cè)驗(yàn)、口頭測(cè)驗(yàn)、電腦測(cè)驗(yàn) 按目的分:描述性測(cè)驗(yàn)(調(diào)查性測(cè)驗(yàn))、診斷性測(cè)驗(yàn)、預(yù)示性測(cè)驗(yàn) 按要求分:最高作為測(cè)驗(yàn)、典型作為測(cè)驗(yàn) 按速度和難度分:速度測(cè)驗(yàn)、難度測(cè)驗(yàn) 按性質(zhì)分:構(gòu)造性測(cè)驗(yàn)、投射性測(cè)驗(yàn) 按解釋分:常模參照測(cè)驗(yàn)、標(biāo)準(zhǔn)參照測(cè)驗(yàn) 按應(yīng)用分:教育測(cè)驗(yàn)、職業(yè)測(cè)驗(yàn)、臨床測(cè)驗(yàn) 補(bǔ)充: 1)能力測(cè)驗(yàn):能力可分為實(shí)際能力和潛在能力。實(shí)際能力指?jìng)€(gè)人當(dāng)前“所能為者”,代表個(gè)人已有的知識(shí)經(jīng)驗(yàn)與技能。潛在能力指?jìng)€(gè)人將來“可能為者”,是可能達(dá)到的水平。測(cè)量潛在能力的測(cè)驗(yàn)稱為能力傾向測(cè)驗(yàn)。能力測(cè)驗(yàn)又可以分為普通能力測(cè)驗(yàn)(通常說的智力)和特殊能力測(cè)驗(yàn)(音樂、美術(shù)、體育等特殊方面)。 2)紙筆測(cè)驗(yàn)(文字、圖形材料);操作測(cè)驗(yàn)(不宜團(tuán)體實(shí)施) 3)速度測(cè)驗(yàn)——測(cè)反應(yīng)速度;難度測(cè)驗(yàn)——測(cè)最高能力。 4) 最高作為測(cè)驗(yàn):有正確答案,分?jǐn)?shù)越高越好;(能力測(cè)驗(yàn)、成就測(cè)驗(yàn)) 典型作為測(cè)驗(yàn):沒有正確答案,通常的習(xí)慣方式;(人格測(cè)驗(yàn)) 5) 構(gòu)造性測(cè)驗(yàn):刺激和被試的任務(wù)是明確的 投射性測(cè)驗(yàn):刺激、問題模糊,被試任務(wù)不明確;能投射出更真實(shí)的結(jié)果 3. 經(jīng)典測(cè)量理論及其模型 (1) 心理特質(zhì):表現(xiàn)在一個(gè)人身上所特有的相對(duì)穩(wěn)定的行為方式。 ①特質(zhì)是一組具有內(nèi)部相關(guān)的行為的概括,具有一定的抽象性。 ②特質(zhì)是“一種一般的神經(jīng)心理系統(tǒng),可以綜合不同刺激,使人對(duì)這些刺激做出相同反應(yīng)”。 ③特質(zhì)是一個(gè)人身上比較穩(wěn)定的特點(diǎn)。 ④一個(gè)人的精神面貌是由多種特質(zhì)分多個(gè)層次有機(jī)組合而成的。 ⑤特質(zhì)可以決定一個(gè)人對(duì)特定刺激的反應(yīng)傾向,可以對(duì)人的行為進(jìn)行預(yù)測(cè)。 (2) 經(jīng)典測(cè)量理論(CTT)的模型 ①觀察分?jǐn)?shù):實(shí)測(cè)分?jǐn)?shù),記作X。 ②真分?jǐn)?shù):反映被試某種心理特質(zhì)真正水平的數(shù)值。操作定義:多次測(cè)量結(jié)果得到的平均數(shù),記作T。(理論上構(gòu)想出來的抽象概念) ③誤差分?jǐn)?shù):這里只是指測(cè)量產(chǎn)生的隨機(jī)誤差,記作E。(E是個(gè)服從均值為0的正態(tài)分布的隨機(jī)變量) ④X=T+E 這就是CTT的數(shù)學(xué)模型。(引申3個(gè)假設(shè)公理) ⑤觀察分?jǐn)?shù)的變異等于真分?jǐn)?shù)的變異與誤差分?jǐn)?shù)的變異之和。 (3) 基本假設(shè) ①觀察分?jǐn)?shù)的平均值接近于真分?jǐn)?shù)。即ε(X)=T或者ε(E)=0 ②真分?jǐn)?shù)與誤差分?jǐn)?shù)的相關(guān)為零。即ρ(T,E)=0 ③各平行測(cè)驗(yàn)的誤差分?jǐn)?shù)的相關(guān)為零。即ρ(E1,E2)=0 平行測(cè)驗(yàn):如果兩個(gè)題目不同的測(cè)驗(yàn)測(cè)的是同一特質(zhì),并且題目形式、數(shù)量、難度、區(qū)分度以及測(cè)查等值團(tuán)體后所得分?jǐn)?shù)的分布(均值和標(biāo)準(zhǔn)差)都是一致的,則這兩個(gè)測(cè)驗(yàn)被稱作是彼此平行的測(cè)驗(yàn)。 第二節(jié) 測(cè)量的信度與效度 1. 測(cè)驗(yàn)的信度——受隨機(jī)誤差的影響 (1) 信度……一致性、穩(wěn)定性 信度是測(cè)量結(jié)果的可靠性,等于一組測(cè)量分?jǐn)?shù)中真分?jǐn)?shù)的變異與總變異之比。 信度指的是測(cè)量結(jié)果的穩(wěn)定性程度;若能用同一測(cè)量工具反復(fù)測(cè)量某人的同一種心理特質(zhì),則其多次測(cè)量結(jié)果間的一致性程度就叫信度。 定義1:信度乃是一個(gè)被測(cè)團(tuán)體的真分?jǐn)?shù)的變異數(shù)與實(shí)得分?jǐn)?shù)的變異數(shù)之比。 定義2:信度乃是一個(gè)被試團(tuán)體的真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平方。 定義3:信度乃是一個(gè)測(cè)驗(yàn)X(A卷)與它的任意一個(gè)平行測(cè)驗(yàn)X’(B卷)的相關(guān)系數(shù)。 信度的作用: ①信度是測(cè)量過程中所存在的隨機(jī)誤差大小的反映。 ②信度可以用來解釋個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的意義。測(cè)量的標(biāo)準(zhǔn)誤計(jì)算公式 ③信度可以幫助進(jìn)行不同測(cè)驗(yàn)分?jǐn)?shù)的比較。 (2) 信度的估計(jì)方法 ① 重測(cè)信度:用同一個(gè)測(cè)驗(yàn),對(duì)同一組被試前后兩次施測(cè),兩次測(cè)驗(yàn)分?jǐn)?shù)所得的相關(guān)系數(shù)為再測(cè)信度?!锲栠d積差相關(guān)系數(shù) 注:重測(cè)信度具有跨時(shí)間上的穩(wěn)定性。 使用的前提條件: 1) 所測(cè)量的心理特性必須是穩(wěn)定的。 2) 遺忘和練習(xí)的效果基本上相互抵消。(適度的時(shí)間間隔,幾分鐘、幾小時(shí)甚至幾年) 3) 在兩次施測(cè)間隔期內(nèi),被試沒有獲得更多的學(xué)習(xí)和訓(xùn)練。 ② 復(fù)本信度:根據(jù)一組被試在兩個(gè)平行(等值)測(cè)驗(yàn)上的得分計(jì)算的相關(guān)系數(shù)即為復(fù)本信度?!锲栠d積差相關(guān)系數(shù) 注:1) 同時(shí)連續(xù)施測(cè)——等值性系數(shù) 相距一段時(shí)間分兩次施測(cè)——穩(wěn)定性與等值性系數(shù) (此種復(fù)本信度最?。? 2)穩(wěn)定性與等值性系數(shù)是對(duì)信度最嚴(yán)格的檢驗(yàn),其值最低。 3)為抵消順序效應(yīng),可以一半被試A卷 B卷,另一半被試B卷 A卷 使用的前提條件: 1) 要構(gòu)造出兩份或兩份以上真正平行的測(cè)驗(yàn)(即A、B卷)。 真正平行:復(fù)本測(cè)驗(yàn)之間必須在題目?jī)?nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語、時(shí)限以及所用的例題、公式和測(cè)驗(yàn)等其他方面都相同或相似。 2) 被試要有條件接受兩個(gè)測(cè)驗(yàn)。 ③ 分半信度:按正常的程序?qū)嵤y(cè)驗(yàn),然后將全部項(xiàng)目分為相等的兩半,根據(jù)個(gè)人在這兩半測(cè)驗(yàn)的分?jǐn)?shù)計(jì)算其相關(guān)系數(shù)。有時(shí)也被稱作內(nèi)部一致性系數(shù)。 ★斯皮爾曼—布朗公式 等價(jià):弗朗那根公式、盧侖公式 注:一般使用奇偶分半法;相關(guān)系數(shù)需要校正。 使用的前提條件: 1)分半信度通常是在只能施測(cè)一次或沒有復(fù)本的情況下使用。 2)分半方法很多(如按題號(hào)的奇偶性分半、按題目的難度分半、按題目的內(nèi)容分半等),同一個(gè)測(cè)驗(yàn)通常會(huì)有多個(gè)分半信度值。 ④同質(zhì)性信度:也稱內(nèi)部一致性系數(shù),指的是測(cè)驗(yàn)內(nèi)部所有題目間的一致性程度。 *一致性:測(cè)的是同一種心理特質(zhì);所有題目得分之間都具有較高的正相關(guān)。 *當(dāng)一個(gè)測(cè)驗(yàn)具有較高的同質(zhì)性信度時(shí),說明測(cè)驗(yàn)主要測(cè)的是某一單個(gè)心理特質(zhì),實(shí)測(cè)結(jié)果就是該特質(zhì)水平的反映;若同質(zhì)性信度不高,說明測(cè)驗(yàn)結(jié)果可能是幾種心理特質(zhì)的綜合反映。*測(cè)量單一特性是同質(zhì)性高的必要而非充分條件,同質(zhì)性高是測(cè)得單一特質(zhì)的充分條件。 ★庫德—理查遜信度系數(shù) 克龍巴赫a系數(shù) 1)KR20公式——適用于(0、1)記分的測(cè)驗(yàn)【客觀試題】 2)KR21公式——適用于(0、1)記分的測(cè)驗(yàn)【客觀試題】 3)克龍巴赫a系數(shù)——適用于(0、1)記分的測(cè)驗(yàn)【客觀試題】和【主觀試題】 *KR20、KR21只是a的特例 4)荷伊特信度——用方差分析的方法來計(jì)算信度 ⑤評(píng)分者信度:隨機(jī)抽取部分試卷,由兩個(gè)或多個(gè)評(píng)分者獨(dú)立按評(píng)分標(biāo)準(zhǔn)打分,然后求其間的相關(guān)。 當(dāng)評(píng)分者人數(shù)為2時(shí)——★積差相關(guān)系數(shù)、等級(jí)相關(guān)系數(shù) 當(dāng)評(píng)分者人數(shù)多于2時(shí)——★肯德爾和諧系數(shù) (3) 信度的影響因素 1、 被試方面 就單個(gè)被試而言,被試的身心健康狀況、應(yīng)試動(dòng)機(jī)、注意力、耐心、求勝心、作答態(tài)度(猜測(cè))等會(huì)影響測(cè)量誤差。 就被試團(tuán)體而言,整個(gè)團(tuán)體內(nèi)部水平的離散程度以及團(tuán)體的平均水平都會(huì)影響測(cè)量信度。 2、 主試者方面 就施測(cè)者而言,若不按指導(dǎo)手冊(cè)中的規(guī)定施測(cè),或故意制造緊張氣氛,或給以暗示、協(xié)助等,則測(cè)量信度會(huì)大大降低。 就評(píng)分者而言,若評(píng)分標(biāo)準(zhǔn)掌握不一,或前緊后松,甚至隨心所欲,則也會(huì)降低測(cè)量信度。 3、 施測(cè)情境方面 考場(chǎng)是否安靜、光線和通風(fēng)情況是否良好、所需設(shè)備是否齊全、桌面是否合乎要求、空間闊窄是否恰當(dāng)?shù)榷伎赡苡绊憸y(cè)量信度。 4、 測(cè)量工具方面 測(cè)量工具是否性能穩(wěn)定是測(cè)量工作成敗的關(guān)鍵。一般的,試題的取樣、試題之間的同質(zhì)性程度、試題的難度等都是影響測(cè)驗(yàn)穩(wěn)定性的主要因素。 5、 兩次施測(cè)的間隔時(shí)間 計(jì)算重測(cè)信度和穩(wěn)定性與等值性系數(shù)時(shí),兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度值越大;間隔時(shí)間越長,信度值就可能越小。 ★ 斯皮爾曼—布朗公式(計(jì)算測(cè)驗(yàn)項(xiàng)目數(shù)量變化對(duì)信度的影響) (4) 信度的改進(jìn)方法 1)適當(dāng)增加測(cè)驗(yàn)的長度。(測(cè)驗(yàn)越長信度越高) 【新增項(xiàng)目必須與試卷中原有項(xiàng)目同質(zhì);新增項(xiàng)目的數(shù)量必須適度】 2)使測(cè)驗(yàn)中所有試題的難度接近正態(tài)分布,并控制在中等水平。 3)努力提高測(cè)驗(yàn)試題的區(qū)分度。 4)選取恰當(dāng)?shù)谋辉噲F(tuán)體,提高測(cè)驗(yàn)在各同質(zhì)性較強(qiáng)的亞團(tuán)體上的信度。 5)主試者嚴(yán)格執(zhí)行施測(cè)規(guī)程,評(píng)分者嚴(yán)格按標(biāo)準(zhǔn)給分,實(shí)測(cè)場(chǎng)地按測(cè)驗(yàn)手冊(cè)的要求進(jìn)行布置,減少無關(guān)因素的干擾。 6)間隔時(shí)間要適當(dāng)。 2. 測(cè)驗(yàn)的效度——受隨機(jī)誤差、系統(tǒng)誤差的影響 (1) 效度的含義……有效性、準(zhǔn)確性 效度是指一個(gè)測(cè)驗(yàn)或量表實(shí)際能測(cè)出其所要測(cè)的心理特質(zhì)的程度,等于一組測(cè)量分?jǐn)?shù)中與測(cè)量目的有關(guān)的變異與實(shí)得變異之比。 注:1)效度是一個(gè)相對(duì)的概念(相對(duì)于測(cè)量目的而言;只能通過行為進(jìn)行推測(cè))。 2)效度是測(cè)量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。 3)判斷測(cè)量是否有效要從多方面搜集證據(jù)。 (2) 效度的估計(jì)方法 ① 內(nèi)容效度:指項(xiàng)目對(duì)欲測(cè)的內(nèi)容或行為范圍取樣的適當(dāng)程度。指一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到的內(nèi)容與所要測(cè)量的內(nèi)容之間的吻合程度,它通常包括欲測(cè)的知識(shí)范圍,以及該范圍內(nèi)各知識(shí)點(diǎn)所要求掌握的程度?!緝?nèi)容范圍;題目代表性】 注:內(nèi)容效度應(yīng)用于成就測(cè)驗(yàn)和職業(yè)測(cè)驗(yàn);不適合用于能力傾向測(cè)驗(yàn)和人格測(cè)驗(yàn)。 ★ 表面效度不能算是一種效度。 內(nèi)容效度的確定方法 a.專家判斷法(邏輯分析法)——題量適當(dāng)、題目的代表性、題目覆蓋范圍廣 b.復(fù)本法(統(tǒng)計(jì)分析方法)——平行測(cè)驗(yàn)的復(fù)本信度 <若相關(guān)低則兩個(gè)測(cè)驗(yàn)中至少有一個(gè)缺乏內(nèi)容效度;若相關(guān)高則測(cè)驗(yàn)可能有較高的內(nèi)容效度> c.再測(cè)法——前測(cè)、后測(cè) d.經(jīng)驗(yàn)法 ② 效標(biāo)效度:考察測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)的關(guān)系,看測(cè)驗(yàn)對(duì)我們感興趣的行為預(yù)測(cè)的如何。效標(biāo)效度(效標(biāo)關(guān)聯(lián)效度)也叫實(shí)證效度,是指一個(gè)測(cè)驗(yàn)對(duì)處于特定情境中的個(gè)體的行為進(jìn)行估計(jì)的有效性。也就是說,一個(gè)測(cè)驗(yàn)是否有效,應(yīng)該以實(shí)踐的效果來作為檢驗(yàn)標(biāo)準(zhǔn)。 *效標(biāo)效度可以分為同時(shí)效度(用于診斷現(xiàn)狀) 預(yù)測(cè)效度(用于預(yù)測(cè)某個(gè)個(gè)體將來的行為) 效標(biāo)——存在于測(cè)量之外;可以獨(dú)立進(jìn)行測(cè)量;能夠量化。 1) 被估計(jì)的行為是檢驗(yàn)測(cè)驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱為效標(biāo)。效標(biāo)就是衡量一個(gè)測(cè)驗(yàn)是否有效的外在標(biāo)準(zhǔn),它是獨(dú)立于測(cè)驗(yàn)并可以從實(shí)踐中直接獲得我們所感興趣的行為(觀念效標(biāo))。觀念效標(biāo)具有多樣性、復(fù)雜性、特殊性和時(shí)間性。 2) 常用效標(biāo)有學(xué)業(yè)成就、等級(jí)評(píng)定、臨床診斷、專門的訓(xùn)練成績(jī)、實(shí)際工作表現(xiàn)等。例如:考察“高考”的效度,用“大學(xué)學(xué)習(xí)成績(jī)”作為效標(biāo)。 效標(biāo)效度的確定方法 a.相關(guān)法——計(jì)算測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)系數(shù) 【積差相關(guān)法、等級(jí)相關(guān)法、二列相關(guān)法、四分相關(guān)法】 b.區(qū)分法(分組法)——能夠把好壞兩組人有效地區(qū)分開來 ——差異越大,說明測(cè)驗(yàn)越有效 思路:被試接受測(cè)驗(yàn)后,讓他們工作一段時(shí)間,再根據(jù)工作成績(jī)(效標(biāo)測(cè)量)的好壞分為兩組,回過來分析這兩組被試原先接受測(cè)驗(yàn)的分?jǐn)?shù)差異。 c.命中率——用于選拔性測(cè)驗(yàn),影響因素:錄取率、基礎(chǔ)率 ——正命中率的比率越高,測(cè)驗(yàn)越有效 總命中率:根據(jù)測(cè)驗(yàn)選出的人當(dāng)中工作合格的人數(shù),以及根據(jù)測(cè)驗(yàn)淘汰的人當(dāng)中工作不合格的人數(shù)之和與總?cè)藬?shù)之比。 正命中率:用測(cè)驗(yàn)選出的人中合格者所占的比例。 d.預(yù)期表法 e.功利率法 ③ 構(gòu)想效度:指測(cè)驗(yàn)對(duì)理論上的構(gòu)想或特質(zhì)的測(cè)量程度。又稱結(jié)構(gòu)效度,是指一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到所要測(cè)量的理論結(jié)構(gòu)和特質(zhì)的程度,或者說它是指測(cè)驗(yàn)分?jǐn)?shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。 構(gòu)想或結(jié)構(gòu)指心理學(xué)理論所涉及到的抽象而屬假設(shè)性的概念或特質(zhì),如智力、焦慮、動(dòng)機(jī)等。 注:構(gòu)想效度主要用于智力測(cè)驗(yàn)和人格測(cè)驗(yàn)。 構(gòu)想效度的確定方法 a.測(cè)驗(yàn)內(nèi)法(測(cè)驗(yàn)內(nèi)部尋找證據(jù)法) 確定測(cè)驗(yàn)的內(nèi)容效度——內(nèi)容效度高實(shí)質(zhì)上也就說明結(jié)構(gòu)效度高 分析被試對(duì)項(xiàng)目做反應(yīng)的答題過程 考察測(cè)驗(yàn)的同質(zhì)性信度——測(cè)驗(yàn)同質(zhì)只是必要條件 b.測(cè)驗(yàn)間法(測(cè)驗(yàn)之間尋找證據(jù)法) 相容效度—考察新編測(cè)驗(yàn)與某個(gè)已知的能有效測(cè)量相同特質(zhì)的舊測(cè)驗(yàn)間的相關(guān) 區(qū)分效度—考察新編測(cè)驗(yàn)與某個(gè)已知的能有效測(cè)量不同特質(zhì)的舊測(cè)驗(yàn)間的相關(guān) 因素效度(因素分析)—對(duì)一組測(cè)驗(yàn)進(jìn)行因素分析,找出影響測(cè)驗(yàn)的共同因素 補(bǔ)充: 1)相容效度與區(qū)分效度 必要非充分條件 相容效度:和測(cè)量相同特質(zhì)的舊測(cè)驗(yàn)有高相關(guān) 區(qū)分效度:和測(cè)量不同特質(zhì)的舊測(cè)驗(yàn)有低相關(guān) 2)因素分析:每個(gè)測(cè)驗(yàn)在共同因素上的負(fù)荷量(即測(cè)驗(yàn)與各因素的相關(guān))就是測(cè)驗(yàn)的因素效度。 c.效標(biāo)關(guān)聯(lián)法(實(shí)證效度法) 兩種:①根據(jù)效標(biāo)把人分成兩類,考察其得分的差異 ②根據(jù)測(cè)驗(yàn)得分把人分成高分組、低分組,考察兩組人在所測(cè)特質(zhì)方面是否確有差異。 d.多種特質(zhì)—多種方法矩陣法——相容效度和區(qū)分效度的綜合運(yùn)用 原理:用多種極不相同的方法測(cè)量同一種特質(zhì)相關(guān)很高(用極為相似的方法測(cè)量不同特質(zhì)相關(guān)很低),說明測(cè)量效度較高。 e.實(shí)驗(yàn)操作法 (3) 效度的影響因素【只要影響信度就一定影響效度】 測(cè)驗(yàn)本身:項(xiàng)目質(zhì)量;項(xiàng)目數(shù)量 測(cè)驗(yàn)的實(shí)施 被試:身心狀態(tài);樣本特點(diǎn) 主試因素 所用效標(biāo) *凡是與測(cè)量目的無關(guān)的、穩(wěn)定的和不穩(wěn)定的變異來源都會(huì)影響測(cè)量的效度。 ①測(cè)驗(yàn)的構(gòu)成 當(dāng)試題樣本沒有較好的代表欲測(cè)內(nèi)容或結(jié)構(gòu)時(shí),或題目語意不清、指導(dǎo)語不明、題目太難或太易、題目太少或安排不當(dāng)時(shí),都會(huì)降低測(cè)量效度。 &測(cè)驗(yàn)長度與效度的公式 ②測(cè)驗(yàn)的實(shí)施過程 在測(cè)驗(yàn)實(shí)施過程中,如不遵從指導(dǎo)語的要求,或出現(xiàn)意外干擾,或評(píng)分、計(jì)分出現(xiàn)差錯(cuò)等,都會(huì)降低測(cè)量效度。 ③接受測(cè)驗(yàn)的被試 就單個(gè)被試而言,被試的應(yīng)試動(dòng)機(jī)、情緒、態(tài)度、身體狀態(tài)等,都會(huì)造成較大的隨機(jī)誤差,進(jìn)而影響測(cè)量效度。 就被試團(tuán)體而言,如果缺乏必要的同質(zhì)性(年齡、性別、文化程度、職業(yè)等),則很可能會(huì)得到不恰當(dāng)?shù)男Ф荣Y料。 ④ 所選效標(biāo)的性質(zhì) 由于同一個(gè)測(cè)驗(yàn)可以有不同的效標(biāo),同一個(gè)觀念效標(biāo)也可以有不同的效標(biāo)測(cè)量,因此在評(píng)價(jià)測(cè)量效度時(shí),所選效標(biāo)的性質(zhì)是很重要的考慮因素。 【在考慮效標(biāo)與分?jǐn)?shù)的相關(guān)時(shí),必須注意:測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)之間是否符合線性關(guān)系】 ⑤測(cè)量的信度 (4) 效度的改進(jìn)方法 ①通過標(biāo)準(zhǔn)化全面減少各種測(cè)量誤差。 ②精心編制測(cè)驗(yàn)量表,避免出現(xiàn)較大的系統(tǒng)誤差。 ③妥善組織測(cè)驗(yàn),控制隨機(jī)誤差。 ④創(chuàng)設(shè)標(biāo)準(zhǔn)的應(yīng)試情境,讓每個(gè)被試都能發(fā)揮正常的水平。 ⑤選好正確的效標(biāo),定好恰當(dāng)?shù)男?biāo)測(cè)量,正確地使用有關(guān)公式。 (5) 信度與效度的關(guān)系 ①信度高是效度高的必要非充分條件。一個(gè)測(cè)驗(yàn)效度高,其信度也必然高;但一個(gè)測(cè)驗(yàn)信度高,其效度不一定高。 ②測(cè)驗(yàn)的效度受它的信度制約。 <信度系數(shù)的平方根是效度系數(shù)的最高限度,效度永遠(yuǎn)小于信度> ③效度等于測(cè)驗(yàn)信度系數(shù)與效標(biāo)信度系數(shù)乘積的開方。 統(tǒng)計(jì)推導(dǎo)公式 第三節(jié) 心理測(cè)量的誤差 1. 誤差的種類與控制 (1) 隨機(jī)誤差的來源及控制:測(cè)驗(yàn)本身、施測(cè)情境、主試因素、被試因素 (2) 系統(tǒng)誤差的來源及控制:測(cè)驗(yàn)本身、主試因素、被試因素 控制:標(biāo)準(zhǔn)化施測(cè)、嚴(yán)格控制測(cè)驗(yàn)條件、取樣要有代表性 2. 測(cè)量誤差的估計(jì) 測(cè)量的標(biāo)準(zhǔn)誤 差異的標(biāo)準(zhǔn)誤 *誤差分?jǐn)?shù)分布的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。 1) 測(cè)量誤差的定義 測(cè)量誤差是指在測(cè)量過程中由那些與測(cè)量目的無關(guān)的變化因素所產(chǎn)生的一種不準(zhǔn)確或不一致的測(cè)量效應(yīng)。它的含義包括:①測(cè)量誤差是由那些與測(cè)量目的無關(guān)的變因所致;②測(cè)量誤差表現(xiàn)為不準(zhǔn)確或不一致兩種方式。 心理測(cè)量的誤差可分為兩類:隨機(jī)誤差和系統(tǒng)誤差。 隨機(jī)誤差是由與測(cè)量目的無關(guān)的、偶然因素引起的,而又不易控制的誤差。它使多次測(cè)量產(chǎn)生不一致的結(jié)果,其方向和大小的變化完全是隨機(jī)的,只符合某種統(tǒng)計(jì)學(xué)規(guī)律。 系統(tǒng)誤差是由與測(cè)量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng)。這種誤差穩(wěn)定的存在于每一次測(cè)量中,盡管多次測(cè)量結(jié)果非常一致,但實(shí)測(cè)結(jié)果仍與真實(shí)數(shù)字有所差異。 系統(tǒng)誤差:按規(guī)律變動(dòng),成比例 恒定誤差:固定數(shù)值不變 *系統(tǒng)誤差只影響準(zhǔn)確性,不影響穩(wěn)定性;隨機(jī)誤差既影響穩(wěn)定性又影響準(zhǔn)確性。 2) 測(cè)量誤差的來源及控制 心理測(cè)量的誤差主要來自三個(gè)方面,即測(cè)量工具、測(cè)量對(duì)象和施測(cè)過程。 在測(cè)量工具方面,心理測(cè)量與物理測(cè)量有所不同。心理測(cè)量工具通常是以一套測(cè)驗(yàn)(問卷)為核心的刺激反應(yīng)系統(tǒng)(通常稱作量表)。當(dāng)量表在測(cè)查人的某種心理特質(zhì)時(shí),若項(xiàng)目所測(cè)的東西與我們欲測(cè)的目的之間出現(xiàn)偏差,則測(cè)量會(huì)出現(xiàn)誤差。測(cè)量工具信度不好、效度不高是造成誤差的兩種主要原因。 在測(cè)量對(duì)象方面,造成測(cè)量誤差的主要原因是受測(cè)者真正水平是否得到正常發(fā)揮。一般的,受測(cè)者的某種心理特質(zhì)水平是相對(duì)穩(wěn)定的,但是他在接受測(cè)量時(shí)的生理和心理狀態(tài)會(huì)影響其水平的正常發(fā)揮。此外,受測(cè)者應(yīng)試動(dòng)機(jī)的強(qiáng)弱、受訓(xùn)時(shí)間的長短、受訓(xùn)內(nèi)容的多少、答題反應(yīng)的快慢等都會(huì)產(chǎn)生測(cè)量誤差。 在施測(cè)過程方面,產(chǎn)生測(cè)量誤差的原因主要是一些偶然因素,包括施測(cè)物理環(huán)境,主試的某些屬性,評(píng)分記分環(huán)節(jié)出現(xiàn)的疏漏,以及意外干擾等。 知道了誤差的來源,就可以根據(jù)來源的不同,采取針對(duì)性的措施減少誤差。 3) 測(cè)量誤差的估計(jì) 經(jīng)典測(cè)量理論假定:X=T+E,X為實(shí)得分?jǐn)?shù)或觀測(cè)分?jǐn)?shù),T為假設(shè)的真分?jǐn)?shù)(一種測(cè)量工具在測(cè)量沒有誤差時(shí)得到的純正值,其操作定義是:無數(shù)次測(cè)量所得結(jié)果的平均值),E為測(cè)量誤差。 其他關(guān)于誤差的假設(shè): ①如果對(duì)一個(gè)人測(cè)量無數(shù)次,其誤差之和為0,平均誤差為0,即E=0。 ②誤差與真分?jǐn)?shù)相互獨(dú)立;其中的誤差是指隨機(jī)誤差,只與偶然因素有關(guān),而與真分?jǐn)?shù)大小無關(guān),即真分?jǐn)?shù)與誤差分?jǐn)?shù)的相關(guān)系數(shù)為0。 ③一個(gè)團(tuán)體的平均真分?jǐn)?shù)T等于該團(tuán)體中所有被試實(shí)得分?jǐn)?shù)的平均值X。在一個(gè)團(tuán)體中,由于每個(gè)人的誤差都是隨機(jī)的且方向不同,只要團(tuán)體足夠大,其誤差就會(huì)相互抵消。因此,其誤差和為0。 ④真分?jǐn)?shù)的變異可以分為兩部分:與測(cè)驗(yàn)?zāi)康挠嘘P(guān)的變異(有效的變異數(shù))和與測(cè)驗(yàn)?zāi)康臒o關(guān)的變異(無效的變異數(shù)),公式為 。 則總體的關(guān)系式為 。 第四節(jié) 測(cè)驗(yàn)的項(xiàng)目分析 要求:心理測(cè)驗(yàn)的項(xiàng)目分析——難度;區(qū)分度;項(xiàng)目的綜合分析和篩選(講義p249)。 項(xiàng)目分析包括定性分析及定量分析。定性分析包括考慮內(nèi)容效度、題目編寫的恰當(dāng)性和有效性等,重點(diǎn)在于分析測(cè)題的內(nèi)容和形式;定量分析主要是采用統(tǒng)計(jì)方法來分析試題的品質(zhì)。 1.難度 (1)難度的含義 難度是指測(cè)驗(yàn)項(xiàng)目的難易程度。 (2)難度的計(jì)算 ①二分法記分項(xiàng)目的難度(客觀題) 通過率法:主要利用項(xiàng)目的通過率作為衡量難度的指標(biāo),即以答對(duì)或通過該項(xiàng)目的人數(shù)的百分比P來表示 。P值越大,題目越容易。 極端分組法:當(dāng)被試的人數(shù)較多時(shí),可以先將被試分為三組,取最高的27%被試和最低的27%被試作為高分組和低分組,并分別計(jì)算通過率,最后求兩個(gè)通過率的平均值作為該項(xiàng)目的難度。 ②非二分法記分項(xiàng)目的難度(主觀題) 計(jì)算公式 *在對(duì)兩個(gè)非二分法記分的項(xiàng)目進(jìn)行難度比較時(shí),要對(duì)它們分別進(jìn)行校正,排除由于猜測(cè)而答對(duì)某些題目致使通過率增大的可能性。 校正公式為 (3)難度水平的確定 項(xiàng)目難度水平的確定取決于測(cè)驗(yàn)的目的和性質(zhì)。對(duì)于效標(biāo)參照測(cè)驗(yàn)和掌握測(cè)驗(yàn),可不考慮難度。對(duì)于選拔測(cè)驗(yàn),應(yīng)將測(cè)驗(yàn)的項(xiàng)目難度控制在錄取率左右。對(duì)于選擇題,難度應(yīng)該大于猜測(cè)概率。無論何種測(cè)驗(yàn),一般都應(yīng)防止被試得滿分,因?yàn)闈M分的意義是不明確的。 (4)難度的等距變換(教材p75) 以項(xiàng)目的通過率來表示項(xiàng)目的難度,這類難度指標(biāo)屬于順序變量,不具有相等的單位,所指出的僅僅是項(xiàng)目的相對(duì)難度。于是需要把順序量表轉(zhuǎn)換成等距量表(僅有名次不能計(jì)算,必須要有具體測(cè)驗(yàn)分?jǐn)?shù)才可以)。 當(dāng)樣本容量很大時(shí),測(cè)驗(yàn)分?jǐn)?shù)將接近正態(tài)分布。根據(jù)正態(tài)分布曲線表,將試題的難度P作為正態(tài)曲線下的面積,轉(zhuǎn)換成具有相等單位的等距量數(shù),即Z分?jǐn)?shù)。 標(biāo)準(zhǔn)分?jǐn)?shù)(Z分?jǐn)?shù))具有相等的單位,屬于等距量表。 較難的項(xiàng)目難度為正值,較易的項(xiàng)目難度為負(fù)值,P為0.5時(shí)難度為0。 (5)難度對(duì)測(cè)驗(yàn)的影響 ①項(xiàng)目難度普遍較大的測(cè)驗(yàn),分?jǐn)?shù)分布將呈現(xiàn)為正偏態(tài);項(xiàng)目難度普遍較小的測(cè)驗(yàn),分?jǐn)?shù)分布將呈現(xiàn)為負(fù)偏態(tài)。一般能力測(cè)驗(yàn)和成就測(cè)驗(yàn)的平均難度在0.5左右為宜,正偏態(tài)分布適合于篩選性測(cè)驗(yàn)。 ②過難或過易的測(cè)驗(yàn)會(huì)使測(cè)驗(yàn)分?jǐn)?shù)相對(duì)的集中在低分端或高分端,從而使分?jǐn)?shù)的全距縮小。項(xiàng)目的難度以集中在0.5左右為最佳,以集中在兩端最差。 2.區(qū)分度 (1)區(qū)分度的含義 區(qū)分度是指測(cè)驗(yàn)項(xiàng)目對(duì)被試心理品質(zhì)水平差異的區(qū)分能力或鑒別能力。區(qū)分度被用作評(píng)價(jià)項(xiàng)目質(zhì)量,篩選項(xiàng)目的主要指標(biāo)和依據(jù)。 具有良好區(qū)分度的項(xiàng)目,能將不同水平的被試區(qū)分開來。即在該項(xiàng)目上水平高的被試得高分,水平低的被試得低分。 把試題的區(qū)分度稱為測(cè)驗(yàn)是否具有效度的“指示器”。 區(qū)分度(D)的取值范圍介于-1.00至+1.00之間。通常D為正值,稱作積極區(qū)分;D為負(fù)值,稱作消極區(qū)分;D為0稱作無區(qū)分作用。具有積極區(qū)分作用的項(xiàng)目,其D值越大,區(qū)分的效果越好。 *評(píng)價(jià)測(cè)驗(yàn)項(xiàng)目區(qū)分度高低依賴于對(duì)被試水平的準(zhǔn)確測(cè)量,通常稱作為效標(biāo)分?jǐn)?shù)。測(cè)驗(yàn)項(xiàng)目區(qū)分度的效標(biāo)分?jǐn)?shù)多用測(cè)驗(yàn)總分,稱為內(nèi)部效標(biāo)。 (2)區(qū)分度的計(jì)算 ①項(xiàng)目鑒別指數(shù)法——二分法記分 當(dāng)效標(biāo)成績(jī)是連續(xù)變量時(shí),可以從分?jǐn)?shù)的兩端各選擇27%的被試,分別計(jì)算出每道題目上各自的通過率,二者之差便是鑒別指數(shù)(D)。D值越高項(xiàng)目越有效。 計(jì)算公式為 。 當(dāng)D=1.00時(shí),高分組被試全部通過,低分組被試全部失??;如果低分組被試全部通過,高分組被試全部失敗,則D=-1.00;如果兩組的通過率相等,則D=0。 項(xiàng)目鑒別指數(shù)法只利用了一部分信息,浪費(fèi)了很多信息,統(tǒng)計(jì)結(jié)果準(zhǔn)確性差一些。而且當(dāng)項(xiàng)目與效標(biāo)之間并非為直線關(guān)系時(shí),甚至?xí)贸鲥e(cuò)誤的結(jié)論。 ②相關(guān)法——大規(guī)?;驑?biāo)準(zhǔn)化測(cè)驗(yàn) 以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)或測(cè)驗(yàn)總分的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)。 相關(guān)越高,項(xiàng)目區(qū)分度越高。 a.點(diǎn)二列相關(guān)——項(xiàng)目是(0,1)記分或二分變量,效標(biāo)或測(cè)驗(yàn)總分是連續(xù)變量 b.二列相關(guān)——連續(xù)的測(cè)量變量,其中一個(gè)變量被人為分成兩類 c.φ相關(guān)——兩個(gè)變量是二點(diǎn)分配,即兩個(gè)變量都是二分名義變量 d.積差相關(guān)——論文式測(cè)驗(yàn)題目,得分具有連續(xù)性 (被試團(tuán)體較大時(shí),可以認(rèn)為項(xiàng)目分?jǐn)?shù)服從正態(tài)分布) ③方差法 被試在某一項(xiàng)目上的得分越分散,則該試題鑒別力越大。 (3)區(qū)分度的相對(duì)性 ①不同計(jì)算方法,所得區(qū)分值不同。一個(gè)測(cè)驗(yàn)的各項(xiàng)目要采用同一種區(qū)分度指標(biāo)。 ②樣本容量大小影響相關(guān)法區(qū)分度值的大小。樣本容量越小,其統(tǒng)計(jì)值越不可靠。 ③分組標(biāo)準(zhǔn)影響鑒別指數(shù)。分組越極端,其D值越大。 ④被試樣本的同質(zhì)性程度影響區(qū)分度值的大小。被試團(tuán)體越同質(zhì),即個(gè)體之間水平越接近,其測(cè)題的區(qū)分度值越小。 (4)區(qū)分度與難度的關(guān)系 測(cè)驗(yàn)項(xiàng)目的難度對(duì)測(cè)驗(yàn)項(xiàng)目的鑒別力有一定的影響,難度與區(qū)分度有著密切的聯(lián)系。 難度越接近0.5時(shí),項(xiàng)目潛在的區(qū)分度越大,而難度越接近1.00或0時(shí),項(xiàng)目潛在的區(qū)分度越小。為了使項(xiàng)目具有較高區(qū)分能力,應(yīng)使所有項(xiàng)目都保持在0.5的難度最為理想。在利用項(xiàng)目分析選擇試題時(shí),應(yīng)使項(xiàng)目的難度分布廣一些,梯度大一些,使整個(gè)測(cè)驗(yàn)的難度分布呈正態(tài)分布,且平均水平保持在0.5左右。這樣才能把各種水平的人都區(qū)分開來,并且分的比較細(xì)。 *難度既影響信度又影響效度;難度影響區(qū)分度。 3.選項(xiàng)分析 選項(xiàng)分析就是對(duì)選擇題后面提供的幾個(gè)答案的分析。主要的異常情況有: ①正確答案無人選擇,或少于其他選項(xiàng)的人數(shù); ②錯(cuò)誤答案選的人太多; ③正確選項(xiàng)上的高分組選擇人數(shù)少于低分組; ④錯(cuò)誤選項(xiàng)上的高分組選擇人數(shù)多于低分組; ⑤某個(gè)選項(xiàng)無人選擇; ⑥未答的人數(shù)較多。 *標(biāo)準(zhǔn):正確選項(xiàng)準(zhǔn)確唯一;錯(cuò)誤選項(xiàng)具有干擾性、迷惑性。 第五節(jié) 心理測(cè)驗(yàn)的編制 1. 測(cè)驗(yàn)編制的基本程序 (1) 確定測(cè)驗(yàn)?zāi)康? (2) 制定編題計(jì)劃 (3) 編寫測(cè)驗(yàn)題目 (4) 題目試測(cè)與分析 (5) 合成測(cè)驗(yàn)及復(fù)本 (6) 測(cè)驗(yàn)使用標(biāo)準(zhǔn)化 (7) 信度與效度分析 (8) 編寫測(cè)驗(yàn)說明書 一、確定測(cè)驗(yàn)?zāi)康? 1.明確測(cè)量對(duì)象——測(cè)量哪些個(gè)人或團(tuán)體 2.明確測(cè)量目標(biāo)——測(cè)量什么心理功能 *目標(biāo)具體化 3.明確測(cè)量用途——描述?診斷?選拔?驗(yàn)證? 二、制定編題計(jì)劃 要明確的信息: 一是全面而具代表性的測(cè)驗(yàn)內(nèi)容,不致使測(cè)題偏離了應(yīng)測(cè)的范圍; 二是對(duì)各個(gè)內(nèi)容點(diǎn)的相對(duì)重視程度,通常用百分比來標(biāo)明。 用途:指明編題方向;確定記分標(biāo)準(zhǔn)。 三、編寫測(cè)驗(yàn)題目 1.收集測(cè)驗(yàn)資料 原則:1)資料要豐富;【臨床觀察的資料、已有的測(cè)題】 2)資料要有普遍性; 3)資料要有趣味性。 2.選擇項(xiàng)目形式 原則:1)使受測(cè)者容易明了測(cè)驗(yàn)方法 2)使受測(cè)者在完成測(cè)驗(yàn)時(shí)不會(huì)因測(cè)驗(yàn)項(xiàng)目的形式不當(dāng)而做錯(cuò)。 3)測(cè)驗(yàn)過程省時(shí) 4)計(jì)分省時(shí)省力 5)經(jīng)濟(jì) 3.編寫測(cè)驗(yàn)項(xiàng)目 注意:1)測(cè)驗(yàn)項(xiàng)目的取樣對(duì)欲測(cè)心理品質(zhì)具有代表性; 2)測(cè)驗(yàn)項(xiàng)目的取材范圍要同編題計(jì)劃所列項(xiàng)目范圍相一致; 3)測(cè)驗(yàn)項(xiàng)目的難度應(yīng)有一定的分布范圍; 4)用語要力求精煉簡(jiǎn)短,淺顯明了 5)初編題目的數(shù)量要多于最終所需要的數(shù)量,以便篩選或編制復(fù)本; 6)測(cè)驗(yàn)項(xiàng)目的說明必須簡(jiǎn)明。 四、題目試測(cè)與分析 1.預(yù)測(cè) 目的:獲得被試對(duì)測(cè)驗(yàn)項(xiàng)目做何反應(yīng)的資料,包括質(zhì)的信息與量的指標(biāo)。 質(zhì):題目思想性、邏輯錯(cuò)誤、印刷、裝訂 量:難度、區(qū)分度、項(xiàng)目分析 注意:1)預(yù)測(cè)對(duì)象應(yīng)取自將來正式測(cè)驗(yàn)時(shí)準(zhǔn)備施用的群體,人數(shù)不必太多,但要具有代表性; 2)預(yù)測(cè)的情境應(yīng)力求同正式測(cè)驗(yàn)的情境一致; 3)預(yù)測(cè)的時(shí)限可以適當(dāng)延長,以便每一個(gè)受測(cè)者都能將題目做完; 4)施測(cè)者應(yīng)對(duì)受測(cè)者的反應(yīng)加以記錄。 2. 項(xiàng)目分析——對(duì)預(yù)測(cè)結(jié)果進(jìn)行統(tǒng)計(jì)分析,確定項(xiàng)目的難度和區(qū)分度。 五、合成測(cè)驗(yàn)及復(fù)本 合成測(cè)驗(yàn)就是把經(jīng)過預(yù)測(cè)以后證明有價(jià)值的項(xiàng)目排成有組織的測(cè)驗(yàn)。 1. 測(cè)驗(yàn)項(xiàng)目的選擇 指標(biāo)(3個(gè)):測(cè)驗(yàn)的性質(zhì);項(xiàng)目的難度;項(xiàng)目的區(qū)分度 2. 測(cè)驗(yàn)項(xiàng)目的編排 總的編排原則:由易到難 兩種常見編排方式: 1) 并列直進(jìn)式:依其難度由易到難排列。 2) 混合螺旋式:依難度分成若干不同的層次,再將不同性質(zhì)的測(cè)驗(yàn)項(xiàng)目予以組合,作交叉式的排列,其難度則漸次升進(jìn)。 3.編制復(fù)本(A、B卷 等值性) 等值需要符合的條件: 1) 各份測(cè)驗(yàn)測(cè)量的是同一種心理特質(zhì); 2) 各份測(cè)驗(yàn)具有相同的內(nèi)容和形式; 3) 各份測(cè)驗(yàn)不應(yīng)有重復(fù)的項(xiàng)目; 4) 各份測(cè)驗(yàn)項(xiàng)目數(shù)量相等,并且有大體相同的難度和區(qū)分度。 **ABBA的順序 平衡難度 六、測(cè)驗(yàn)使用標(biāo)準(zhǔn)化 標(biāo)準(zhǔn)化是指測(cè)驗(yàn)的編制、施測(cè)、評(píng)分以及解釋測(cè)驗(yàn)分?jǐn)?shù)的程度的一致性。 1. 測(cè)驗(yàn)內(nèi)容:相同的或等值的題目 2. 施測(cè)過程:相同的測(cè)驗(yàn)情境;相同的指導(dǎo)語;相同的測(cè)驗(yàn)時(shí)限 3. 測(cè)驗(yàn)評(píng)分:1)對(duì)反應(yīng)要及時(shí)清楚的記錄; 2)要有標(biāo)準(zhǔn)答案或正確反應(yīng)的表格,即記分鍵; 3)將受測(cè)者的反應(yīng)與記分鍵比較,確定受測(cè)者反應(yīng)應(yīng)得的分?jǐn)?shù)。 4. 測(cè)驗(yàn)分?jǐn)?shù)的解釋 七、鑒定測(cè)驗(yàn)(信度與效度分析) 1.信度——測(cè)驗(yàn)的可靠性;即用同一測(cè)驗(yàn)多次測(cè)量同一團(tuán)體,所得測(cè)驗(yàn)結(jié)果之間具有一致性。 2.效度——測(cè)驗(yàn)的有效性;即一個(gè)測(cè)驗(yàn)在多大程度上能夠測(cè)得所要測(cè)得的東西。 3.測(cè)驗(yàn)量表與常模 ①按照統(tǒng)計(jì)學(xué)的原理,把某一標(biāo)準(zhǔn)化樣本的測(cè)驗(yàn)分?jǐn)?shù)轉(zhuǎn)化為具有一定參照點(diǎn)、等值單位的導(dǎo)出分?jǐn)?shù),這就是所謂的測(cè)量量表。常見:百分等級(jí)量表、標(biāo)準(zhǔn)分?jǐn)?shù)量表、T量表、發(fā)展量表、智力商數(shù)量表等。 ②如果將標(biāo)準(zhǔn)化樣本的測(cè)驗(yàn)分?jǐn)?shù)與相應(yīng)的某一個(gè)或某幾個(gè)測(cè)驗(yàn)量表分?jǐn)?shù)一起用表格的形式呈現(xiàn)出來,就是該測(cè)驗(yàn)的常模表。 八、編寫測(cè)驗(yàn)說明書 1)本測(cè)驗(yàn)的目的與功用; 2)本測(cè)驗(yàn)的理論依據(jù); 3)測(cè)驗(yàn)內(nèi)容及實(shí)施測(cè)驗(yàn)的方法; 4)測(cè)驗(yàn)的標(biāo)準(zhǔn)答案和評(píng)分方法; 5)關(guān)于測(cè)驗(yàn)的信度、效度資料的說明; 6)常模表,即如何依據(jù)常模解釋測(cè)驗(yàn)結(jié)果。 2.測(cè)驗(yàn)?zāi)繕?biāo)與雙向細(xì)目表(講義p250) 3.題目編制技術(shù)(講義p250-p251) 第六節(jié) 心理測(cè)驗(yàn)的實(shí)施 測(cè)驗(yàn)的使用主要涉及兩個(gè)問題: 1) 如何實(shí)施測(cè)驗(yàn)才能保證測(cè)驗(yàn)分?jǐn)?shù)盡可能少受施測(cè)過程的影響; 2) 如何解釋測(cè)驗(yàn)分?jǐn)?shù)才能保證受測(cè)者的心理不受負(fù)面影響。 一、 測(cè)驗(yàn)的實(shí)施過程 通過觀測(cè)受測(cè)者在測(cè)驗(yàn)情境中的行為樣本,可以推斷他平日一般的行為特征。 1. 施測(cè)前的準(zhǔn)備工作 (1) 準(zhǔn)備好測(cè)驗(yàn)材料 (2) 熟練掌握施測(cè)手續(xù) 訓(xùn)練的內(nèi)容包括:①熟悉測(cè)驗(yàn)內(nèi)容; ②掌握施測(cè)步驟; ③掌握記分方法; ④掌握解釋分?jǐn)?shù)的技術(shù)。 (3) 熟記測(cè)驗(yàn)指導(dǎo)語并能用口語清楚而流利地說出來。 2. 指導(dǎo)語 指導(dǎo)語通常包括對(duì)測(cè)驗(yàn)?zāi)康牡恼f明和對(duì)題目反應(yīng)方式的解釋。 注意:一般要求測(cè)驗(yàn)的主持者和指導(dǎo)語都應(yīng)保持和表述中立的態(tài)度,不傾向于答案中的任何一種方向。 *一般的能力測(cè)驗(yàn)和成就測(cè)驗(yàn)都要求有標(biāo)準(zhǔn)嚴(yán)格的時(shí)間限制; 而人格測(cè)驗(yàn)和態(tài)度測(cè)驗(yàn)一般不要求有時(shí)間限制。 3. 測(cè)驗(yàn)情境 包括測(cè)驗(yàn)場(chǎng)地(通風(fēng)、光線、噪聲)、座位、答案紙型等。 4. 測(cè)驗(yàn)焦慮 測(cè)驗(yàn)焦慮是指被試因接受測(cè)驗(yàn)而產(chǎn)生的一種憂慮和緊張情緒,它會(huì)影響測(cè)驗(yàn)結(jié)果的真實(shí)性。 主試有時(shí)可以利用保證測(cè)驗(yàn)結(jié)果絕對(duì)保密或鼓勵(lì)被試等方法來消除測(cè)驗(yàn)焦慮。 5. 與受測(cè)者建立良好的協(xié)調(diào)關(guān)系 良好的協(xié)調(diào)關(guān)系指的是施測(cè)者設(shè)法努力引起受測(cè)者對(duì)測(cè)驗(yàn)的興趣,取得他的合作,以保證他能按照標(biāo)準(zhǔn)測(cè)驗(yàn)指導(dǎo)語行事。 6. 評(píng)分技術(shù) 二、 測(cè)驗(yàn)分?jǐn)?shù)的解釋 主要涉及兩個(gè)問題:一是如何看待測(cè)驗(yàn)分?jǐn)?shù)的意義;二是如何將測(cè)驗(yàn)分?jǐn)?shù)的意義告訴受測(cè)者。 1. 如何看待測(cè)驗(yàn)分?jǐn)?shù)的意義 高德曼的三個(gè)維度的解釋模型 三個(gè)維度分別是解釋測(cè)驗(yàn)分?jǐn)?shù)的類型、資料處理的方法、資料的來源 解釋測(cè)驗(yàn)分?jǐn)?shù)的4種類型:敘述的解釋、溯因的解釋、預(yù)測(cè)的解釋、評(píng)價(jià)的解釋 資料處理的2種方法:機(jī)械的處理、非機(jī)械的處理 資料的2種來源:測(cè)驗(yàn)資料、非測(cè)驗(yàn)資料 三個(gè)維度加以組合:4*2*2=16種不同的解釋方式。 基本原則: 1) 主試應(yīng)充分了解測(cè)驗(yàn)的性質(zhì)與功能。 2) 對(duì)導(dǎo)致測(cè)驗(yàn)結(jié)果的原因的解釋應(yīng)慎重,謹(jǐn)防片面極端。 3) 必須充分估計(jì)測(cè)驗(yàn)的常模和效度的局限性。 4) 解釋分?jǐn)?shù)應(yīng)參考其他有關(guān)資料。 5) 對(duì)測(cè)驗(yàn)分?jǐn)?shù)應(yīng)以“一段分?jǐn)?shù)”來解釋,而不應(yīng)以“特定的數(shù)值”來解釋。 6) 對(duì)來自不同測(cè)驗(yàn)的分?jǐn)?shù)不能直接加以比較。 2. 如何將測(cè)驗(yàn)分?jǐn)?shù)的意義告訴受測(cè)者(教材p131-p132) 補(bǔ)充:講義p252 第七節(jié) 測(cè)驗(yàn)常模 1、 常模與常模團(tuán)體 1) 常模:用于比較和解釋測(cè)驗(yàn)結(jié)果的標(biāo)準(zhǔn)化樣本的分?jǐn)?shù)分布。 常模是根據(jù)標(biāo)準(zhǔn)化樣本的測(cè)驗(yàn)分?jǐn)?shù)經(jīng)過統(tǒng)計(jì)處理而建立起來的具有參照點(diǎn)和單位的測(cè)驗(yàn)量表。 編制常模需要三步:①確定有關(guān)的比較團(tuán)體; ②獲得該團(tuán)體成員的測(cè)驗(yàn)分?jǐn)?shù); ③把原始分?jǐn)?shù)轉(zhuǎn)化成量表分?jǐn)?shù)。 2) 常模團(tuán)體 常模團(tuán)體是作為比較標(biāo)準(zhǔn)的具有某些共同特征的人組成的群體或該群體的樣本。 3) 確定常模團(tuán)體的注意事項(xiàng) ①群體構(gòu)成的界限必須明確; ②常模團(tuán)體必須是所測(cè)群體的一個(gè)代表性樣本;(遵循隨機(jī)化原則)e.g.分層抽樣 ③取樣的過程必須明確且有詳盡的描述; ④樣本大小要適當(dāng);(取樣誤差與樣本大小成反比;其他條件相同時(shí)樣本越大越好) ⑤常模團(tuán)體必須是近時(shí)的; 即減低抽樣誤差,就必須加大樣本容量 ⑥注意一般常模與特殊常模的結(jié)合。 2、 分?jǐn)?shù)轉(zhuǎn)換與合成 分?jǐn)?shù)的轉(zhuǎn)換:按某種規(guī)則將原始分?jǐn)?shù)轉(zhuǎn)化為導(dǎo)出分?jǐn)?shù)的過程。 1) 原始分?jǐn)?shù):從測(cè)驗(yàn)中直接獲得的分?jǐn)?shù);被試在接受測(cè)驗(yàn)后,根據(jù)測(cè)驗(yàn)的記分標(biāo)準(zhǔn),對(duì)照被試的反應(yīng)所計(jì)算出的測(cè)驗(yàn)分?jǐn)?shù)。 原始分?jǐn)?shù)反映了被試答對(duì)題目的個(gè)數(shù)或作答正確的程度;不能直接反映出被試之間的差異狀況、被試相互比較后所處的地位、被試在其他等值測(cè)驗(yàn)上應(yīng)獲得什么樣的分值。 2) 導(dǎo)出分?jǐn)?shù):在原始分?jǐn)?shù)轉(zhuǎn)換的基礎(chǔ)上,按照一定的規(guī)則,經(jīng)過統(tǒng)計(jì)處理后獲得的具有一定參考點(diǎn)和單位,且可以相互比較的分?jǐn)?shù)。常用的導(dǎo)出分?jǐn)?shù)有百分等級(jí)、標(biāo)準(zhǔn)分?jǐn)?shù)、T分?jǐn)?shù)。 分?jǐn)?shù)的合成:將幾個(gè)分?jǐn)?shù)或幾個(gè)預(yù)測(cè)源組合起來,以獲得一個(gè)合成分?jǐn)?shù)或做總的預(yù)測(cè)。有3種類型:1)項(xiàng)目的組合; 2)分測(cè)驗(yàn)或量表的組合; 3)測(cè)驗(yàn)或預(yù)測(cè)源的組合。 分?jǐn)?shù)合成中的問題: 1) 采用什么方法來合成分?jǐn)?shù)?取決于組成測(cè)驗(yàn)分?jǐn)?shù)的目的與要做何種決定。 2) 什么形式是最適當(dāng)?shù)姆謹(jǐn)?shù)組合?可用效標(biāo)效度來評(píng)價(jià)合成分?jǐn)?shù)。 3)需要多少及何種測(cè)驗(yàn)分?jǐn)?shù)作最適當(dāng)?shù)慕M合分?jǐn)?shù)?可用合成體效度來評(píng)價(jià)。 分?jǐn)?shù)合成的方法: 1) 臨床判斷 2) 推理方法:?jiǎn)挝患訖?quán),等量加權(quán),差異加權(quán) 3) 多重分段:連續(xù)柵欄,綜合分段 4) 多重回歸:基本方程,預(yù)測(cè)誤差,漸進(jìn)效度,合成體效度 5) 特殊方法:完形記分,輪廓分析 1> 臨床診斷——直覺合成 根據(jù)經(jīng)驗(yàn)做出診斷;這種根據(jù)直覺的經(jīng)驗(yàn),主觀地將各種因素加權(quán),而獲得結(jié)論或預(yù)測(cè)的方法叫做臨床診斷。 優(yōu)點(diǎn):①具有高度的綜合性;②具有靈活的針對(duì)性。 缺點(diǎn):①主觀加權(quán)易受決策者的偏見影響,不夠客觀; ②缺乏精確的數(shù)量分析,沒有精確的數(shù)量指標(biāo)。 2> 加權(quán)求和合成——推理方法:?jiǎn)挝患訖?quán),等量加權(quán),差異加權(quán) ① 單位加權(quán):將各個(gè)測(cè)驗(yàn)分?jǐn)?shù)直接相加而獲得合成分?jǐn)?shù)。 公式為: ② 等量加權(quán):將所有測(cè)驗(yàn)分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù),然后采用下式加權(quán)組合。 (適用于各測(cè)驗(yàn)對(duì)預(yù)測(cè)效標(biāo)具有同等重要性的場(chǎng)合) 公式為: ③ 差異加權(quán):通常情況下,各個(gè)變數(shù)對(duì)預(yù)測(cè)效標(biāo)的作用是不同的。因此需要根據(jù)各個(gè)變數(shù)與效標(biāo)之間的經(jīng)驗(yàn)關(guān)系作差異加權(quán)。 公式為: e.g.分?jǐn)?shù)離散程度大的課程,具有較強(qiáng)區(qū)分度,在錄取時(shí)起的作用大。 3> 多重劃分——多重分段:連續(xù)柵欄,綜合分段 ①多重劃分就是在各個(gè)特質(zhì)上都確定一個(gè)標(biāo)準(zhǔn),從而把成績(jī)劃分為合格與不合格兩類。只有每個(gè)測(cè)驗(yàn)都合格時(shí),總要求才算合格。(同時(shí)考察) ②連續(xù)柵欄就是在整個(gè)測(cè)驗(yàn)實(shí)施時(shí),是把所有組成這一測(cè)驗(yàn)的分測(cè)驗(yàn)按一定順序排列起來逐一實(shí)施,只有通過了前一次測(cè)驗(yàn),才能繼續(xù)實(shí)施后一個(gè)測(cè)驗(yàn)。 4> 多重回歸:基本方程,預(yù)測(cè)誤差,漸進(jìn)效度,合成體效度 多重回歸就是研究一種事物或現(xiàn)象與其他多種事物或現(xiàn)象在數(shù)量上相互聯(lián)系和相互制約的統(tǒng)計(jì)方法。 基本方程式為: 通過對(duì)預(yù)測(cè)源作適當(dāng)加權(quán),使這些加權(quán)的測(cè)驗(yàn)分?jǐn)?shù)的合成能以最小的誤差來預(yù)測(cè)效標(biāo)分?jǐn)?shù)。 注意: 最佳預(yù)測(cè)源:選出與效標(biāo)相關(guān)最高的變量,然后加入另一預(yù)測(cè)源組合起來以使R的數(shù)值增至最大,下一個(gè)要加入的預(yù)測(cè)源應(yīng)該是與前兩個(gè)預(yù)測(cè)源組合起來能使R值增加最多的,依次類推,當(dāng)加入額外的預(yù)測(cè)源不再顯著的使相關(guān)系數(shù)R值增加時(shí),則終止分析。 和Y相關(guān)盡可能高,和X1相關(guān)盡可能低 5> 特殊方法:完形記分,輪廓分析 呈現(xiàn)常模的方法:轉(zhuǎn)化表,剖析圖 轉(zhuǎn)化表的構(gòu)成要素有:原始分?jǐn)?shù)、相應(yīng)的導(dǎo)出分?jǐn)?shù)、對(duì)常模團(tuán)體的具體描述。 剖析圖是把一套測(cè)驗(yàn)中幾個(gè)分測(cè)驗(yàn)分?jǐn)?shù)同圖表(圖形)表示出來。 3、 幾種常模分?jǐn)?shù) 發(fā)展量表 1) 年齡量表——所測(cè)量的特質(zhì)隨年齡作有系統(tǒng)的改變 2) 年級(jí)當(dāng)量 商數(shù) 1) 智力商數(shù) 2) 教育商數(shù) 3) 成就商數(shù) 百分等級(jí) 一個(gè)原始分?jǐn)?shù)的百分等級(jí),是指在一個(gè)群體的測(cè)驗(yàn)分?jǐn)?shù)中,得分低于這個(gè)分?jǐn)?shù)的人數(shù)的百分比。百分等級(jí)取值越大,說明成績(jī)?cè)絻?yōu)秀。 百分等級(jí)分?jǐn)?shù)的計(jì)算 (1)未分組分?jǐn)?shù)資料 e.g.成績(jī)?yōu)?0分的百分等級(jí)為83,就是說比80分低的原始分?jǐn)?shù)占全體得分的83%,比其高的只占17%。 (2)分組分?jǐn)?shù)資料 四舍五入 對(duì)百分等級(jí)的評(píng)價(jià) 百分等級(jí)是一種相對(duì)位置量數(shù),具有可比性,且易于計(jì)算,解釋方便;但它是一種順序量數(shù),不具有可加性。 兩個(gè)缺點(diǎn):①單位不等,尤其在分配的兩個(gè)極端; ②只具有順序性,無法說明不同被試之間分?jǐn)?shù)差異的數(shù)量。 *百分等級(jí)是相對(duì)于特定的被試團(tuán)體而言的,解釋時(shí)不能離開特定的參照?qǐng)F(tuán)體。 標(biāo)準(zhǔn)分?jǐn)?shù) 標(biāo)準(zhǔn)分?jǐn)?shù)是一種具有相等單位的量數(shù),又稱作Z分?jǐn)?shù),以Z表示。 標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算 公式為: (線性轉(zhuǎn)化) 對(duì)Z分?jǐn)?shù)的評(píng)估 Z分?jǐn)?shù)是以平均數(shù)為參照點(diǎn),以標(biāo)準(zhǔn)差為單位的等距量表。具有可比性、可加性;由符號(hào)與絕對(duì)值兩部分構(gòu)成: 正負(fù)符號(hào)表示原始分?jǐn)?shù)在平均數(shù)之上或之下,絕對(duì)值表示原始分?jǐn)?shù)與平均數(shù)的距離。 1) 線性轉(zhuǎn)化(如上) 2) 常態(tài)化(T分?jǐn)?shù)、標(biāo)準(zhǔn)九、標(biāo)準(zhǔn)十、離差智商) 常態(tài)化就是正態(tài)化,是指使用非線性變換,將非正態(tài)分布的分?jǐn)?shù)強(qiáng)制性的扭轉(zhuǎn)成正態(tài)分布。 ①T分?jǐn)?shù):麥柯爾提出,公式為: T在[0,100]之間。 平均數(shù)為50,標(biāo)準(zhǔn)差為10;T分?jǐn)?shù)避免了小數(shù)與負(fù)號(hào)。 ②標(biāo)準(zhǔn)九:以0.5個(gè)標(biāo)準(zhǔn)差為單位,將正態(tài)曲線下的橫軸分為九段,最高一端為9分,最低一端為1分,中間一段為5分,除兩端外,每段均有半個(gè)標(biāo)準(zhǔn)差寬。 ③標(biāo)準(zhǔn)十:卡特爾16PF ④離差智商:韋氏智力測(cè)驗(yàn)采用 平均數(shù)為100,標(biāo)準(zhǔn)差為15。 第八節(jié) 標(biāo)準(zhǔn)參照測(cè)驗(yàn) 1. 標(biāo)準(zhǔn)參照測(cè)驗(yàn)的含義與作用 標(biāo)準(zhǔn)參照測(cè)驗(yàn)是根據(jù)某一明確界定的內(nèi)容范圍而縝密編制的測(cè)驗(yàn)。當(dāng)一個(gè)測(cè)驗(yàn)是以某一明確界定的內(nèi)容范圍為基礎(chǔ)編制而成,并且其分?jǐn)?shù)是參考該內(nèi)容范圍所要求的絕對(duì)標(biāo)準(zhǔn)進(jìn)行解釋時(shí),稱這一測(cè)驗(yàn)為標(biāo)準(zhǔn)參照測(cè)驗(yàn)。通過標(biāo)準(zhǔn)參照測(cè)驗(yàn),可以了解個(gè)體在所規(guī)定測(cè)量?jī)?nèi)容上的行為水平,其出發(fā)點(diǎn)是個(gè)體本身的絕對(duì)水平。 2. 標(biāo)準(zhǔn)參照測(cè)驗(yàn)的題目分析 *測(cè)驗(yàn)項(xiàng)目的難度分析:與常模參照測(cè)驗(yàn)相同,一般以通過率表示。 *測(cè)驗(yàn)項(xiàng)目的區(qū)分度分析: ①當(dāng)采用掌握組-未掌握組的預(yù)測(cè)方法時(shí),可以使用鑒別系數(shù)(D) ②當(dāng)采用前測(cè)-后測(cè)方法,可獲得在前測(cè)中錯(cuò)誤回答某項(xiàng)目而在后測(cè)中能夠正確回答的被試人數(shù)比例,此即該項(xiàng)目的個(gè)人獲得指數(shù)。 3. 標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度與效度 1) 標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度及其估計(jì) ①分類一致性信度——計(jì)算兩次都被分到一類中的被試占總被試人數(shù)的比例。 ②方差分析方法——荷伊特信度 2) 標(biāo)準(zhǔn)參照測(cè)驗(yàn)的效度及其估計(jì) ①內(nèi)容效度 ②效標(biāo)關(guān)聯(lián)效度 4. 標(biāo)準(zhǔn)參照測(cè)驗(yàn)的分?jǐn)?shù)解釋 (1) 專家判定法 ①Nedelsky法 ②Angoff法 (2) 效標(biāo)組預(yù)測(cè)法 ①臨界組法 ②對(duì)照組法 詳見講義p256-p258 第九節(jié) 心理測(cè)驗(yàn)理論的新發(fā)展 一、 經(jīng)典測(cè)量理論的局限 1. 統(tǒng)計(jì)指標(biāo)依賴于被試樣本;(難度、區(qū)分度、信度、效度) 2. 分?jǐn)?shù)解釋依賴于測(cè)驗(yàn)難度;(難度不同,解釋不同) 3. 同一測(cè)驗(yàn)相同分?jǐn)?shù)其含義不同;(做對(duì)的題目其難度不同) 4. 信度估計(jì)不精確;(沒有更精確的總體估計(jì)) 5. 測(cè)驗(yàn)結(jié)果不能概化到非標(biāo)準(zhǔn)化情境;(標(biāo)準(zhǔn)化測(cè)驗(yàn)不能推廣) 6. 被試做同樣題目無法照顧個(gè)別差異。(被試水平不同,相對(duì)難易程度不同) 二、 項(xiàng)目反應(yīng)理論 1. 基本假設(shè) ①潛在特質(zhì)空間的單維性假設(shè); ②局部獨(dú)立性假設(shè);(各項(xiàng)目之間不相關(guān),不影響) ③正確反應(yīng)概率與特質(zhì)水平間函數(shù)關(guān)系假設(shè); ④非速度測(cè)驗(yàn)假設(shè)。(對(duì)時(shí)間沒有限制) 2. 項(xiàng)目反應(yīng)的參數(shù)及模型:?jiǎn)螀?shù)、二參數(shù)、三參數(shù) 單參數(shù):區(qū)分度 二參數(shù):難度、區(qū)分度 三參數(shù):難度、區(qū)分度、猜測(cè)率 3. 項(xiàng)目特征曲線及信息函數(shù) 項(xiàng)目特征曲線(教材p292) 信息函數(shù):作為信度的指標(biāo) 4. 項(xiàng)目反應(yīng)理論的應(yīng)用(題目分析、題庫、自適應(yīng)測(cè)驗(yàn)) 題目分析:可根據(jù)圖形直接判斷——曲線越陡峭,區(qū)分度越高; 曲線越往右側(cè)靠,難度越大。 自適應(yīng)測(cè)驗(yàn):根據(jù)不同被試的水平給予不同難度的測(cè)驗(yàn);避免天花板、地板效應(yīng)。 5. 項(xiàng)目反應(yīng)理論的優(yōu)點(diǎn)及局限 局限:對(duì)于現(xiàn)今的測(cè)驗(yàn),單維假設(shè)不成立,二分法記分不適用。 三、 概化理論 概化理論是經(jīng)典測(cè)量理論與方差分析結(jié)合的產(chǎn)物,其核心是從特定條件下的測(cè)量結(jié)果來推斷更廣泛的條件下可能得到的測(cè)量結(jié)果。 1. 基本概念 題目、被試、主試等各種影響因素 測(cè)量目標(biāo):所要測(cè)量的心理特質(zhì); 測(cè)量側(cè)面:影響測(cè)量過程和結(jié)果的各種內(nèi)在外在因素(每個(gè)影響因素都是一個(gè)側(cè)面); 測(cè)量情境:由測(cè)量目標(biāo)和測(cè)量側(cè)面構(gòu)成,即測(cè)什么和怎么測(cè)的結(jié)合。 2. 基本假設(shè) 替代信度 可靠性與隨機(jī)平行測(cè)驗(yàn)假設(shè) ——用觀察全域中隨機(jī)抽取的一個(gè)樣例來推斷全域的可靠性作為信度指標(biāo)。 3. 概化理論的優(yōu)點(diǎn)與局限 ①用隨機(jī)平行測(cè)驗(yàn)取代嚴(yán)格平行測(cè)驗(yàn),操作方便; ②用方差分析技術(shù)能全面估計(jì)各種誤差成分的相對(duì)大??;(能整合起來) ③在方法和應(yīng)用上都有待完善。 四、 測(cè)驗(yàn)等值 1. 含義:將不同測(cè)驗(yàn)版本分?jǐn)?shù)統(tǒng)一在一個(gè)量表上的過程;使其具有可比性。 2. 特性:等價(jià)性、可逆性、組間一致性 3. 種類:測(cè)驗(yàn)分?jǐn)?shù)等值、項(xiàng)目參數(shù)等值、橫向等值、縱向等值 (難度、區(qū)分度) (測(cè)驗(yàn)間) (時(shí)間) 4. 方法: ①平均數(shù)等值:A測(cè)驗(yàn)平均分80與B測(cè)驗(yàn)平均分70等值 ②百分位等值:A測(cè)驗(yàn)80分為75百分等級(jí),B測(cè)驗(yàn)70分為75百分等級(jí),80與70等值 ③線性等值:用標(biāo)準(zhǔn)差計(jì)算—代數(shù)公式<用平均數(shù)、標(biāo)準(zhǔn)差計(jì)算> ④項(xiàng)目反應(yīng)理論等值:參數(shù)等值 5. 設(shè)計(jì): ①單組設(shè)計(jì)—兩個(gè)測(cè)驗(yàn)對(duì)同一組人測(cè)試 ②等組設(shè)計(jì)—隨機(jī)抽取兩個(gè)組,假設(shè)為等組 ③等組交叉設(shè)計(jì)—前兩種方法結(jié)合,一組先A卷后B卷,另一組先B卷后A卷 ④共同被試設(shè)計(jì)—有一部分共同的人做中介,既參加A卷又參加B卷 ⑤鉚測(cè)驗(yàn)設(shè)計(jì)—用共同的題目作為鉚來進(jìn)行測(cè)驗(yàn) ⑥混合設(shè)計(jì)—以上設(shè)計(jì)混合- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
32 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 心理測(cè)量學(xué) 筆記 備考 北師大
鏈接地址:http://www.820124.com/p-1573759.html