心理測量學(xué)教案(舊).doc
《心理測量學(xué)教案(舊).doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《心理測量學(xué)教案(舊).doc(83頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
心理測量學(xué)(舊) 課程說明 (一)課程性質(zhì) 本課程適合于大學(xué)本科心理學(xué)、教育科學(xué)等專業(yè)的本科生及研 究生教育。本課程的學(xué)習(xí)將有助于實(shí)驗(yàn)設(shè)計(jì)、教育評(píng)價(jià)、心理與 教育統(tǒng)計(jì)學(xué)等學(xué)科的學(xué)習(xí),是培養(yǎng)學(xué)生科學(xué)研究及掌握研究方法 的基礎(chǔ)性學(xué)科。 (二)教學(xué)目的 通過學(xué)習(xí),要求學(xué)生掌握心理測量的基本知識(shí)、心理測量的編制 和實(shí)施、以及良好測量所要求具備的基本條件。更重要的是,通 過本課程的學(xué)習(xí)要使學(xué)生熟練掌握不同心理測量的實(shí)際應(yīng)用。 (三)教學(xué)內(nèi)容 本課程的主要教學(xué)內(nèi)容有:心理測量的基本內(nèi)涵及其評(píng)價(jià)和測量 的一般步驟和方法兩部分。內(nèi)容涉及一般測量解析,測量的要素 及量表類型,測驗(yàn)信、效度、難度和區(qū)分度,測量的一般步驟和 方法,智力測驗(yàn)、人格測驗(yàn)等心理測驗(yàn),以及心理測量的綜合應(yīng) 用和心理測量理論的新發(fā)展等內(nèi)容。 (四)教學(xué)時(shí)數(shù) 54個(gè)課時(shí) (五)教學(xué)方式 課堂教學(xué)與實(shí)踐應(yīng)用相結(jié)合。 第一編 心理測量的基本內(nèi)涵及其評(píng)價(jià) 第一章 緒論 教學(xué)要點(diǎn): 通過本章的學(xué)習(xí),了解測量的基本性質(zhì)及其要素,測量量表的四種 水平,心里測量的本質(zhì)、基本條件及功能,心里測量的發(fā)展以及心 理測量的道德準(zhǔn)則等內(nèi)容,對(duì)心理測量有一個(gè)概括化的了解。 教學(xué)時(shí)數(shù):[10學(xué)時(shí)] 教學(xué)內(nèi)容: 一、一般測量解析 1.測量(Measurement)概論 2.測量的分類 3.心理測量的種類 (1)以測量對(duì)象來分,(2)以測量的目的來分,(3)以測量的方式 來分類,(4)以項(xiàng)目結(jié)構(gòu)或組成形式來分,(5)按評(píng)價(jià)參照的 標(biāo)準(zhǔn)分類 4.測量與測驗(yàn)(Test)、考試(Examination)、評(píng)價(jià)(Evaluation)聯(lián)系 與區(qū)別 二、測量的要素及量表類型 1.測量的要素 識(shí)記: 單位(Unit),參照點(diǎn)(Reference Point),量表(Scale) 2.量表類型 (1)稱名量表 稱名變量只說明某一事物與其他事物在名稱、類別或?qū)傩陨系牟? 同,并不說明事物與事物之間差異的大小、順序的先后及質(zhì)的優(yōu) 劣。 (2)順序變量 順序變量是指可以就事物的某一屬性的多少或大小按次序?qū)⒏? 事物加以排列的變量,具有等級(jí)性和次序性的特點(diǎn)。 (3)等距變量 等距變量除能表明量的相對(duì)大小外,還具有相等的單位。 (4)比率變量 比率變量除了具有量的大小、相等單位外,還有絕對(duì)零點(diǎn)。 三、心理測量的本質(zhì)、基本條件及功能 1.心理測量的本質(zhì) 2.編制心理測驗(yàn)的基本條件 3.心理測量的功能 (1)理論研究功能,(2)實(shí)際應(yīng)用功能 四、心理測量發(fā)展簡史 1.主觀經(jīng)驗(yàn)性考試階段(1864年以前) 2.客觀標(biāo)準(zhǔn)化測驗(yàn)階段(1864年——1940年) 3.觀測驗(yàn)的深入發(fā)展階段(1940年——) 4.西方心理測量的發(fā)展 5.心理測驗(yàn)在我國的發(fā)展 五、心理測量的道德準(zhǔn)則 1.心理測量工作者的素質(zhì)要求 (1)心理測量工作的知識(shí)結(jié)構(gòu).(2)對(duì)心理測量的態(tài)度 2.心理測量工作者的道德準(zhǔn)則 (1)測驗(yàn)的保密和控制原則(2)測驗(yàn)中個(gè)人隱私的保護(hù) 考核要求: 1.心理測量的種類 2.測量與測驗(yàn)(Test)、考試(Examination)、評(píng)價(jià)(Evaluation)聯(lián)系 與區(qū)別 3.測量的要素及量表類型 單位,參照點(diǎn),量表,稱名量表,順序變量,等距變量,比率變量 4.心理測量的本質(zhì)、基本條件及功能 5.心理測量發(fā)展簡史 第二章 經(jīng)典測驗(yàn)理論的基本假設(shè) 教學(xué)要點(diǎn): 通過本章的學(xué)習(xí),掌握經(jīng)典測驗(yàn)理論的基本假設(shè),心里特之及其 特性,心里測量的誤差和種類,以及真分?jǐn)?shù)的含義等內(nèi)容。 教學(xué)時(shí)數(shù):[6學(xué)時(shí)] 教學(xué)內(nèi)容: 一、心理特質(zhì)(Trait)及其可測性假設(shè) 1.經(jīng)典測驗(yàn)(Classical Test Theory ,CTT)理論 2.特質(zhì)假設(shè) 二、測量誤差及其來源 1. 測量誤差的含義 2.誤差種類 識(shí)記: 隨機(jī)誤差,系統(tǒng)誤差 3.誤差來源 (1)來自心理測量工具,(2)來自測量對(duì)象,(3)來自實(shí)測過程 二、真分?jǐn)?shù)模型及其假設(shè) 1. 真分?jǐn)?shù)的含義 2.真分?jǐn)?shù)數(shù)學(xué)模型解析 領(lǐng)會(huì):(1)幾個(gè)推理,(2)CTT的基本含義,(3)CTT的基本公式 3.經(jīng)典測驗(yàn)理論的不足 考核要求: 1.心理特質(zhì)(Trait)及其可測性假設(shè) 2.測量誤差及其來源 3.真分?jǐn)?shù)模型及其假設(shè) 4.經(jīng)典測驗(yàn)理論的不足 第三章測驗(yàn)信度 教學(xué)要點(diǎn): 通過本章的學(xué)習(xí),掌握信度的意義,信度系數(shù)的計(jì)算,了解影響 信度的主要因素以及提高信度的常用方法等內(nèi)容。 教學(xué)時(shí)數(shù):[4學(xué)時(shí)] 教學(xué)內(nèi)容: 一、信度的意義 1.信度指實(shí)測值和真值相差的程度 2.信度指統(tǒng)計(jì)量與參數(shù)之間的接近程度 3.信度是指一種測驗(yàn)對(duì)相同的應(yīng)試者再次測驗(yàn)時(shí)引起同樣反應(yīng)的程 度 二、信度系數(shù)的計(jì)算 1.穩(wěn)定性系數(shù) 2.等值性系數(shù) 3.等值穩(wěn)定性系數(shù) 4.內(nèi)部一致性系數(shù) 5.評(píng)分者的信度系數(shù) 三、提高測驗(yàn)信度的方法 1.信度系數(shù)以多大為宜 2.影響信度的因素 3.提高測驗(yàn)信度的方法 考核要求: 1.信度的意義 2.信度系數(shù)的計(jì)算 識(shí)記:穩(wěn)定性系數(shù),等值性系數(shù),等值穩(wěn)定性系數(shù),內(nèi)部一致性系 數(shù),評(píng)分者的信度系數(shù) 3.提高測驗(yàn)信度的方法 請列舉一些你所使用過或接觸過的量表 思考: 量表的作用是什么? 你如何解釋下述現(xiàn)象? 一個(gè)很聰明的孩子,測得智商是80分 一個(gè)學(xué)習(xí)很好的學(xué)生,考試成績?yōu)?0分 一個(gè)人緣很好的人,人際關(guān)系測量低于常模值 量表幫助我們了解心理現(xiàn)象(心理特質(zhì)),就像尺子幫助我們測量身高。 思考:我們?nèi)绾沃牢覀冇卸喔撸? 有兩個(gè)工具:尺子 / 秤 尺子的數(shù)據(jù)與我們的目測更一致,而秤盤的數(shù)據(jù)則與我們的目測不一致。因此,尺子是測量身高的有效工具——效度。 什么材料的尺子?——鋼鐵(熱脹冷縮) 涉及到一致性的問題?!哦? ? 物理不等于數(shù)學(xué) ? 1.70與1.7的關(guān)系 ? 總結(jié):量表是我們用來了解心理特質(zhì)的工具,但這個(gè)工具是有誤 差的。誤差要控制在一個(gè)許可的范圍內(nèi)。 ? 什么是誤差? ? 誤差的種類? ? 誤差是在測量中與目的無關(guān)的變因所產(chǎn)生的不準(zhǔn)確或不一致的效 應(yīng)。 ? 誤差分為隨機(jī)誤差和系統(tǒng)誤差。 ? 高爾頓的智力觀 ? 比奈的智力觀 ? 判斷題、選擇題和問答題 ? SX2 = ST2 + SE2 ST2 = SV2 + SI2 SX2 = SV2 + SI2 + SE2 ? 穩(wěn)定性 \ 可靠性 \ 一致性 ? 信度乃是一個(gè)被測團(tuán)體真分?jǐn)?shù)的變異數(shù)與實(shí)得分?jǐn)?shù)的變異數(shù)之 比。 ? rXX=ST2/SX2 ? 信度乃是一個(gè)被測團(tuán)體真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平方。 ? rXX=P2TX ? 思考:相關(guān)系數(shù)的平方? ? 信度乃是一個(gè)測驗(yàn)X與它的任意一個(gè)平行測驗(yàn)X'的相關(guān)系數(shù)。 ? rXX=PXX' ? 重測信度(Test-Retest Reliability) ? 定義:同一量表,同一被試群體,在不同時(shí)間,兩次施測,求其 相關(guān)。 ? 實(shí)質(zhì):表示測驗(yàn)結(jié)果的穩(wěn)定性。故稱之為穩(wěn)定性系數(shù)(CoefficientofStability) ? 形式:施測—適當(dāng)時(shí)間—再施測 ? 間隔時(shí)間越長,穩(wěn)定性系數(shù)越低。適宜時(shí)間間隔依照測驗(yàn)?zāi)康摹? 性質(zhì)及被試特點(diǎn)而定。 幾分鐘至幾年。 ? 年幼兒童,間隔要??;年長群體,間隔可大。智力測驗(yàn)的間隔不 能太短,成就測驗(yàn)的間隔不能太長。 ? 一般間隔時(shí)間不超過六個(gè)月。(即不能讓被試記住上一次測驗(yàn)的內(nèi) 容,又不能讓其特質(zhì)發(fā)生變化,或?qū)λ鶎W(xué)知識(shí)產(chǎn)生遺忘) ? 在一般情況下,間隔施測的副本信度最低,因?yàn)楹芏嘁蛩赜袡C(jī)會(huì) 影響到分?jǐn)?shù)。相反,校正過的分半相關(guān),因?yàn)橛绊懙囊蛩厣?,所? 的信度估計(jì)為最高。 ? 實(shí)際上,有多少種誤差來源,便有 ? 多少種估計(jì)信度的方法。一個(gè)測驗(yàn)?zāi)姆N誤差大,便應(yīng)該用哪種誤 差估計(jì)。有時(shí)一個(gè)測驗(yàn)需要有幾種信度系數(shù),這樣我們就把總分?jǐn)?shù) 的變異數(shù)分成不同的分支。 ? 假設(shè)對(duì)100個(gè)六年級(jí)學(xué)生以兩個(gè)月的時(shí)間間隔先后施測一個(gè)創(chuàng)造 力測驗(yàn)的A\B兩個(gè)復(fù)本,所得的等值性與穩(wěn)定性系數(shù)為0.70。我 們還根據(jù)被試對(duì)每個(gè)復(fù)本的反應(yīng)計(jì)算出分半信度為0.80(先計(jì)算 每個(gè)復(fù)本的分半相關(guān)系數(shù)。將二者平均后再用斯皮爾曼-布朗公式 校正)。同時(shí),我們讓另一個(gè)評(píng)分者隨機(jī)抽取50份卷子另外評(píng)分, 得到評(píng)分者信度為0.92。然后,我們對(duì)這三種方法所產(chǎn)生的誤差 變異進(jìn)行分析。 一個(gè)假想測驗(yàn)的誤差變異來源分析 信度類型 誤差變異量 誤差變異來源 復(fù)本信度(間隔施測) 1-0.70=0.30 時(shí)間與內(nèi)容取樣 分半信度 1-0.80=0.20 內(nèi)容取樣 上述二者差異 0.30-0.20=0.10 時(shí)間取樣 評(píng)分者信度 1-0.92=0.08 評(píng)分者差異 誤差變異總和 0.20+0.10+0.08=0.38 真實(shí)變異 1-0.38=0.62 一個(gè)假想測驗(yàn)的誤差變異來源分析 真實(shí)變異 誤差變異 時(shí)間上的穩(wěn)定性, 復(fù)本之間的一致性, 評(píng)分者之間的一致性 時(shí)間取樣誤差 內(nèi)容取樣誤差 評(píng)分者間差異 62% 20% 10% 8% 第四章 測驗(yàn)的效度 教學(xué)要點(diǎn): 通過本章的學(xué)習(xí),掌握效度的含義,效度估計(jì)方法,了解影響信度 與效度的關(guān)系,影響效度的因素以及提高信度的幾種方法等內(nèi)容。 教學(xué)時(shí)數(shù):[10學(xué)時(shí)] 教學(xué)內(nèi)容: 一、效度概述 1.效度的一般定義及其內(nèi)涵 效度是指測驗(yàn)的準(zhǔn)確性,即測驗(yàn)?zāi)軌驕y出他們所欲測的特質(zhì)的程度。 2.效度的統(tǒng)計(jì)與原理 3.效度的信度關(guān)系 (1)高效度,高信度(2)高信度,低效度(3)低信度,低效度 二、效度的估計(jì) 1966年美國心理學(xué)會(huì)在《教育心理測驗(yàn)值標(biāo)準(zhǔn)》中將效度分為三大類: 1.內(nèi)容效度(Content Validity) 內(nèi)容效度指測驗(yàn)實(shí)際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。 2.結(jié)構(gòu)效度(Construct Validity) 結(jié)構(gòu)效度是指測驗(yàn)對(duì)于被稱作構(gòu)想的某一理論概念或特質(zhì)測量的程度。 3.實(shí)證效度(Criterion related Validity) 實(shí)證效度是指一個(gè)測驗(yàn)對(duì)處于特定情景中的個(gè)體的行為進(jìn)行估計(jì)的有效性。 三、提高測量效度的方法 1.各種測量效度的要求 2.提高效度的方法 (1)控制系統(tǒng)誤差,(2)精心編制量表,(3)妥善組織測驗(yàn), (4)擴(kuò)充樣本容量,(5)適當(dāng)增加測驗(yàn)的長度 3.效度的一般定義及其內(nèi)涵 效度是指測驗(yàn)的準(zhǔn)確性,即測驗(yàn)?zāi)軌驕y出他們所欲測的特質(zhì)的程度。 4.效度的統(tǒng)計(jì)與原理 5.效度與信度的關(guān)系 (1)高效度,高信度(2)高信度,低效度(3)低信度,低效度 四、效度的估計(jì) 1966年美國心理學(xué)會(huì)在《教育心理測驗(yàn)值標(biāo)準(zhǔn)》中將效度分為三大類: 1.內(nèi)容效度(Content Validity) 內(nèi)容效度指測驗(yàn)實(shí)際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。 2.結(jié)構(gòu)效度(Construct Validity) 結(jié)構(gòu)效度是指測驗(yàn)對(duì)于被稱作構(gòu)想的某一理論概念或特質(zhì)測量的程度。 3.實(shí)證效度(Criterion related Validity) 實(shí)證效度是指一個(gè)測驗(yàn)對(duì)處于特定情景中的個(gè)體的行為進(jìn)行估計(jì)的有效性。 五、提高測量效度的方法 1.各種測量效度的要求 2.提高效度的方法 (1)控制系統(tǒng)誤差,(2)精心編制量表,(3)妥善組織測驗(yàn),(4)擴(kuò)充樣本容量,(5)適當(dāng)增加測驗(yàn)的長度 考核要求: 1.效度的一般定義及其內(nèi)涵 2.效度的統(tǒng)計(jì)與原理 3.效度與度的信度關(guān)系 4.效度的估計(jì) 內(nèi)容效度,結(jié)構(gòu)效度,實(shí)證效度 5.提高測量效度的方法 第五章測驗(yàn)的難度和區(qū)分度 教學(xué)要點(diǎn): 通過本章的學(xué)習(xí),掌握測驗(yàn)難度和區(qū)分度的含義,以及難度、區(qū)分度的計(jì)算,了解難度、區(qū)分度對(duì)測驗(yàn)質(zhì)量的影響等內(nèi)容。 教學(xué)時(shí)數(shù):[10學(xué)時(shí)] 教學(xué)內(nèi)容: 一、測驗(yàn)難度的計(jì)算 1.計(jì)算難度的基本公式 (1)以試題通過率計(jì)算難度:P=R/N,(2)用平均數(shù)計(jì)算試題的難度 2.用極端分組法計(jì)算難度 二、難度的轉(zhuǎn)換 難度轉(zhuǎn)換的方法 三、測驗(yàn)題目難度水平的確定 四、區(qū)分度的定義 1.定義:區(qū)分度是指測驗(yàn)對(duì)于考生實(shí)際水平的區(qū)分度程度或鑒別能力。 2.區(qū)分度與測驗(yàn)信度、難度的關(guān)系 五、區(qū)分度計(jì)算 1.極端分組法計(jì)算 (1)客觀題計(jì)算,(2)論文題計(jì)算 2.用內(nèi)部一致性系數(shù)(Internal Consistency)計(jì)算區(qū)分度 (1)用點(diǎn)二列相關(guān)計(jì)算區(qū)分度 (2)用二列相關(guān)計(jì)算區(qū)分度 (3)用Φ相關(guān)計(jì)算區(qū)分度 (4)用四分相關(guān)計(jì)算區(qū)分度 (5)用皮爾遜相關(guān)法計(jì)算區(qū)分度 (6)D(鑒別指數(shù))的經(jīng)驗(yàn)標(biāo)準(zhǔn) 考核要求: 1.測驗(yàn)難度的計(jì)算 2.計(jì)算難度的基本公式 3.難度的轉(zhuǎn)換 4.測驗(yàn)題目難度水平的確定 5.區(qū)分度的含義 6.區(qū)分度與測驗(yàn)信度、難度的關(guān)系 7.區(qū)分度計(jì)算 用極端分組法計(jì)算,用內(nèi)部一致性系數(shù)(Internal Consistency)計(jì)算區(qū)分度 第二編測量的一般步驟和方法 第六章 測驗(yàn)的編制與實(shí)施 教學(xué)要點(diǎn): 通過本章的學(xué)習(xí),掌握編制測驗(yàn)的基本程序,測驗(yàn)的實(shí)施過程及須注意的事項(xiàng)等內(nèi)容。 教學(xué)時(shí)數(shù):[10學(xué)時(shí)] 教學(xué)內(nèi)容: 第一節(jié)編制心理與教育測驗(yàn)的基本程序 一、確定測驗(yàn)的目的 1.明確測量對(duì)象 2.明確測量目標(biāo) 3.明確測量用途 二、制定編題計(jì)劃 三、編輯測驗(yàn)項(xiàng)目 1.收集測驗(yàn)資料 2.選擇項(xiàng)目形式 3.編寫測驗(yàn)項(xiàng)目 四、測驗(yàn)與項(xiàng)目分析 1.預(yù)測 2.項(xiàng)目分析 五、合成測驗(yàn) 1.測驗(yàn)項(xiàng)目的選擇 2.測驗(yàn)項(xiàng)目的編排 3.編制副本 六、測驗(yàn)標(biāo)準(zhǔn)化 1.測驗(yàn)內(nèi)容 2.實(shí)測過程 3.測驗(yàn)評(píng)分 4.測驗(yàn)分?jǐn)?shù)解釋 七、鑒定測驗(yàn) 1.信度 2.效度 3.測驗(yàn)量表與常模 八、編寫測驗(yàn)說明書 第二節(jié) 測驗(yàn)的實(shí)施 一、測驗(yàn)的實(shí)施過程 1.實(shí)測前的準(zhǔn)備工作 2.指導(dǎo)語 3.測驗(yàn)情境 4.測驗(yàn)焦慮 5.與受測者建立良好的協(xié)調(diào)關(guān)系 6.評(píng)分技術(shù) 二、測驗(yàn)分?jǐn)?shù)的解釋 1.如何看待測驗(yàn)分?jǐn)?shù)的意義 2.如何向受測者報(bào)告測驗(yàn)分?jǐn)?shù) 考核要求: 1. 編制測驗(yàn)的基本程序 確定測驗(yàn)的目的,制定編題計(jì)劃,編輯測驗(yàn)項(xiàng)目,測驗(yàn)與項(xiàng)目分析,合成測驗(yàn),測驗(yàn)標(biāo)準(zhǔn)化,鑒定測驗(yàn),編寫測驗(yàn)說明書 2.測驗(yàn)的實(shí)施過程及須注意的事項(xiàng)等內(nèi)容 3.測驗(yàn)分?jǐn)?shù)的解釋 第七章 測驗(yàn)分?jǐn)?shù)的解釋與應(yīng)用 教學(xué)要點(diǎn): 通過本章的學(xué)習(xí),掌握測驗(yàn)分?jǐn)?shù)的類型,常模及常模類型,以及測驗(yàn)分?jǐn)?shù)的解釋和常模的應(yīng)用等內(nèi)容。 教學(xué)時(shí)數(shù):[4學(xué)時(shí)] 教學(xué)內(nèi)容: 一、分?jǐn)?shù)與常模 1.分?jǐn)?shù)的種類和含義 識(shí)記:(1)原始分?jǐn)?shù),(2)導(dǎo)出分?jǐn)?shù) 2.常模 3.年齡常模 4.年級(jí)常模 5.百分等級(jí)常模 6.標(biāo)準(zhǔn)分?jǐn)?shù)常模 二、測驗(yàn)的等值 1.測驗(yàn)等值的實(shí)質(zhì) 2.測驗(yàn)等值的條件 (1)同質(zhì)性,(2)等信度,(3)公平性,(4)可遞推性, (5)對(duì)稱性,(6)樣本不變性 3.測驗(yàn)等值的基本算法 識(shí)記:(1)百分位等值(2)線性等值 4.常用等值設(shè)計(jì) 5.測驗(yàn)等值誤差估計(jì) 考核要求: 1.分?jǐn)?shù) 原始分?jǐn)?shù),導(dǎo)出分?jǐn)?shù) 2.常模 年齡常模,年級(jí)常模,百分等級(jí)常模,標(biāo)準(zhǔn)分?jǐn)?shù)常模 3.測驗(yàn)的等值的實(shí)質(zhì)與條件 4.測驗(yàn)等值的基本算法:百分位等值,線性等值 第八章 測驗(yàn)的項(xiàng)目分析 項(xiàng)目分析包括定性分析和定量分析。定性分析包括考慮內(nèi)容效度、題目編寫的恰當(dāng)性和有效性等;定量分析主要是指題目難度和區(qū)分度的測量。 對(duì)項(xiàng)目進(jìn)行篩選和修訂,可以提高測驗(yàn)的信度和效度。 第一節(jié) 測驗(yàn)的難度 一、難度(difficulty)的意義 難度,指項(xiàng)目的難易程度。 在最高作為測驗(yàn)中,稱為“難度”,而在典型作為測驗(yàn)中,則指“通俗性”。兩者都是指在總體中,能夠正確或確切回答某項(xiàng)目的人數(shù)。 二、難度的計(jì)算 (一)二分法記分項(xiàng)目的難度 1.通過率 P=R/N 2.極端分組法(上下27%) P=(PH+PL)/2 (二)非二分法記分項(xiàng)目的難度 P=X / Xmax X為所有被試在該項(xiàng)目上的平均得分, Xmax為該項(xiàng)目的滿分。 三、測驗(yàn)難度水平的確定 效標(biāo)參照測驗(yàn)、掌握測驗(yàn):不考慮難度; 選拔測驗(yàn):難度=錄取率; 對(duì)于選擇題來說,難度一般應(yīng)大于猜測概率; 無論是速度測驗(yàn),還是難度測驗(yàn),一般都應(yīng)防止被試得滿分,因 為滿分的意義是不明確的。 大體而言,難度為0.50時(shí)最理想,此時(shí)項(xiàng)目具有最大的鑒別力。但在實(shí)際操作中,讓所有項(xiàng)目難度都到達(dá)0.50困難很大,而且也不必要,一般只需使項(xiàng)目的平均難度接近0.50,而各個(gè)項(xiàng)目的難度在0.50 0.20之間變化。 四、難度的等距變換 根據(jù)正態(tài)分布表,將難度P作為正態(tài)曲線下的面積,轉(zhuǎn)換成相應(yīng)的Z分?jǐn)?shù),這就是等距量表。 P Y 0 Z 美國教育服務(wù)中心以Δ 作為難度指標(biāo): Δ=13+4Z P = .0013 Z = +3 Δ= 25 P = .16 Z = +1 Δ= 17 P = .50 Z = 0 Δ= 13 P = .84 Z = -1 Δ= 9 P = .9987 Z = -3 Δ= 1 五、難度對(duì)測驗(yàn)的影響 (一)測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的分布形態(tài) 難度大,正偏態(tài) 難度低,負(fù)偏態(tài) (二)測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的離散程度 測驗(yàn)過難或過易,分?jǐn)?shù)全距縮小,信度降低。 P=0.50時(shí)最佳 第二節(jié) 測驗(yàn)的區(qū)分度 一、區(qū)分度的意義 區(qū)分度(discrimination)是指測驗(yàn)項(xiàng)目對(duì)被試心理品質(zhì)水平差異的區(qū)分能力或鑒別能力。 項(xiàng)目的區(qū)分度是測驗(yàn)是否有效的“指示器”。 二、區(qū)分度的計(jì)算 (一)項(xiàng)目鑒別指數(shù)法 1.鑒別指數(shù)(index of discrimination,D)的計(jì)算 D = PH - PL 取值范圍:-1~ +1 2.極端組的劃分 27%規(guī)則 一般情況下,取上下25%~33%均可。 樣本少時(shí),可以取50% 注意: 由于計(jì)算機(jī)的方便使用,可以上下50%作為劃分高低組的標(biāo)準(zhǔn),或者多分幾組,對(duì)區(qū)分度和難度作詳細(xì)分析。因?yàn)橹蝗∩舷聝啥?,只利用了一部分資料,浪費(fèi)了很多信息,有可能得出錯(cuò)誤結(jié)論。 (二)相關(guān)法(項(xiàng)目-總分相關(guān)) 1.點(diǎn)二列相關(guān) Xp-Xq rpb= √pq St 2.二列相關(guān) Xp - Xq pq Xp - Xt p rb= 或 rb= ? St y St y 3.φ 相關(guān) ad-bc rφ= √(a+b)(c+d)(a+c)(b+d) 4.四分相關(guān) 5. 項(xiàng)目和總分相關(guān)重疊的校正 當(dāng)測驗(yàn)項(xiàng)目超過20個(gè)項(xiàng)目時(shí),校正法通常毫無意義。 rtpSt – Sp rpq =√St2+ Sp2 –2rtpStSp (三)項(xiàng)目特征曲線(item characteristic curve, ICC) 項(xiàng)目特征曲線描述了效標(biāo)分?jǐn)?shù)不同的被試在該項(xiàng)目上的通過率。 曲線坡度越陡,鑒別力越好,預(yù)測的誤差越小。 三、區(qū)分度與難度的關(guān)系 難度和區(qū)分度都是針對(duì)一定團(tuán)體而言的。 一般來說,較難的項(xiàng)目對(duì)高水平被試區(qū)分度高,較易的項(xiàng)目對(duì)低水平被試的區(qū)分度高。 四、區(qū)分度的相對(duì)性 (一)不同的計(jì)算方法,所得區(qū)分值不同 區(qū)分度有幾種計(jì)算方法? (二)樣本容量大小影響相關(guān)法區(qū)分度值的大小 樣本越大,區(qū)分度越…… (三)分組標(biāo)準(zhǔn)影響鑒別指數(shù) 分組越極端,區(qū)分度越…… (四)被試樣本的同質(zhì)性程度影響區(qū)分度值的大小 樣本越同質(zhì),區(qū)分度越…… 第三節(jié)項(xiàng)目分析的特殊問題 一、多重選擇題的項(xiàng)目分析(誘答分析) 對(duì)于多重選擇題,除了分析難度和區(qū)分度外,還要對(duì)每個(gè)選項(xiàng)進(jìn)行分析。 下列哪一個(gè)最有可能是偏執(zhí)型精神分裂癥患者的次級(jí)癥狀: A 幻聽 B 癱瘓 C 記憶喪失 D 厭食 如果所有被試都選擇某一正確的選項(xiàng),說明該選項(xiàng)…… 如果沒有一個(gè)被試選擇某個(gè)錯(cuò)誤選項(xiàng),說明該選項(xiàng)…… 如果所有被試都選擇某個(gè)錯(cuò)誤選項(xiàng),說明該選項(xiàng)…… 如果高分組被試的選擇集中在兩個(gè)選項(xiàng)上,說明該選項(xiàng)…… 如果高分組和低分組對(duì)正確選項(xiàng)的選擇沒有區(qū)別,說明該選項(xiàng)…… 如果所有被試都未回答某個(gè)題目,說明該題…… 如果選擇各個(gè)選項(xiàng)的人數(shù)幾乎相等,說明該題…… 二、速度測驗(yàn)的項(xiàng)目分析 對(duì)前面部分的測驗(yàn)項(xiàng)目,難度和區(qū)分度都…… 對(duì)后面部分的測驗(yàn)項(xiàng)目,難度和區(qū)分度都…… 三、標(biāo)準(zhǔn)參照測驗(yàn)的項(xiàng)目分析 在標(biāo)準(zhǔn)參照測驗(yàn)中,無須考慮項(xiàng)目的難度和區(qū)分度,只要項(xiàng)目的內(nèi) 容很重要就行。 也可以通過比較教學(xué)或訓(xùn)練的前測和后測結(jié)果來進(jìn)行項(xiàng)目分析,用 來說明教學(xué)或訓(xùn)練的效果以及項(xiàng)目編制是否適當(dāng)。 四、項(xiàng)目-團(tuán)體的相互作用 具有不同性質(zhì)(性別、種族、職業(yè)等)的團(tuán)體,在測驗(yàn)得分上也 存在差異,即同樣的項(xiàng)目可能有不同的難度。 如果測驗(yàn)要求對(duì)所有個(gè)體都相對(duì)“公平”,那么,就應(yīng)該排除那些有 利于或不利于不同性質(zhì)的亞團(tuán)體的項(xiàng)目; 如果測驗(yàn)的目的就是為了考察不同亞團(tuán)體的差異,那么,就應(yīng)選 擇使團(tuán)體差異盡可能大的題目。 五、有效性與可靠性的矛盾 ? 同質(zhì)性信度要求項(xiàng)目之間有高相關(guān),各項(xiàng)目的難度均等; ? 對(duì)于預(yù)測效度來說,因?yàn)樾?biāo)的變異范圍較大,如果項(xiàng)目越同質(zhì),那么效標(biāo)關(guān)聯(lián)效度則低;因此,效標(biāo)關(guān)聯(lián)效度要求各項(xiàng)目之間要有一定的差異,即項(xiàng)目之間相關(guān)低,這樣才能保證測驗(yàn)得分與效標(biāo)之間有高相關(guān),即高的效標(biāo)關(guān)聯(lián)效度。 因此,對(duì)于多數(shù)心理測驗(yàn)來說,項(xiàng)目之間中等程度的相關(guān),可使二者調(diào)和,獲得較為滿意的(同質(zhì)性)信度和(效標(biāo)關(guān)聯(lián))效度。 第九章 學(xué)績測驗(yàn) 第一節(jié) 學(xué)績測驗(yàn)概述 一、學(xué)績測驗(yàn)的性質(zhì) 最高作為測驗(yàn)可以分為:學(xué)績測驗(yàn)、能力測驗(yàn)、能力傾向測驗(yàn)。 學(xué)績,指經(jīng)過一定的教學(xué)或訓(xùn)練后所學(xué)到的東西,是在一個(gè)比較明確 的、相對(duì)限定的范圍內(nèi)的學(xué)習(xí)結(jié)果。 能力傾向指學(xué)習(xí)的能力,是在給予適當(dāng)?shù)臋C(jī)會(huì)時(shí)獲得某種知識(shí)或技能 的能力。 能力介于學(xué)績和能力傾向之間,指的是當(dāng)前的知識(shí)或技能的水平,既 有正式學(xué)習(xí)的,也有非正式學(xué)習(xí)的結(jié)果,既包括學(xué)術(shù)技能,又包 括非學(xué)術(shù)技能。 學(xué)績測驗(yàn)用來描述現(xiàn)狀,指明一個(gè)人已經(jīng)學(xué)會(huì)了什么和能做什么。 二、學(xué)績測驗(yàn)的基本假設(shè) 1 學(xué)績測驗(yàn)所測量的知識(shí)和技術(shù)的范圍能明確界定。 2 測驗(yàn)所測量的是研究者認(rèn)為重要的東西,而不是與測量目的無關(guān)的東西。 3 被試有同樣的機(jī)會(huì)學(xué)習(xí)測驗(yàn)所包含的材料。 三、學(xué)績測驗(yàn)的分類 (一)按測驗(yàn)的編制方法分 教師自編課堂測驗(yàn),標(biāo)準(zhǔn)化學(xué)績測驗(yàn) (二)按測驗(yàn)內(nèi)容分 單科測驗(yàn),多科測驗(yàn) 單元測驗(yàn),總測驗(yàn) (三)按測驗(yàn)的用途分 考察性測驗(yàn),診斷性測驗(yàn),準(zhǔn)備性測驗(yàn),選拔與安置測驗(yàn),職業(yè)水平測驗(yàn),用于研究的測驗(yàn) (四)按測驗(yàn)評(píng)分的參照系分 常模參照性測驗(yàn),目標(biāo)參照性測驗(yàn) (五)按測驗(yàn)的題型分 客觀測驗(yàn),論文式測驗(yàn) 四、學(xué)績測驗(yàn)的應(yīng)用 1 反饋功能 2 診斷功能 3 輔助教學(xué)管理 4 研究工具 5 人才選拔與安置 第二節(jié) 標(biāo)準(zhǔn)化學(xué)績測驗(yàn) 一、標(biāo)準(zhǔn)化學(xué)績測驗(yàn)的基本要求 1 命題組卷標(biāo)準(zhǔn)化 測驗(yàn)?zāi)繕?biāo),試題的措辭、難度、區(qū)分度,題型比例、題量 2 施測標(biāo)準(zhǔn)化 環(huán)境、時(shí)間、指導(dǎo)語、主試 3 評(píng)分標(biāo)準(zhǔn)化 標(biāo)準(zhǔn)答案、評(píng)分細(xì)則、評(píng)分者人數(shù) 4 測驗(yàn)分?jǐn)?shù)解釋標(biāo)準(zhǔn)化 是常模參照還是目標(biāo)參照 二、標(biāo)準(zhǔn)化學(xué)績測驗(yàn)的編制 由學(xué)科專家與測驗(yàn)編制專家共同完成,其步驟與一般心理測驗(yàn)的編制程序相同。 (一)確定測驗(yàn)?zāi)康模x定測驗(yàn)編制的方法 考察還是診斷,常模參照還是目標(biāo)參照 (二)分析測量目標(biāo),擬訂測驗(yàn)編制計(jì)劃 雙向細(xì)目表,題型,題量 (三)編題征題與選題組卷 編題征題→試測→組卷 (四)調(diào)查測驗(yàn)質(zhì)量參數(shù),編制測驗(yàn)常模 難度、區(qū)分度、信度、效度、常模 (五)編寫測驗(yàn)指導(dǎo)書,正式出版發(fā)行 三、國外常用標(biāo)準(zhǔn)化學(xué)績測驗(yàn)簡介 (一)斯坦福成就測驗(yàn) ? 綜合性學(xué)績測驗(yàn) ? 適用范圍:1~9年級(jí) ? 內(nèi)容:詞匯、閱讀理解、拼字、聽理解、詞匯學(xué)習(xí)技能、語言、數(shù)學(xué)概念、數(shù)學(xué)計(jì)算、數(shù)學(xué)應(yīng)用、社會(huì)科學(xué)常識(shí)、自然科學(xué)常識(shí) 斯坦福早期學(xué)校成就測驗(yàn)(適用于幼兒園和小學(xué)一年級(jí)) 斯坦福學(xué)業(yè)技能測驗(yàn)(適用于8~12年級(jí)) 導(dǎo)出分?jǐn)?shù):百分等級(jí)、標(biāo)準(zhǔn)九、年級(jí)當(dāng)量、量表分?jǐn)?shù)、正態(tài)曲線當(dāng)量 分測驗(yàn)信度均在0.80以上。 (二)關(guān)鍵數(shù)學(xué)算術(shù)診斷測驗(yàn) 適用范圍:學(xué)前兒童~小學(xué)六年級(jí) q 測驗(yàn)內(nèi)容: ? 內(nèi)容塊:數(shù)學(xué)、分?jǐn)?shù)、幾何、符號(hào) ? 運(yùn)算塊:加法、減法、乘法、除法、心算、數(shù)字推理 ? 應(yīng)用塊:文字題、補(bǔ)充、金錢、測量、時(shí)間 q 診斷: ? 總體水平診斷 ? 分塊水平診斷 ? 分測驗(yàn)水平診斷 ? 項(xiàng)目水平診斷 四、標(biāo)準(zhǔn)化學(xué)績測驗(yàn)的題庫建設(shè) 一個(gè)高質(zhì)量的題庫應(yīng)具有的性質(zhì): ? 有一種科學(xué)的測量理論; ? 貯備一定數(shù)量的試題,所有試題品質(zhì)優(yōu)良,技術(shù)參數(shù)完備; ? 題庫內(nèi)部結(jié)構(gòu)層次清楚、分類嚴(yán)謹(jǐn),試題檢索方便; ? 題庫管理方便,可控性強(qiáng),易于維護(hù)更新; ? 保密性強(qiáng)。 五、我國高考的標(biāo)準(zhǔn)化試驗(yàn) 第三節(jié) 教師自編課堂測驗(yàn) 一、教師自編課堂測驗(yàn)的特點(diǎn) ? 測驗(yàn)形式靈活多變,與測驗(yàn)?zāi)康耐耆恢? ? 測驗(yàn)內(nèi)容與教材內(nèi)容完全一致 ? 測驗(yàn)難度切合學(xué)生的實(shí)際水平 ? 測驗(yàn)編制簡易快速 二、教師自編課堂測驗(yàn)的步驟與方法 ? 審查測驗(yàn)?zāi)康? ? 制定測驗(yàn)編制計(jì)劃 ? 命題與組卷 三、教師自編課堂測驗(yàn)應(yīng)注意的問題 ? 教師要深入研究教材,深入研究學(xué)生 ? 要維護(hù)準(zhǔn)確穩(wěn)定的合格標(biāo)準(zhǔn) ? 要客觀評(píng)價(jià)自己的命題技術(shù),合理使用各種題型 ? 要注意總結(jié)命題經(jīng)驗(yàn),提高命題技術(shù) ? 要盡量控制評(píng)分誤差,防止簡單粗糙 ? 要做一些定量分析研究 第十章 能力測驗(yàn)(上) 第一節(jié) 智力測驗(yàn)的理論基礎(chǔ) (一)什么是智力? Spearman(1904,1923):智力是一種普遍的能力,它主要涉及 聯(lián)系的引出(eduction)和相關(guān)的引出。 Binet & Simon(1905):智力是正確進(jìn)行理解、判斷和推理的能 力。 Terman(1916):智力是形成概念,并且抓住其重要性的能力。 Thorndike(1921):智力是從真理或事實(shí)角度產(chǎn)生良好反應(yīng)的能 力。 Thurstone(1921):智力是抑制本能反應(yīng),靈活地想象不同反應(yīng), 并且把修改后的本能反應(yīng)轉(zhuǎn)換為外顯行為的能力。 Wechsler(1939):智力是個(gè)體有目的地行動(dòng),理性地思考以及有 效地應(yīng)付環(huán)境的總體能力。 Piaget(1972):智力是總括性的術(shù)語,指用來適應(yīng)物理和社會(huì)環(huán) 境的認(rèn)知結(jié)構(gòu)的組織和平衡的高級(jí)形式。 Sternberg(1985):智力是指自動(dòng)信息加工和產(chǎn)生適合于新情況 的行為的心理能量,它包括元成分、操作成分和知識(shí)獲得成分。 Eysenck(1986):智力是將信息無錯(cuò)地傳遞過皮層的能力。 Gardner(1986):智力是解決問題,制造在某些文化范圍內(nèi)有價(jià) 值的產(chǎn)品的能力或技術(shù)。 共同點(diǎn): w智力是適應(yīng)環(huán)境的能力 w智力是通過經(jīng)驗(yàn)進(jìn)行學(xué)習(xí)的能力 w 智力是人們在獲得知識(shí)和運(yùn)用知識(shí)解決實(shí)際問題時(shí)所必須具備的 心理?xiàng)l件或特征。 Boring(1923):智力就是智力測驗(yàn)所測量的東西。 Sternberg等(1981)的研究 專家認(rèn)為:語詞能力、問題解決能力和實(shí)際智能最重要 外行認(rèn)為:實(shí)際問題解決能力、語詞能力和社會(huì)能力最重要 (二)智力的理論 Galton和感覺敏銳度 1.二因素論 Spearman的一般因素(G)和特殊因素(S) 2.多因素論 Thurstone的群因素(語文理解、言語流暢性、推理、空間想象、 數(shù)字、記憶、知覺速度) 3.二維結(jié)構(gòu)模型 希萊辛格和古特曼(1966) 第一維:言語能力、數(shù)學(xué)能力、圖形和空間能力 第二維:規(guī)則應(yīng)用能力、規(guī)則歸類的能力、學(xué)術(shù)成就 4. Cattell的流體智力與晶體智力 5. Gardner的多元智力理論 言語、邏輯-數(shù)學(xué)、空間、音樂、身體運(yùn)動(dòng)、社交、自知 6. Sternberg智力的認(rèn)知心理學(xué)理論 智力成分:元成分、操作成分、知識(shí)獲得成分 智力情境:適應(yīng)環(huán)境、塑造環(huán)境、選擇新環(huán)境 智力經(jīng)驗(yàn):處理新任務(wù)、自動(dòng)化加工 7. 其他: 情緒智力(EQ)、成功智力、實(shí)踐性智力(practical intelligence) 第二節(jié) 個(gè)體智力測驗(yàn) 一、比內(nèi)量表 (一)比內(nèi)-西蒙量表 1.1905年量表 ? 世界上第一個(gè)智力量表; ? 內(nèi)容:30道題(記憶、言語、理解、手工操作)。 ? 題目排列方式:從易到難。 ? 指標(biāo):通過項(xiàng)目數(shù)。如白癡最多只能通過6項(xiàng),低能的成人可通 過7~15項(xiàng)。 ? 眼睛是否隨動(dòng)的物體移動(dòng)。 ? 用觸覺刺激喚起抓握反應(yīng)。 ? 用視覺刺激喚起抓握反應(yīng)。 ? 辨認(rèn)食物。 ? 搜尋食物。 ? 執(zhí)行簡單的命令和模仿簡單的手勢。 ? 認(rèn)識(shí)物體。 ? 認(rèn)識(shí)圖片。 ? 列舉圖片中的人物和物體。 ? 比較兩條線的長短。 ? 復(fù)述兩個(gè)數(shù)字。 ? 比較兩個(gè)重量。 ? 暗示。 ? 解說物體與人物的名稱。 ? 復(fù)述句子。 ? 說出二物的不同點(diǎn)。 ? 記憶圖片中的物體。 ? 靠記憶重畫圖片。 ? 復(fù)述數(shù)字。 ? 說出二物的相同點(diǎn)。 ? 比較線的長短。 ? 比較重量。 ? 重量記憶。 ? 說出同韻字。 ? 填詞。 ? 用三個(gè)詞造句。 ? 對(duì)答問句。 ? 交換長短針的位置。 ? 剪紙。 ? 抽象名詞的定義。 2.1908年量表 ? 內(nèi)容:增至59道題。 ? 方式:把測驗(yàn)項(xiàng)目按年齡分組。每一歲一組。每個(gè)年齡組項(xiàng)目數(shù) 量不等,最多8項(xiàng),最少3項(xiàng)。 ? 年齡范圍:3~13歲。 ? 指標(biāo):智力年齡。 3.1911年量表 ? 題目:刪舊補(bǔ)新,但總數(shù)仍為59題。 ? 增設(shè)一個(gè)成年組。 ? 除4歲組僅有4個(gè)項(xiàng)目外,其他每個(gè)年齡組一律為5項(xiàng),便于計(jì) 算。 q 對(duì)比內(nèi)-西蒙量表的評(píng)價(jià) 成就: (1)比西量表是第一個(gè)采用復(fù)雜任務(wù)來測量高級(jí)心理過程的測驗(yàn)。 以前的測驗(yàn)主要測量感知覺、運(yùn)動(dòng)等低級(jí)心理過程。 (2)比西量表首次采用年齡作為智力的標(biāo)準(zhǔn),這樣可以對(duì)測驗(yàn)作出 通俗易懂的解釋。 (3)比西量表首次從整體上測量智力,也就是測量智力的普通因素, 而以往心理學(xué)家把感覺辨別力、記憶力、注意力等割裂開來測量。 不足: (1)施測和記分沒有標(biāo)準(zhǔn)化。 (2)常模團(tuán)體的代表性不夠,因而有些項(xiàng)目的安排位置不當(dāng)。 (3)測驗(yàn)項(xiàng)目過少。 (二)斯坦福-比內(nèi)量表 1.斯坦福-比內(nèi)量表的發(fā)展 (1)1916年量表 ? 在修改基礎(chǔ)上增設(shè)39個(gè)新項(xiàng)目,達(dá)到90個(gè)項(xiàng)目。 ? 最早對(duì)施測和記分提供了詳細(xì)的指導(dǎo)語。 ? 引入了智力商數(shù)的概念(比率智商)。 ? 適用年齡:3~13歲。 ? 樣本:1000名兒童和400名成人。 (2)1937年量表 ? 由 L 和 M 兩個(gè)等值型量表構(gòu)成 ? 年齡范圍擴(kuò)大:1.5~18歲 ? 樣本:3184名1.5~18歲兒童,但僅限城市白人 (3)1960年量表 ? 合并了L和M兩型中最好的項(xiàng)目,改為單一量表。 ? 年齡:2~成人 ? 離差智商 ? 4498名1.5~18歲兒童(1937年量表的施測對(duì)象)。 (4)1972年量表 ? 測驗(yàn)內(nèi)容未變; ? 取樣范圍擴(kuò)大(地區(qū)、社會(huì)階層、經(jīng)濟(jì)狀況、民族)。 共2100名被試,其中2~5.5歲每半歲選100名,6~18歲每一歲 選100名。 2.斯比量表的信度和效度 (1)信度 ? 復(fù)本信度:L和M相關(guān)在0.83~0.95之間。 ? 再測信度:高于0.90。 (2)效度 ? 內(nèi)容效度:測驗(yàn)內(nèi)容屬于公認(rèn)的智力范疇。 ? 效標(biāo)關(guān)聯(lián)效度:與學(xué)業(yè)成績、受教育年限的相關(guān)在0.4~0.75之間。 ? 結(jié)構(gòu)效度:假設(shè)智力發(fā)展隨年齡增長,先快后慢(證據(jù):隨年齡 增長,再測穩(wěn)定性逐步提高); 存在G因素(證據(jù):各項(xiàng)目與測驗(yàn)總分的平均相關(guān)為0.66) (三)中國比內(nèi)測驗(yàn) 陸志偉和吳天敏1924年、1936年、1982年三次修訂 內(nèi)容:51題 指標(biāo):離差智商 年齡范圍:2歲~18歲 ? 生活常識(shí) ? 知覺速度及觀察力 ? 空間知覺力和想象力 ? 記憶力 ? 語言能力 ? 判斷推理能力 二、韋克斯勒(Wechsler)智力測驗(yàn) 生平:1896年出生于羅馬尼亞,6歲遷居美國。一戰(zhàn)期間從事心 理測驗(yàn)工作,用陸軍甲、乙種測驗(yàn)、斯比量表來甄選新兵,積累 了豐富的經(jīng)驗(yàn)。 1919年去倫敦大學(xué),師從Spearman和Pearson, 接受G因素理論。1920~1922年在巴黎與西蒙有過接觸。1925 年,在哥倫比亞大學(xué)獲博士學(xué)位,論文《情緒反應(yīng)的測量》。 1932~1967年,任紐約貝爾韋精神病院的主任心理學(xué)家。 編制背景:尋找一種測量成人智力的有效方式。當(dāng)時(shí)的智力測驗(yàn)存在 下列問題: ? 測驗(yàn)項(xiàng)目引不起成人的興趣; ? 過多的項(xiàng)目涉及語詞的操作; ? 指導(dǎo)語過分強(qiáng)調(diào)速度,犧牲了準(zhǔn)確性; ? 計(jì)算心理年齡,不適合成人測驗(yàn)要求。 IQ=測驗(yàn)者的實(shí)際測驗(yàn)分?jǐn)?shù)-這一年齡測驗(yàn)者的平均測驗(yàn)分?jǐn)?shù) 韋氏智力測驗(yàn)家族: 1939年,韋克斯勒-貝利弗測驗(yàn) 1946年,韋克斯勒-貝利弗測驗(yàn)Ⅱ 1949年,韋克斯勒兒童智力量表(WISC) 1955年,韋克斯勒成人智力量表(WAIS) 1967年,韋克斯勒學(xué)前和小學(xué)兒童智力量表(WPPSI) 1974年,韋克斯勒兒童智力量表修訂版(WISC-R) 1981年,韋克斯勒成人智力量表修訂版(WAIS-R) 1989年,韋克斯勒學(xué)前和小學(xué)兒童智力量表(WPPSI-R) 1991年,韋克斯勒兒童智力量表第三版(WISC- Ⅲ ) 韋氏測驗(yàn)的特點(diǎn): (1)10~12個(gè)分測驗(yàn):使用多個(gè)分測驗(yàn),不僅可以得到總IQ,還可 以分析個(gè)體在智力上的強(qiáng)項(xiàng)和弱點(diǎn); (2)言語量表和操作量表各由5~6個(gè)分測驗(yàn)組成,可以單獨(dú)評(píng)價(jià)言 語或操作的各項(xiàng)智力成分,體現(xiàn)了左右腦功能的整合,而且可以 顯示個(gè)體的職業(yè)能力傾向。 (3)共同的IQ計(jì)分系統(tǒng):對(duì)所有測驗(yàn)和所有年齡組,IQ平均為100, 標(biāo)準(zhǔn)差為15。而且每個(gè)分測驗(yàn)的平均分為10,標(biāo)準(zhǔn)差接近3分。 這樣就可以比較被試的各項(xiàng)分測驗(yàn)分?jǐn)?shù),了解其相對(duì)強(qiáng)弱。 (4)不同年齡組有相同的分測驗(yàn):例如,WAIS-R,WISC-R,WPPSI-R 有相同的8個(gè)核心分測驗(yàn)。這不僅方便施測者,而且有助于測驗(yàn) 之間的相互比較。 韋克斯勒測驗(yàn)的分測驗(yàn) (1)常識(shí)(information) 33個(gè)一般知識(shí)性問題,如“誰發(fā)現(xiàn)了美洲?”“我國的首都在哪 里?” “兒童節(jié)是哪一天?” 得分越高,說明興趣越廣泛,好奇心強(qiáng),長時(shí)記憶好。 把該測驗(yàn)放在首位,容易與被試建立關(guān)系,不易引起被試的緊張 和厭煩。 (2)數(shù)字廣度(digit span) 分順背和倒背兩部分(2位到9位數(shù))。 主要測查瞬時(shí)記憶能力。對(duì)智力低者,測其智力;對(duì)智力高者, 測其注意力。 按0或1計(jì)分,總分為兩部分之和。 智力高者在該項(xiàng)上得分未必高,有時(shí)倒背可能會(huì)高于順背成績。腦功能障礙者一般得分較低。但對(duì)有些白癡學(xué)者,能輕易得高 (3)詞匯(vocabulary) 要求被試定義和解釋通過視覺或聽覺呈現(xiàn)給他們的字詞的一般 意義。例如“什么是杯子?”“什么是美麗?” 該測驗(yàn)與抽象概括能力有關(guān)。年齡大的、智力高的、受教育程度 高的、經(jīng)歷豐富的人,其得分高。 問題是計(jì)分困難。答案分四級(jí): 一級(jí):用同義詞,且能說明二者的細(xì)微差別; 二級(jí):具體運(yùn)用詞匯來造句; 三級(jí):望文生義,作字面解釋; 四級(jí):做手勢或指實(shí)物給主試看。 一級(jí)計(jì)2分,二級(jí)計(jì)1分,三四級(jí)計(jì)0分。 (4)算術(shù)(arithmetic) 簡單項(xiàng)目主要是加減法運(yùn)算。難一些的問題需要對(duì)問題進(jìn)行分 析,并運(yùn)用兩種以上的算術(shù)運(yùn)算。 主要測量基本的數(shù)理知識(shí)和數(shù)學(xué)思維、推理能力。 (5)理解(comprehension) 容易的題目主要測常識(shí),如“為什么人要穿衣服?” 難的項(xiàng)目需要了解社會(huì)、文化傳統(tǒng),如“為什么最高法院任命終 身法官?” 該分測驗(yàn)?zāi)芊从潮辉噷?duì)于社會(huì)價(jià)值取向、風(fēng)俗、倫理道德是否理 解和適應(yīng),在臨床上可以鑒別腦器質(zhì)性障礙的病人。 (6)類同(similarities) 讓被試區(qū)分物體、事實(shí)和觀念的重要的相似性與不重要的相似 性,如“襯衫和襪子有什么相似的地方?”測查個(gè)體的邏輯思維、 抽象思維、分析和概括能力。 (7)填圖(picture completion) 要求被試回答圖中缺少了什么重要成分。主要測的是記憶、細(xì)節(jié) 注意能力和視覺敏銳性。 具有病態(tài)觀念的患者往往將自己的思想投射到測驗(yàn)中去。智力落 后者的填圖成績很差。 (8)句子(sentences) 要求被試逐字重復(fù)主試大聲讀出的句子。 測查注意和記憶能力。 (9)幾何圖形(geometric design) 10個(gè)圖案,每個(gè)圖形由一個(gè)圓、一個(gè)正方形和一個(gè)菱形組成, 讓兒童復(fù)寫。 (10)動(dòng)物房(animal pegs) 把某種顏色的圓錐(黑、白、黃、藍(lán))放到合適的動(dòng)物(狗、小 雞、貓、魚)的洞里。測查學(xué)習(xí)能力、手的靈活性、維持注意的 能力。 (一)韋氏成人智力量表 共有11個(gè)分測驗(yàn),其中6個(gè)言語量表(常識(shí)、數(shù)字廣度、詞匯、 算術(shù)、理解和類同),5個(gè)操作量表(填圖、圖片排列、積木圖 案、物體拼湊、數(shù)字符號(hào)) q 信度和效度 ? 背數(shù)和數(shù)字符號(hào)分測驗(yàn)計(jì)算復(fù)本信度,其余部分計(jì)算分半信度, 為0.88~0.98 ? 結(jié)構(gòu)效度:“從各個(gè)方面來測量智力,而不是測量不同類型的智力。” 因素分析表明,有50%的變異來自智力一般因素;各分測驗(yàn)之間 和分量表之間存在普遍的顯著的正相關(guān),表明智力G因素滲透于 智力行為的各個(gè)方面。 ? 內(nèi)容效度:測驗(yàn)項(xiàng)目均取自或參照前人成功用過的量表(比內(nèi)量 表、陸軍a和b)編制。 ? 效標(biāo)關(guān)聯(lián)效度:與斯比量表的相關(guān)0.80;文職人員的言語智商高 于操作智商,技術(shù)工人則相反。 (一)韋氏成人智力量表 共有11個(gè)分測驗(yàn),其中6個(gè)言語量表(常識(shí)、數(shù)字廣度、詞匯、 算術(shù)、理解和類同),5個(gè)操作量表(填圖、圖片排列、積木圖 案、物體拼湊、數(shù)字符號(hào)) q 信度和效度 ? 背數(shù)和數(shù)字符號(hào)分測驗(yàn)計(jì)算復(fù)本信度,其余部分計(jì)算分半信度, 為0.88~0.98 ? 結(jié)構(gòu)效度:“從各個(gè)方面來測量智力,而不是測量不同類型的智力。” 因素分析表明,有50%的變異來自智力一般因素;各分測驗(yàn)之間 和分量表之間存在普遍的顯著的正相關(guān),表明智力G因素滲透于 智力行為的各個(gè)方面。 ? 內(nèi)容效度:測驗(yàn)項(xiàng)目均取自或參照前人成功用過的量表(比內(nèi)量 表、陸軍a和b)編制。 ? 效標(biāo)關(guān)聯(lián)效度:與斯比量表的相關(guān)0.80;文職人員的言語智商高 于操作智商,技術(shù)工人則相反。 (二)韋氏兒童智力量表 ? 12個(gè)分測驗(yàn):5個(gè)言語測驗(yàn)(常識(shí)、類同、算術(shù)、詞匯、理解), 5個(gè)操作測驗(yàn)(填圖、圖片排列、積木圖案、拼圖、譯瑪),2個(gè)備 用測驗(yàn)(背數(shù)和迷津)。 ? 適用年齡:6~16歲 ? 分半信度:0.70~0.86 ? 再測信度:0.65~0.88 ? 效標(biāo)關(guān)聯(lián)效度:以年齡為效標(biāo),得分隨年齡增長而提高。與學(xué)績 測驗(yàn)或其他學(xué)業(yè)行為的相關(guān)為0.50~0.60;與斯比量表的相關(guān)為 0.60~0.71 ? 結(jié)構(gòu)效度:發(fā)現(xiàn)智力一般因素的存在 q 韋克斯勒兒童智力量表(WISC-R)中國修訂本 ? 修訂者:林傳鼎、張厚粲等(1983年) ? 模:中等以上城市(3000人) ? 修訂原則:測題要適合中國兒童的特點(diǎn);改動(dòng)的測題盡可能與原 題性質(zhì)類似、難度接近。主要改動(dòng)有: (1)我國社會(huì)中不常見的或我國兒童不熟悉的測題內(nèi)容,如“一個(gè)鎳 幣等于幾便士?”“美國成年男子平均身高是多少?” (2)不合我國國情的,如“為什么把錢交給慈善機(jī)關(guān)比施舍給街頭乞 丐好?” (3)由于語種不同,翻譯后在難度上發(fā)生變化的,如“三月過后是幾 月?”“啤酒和黃酒的共同點(diǎn)是什么?” (4)凡外國人名、貨幣名稱以及圖片上的人物等盡量使之中國化。 言語量表:常識(shí)、背數(shù)、詞匯、算術(shù)、理解、類同 操作量表:填圖、圖畫排列、積木圖案、拼圖、譯碼、迷津 (三)韋氏幼兒智力量表(WPPSI) ? 年齡:4~6.5歲 ? 11個(gè)分測驗(yàn):5個(gè)言語測驗(yàn)(常識(shí)、理解、詞匯、算術(shù)、類同), 5個(gè)操作測驗(yàn)(填圖、迷津、積木圖案、句子復(fù)述),2個(gè)備用測驗(yàn) (動(dòng)物房、幾何圖案)。 ? 分半信度: ? 再測信度 ? 結(jié)構(gòu)效度:G ? 效標(biāo)關(guān)聯(lián)效度:與斯比量表的相關(guān) ? 對(duì)韋氏量表的評(píng)價(jià) 優(yōu)點(diǎn): (1)具有復(fù)雜的結(jié)構(gòu),能夠較好地反映智力的整體和各個(gè)側(cè)面; (2)各年齡組都接受相同的分測驗(yàn),可以相互比較,并節(jié)省指導(dǎo)測 驗(yàn)的時(shí)間; (3)用離差智商代替比率智商,克服了計(jì)算成人智商的困難。 (4)采用因素分析法研究結(jié)構(gòu)效度更具有理論意義。 (5)各量表之間相互銜接,適用的年齡范圍可以從幼兒直到老年。 缺點(diǎn): (1)施測程序復(fù)雜費(fèi)時(shí); (2)對(duì)于測量智力極高或極低的被試不大適用; (3)缺乏充分的效度資料。 第三節(jié) 團(tuán)體智力測驗(yàn) 一、陸軍測驗(yàn) 一戰(zhàn)時(shí)在Yerkes領(lǐng)導(dǎo)下編制。 q 陸軍甲種(α)測驗(yàn) ? 8個(gè)分測驗(yàn): 照令行事、算術(shù)、常識(shí)、異同(同反義詞)、字句重組、填數(shù)、類比推理、理解 ? 效度:與軍官評(píng)定、斯比量表、教師評(píng)定、學(xué)業(yè)成績的相關(guān) q 陸軍乙種(β)測驗(yàn) ? 7個(gè)分測驗(yàn):迷津、立方體分析、補(bǔ)足數(shù)列、譯碼、數(shù)字校對(duì)、圖畫補(bǔ)缺、幾何形分析 ? 測試對(duì)象:母語非英語的被試和文盲被試 ? 效度:與甲種測驗(yàn)的相關(guān) 二、瑞文推理測驗(yàn) (一)瑞文推理測驗(yàn)的產(chǎn)生與發(fā)展 1.瑞文標(biāo)準(zhǔn)推理測驗(yàn) ? 6歲以上 ? 5個(gè)系列,60個(gè)項(xiàng)目 A組測知覺辨別力、圖形比較、圖形想象 B組測類同、比較、圖形組合 C組測比較、推理、圖形組合 D組測系列關(guān)系、圖套組合 E組測套合、互換等抽象思維能力 2.瑞文彩圖推理測驗(yàn) ? 5~11歲 ? 3個(gè)系列,36個(gè)項(xiàng)目 3.瑞文高級(jí)推理測驗(yàn) ? 適合于高智力成人 ? 第一套12個(gè)項(xiàng)目,第二套36個(gè)項(xiàng)目 (二)瑞文標(biāo)準(zhǔn)推理測驗(yàn)中國修訂本 修訂者:張厚粲(1985年) 取樣:大、中、小城市 年齡:5歲~成人 信度:分半信度、再測信度 效度:與WISC-RC、高考成績的相關(guān)。 聯(lián)合型瑞文測驗(yàn)(CRT,Combined Raven’s Test) (彩色+標(biāo)準(zhǔn)) 團(tuán)體施測的適用范圍:三年級(jí)以上,65歲以下 三、認(rèn)知能力測驗(yàn) 桑代克 初級(jí)型:口頭、詞匯、關(guān)系概念、多重智力和數(shù)量概念 文字測驗(yàn):詞匯、句子填充、語詞分類、語詞類推 數(shù)量測驗(yàn):數(shù)的大小比較、數(shù)列補(bǔ)充、建立關(guān)系 非文字測驗(yàn):圖形分類、圖形推理、圖形綜合 第四節(jié) 嬰幼兒智力測驗(yàn) 一、蓋塞爾發(fā)展順序量表 適用年齡:出生~36個(gè)月 方式:自然情景下對(duì)兒童的觀察 測試工具:響鈴、三色環(huán)、撥浪鼓、積木、搖鈴、蠟筆和紙、皮球、顏色板等 評(píng)定內(nèi)容: ? 動(dòng)作:分大動(dòng)作和細(xì)動(dòng)作。大動(dòng)作指身體的姿態(tài)、頭的平衡、坐、立、爬、走、跑、跳,細(xì)動(dòng)作指手指的運(yùn)用。 ? 言語:聽、理解和表達(dá) ? 環(huán)境適應(yīng):如對(duì)物體和環(huán)境的精細(xì)感覺、協(xié)調(diào)能力 ? 社會(huì)應(yīng)答:與人交往 診斷依據(jù):每個(gè)成熟階段的行為模式。 指標(biāo):DQ(發(fā)育商數(shù)) = 測得的成熟年齡/實(shí)際年齡 2歲小孩的動(dòng)作發(fā)育:逐頁翻書、疊起7~8塊積木、用積木接成火 車、把盛滿水的杯子給人、學(xué)畫圈、能說出4樣畫片的名稱、踢球、 跑且不摔交 嬰幼兒智能發(fā)育階段初步檢查表 關(guān)鍵年齡 成熟階段 動(dòng)作能 應(yīng)物能 言語能 應(yīng)人能 4周 仰臥 不能控制頭部,仰臥姿勢左右不對(duì)稱 眼光能短暫跟 隨人、物,給玩具立即放棄 面部無表情,喉頭作微聲 凝 視四周,“傾聽聲音” 16周 仰臥 頸可豎直,頭微搖動(dòng),仰臥姿勢左右對(duì)稱 開始接 近有響聲的玩具,注視手中有響聲的玩具 發(fā)出咕咕聲,出 聲笑 動(dòng)微笑迎人,玩弄己手 28周 坐 扶起獨(dú)坐,身體前傾 伸手拿玩具,能將玩具自一手 遞交他手 呼號(hào),哭時(shí)作“姆姆”聲 將足置于口中 40周 坐 可獨(dú)坐,爬行,扶著物件站立 能將兩樣玩具放在一 起,平指摘小丸 能呼爸爸媽媽,除爸媽外能說另一字 懂 得成人逗玩,能自己吃- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 心理測量學(xué) 教案
鏈接地址:http://www.820124.com/p-10029949.html