心理測量學教案(舊).doc
《心理測量學教案(舊).doc》由會員分享,可在線閱讀,更多相關《心理測量學教案(舊).doc(83頁珍藏版)》請在裝配圖網上搜索。
心理測量學(舊) 課程說明 (一)課程性質 本課程適合于大學本科心理學、教育科學等專業(yè)的本科生及研 究生教育。本課程的學習將有助于實驗設計、教育評價、心理與 教育統(tǒng)計學等學科的學習,是培養(yǎng)學生科學研究及掌握研究方法 的基礎性學科。 (二)教學目的 通過學習,要求學生掌握心理測量的基本知識、心理測量的編制 和實施、以及良好測量所要求具備的基本條件。更重要的是,通 過本課程的學習要使學生熟練掌握不同心理測量的實際應用。 (三)教學內容 本課程的主要教學內容有:心理測量的基本內涵及其評價和測量 的一般步驟和方法兩部分。內容涉及一般測量解析,測量的要素 及量表類型,測驗信、效度、難度和區(qū)分度,測量的一般步驟和 方法,智力測驗、人格測驗等心理測驗,以及心理測量的綜合應 用和心理測量理論的新發(fā)展等內容。 (四)教學時數 54個課時 (五)教學方式 課堂教學與實踐應用相結合。 第一編 心理測量的基本內涵及其評價 第一章 緒論 教學要點: 通過本章的學習,了解測量的基本性質及其要素,測量量表的四種 水平,心里測量的本質、基本條件及功能,心里測量的發(fā)展以及心 理測量的道德準則等內容,對心理測量有一個概括化的了解。 教學時數:[10學時] 教學內容: 一、一般測量解析 1.測量(Measurement)概論 2.測量的分類 3.心理測量的種類 (1)以測量對象來分,(2)以測量的目的來分,(3)以測量的方式 來分類,(4)以項目結構或組成形式來分,(5)按評價參照的 標準分類 4.測量與測驗(Test)、考試(Examination)、評價(Evaluation)聯(lián)系 與區(qū)別 二、測量的要素及量表類型 1.測量的要素 識記: 單位(Unit),參照點(Reference Point),量表(Scale) 2.量表類型 (1)稱名量表 稱名變量只說明某一事物與其他事物在名稱、類別或屬性上的不 同,并不說明事物與事物之間差異的大小、順序的先后及質的優(yōu) 劣。 (2)順序變量 順序變量是指可以就事物的某一屬性的多少或大小按次序將各 事物加以排列的變量,具有等級性和次序性的特點。 (3)等距變量 等距變量除能表明量的相對大小外,還具有相等的單位。 (4)比率變量 比率變量除了具有量的大小、相等單位外,還有絕對零點。 三、心理測量的本質、基本條件及功能 1.心理測量的本質 2.編制心理測驗的基本條件 3.心理測量的功能 (1)理論研究功能,(2)實際應用功能 四、心理測量發(fā)展簡史 1.主觀經驗性考試階段(1864年以前) 2.客觀標準化測驗階段(1864年——1940年) 3.觀測驗的深入發(fā)展階段(1940年——) 4.西方心理測量的發(fā)展 5.心理測驗在我國的發(fā)展 五、心理測量的道德準則 1.心理測量工作者的素質要求 (1)心理測量工作的知識結構.(2)對心理測量的態(tài)度 2.心理測量工作者的道德準則 (1)測驗的保密和控制原則(2)測驗中個人隱私的保護 考核要求: 1.心理測量的種類 2.測量與測驗(Test)、考試(Examination)、評價(Evaluation)聯(lián)系 與區(qū)別 3.測量的要素及量表類型 單位,參照點,量表,稱名量表,順序變量,等距變量,比率變量 4.心理測量的本質、基本條件及功能 5.心理測量發(fā)展簡史 第二章 經典測驗理論的基本假設 教學要點: 通過本章的學習,掌握經典測驗理論的基本假設,心里特之及其 特性,心里測量的誤差和種類,以及真分數的含義等內容。 教學時數:[6學時] 教學內容: 一、心理特質(Trait)及其可測性假設 1.經典測驗(Classical Test Theory ,CTT)理論 2.特質假設 二、測量誤差及其來源 1. 測量誤差的含義 2.誤差種類 識記: 隨機誤差,系統(tǒng)誤差 3.誤差來源 (1)來自心理測量工具,(2)來自測量對象,(3)來自實測過程 二、真分數模型及其假設 1. 真分數的含義 2.真分數數學模型解析 領會:(1)幾個推理,(2)CTT的基本含義,(3)CTT的基本公式 3.經典測驗理論的不足 考核要求: 1.心理特質(Trait)及其可測性假設 2.測量誤差及其來源 3.真分數模型及其假設 4.經典測驗理論的不足 第三章測驗信度 教學要點: 通過本章的學習,掌握信度的意義,信度系數的計算,了解影響 信度的主要因素以及提高信度的常用方法等內容。 教學時數:[4學時] 教學內容: 一、信度的意義 1.信度指實測值和真值相差的程度 2.信度指統(tǒng)計量與參數之間的接近程度 3.信度是指一種測驗對相同的應試者再次測驗時引起同樣反應的程 度 二、信度系數的計算 1.穩(wěn)定性系數 2.等值性系數 3.等值穩(wěn)定性系數 4.內部一致性系數 5.評分者的信度系數 三、提高測驗信度的方法 1.信度系數以多大為宜 2.影響信度的因素 3.提高測驗信度的方法 考核要求: 1.信度的意義 2.信度系數的計算 識記:穩(wěn)定性系數,等值性系數,等值穩(wěn)定性系數,內部一致性系 數,評分者的信度系數 3.提高測驗信度的方法 請列舉一些你所使用過或接觸過的量表 思考: 量表的作用是什么? 你如何解釋下述現象? 一個很聰明的孩子,測得智商是80分 一個學習很好的學生,考試成績?yōu)?0分 一個人緣很好的人,人際關系測量低于常模值 量表幫助我們了解心理現象(心理特質),就像尺子幫助我們測量身高。 思考:我們如何知道我們有多高? 有兩個工具:尺子 / 秤 尺子的數據與我們的目測更一致,而秤盤的數據則與我們的目測不一致。因此,尺子是測量身高的有效工具——效度。 什么材料的尺子?——鋼鐵(熱脹冷縮) 涉及到一致性的問題?!哦? ? 物理不等于數學 ? 1.70與1.7的關系 ? 總結:量表是我們用來了解心理特質的工具,但這個工具是有誤 差的。誤差要控制在一個許可的范圍內。 ? 什么是誤差? ? 誤差的種類? ? 誤差是在測量中與目的無關的變因所產生的不準確或不一致的效 應。 ? 誤差分為隨機誤差和系統(tǒng)誤差。 ? 高爾頓的智力觀 ? 比奈的智力觀 ? 判斷題、選擇題和問答題 ? SX2 = ST2 + SE2 ST2 = SV2 + SI2 SX2 = SV2 + SI2 + SE2 ? 穩(wěn)定性 \ 可靠性 \ 一致性 ? 信度乃是一個被測團體真分數的變異數與實得分數的變異數之 比。 ? rXX=ST2/SX2 ? 信度乃是一個被測團體真分數與實得分數的相關系數的平方。 ? rXX=P2TX ? 思考:相關系數的平方? ? 信度乃是一個測驗X與它的任意一個平行測驗X'的相關系數。 ? rXX=PXX' ? 重測信度(Test-Retest Reliability) ? 定義:同一量表,同一被試群體,在不同時間,兩次施測,求其 相關。 ? 實質:表示測驗結果的穩(wěn)定性。故稱之為穩(wěn)定性系數(CoefficientofStability) ? 形式:施測—適當時間—再施測 ? 間隔時間越長,穩(wěn)定性系數越低。適宜時間間隔依照測驗目的、 性質及被試特點而定。 幾分鐘至幾年。 ? 年幼兒童,間隔要??;年長群體,間隔可大。智力測驗的間隔不 能太短,成就測驗的間隔不能太長。 ? 一般間隔時間不超過六個月。(即不能讓被試記住上一次測驗的內 容,又不能讓其特質發(fā)生變化,或對所學知識產生遺忘) ? 在一般情況下,間隔施測的副本信度最低,因為很多因素有機會 影響到分數。相反,校正過的分半相關,因為影響的因素少,所得 的信度估計為最高。 ? 實際上,有多少種誤差來源,便有 ? 多少種估計信度的方法。一個測驗哪種誤差大,便應該用哪種誤 差估計。有時一個測驗需要有幾種信度系數,這樣我們就把總分數 的變異數分成不同的分支。 ? 假設對100個六年級學生以兩個月的時間間隔先后施測一個創(chuàng)造 力測驗的A\B兩個復本,所得的等值性與穩(wěn)定性系數為0.70。我 們還根據被試對每個復本的反應計算出分半信度為0.80(先計算 每個復本的分半相關系數。將二者平均后再用斯皮爾曼-布朗公式 校正)。同時,我們讓另一個評分者隨機抽取50份卷子另外評分, 得到評分者信度為0.92。然后,我們對這三種方法所產生的誤差 變異進行分析。 一個假想測驗的誤差變異來源分析 信度類型 誤差變異量 誤差變異來源 復本信度(間隔施測) 1-0.70=0.30 時間與內容取樣 分半信度 1-0.80=0.20 內容取樣 上述二者差異 0.30-0.20=0.10 時間取樣 評分者信度 1-0.92=0.08 評分者差異 誤差變異總和 0.20+0.10+0.08=0.38 真實變異 1-0.38=0.62 一個假想測驗的誤差變異來源分析 真實變異 誤差變異 時間上的穩(wěn)定性, 復本之間的一致性, 評分者之間的一致性 時間取樣誤差 內容取樣誤差 評分者間差異 62% 20% 10% 8% 第四章 測驗的效度 教學要點: 通過本章的學習,掌握效度的含義,效度估計方法,了解影響信度 與效度的關系,影響效度的因素以及提高信度的幾種方法等內容。 教學時數:[10學時] 教學內容: 一、效度概述 1.效度的一般定義及其內涵 效度是指測驗的準確性,即測驗能夠測出他們所欲測的特質的程度。 2.效度的統(tǒng)計與原理 3.效度的信度關系 (1)高效度,高信度(2)高信度,低效度(3)低信度,低效度 二、效度的估計 1966年美國心理學會在《教育心理測驗值標準》中將效度分為三大類: 1.內容效度(Content Validity) 內容效度指測驗實際測到的內容與所要測量的內容之間的吻合程度。 2.結構效度(Construct Validity) 結構效度是指測驗對于被稱作構想的某一理論概念或特質測量的程度。 3.實證效度(Criterion related Validity) 實證效度是指一個測驗對處于特定情景中的個體的行為進行估計的有效性。 三、提高測量效度的方法 1.各種測量效度的要求 2.提高效度的方法 (1)控制系統(tǒng)誤差,(2)精心編制量表,(3)妥善組織測驗, (4)擴充樣本容量,(5)適當增加測驗的長度 3.效度的一般定義及其內涵 效度是指測驗的準確性,即測驗能夠測出他們所欲測的特質的程度。 4.效度的統(tǒng)計與原理 5.效度與信度的關系 (1)高效度,高信度(2)高信度,低效度(3)低信度,低效度 四、效度的估計 1966年美國心理學會在《教育心理測驗值標準》中將效度分為三大類: 1.內容效度(Content Validity) 內容效度指測驗實際測到的內容與所要測量的內容之間的吻合程度。 2.結構效度(Construct Validity) 結構效度是指測驗對于被稱作構想的某一理論概念或特質測量的程度。 3.實證效度(Criterion related Validity) 實證效度是指一個測驗對處于特定情景中的個體的行為進行估計的有效性。 五、提高測量效度的方法 1.各種測量效度的要求 2.提高效度的方法 (1)控制系統(tǒng)誤差,(2)精心編制量表,(3)妥善組織測驗,(4)擴充樣本容量,(5)適當增加測驗的長度 考核要求: 1.效度的一般定義及其內涵 2.效度的統(tǒng)計與原理 3.效度與度的信度關系 4.效度的估計 內容效度,結構效度,實證效度 5.提高測量效度的方法 第五章測驗的難度和區(qū)分度 教學要點: 通過本章的學習,掌握測驗難度和區(qū)分度的含義,以及難度、區(qū)分度的計算,了解難度、區(qū)分度對測驗質量的影響等內容。 教學時數:[10學時] 教學內容: 一、測驗難度的計算 1.計算難度的基本公式 (1)以試題通過率計算難度:P=R/N,(2)用平均數計算試題的難度 2.用極端分組法計算難度 二、難度的轉換 難度轉換的方法 三、測驗題目難度水平的確定 四、區(qū)分度的定義 1.定義:區(qū)分度是指測驗對于考生實際水平的區(qū)分度程度或鑒別能力。 2.區(qū)分度與測驗信度、難度的關系 五、區(qū)分度計算 1.極端分組法計算 (1)客觀題計算,(2)論文題計算 2.用內部一致性系數(Internal Consistency)計算區(qū)分度 (1)用點二列相關計算區(qū)分度 (2)用二列相關計算區(qū)分度 (3)用Φ相關計算區(qū)分度 (4)用四分相關計算區(qū)分度 (5)用皮爾遜相關法計算區(qū)分度 (6)D(鑒別指數)的經驗標準 考核要求: 1.測驗難度的計算 2.計算難度的基本公式 3.難度的轉換 4.測驗題目難度水平的確定 5.區(qū)分度的含義 6.區(qū)分度與測驗信度、難度的關系 7.區(qū)分度計算 用極端分組法計算,用內部一致性系數(Internal Consistency)計算區(qū)分度 第二編測量的一般步驟和方法 第六章 測驗的編制與實施 教學要點: 通過本章的學習,掌握編制測驗的基本程序,測驗的實施過程及須注意的事項等內容。 教學時數:[10學時] 教學內容: 第一節(jié)編制心理與教育測驗的基本程序 一、確定測驗的目的 1.明確測量對象 2.明確測量目標 3.明確測量用途 二、制定編題計劃 三、編輯測驗項目 1.收集測驗資料 2.選擇項目形式 3.編寫測驗項目 四、測驗與項目分析 1.預測 2.項目分析 五、合成測驗 1.測驗項目的選擇 2.測驗項目的編排 3.編制副本 六、測驗標準化 1.測驗內容 2.實測過程 3.測驗評分 4.測驗分數解釋 七、鑒定測驗 1.信度 2.效度 3.測驗量表與常模 八、編寫測驗說明書 第二節(jié) 測驗的實施 一、測驗的實施過程 1.實測前的準備工作 2.指導語 3.測驗情境 4.測驗焦慮 5.與受測者建立良好的協(xié)調關系 6.評分技術 二、測驗分數的解釋 1.如何看待測驗分數的意義 2.如何向受測者報告測驗分數 考核要求: 1. 編制測驗的基本程序 確定測驗的目的,制定編題計劃,編輯測驗項目,測驗與項目分析,合成測驗,測驗標準化,鑒定測驗,編寫測驗說明書 2.測驗的實施過程及須注意的事項等內容 3.測驗分數的解釋 第七章 測驗分數的解釋與應用 教學要點: 通過本章的學習,掌握測驗分數的類型,常模及常模類型,以及測驗分數的解釋和常模的應用等內容。 教學時數:[4學時] 教學內容: 一、分數與常模 1.分數的種類和含義 識記:(1)原始分數,(2)導出分數 2.常模 3.年齡常模 4.年級常模 5.百分等級常模 6.標準分數常模 二、測驗的等值 1.測驗等值的實質 2.測驗等值的條件 (1)同質性,(2)等信度,(3)公平性,(4)可遞推性, (5)對稱性,(6)樣本不變性 3.測驗等值的基本算法 識記:(1)百分位等值(2)線性等值 4.常用等值設計 5.測驗等值誤差估計 考核要求: 1.分數 原始分數,導出分數 2.常模 年齡常模,年級常模,百分等級常模,標準分數常模 3.測驗的等值的實質與條件 4.測驗等值的基本算法:百分位等值,線性等值 第八章 測驗的項目分析 項目分析包括定性分析和定量分析。定性分析包括考慮內容效度、題目編寫的恰當性和有效性等;定量分析主要是指題目難度和區(qū)分度的測量。 對項目進行篩選和修訂,可以提高測驗的信度和效度。 第一節(jié) 測驗的難度 一、難度(difficulty)的意義 難度,指項目的難易程度。 在最高作為測驗中,稱為“難度”,而在典型作為測驗中,則指“通俗性”。兩者都是指在總體中,能夠正確或確切回答某項目的人數。 二、難度的計算 (一)二分法記分項目的難度 1.通過率 P=R/N 2.極端分組法(上下27%) P=(PH+PL)/2 (二)非二分法記分項目的難度 P=X / Xmax X為所有被試在該項目上的平均得分, Xmax為該項目的滿分。 三、測驗難度水平的確定 效標參照測驗、掌握測驗:不考慮難度; 選拔測驗:難度=錄取率; 對于選擇題來說,難度一般應大于猜測概率; 無論是速度測驗,還是難度測驗,一般都應防止被試得滿分,因 為滿分的意義是不明確的。 大體而言,難度為0.50時最理想,此時項目具有最大的鑒別力。但在實際操作中,讓所有項目難度都到達0.50困難很大,而且也不必要,一般只需使項目的平均難度接近0.50,而各個項目的難度在0.50 0.20之間變化。 四、難度的等距變換 根據正態(tài)分布表,將難度P作為正態(tài)曲線下的面積,轉換成相應的Z分數,這就是等距量表。 P Y 0 Z 美國教育服務中心以Δ 作為難度指標: Δ=13+4Z P = .0013 Z = +3 Δ= 25 P = .16 Z = +1 Δ= 17 P = .50 Z = 0 Δ= 13 P = .84 Z = -1 Δ= 9 P = .9987 Z = -3 Δ= 1 五、難度對測驗的影響 (一)測驗難度影響測驗分數的分布形態(tài) 難度大,正偏態(tài) 難度低,負偏態(tài) (二)測驗難度影響測驗分數的離散程度 測驗過難或過易,分數全距縮小,信度降低。 P=0.50時最佳 第二節(jié) 測驗的區(qū)分度 一、區(qū)分度的意義 區(qū)分度(discrimination)是指測驗項目對被試心理品質水平差異的區(qū)分能力或鑒別能力。 項目的區(qū)分度是測驗是否有效的“指示器”。 二、區(qū)分度的計算 (一)項目鑒別指數法 1.鑒別指數(index of discrimination,D)的計算 D = PH - PL 取值范圍:-1~ +1 2.極端組的劃分 27%規(guī)則 一般情況下,取上下25%~33%均可。 樣本少時,可以取50% 注意: 由于計算機的方便使用,可以上下50%作為劃分高低組的標準,或者多分幾組,對區(qū)分度和難度作詳細分析。因為只取上下兩端,只利用了一部分資料,浪費了很多信息,有可能得出錯誤結論。 (二)相關法(項目-總分相關) 1.點二列相關 Xp-Xq rpb= √pq St 2.二列相關 Xp - Xq pq Xp - Xt p rb= 或 rb= ? St y St y 3.φ 相關 ad-bc rφ= √(a+b)(c+d)(a+c)(b+d) 4.四分相關 5. 項目和總分相關重疊的校正 當測驗項目超過20個項目時,校正法通常毫無意義。 rtpSt – Sp rpq =√St2+ Sp2 –2rtpStSp (三)項目特征曲線(item characteristic curve, ICC) 項目特征曲線描述了效標分數不同的被試在該項目上的通過率。 曲線坡度越陡,鑒別力越好,預測的誤差越小。 三、區(qū)分度與難度的關系 難度和區(qū)分度都是針對一定團體而言的。 一般來說,較難的項目對高水平被試區(qū)分度高,較易的項目對低水平被試的區(qū)分度高。 四、區(qū)分度的相對性 (一)不同的計算方法,所得區(qū)分值不同 區(qū)分度有幾種計算方法? (二)樣本容量大小影響相關法區(qū)分度值的大小 樣本越大,區(qū)分度越…… (三)分組標準影響鑒別指數 分組越極端,區(qū)分度越…… (四)被試樣本的同質性程度影響區(qū)分度值的大小 樣本越同質,區(qū)分度越…… 第三節(jié)項目分析的特殊問題 一、多重選擇題的項目分析(誘答分析) 對于多重選擇題,除了分析難度和區(qū)分度外,還要對每個選項進行分析。 下列哪一個最有可能是偏執(zhí)型精神分裂癥患者的次級癥狀: A 幻聽 B 癱瘓 C 記憶喪失 D 厭食 如果所有被試都選擇某一正確的選項,說明該選項…… 如果沒有一個被試選擇某個錯誤選項,說明該選項…… 如果所有被試都選擇某個錯誤選項,說明該選項…… 如果高分組被試的選擇集中在兩個選項上,說明該選項…… 如果高分組和低分組對正確選項的選擇沒有區(qū)別,說明該選項…… 如果所有被試都未回答某個題目,說明該題…… 如果選擇各個選項的人數幾乎相等,說明該題…… 二、速度測驗的項目分析 對前面部分的測驗項目,難度和區(qū)分度都…… 對后面部分的測驗項目,難度和區(qū)分度都…… 三、標準參照測驗的項目分析 在標準參照測驗中,無須考慮項目的難度和區(qū)分度,只要項目的內 容很重要就行。 也可以通過比較教學或訓練的前測和后測結果來進行項目分析,用 來說明教學或訓練的效果以及項目編制是否適當。 四、項目-團體的相互作用 具有不同性質(性別、種族、職業(yè)等)的團體,在測驗得分上也 存在差異,即同樣的項目可能有不同的難度。 如果測驗要求對所有個體都相對“公平”,那么,就應該排除那些有 利于或不利于不同性質的亞團體的項目; 如果測驗的目的就是為了考察不同亞團體的差異,那么,就應選 擇使團體差異盡可能大的題目。 五、有效性與可靠性的矛盾 ? 同質性信度要求項目之間有高相關,各項目的難度均等; ? 對于預測效度來說,因為效標的變異范圍較大,如果項目越同質,那么效標關聯(lián)效度則低;因此,效標關聯(lián)效度要求各項目之間要有一定的差異,即項目之間相關低,這樣才能保證測驗得分與效標之間有高相關,即高的效標關聯(lián)效度。 因此,對于多數心理測驗來說,項目之間中等程度的相關,可使二者調和,獲得較為滿意的(同質性)信度和(效標關聯(lián))效度。 第九章 學績測驗 第一節(jié) 學績測驗概述 一、學績測驗的性質 最高作為測驗可以分為:學績測驗、能力測驗、能力傾向測驗。 學績,指經過一定的教學或訓練后所學到的東西,是在一個比較明確 的、相對限定的范圍內的學習結果。 能力傾向指學習的能力,是在給予適當的機會時獲得某種知識或技能 的能力。 能力介于學績和能力傾向之間,指的是當前的知識或技能的水平,既 有正式學習的,也有非正式學習的結果,既包括學術技能,又包 括非學術技能。 學績測驗用來描述現狀,指明一個人已經學會了什么和能做什么。 二、學績測驗的基本假設 1 學績測驗所測量的知識和技術的范圍能明確界定。 2 測驗所測量的是研究者認為重要的東西,而不是與測量目的無關的東西。 3 被試有同樣的機會學習測驗所包含的材料。 三、學績測驗的分類 (一)按測驗的編制方法分 教師自編課堂測驗,標準化學績測驗 (二)按測驗內容分 單科測驗,多科測驗 單元測驗,總測驗 (三)按測驗的用途分 考察性測驗,診斷性測驗,準備性測驗,選拔與安置測驗,職業(yè)水平測驗,用于研究的測驗 (四)按測驗評分的參照系分 常模參照性測驗,目標參照性測驗 (五)按測驗的題型分 客觀測驗,論文式測驗 四、學績測驗的應用 1 反饋功能 2 診斷功能 3 輔助教學管理 4 研究工具 5 人才選拔與安置 第二節(jié) 標準化學績測驗 一、標準化學績測驗的基本要求 1 命題組卷標準化 測驗目標,試題的措辭、難度、區(qū)分度,題型比例、題量 2 施測標準化 環(huán)境、時間、指導語、主試 3 評分標準化 標準答案、評分細則、評分者人數 4 測驗分數解釋標準化 是常模參照還是目標參照 二、標準化學績測驗的編制 由學科專家與測驗編制專家共同完成,其步驟與一般心理測驗的編制程序相同。 (一)確定測驗目的,選定測驗編制的方法 考察還是診斷,常模參照還是目標參照 (二)分析測量目標,擬訂測驗編制計劃 雙向細目表,題型,題量 (三)編題征題與選題組卷 編題征題→試測→組卷 (四)調查測驗質量參數,編制測驗常模 難度、區(qū)分度、信度、效度、常模 (五)編寫測驗指導書,正式出版發(fā)行 三、國外常用標準化學績測驗簡介 (一)斯坦福成就測驗 ? 綜合性學績測驗 ? 適用范圍:1~9年級 ? 內容:詞匯、閱讀理解、拼字、聽理解、詞匯學習技能、語言、數學概念、數學計算、數學應用、社會科學常識、自然科學常識 斯坦福早期學校成就測驗(適用于幼兒園和小學一年級) 斯坦福學業(yè)技能測驗(適用于8~12年級) 導出分數:百分等級、標準九、年級當量、量表分數、正態(tài)曲線當量 分測驗信度均在0.80以上。 (二)關鍵數學算術診斷測驗 適用范圍:學前兒童~小學六年級 q 測驗內容: ? 內容塊:數學、分數、幾何、符號 ? 運算塊:加法、減法、乘法、除法、心算、數字推理 ? 應用塊:文字題、補充、金錢、測量、時間 q 診斷: ? 總體水平診斷 ? 分塊水平診斷 ? 分測驗水平診斷 ? 項目水平診斷 四、標準化學績測驗的題庫建設 一個高質量的題庫應具有的性質: ? 有一種科學的測量理論; ? 貯備一定數量的試題,所有試題品質優(yōu)良,技術參數完備; ? 題庫內部結構層次清楚、分類嚴謹,試題檢索方便; ? 題庫管理方便,可控性強,易于維護更新; ? 保密性強。 五、我國高考的標準化試驗 第三節(jié) 教師自編課堂測驗 一、教師自編課堂測驗的特點 ? 測驗形式靈活多變,與測驗目的完全一致 ? 測驗內容與教材內容完全一致 ? 測驗難度切合學生的實際水平 ? 測驗編制簡易快速 二、教師自編課堂測驗的步驟與方法 ? 審查測驗目的 ? 制定測驗編制計劃 ? 命題與組卷 三、教師自編課堂測驗應注意的問題 ? 教師要深入研究教材,深入研究學生 ? 要維護準確穩(wěn)定的合格標準 ? 要客觀評價自己的命題技術,合理使用各種題型 ? 要注意總結命題經驗,提高命題技術 ? 要盡量控制評分誤差,防止簡單粗糙 ? 要做一些定量分析研究 第十章 能力測驗(上) 第一節(jié) 智力測驗的理論基礎 (一)什么是智力? Spearman(1904,1923):智力是一種普遍的能力,它主要涉及 聯(lián)系的引出(eduction)和相關的引出。 Binet & Simon(1905):智力是正確進行理解、判斷和推理的能 力。 Terman(1916):智力是形成概念,并且抓住其重要性的能力。 Thorndike(1921):智力是從真理或事實角度產生良好反應的能 力。 Thurstone(1921):智力是抑制本能反應,靈活地想象不同反應, 并且把修改后的本能反應轉換為外顯行為的能力。 Wechsler(1939):智力是個體有目的地行動,理性地思考以及有 效地應付環(huán)境的總體能力。 Piaget(1972):智力是總括性的術語,指用來適應物理和社會環(huán) 境的認知結構的組織和平衡的高級形式。 Sternberg(1985):智力是指自動信息加工和產生適合于新情況 的行為的心理能量,它包括元成分、操作成分和知識獲得成分。 Eysenck(1986):智力是將信息無錯地傳遞過皮層的能力。 Gardner(1986):智力是解決問題,制造在某些文化范圍內有價 值的產品的能力或技術。 共同點: w智力是適應環(huán)境的能力 w智力是通過經驗進行學習的能力 w 智力是人們在獲得知識和運用知識解決實際問題時所必須具備的 心理條件或特征。 Boring(1923):智力就是智力測驗所測量的東西。 Sternberg等(1981)的研究 專家認為:語詞能力、問題解決能力和實際智能最重要 外行認為:實際問題解決能力、語詞能力和社會能力最重要 (二)智力的理論 Galton和感覺敏銳度 1.二因素論 Spearman的一般因素(G)和特殊因素(S) 2.多因素論 Thurstone的群因素(語文理解、言語流暢性、推理、空間想象、 數字、記憶、知覺速度) 3.二維結構模型 希萊辛格和古特曼(1966) 第一維:言語能力、數學能力、圖形和空間能力 第二維:規(guī)則應用能力、規(guī)則歸類的能力、學術成就 4. Cattell的流體智力與晶體智力 5. Gardner的多元智力理論 言語、邏輯-數學、空間、音樂、身體運動、社交、自知 6. Sternberg智力的認知心理學理論 智力成分:元成分、操作成分、知識獲得成分 智力情境:適應環(huán)境、塑造環(huán)境、選擇新環(huán)境 智力經驗:處理新任務、自動化加工 7. 其他: 情緒智力(EQ)、成功智力、實踐性智力(practical intelligence) 第二節(jié) 個體智力測驗 一、比內量表 (一)比內-西蒙量表 1.1905年量表 ? 世界上第一個智力量表; ? 內容:30道題(記憶、言語、理解、手工操作)。 ? 題目排列方式:從易到難。 ? 指標:通過項目數。如白癡最多只能通過6項,低能的成人可通 過7~15項。 ? 眼睛是否隨動的物體移動。 ? 用觸覺刺激喚起抓握反應。 ? 用視覺刺激喚起抓握反應。 ? 辨認食物。 ? 搜尋食物。 ? 執(zhí)行簡單的命令和模仿簡單的手勢。 ? 認識物體。 ? 認識圖片。 ? 列舉圖片中的人物和物體。 ? 比較兩條線的長短。 ? 復述兩個數字。 ? 比較兩個重量。 ? 暗示。 ? 解說物體與人物的名稱。 ? 復述句子。 ? 說出二物的不同點。 ? 記憶圖片中的物體。 ? 靠記憶重畫圖片。 ? 復述數字。 ? 說出二物的相同點。 ? 比較線的長短。 ? 比較重量。 ? 重量記憶。 ? 說出同韻字。 ? 填詞。 ? 用三個詞造句。 ? 對答問句。 ? 交換長短針的位置。 ? 剪紙。 ? 抽象名詞的定義。 2.1908年量表 ? 內容:增至59道題。 ? 方式:把測驗項目按年齡分組。每一歲一組。每個年齡組項目數 量不等,最多8項,最少3項。 ? 年齡范圍:3~13歲。 ? 指標:智力年齡。 3.1911年量表 ? 題目:刪舊補新,但總數仍為59題。 ? 增設一個成年組。 ? 除4歲組僅有4個項目外,其他每個年齡組一律為5項,便于計 算。 q 對比內-西蒙量表的評價 成就: (1)比西量表是第一個采用復雜任務來測量高級心理過程的測驗。 以前的測驗主要測量感知覺、運動等低級心理過程。 (2)比西量表首次采用年齡作為智力的標準,這樣可以對測驗作出 通俗易懂的解釋。 (3)比西量表首次從整體上測量智力,也就是測量智力的普通因素, 而以往心理學家把感覺辨別力、記憶力、注意力等割裂開來測量。 不足: (1)施測和記分沒有標準化。 (2)常模團體的代表性不夠,因而有些項目的安排位置不當。 (3)測驗項目過少。 (二)斯坦福-比內量表 1.斯坦福-比內量表的發(fā)展 (1)1916年量表 ? 在修改基礎上增設39個新項目,達到90個項目。 ? 最早對施測和記分提供了詳細的指導語。 ? 引入了智力商數的概念(比率智商)。 ? 適用年齡:3~13歲。 ? 樣本:1000名兒童和400名成人。 (2)1937年量表 ? 由 L 和 M 兩個等值型量表構成 ? 年齡范圍擴大:1.5~18歲 ? 樣本:3184名1.5~18歲兒童,但僅限城市白人 (3)1960年量表 ? 合并了L和M兩型中最好的項目,改為單一量表。 ? 年齡:2~成人 ? 離差智商 ? 4498名1.5~18歲兒童(1937年量表的施測對象)。 (4)1972年量表 ? 測驗內容未變; ? 取樣范圍擴大(地區(qū)、社會階層、經濟狀況、民族)。 共2100名被試,其中2~5.5歲每半歲選100名,6~18歲每一歲 選100名。 2.斯比量表的信度和效度 (1)信度 ? 復本信度:L和M相關在0.83~0.95之間。 ? 再測信度:高于0.90。 (2)效度 ? 內容效度:測驗內容屬于公認的智力范疇。 ? 效標關聯(lián)效度:與學業(yè)成績、受教育年限的相關在0.4~0.75之間。 ? 結構效度:假設智力發(fā)展隨年齡增長,先快后慢(證據:隨年齡 增長,再測穩(wěn)定性逐步提高); 存在G因素(證據:各項目與測驗總分的平均相關為0.66) (三)中國比內測驗 陸志偉和吳天敏1924年、1936年、1982年三次修訂 內容:51題 指標:離差智商 年齡范圍:2歲~18歲 ? 生活常識 ? 知覺速度及觀察力 ? 空間知覺力和想象力 ? 記憶力 ? 語言能力 ? 判斷推理能力 二、韋克斯勒(Wechsler)智力測驗 生平:1896年出生于羅馬尼亞,6歲遷居美國。一戰(zhàn)期間從事心 理測驗工作,用陸軍甲、乙種測驗、斯比量表來甄選新兵,積累 了豐富的經驗。 1919年去倫敦大學,師從Spearman和Pearson, 接受G因素理論。1920~1922年在巴黎與西蒙有過接觸。1925 年,在哥倫比亞大學獲博士學位,論文《情緒反應的測量》。 1932~1967年,任紐約貝爾韋精神病院的主任心理學家。 編制背景:尋找一種測量成人智力的有效方式。當時的智力測驗存在 下列問題: ? 測驗項目引不起成人的興趣; ? 過多的項目涉及語詞的操作; ? 指導語過分強調速度,犧牲了準確性; ? 計算心理年齡,不適合成人測驗要求。 IQ=測驗者的實際測驗分數-這一年齡測驗者的平均測驗分數 韋氏智力測驗家族: 1939年,韋克斯勒-貝利弗測驗 1946年,韋克斯勒-貝利弗測驗Ⅱ 1949年,韋克斯勒兒童智力量表(WISC) 1955年,韋克斯勒成人智力量表(WAIS) 1967年,韋克斯勒學前和小學兒童智力量表(WPPSI) 1974年,韋克斯勒兒童智力量表修訂版(WISC-R) 1981年,韋克斯勒成人智力量表修訂版(WAIS-R) 1989年,韋克斯勒學前和小學兒童智力量表(WPPSI-R) 1991年,韋克斯勒兒童智力量表第三版(WISC- Ⅲ ) 韋氏測驗的特點: (1)10~12個分測驗:使用多個分測驗,不僅可以得到總IQ,還可 以分析個體在智力上的強項和弱點; (2)言語量表和操作量表各由5~6個分測驗組成,可以單獨評價言 語或操作的各項智力成分,體現了左右腦功能的整合,而且可以 顯示個體的職業(yè)能力傾向。 (3)共同的IQ計分系統(tǒng):對所有測驗和所有年齡組,IQ平均為100, 標準差為15。而且每個分測驗的平均分為10,標準差接近3分。 這樣就可以比較被試的各項分測驗分數,了解其相對強弱。 (4)不同年齡組有相同的分測驗:例如,WAIS-R,WISC-R,WPPSI-R 有相同的8個核心分測驗。這不僅方便施測者,而且有助于測驗 之間的相互比較。 韋克斯勒測驗的分測驗 (1)常識(information) 33個一般知識性問題,如“誰發(fā)現了美洲?”“我國的首都在哪 里?” “兒童節(jié)是哪一天?” 得分越高,說明興趣越廣泛,好奇心強,長時記憶好。 把該測驗放在首位,容易與被試建立關系,不易引起被試的緊張 和厭煩。 (2)數字廣度(digit span) 分順背和倒背兩部分(2位到9位數)。 主要測查瞬時記憶能力。對智力低者,測其智力;對智力高者, 測其注意力。 按0或1計分,總分為兩部分之和。 智力高者在該項上得分未必高,有時倒背可能會高于順背成績。腦功能障礙者一般得分較低。但對有些白癡學者,能輕易得高 (3)詞匯(vocabulary) 要求被試定義和解釋通過視覺或聽覺呈現給他們的字詞的一般 意義。例如“什么是杯子?”“什么是美麗?” 該測驗與抽象概括能力有關。年齡大的、智力高的、受教育程度 高的、經歷豐富的人,其得分高。 問題是計分困難。答案分四級: 一級:用同義詞,且能說明二者的細微差別; 二級:具體運用詞匯來造句; 三級:望文生義,作字面解釋; 四級:做手勢或指實物給主試看。 一級計2分,二級計1分,三四級計0分。 (4)算術(arithmetic) 簡單項目主要是加減法運算。難一些的問題需要對問題進行分 析,并運用兩種以上的算術運算。 主要測量基本的數理知識和數學思維、推理能力。 (5)理解(comprehension) 容易的題目主要測常識,如“為什么人要穿衣服?” 難的項目需要了解社會、文化傳統(tǒng),如“為什么最高法院任命終 身法官?” 該分測驗能反映被試對于社會價值取向、風俗、倫理道德是否理 解和適應,在臨床上可以鑒別腦器質性障礙的病人。 (6)類同(similarities) 讓被試區(qū)分物體、事實和觀念的重要的相似性與不重要的相似 性,如“襯衫和襪子有什么相似的地方?”測查個體的邏輯思維、 抽象思維、分析和概括能力。 (7)填圖(picture completion) 要求被試回答圖中缺少了什么重要成分。主要測的是記憶、細節(jié) 注意能力和視覺敏銳性。 具有病態(tài)觀念的患者往往將自己的思想投射到測驗中去。智力落 后者的填圖成績很差。 (8)句子(sentences) 要求被試逐字重復主試大聲讀出的句子。 測查注意和記憶能力。 (9)幾何圖形(geometric design) 10個圖案,每個圖形由一個圓、一個正方形和一個菱形組成, 讓兒童復寫。 (10)動物房(animal pegs) 把某種顏色的圓錐(黑、白、黃、藍)放到合適的動物(狗、小 雞、貓、魚)的洞里。測查學習能力、手的靈活性、維持注意的 能力。 (一)韋氏成人智力量表 共有11個分測驗,其中6個言語量表(常識、數字廣度、詞匯、 算術、理解和類同),5個操作量表(填圖、圖片排列、積木圖 案、物體拼湊、數字符號) q 信度和效度 ? 背數和數字符號分測驗計算復本信度,其余部分計算分半信度, 為0.88~0.98 ? 結構效度:“從各個方面來測量智力,而不是測量不同類型的智力。” 因素分析表明,有50%的變異來自智力一般因素;各分測驗之間 和分量表之間存在普遍的顯著的正相關,表明智力G因素滲透于 智力行為的各個方面。 ? 內容效度:測驗項目均取自或參照前人成功用過的量表(比內量 表、陸軍a和b)編制。 ? 效標關聯(lián)效度:與斯比量表的相關0.80;文職人員的言語智商高 于操作智商,技術工人則相反。 (一)韋氏成人智力量表 共有11個分測驗,其中6個言語量表(常識、數字廣度、詞匯、 算術、理解和類同),5個操作量表(填圖、圖片排列、積木圖 案、物體拼湊、數字符號) q 信度和效度 ? 背數和數字符號分測驗計算復本信度,其余部分計算分半信度, 為0.88~0.98 ? 結構效度:“從各個方面來測量智力,而不是測量不同類型的智力。” 因素分析表明,有50%的變異來自智力一般因素;各分測驗之間 和分量表之間存在普遍的顯著的正相關,表明智力G因素滲透于 智力行為的各個方面。 ? 內容效度:測驗項目均取自或參照前人成功用過的量表(比內量 表、陸軍a和b)編制。 ? 效標關聯(lián)效度:與斯比量表的相關0.80;文職人員的言語智商高 于操作智商,技術工人則相反。 (二)韋氏兒童智力量表 ? 12個分測驗:5個言語測驗(常識、類同、算術、詞匯、理解), 5個操作測驗(填圖、圖片排列、積木圖案、拼圖、譯瑪),2個備 用測驗(背數和迷津)。 ? 適用年齡:6~16歲 ? 分半信度:0.70~0.86 ? 再測信度:0.65~0.88 ? 效標關聯(lián)效度:以年齡為效標,得分隨年齡增長而提高。與學績 測驗或其他學業(yè)行為的相關為0.50~0.60;與斯比量表的相關為 0.60~0.71 ? 結構效度:發(fā)現智力一般因素的存在 q 韋克斯勒兒童智力量表(WISC-R)中國修訂本 ? 修訂者:林傳鼎、張厚粲等(1983年) ? 模:中等以上城市(3000人) ? 修訂原則:測題要適合中國兒童的特點;改動的測題盡可能與原 題性質類似、難度接近。主要改動有: (1)我國社會中不常見的或我國兒童不熟悉的測題內容,如“一個鎳 幣等于幾便士?”“美國成年男子平均身高是多少?” (2)不合我國國情的,如“為什么把錢交給慈善機關比施舍給街頭乞 丐好?” (3)由于語種不同,翻譯后在難度上發(fā)生變化的,如“三月過后是幾 月?”“啤酒和黃酒的共同點是什么?” (4)凡外國人名、貨幣名稱以及圖片上的人物等盡量使之中國化。 言語量表:常識、背數、詞匯、算術、理解、類同 操作量表:填圖、圖畫排列、積木圖案、拼圖、譯碼、迷津 (三)韋氏幼兒智力量表(WPPSI) ? 年齡:4~6.5歲 ? 11個分測驗:5個言語測驗(常識、理解、詞匯、算術、類同), 5個操作測驗(填圖、迷津、積木圖案、句子復述),2個備用測驗 (動物房、幾何圖案)。 ? 分半信度: ? 再測信度 ? 結構效度:G ? 效標關聯(lián)效度:與斯比量表的相關 ? 對韋氏量表的評價 優(yōu)點: (1)具有復雜的結構,能夠較好地反映智力的整體和各個側面; (2)各年齡組都接受相同的分測驗,可以相互比較,并節(jié)省指導測 驗的時間; (3)用離差智商代替比率智商,克服了計算成人智商的困難。 (4)采用因素分析法研究結構效度更具有理論意義。 (5)各量表之間相互銜接,適用的年齡范圍可以從幼兒直到老年。 缺點: (1)施測程序復雜費時; (2)對于測量智力極高或極低的被試不大適用; (3)缺乏充分的效度資料。 第三節(jié) 團體智力測驗 一、陸軍測驗 一戰(zhàn)時在Yerkes領導下編制。 q 陸軍甲種(α)測驗 ? 8個分測驗: 照令行事、算術、常識、異同(同反義詞)、字句重組、填數、類比推理、理解 ? 效度:與軍官評定、斯比量表、教師評定、學業(yè)成績的相關 q 陸軍乙種(β)測驗 ? 7個分測驗:迷津、立方體分析、補足數列、譯碼、數字校對、圖畫補缺、幾何形分析 ? 測試對象:母語非英語的被試和文盲被試 ? 效度:與甲種測驗的相關 二、瑞文推理測驗 (一)瑞文推理測驗的產生與發(fā)展 1.瑞文標準推理測驗 ? 6歲以上 ? 5個系列,60個項目 A組測知覺辨別力、圖形比較、圖形想象 B組測類同、比較、圖形組合 C組測比較、推理、圖形組合 D組測系列關系、圖套組合 E組測套合、互換等抽象思維能力 2.瑞文彩圖推理測驗 ? 5~11歲 ? 3個系列,36個項目 3.瑞文高級推理測驗 ? 適合于高智力成人 ? 第一套12個項目,第二套36個項目 (二)瑞文標準推理測驗中國修訂本 修訂者:張厚粲(1985年) 取樣:大、中、小城市 年齡:5歲~成人 信度:分半信度、再測信度 效度:與WISC-RC、高考成績的相關。 聯(lián)合型瑞文測驗(CRT,Combined Raven’s Test) (彩色+標準) 團體施測的適用范圍:三年級以上,65歲以下 三、認知能力測驗 桑代克 初級型:口頭、詞匯、關系概念、多重智力和數量概念 文字測驗:詞匯、句子填充、語詞分類、語詞類推 數量測驗:數的大小比較、數列補充、建立關系 非文字測驗:圖形分類、圖形推理、圖形綜合 第四節(jié) 嬰幼兒智力測驗 一、蓋塞爾發(fā)展順序量表 適用年齡:出生~36個月 方式:自然情景下對兒童的觀察 測試工具:響鈴、三色環(huán)、撥浪鼓、積木、搖鈴、蠟筆和紙、皮球、顏色板等 評定內容: ? 動作:分大動作和細動作。大動作指身體的姿態(tài)、頭的平衡、坐、立、爬、走、跑、跳,細動作指手指的運用。 ? 言語:聽、理解和表達 ? 環(huán)境適應:如對物體和環(huán)境的精細感覺、協(xié)調能力 ? 社會應答:與人交往 診斷依據:每個成熟階段的行為模式。 指標:DQ(發(fā)育商數) = 測得的成熟年齡/實際年齡 2歲小孩的動作發(fā)育:逐頁翻書、疊起7~8塊積木、用積木接成火 車、把盛滿水的杯子給人、學畫圈、能說出4樣畫片的名稱、踢球、 跑且不摔交 嬰幼兒智能發(fā)育階段初步檢查表 關鍵年齡 成熟階段 動作能 應物能 言語能 應人能 4周 仰臥 不能控制頭部,仰臥姿勢左右不對稱 眼光能短暫跟 隨人、物,給玩具立即放棄 面部無表情,喉頭作微聲 凝 視四周,“傾聽聲音” 16周 仰臥 頸可豎直,頭微搖動,仰臥姿勢左右對稱 開始接 近有響聲的玩具,注視手中有響聲的玩具 發(fā)出咕咕聲,出 聲笑 動微笑迎人,玩弄己手 28周 坐 扶起獨坐,身體前傾 伸手拿玩具,能將玩具自一手 遞交他手 呼號,哭時作“姆姆”聲 將足置于口中 40周 坐 可獨坐,爬行,扶著物件站立 能將兩樣玩具放在一 起,平指摘小丸 能呼爸爸媽媽,除爸媽外能說另一字 懂 得成人逗玩,能自己吃- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 心理測量學 教案
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.820124.com/p-10029949.html