心理測量學(xué)(基礎(chǔ)知識).ppt
《心理測量學(xué)(基礎(chǔ)知識).ppt》由會員分享,可在線閱讀,更多相關(guān)《心理測量學(xué)(基礎(chǔ)知識).ppt(147頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1 心理測量學(xué) 2 上篇 什么是心理測量學(xué) 心理測量起于行為主義盛行的時代 人的心理在相當程度上被看成是與一般動物的心理活動有同樣的本質(zhì) 所以是可以操控和測量的 但是我們今天看到 隱秘 深邃 有限而又無限 社會文化使得人類個體的行為遠離動物行為的刻板模式 更具有隨機性而似乎不可確定 還是可以測量的嗎 是的 可以 言必由衷 行必有因 言與行提供了人類心靈評估的標尺 基于此 心理測量依然成為當代心理學(xué)工作者的有效技術(shù)了 返回首頁 3 目錄 第一節(jié)概述第二節(jié)心理測驗的常模第三節(jié)心理測驗的信度第四節(jié)心理測驗的效度第五節(jié)心理測驗的項目分析第六節(jié)心理測驗的編制程序第七節(jié)心理測驗的使用 退出 4 第一節(jié)心理測量學(xué)概述 心理測量學(xué)是心理學(xué)的基本方法學(xué)課程之一 它主要討論如何借助于標準化的心理測量工具 心理測驗對個體的心理特征或心理狀態(tài)進行評估 并將其數(shù)量化的過程 因此 它基本的和重點的內(nèi)容在于心理測驗的編制方法 質(zhì)量評估 實際應(yīng)用和結(jié)果解釋 以及經(jīng)典測驗的介紹和使用 5 一心理測量的涵義 要素與量表 1 心理測量及其構(gòu)成元素 事物總在不斷地運動變化 而其運動變化表現(xiàn)為多種屬性在質(zhì)或量上的改變 這些可變的事物的屬性叫變量 利用一定的規(guī)則 方法或工具 使事物的屬性數(shù)量化 即確定一系列事物的屬性值 就叫測量 其構(gòu)成元素有 事物 即事物的屬性 規(guī)則 數(shù)字 規(guī)則 則是指這一過程具有科學(xué)依據(jù) 確定的程序和量化的標準 數(shù)字 一般具有 同一性或區(qū)分性 等級性或位次性 等距性 可加性 當被測量的變量是反映心理活動的屬性或特征時 這種測量就叫心理測量 如 記憶力測量 氣質(zhì)類型測量 焦慮水平測量等 P348 6 2 心理測量的基本要素 測量有兩個基本要素 參照點和單位 其中參照點是測量過程計算量的起點 包括絕對和相對參照點 絕對參照點就是絕對零點 相對參照點則根據(jù)情境來人為規(guī)定 也叫相對零點 單位是測量中的等值單元 它必須具備兩個條件 有確定的意義 有相同的價值 就心理測量來說 第一 測量中幾乎沒有絕對零點 大多是以相對零點來計算的 第二 測量中很少有相等單位 所以在對測量值進行解釋時更多看其相對意義 或?qū)y量結(jié)果等值轉(zhuǎn)換形成相等單位 當然 心理測量常以行為測量來完成 而行為測量中是可以有絕對零點和相等單位的 如學(xué)習(xí)能力無絕對零點 但考試成績有零分 P349 7 3 測量量表及其種類 如將事物某一屬性的可能取值全部列出并按其相對位置排列 就構(gòu)成了一個測量標尺 這一標尺就叫測量量表 measurescale 按照測量量表是否具有絕對零點 相等單位 以及測量所得數(shù)值的對比關(guān)系 我們可以將測量量表劃分為四種 1 命名量表 也叫稱名量表 2 順序量表 也叫等級量表 3 等距量表 4 等比量表這里需要注意 1 各種量表值的意義 2 各種量表的量化水平 3 各種量表測量值允許的運算 加 減 乘 除 4 心理測量大多是在順序量表上進行的 P349 8 能夠用來完成心理測量的標準化工具或程序叫心理測驗 也叫心理量表 定義 心理學(xué)家依據(jù)一定心理學(xué)理論和系統(tǒng)觀察 取樣 而精心編制的一系列刺激項目及其標準化形式 就叫心理測驗 心理測量就是心理測驗的使用過程 它是收集個體對這一系列刺激項目的反應(yīng)資料 進而對其心理特征 能力及其他心理結(jié)構(gòu)進行評定的過程 所以從某種意義上說 心理測量就是從人的眾多相關(guān)行為中進行取樣 然后由這一行為樣本推斷其心理品質(zhì)或心理狀態(tài) 二 心理測驗的基本概念 1 什么叫做心理測驗 P350 9 為理解心理測驗 再強調(diào)三點 第一 心理測驗所提供的是一系列刺激項目 借此收集被試對這些刺激的反應(yīng)資料 所以心理測驗實際上是進行行為取樣的過程 為使收集來的行為資料意義較確定 測驗項目應(yīng)具體 直接 語義單一 盡量不使用含糊 抽象和有較大不確定性的問題 第二 測驗不需要涉及某類行為的所有方面 而要有所選擇 即要進行行為取樣 選取那些能有效反映所想要測量的心理特征或傾向 第三 測驗應(yīng)是標準化的 即其編制 施用 評分和結(jié)果解釋都必須按照系統(tǒng)程序和科學(xué)化的規(guī)則來進行 P350 10 心理測驗的三要素 第一 行為樣組 心理測量是通過個體一組相關(guān)的行為測量間接完成的 所以其成功與否 或準確性高低 取決于心理測驗中的行為取樣的有效性 第二 標準化 心理測量更看重個體間測量結(jié)果的比較關(guān)系 為了使得測量結(jié)果具有可比性 心理測驗必須標準化 第三 客觀性 客觀性是指測量結(jié)果較少受到主觀的 其他偶然因素影響 而獲得可靠結(jié)果 進行良好的行為取樣和進行標準化 都是為了保證測量結(jié)果的客觀性 P350 11 心理測驗的特點決定了心理測量的性質(zhì) 第一 因為心理測驗提供的是一個刺激序列 使用測驗所獲得的是人對這一刺激系列的反應(yīng)資料 然后再推斷其內(nèi)在的心理特質(zhì) 所以心理測量具有間接性 第二 針對測驗的刺激項目 我們獲得的主要是被試對刺激的反應(yīng)傾向或反應(yīng)強度 不具有絕對零點和絕對意義 只具有相對意義 所以心理測量具有相對性 第三 測驗中的項目選擇 施測程序 結(jié)果的分析與解釋均是經(jīng)過標準化的 這決定了心理測量具有相對的可靠性 即具有客觀性 P351 12 2 心理測驗的分類 按測驗的功能或目標不同 智力測驗 特殊能力測驗 人格測驗按測驗材料的性質(zhì)不同 文字測驗 操作測驗按測驗材料的嚴謹程度不同 客觀測驗 投射測驗按測驗的方式不同 個別測驗 團體測驗按測驗對被試要求的不同 最高作為測驗 典型行為測驗按測驗的目的不同 描述性測驗 診斷性測驗 預(yù)測性測驗 P353 13 三 如何看待心理測驗 第一 萬能論 心理測驗測驗完美無缺 可以解決一切問題 第二 無用論 侵犯隱私 違背民主原則 種族歧視 宿命論等 第三 心理測驗就是智力測驗 心理測驗 智力測驗 智商 遺傳決定論 錯誤看法 P351 14 正確看法 第一 心理測驗是心理學(xué)研究和實際工作中的有效工具 可以幫助人們收集有關(guān)人的心理特征 心理狀態(tài)的資料 獲得對人的心理活動規(guī)律性的認知和進行科學(xué)決策 第二 心理測驗作為研究方法和測量工具 尚不完善 其使用中會帶來系統(tǒng)的和隨機的誤差 所以可信但不能全信 可靠但不是絕對可靠的 無用論 和 萬能論 都是錯誤的 第三 心理測驗不等于智力測驗 更不能說成是 遺傳決定論 P351 15 四 心理測驗在心理咨詢中的應(yīng)用 1 心理測驗與心理咨詢的關(guān)系 心理測驗對心理咨詢的影響 1 提供關(guān)于個體心理特質(zhì) 心理狀態(tài) 心理發(fā)展的客觀資料 為教育心理咨詢 發(fā)展預(yù)測咨詢 職業(yè)指導(dǎo)提供依據(jù) 2 作為診斷 甄別與療效評估的工具 使心理咨詢具有更高的操作性 針對性和有效性 3 巧妙使用 可以作為心理咨詢與治療的手段之一 達到意想不到的效果 心理咨詢對心理測驗的影響 1 心理咨詢與治療實踐的需要直接刺激和推動了心理測驗的發(fā)展 2 心理咨詢與治療過程獲得的資料豐富和推動了心理學(xué)理論和測驗技術(shù)的完善與發(fā)展 P355 16 2 我國心理咨詢中運用較多的心理測驗 1 智力測驗 比奈智力測驗 韋克斯勒智力測驗 瑞文標準推理測驗等 測查智力發(fā)展水平或進行智障診斷 2 人格測驗 艾森克人格問卷 EPQ 卡特爾16種人格因素問卷 16PF 明尼蘇達多項人格調(diào)查表 MMPI 等 這些測驗可以達到了解 診斷和預(yù)測的目的 3 心理評定量表 精神病評定量表 躁狂狀態(tài)評定量表 抑郁量表 恐怖量表等 這些測驗主要用來進行臨床診斷和療效評估 P355 17 五 心理測驗的發(fā)展簡史 1 現(xiàn)代心理測驗的開始 1 英國的高爾頓 F Galton 受達爾文進化論的影響 最早關(guān)注個體氣質(zhì)特點與智能差異 即個性差異 為了研究差異的遺傳性 設(shè)計了差異測量的方法 這可被看作是心理測驗的開端 高爾頓提出相關(guān)的概念 并由他的學(xué)生皮爾遜 K Pearson 發(fā)展出積差相關(guān) 為心理測驗奠定了統(tǒng)計學(xué)基礎(chǔ) 使心理測驗的信度 效度評估和進行因素分析成為可能 其實際測量集中在1884后的6年 波林 在測驗領(lǐng)域 19世紀80年代是高爾頓的10年 90年代是卡特爾的10年 20世紀頭10年則是比內(nèi)的10年 P357 18 2 心理測驗的概念和標準化思想的提出 美國著名心理學(xué)家卡特爾 JamesM Cattell 于1890年在 心理 雜志上發(fā)表 心理測驗與測量 首次正式提出 心理測驗 mentaltest 的概念 并強調(diào)了心理測驗標準化 制訂常模的重要性 P357 19 3 世界上第一個正式的心理測驗 1904年 法國公共教育部成立了一個專門研究學(xué)習(xí)落后兒童教育方法的委員會 比奈 A Binet 成為該委員會成員 他開始著手制訂有效方法來甄別學(xué)校中那些學(xué)習(xí)成績差者 哪些是由于智力落后造成的 在西蒙 T Simon 醫(yī)生協(xié)助下 比奈于次年發(fā)表 診斷異常兒童智力的新方法 公布一個由30個項目組成的粗略量表 這就是第一個正式的智力測驗 被稱為比奈 西蒙智力測驗 比內(nèi)在1908年發(fā)表修訂版測驗時 第一次使用了心理年齡 mentalage 簡稱MA 的概念 P358 20 比奈智力量表后傳到美國 經(jīng)斯坦福大學(xué)的推孟 Terman 教授修訂于1916年發(fā)表了被廣泛使用的智力測驗 即斯坦福 比奈智力量表 該量表第一次提出了智力商數(shù)的概念 簡稱智商 intelligenceratio 簡稱IQ 比內(nèi)的主要工作從1898年發(fā)表 人格心理學(xué)中的測量 提出許多測驗開始直至1911年去世 去世當年發(fā)表了他的智力測驗的第二次修訂版 P358 21 2 現(xiàn)代心理測驗的發(fā)展 1 操作測驗的發(fā)展 比奈 西蒙量表以言語測驗為主 制約了對整體智力的測驗和測驗向某些人群的推廣 于是出現(xiàn)操作性測驗 2 團體智力測驗的發(fā)展 第一次世界大戰(zhàn)之前 主要是屬于個人測驗 后因戰(zhàn)爭需要 團體智力測驗迅速發(fā)展 3 能力傾向測驗的發(fā)展 20世紀30年代 因素分析技術(shù)使智力結(jié)構(gòu)理論迅速發(fā)展 促進了智力測驗 特別是能力傾向測驗的發(fā)展 4 人格測驗的發(fā)展 20世紀40年代 由于社會動蕩 人格障礙成為社會生活中的突出問題 這推動了人格理論的繁榮和發(fā)展 也進而推動了人格測驗的發(fā)展 P358 22 3 現(xiàn)代心理測驗在中國的發(fā)展 在20世紀二三十年代 我國早期心理學(xué)家進行了比奈智力量表的引進和修訂工作 陳鶴琴等著名心理學(xué)家進行了大量教育心理的測驗和研究工作 后因抗戰(zhàn)爆發(fā) 測驗工作處于停滯 建國后的最初幾年 心理測驗也得到發(fā)展 但后因?qū)W習(xí)蘇聯(lián)批判兒童學(xué) 連帶兒童學(xué)的研究方法 心理測驗也受到批判 進入20世紀80年代后 我國的心理測驗得到順利發(fā)展 主要進行了智力與人格量表的引進和修訂 近年 主要致力于測驗的本土化工作 編制適合于我國文化背景的智力測驗 適應(yīng)行為量表等 P358 23 1 用心理量表將心理現(xiàn)象數(shù)量化的方法是 A 個案法B 會談法C 觀察法D 測量法2 測量的二要素是 A 行為樣組B 參照點C 客觀性D 標準化E 單位3 測量結(jié)果可以進行加減乘除運算的量表是 A 命名量表B 順序量表C 等距量表D 等比量表4 心理測驗的要素是 A 行為樣組B 參照點C 客觀性D 標準化E 單位5 心理測驗或心理測量的性質(zhì)包括 A 神秘性B 間接性C 準確性D 客觀性E 相對性 返回目錄 本節(jié)學(xué)習(xí)檢測題 24 6 按測驗的功能或目標分類 心理測驗包括 A 個人測驗B 智力測驗C 文字測驗D 特殊能力測驗E 人格測驗7 下列有關(guān)心理測驗性質(zhì)的描述哪項是正確的 A 心理測驗可以直接反映心理品質(zhì)的量B 心理測驗分數(shù)是心理品質(zhì)的相對估計C 心理測驗分數(shù)是絕對客觀的 沒有主觀因素參與D 如果兩個人的測驗分數(shù)相等 那么他們的心理品質(zhì)也完全相同8 根據(jù)測驗?zāi)康?可將心理測驗劃分為預(yù)測性 診斷性和 等形式 A 文字性B 非文字性C 計劃性D 描述性9 我國心理門診運用較多的心理測驗主要有 A 智力測驗B 管理能力測驗C 人格測驗D 心理評定量表E 團體智力測驗 返回目錄 25 10 最早關(guān)注個別差異測量并提出相關(guān)概念的學(xué)者是 A 高爾頓B 卡特爾C 比內(nèi)D 推孟11 最早提出 心理測驗 概念 并強調(diào)要建立常模的學(xué)者是 A 高爾頓B 卡特爾C 比內(nèi)D 推孟12 完成了第一個正式心理測驗編制的學(xué)者是 A 高爾頓B 卡特爾C 比內(nèi)D 推孟13 最早使用智力商數(shù)概念的學(xué)者是 A 高爾頓B 卡特爾C 比內(nèi)D 推孟14 在比 西測驗問世后 心理測驗的主要發(fā)展為 A 操作測驗的發(fā)展B 團體測驗的發(fā)展C 能力傾向測驗的發(fā)展D 人格測驗的發(fā)展 返回目錄 26 第二節(jié)測驗的常模 常模 就是常定模具 是衡量被試分數(shù)相對高低的固定對照 模板 它由 原始分 與 導(dǎo)出分 組成 實際上就是 測驗所得原始分 與 在相應(yīng)人群中該分排位的等級 的對照表 導(dǎo)出分也叫常模分 是根據(jù)常模樣本施測的分數(shù)計算出來的 然后就成為評估被試測驗分數(shù)的標準或基礎(chǔ) 導(dǎo)出分是具有參照點和單位的一個意義明顯的測驗量表 是一個排位值 當被試參加測驗 得到了原始分數(shù)之后 與常模對照 即可得到排位分 一 常模與常模分數(shù) 27 二 常模團體及其測量分數(shù)的轉(zhuǎn)換 1 什么叫做常模團體 常模團體是具有某種共同特征的人組成的一個群體 或者是該群體的一個代表性樣本 確定常模團體的方法是 先由測驗將要施測的對象確定一般總體 然后根據(jù)常模擬適用的范圍確定目標總體 再從目標總體中抽取一代表性樣本 就形成了一個常模團體 就一個測驗 可以根據(jù)被試特征的不同選擇出多個不同的常模團體 制訂出多個常模 以適用于對不同被試的測量與評估 一 常模團體 P360 28 2 常模團體的條件 適合于選用的常模團體必須符合下列條件 1 所測群體的構(gòu)成必須是界定明確的 2 常模團體必須是所測群體的代表性樣本 以保證分數(shù)的分布特征與目標總體一致 3 樣本大小要適當 樣本大小的關(guān)鍵是看其是否具有代表性 總體小 只有幾十人 則需100 的樣本 總體大 樣本也要大 一般不少于30或100人 全國性常模 一般應(yīng)有2000 3000人為宜 4 具有時空的新近性 P360 29 3 常模團體的取樣方法 取樣就是從目標總體中抽取有代表性的樣本 其方法包括概率性抽樣和非概率性抽樣兩類 具體做法有 1 簡單隨機抽樣 2 系統(tǒng)隨機抽樣 3 分組抽樣 4 分層抽樣 5 整群隨機抽樣 P361 30 4 常模團體的抽樣誤差 略 我們期望常模團體能完全代表總體 即常模團體測驗得分的平均分及其分布狀態(tài)與所在總體完全重合 但實際上很難做到 在抽樣過程中會產(chǎn)生誤差 當這種誤差一旦出現(xiàn) 就會成為一個常模中的系統(tǒng)誤差 所以有必要對該誤差大小進行估計 以便能估計出使用這個常模來評定被試成績時可能產(chǎn)生的誤差范圍 統(tǒng)計學(xué)使用標準誤來估計抽樣誤差 它與被試異質(zhì)性成正比 與樣本容量的平方根成反比 即 31 試比較下列兩組數(shù)據(jù) 32 二 常模團體分數(shù)的轉(zhuǎn)換 常模團體的被試均按標準程序參加測驗 就可以得到每個被試的測驗分數(shù) 將這些分數(shù)按大小順序排列 就可以得到一個分數(shù)分布表 一系列排位等級 由此可確定各種等級位數(shù)和標準分數(shù) 百分等級 百分點 百分位數(shù) 十分位數(shù) 四分位數(shù) 標準分等 有了上述排位值或標準分 就可以找到某一被試測驗分數(shù)的相對排位 這種排位值就是常模分數(shù) P361 33 返回目錄 34 三 常模的類型 1 發(fā)展常模 年齡量表 1 發(fā)展順序量表 發(fā)展順序量表 就是對正常兒童樣本的心理或行為能力的發(fā)展順序進行觀測 并制訂出各種發(fā)展水平與年齡的對照表 這種對照表就是發(fā)展順序量表 它可以提供給人們的是關(guān)于各年齡正常兒童所具有的能力或行為方式 它是最直觀的發(fā)展常模 最早的范例是葛塞爾發(fā)展順序量表 P363 35 葛塞爾發(fā)展程序表 葛塞爾發(fā)展程序表是按月份顯示兒童在運動水平 適應(yīng)性 語言 社會性四方面大致的發(fā)展水平 他強調(diào)兒童發(fā)展的規(guī)律性 順序性 具體如 4周 能控制眼睛運動 去追隨一個對象 16周 能使頭保持平衡 28周 能用手抓握東西 并擺玩它 40周 能控制軀干 坐立或爬行 52周 能控制腿腳運動 站立或行走 P363 36 皮亞杰關(guān)于兒童發(fā)展的研究 皮亞杰的研究著重于從嬰兒到十多歲兒童認知過程的發(fā)展 尤其注重某些特殊概念的形成 其中最著名的工作就是對 守恒 概念的研究 他發(fā)現(xiàn) 兒童不同時期出現(xiàn)不同的守恒概念 5歲時出現(xiàn)質(zhì)量守恒概念 6歲時出現(xiàn)重量守恒概念 7歲時出現(xiàn)容量守恒概念 P363 37 2 智力年齡 比奈 西蒙智力測驗最先使用了智力年齡的概念 這個量表實際上是一個智力發(fā)展的年齡量表 根據(jù)兒童所能完成的題目處在哪一年齡 就把這一年齡稱為他的智力年齡 簡稱智齡 IA 在吳天敏修訂的比奈智力量表中 每個年齡有六個題目 所以每完成一個題目相當于智齡兩個月 這些題目的難度是呈梯級增加的 這樣可以根據(jù)被試完成的題數(shù)確定其智齡 P363 38 3 年級當量 年級當量就是年級量表 測驗結(jié)果說明被試的能力或?qū)W績達到了哪一年級的水平 年級量表的單位通常為10個月 4 5的年級當量代表的是第4年級中的第5個月水平或說中間水平 而不是指4 5年級的平均水平 7 3代表的是7年級中的第3個月水平 P364 39 2 百分位常模 百分位常模包括百分等級和百分點 四分位數(shù) 十分位數(shù) 未分組資料的百分等級 百分點 也叫百分位數(shù) 計算 P364 40 3 標準分常模 標準分常模是將原始分數(shù)與平均數(shù)的距離以標準差為單位表示出來的量表 常見的標準分數(shù)有 z分數(shù) Z分數(shù) T分數(shù) 標準九分數(shù) 離差智商 IQ 等 在線性轉(zhuǎn)換中 加上一個常數(shù)是為消除負數(shù) 乘上一個常數(shù)是為了去掉小數(shù)點 如將原始分數(shù)轉(zhuǎn)換為平均數(shù)為50 標準差為10的標準分 則叫做T分數(shù) T 50 10z 最早提出者是麥柯爾 P365 41 非線性轉(zhuǎn)換的標準分數(shù) 了解 標準九分是一9級的分數(shù)量表 它是以5為平均數(shù) 以2為標準差的一個分數(shù)量表 標準十分是一10級的分數(shù)量表 其以5為平均數(shù) 以1 5為標準差 標準二十分是一20級的分數(shù)量表 其以10為平均數(shù) 以3為標準差 P365 42 4 智商及其意義 1 比率智商 但是 用比率智商反映個體的智力發(fā)展 概念有缺陷 首先心理年齡 MentalAge 簡稱MA 與實足年齡 ChronologicalAge 簡稱CA 并不同步增長 所以比率智商不適合于年齡較大的被試 其次 不同年齡組兒童的比率智商分布的情況不一樣 所以相同的比率智商在不同年齡就具有不同意義 P366 43 2 離差智商 離差智商是一種以年齡組為樣本計算而得標準分數(shù) 并且轉(zhuǎn)換成平均數(shù)為100 標準差為15的標準分數(shù) 其中 X為一被試的測驗分數(shù) M為相應(yīng)年齡組常模樣本測驗的平均分 SD為相應(yīng)年齡組常模樣本測驗的標準差 P366 44 四 常模分數(shù)的表示方法 1 轉(zhuǎn)換表法 轉(zhuǎn)換表也叫常模表 一個轉(zhuǎn)換表顯示出一個特定的標準化樣組的原始分數(shù)與其相應(yīng)的等值分數(shù) 百分位 標準分數(shù) T分數(shù)或者其他任何分數(shù) 利用轉(zhuǎn)換表可以將被試的測驗分數(shù)轉(zhuǎn)換為與其對應(yīng)的導(dǎo)出分數(shù) P368 45 2 剖面圖法 剖面圖是將測驗分數(shù)的轉(zhuǎn)換關(guān)系用圖形表示出來 從剖面圖上可以很直觀地看出被試在各個分測驗上的表現(xiàn)及其相應(yīng)的位置 46 47 1 常模團體必須是所測群體的 A 總體B 優(yōu)秀分子C 隨機樣本D 代表性樣本2 全國性常模 一般常模團體應(yīng)有 人為宜 A 30 100B 100 500C 2000 3000D 5000以上3 最早的發(fā)展順序量表是 制訂的 A 比內(nèi)B 皮亞杰C 葛塞爾D 科爾伯格4 皮亞杰特別關(guān)注一些特殊概念形成的研究 如 概念的研究 A 數(shù)量B 守恒C 順應(yīng)D 同化5 百分位常模包括 A 百分等級B 百分點C 四分位數(shù)D 十分位數(shù) 本節(jié)學(xué)習(xí)檢測題 48 6 小明語文分數(shù)在全班50名同學(xué)中排15名 則其百分等級為 A 15 B 30 C 71 D 85 7 常見的標準分常模有 A T分數(shù)B 百分位數(shù)C 離差智商D 標準九分數(shù)8 標準T分數(shù)的平均數(shù)為50 標準差為 A 5B 10C 15D 不確定9 標準九分的平均數(shù)和標準差分別為 A 5 1B 6 1C 5 2D 6 210 標準十分的平均數(shù)和標準差分別為 A 5 1B 6 1C 5 1 5D 6 1 511 使用最廣 影響最大的常態(tài)化標準分數(shù)是 A T分數(shù)B 比率智商C Z分數(shù)D 離差智商 49 12 16PF的量表分是 A 標準九分B 標準十分C T分數(shù)D Z分數(shù)13 比率智商是指 A 實足年齡與心理年齡之比B 心理年齡與實足年齡之比C 心理年齡與實足年齡之差D 實足年齡與心理年齡之差14 在斯坦福 比內(nèi)量表的發(fā)展中 其主要特征是 A 測驗成績用智齡表示B 首次引用智商概念C 用離差智商代替比率智商D 用L型和M型兩個等值量表15 下面哪一個是離差智商 A IQ MA CA 100B IQ MA CA 100 C IQ 100 15 X X SDD IQ 50 15 X M SD16 最簡單和最基本的常模表示方法是 A 比率智商B 離差智商C 轉(zhuǎn)換表D 剖面圖 50 第三節(jié)測驗的信度分析 信度是指同一被試者在不同時間內(nèi)用同一測驗 或用另一套相等的測驗 重復(fù)測量 所得結(jié)果的一致性程度 前后測驗分數(shù)一致性程度高 即可信度高 反之可信度低 一 信度的定義 P371 51 信度的本質(zhì) 一般來說 使用一個工具對個體進行測量時 所得結(jié)果由兩部分組成 X T E 其中 T是真分數(shù) 它是穩(wěn)定的值 E是隨機誤差 它的變化是隨機的 如重復(fù)進行測量 隨機誤差會造成分數(shù)起伏變化 隨機誤差小 實測分數(shù)起伏小 信度較高 相反 隨機誤差大 實測分數(shù)起伏大 數(shù)據(jù)不穩(wěn)定 信度較低 所以 信度受隨機誤差而不是系統(tǒng)誤差影響 理論上講 要評估工具的信度 就要對一個人反復(fù)進行測量 看前后結(jié)果的穩(wěn)定性 但是 這在很多時候是行不通的 52 通常的做法是 選取一個被試團體即樣本 使用一個工具對樣本團體中的每一個體進行測量 得到一組數(shù)據(jù) 這一組數(shù)據(jù)的總變異方差Sx2 ST2 SE2 如果測量中沒有隨機誤差 則實測數(shù)據(jù)總方差就等于真分數(shù)方差 數(shù)據(jù)完全可信 如果隨機誤差很大 真分數(shù)方差只占總方差中很小一部分 數(shù)據(jù)幾乎全無可信 如果隨機誤差較小 真分數(shù)占總方差的大部分 則信度較高 于是信度被定義為 一組測量分數(shù)中真分數(shù)的方差與測驗分數(shù)的總方差之比 該比率也叫信度系數(shù) 由公式看出 隨機誤差引起的方差越小 信度系數(shù)越接近于1 53 54 二 信度的指標 信度的定義是明確的 但是在一組測量分數(shù)中 真分數(shù)方差是未知的 所以真分數(shù)方差與誤差方差無法分離 信度系數(shù)計算仍然是一句空話 不過 可以設(shè)想 讓一個被試團體接受同一種工具的兩次測量 因為實測分數(shù)由真分數(shù)和隨機誤差組成 隨機誤差較小時實測分數(shù)主要由真分數(shù)組成而真分數(shù)在前后兩次測量中是穩(wěn)定的 所以前后兩次實測分數(shù)一致性就高 具有較高的正相關(guān) 反之 就具有低相關(guān)甚至負相關(guān) 所以 兩次測量結(jié)果的相關(guān)可以間接反映測量隨機誤差大小 信度系數(shù)就是一種相關(guān)系數(shù) 信度系數(shù)成為可計算的指標了 1 信度系數(shù)與信度指數(shù) P371 55 信度指數(shù)等于真分數(shù)標準差與實測分數(shù)標準差的比值 所以信度系數(shù)正好等于信度指數(shù)的平方 信度指數(shù) P371 56 何謂相關(guān)呢 相關(guān)系數(shù)的意義是什么 57 2 測量的標準誤 隨機誤差的標準差也就是標準誤 對于一個樣本的測量來說 分數(shù)的標準差一部分是反映個體真值的差異性 一部分是反映隨機誤差的起伏變化性即誤差的標準差 根據(jù)前面的信度公式可以推導(dǎo)出 SE越大 rxx就越小 反之 rxx就越大 所以標準誤也是一種信度指標 P371 58 三 信度評估的方法 1 重測信度 test retestreliabllity 又稱穩(wěn)定性系數(shù) 使用同一測驗 在其他條件相同的情況下對同一組被試者前后施測兩次測驗 求兩次得分間的相關(guān)系數(shù) 一般是2 4周較宜 間隔時間最好不超過6個月 P372 59 2 復(fù)本信度 alternate formreliability 以兩個等值但題目不同的測驗 復(fù)本 來測量同一群體 然后求得被試者在兩個測驗上得分的相關(guān)系數(shù)復(fù)本信度反映的是測驗在內(nèi)容上的等值性 故又稱等值性系數(shù) 某種意義上 它更像效度 P372 60 3 內(nèi)部一致性信度 1 分半信度 split halfreliability 這個相關(guān)系數(shù)就代表了兩半測驗內(nèi)容取樣的一致程度 式中為rhh為一半分數(shù)的相關(guān)系數(shù) rXX為測驗在原長度時的信度估計值 P373 61 2 同質(zhì)性信度 homogeneityreliability 代表測驗內(nèi)部所有題目間的一致性 如果各項目測量同一心理特質(zhì) 則項目間得分應(yīng)有顯著的正相關(guān) 這時內(nèi)部一致性較高 信度較高 如果項目間出現(xiàn)低相關(guān)或負相關(guān) 則內(nèi)部一致性差 信度不高 當測驗包含多個分測驗時 則應(yīng)首先計算各分測驗的同質(zhì)性信度 再計算全量表的同質(zhì)性信度 對二項記分測驗 使用庫德 理查遜公式計算同質(zhì)信度 對于多等級記分的測驗 計算克倫巴赫 系數(shù)來估算信度大小 對于項目編排時 專門進行反向記分處理的項目 要在計算同質(zhì)性信度之前對記分進行反向調(diào)整 P373 62 4 評分者信度 隨機抽取若干份測卷 由兩位評分者按評分標準分別給分 然后根據(jù)每份測驗卷的兩個分數(shù)計算相關(guān) 即得評分者信度 一般要求在成對的受過訓(xùn)練的評分者之間評分一致性要達到0 90以上 才認為評分是可信的 當評分者人數(shù)達到三人以上時 通過計算肯德爾和諧系數(shù)來估價評分者信度 P373 63 四 信度與測驗分數(shù)的解釋 1 解釋實測得分與真分數(shù)的相關(guān) 信度系數(shù)反映了實測分數(shù)變化與真分數(shù)變化的一致性程度 當rxx 1 00時 二者完全一致 實測數(shù)據(jù)的變異量 方差 全部是由于真分數(shù)不同引起的 當rxx 0 00時 則說明實測分數(shù)的變異量全部是由隨機誤差起伏變化引起的 實測數(shù)據(jù)變化沒能反映真分數(shù)不同的任何信息 當rxx 0 90 說明實測數(shù)據(jù)變化的90 都是由真分數(shù)不同引起的 實測分數(shù)反映了真分數(shù)大部分的變化信息 具有高的可信度 所以 信度系數(shù)也反映了測量的隨機誤差比例 P373 64 在根據(jù)信度水平?jīng)Q定是否采用某一測驗時 需要重點考慮測驗的目標和功用 一般能力測驗和成就測驗 信度應(yīng)在0 90以上 人格 態(tài)度 興趣 價值觀等測驗 信度應(yīng)在0 80以上 另需注意 1 信度系數(shù)低于0 70時 測驗不能用于對人的評價和預(yù)測 也不能用于作團體間的比較 達到0 70以上 可用于作團體比較 達到0 85以上 測驗可用于對個人的評價和預(yù)測 2 新編測驗的信度應(yīng)高于同類測驗或相似測驗 2 確定測驗的可接受程度 P374 65 3 解釋個人分數(shù)的意義 兩個作用 其一 是估計真實分數(shù)的范圍 其二 是了解實得分數(shù)再測時可能的變化情形 P374 66 五 信度的影響因素 信度常用信度系數(shù)來表示 信度系數(shù)就是相關(guān)系數(shù) 相關(guān)系數(shù)的獲得需要一個被試樣本 或叫樣本團體 1 樣本團體異質(zhì)性的影響 當樣本異質(zhì)性高時 計算的信度系數(shù)會較大 可能會高估測驗的信度 反之 計算的信度系數(shù)較小 可能會低估測驗信度 2 樣本團體平均能力水平的影響 樣本平均能力水平的高低也會影響分數(shù)的分布 所以也會影響信度計算 一般要求 在給出信度系數(shù)時 也要描述相應(yīng)的測量樣本 1 被試樣本特征 P375 67 2 測驗的長度 測驗的長度 即測驗的項目數(shù)會影響測驗的信度 1 測驗越長 測驗的測題取樣或內(nèi)容取樣越具有代表性 2 測驗越長 被試的猜測因素對結(jié)果的影響就越小 但是 增加測驗長度的效果是遵循報酬遞減率原則的 這里可以利用斯皮爾曼 布朗公式的導(dǎo)出公式了解測驗長度與信度系數(shù)的關(guān)系 要使測驗的信度從原來的rxx提高到rkk 則測驗的長度需要增加到原來的K倍 P376 68 3 測驗的難度 對于能力與成就測驗來說 存在難度問題 一般來說 中等難度的測驗 計算出來的信度系數(shù)較大 太難和太容易都會使信度較低 對于簡答題 難度為0 50 求得的信度較高 對于選擇題 因有猜測成分 所以難度應(yīng)適當提高 P376 69 4 時間間隔 對于重測信度和不同時測量的復(fù)本信度來說 存在時間間隔問題 時間間隔越短 計算得到的信度系數(shù)越大 時間間隔越長 信度系數(shù)越低 一般是2 4周較宜 間隔時間最好不超過6個月 P376 70 1 衡量測量結(jié)果一致性程度的指標是 A 區(qū)分度B 難度C 信度D 效度2 下列可作為信度指標的是 A 信度系數(shù)B 信度指數(shù)C 標準差D 標準誤3 重測信度反映的是測驗在 上的穩(wěn)定性 A 內(nèi)容B 時間C 空間D 誤差4 復(fù)本信度反映的是兩個測驗在 上的一致性 A 內(nèi)容B 時間C 空間D 誤差5 重測信度的計算中 重測的時距一般最多不要超過 A 2周B 4周C 4月D 6月 本節(jié)學(xué)習(xí)檢測題 71 6 內(nèi)部一致性信度主要包括 兩種 A 分半信度和重測信度B 重測信度和復(fù)本信度C 復(fù)本信度和同質(zhì)性信度D 分半信度和同質(zhì)性信度7 二級評分測驗同質(zhì)信度可用以下 方法計算 A 分半信度B 庫德 理查遜公式法C 系數(shù)法D 重測信度法8 計算的分半信度為0 80 那么整個測驗的信度大約為 A 0 80B 0 85C 0 89D 0 959 用庫德 理查遜公式計算信度的方法適用于 A 多等級選擇測驗B 判斷題測驗C 多項選擇和判斷題測驗D 簡答題10 克倫巴赫 系數(shù)法適合于 測驗的信度計算 A 多等級選擇測驗B 判斷題測驗C 多項選擇題測驗D 簡答題 72 11 評估評分者之間一致性的信度是 A 復(fù)本信度B 肯德爾和諧系數(shù)C 同質(zhì)信度D 分半信度12 一個測驗選用哪種方法計算信度 主要是看 A 哪種因素導(dǎo)致更大的誤差B 哪種因素導(dǎo)致的誤差最小C 哪種方法更簡單D 對哪種方法更熟練13 要取得較高的同質(zhì)信度 測驗內(nèi)部項目間得分要有 A 較高正相關(guān)B 較高負相關(guān)C 較低正相關(guān)D 較低負相關(guān)14 當一個測驗的信度系數(shù)為0 85時 就可以說 A 真分數(shù)變異占總變異的85 B 真分數(shù)變異占總變異的15 C 隨機誤差變異占總變異的85 D 隨機誤差變異占總變異的15 15 一般的能力測驗和成就測驗的信度系數(shù)應(yīng)達到 以上 A 0 70B 0 80C 0 90D 0 95 73 16 影響信度的因素包括 A 樣本特征B 測驗長度C 測驗難度D 時間間隔17 樣本團體同質(zhì)性高 則計算的信度系數(shù) A 會低估測驗的信度B 會高估測驗的信度C 會偏低D 會偏高18 當希望以增加測驗長度的方法使其一50題組成的測驗的信度系數(shù)從0 85提高到0 90 那么測驗長度要增加 題 A 30B 60C 80D 9019 受時間間隔影響的信度計算是 A 重測信度B 分半信度C 同質(zhì)信度D 克倫巴赫 系數(shù) 74 第四節(jié)測驗的效度 一 效度的概念 1 什么叫做效度 在心理測驗中 效度是指一個測驗所能測量到它想要測量的心理特質(zhì)或傾向的程度 也就是它對測量目標測量的準確性 測量分數(shù)可分解為真分數(shù)和隨機誤差 真分數(shù)可以再分解為兩部分 反映測量目標水平的分數(shù)和系統(tǒng)誤差 即與測量目標有關(guān)的部分和與測量目標無關(guān)的部分 效度是 在一組測量分數(shù)中 與測量目標有關(guān)部分的方差S2V與總方差S2X之比 P379 75 2 效度的性質(zhì) 1 效度具有相對性任何測驗都是針對一定目標編制的 用于該目標就會有效 用于其他目標就可能無效 對某一總體有效的測驗 對于其他總體未必有效 某一心理學(xué)家認為有效的測驗 其他心理學(xué)家可能認為無效 2 效度具有連續(xù)性說明 一 測驗效度也是用相關(guān)系數(shù)表示 有高低之分 非 有 和 無 之差 二是 效度是針對測量結(jié)果來說的 P379 76 3 效度與信度的關(guān)系 1 信度是效度的必要條件 但不是充分條件 2 效度總會受到信度的制約 它不會超過信度的平方根 P380 77 二 效度評估的方法 美國心理學(xué)會在1974年所發(fā)行的 教育與心理測量之標準 一書中將效度分為三大類 內(nèi)容效度 構(gòu)想效度 效標效度 1 內(nèi)容效度 content relatedvalidity 內(nèi)容效度是指測驗項目在內(nèi)容上的適合性 即是否是所欲測量的行為領(lǐng)域的代表性取樣 要編制有高內(nèi)容效度的測驗 就要對測量的心理特性有明確的定義 并劃定出相應(yīng)的行為內(nèi)容 其次 測驗題目應(yīng)是所界定的行為內(nèi)容的代表性取樣 P380 78 內(nèi)容效度的專家評定法 專家評定是最常用的內(nèi)容效度評估方法 是請有關(guān)專家對測驗題目與測量目標的符合性程度作出評判 看測驗的題目是否代表欲測的內(nèi)容 也可以請專家對測驗項目的適合性進行定量評定 專家的判斷多是依賴于對內(nèi)容的邏輯分析 所以這種評估的效度也叫做邏輯效度 P381 79 關(guān)于內(nèi)容效度要注意的兩個問題 第二 內(nèi)容效度與表面效度的區(qū)分 最高作為測驗可以有比較高的表面效度 典型行為測驗則要有比較低的表面效度 但兩類測驗都要有高的內(nèi)容效度 第一 測驗要有高的內(nèi)容效度 但不一定要有高的同質(zhì)性 P381 80 2 構(gòu)想效度 1 什么叫做構(gòu)想效度 構(gòu)想效度 就是一個測驗對于某一理論構(gòu)想或內(nèi)在心理特質(zhì)假設(shè)的證實程度 測量程度 所以也叫做構(gòu)思效度 結(jié)構(gòu)效度等 建立構(gòu)想效度的邏輯順序 基于相關(guān)專業(yè)知識和觀測資料 提出某一心理特質(zhì)假設(shè)或某一心理結(jié)構(gòu)理論假設(shè) 然后根據(jù)理論或假設(shè)所可能對應(yīng)的行為特點編制測驗并進行施測 最后對測量結(jié)果進行相關(guān)或因素分析 驗證其與理論假設(shè)的符合程度 P382 81 2 構(gòu)想效度的評估方法 從測驗的組成成分來分析其結(jié)構(gòu)是否與理論構(gòu)思一致 常用因素分析方法來確定測驗的結(jié)構(gòu)成分 當使用一個新編制的測驗對目標群體施測后 對測驗項目進行因素分析 還可以通過計算相容相關(guān)和區(qū)分相關(guān)來間接驗證所編測驗?zāi)軌驕y量的是不是某一種心理特質(zhì)或理論構(gòu)想 P382 82 3 效標效度 1 什么叫效標效度 效標效度是指使用測驗分數(shù)預(yù)測個體在某種情境下行為表現(xiàn)的準確性 被預(yù)測的行為同時也就成為檢驗測驗有效性的效標 這種效度也叫實證效度 根據(jù)效標資料與測驗分數(shù)獲得的時間不同 效標效度又分為同時效度和預(yù)測效度 二者差異主要在于測驗的目的不同 同時效度與用來診斷現(xiàn)狀的測驗有關(guān) 后者與預(yù)測將來結(jié)果的測驗有關(guān) P383 83 2 效標效度的評估方法 相關(guān)法 區(qū)分法 命中率法 P384 84 4 效度系數(shù)的計算方法 效標效度的計算 第一步取得測驗分數(shù)x和效標分數(shù)y 好的效標需要具備下列條件 有效的反映測驗的目標 具有較高的信度 穩(wěn)定可靠 可以客觀地加以測量 可用數(shù)據(jù)或等級來表示 測量的方法要簡單 省時省力 經(jīng)濟可用 85 當測驗分數(shù) 效標資料均為連續(xù)數(shù)據(jù)時 使用積差相關(guān) 當測驗分數(shù) 效標資料均為等級變量時 使用等級相關(guān) 第二步根據(jù)兩種分數(shù)的性質(zhì)選用適當方法計算相關(guān)系數(shù) 86 三 效度系數(shù)的作用 預(yù)測效標 效度系數(shù)的實際意義常以決定系數(shù)表示 即效度的內(nèi)涵 為相關(guān)系數(shù)的平方 它表示測驗正確預(yù)測或解釋的效標方差占總方差的比例 如測驗的效度是0 80 則測驗分數(shù)能正確預(yù)測效標分數(shù)變異量的64 效度系數(shù)是根據(jù)測驗分數(shù)和效標分數(shù)計算出來的相關(guān)系數(shù) 所以它也反映了二者所具有的共變關(guān)系 這樣就可以建立二者的回歸方程式 以便由測驗分數(shù)預(yù)測效標分數(shù) P385 87 如果用一被試的測驗分數(shù)來估計他的效標分數(shù) 誤差會有多大呢 這用標準誤來估計 從公式看 效度系數(shù)的大小與估計的誤差有關(guān) 如果效度系數(shù)rxy 1 00 則估計誤差等于0 通過測驗分數(shù)可準確預(yù)測效標分數(shù)變化 如果rxy 0 00 則以測驗分數(shù)無法估計效標分數(shù) 以測驗分數(shù)預(yù)測效標則無異于猜測 P385 88 預(yù)測效率指數(shù) 據(jù)預(yù)測效標分數(shù)的標準誤計算公式 無關(guān)系數(shù)K的計算公式 K反映了測驗分數(shù)與效標分數(shù)的無關(guān)程度 它受效度系數(shù)的影響 當效度系數(shù)等于1時 K 0 測驗分數(shù)與效標分數(shù)有完全的對應(yīng)關(guān)系 當效度系數(shù)等于0 K 1 測驗分數(shù)與效標分數(shù)100 的無關(guān) 測驗與效標分數(shù)完全無關(guān) 它對效標分數(shù)沒有任何預(yù)測力 當效度系數(shù)等于0 90時 可以計算出K 0 436 即測驗分數(shù)與效標分數(shù)的無關(guān)程度是43 6 預(yù)測效率指數(shù)就是56 4 即使用該測驗預(yù)測被試的效標分數(shù) 較之瞎猜 可以減少56 4 的誤差 P386 89 四 效度的影響因素 根據(jù)前文關(guān)于信度和效度概念的分析 知道 隨機誤差影響信度 進而影響效度 系統(tǒng)誤差直接影響效度本身 所以 凡是會產(chǎn)生隨機誤差和系統(tǒng)誤差的因素都會影響測驗的效度 P386 90 1 測驗編制本身的因素 測驗取材的代表性 長度 試題類型 難度 區(qū)分度以及編排方式等都會影響效度 為此 編制要注意 1 測驗材料要有應(yīng)測內(nèi)容具有代表性 2 盡量避免誤差較大的題型 如是非題 3 難度要適中 具有較大的區(qū)分度 4 測驗長度要恰當 保證一定的題量 5 測題的排列應(yīng)先易后難 P386 91 2 測驗施測過程中的干擾因素 1 測驗實施中主試的影響 如是否按標準化來實施 測驗與效標測量的實施的時間間隔 測驗環(huán)境的布置等 2 測驗實施中被試的影響 如被試參加測驗的動機 情緒 態(tài)度 身體狀態(tài) 反應(yīng)定勢等 P386 92 3 所抽取的樣本團體的特點 1 樣本團體的異質(zhì)性 其他條件相同 樣本團體同質(zhì)性越高 分數(shù)范圍越小 得到的效度系數(shù)就會越低 會低估測驗效度 反之 得到的效度系數(shù)就越大 可能會高估效度 比如 只使用經(jīng)選拔后的被試組成樣本團體 增加了被試同質(zhì)性 測驗得到的效度系數(shù)會較低 2 干涉因素 樣本團體的有些變量會影響效度測驗 比如被試的年齡 性別 受教育程度 智力 動機 興趣 職業(yè)等特征 對于同一個測驗來說 使用的樣本團體不同 得到的效度系數(shù)也會不同 P387 93 4 效標的性質(zhì) 1 效標與測驗分數(shù)是否是線性關(guān)系 2 效標測驗本身的可靠性 即信度 P388 94 1 效度是指測驗的準確性 即 A 真分數(shù)方差與總方差之比B 隨機誤差方差與總方差之比C 與測量目標有關(guān)的真實方差與總方差之比D 真分數(shù)方差與系統(tǒng)誤差方差之比2 反映測驗題目是否是所欲測量的行為領(lǐng)域的代表性取樣 屬于 A 內(nèi)容效度B 構(gòu)想效度C 效標效度D 表面效度3 使用專家判斷法評估的效度也叫 A 效標效度B 表面效度C 邏輯效度D 構(gòu)想效度4 在下列測驗中 最需要降低表面效度的測驗是 A 智力測驗B 氣質(zhì)測驗C 性格測驗D 學(xué)績測驗 本節(jié)學(xué)習(xí)檢測題 95 5 當效度系數(shù)等于1時 被試的測驗分數(shù) A 可以準確預(yù)測其效標分數(shù)B 對效標分數(shù)沒有任何的預(yù)測力C 就是效標分數(shù)D 與效標分數(shù)有最大的正相關(guān)6 影響效度的因素包括 A 測驗本身B 主試因素C 被試因素D 效標的性質(zhì)7 用下列樣本評估中學(xué)生智力測驗效度 得到較大效度系數(shù)的是 A 全省中學(xué)生的代表性樣本B 全省重點高中學(xué)生的代表性樣本C 全省青少年的代表性樣本D 全省當年高考一本上線代表性樣本 96 第五節(jié)項目分析 一 項目的難度 1 難度的定義 測驗項目的難易程度 通常以題目的通過率為指標 2 難度的計算方法 1 二分法計分項目最簡單方法就是以被試在該項目上的通過率評估難度 當被試人數(shù)多時 可以高分組和低分組通過率的平均數(shù)來評估 P PH PL 2 P389 P R N 100 97 在有多選項的選擇題中 為了平衡機遇因素的影響 可采用吉爾福特的難度校正公式來計算難度 Cp為校正后的通過率 P為實際得到的通過率 K為被選答案數(shù) 98 2 非二分計分的項目 即以被試在某一項目上得分的平均值除以該題滿分 再乘以100 P390 99 3 難度水平的確定 1 項目難度的確定 難度分析的目的在于篩選項目 難度確定取決于測驗的目的 性質(zhì)以及項目的形式 一般來說 P值越接近于0 50 區(qū)別力越高 為了使測驗具有更大的區(qū)別力 各題目難度可考慮控制在0 50 0 20 當測驗用于選拔時 可較多地選擇難度接近于錄取率的項目 當測驗用于篩選或診斷出少數(shù)被試 則難度要比較低即P值要比較大 P390 100 2 測驗難度的確定 整個測驗的難度取決于組成項目的難度 如果測驗分數(shù)接近于常態(tài)分布 說明整個測驗的難度較為恰當 如果出現(xiàn)明顯的正偏態(tài)分布 說明難度偏大 可增加一些較容易的題目 如果出現(xiàn)明顯的負偏態(tài) 說明難度偏小 可增加一些難度較大的題目 P390 101 二 項目的區(qū)分度 1 項目區(qū)分度的定義 項目區(qū)分度也叫鑒別力 是指測驗項目對被試的心理特性 傾向性或發(fā)展水平的區(qū)分能力 項目區(qū)分度的取值范圍在 1 1之間 主要是指項目得分與實際能力水平之間的相關(guān)程度 相關(guān)系數(shù)越大 區(qū)分度越高 P391 102 2 區(qū)分度的計算方法 1 鑒別指數(shù) 通常 以測驗總分高分組 前27 和低分組 后27 在一項目上通過率或得分率之差作為該項目的鑒別指數(shù) 即D PH PL 美國測量專家伊貝爾 L Ebel 提出了一套項目鑒別指數(shù)的平均標準 0 40 很好0 30 0 39 良好 修改后更佳0 20 0 29 尚可 但需修改0 19以下 差 必須淘汰 P391 103 2 相關(guān)法 計算區(qū)分度最常用的方法是 以某一項目分數(shù)與效標成績或測驗成績總分的相關(guān)作為該項目區(qū)分度的指標 相關(guān)越高 表明項目越具有區(qū)分功能 P392 104 3 區(qū)分度與難度的關(guān)系 一般來說 中等難度的項目區(qū)分度最大 但是區(qū)分度和難度都是相對的 有條件的 較難的項目對高水平的被試區(qū)分度高 較容易的項目對低水平的被試區(qū)分度高 中等難度的項目對中等水平的被試區(qū)分度高 測驗中項目的難度分布最好也是常態(tài)分布的 其中很難的和很容易的項目都較少 中等難度的項目最多 平均難度在0 50左右 這樣可以提高整個測驗的鑒別力 P392 105 下列公式中屬于難度計算的是 A R N 100 B P PH PL 2C KP 1 K 1 D D PH PL 能夠更好的區(qū)分被試之間差異的測驗項目的難度一般是 A 0B 0 5C 1D 無所謂3 下列測題區(qū)分度D屬于很好的是 A 0 6B 0 41C 0 36D 0 284 對于選拔性測驗來說 測驗的難度應(yīng)該 A 較小B 中等C 較大D 無所謂5 對于診斷性測驗來說 測驗的難度應(yīng)該 A 較小B 中等C 較大D 無所謂 本節(jié)學(xué)習(xí)檢測題 106 第六節(jié)心理測驗編制的程序 第一步測驗的目標分析 簡單地說 就是要 1 確定測量的對象群 即測量總體2 確定測量結(jié)果的用途3 確定測量的具體內(nèi)容 P394 107 1 測量的對象 測驗編制前 要明確測驗適應(yīng)的團體 只有對受測者的年齡 受教育程度 社會經(jīng)濟地位和閱讀水平有清楚了解 測驗編制才能做到有針對性 舉例來說 被試理解題意嗎 108 2 測量結(jié)果的用途 測驗?zāi)康?結(jié)果的用途不同 測驗的選材范圍和項目難度都會有所不同 P394 109 3 測量的目標 測驗?zāi)繕司褪强s編測驗欲測量的心理變量或行為傾向 為使測驗有效 需對測量目標進行分析 目標分析可分為三種情況 1 工作分析 也叫任務(wù)分析 是針對特定領(lǐng)域或崗位的選拔性或預(yù)測性測驗所進行的目標分析 分兩步 先確定特定工作或活動取得高績效所需要的心理特質(zhì)或行為傾向 再建立考察被試績效的效標 2 給特定概念下定義 即分析所要測量心理特質(zhì)或品質(zhì)的內(nèi)涵 并在此基礎(chǔ)上給出操作性定義 便于將抽象的心理特質(zhì)具體化 3 確定測驗具體內(nèi)容 描述性顯示測驗編制前 要確定測驗所要顯示的內(nèi)容和技能 以便從中進行內(nèi)容取樣 常使用雙向細目表 P395 110 第二步測題的編寫 目標分析需要大量調(diào)研 而測題編寫時 也需要開展調(diào)研 以搜集可以寫進測驗的項目 下列資料是獲得測驗項目的重要參考 1 已有標準測驗 即從已有測驗中選擇 修訂項目為新測驗所用 2 理論和專家經(jīng)驗 根據(jù)理論構(gòu)念 將其具體化為外顯行為 從而作為測題使用 專家經(jīng)驗可直接提供測驗題目 3 臨床醫(yī)生和護理人員 教師的觀察和工作記錄 這是測驗行為取樣的主要源泉 如MMPI 羅夏墨跡測驗 學(xué)習(xí)適應(yīng)性測驗等 1 項目來源 P396 111 2 命題的一般原則 1 內(nèi)容方面 符合測驗?zāi)康?避免貪多而亂出題 內(nèi)容取樣要有代表性 題目間互相獨立 且要盡量避免復(fù)合性測題 2 文字方面 使用準確的當代語言 避免生僻字詞 語句表述要充分 簡明扼要 一句話說明一個概念 即語義單一 明確 清晰 盡量不用雙重否定 3 理解方面 題目應(yīng)有確切答案 除創(chuàng)造力測驗和人格測驗外不應(yīng)具有引起爭議的可能 不要超出受測者的知識水平和理解力 4 社會敏感性方面 盡量避免有社會敏感性的問題 P396 112 2 編制要領(lǐng) 1 選擇題 2 是非題 3 簡答題 4 操作題 P396 113 第三步測驗的編排和組織 1 試題形式的選擇 1 根據(jù)測驗的目的和材料性質(zhì)選擇試題形式 2 根據(jù)受測者團體的特點選擇試題形式 3 根據(jù)實際的制約因素選擇試題形式 如被試者人數(shù) 時間和經(jīng)費限制等 P399 114 2 題目審定 是測驗編制者或有關(guān)專家對題目反復(fù)審查修訂 改正意義不明確的詞語 取消一些重復(fù)和不適宜的題目 組成預(yù)備測驗 題目審定時需要注意以下問題 1 除必要的調(diào)整外 審核題目的內(nèi)容及結(jié)構(gòu)是否與計劃一致 2 保留的題目數(shù)量應(yīng)比最后所需題數(shù)多出一倍至幾倍 以備篩選和制作復(fù)本使用 3 題目的難度要適當 符合測驗?zāi)康牡男枰?4 題目的說明必須清楚明白 P400 115 3 測題的編排 測驗題目選出之后 根據(jù)測驗的目的 性質(zhì) 被試的可能心理反應(yīng) 加以合理編排 一般應(yīng)依照以下原則 1 測題宜由易到難排列 2 盡可能將同類型的測題組合在一起 3 注意根據(jù)各種類型測題本身的特點排列題目 4 盡量將涉及個人敏感性話題的題目排在后邊 P400 116 測題的編排方式 1 并列直進式 將整個測驗的試題或項目按照性質(zhì)或測量目標不同 單列為幾個分測驗 此為 并列 而每個分量表中的項目由易到難排列 此為 直進 通常 智力測驗是采用這種排列方式 2 混合螺旋式 將整個測驗的試題或項目按難度分層 然后在每一個難度層次里 將各分測驗或分量表的項目交叉混排 使測驗難度逐漸升進 被試能較好維持作答興趣 如比內(nèi) 西蒙智力量表 P401 117 第四步預(yù)測 項目分析與修改 測驗基本成型后 需要從目標總體中選擇一定容量的樣本進行預(yù)測 預(yù)測之后要做項目分析 以評估測驗的質(zhì)量和為進一步的修改完善提供客觀依據(jù) P401 118 1 預(yù)測的目的 預(yù)測的目的在于獲取被試對測題的反應(yīng)資料 以便從定性和定量兩方面分析測題乃至整個測驗的質(zhì)量 比如 哪些題目的意義不清 容易引起誤解 是否存在時限長度不合適 某些題目容易引起被試反感等意想不到的情況 施測過程中是否還存在需要進一步控制的因素等 P401 119 2 預(yù)測時應(yīng)注意的問題 1 預(yù)測對象應(yīng)來自目標總體 取樣有代表性 規(guī)模要合適 2 預(yù)測的過程和環(huán)境應(yīng)盡量接近將來實際施測的過程和環(huán)境 3 預(yù)測的時限應(yīng)放寬 盡量讓每個被試將題目做完 4 預(yù)測過程中 隨時記錄被試反應(yīng) 如被試進度 不理解的題 P401 120 3 預(yù)測后的項目分析與修改 預(yù)測后 對測題及整個測驗進行定性和定量分析 定性分析主要是關(guān)于題目的適切性 思想性 表達清晰性和準確性等 定量分析主要是對預(yù)測資料進行統(tǒng)計分析 以評估題目的難度 區(qū)分度 備選答案的合適度等 根據(jù)分析結(jié)果 對測驗進行修改和完善 包括修改 增刪項目 調(diào)整測驗的編排結(jié)構(gòu)等 然后再預(yù)測 再分析 再修改 此過程可循環(huán)多次 以獲得滿意的測驗 P401 121 第五步質(zhì)量評估及其參數(shù)計算 測驗編好后可在小范圍內(nèi)試用 以對其可信度和有效性進行初步鑒定 確定其是否可用 被認為是可用的測驗 可以在一個較大的 代表性樣本中試測 并依據(jù)測驗資料估價測驗的信度 效度 P402 122 第六步常模制訂 常模是依據(jù)標準化樣本測量分數(shù)分布模式制訂出來的 而標準化樣本就是來自目標總體的較大的代表性樣本 將測驗在標準化樣本中施測 然后將所得分數(shù)進行統(tǒng)計整理 形成一個具有代表性的分數(shù)分布 即常模 常用的心理測驗常模包括 百分位常模 標準分常模 發(fā)展常模及商數(shù)等 P402 123 第七步編寫指導(dǎo)手冊 指導(dǎo)手冊的內(nèi)容包括 1 測驗的目標和功用 2 測驗的理論背景 材料選取的原則 方法和統(tǒng)計指標 3 指導(dǎo)語 4 測驗的標準答案或計分標準 5 常模資料 包括常模表 常模適用團體 測驗分數(shù)的換算和解釋方法 6 測驗的基本特征 難度 鑒別力 信度 效度和因素分析等資料 P402 124 1 命題的一般原則涉及以下 幾個方面 A 內(nèi)容B 文字C 理解D 社會敏感性2 題目審定時 可對初選的題目進行刪減 一般保留的題目是 A 少于測驗所需的題目 以便為增加新題目留有余地B 等于測驗所需的題目C 多出一倍至幾倍 以便篩選和編制復(fù)本D 盡可能的多 以便精選項目3 心理測驗常用的測題編排方式有 A 難以交叉式B 并列直進式C 混合螺旋式D 隨意混排式 本節(jié)練習(xí)題 125 4 編制測驗時進行預(yù)測的目的是 A 對測題質(zhì)量進行定性分析 B 對測題質(zhì)量進行定量分析 C 測試時- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 心理測量學(xué) 基礎(chǔ)知識
鏈接地址:http://www.820124.com/p-7688834.html