新課件-心理測量學.ppt
《新課件-心理測量學.ppt》由會員分享,可在線閱讀,更多相關《新課件-心理測量學.ppt(261頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、心理咨詢師考試心理測量學知識,張春雨() 西南大學心理學院,主要內(nèi)容,第一節(jié) 概述 第二節(jié) 測驗的常模 第三節(jié) 測驗的信度 第四節(jié) 測驗的效度 第五節(jié) 項目分析 第六節(jié) 測驗編制的一般程序 第七節(jié) 心理測驗的使用,第一節(jié) 概述,第一單元 測量與測量量表 第二單元 心理測驗的基本概念 第三單元 心理測驗的分類 第四單元 糾正錯誤的測驗觀 第五單元 心理測驗在心理咨詢中的應用 第六單元 心理測驗的發(fā)展史,一、什么是測量 測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。 三個主要的元素:(1)事物;(2)數(shù)字;(3)法則。,第一單元 測量與測量量表,所謂“事物”,指的是我們要測量的對象,更準確地說,就是
2、引起我們興趣的事物的屬性或特征。 所謂“數(shù)字”,是代表某一事物或事物某一屬性的量。 區(qū)分性1與2 序列性(等級性)3 2 1 等距性 321、 211 可加性 所謂“法則”,代表的是測量所依據(jù)的規(guī)則和方法,二、測量要素,(一)參照點 參照點有兩種: 絕對零點 人定的參照點,即相對零點 (二)單位 好的單位必須具備兩個條件: 確定的意義 相同的價值,三、測量量表,測量的本質(zhì)是根據(jù)某一法則將事物數(shù)量化,即在一個定有單位和參照點的連續(xù)體上把事物的屬性表現(xiàn)出來,這個連續(xù)體稱為量表。 由于制定量表的單位和參照點不同,量表的種類也不同。,(1)命名量表 只是用數(shù)字來代表事物或?qū)κ挛镞M行分類。 量表中的數(shù)字
3、沒有任何數(shù)值意義,不能作量化分析。無大小意義,只表明類別。 無參照點和單位。無法比較大小或進行任何數(shù)學方法運算。 測量水平最低的一種形式,如代號、類別,四類量表,(2)順序量表 表明類別的大小或某種屬性的多少。 主要用于分等論級和分類。 數(shù)字僅表示等級并不表示某種屬性的真正量或絕對值。 無參照點(沒有絕對零度)和單位。 無法進行數(shù)學方法運算。,(3)等距量表 存在大小關系。 無絕對零度,但存在相對零點。 有相等單位,可以進行加減數(shù)學運算,但不能做乘除運算。,(4)等比量表 是最精確的測量。具有相等單位又有絕對零點。 大多是物理量表,可以進行各種數(shù)學運算??梢灾朗挛镏g的某種特點上相差多少及它
4、們之間的倍數(shù)關系。 心理測驗本質(zhì)屬于順序量表!,第二單元 心理測量的基本概念,一、心理測量的定義 二、心理測量的性質(zhì),一、心理測量的定義,所謂心理測量,就是依據(jù)心理學理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的行為,對于貫穿在人的全部行為活動中的心理特點做出推論和數(shù)量化分析的一種科學手段。,二、心理測量的性質(zhì),(一)間接性 (二)相對性 (三)客觀性,心理測量的間接性,研究者無法直接測量人的心理,只能測量人的外顯行為,也就是說,只能通過一個人對測驗題目的反應來推論他的心理特質(zhì)。 特質(zhì)是構成人格的最小單位,是激發(fā)與指導個體的各種反應的恒常的心理結構。,心理測量的相對性,在對人的行為做比較
5、時,沒有絕對的標準,也就是沒有絕對的零點,有的只是一個連續(xù)的行為序列。所謂測驗就是看每個人處在這個序列的什么位置上。,心理測量的客觀性,測驗的客觀性實際上就是測驗的標準化問題。對一切測量的共同要求是測驗工具的標準化。 測驗用的項目或作業(yè)、施測說明、施測者的言語態(tài)度及施測時的環(huán)境等,要求標準化。 測驗評分記分的原則和手續(xù)也要經(jīng)過標準化,使反應的量化是客觀的。 最后,分數(shù)轉(zhuǎn)換和解釋標準化,對結果的推論應該是客觀的。,第三單元 心理測驗的分類,按測驗的功能分類 按測驗材料的性質(zhì)分類 按測驗材料的嚴謹程度分類 按測驗的方式分類 按測驗的要求分類,一、按測驗的功能分類,(一)智力測驗 (二)特殊能力測驗
6、 (三)人格測驗 EPQ 16PF MMPI,二、按測驗的性質(zhì)分類,(一)文字測驗 (二)操作測驗 也稱非文字測驗。,三、按測驗材科的嚴謹程度分類,(一)客觀測驗 (二)投射測驗,,四、按測驗的方式分類,(一)個別測驗 (二)團體測驗,,,五、按測驗的要求分類,(一)最高行為測驗(智力測驗、成就測驗) (二)典型行為測驗(人格測驗),第四單元 糾正錯誤的測驗觀,錯誤的測驗觀 正確的測驗觀,一、錯誤的測驗觀,(一)測驗萬能論 (二)測驗無用論 (三)心理測驗即智力測驗,二、正確的測驗觀,(一)心理測驗是重要的心理學研究方法之一,是決策的輔助工具 (二)心理測驗作為研究方法和測量工具尚不完善,第五
7、單元 心理測驗在心理咨詢中的應用,智力測驗 人格測驗 心理評定量表,這幾個方面是我國目前心理門診中運用較多的,第六單元 心理測驗的發(fā)展史,科學心理測驗的產(chǎn)生和發(fā)展 現(xiàn)代心理測驗在我國的發(fā)展,一、科學心理測驗的產(chǎn)生與發(fā)展,高爾頓(FGalton) 提出人的不同氣質(zhì)特點和智能是按身體特點的不同而遺傳的。 為了研究差異的遺傳性,便設計了測量差異的方法。 為心理測驗奠定了統(tǒng)計學基礎。他第一個提出了相關的概念,,卡特爾,卡特爾是對心理測驗發(fā)展做出巨大貢獻美國心理學家。1890年,卡特爾在心理雜志上發(fā)表心理測驗與測量一文,這是心理測驗第一次出現(xiàn)于心理學文獻中。在此文中,卡特爾寫到:“心理學若不立足于實驗與
8、測量上,決不能夠有自然科學之準確性。”又說:“心理測驗如果有一個普遍的標準,則其科學的與實用的價值都可以增加。”他當時就極力主張測驗手續(xù)和考試方法應有統(tǒng)一規(guī)定,并要有常模以便比較。所有這些都是測量學上的重要概念。,比內(nèi)(ABinet) 世界上第一個正式的心理測驗。,,20世紀以后,心理測驗主要有以下幾個方面的發(fā)展: 1操作測驗的發(fā)展 2團體智力測驗的發(fā)展 3能力傾向測驗的發(fā)展 4人格測驗的發(fā)展,二、現(xiàn)代心理測驗在我國的發(fā)展,近些年來我國的心理學家正在致力于測驗本土化.,近代中國的心理測驗,1914年,Creighton比較中美兒童智力差異(廣州,500人) 1916年,樊炳清首先介紹了比 西智
9、力量表 1918年,Walcott用S-B施測(清華) 1918年,俞子夷編制“小學生毛筆書法量表” 1920 南京高等師范學校,廖世承、陳鶴琴開設心理測量課,1921年,廖世承、陳鶴琴出版書心理測量法 1921年,費培杰將比內(nèi)智力測驗翻成中文 1922年,張耀翔在北京將心理測驗列為入學考試科目 1922年夏,中華教育改進社聘請美國麥柯爾 1924年,陸志韋發(fā)表訂正比內(nèi)西蒙智力測驗說明書;36年代與吳天敏做修訂(80年代吳天敏3修),,1931年6月由艾偉、陸志韋、陳鶴琴、蕭孝嶸等倡議,組織并成立了中國測驗學會。南京 1932年,測驗創(chuàng)刊 1935年,沈有乾用“朋洛德人格問卷”測量中國學生 1
10、937年,周先庚使用“塞斯頓情緒穩(wěn)定性測驗” 此時智力測驗和人格測驗約20種,教育測驗50種,1943年,林傳鼎試用“普萊西X-O測驗” 丁瓚等于46,4752年分別將TAT(主題統(tǒng)覺測驗)與韋克斯勒 布勒維測驗用于臨床。 194851年間,劉范使用過RIT(羅夏克墨跡圖測驗)。 至1949年,出版的測驗方面的書籍共計20余種,,1979年,林傳鼎,吳天敏,張厚粲在武漢舉辦全國測驗培訓班 1979年,龔耀先主持修訂“韋克斯勒成人智力量表” 1979年,林傳鼎、張厚粲編制“少年兒童學習能力測驗” 1980年,林傳鼎、張厚粲主持修訂“韋克斯勒兒童智力量表” 1980年,北師大開設心理測驗課,,19
11、80年,張厚粲開始對高考試卷做系統(tǒng)分析 1981年,劉紹衣修訂“卡特爾16種人格因素問卷” 1982年,吳天敏第三次修訂中國比內(nèi)測驗 1982年,宋維真修訂“明尼蘇達多相人格調(diào)查表”,,1983年,龔耀先、陳仲庚修訂“艾森克問卷” 1984年,中國心理學會成立心理測量專業(yè)委員會 1984年,我國正式加入“國際教育成就評價協(xié)會” 1985年,張厚粲主持修訂“瑞文標準推理測驗” 1986年,龔耀先主持修訂“韋克斯勒幼兒智力量表”,1987年,張明園修訂“生活事件量表” 1989年,李丹修訂“瑞文測驗(聯(lián)合型)” 1990年,中國加入國際測驗委員會(ITC);吳文源修訂“癥狀自評量表(SCL-90)
12、” 1992年,戴忠恒修訂“一般能力傾向測驗”,,1992年,宋維真編制“心理健康調(diào)查表” 1992年,沙毓(yu)英等編制“學生性格量表” 1993年,宋維真等編制“中國人個性測量表”(CPAI) 1980年代,編制超常、弱智兒童篩查量表、03(6)歲兒童發(fā)育、發(fā)展量表、CPM領導行為評價量表,真題練習,200705- 103、正確的測驗觀包括( )。 (A)心理測驗是重要的心理學研究方法之一,是決策的輔助工具 (B)做心理測驗時態(tài)度要正確 (C)心理測驗作為研究方法和測量工具不完善 (D)“一考定終身”說明心理測驗非常重要 200705- 104、人格測驗包括( )。 (A)EPQ (
13、B)MMPI (C)16PF (D)CRT 200711-50、關于測量,正確的說法是( )。 (A)測量就是心理測量 (B)就是依據(jù)一定的法則用數(shù)字對事物加以確定 (C)就是用數(shù)字描述事物的法則 (D)就是用一些題目或數(shù)字來描述事物的屬性,AC,ABC,B,真題練習,200806-105、心理測驗具有( )。 (A)外顯性 (B)間接性(C)相對性 (D)客觀性 200806-106按測驗的功能,可將測驗分為( )。 (A)智力測驗 (B)特殊能力測驗 (C)人格測驗 (D)投射測驗 200806-109錯誤的測驗觀包括( )。 (A)心理測驗即人格測驗(B)心理測驗尚不完善 (C)心理測
14、驗即智力測驗(D)測驗萬能論 200811-106、按測驗的方式分類,可將測驗分為( )。 (A)操作測驗 (B)文字測 (C)個別測驗 (D)團體測驗,BCD,ABC,ACD,CD,真題練習,200811-107、心理測驗具有( )。 (A)外顯性 (B)間接性 (C)相對性 (D)客觀性 200811-108、測量的主要元素包括( )。 (A)事物 (B)數(shù)字 (C)法則 (D)描述 200905-91、測量所用數(shù)字具有自然數(shù)的特點,即具有 (A)區(qū)分性 (B)等級性 (C)等距性 (D)可加性 200905-118、等距量表中的數(shù)值可以進行( )運算。 (A)加 (B)減 (
15、C)乘 (D)除,BCD,ABC,ABCD,AB,真題練習,200911- 34、人格測驗不包括( )。 (A)EPQ (B)16PF(C)CRT(D)MMPI2 200911- 55、在順序量表中,變量具有( )。 (A)相等單位(B)絕對零點(C)等級(D)可以做四則運算 200911- 75、編制世界上第一個正式的心理測驗的學者是( )。 (A)高爾登(B)比內(nèi)(C)卡特爾(D)奧蒂斯 200911- 91、按測驗的功能,可將測驗分為( )。 (A)智力測驗(B)特殊能力測驗(C)人格測驗(D)投射測驗 200911- 118、按測驗材料的性質(zhì),可將測驗分為( ) (A)文字測驗(B)主
16、題統(tǒng)覺測驗(C)智力測驗(D)操作測驗,C,C,B,ABC,AD,真題練習,201011- 107、按測驗材料的性質(zhì),可將測驗分為( )。 (A)文字測驗 (B)智力測驗(C)主題統(tǒng)覺測驗 (D)操作測驗 201105-53、在順序量表中,變量具有()。 (A)相等單位(B)等級(C)絕對零點(D)可以做四則運算,AD,小結: 第一節(jié) 概述,第一單元 測量與測量量表 第二單元 心理測驗的基本概念 第三單元 心理測驗的分類 第四單元 糾正錯誤的測驗觀 第五單元 心理測驗在心理咨詢中的應用 第六單元 心理測驗的發(fā)展史,心理測量學,第一節(jié) 概述 第二節(jié) 測驗的常模 第三節(jié) 測驗的信度 第四節(jié) 測驗的
17、效度 第五節(jié) 項目分析 第六節(jié) 測驗編制的一般程序 第七節(jié) 心理測驗的使用,第二節(jié)測驗的常模,第一單元 常模團體 第二單元 常模的類型 第三單元 常模分數(shù)的表示方法,,第一單元 常模團體,一、常模團體的性質(zhì) 常模團體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。 用一個標準的、規(guī)范的分數(shù)表示出來,以提供比較的基礎。 任何一個測驗都有許多可能的常模團體。,,第一單元 常模團體,一、常模團體的性質(zhì) 常模的選擇主要是基于對測驗將要施測的總體的認識,常模團體必須能夠代表該總體。 常模的選擇包括:確定一般總體、確定目標總體、確定樣本。 使用測驗需要特別注意常模團體。,,二、常模團體的
18、條件,(一)群體的構成必須明確界定 (二)常模團體必須是所測群體的代表性樣本 (三)樣本的大小要適當 在實際工作中,應從經(jīng)濟的或?qū)嵱玫目赡苄院蜏p少誤差這兩個方面來綜合考慮樣本的大小。 一般最低不小于30或100個。全國性常模,一般應有20003000人為宜。 樣本大小適當?shù)年P鍵是樣本要有代表性。 (四)標準化樣組是一定時空的產(chǎn)物 在選擇合適常模時,要注意選擇較為新近的常模。,三、取樣的方法,取樣即從目標人群中選擇有代表性的樣本。 抽樣方法有下列幾種:,,(一)簡單隨機抽樣 按照隨機表順序選擇被試構成樣本,,(二)系統(tǒng)抽樣 系統(tǒng)抽樣要求目標總體無序可排,也無等級結構存在。,,(三)分組抽樣 先將
19、群體進行分組,再在組內(nèi)進行隨機取樣。,,(四)分層抽樣 先將目標總體按某種變量分成若干層次,再從各層次中隨即抽取若干被試,最后把各層的被試組合成常模樣本。,,,四、常模分數(shù)與常模,(一)常模分數(shù) 常模分數(shù)就是施測常模樣本被試后,將被試者的原始分數(shù)按一定規(guī)則轉(zhuǎn)換出來的導出分數(shù)。 由原始分數(shù)構成的分布轉(zhuǎn)換而來的分數(shù),叫導出分數(shù) 導出分數(shù)具有一定的參照點和單位,它實際是一個有意義的測驗量表,它與原始分數(shù)等值。(有意義、等單位、帶參照點),(二)常模,常模分數(shù)構成的分布,就是通常所說的常模(norm),它是解釋心理測驗分數(shù)的基礎。 常模有一般常模與特殊常模之分。,第二單元 常模的類型,發(fā)展常模 百分位
20、常模 標準分常模 智商及其意義,一、發(fā)展常模,個人的分數(shù)指出他的行為在按正常途徑發(fā)展方面處于什么樣的發(fā)展水平。 (一)發(fā)展順序量表 (二)智力年齡 (三)年級當量,,,,,(一)發(fā)展順序量表,最早的一個范例是格塞爾發(fā)展程序表 皮亞杰最著名的工作就是對守恒概念的研究。,,,,,格塞爾嬰幼兒發(fā)展量表Gesell Developmental Schedules 由美國耶魯大學的A.格塞爾及其同事制定的嬰幼兒發(fā)展測量工具。最初發(fā)表于1925年,后對它作了幾次修訂,先后發(fā)表于1937、1940、1947和1974年。1974年修訂版的測試對象為從出生至5歲、重點是3歲以下的幼兒,測試時間約30分鐘。 格
21、塞爾早期用電影記錄并分析了幼兒的日常行為反應,發(fā)現(xiàn)了幼兒發(fā)展程序的規(guī)律。他認為,幼兒的生長發(fā)展是有次序地逐步成熟和由簡易分化到精細分化。幼兒的行為在抵達某一階段時會顯示出特殊的飛躍式進展,幼兒的新行為在成熟程序上具有代表性,并反映其在生長發(fā)育上已抵達新的階段。格塞爾稱這些年齡階段為樞紐年齡,并把測定樞紐年齡列為量表的重點檢查項目和診斷標準。格塞爾量表確定,1歲內(nèi)以每4周為一個階段,而以4周、16周、28周、40周、52周作為樞紐年齡,13歲間則以36月為一個階段,以18月、24月、36月為樞紐年齡。,格塞爾嬰幼兒發(fā)展量表Gesell Developmental Schedules 其檢查內(nèi)容分
22、應人能:測試幼兒對周圍人的應答能力和料理自己生活的能力;應物能:測試幼兒看物、摘物和繪畫等能力;言語能:測試幼兒聽、理解和言語能力;動作能:測試幼兒坐、步行和跳躍的能力。結果以發(fā)展商數(shù)評價幼兒的發(fā)展水平。格塞爾認為,所觀察到的發(fā)展現(xiàn)象反映了中樞神經(jīng)系統(tǒng)的成熟程序。這一理論受到各方面的肯定。 格塞爾量表具有臨床診斷的價值,它不僅適用于測量幼兒的發(fā)展水平,而且比其他量表更適用于傷殘兒,被認為是嬰幼兒智能測試的經(jīng)典方法。20世紀60年代初,中國開始在臨床上試用格塞爾量表。,(一)發(fā)展順序量表,皮亞杰對守恒概念的研究。,,,,,,兒童不是時期出現(xiàn)不同的守恒概念 5歲能理解質(zhì)量守恒概念 6歲掌握重量守恒
23、概念 7歲掌握容量守恒概念,(二)智力年齡 比內(nèi)-西蒙量表中首先使用智力年齡的概念。 一個兒童在年齡量表上所得的分數(shù),就是最能代表他的智力水平的年齡。這種分數(shù)叫做智力年齡,簡稱智齡。 直接的計算 年齡常模轉(zhuǎn)換,(三)年級當量 年級當量實際上就是年級量表,測驗結果說明屬哪一年級的水平,在教育成就測驗中最常用。,二、百分位常模,百分位常模包括百分等級和百分點、四分位數(shù)和十分位數(shù),(一)百分等級,一個測驗分數(shù)的百分等級是指在常模樣本中低于這個分數(shù)的人數(shù)百分比。,,(二)百分點(百分位數(shù)),在分數(shù)量表上,相對于某一百分等級的分數(shù)點就叫百分點或百分位數(shù)。,(三)四分位數(shù)和十分位數(shù),四分位數(shù)是將量表分成四
24、等份,相當于百分等級的25%、50%和75%對應的三個點分成的四段。 十分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到?。┡判蚝螅?個點將全部數(shù)據(jù)分為10等份,與9個分割點上相對應的數(shù)據(jù)稱為十分位數(shù)。,三、標準分常模,常見的標準分數(shù)有:z分數(shù)、Z分數(shù)、T分數(shù)、標準九分數(shù)、離差智商(IQ)等。 標準分數(shù)可以通過線性轉(zhuǎn)換,也可以通過非線性轉(zhuǎn)換得到,(一)線性轉(zhuǎn)換的標準分數(shù),(公式5-2) 其中X為任一原始分數(shù), 為樣本平均數(shù),SD為樣本標準差。 Z=A+Bz(公式5-3) 加上一個常數(shù)(A)是為了去掉負值,乘以一個常數(shù)(B)是為了使單位變小從而去掉小數(shù)點。,,,(一)線性轉(zhuǎn)換的標準分數(shù),當以50為平均數(shù)(
25、即加上一個常數(shù)50),以10為標準差(乘以一個常數(shù)10)來表示時,通常叫做T分數(shù),即: T50+10 (公式5-4) 最早使用T分數(shù)者是麥柯爾。,,標準九分、十分、二十分,標準九分:量表是個9級的分數(shù)量表。它是以5為平均數(shù),以2為標準差的一個分數(shù)量表。 標準十分:平均數(shù)為5,標準差為1.5; 標準二十分:平均數(shù)為10,標準差為3。 使用最廣、影響最大的一種常態(tài)化標準分數(shù)則是離差智商。,(二)非線性轉(zhuǎn)換的標準分數(shù),當原始分數(shù)不是常態(tài)分布時,也可以使之常態(tài)化,這一轉(zhuǎn)換過程就是非線性的。 常態(tài)化過程主要是將原始分數(shù)轉(zhuǎn)化為百分等級,再將百分等級轉(zhuǎn)化為常態(tài)分布上相應的離均值,并可以表示為任何平均數(shù)和標
26、準差。計算步驟如下: 1對每個原始分數(shù)值計算累積百分比; 2在常態(tài)曲線面積表中,求出對應于該百分比的z分數(shù)。 所得的z分數(shù)可將分布分成幾部分,稱z/分數(shù),以區(qū)別由線性轉(zhuǎn)換所求得的z分數(shù)。,,四、智商及其意義,若心理年齡高于其生理年齡,則智力較一般兒童高,若心理年齡低于其生理年齡,則智力較一般兒童低。但在使用中發(fā)現(xiàn),單純用心理年齡來表示智力高低的方法缺乏不同年齡兒童間的可比性,(一)比率智商,比率智商(IQ)被定義為心理年齡(MA)與實足年齡(CA)之比。 (公式5-5) 由于個體心理年齡與實足年齡并不同步增長,所以比率智商并不適合于年齡較大的被試。,,(二)離差智商,是一種以年齡組
27、為樣本計算而得的標準分數(shù),它表示的是個體智力在年齡組中所處的位置,因而是表示智力高低的一種理想的指標。 韋克斯勒將離差智商的平均數(shù)定為100,標準差定為15。 (公式5-6),,,,16%,50%,第三單元 常模分數(shù)的表示方法,一、轉(zhuǎn)換表法 二、剖析圖 將測驗分數(shù)的轉(zhuǎn)換關系用圖形表示出來。,真題練習,200705-50、常模樣本量一般不小于( )。 A)100或500 (B)800或1000 (C)20或25 (D)30或100 200705-51、維克斯勒將離差智商的平均數(shù)定位100,標準差定為 (A) 17 (B)15 (C)11 (D)13 200711-
28、 51、系統(tǒng)抽樣的關鍵是計算( )。 (A) 樣本量(B)總體(C)隨機數(shù)(D)組距 200711- 52、百分等級的55的分數(shù)表示在常模樣本中有55%的人比這個分數(shù)( )。 (A)低(B)相等(C)高(D)以上都不正確 200711-53、( )可以將測驗分數(shù)的轉(zhuǎn)換關系用圖形表示出來,便于直觀的看出被試者在各個分測驗上的表現(xiàn)及相對位置。 (A)條形圖(B)直方圖(C)剖面圖(D)餅狀圖,D,B,D,A,C,200806-53、( )是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。 (A)團體 (B)常模團體 (C)樣本 (D)受測人群 200806-54、常模分數(shù)構
29、成的分布,就是通常所說的( ),它是解釋心理測驗分數(shù)的基礎。 (A)常模分數(shù) (B)常模 (C)導出分數(shù) (D)分數(shù) 200806-55、 ,式中SD為( )。 (A)樣本平均數(shù)B)任一原始分數(shù) C)樣本標準差D)標準分數(shù) 200806-56韋克斯勒將離差智商的平均數(shù)定為100,標準差定為( )。 (A)16 (B)15 (C)14 (D)13 200806-57最簡單而且最基本的表示常模的方法就是 (A)轉(zhuǎn)換表 (B)分布表 (C)對照表 (D)指數(shù)表,B,B,C,C,B,A,200811-55、取樣是指從( )中選擇有代表性的樣本。 (A)總體 (B)群體 (C)目標人群 (D
30、)樣本 , 200811-56、常模分數(shù)又叫( )。 (A)導出分數(shù) (B)粗分數(shù) (C)原始分數(shù) (D)總體分數(shù) 200811-57、標準二十分的標準差為( ) (A)5 (B)4 (C)3 (D)2 200811-58、韋克斯勒將離差智商的平均數(shù)定為100,標準差定為 (A)16 (B)15 (C)14 (D)13 200811-105、發(fā)展順序量表可以告訴人們某兒童的發(fā)育與其年齡相比 (A)超前 (B)滯后 (C)正常 (D)以上都不是 200905-34、以50為平均數(shù)、以10為標準差表示的標準分數(shù)叫 (A)標準九分數(shù) (B)T分數(shù)(C)離差智商 (D)Z分數(shù) 200
31、905-56、隨機號碼表法是( )。 A)簡單隨機抽樣(B)系統(tǒng)抽樣(C)分組抽樣 (D)分層抽樣 200905-76、比率智商(IQ)是( )與實足年齡之比。 A)生理年齡 (B)真實年齡 (C)心理年齡 (D)智力年齡 200905-105、標準分數(shù)可以通過( )得到。 (A)線性轉(zhuǎn)換(B)非線性轉(zhuǎn)換(C)分析 (D)變化,C,A,C,B,ABC,B,A,C,AB,200911-56、首先使用智力年齡概念的是( )量表 (A)比內(nèi)西蒙(B)韋克斯勒(C)斯坦福比內(nèi)(D)瑞文 200911-105、屬于標準分數(shù)常模的是( )。 (A)百分等級(B)T分數(shù)(C)比率智商(D)離差智商 2010
32、5- 34發(fā)展常模就是( )。 A團體的分數(shù) B百分位數(shù) C個人的分數(shù) D年齡量表 20105- 35在心理測驗中,對于非典型群體需要制定( ) A普通常模 B特殊常模 C一般常模 D發(fā)展常模 20105- 56具有某種共同特征的人所組成的一個群體或者是該群體的一個樣本,叫做( )。 A團體 B常模團體 C樣本 D受測人人群 20105- 57以50為平均數(shù),以10為標準差來表示的分數(shù),通常叫 AZ分數(shù) B標準九分數(shù) CT分數(shù) D離差智商 20105- 76解釋心理測驗分數(shù)的比較基礎是( )。 A常模分數(shù) B常模 C導出分數(shù) D分數(shù),A,BD,B,B,C,B,20105- 92抽樣的方
33、法一般包括( )。 A分層抽樣 B系統(tǒng)抽樣 C分組抽樣 D簡單隨機抽樣 20105- 121常模的構成要素包括( )。 A抽樣分數(shù) B原始分數(shù) C導出分數(shù) D對常模團體的具體描述 201011- 56、常模樣本量的大小,一般最低不小于( )。P337 (A)100或500 (B)800或1000(C)20或25 (D)30或100 201011- 57、“某分數(shù)的百分等級為55”表示在常模樣本中有55%的人的分數(shù)比該分數(shù)(A)。P340 (A)低 (B)相等(C)高 (D)全不是 201011- 58、以50為平均數(shù)、以10為標準差來表示的分數(shù)通常叫( )。P342 (A)Z分數(shù) (B)T分數(shù)
34、(C)標準九分數(shù) (D)離差分數(shù) 201011- 59、( )表示的是個體智力分數(shù)在同年齡組分數(shù)分布中所處的位置。P343 (A)離差智商B)比率智商C)百分等級 D)標準九分數(shù),ABCD,BCD,D,A,B,A,201011- 60、()是將測驗分數(shù)的轉(zhuǎn)換關系用圖形表示出來,從而可以很直觀地看出披試者在各個分測驗分數(shù)分布中的相對位置。P346 (A)條形圖 (B)直方圖(C)剖面圖 (D)散點圖 201011- 106、標準分數(shù)可以通過( )得到。P341 (A)線性轉(zhuǎn)換 (B)非線性轉(zhuǎn)換(C)求積 (D)求和 201105-54、由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣
35、本,稱為( )。 (A)團體(B)常模團體(C)樣本(D)受測人群,C,AB,B,小結:第二節(jié) 測驗的常模,第一單元 常模團體 第二單元 常模的類型 第三單元 常模分數(shù)的表示方法,心理測量學,第一節(jié) 概述 第二節(jié) 測驗的常模 第三節(jié) 測驗的信度 第四節(jié) 測驗的效度 第五節(jié) 項目分析 第六節(jié) 測驗編制的一般程序 第七節(jié) 心理測驗的使用,第三節(jié) 測驗的信度,第一單元 信度的概念 第二單元 信度評估的方法 第三單元 信度與測驗分數(shù)的解釋 第四單元 影響信度的因素,補充內(nèi)容:,經(jīng)典測驗理論的基本假設,一、誤差的含義和種類,(一)含義 測量誤差指的是在測量過程中與測量目的無關的變化因素所產(chǎn)生的一種不準
36、確或不一致的測量效應。 (二)種類 系統(tǒng)誤差 隨機誤差,二、誤差的來源,(一)測驗本身引起的誤差 取樣缺乏代表性,詞語模棱兩可 (二)施測過程引起的誤差 1.主試者方面:年齡、性別、外表、動作等 2.環(huán)境因素 3.時間安排 4.意外干擾 5.記分,二、誤差的來源,(三)受測者本身引起的誤差 應試動機 測驗焦慮 學習和訓練 測驗經(jīng)驗 生理狀態(tài) 反應定勢,三、真分數(shù),(一)含義 測量沒有誤差時所得到的真值 操作性:無數(shù)次測量結果得到的平均值 (二)實得分數(shù)、真分數(shù)與測量誤差 (三)性質(zhì) 一組測驗分數(shù)的變異性是由測量目的有關的變異數(shù)、穩(wěn)定的但出自無關來源的變異數(shù)和隨機誤差變異數(shù)所決定的,,,三、真分
37、數(shù),(四)真分數(shù)的數(shù)學模型 (五)三個假設公理 若某種心理特質(zhì)可以用平行測驗反復測量足夠多次,觀察分數(shù)就會接近真分數(shù) E(X)T;E(E)0 真分數(shù)與誤差分數(shù)之間的相關為零 (T,E)0 各平行測驗上的誤差分數(shù)之間的相關為零 (E1,E2)0,,,三、真分數(shù),(六)平行測驗 如果兩個題目不同的測驗測的是同一種特質(zhì),并且題目的形式、數(shù)量、難度、區(qū)分度以及測查等值團體后所得分數(shù)的分布都是一致的,則這兩個測驗被稱為平行測驗。,,,,第一單元 信度的概念,一、信度的定義 信度是指同一被試者在不同時間內(nèi)用同一測驗(或用另一套相等的測驗)重復測量,所得結果的一致程度。,,,信度只受隨機誤差的影響。,,,
38、如果我們討論一組測驗分數(shù)的特性時,可用方差代表具體分數(shù),得到與公式5-7類似的公式: 式中, 是測驗實得分數(shù)的方差, 是測驗真分數(shù)的方差, 是測驗誤差的方差。,在測量理論中,信度被定義為:一組測量分數(shù)的真分數(shù)方差與總方差(實得分數(shù)的方差)的比率。即: (公式59) 由于真實分數(shù)的方差是無法統(tǒng)計的,因此公式59還可以轉(zhuǎn)化為: 因此,信度也可以看作在總的方差中非測量誤差的方差所占的比例。,,二、信度的指標,(一)信度系數(shù)與信度指數(shù) (公式5-11) 信度指數(shù)的平方就是信度系數(shù)。 (二)測量標準誤(誤差的標準差) 信度越高,標準誤越??;信度越低,標準誤越大。,,,第二
39、單元 信度評估的方法,重測信度 復本信度 內(nèi)部一致性信度 評分者信度,一、重測信度,又稱穩(wěn)定性系數(shù)。 使用同一測驗,在同樣條件下對同一組被試者前后施測兩次測驗,求兩次得分間的相關系數(shù)。 一般是兩周到四周較宜,間隔時間最好不超過六個月。,,,二、復本信度,以兩個等值但題目不同的測驗(復本)來測量同一群體,然后求得被試者在兩個測驗上得分的相關系數(shù) 復本信度反映的是測驗在內(nèi)容上的等值性,故又稱等值性系數(shù)。,,,復本測驗要求題目內(nèi)容、數(shù)量、形式、難度、區(qū)分度、指導語、時限、例題等相同或相似,三、內(nèi)部一致性信度,(一)分半信度(splithalf reliability) 這個相關系數(shù)就代表了兩半測驗內(nèi)
40、容取樣的一致程度 (公式5-14) 式中為 一半分數(shù)的相關系數(shù), 為測驗在原長度時的信度估計值。,,,,,How to divide the test?,Random(隨機法) odd-even(奇偶法) 1st half of items & last half of items(順序法),(二)同質(zhì)性信度(homogeneity reliability) 代表測驗內(nèi)部所有題目間的一致性。 (1)指所有題目都測的是同一種心理特質(zhì)。 (2)指所有題目得分之間都具有較高的正相關。 同質(zhì)性信度就是一個測驗所測內(nèi)容或特質(zhì)的相同程度。,,克倫巴赫系數(shù),四、評分者信度,隨機抽取若干份測
41、驗卷,由兩位評分者按評分標準分別給分,然后再根據(jù)每份測驗卷的兩個分數(shù)計算相關,即得評分者信度。 一般要求在成對的受過訓練的評分者之間平均一致性達0.90以上,才認為評分是客觀的。,,斯皮爾曼等級相關,評分者信度:肯德爾和諧系數(shù),被評者,評定者,公式中 K=3(評定者數(shù)) N=6(被評者數(shù)),W0.86,第三單元 信度與測驗分數(shù)的解釋,解釋真實分數(shù)與實得分數(shù)的相關 確定信度可以接受的水平 解釋個人分數(shù)的意義 比較不同測驗分數(shù)的差異,一、解釋真分數(shù)與實得分數(shù)的相關,信度系數(shù)可以解釋為測驗的總變異中,真分數(shù)造成的變異占百分之幾。 在極端的情況下,如有rxx1.00,則表示完全沒有測量誤差,
42、所有的變異均來自真實分數(shù);若有rxx0,則所有的變異和差別都反映的是測量誤差。,二、確定信度可以接受的水平,一般原則是: 當rxx<0.70時,測驗不能用于對個人做出評價或預測,而且不能作團體比較; 當0.70rxx < 0.85時,可用于團體比較; 當rxx0.85時,才能用來鑒別或預測個人成績或作為。,三、解釋個人分數(shù)的意義,兩個作用 其一是估計真實分數(shù)的范圍; 其二是了解實得分數(shù)再測時可能的變化情形。 人們一般采用95%的或然率(概率)水平,其置信區(qū)間為: (公式5-16),,四、比較不同測驗分數(shù)的差異,測量標準誤和測驗信度在評價兩個不同測驗的分數(shù)是否有明顯差異
43、時也非常重要。這種比較包括兩個人不同分數(shù)的差別和同一被試在兩個測驗上的差別。 差異分數(shù)的標準誤公式為: (公式517),,第四單元 影響信度的因素,一、樣本特征 二、測驗長度 三、測驗難度 四、時間間隔,一、樣本特征,信度常用信度系數(shù)來表示,信度系數(shù)就是相關系數(shù),相關系數(shù)受樣本是否異質(zhì)及樣本團體平均能力水平的影響。 (一)樣本團體異質(zhì)性的影響 (二)樣本團體平均能力水平的影響,樣本團體異質(zhì)性的影響,任何相關系數(shù)都要受到團體中分數(shù)分布的范圍所影響,而分數(shù)范圍與樣本團體的異質(zhì)程度有關。若獲得信度的取樣團體較為異質(zhì)的話,往往會高估測驗的信度,相反則會低估測驗的信度。,樣本團體平
44、均能力水平的影響,測驗的信度還受取樣不同團體間平均能力水平的不同而不同。這是因為,對于不同水平的團體,題目具有不同的難度,每個題目在難度上的微小差異累計起來便會影響信度。 顯而易見,每個信度系數(shù)都要求有對建立信度系數(shù)的團體的描述。在編制測驗時,應把常模團體按年齡、性別、文化程度、職業(yè)等分為更同質(zhì)的亞團體,并分別報告每個亞團體的信度系數(shù),這樣測驗才能適用于各種團體。,二、測驗長度,測驗長度,亦即測驗的數(shù)量,也是影響信度系數(shù)的一個因素。一般來說,在一個測驗中增加同質(zhì)的題目,可以使信度提高。 第一,測驗越長,測驗的測題取樣或內(nèi)容取樣就越有代表性。 第二,測驗越長,被試的猜測因素影響就越小。長有時反而
45、會引起被試的疲勞和反感而降低可靠性。,,K=rkk(1-rxx)/rxx(1-rkk) K為改變后的長度與原長度之比 rxx為原測驗的信度 rkk為測驗長度是原來的k倍時的信度估計,三、測驗難度,難度對信度的影響,只存在于某些測驗中,如智力測驗、成就測驗、能力傾向測驗等,對于人格測驗、興趣測驗、態(tài)度量表等不存在難度問題,因為這些測驗的題目沒有正確或錯誤答案之分。,三、測驗難度,在實際情況下,如果某個測驗適用范圍很廣,其難度水平通常適合于中等能力水平的被試,而對較高水平和較低水平的被試可能較易或較難,使得分數(shù)分布范圍縮小,信度水平降低。因此一個標準化的測驗,應根據(jù)不同能力水平報告測驗的難度,以作
46、為選擇測驗的參考。,四、時間間隔,時間間隔只對重測信度和不同時測量時的復本信度(重測復本信度)有影響,對其余的信度來說不存在時間間隔問題。,真題練習,200705-52、一般要求在成對的受過訓練的評分者之間平均一致性達到( )以上,才認為評分是客觀的。 (A)0.70 (B)0.80 (C)0.90 (D)1.00 200705-53、以再測法或復本法求信度,兩次測驗相隔時間越短,其信度系數(shù)( )。 (A)越大 (B)越低 (C)越小 (D)不變 200705-55、信度只受( )的影響。 A)系統(tǒng)誤差B)隨機誤差C)恒定效應D)概化作用 200711- 54、同質(zhì)性信度主要代表測驗內(nèi)部
47、( )間的一致性。 A)兩半測驗B)題目與分測驗(C)所有題目(D)分測驗 200811-59、信度只受( )的影響 (A)系統(tǒng)誤差 (B)隨機誤差 (C)恒定效應 (D)概化理論,C,A,B,C,B,200905-35、以再測法或復本法秋信度,兩次測驗相隔時間越短,其信度系數(shù)越( )。 (A)大 (B)低 (C)小 (D)不確定 200905-77、重測信度即( )。 (A)等位性系數(shù)B)穩(wěn)定性系數(shù)(C)相關系數(shù)D)X系數(shù) 200905- 92、關于心理測驗,下列說法正確的是( )。 (A)測驗越長,測驗的測題取樣或內(nèi)容取樣越有代表性 (B)測驗越長,被試者受猜測因素的影響就越小 (C)測
48、驗越長,月遵循報酬遞增率原則 (D)測驗太長,有時會引起被試者的疲勞和反感而降低可靠性 200911-76、在不同時間內(nèi)用同一測驗重復測量同一被試者,所得結果的一致程度稱為( )。 (A)信度(B)效度(C)難度(D)區(qū)分度,A,B,ABD,A,20105 -77同質(zhì)性信度主要反映測驗內(nèi)部( )間的一致性。 A兩半測驗 B題目與分測驗 C所有題目 D分測驗與分測驗 201011-61、信度只受()的影響。P348 A系統(tǒng)誤差B隨機誤差C恒定效應D實驗誤差,C,B,小結:第三節(jié) 測驗的信度,第一單元 信度的概念 第二單元 信度評估的方法 第三單元 信度與測驗分數(shù)的解釋 第四單元 影響信度的因素,
49、心理測量學,第一節(jié) 概述 第二節(jié) 測驗的常模 第三節(jié) 測驗的信度 第四節(jié) 測驗的效度 第五節(jié) 項目分析 第六節(jié) 測驗編制的一般程序 第七節(jié) 心理測驗的使用,第四節(jié) 測驗的效度,第一單元 效度的概念 第二單元 效度評估的方法 第三單元 效度的功能 第四單元 影響效度的因素,一、效度的定義,效度是指所測量的與所要測量的心理特點之間符合的程度,或者簡單地說是指一個心理測驗的準確性。 在測驗理論中,效度被定義為在一組測量中,與測量目標有關的方差(或稱有效方差)與總方差的比率,即: (公式5-21),,二、效度的性質(zhì),(一)效度具有相對性 在評鑒測驗的效度時,必須考慮其目的與功能。,二、
50、效度的性質(zhì),(二)效度具有連續(xù)性 測驗效度通常用相關系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無”的區(qū)別。因此,我們評價一個測驗時,不應該說“有效”或“無效”,而應該用效度較高或較低來評價。 另外,效度是針對測驗結果的,即測驗效度是“測驗結果”的有效性程度。,信度和效度的關系,一、信度是效度的必要而非充分條件 二、效度是受信度制約的,,第二單元 效度評估的方法,美國心理學會在1974年所發(fā)行的教育與心理測量之標準一書中將效度分為三大類:即內(nèi)容效度、構想效度和效標效度。,一、內(nèi)容效度,(一)什么是內(nèi)容效度 內(nèi)容效度指的是測驗題目對有關內(nèi)容或行為取樣的適用性,從而確定測驗是否是所欲測量的行
51、為領域的代表性取樣。 想要編制一個具有較高內(nèi)容效度的測驗需要 對所測心理特征有明確的概念 測驗題目應是所界定的內(nèi)容范圍的代表性取樣,(二)內(nèi)容效度的評估方法,1專家判斷法 2統(tǒng)計分析法 3經(jīng)驗推測法,1專家判斷法,請有關專家對測驗題目與原定內(nèi)容的符合性做出判斷,看測驗的題目是否代表規(guī)定的內(nèi)容。 又稱“邏輯效度”(logical validity)。,,為了使內(nèi)容效度的確定過程更為客觀,彌補不同專家對同一測驗的判斷可能不一致,可采用如下幾個步驟: 、定義好測驗內(nèi)容的總體范圍,描述有關的知識與技能及所用材料的來源; 、編制雙向細目表,確定內(nèi)容和技能各自所占的比例,并由測驗編制者確定各題所測的是何種
52、內(nèi)容與技能; 、制定評定量表來測量測驗的整個效度,如測驗包括的內(nèi)容、技能、材料的重要程度、題目對內(nèi)容的適用性等。,簡約式 命題 細目表,說明: 1.全卷滿分100分,表中分值即為百分比。 2.M為選擇題;H為填空題;N為解答題;E為綜合題。 3.試題難度分為容易題(0.7以上)、適中(0.40.7)、難(0.4以下)三級,三種試題試題的分值比例約為5:4:1。 4.考試時間120分鐘,其中第I卷50分鐘,第II卷70分鐘。,全息式命題細目表,2統(tǒng)計分析法,重測信度(學習前后測驗):在學習某一知識前后各做一次測驗,進行比較 評分者一致性信度 復本信度:來自同一范圍的復本測同一批被試,看其
53、相關,3經(jīng)驗推測法,即通過實踐來檢驗效度。 不同的被試團體在測驗上的得分和對每題的反應有較大差異,一般總分和各題通過率隨年級上升 如兒童發(fā)展量表是否有效,經(jīng)過對不同年齡階段的兒童進行調(diào)查,然后分析其結果。,(三)內(nèi)容效度的特性,內(nèi)容效度與所有效度的性質(zhì)一樣,不是普遍適用的,而是根據(jù)具體情況分析得來。如果測驗分析者和測驗使用者定義的內(nèi)容范圍相同,則編制者報告的內(nèi)容效度對使用者而言是有意義的,否則就沒有意義。,內(nèi)容效度與表面效度,表面效度是由外行對測驗作表面上的檢查確定的,它不反映測驗實際測量的東西,只是指測驗表面上看來好像是測量所要測的東西; 內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對測
54、驗作評價而建立的。 不過,在編制測驗時,表面效度是一個必須考慮的特性。 例如,最高行為的測驗要求有較高的表面效度,二、構想效度,(一)什么是構想效度 構思效度,還有人叫結構效度。 一個測驗實際測到所要測量的理論結構和特質(zhì)的程度,或者說分數(shù)能夠說明心理學理論的某種結構或特質(zhì)的程度。 基本特征 結構效度的大小取決于事先假定的心理結構理論; 無法證實時,有可能理論有問題,,二、構想效度,(二)構想效度的估計方法 1對測驗本身的分析(內(nèi)容效度、內(nèi)部一致性信度、被試對題目的反應特點) 2測驗間的相互比較(相容效度、區(qū)分效度、因素分析法) 3效標效度的研究證明 4實驗法和觀察法證實,,三、效標效度,(一)
55、什么是效標效度 反映的是測驗預測個體在某種情境下行為表現(xiàn)的有效程度。被預測的行為是檢驗效度的標準,簡稱效標。 效標就是衡量一個測驗是否有效的外在標準,它是獨立于測驗并可以從實踐中直接獲得的我們感興趣的行為。 根據(jù)效標資料是否與測驗分數(shù)同時獲得,又可分為同時效度和預測效度兩類。,常用效標:學業(yè)成就、等級評定、臨床診斷、特殊訓練成績、實際工作表現(xiàn)等 好的效標測量的條件:(1)真實反映觀念效標的重要側(cè)面;(2)效標測量必須穩(wěn)定、可靠、客觀;(3)在有效性的前提下,效標測量要盡可能簡單、省時、省力,,(二)效標效度的評估方法,1相關法 2區(qū)分法 3命中率法,1相關法,相關法是評估效標效度最常用的方法,
56、它是求測驗分數(shù)與效標資料間的相關,這一相關系數(shù)稱為效度系數(shù)。,2區(qū)分法,區(qū)分法是檢驗測驗分數(shù)能否有效地區(qū)分由效標所定義的團體的一種方法。 某政府機關通過測驗錄用了一批公務員,經(jīng)半年試用期后,根據(jù)他們的實際工作成績,將這批公務員區(qū)分為稱職和不稱職兩組,然后回過頭來檢查這兩組人在測驗上的分數(shù)是否有顯著差異,如果差異顯著,說明這個測驗在錄用公務員的選拔性測驗中是有效的。,由于統(tǒng)計上的顯著性受到團體大小的影響當團體較大時,平均數(shù)之間小的差異在統(tǒng)計上也顯著,因而變得有意義了。但實際上測驗很難將這兩個團體的人區(qū)分開。為避免這個缺點,還要看這兩個團體分布的重迭量,這里有兩個指標: 一個是其中一組內(nèi)被試得分超
57、過另一組平均數(shù)的人數(shù)與另一組中被試超過其平均數(shù)的人數(shù)比率,如果比率小,說明兩組差異大,測驗是有效的。 另一個指標是看兩組分數(shù)分布共同區(qū)域的百分比例,如果百分比例不大,說明兩組差異顯著比較可信,測驗是有效的。,3命中率法,命中率法是當測驗用來做取舍的依據(jù)時,用其正確決定的比例作為效度指標的一種方法。 使用命中率法,可將測驗分數(shù)和效標資料分為兩類。在測驗分數(shù)方面是確定一個臨界分數(shù)(即分數(shù)線),高于臨界分數(shù)者預測其成功,低于臨界分數(shù)者預測其失敗。,,第三單元 效度的功能,一、預測誤差 效度系數(shù)常常以決定性系數(shù)來表示,意旨相關系數(shù)的平方,它表示測驗正確預測或解釋的效標的方差占總方差的比例。,,,第三單
58、元 效度的功能,二、預測效標分數(shù) (公式5-26) byx=rxysy/sx a=-byxX 三、預測效度指數(shù) E值大小表明使用測驗比盲目猜測能減少多少誤差 E=100(1-K) k=,,,第四單元 影響效度的因素,一、測驗本身的因素 二、測驗實施中的干擾因表 三、樣本團體的性質(zhì) 四、效標的性質(zhì),一、測驗本身的因素,1測驗材料必須對整個內(nèi)容具有代表性; 2測題設計時應盡量避免容易引起誤差的題型(如是非題); 3測題難度要適中,具有較高的區(qū)分度; 4測驗長度要恰當,即要有一定的測題量; 5測題的排列按先易后難順序。,二、測驗實施中的干擾因表,(一)主試的影響因素 標
59、準化 預測效度的時間間隔 測驗情境 (二)被試的影響因素,三、樣本團體的性質(zhì),(一)樣本團體的異質(zhì)性 如果其他條件相同,樣本團體越同質(zhì),分數(shù)分布范圍越小,測驗效度就越低; (二)干涉變量 年齡、性別、教育水平、智力、動機、興趣、職業(yè)和任何有關的特征不同,同一測驗的效度也會有很大不同。,四、效標的性質(zhì),效標與測驗分數(shù)之間的關系是否線形 皮爾遜積差相關系數(shù)的前題是假設兩個變量的關系是線性的分布。 效標測量的可靠性即效標測量的信度。,真題練習,200705-105、內(nèi)容效度的評估方法有( )。 A專家判斷法B雙向細目表法C統(tǒng)計分析法 D經(jīng)驗推測法 200711-102、效度具有相對性,因此在評鑒測
60、驗的效度時,必須考慮測驗的( )。(A)信度(B)目的(C)功能(D)長度 200711-103、同200705-105 200711-104、測驗實施中的干擾因素包括( )。 (A)主試者的影響因素(B)測驗情景 (C)被試者的影響因素(D)其他干擾因素 200711-105、構想效度的估計方法包括( )。 (A)對測驗本身的分析 (B)測驗間的相互比較 (C)效標效度的研究證明(D)實驗法和觀察法證實 200806-58、效標與測驗分數(shù)之間的相關,用皮爾遜積差相關系數(shù)的前提是假設兩個變量的關系是( )的分布。 A)非線性 (B)線性 (C)拋物線 (D)正態(tài)曲線,ACD,BC,AB
61、CD,ABCD,B,200806-107信度與效度的關系可表述為( )。 A)信度是效度的必要而充分條件B)信度是效度的充分條件 C)信度是效度的必要而非充分條件D)效度是受信度制約的 200806-108、根據(jù)效標資料是否與測驗分數(shù)同時獲得,可將效標效度分為( )。 A)相容效度 (B)區(qū)分效度 (C)同時效度 (D)預測效度 200811-60、在心理測驗中,效度是指一個心理測驗的( )。 (A)穩(wěn)定性 (B)準確性 (C)可信度 (D)區(qū)分性 200905-57、檢驗測驗分數(shù)能否有效地劃分由校標所定義的團體的一種方法是( )。 (A)相關法 (B)區(qū)分法 (D)命中率法 (D)失誤法
62、200905-119、同200705-105 200911-35、測驗題目對有關行為取樣的適用性是( )。 (A)內(nèi)容效度(B)構想效度(C)效標效度(D)區(qū)分效度 201005-107同200711-102 201011-104、效標效度可分為( )。P363 (A)相容效度 (B)區(qū)分效度(C)同時效度 (D)預測效度 105、同200711-102,CD,CD,CD,B,B,A,CD,201105-57、在心理測驗中,效度是指所測量的與所要測量的心理特點之間符合的程度,或者簡單地說是指一個心理測驗的( )。,小結:第四節(jié) 測驗的效度,第一單元 效度的概念 第二單元 效度評估的方法 第三單
63、元 效度的功能 第四單元 影響效度的因素,心理測量學,第一節(jié) 概述 第二節(jié) 測驗的常模 第三節(jié) 測驗的信度 第四節(jié) 測驗的效度 第五節(jié) 項目分析 第六節(jié) 測驗編制的一般程序 第七節(jié) 心理測驗的使用,第五節(jié) 項目分析,,項目分析就是對組成測驗的每個測題進行分析。 項目分析包括定性分析和定量分析。 定性分析:內(nèi)容效度、題目編寫的恰當性和有效性; 定量分析:題目的難度和區(qū)分度。 項目分析的應用 對項目進行編制、篩選和修訂,可以提高測驗的信度和效度 試題庫、計算機自適應考試,第一單元 項目的難度,,一、定義,難度(difficulty),顧名思義,是指項目的難易程度。 難度的指標通常以通過率表示,即以
64、答對或通過該題的人數(shù)百分比來表示: (公式5-31) 通過人數(shù)越多(即P值越大),難度越低;,,二、計算方法,(一)二分法記分的項目 (公式5-32) (二)非二分記分的項目 (公式5-34),,,三、難度水平的確定,(一)項目的難度 選擇題目時,最好使試題的平均難度接近0.50,而各題難度在0.50士0.20之間。 選拔測驗一般難度接近錄取率 速度測驗、難度測驗,一般都應防止被試得滿分,因為滿分的意義是不明確的 選擇題的難度應大于概率水平 是非題0.75最為合適,四選一的0.63最為合適,三、難度水平的確定,(二)測驗的難度 如果被試樣
65、本具有代表性,對于中等難度的測驗,其測驗總分應該接近常態(tài)分配。,第二單元 項目的區(qū)分度,,一、定義,項目區(qū)分度(item discrimination),也叫鑒別力,是指測驗項目對被試的心理特性的區(qū)分能力。 具有良好區(qū)分度的項目,能將不同水平的被試區(qū)分開來。 區(qū)分度(D)的范圍在1.00至1.00之間,有積極區(qū)分、消極區(qū)分和無區(qū)分作用三種類型。,二、計算方法,(一)鑒別指數(shù) (二)相關法,(一)鑒別指數(shù),根據(jù)測驗總分取兩端的人作為高分組和低分組(一般取上下各占27%的人) D = PH PL 步驟 按測驗總分高低排列 確定高分組和低分組,一般是27 分別計算PH 、 PL 最后計算D
66、,題目鑒別指數(shù)與評價價標,(二)相關法,相關法:以項目分數(shù)與效標分數(shù)或測驗總分的相關作為項目區(qū)分度指標。 點二列相關 二列相關 相關 積差相關,三、區(qū)分度與難度的關系,關系密切: 難度越接近0.5,項目潛在的區(qū)分度越大,難度越接近1.00或0,區(qū)分度越小 實際編制時,不能要求所有的項目難度都是0.5,D的最大值與項目難度的關系,四、區(qū)分度的相對性,不同的計算方法,所得區(qū)分度不同 樣本容量大小影響相關法區(qū)分度值的大小 分組標準影響鑒別指數(shù)值(D) 被試樣本的同質(zhì)性程度影響區(qū)分度質(zhì)的大小,真題練習,200705-54、項目區(qū)分度也叫( ),是指測驗項目對被試者的心理特征性的區(qū)分能力。 (A)難度 (B)鑒別力 (C)信度 (D)效度 200711-55、項目的難易程度,用P表示,P值越( ),難度越低。 (A)大 (B)低 (C)小 (D)接近于0 201105-58,同上 200806-59難度與區(qū)分度的關系,一般來說,較難的項目對高水平的受測者區(qū)分度( )。 (A)低 (B)一般 (C)高 (D)中等,B,A,C,小結:第五節(jié) 項目分析,第一單元 項目的難度 第二單元 項目的區(qū)分
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。