心理測(cè)量學(xué)教案(鄭日昌版).doc
《心理測(cè)量學(xué)教案(鄭日昌版).doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《心理測(cè)量學(xué)教案(鄭日昌版).doc(67頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
第一章 心理測(cè)驗(yàn)總論 [教學(xué)目的與要求] (1)識(shí)記并了解心理測(cè)驗(yàn)的發(fā)展歷史 (2)掌握心理測(cè)驗(yàn)的性質(zhì) (3)了解心理測(cè)驗(yàn)的種類 [教學(xué)重點(diǎn)與難點(diǎn)]心理測(cè)驗(yàn)的性質(zhì) [教學(xué)時(shí)數(shù)]2學(xué)時(shí) 第一節(jié) 心理測(cè)驗(yàn)的歷史 一、中國古代的心理測(cè)驗(yàn)思想 1、孔子:把人分為中人、中人以上、中人以下三個(gè)類別,“中人以上,可以語上也;中人以下,不可以語上也”。(相當(dāng)于現(xiàn)代測(cè)量學(xué)中的命名量表和次序量表) 2、孟子:“權(quán),然后知輕重;度,然后知長(zhǎng)短。物皆然,心為甚?!泵鞔_指出了心理能力和心理特征與物理現(xiàn)象一樣,具有可測(cè)量的特性。 3、(南朝)劉勰:世界上最早的“分心測(cè)驗(yàn)”,認(rèn)為一心不能二用。 4、(南北朝)顏之推:周歲試兒,其是1925年格塞爾嬰兒發(fā)展量表的前導(dǎo)。 5、“七巧板”又稱益智圖、唐圖(Tangram),為當(dāng)代多數(shù)智力測(cè)驗(yàn)和創(chuàng)造力測(cè)驗(yàn)所使用。 6、隋煬帝科舉制度的開端,被認(rèn)為是世界上最早的心理測(cè)驗(yàn)的實(shí)踐。當(dāng)時(shí)的考試方法:貼經(jīng)和對(duì)偶,類似于現(xiàn)代西方言語測(cè)驗(yàn)中常見的填字和類比。 7、、中國古代心理測(cè)驗(yàn)的思想,包含著典型的東方文化特點(diǎn): A、他們都是描述性的,沒有定量的標(biāo)準(zhǔn); B、往往將心理特點(diǎn)與道德觀念聯(lián)系起來(局限性) 二、科學(xué)心理測(cè)驗(yàn)產(chǎn)生的原因 (一)對(duì)智力落后著分類和訓(xùn)練的早期關(guān)注 1、心理測(cè)驗(yàn)產(chǎn)生的最初原因:對(duì)智力落后和精神病人治療的需要。 2、法國醫(yī)生埃斯克羅:1838年出版了兩卷本著作,第一次明確地對(duì)智力落后與精神病人作出了區(qū)分,他認(rèn)為精神病是以情緒障礙為標(biāo)志。(發(fā)現(xiàn)一個(gè)人的語言能力是他智力水平的最可靠的指標(biāo)) 3、法國醫(yī)生塞國恩(E.Sequin):訓(xùn)練智力落后者的先驅(qū)。1837年,他創(chuàng)建了第一座教育智力落后兒童的學(xué)校,1846年出版了《白癡:用生理方法進(jìn)行診斷和治療》。其首創(chuàng)方法感官訓(xùn)練(sense-training)、肌肉訓(xùn)練(muscle-training)至今仍在全世界范圍內(nèi)的智力落后兒童教育機(jī)構(gòu)。其Sequin Form Board拼圖板被心理測(cè)驗(yàn)的非語言測(cè)驗(yàn)所采用,其操作方法是要求受測(cè)者盡快地將不同形狀的圖片嵌入適當(dāng)?shù)陌疾蹆?nèi)。 4、法國心理學(xué)家比奈開始致力于推動(dòng)建立鑒別不能適應(yīng)正常學(xué)校學(xué)習(xí)但是可教育兒童的方法,鑒別出后安排接受一系列特殊教育課程。比奈與“兒童心理學(xué)研究會(huì)”的同事們努力推動(dòng)法國公共教育部開展一項(xiàng)促進(jìn)智能不足兒童學(xué)習(xí)能力計(jì)劃,并成立了專門的研究小組,這個(gè)小組的成立是心理測(cè)驗(yàn)發(fā)展史上一個(gè)極為重大的歷史事件。 (二)實(shí)驗(yàn)心理學(xué)的發(fā)展 1、馮特:1879年他在德國萊比錫大學(xué)建立了心理學(xué)史上第一個(gè)實(shí)驗(yàn)室,引發(fā)了個(gè)別差異的研究。 2、實(shí)驗(yàn)心理學(xué)的誕生和發(fā)展,給心理測(cè)驗(yàn)帶來了另一個(gè)副產(chǎn)品:嚴(yán)格的標(biāo)準(zhǔn)化程序。 三、心理測(cè)驗(yàn)的發(fā)展(金瑜P7-9) 1、高爾頓:英國生物學(xué)家和心理學(xué)家高爾頓是倡導(dǎo)測(cè)驗(yàn)運(yùn)動(dòng)的主要人物。他設(shè)計(jì)了測(cè)量差異的方法,1884年,他在倫敦國際博覽會(huì)中專門設(shè)立了個(gè)“人體測(cè)量學(xué)實(shí)驗(yàn)室”六年中積累了9337人的資料,雖不是正式的心理測(cè)驗(yàn),但可視為心理測(cè)驗(yàn)的開端。他還是評(píng)定量表和問卷法應(yīng)用的先驅(qū),他的另一個(gè)重要貢獻(xiàn)是為心理測(cè)驗(yàn)奠定了統(tǒng)計(jì)學(xué)基礎(chǔ),并第一個(gè)提出了相關(guān)的概念。(皮爾遜相關(guān)) 2、卡特爾:美國心理學(xué)家,從師馮特。1890年,卡特爾在《心理》雜志上發(fā)表“心理測(cè)驗(yàn)與測(cè)量”,這是心理測(cè)驗(yàn)第一次出現(xiàn)于心理學(xué)文獻(xiàn)中。 3、世界上第一個(gè)智力測(cè)驗(yàn):比內(nèi)與助手西蒙在《心理學(xué)年報(bào)》上發(fā)表了一篇文章,題為:“診斷異常兒童智力的新方法”,是世界上第一個(gè)正式的心理測(cè)驗(yàn)。比內(nèi)-西蒙量表自1905年發(fā)表后,在1908年修訂,1908年量表題目總數(shù)達(dá)到了59個(gè),所有測(cè)題按年齡分組,組別從3-13歲,測(cè)驗(yàn)的結(jié)果用“智力水平”表示,但其通常翻譯和提法為“智力年齡”。后又經(jīng)1911年修訂一次。 4、心理測(cè)驗(yàn)的蓬勃發(fā)展: (1)操作測(cè)驗(yàn)的發(fā)展:理論上的缺陷和實(shí)際上的需要,所以就有操作測(cè)驗(yàn)的問世和發(fā)展。 (2)團(tuán)體智力測(cè)驗(yàn)的發(fā)展:這是心理測(cè)驗(yàn)方式的極大進(jìn)步,也擴(kuò)大了測(cè)驗(yàn)的應(yīng)用范圍。 (3)能力傾向測(cè)驗(yàn)的發(fā)展:韋克斯勒所編的學(xué)前兒童、學(xué)齡兒童、成人智力量表。 (4)人格測(cè)驗(yàn)的發(fā)展:心理測(cè)驗(yàn)的另一領(lǐng)域是涉及情感或行為等非智力方面的人格評(píng)估,通常包括對(duì)性格、氣質(zhì)、情緒狀態(tài)、人際關(guān)系、動(dòng)機(jī)、興趣和態(tài)度的測(cè)量。 (5)現(xiàn)代西方心理測(cè)驗(yàn)的發(fā)展,受到計(jì)算機(jī)的產(chǎn)生和發(fā)展,以及統(tǒng)計(jì)方法的改進(jìn)的極大影響。 四、現(xiàn)代心理測(cè)驗(yàn)在中國的發(fā)展:以1949年中華人民共和國成立為分期 (一)中華人民共和國成立前心理測(cè)驗(yàn)的發(fā)展 1、1916年,樊炳清先生首先介紹了比內(nèi)-西蒙智力量表; 2、 1920年,廖世承和陳鶴琴在南京高等師范學(xué)校開設(shè)心理測(cè)驗(yàn)課,并用心理測(cè)驗(yàn)試測(cè)投考該校的學(xué)生,這便是中國正式開始的科學(xué)心理測(cè)驗(yàn); 3、1921年,他倆正式出版《心理測(cè)驗(yàn)法》一書,成為中國最早的心理測(cè)驗(yàn)專著; 4、1922年,中華教育改進(jìn)社聘請(qǐng)美國教育心理測(cè)驗(yàn)專家麥考爾來華講學(xué),并主持編制心理測(cè)驗(yàn)事宜; 5、 1924年,陸志韋發(fā)表了《訂正比內(nèi)西蒙智力測(cè)驗(yàn)說明書》,30年代又與吳天敏再次做了修訂; 6、 1931年,由艾偉、陸志韋、陳鶴琴、蕭孝嶸等倡議,組織并成立了中國測(cè)驗(yàn)學(xué)會(huì); 7、1932年,《測(cè)驗(yàn)》雜志創(chuàng)刊。 (二)中華人民共和國成立后心理測(cè)驗(yàn)的發(fā)展 1、 1979年,林傳鼎、張厚粲等以國外資料為參考,編制了少年兒童學(xué)習(xí)能力測(cè)驗(yàn); 2、 1989年,成立中國心理學(xué)會(huì)心理測(cè)驗(yàn)專業(yè)委員會(huì),標(biāo)志著中國心理測(cè)驗(yàn)已進(jìn)入了一個(gè)新的高速發(fā)展時(shí)期。 第二節(jié) 心理測(cè)驗(yàn)的性質(zhì) 一、測(cè)量的基本問題 (一)測(cè)量的定義 1、定義:測(cè)量就是根據(jù)一定的法則,用數(shù)字對(duì)事物加以確定。 a一定的法則:是指測(cè)量行為發(fā)生時(shí)采用的規(guī)則或方法。 b事物:是指我們要測(cè)量的感興趣的事物的屬性或特征。 c數(shù)字:可以表示數(shù)量,也可以不表示數(shù)量。 d通常人們所說的測(cè)量,指的是給事物確定出一種數(shù)量化的價(jià)值。 2、測(cè)量的要素:一是參照點(diǎn),二是單位 a參照點(diǎn):一種是絕對(duì)的零點(diǎn);一種是相對(duì)參照點(diǎn),是認(rèn)為確定的。最理想的參照點(diǎn)是絕對(duì)零點(diǎn),心理測(cè)驗(yàn)中所用的參照點(diǎn)都是相對(duì)的,因而測(cè)量的結(jié)果常常不能以“倍數(shù)”的方式解釋。 b理想的單位的條件:有明確的意義和有相等的價(jià)值。 3、測(cè)量的量表:量表就是有參照點(diǎn)和單位的連續(xù)體。斯蒂文斯將量表由低到高依次為: a命名量表:是水平最低的一種測(cè)量量表,用數(shù)字來代替事物或?qū)κ挛镞M(jìn)行分類; b順序量表:不僅表明類別,還能表明不通類別的大小等級(jí),或具有某種屬性的程度; c等距量表:不僅有大小關(guān)系,而且又有相等的單位,因此可以加減運(yùn)算,但沒有絕對(duì)零點(diǎn),所以不能做乘除運(yùn)算; d比例量表:是最精確的測(cè)量,既有相等的單位,又有絕對(duì)零點(diǎn)。 二、心理測(cè)量的基本概念 1、定義:是根據(jù)一定的法則用數(shù)字對(duì)人的行為加以確定,即依據(jù)一定的心理學(xué)理論,使用一定的操作程序,給人的行為和心理屬性確定出一種數(shù)量化的價(jià)值。 2、特點(diǎn): (1)心理測(cè)量的間接性 (2)心理測(cè)量的相對(duì)性 3、心理測(cè)量的水平 心理測(cè)量,不論是對(duì)智力,還是對(duì)能力傾向或人格的測(cè)量,都只具有等級(jí)量表的特征。測(cè)驗(yàn)分?jǐn)?shù)一般只能顯示個(gè)體智力、能力、人格上的等級(jí)位次,而沒有一個(gè)相等的單位,故它不是一個(gè)等距量表。但由于多數(shù)心理特征具有常態(tài)分布的特征,且沒有絕對(duì)零點(diǎn),所以我們也可以把測(cè)量后直接得到的原始分?jǐn)?shù)轉(zhuǎn)化為常態(tài)分布下的標(biāo)準(zhǔn)分?jǐn)?shù),把這些量表當(dāng)作等距量表來處理。 三、心理測(cè)驗(yàn)的基本問題 (一)心理測(cè)驗(yàn)和心理測(cè)量的的聯(lián)系和區(qū)別 心理測(cè)驗(yàn)是了解人心理的工具,主要在名詞上使用。而心理測(cè)量則是運(yùn)用測(cè)驗(yàn)為工具,達(dá)到了解人類心理的實(shí)踐活動(dòng),它主要是在“動(dòng)詞”意義上使用。因此,相對(duì)而言,心理測(cè)量的意義范圍更廣一些。能被應(yīng)用于實(shí)際心理測(cè)量的心理測(cè)驗(yàn)才是真正有效的測(cè)驗(yàn)工具才是真正有效的測(cè)驗(yàn)工具。 (二)心理測(cè)驗(yàn)的定義 心理測(cè)驗(yàn)就是通過觀察人的少數(shù)有代表性行為,對(duì)于貫穿在人的全部行為活動(dòng)中心理特點(diǎn)作出推論和數(shù)量化分析的一種科學(xué)手段。 心理測(cè)驗(yàn)即是依據(jù)一定的心理學(xué)理論,使用一定的操作程序,給人的行為確定出一種數(shù)量化的價(jià)值。 (三)心理測(cè)驗(yàn)的要素 1、行為樣本:對(duì)少數(shù)經(jīng)過慎重選擇的樣本進(jìn)行觀察,來間接推知被試的心理特征。 2、標(biāo)準(zhǔn)化:是指測(cè)驗(yàn)編制、實(shí)施、記分以及測(cè)驗(yàn)分?jǐn)?shù)解釋程序的一致性,標(biāo)準(zhǔn)化的量一個(gè)重要步驟是建立有代表性的常模。 3、客觀性:在不受被試主觀判斷支配的范圍內(nèi),測(cè)驗(yàn)的實(shí)施、評(píng)分、解釋應(yīng)是客觀的,要盡量減少主試和被試的隨意程度??陀^性另一個(gè)主要方面是測(cè)題或整個(gè)測(cè)驗(yàn)的難度水平的確定必須客觀。神經(jīng)心理測(cè)驗(yàn)客觀性最高,智力測(cè)驗(yàn)較高,人格問卷次之,投射測(cè)驗(yàn)的客觀性較低。 (四)心理測(cè)驗(yàn)的性質(zhì) 1、心理測(cè)驗(yàn)的間接性; 2、心理測(cè)驗(yàn)的相對(duì)性; 3、心理測(cè)驗(yàn)的客觀性:心理測(cè)驗(yàn)標(biāo)準(zhǔn)化包括: ①測(cè)驗(yàn)用的項(xiàng)目或作業(yè)、實(shí)測(cè)說明、實(shí)測(cè)者的言語態(tài)度及實(shí)測(cè)時(shí)的物理環(huán)境等,均經(jīng)過標(biāo)準(zhǔn)化。 ②評(píng)分記分的原則和手續(xù)經(jīng)過了標(biāo)準(zhǔn)化,對(duì)反應(yīng)的量化是客觀的。 ③分?jǐn)?shù)轉(zhuǎn)換和解釋經(jīng)過了標(biāo)準(zhǔn)化,對(duì)結(jié)果的推論是客觀的。 第三節(jié) 心理測(cè)驗(yàn)的種類 一、按測(cè)驗(yàn)功能分類: 1、能力測(cè)驗(yàn):智力測(cè)驗(yàn):比內(nèi)-西蒙智力測(cè)驗(yàn)、韋克斯勒兒童和成人智力量表。特殊能力測(cè)驗(yàn):如音樂、繪畫等 2、成就測(cè)驗(yàn):用于測(cè)量個(gè)人(團(tuán)體)經(jīng)過某種正式教育或訓(xùn)練之后對(duì)知識(shí)和技能掌握的程度。學(xué)科測(cè)驗(yàn) 3、人格測(cè)驗(yàn):用于測(cè)量性格、氣質(zhì)、興趣、態(tài)度、品德、情緒、動(dòng)機(jī)、信念、價(jià)值觀等方面的個(gè)性心理特征,即個(gè)性中除能力以外的部分。明尼蘇達(dá)多項(xiàng)人格調(diào)查表(MMPI)、16種人格因素問卷(16PF)、艾森克人格問卷(EPQ)、羅夏墨跡測(cè)驗(yàn)、主題統(tǒng)覺測(cè)驗(yàn)(TAT)。 二、按測(cè)驗(yàn)對(duì)象分類 1、個(gè)別測(cè)驗(yàn):優(yōu)點(diǎn):主試可以仔細(xì)觀察被試的言語情緒,并有充分的機(jī)會(huì)與被試合作,所以其結(jié)果正確可靠。缺點(diǎn):時(shí)間不經(jīng)濟(jì),不能在短時(shí)間呢您收集到大量的資料。 2、團(tuán)體測(cè)驗(yàn):優(yōu)點(diǎn):時(shí)間經(jīng)濟(jì),主試不必接受嚴(yán)格的專業(yè)訓(xùn)練即可擔(dān)任。缺點(diǎn):主試對(duì)被試的行為不能作切實(shí)的控制,所得結(jié)果不及個(gè)別測(cè)驗(yàn)正確可靠。 三、按測(cè)驗(yàn)方式分類: 1、紙筆測(cè)驗(yàn):言語作為刺激。MMPI、EPQ、16PF及韋克斯勒兒童和成人智力量表中的言語量表部分。 優(yōu)點(diǎn):實(shí)施方便,團(tuán)體測(cè)驗(yàn)多用,有肢體殘疾而無言語困難的病人只能用此。 缺點(diǎn):受被試文化程度的影響。 2、操作測(cè)驗(yàn):也稱非文字測(cè)驗(yàn)。羅夏墨跡測(cè)驗(yàn)、主題統(tǒng)覺測(cè)驗(yàn)、瑞文測(cè)驗(yàn)及韋克斯勒兒童和成人智力量表中的操作量表部分。 優(yōu)點(diǎn):不受文化因素的限制。 3、口頭測(cè)驗(yàn) 4、電腦測(cè)驗(yàn) 四、按測(cè)驗(yàn)?zāi)康姆诸悾? 1、描述性測(cè)驗(yàn):目的在于對(duì)個(gè)人或團(tuán)體的能力、性格、興趣、知識(shí)水平等進(jìn)行描述。 2、診斷性測(cè)驗(yàn):目的在于對(duì)個(gè)人或團(tuán)體的某種行為問題進(jìn)行診斷。 3、預(yù)示性測(cè)驗(yàn):目的在于通過測(cè)驗(yàn)分?jǐn)?shù)預(yù)示一個(gè)人將來的表現(xiàn)和所能達(dá)到的水平。 五、按測(cè)驗(yàn)難度分類 1、速度測(cè)驗(yàn) 2、難度測(cè)驗(yàn) 六、按測(cè)驗(yàn)要求分類 1、最高作為測(cè)驗(yàn) 2、典型作為測(cè)驗(yàn) 七、按測(cè)驗(yàn)性質(zhì)分類 1、構(gòu)造性測(cè)驗(yàn):在此種測(cè)驗(yàn)中,所呈現(xiàn)的刺激和被試的任務(wù)是明確的。 2、投射性測(cè)驗(yàn):在此種測(cè)驗(yàn)中,刺激沒有明確意義,問題模糊,對(duì)被試的反應(yīng)也沒有明確規(guī)定。 八、按測(cè)驗(yàn)解釋分類 1、常模參照測(cè)驗(yàn) 2、標(biāo)準(zhǔn)參照測(cè)驗(yàn) 九、按測(cè)驗(yàn)應(yīng)用分類 1、教育測(cè)驗(yàn) 2、職業(yè)測(cè)驗(yàn) 3、臨床測(cè)驗(yàn) 第四節(jié) 心理測(cè)驗(yàn)的功能與應(yīng)用 一、心理測(cè)驗(yàn)的功能:最基本的功能是測(cè)量個(gè)體差異或行為反應(yīng)。 (一)從實(shí)際應(yīng)用角度看: ①人才選拔; ②崗位安置 ③臨床診斷; ④教育評(píng)價(jià); ⑤心理咨詢和治療 (二)從理論研究角度看: ①搜集材料:心理測(cè)驗(yàn)是收集個(gè)體差異資料最快捷的辦法。 ②提出和驗(yàn)證假設(shè) ③實(shí)驗(yàn)分組 二、測(cè)驗(yàn)的應(yīng)用 (一)錯(cuò)誤的測(cè)驗(yàn)觀 1、測(cè)驗(yàn)萬能論 2、測(cè)驗(yàn)無用論: ①某些人格測(cè)驗(yàn)侵犯了個(gè)人隱私; ②測(cè)驗(yàn)為宿命論和種族歧視提供了心理學(xué)依據(jù)。 3、心理測(cè)驗(yàn)即智力測(cè)驗(yàn) (二)正確的測(cè)驗(yàn)觀 1、重要的心理學(xué)研究方法和決策的輔助工具:心理測(cè)驗(yàn)法的出現(xiàn)是心理科學(xué)發(fā)展史上的一大進(jìn)步,是心理學(xué)研究中不可缺少的研究方法之一。 2、作為研究方法和測(cè)量工具尚不完善:過分夸大心理測(cè)驗(yàn)的科學(xué)性和準(zhǔn)確性是不對(duì)的。 3、科學(xué)地看待心理測(cè)驗(yàn),防止亂用測(cè)驗(yàn): ①測(cè)驗(yàn)使用者必須具備一定的資格; ②慎重選擇測(cè)驗(yàn)量表; ③與被試建立良好的協(xié)調(diào)關(guān)系; ④正確解釋測(cè)驗(yàn)結(jié)果; ⑤注意測(cè)驗(yàn)的保密。 第二章 心理測(cè)驗(yàn)的編制 [教學(xué)目的與要求] (1)掌握心理測(cè)驗(yàn)編制的一般程序 (2)心理測(cè)驗(yàn)的難度與區(qū)分度的定義及 [教學(xué)重點(diǎn)與難點(diǎn)]心理測(cè)驗(yàn)的項(xiàng)目分析 [教學(xué)時(shí)數(shù)]4學(xué)時(shí) 第一節(jié) 編制測(cè)驗(yàn)的一般程序 一、確定測(cè)驗(yàn)?zāi)康? (一)心理測(cè)驗(yàn)的對(duì)象:首先要明確測(cè)量的對(duì)象,也就是測(cè)驗(yàn)編成后要用于哪些團(tuán)體。 A年齡 B教育水平:在編制兒童測(cè)驗(yàn)時(shí),要同時(shí)考慮教育水平和年齡的影響。在承認(rèn)測(cè)驗(yàn)中,一般只考慮教育水平的影響。 C文化背景 (二)測(cè)驗(yàn)的目標(biāo):是指編制的測(cè)驗(yàn)是測(cè)什么的,即用來測(cè)量什么樣的心理變量或行為特征。目標(biāo)分析以測(cè)驗(yàn)不同而異,一般分為三種情況: A工作分析:主要任務(wù)是對(duì)所預(yù)測(cè)的行為活動(dòng)作具體分析,我們稱之為任務(wù)分析或工作分析。 B對(duì)特定概念下定義:如果測(cè)驗(yàn)是為了測(cè)量某種特殊的心理品質(zhì)或特點(diǎn),那么測(cè)驗(yàn)編制者就必須給所要測(cè)量的心理或行為特質(zhì)下定義,然后必須發(fā)現(xiàn)該特質(zhì)所包含的維量將通過什么行為表現(xiàn)出來或怎樣進(jìn)行測(cè)量。 C確定測(cè)驗(yàn)的具體內(nèi)容:如果測(cè)驗(yàn)是描述性的顯示測(cè)驗(yàn),它的目標(biāo)分析的主要任務(wù)則是確定顯示的內(nèi)容和技能。 (三)測(cè)驗(yàn)用途:所編出的測(cè)驗(yàn)是要對(duì)被試做描述,還是做診斷,抑或是選拔和預(yù)示。 二、擬定編制計(jì)劃 編制計(jì)劃,實(shí)際上是對(duì)測(cè)驗(yàn)的總體設(shè)計(jì),指出測(cè)驗(yàn)的內(nèi)容結(jié)構(gòu)和項(xiàng)目形式等,以及對(duì)每個(gè)內(nèi)容、目標(biāo)的相對(duì)重視程度。 根據(jù)布魯姆最早提出教育目標(biāo)的分類問題。他把學(xué)習(xí)的心理活動(dòng)分成認(rèn)知、精神運(yùn)動(dòng)和情感三個(gè)領(lǐng)域,又把認(rèn)知領(lǐng)域具體分為知識(shí)、理解、應(yīng)用、分析和綜合、評(píng)價(jià)。 三、設(shè)計(jì)測(cè)試項(xiàng)目 (一)搜集有關(guān)資料 1、資料要豐富 2、資料要有普遍性 (二)選擇項(xiàng)目形式 1、測(cè)驗(yàn)的目的和材料性質(zhì) 2、接受測(cè)驗(yàn)的團(tuán)體的特點(diǎn) 3、各種實(shí)際因素:時(shí)間,人數(shù)、經(jīng)費(fèi)等 (三)編寫和修訂項(xiàng)目 1、項(xiàng)目的范圍要與測(cè)驗(yàn)計(jì)劃相一致 2、項(xiàng)目的數(shù)量要比最后所需的數(shù)目多一倍至幾倍,以備篩選和編制復(fù)本 3、項(xiàng)目的難度必須符合測(cè)驗(yàn)?zāi)康男枰? 4、項(xiàng)目的說明必須清楚 四、項(xiàng)目的試測(cè)和分析 (一)試測(cè) 1、預(yù)測(cè)對(duì)象應(yīng)取自將來正式測(cè)驗(yàn)準(zhǔn)備應(yīng)用的群體 2、預(yù)測(cè)的實(shí)施過程與情境應(yīng)力求與將來正式測(cè)試時(shí)的情況相近似 3、預(yù)測(cè)的時(shí)限可稍寬一些,最好使每個(gè)被試都能將項(xiàng)目做完,以搜集較充分的反應(yīng)資料,使統(tǒng)計(jì)分析的結(jié)果更為可靠。 4、在預(yù)測(cè)過程中應(yīng)隨時(shí)記錄被試的反應(yīng)情形,如在不同時(shí)限內(nèi)一般被試所完成的題數(shù)、題意不清之處及其他有關(guān)問題。 (二)項(xiàng)目分析 包括質(zhì)的分析和量的分析 質(zhì)的分析是從內(nèi)容取樣的適當(dāng)性、題目的思想性以及表達(dá)是否清楚等方面加以分析。 量的分析是對(duì)預(yù)測(cè)結(jié)果進(jìn)行統(tǒng)計(jì)分析,確定項(xiàng)目的難度、區(qū)分度、備選答案的適宜性等。 五、合成測(cè)驗(yàn) 1、項(xiàng)目的選擇:要考慮測(cè)驗(yàn)的目的、性質(zhì)與功能,區(qū)分度,難度 2、項(xiàng)目的編排:由易到難,有并列直進(jìn)式,混合螺旋式 A一般原則:a測(cè)題的難度排列易逐步上升;b盡可能將同類型的測(cè)題組合在一起;c各種類型測(cè)題本身的特點(diǎn); B常見試題排列方式:a并列直進(jìn)式b混合螺旋式 3、編造復(fù)本 測(cè)驗(yàn)的各份復(fù)本必須等值,所謂等值需符合下列幾個(gè)條件: (1)各份測(cè)驗(yàn)測(cè)量的是同一種心理特質(zhì); (2)各份測(cè)驗(yàn)包含相同的內(nèi)容范圍,但題目不應(yīng)有重復(fù); (3)各份測(cè)驗(yàn)題型相同,題目數(shù)量相等,并且有大體相同的難度分布。 六、測(cè)驗(yàn)使用的標(biāo)準(zhǔn)化 1、施測(cè)過程標(biāo)準(zhǔn)化 2、評(píng)分計(jì)分標(biāo)準(zhǔn)化 3、分?jǐn)?shù)解釋標(biāo)準(zhǔn)化 七、搜集信度、效度資料 (一)信度 指的是測(cè)量的可靠性或一致性。 (二)效度 指的是測(cè)量的有效性或正確性。 A搜集有關(guān)資料:題目的有關(guān)來源 a已出版的標(biāo)準(zhǔn)測(cè)驗(yàn) b理論和專家的經(jīng)驗(yàn) c臨床觀察和記錄 B命題的原則及編寫要領(lǐng) a命題的原則(理解): ○1內(nèi)容方面:符合測(cè)驗(yàn)的目的,取樣有代表性,相互獨(dú)立,互不牽掛; ○2文字方面:準(zhǔn)確,簡(jiǎn)明扼要,少使用雙重否定句; ○3理解方面:不要超出受測(cè)團(tuán)體的知識(shí)水平和理解能力,不要有爭(zhēng)議誤解; ○4社會(huì)敏感性方面:應(yīng)盡量避開社會(huì)敏感性問題,如涉及社會(huì)禁忌或個(gè)人隱私的題目不應(yīng)使用。 菲利普對(duì)于涉及社會(huì)敏感性問題,怎樣鼓勵(lì)被試作出真實(shí)回答的策略: ◇1命題時(shí)假定被試具有某種行為,使他不得不在確實(shí)沒有該行為時(shí)才否定,可避免否定過多的傾向。 ◇2命題時(shí)假定規(guī)范不一致。 ◇3指出該行為是常見的,雖然是違規(guī)的。 b測(cè)題的編制要領(lǐng):根據(jù)被試的要求不同分為 ○1提供型:要求被試給出正確答案。 ○2選擇題:要求被試在有限幾個(gè)答案中選擇正確的答案。由題干和選項(xiàng)構(gòu)成。 題干:呈現(xiàn)一個(gè)問題的情境,一般由直接問句或不完全的陳述句構(gòu)成。 選項(xiàng):?jiǎn)栴}的多種可能答案,常常是包含一個(gè)正確答案,若干(一般是1~5個(gè))錯(cuò)誤答案,其中的錯(cuò)誤的答案叫做“誘答”。 八、編寫測(cè)驗(yàn)手冊(cè) 1、本測(cè)驗(yàn)的目的和功用 2、測(cè)驗(yàn)的理論背景以及選擇項(xiàng)目的根據(jù) 3、測(cè)驗(yàn)的實(shí)施方法、時(shí)限及注意事項(xiàng) 4、測(cè)驗(yàn)的標(biāo)準(zhǔn)答案和記分方法 5、常模表或其他有助于分?jǐn)?shù)轉(zhuǎn)化與解釋的資料 6、測(cè)驗(yàn)的信度、效度資料,包括信度系數(shù)、效度系數(shù)以及這些數(shù)據(jù)是在什么情境下得到的 第二節(jié) 測(cè)驗(yàn)的項(xiàng)目分析 一、項(xiàng)目的難度分析 (一)定義: 1、難度:是指項(xiàng)目的難易程度。P在能力測(cè)驗(yàn)中通常需要一個(gè)反映難度水平的指標(biāo),在非能力測(cè)驗(yàn)中,類似的指標(biāo)是“通俗性”,即取自相同總體的樣本中,能在答案方向上回答該題的的人數(shù)。 2、難度的指標(biāo): 以通過率表示難度時(shí),通過人數(shù)越多,即P值越大,難度就越低;P值越小,難度越高。 因?yàn)镻值大小與難度高低成反比,有人將其稱作易度。 (二)難度的計(jì)算 1、原始定義法 (1)客觀試題(二分法記分): R:答對(duì)該題的人數(shù);N:參加測(cè)驗(yàn)的總?cè)藬?shù) 由于選擇題允許猜測(cè),所以通過率可能因機(jī)遇作用而變大。備選答案的數(shù)目越少,機(jī)遇的作用越大,越不能真正反映測(cè)驗(yàn)的難度。為此,吉爾福特提出了一個(gè)P值校正公式。 CP:校正后的難度值;P:實(shí)際得到的通過率;K:選項(xiàng)數(shù)目 例題:假定某題有75%的被試通過,若該題有5個(gè)備選答案,則校正后的通過率為: 當(dāng)有4個(gè)備選答案時(shí),CP=0.67;有3個(gè),CP=0.63;有2個(gè),CP=0.54) b非二分記分:例題某一數(shù)學(xué)能力測(cè)驗(yàn)題的滿分為20分,全體被試在該題上的平均分?jǐn)?shù)為15分,則該題的難度為: P=15/20=0.75 例:一個(gè)題目的難度值為0.75,分別計(jì)算此題有四個(gè)選項(xiàng)、三個(gè)選項(xiàng)、兩個(gè)選項(xiàng)時(shí)大的難度值 (2)主觀題的平均數(shù)法 2、極端分組法 (1)客觀題的極端分組法 根據(jù)測(cè)驗(yàn)分?jǐn)?shù)按高低排序,用兩個(gè)極端組在某項(xiàng)目上的平均通過率表示項(xiàng)目的難度 PH、PL分別為高分組與低分組的通過率。 步驟: A、按測(cè)驗(yàn)總分由高到低排序 B、從高分段向下選出全部試卷的27%作為高分組 C、從低分段向上選出全部試卷的27%作為低分組 D、按照上述公式計(jì)算項(xiàng)目難度值 例:100人參加某測(cè)驗(yàn),高分組與低分組各取27人,其中第一題高分組20人答對(duì),低分組10人答對(duì)。這道題的難度系數(shù)是多少? (2)主觀題的極端分組法 步驟: A、按測(cè)驗(yàn)總分由高到低排序 B、從高分段向下選出全部試卷的25%作為高分組 C、從低分段向上選出全部試卷的25%作為低分組 D、按照上述公式計(jì)算項(xiàng)目難度值 XH:高分組所得總分; XL:低分組所得總分;H:該題最高分;L:該題最低分;N:考生總?cè)藬?shù)的25% (三)難度對(duì)測(cè)驗(yàn)的影響 1、難度對(duì)測(cè)驗(yàn)分?jǐn)?shù)分布的影響 (1)P值越小 →測(cè)驗(yàn)項(xiàng)目越難→測(cè)驗(yàn)分?jǐn)?shù)集中在低分端→分?jǐn)?shù)分布呈正偏態(tài)分布。 (2)P值越大→測(cè)驗(yàn)項(xiàng)目越易→ 測(cè)驗(yàn)分?jǐn)?shù)集中在高分端→分?jǐn)?shù)分布呈負(fù)偏態(tài)分布。 即:測(cè)驗(yàn)項(xiàng)目過份容易或過份難,都會(huì)造成測(cè)驗(yàn)分?jǐn)?shù)偏離正態(tài)分布,而使測(cè)驗(yàn)分?jǐn)?shù)的離散程度變小。 2、難度對(duì)測(cè)驗(yàn)鑒別力的影響 測(cè)驗(yàn)的主要功效之一就是鑒別考生實(shí)際水平的高低。自欺欺人適量難度可以加大考生得分的差異,從而提高測(cè)驗(yàn)的鑒別力。 P值越接近0.50,試題的鑒別能力就越高;相反,P值越接近1.00或0,試題的鑒別能力就越低。 3、難度與測(cè)驗(yàn)?zāi)康牡年P(guān)系 項(xiàng)目難度應(yīng)根據(jù)測(cè)驗(yàn)?zāi)康膩泶_定,不能認(rèn)為測(cè)驗(yàn)項(xiàng)目都必須保持值等于0.50最好。事實(shí)上,一方面,如果每個(gè)項(xiàng)目的難度都等于0.50,測(cè)驗(yàn)項(xiàng)目之間存在高度相關(guān),會(huì)使測(cè)驗(yàn)分?jǐn)?shù)的分布呈雙峰狀態(tài),即有5%的人所有題目都答對(duì),得滿分,另外5%的人全部答錯(cuò),得0分。 為此,難度水平的確定應(yīng)根據(jù)測(cè)驗(yàn)的目的,性質(zhì)及題目的形成。 (1)對(duì)于一般的常模、參照測(cè)驗(yàn)而言,其目的在于測(cè)量個(gè)體差異,一般只要求測(cè)驗(yàn)題目的平均難度為0.50,而個(gè)題難度可在0.50+0.20之間 。 (2)當(dāng)測(cè)驗(yàn)用與選拔或診斷時(shí),題目的難度值應(yīng)更多地接近錄取率。 (3)就選擇題而言,P值應(yīng)大于概率水平。P值若等于概率,說明被試純粹憑猜測(cè)作答;P值若小于概率,說明題目很可能存在問題。 (4)整個(gè)測(cè)驗(yàn)的難度水平取決于組成測(cè)驗(yàn)的題目的難度。 (四)難度的轉(zhuǎn)換 難度指出的僅僅是題目的相對(duì)難度,不能客觀地指出題目難度之間差異大小 P向Z的轉(zhuǎn)換 n假定每個(gè)試題所要測(cè)量地潛在特質(zhì)或能力是呈正態(tài)分布的,可將P值作為正態(tài)曲線下的概率面積,以此轉(zhuǎn)換成Z分?jǐn)?shù) 二、項(xiàng)目的區(qū)分度D (一)區(qū)分度的概念 區(qū)分度是測(cè)驗(yàn)對(duì)被試實(shí)際水平的區(qū)分程度。是測(cè)驗(yàn)項(xiàng)目分析的重要內(nèi)容 是作為評(píng)價(jià)項(xiàng)目質(zhì)量、篩選項(xiàng)目的主要指標(biāo)與依據(jù) 通常用D表示,取值范圍為+1.00至-1.00 D越高時(shí),試題的質(zhì)量越好,D值范圍在-1.00和+1.00之間,值越大,試題的區(qū)分能力越強(qiáng)。當(dāng)D為正值時(shí),說明試題是積極區(qū)分,即高分組通過率高,低分組通過率低。為D負(fù)值時(shí),說明試題有消極區(qū)分,高組通過率低,低組通過率高。D為0時(shí),說明試題無區(qū)分用 (二)區(qū)分度對(duì)測(cè)驗(yàn)的影響 1.區(qū)分度與難度的關(guān)系 l試題的區(qū)分度與難度有密切關(guān)系。試題難度過大或過小,其區(qū)分度都較低。當(dāng)難度值為1.00或0時(shí),高分組和低分組或全部通過得滿分,或全部未通過得0分,這時(shí)區(qū)分度都為0分。這兩種情況,都表示試題沒有鑒別考生水平高低的能力。所以,調(diào)整試題難度是提高試題區(qū)分度的重要方法。右表可說明難度與區(qū)分度的關(guān)系。 A、假如樣本中通過某一項(xiàng)目的人數(shù)比率為1.00或0,說明高分組與低分組在通過率上不存在差異,因此D為0;假如項(xiàng)目的通過率為0.50,則可能是高分組的所有人都通過了,而低分組卻無人通過,這樣D的最大值可能達(dá)到1.00。 B、為了使整個(gè)測(cè)驗(yàn)項(xiàng)目的潛在區(qū)分度最大,似乎應(yīng)該使每個(gè)項(xiàng)目的難度處于0.50水平,但事實(shí)并非如此簡(jiǎn)單。如果每一個(gè)項(xiàng)目的難度均處于0.50,由于項(xiàng)目難度相同,有可能大多趨向于有關(guān)的內(nèi)容或技能,結(jié)果造成項(xiàng)目同質(zhì)性提高。在極端情況下,有可能50%的被試全部通過各項(xiàng)目得滿分,另外50%的被試全部為0分,形成U形分布,這樣反而降低總分的區(qū)分能力。如果測(cè)驗(yàn)的所有項(xiàng)目都是中等難度,只有項(xiàng)目的內(nèi)在相關(guān)為0時(shí),整個(gè)測(cè)驗(yàn)才能產(chǎn)生常態(tài)分布??紤]到一般測(cè)驗(yàn)項(xiàng)目之間具有某種程度的相關(guān)難度的分布要廣一些,梯度多一些,是合乎需要的。 2.區(qū)分度與信度的關(guān)系 一個(gè)良好的測(cè)驗(yàn),信度必須要高。測(cè)驗(yàn)的信度與項(xiàng)目的區(qū)分度有著密切的關(guān)系,事實(shí)上,由試題的區(qū)分度還可以估計(jì)測(cè)驗(yàn)的信度。整個(gè)測(cè)驗(yàn)中各試題的區(qū)分度值的平均數(shù)越高,測(cè)驗(yàn)的信度就越高。值的平均數(shù)與信度的關(guān)系如右表。 (三)區(qū)分度計(jì)算方法 1、極端分組法 (1)客觀性試題區(qū)分度的計(jì)算公式: D=PH-PL 按測(cè)驗(yàn)總分從高到低排序 確定測(cè)驗(yàn)總分最高的27%的被試作為高分組,最低的27%的被試為低分組 分別求出這兩組被試通過試題的百分比 (2)主觀性試題區(qū)分度的計(jì)算公式: 說明: XH:高分組所得總分;XL:低分組所得總分;H:該題最高分;L:該題最低分;N:考生總?cè)藬?shù)的25% 步驟: 按測(cè)驗(yàn)總分由高到低排序;分別確定測(cè)驗(yàn)總分的25%、25%作為高低分組;列出試題分析表;將數(shù)據(jù)帶入以上公式加以計(jì)算 2、相關(guān)法 考慮中間數(shù)據(jù) 以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)(效標(biāo)分?jǐn)?shù)不易得到時(shí),以測(cè)驗(yàn)總分代替)的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo) 相關(guān)越高,區(qū)分能力越好 具體方法: ①點(diǎn)二列相關(guān):適用于一類變量為二分稱名變量,另一類變量為連續(xù)變量的成對(duì)變量的相關(guān)計(jì)算。 ②二列相關(guān):適用于兩個(gè)連續(xù)變量,但其中一個(gè)變量被人為分成兩類。 ③ 相關(guān):適用于兩個(gè)變量均為二分稱名變量。 積差相關(guān)法,點(diǎn)二列相關(guān),二列相關(guān),Φ相關(guān) (一) (二) (三) 提高區(qū)分度的方法 1、 使試題的難度適中,使整個(gè)考試難度適中 2、 著重考察復(fù)雜的學(xué)習(xí)結(jié)果 (四) 區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn) 以上標(biāo)準(zhǔn)僅作參考,不是絕對(duì)的。事實(shí)上,項(xiàng)目區(qū)分度的要求應(yīng)根據(jù)測(cè)驗(yàn)?zāi)康亩?,若測(cè)驗(yàn)?zāi)康脑谟谶x人,主要評(píng)判被試的個(gè)別差異,那么區(qū)分度要求高些;若測(cè)驗(yàn)只是考察被試對(duì)所學(xué)知識(shí)的掌握情況,可不過多考慮區(qū)分度。 三、項(xiàng)目分析的特殊問題 (一)選擇題反應(yīng)模式的分析 對(duì)于選擇題,除了分析其難度的區(qū)分度外,還要分析被試對(duì)每個(gè)備選答案的反應(yīng)情況。一般要做以下分析: 1、如果正確的備選答案被所有被試所選擇,則說明該題目太易或者題目中可能提供了某種暗示; 2、如果某個(gè)錯(cuò)誤答案沒有一個(gè)被試選擇,說明該選項(xiàng)不具迷惑性,錯(cuò)得過于明顯,一般說來,除非有2%以上的人選擇,否則這個(gè)備選答案就應(yīng)該修改。 3、如果所有被試的選擇了同一個(gè)錯(cuò)誤答案,可能是編制測(cè)驗(yàn)時(shí)把答案定錯(cuò)了,也可能是教學(xué)中發(fā)生了錯(cuò)誤。 4、如果所有被試的選擇集中在兩個(gè)答案上,二者選擇率相近,,說明該題可能有兩個(gè)正確答案或另一個(gè)答案也有一定道理。 5、如果高分組對(duì)正確答案的選擇與低分組相等或低于,說明所考察的東西與水平無關(guān)。 6、如果一個(gè)題目被試未答人數(shù)過多或選擇各個(gè)備選答案人數(shù)相等則說明題目過難或題意不清。 (二)標(biāo)準(zhǔn)參照測(cè)驗(yàn)的項(xiàng)目分析 標(biāo)準(zhǔn)參照測(cè)驗(yàn)主要用于判斷被試是否掌握了某些知識(shí)技能,是達(dá)到了一個(gè)事先確定的標(biāo)準(zhǔn),測(cè)驗(yàn)結(jié)果只與既定標(biāo)準(zhǔn)比較而不在被試之間作比較。因此測(cè)驗(yàn)分?jǐn)?shù)的變異性不是標(biāo)準(zhǔn)參照測(cè)驗(yàn)的必要條件。所以,常模參照測(cè)驗(yàn)的項(xiàng)目分析方法不完全適用于標(biāo)準(zhǔn)參照測(cè)驗(yàn)。 1、難度分析 標(biāo)準(zhǔn)參照測(cè)驗(yàn)可以采用常模參照測(cè)驗(yàn)的方法計(jì)算難度,但是在篩選項(xiàng)目時(shí),對(duì)難度水平的要求與常模參照測(cè)驗(yàn)不同。 由于標(biāo)準(zhǔn)參照測(cè)驗(yàn)的目的是為了考察被試對(duì)某方面的知識(shí)技能的掌握情況,因此,只要能反映教育目標(biāo)或教育者認(rèn)為重要的內(nèi)容,無論其難度為多少,都可以編入測(cè)驗(yàn)。 2、區(qū)分度分析 標(biāo)準(zhǔn)參照測(cè)驗(yàn)一般分?jǐn)?shù)變異較小,不適合用相關(guān)法來計(jì)算區(qū)分度,但是可以采用鑒別指數(shù)的方法計(jì)算,即比較兩組的通過率。 方法一 根據(jù)測(cè)驗(yàn)分?jǐn)?shù)將被試分為達(dá)標(biāo)組與未達(dá)標(biāo)組,然后分別計(jì)算它們?cè)谀骋豁?xiàng)目上的通過率,兩組考生通過率之差,便是該項(xiàng)目的區(qū)分度,其公式為: D=ps-pn 式中ps、pn為達(dá)標(biāo)組與未達(dá)標(biāo)組在某一項(xiàng)目上的通過率。 這種方法主要的問題是分組標(biāo)準(zhǔn)不同,得到的區(qū)分度值不同。 方法二 用同一測(cè)驗(yàn)對(duì)同一組被試在教學(xué)前后各施測(cè)一次,分別統(tǒng)計(jì)各項(xiàng)目前后測(cè)的通過率,二者之差便是項(xiàng)目的區(qū)分度。其公式為: D=ppost-ppre D值越高,說明項(xiàng)目對(duì)教學(xué)效果越敏感,所以有人將其稱做教學(xué)效果敏感指數(shù),其公式也可寫為 其中S 為敏感指數(shù),RA、RB分別為前測(cè)、后測(cè)通過人數(shù),N為總?cè)藬?shù)。 此種方法的主要缺點(diǎn)是:(1)同一測(cè)驗(yàn)施測(cè)兩次可能會(huì)產(chǎn)生練習(xí)效應(yīng),成績(jī)的提高究竟是由教學(xué)引起的,還是由練習(xí)引起的難以分辨;(2)只有等兩次施測(cè)后才能進(jìn)行項(xiàng)目分析;(3)當(dāng)D值低時(shí),難于做出明確的解釋,無法確定是由試題不良還是由教學(xué)不當(dāng)所致。 式中ppost、ppre分別為項(xiàng)目在后測(cè)和前測(cè)中的通過率。 方法三 取兩組條件相近的考生,一組接受過同測(cè)驗(yàn)有關(guān)的學(xué)科教學(xué),另一組沒有接受過此種教學(xué)。施測(cè)同一測(cè)驗(yàn)后,分別統(tǒng)計(jì)每組考生答對(duì)某題的人數(shù),兩組考生通過率之差便是該題的區(qū)分度。公式為D=pi-pu 式中pi、pu分別為教學(xué)組和未經(jīng)教學(xué)組對(duì)某題的通過率。 此方法的缺點(diǎn)是,兩組考生除在教學(xué)方面不同外在其他有關(guān)方面必須同質(zhì),而這一點(diǎn)是難以做到的。 項(xiàng)目特征曲線:是項(xiàng)目特征函數(shù)或項(xiàng)目反應(yīng)函數(shù)的圖解形式,它反映了被試對(duì)某一測(cè)驗(yàn)項(xiàng)目的正確反應(yīng)概率與該項(xiàng)目所對(duì)應(yīng)的能力或特質(zhì)的水平之間的一種函數(shù)關(guān)系。這一方法不僅適用于項(xiàng)目分析,而且也適用于某些測(cè)驗(yàn)量表的編制。 A項(xiàng)目特征曲線可圖解測(cè)驗(yàn)的鑒別力,項(xiàng)目鑒別力的高低主要在于其曲線的傾斜度,曲線坡度越陡,鑒別能力越好,預(yù)測(cè)的誤差越小。 B項(xiàng)目特征曲線可以圖解項(xiàng)目難度。 C項(xiàng)目特征曲線還可以圖解選擇題的誘答反應(yīng)。 第三章 測(cè)量的誤差及其檢驗(yàn) [教學(xué)目的與要求] (1)了解測(cè)量誤差的種類與來源 (2)掌握信度的定義、意義及其估計(jì)方法 (3)掌握效度的定義、意義及其估計(jì)方法 [教學(xué)重點(diǎn)與難點(diǎn)]信度與效度的估計(jì) [教學(xué)時(shí)數(shù)]4學(xué)時(shí) 第一節(jié) 測(cè)量的誤差 一、誤差的種類 (一)誤差的定義 誤差是在測(cè)量中與目的無關(guān)的因素所產(chǎn)生的不準(zhǔn)確的或不一致的結(jié)果。 (二)誤差的種類 1、隨機(jī)誤差:與測(cè)量目的無關(guān)的偶然因素引起的變化規(guī)律的誤差,使得多次的測(cè)量結(jié)果不一致,這種誤差的大小和方向是隨機(jī)的。既影響測(cè)量的準(zhǔn)確性又影響一致性。 2、系統(tǒng)誤差:與測(cè)量目的無關(guān)的因素引起的恒定的有規(guī)律的誤差,它穩(wěn)定地存在于每一次測(cè)量中。只影響測(cè)量的準(zhǔn)確性。 二、誤差的來源 (一)測(cè)驗(yàn)自身引起的誤差 主要來源于測(cè)驗(yàn)的編制過程,其中項(xiàng)目取樣影響最大。 (二)施測(cè)過程引起的誤差 1、測(cè)試環(huán)境 2、測(cè)試時(shí)間 3、主試因素 4、意外干擾 5、評(píng)分記分 (三)被試引起的誤差 1、應(yīng)試動(dòng)機(jī) 2、測(cè)驗(yàn)焦慮 3、測(cè)驗(yàn)經(jīng)驗(yàn) 4、練習(xí)效應(yīng) 5、反應(yīng)傾向 6、生理變因 三、真分?jǐn)?shù) (一)含義 真分?jǐn)?shù)是指測(cè)量沒有誤差時(shí)所得到的真值。其操作定義是無數(shù)次測(cè)量結(jié)果的平均值。 (二)數(shù)學(xué)模型及其假設(shè) 1、CTT模型——經(jīng)典測(cè)驗(yàn)理論假定,觀察分?jǐn)?shù)(X)與真分?jǐn)?shù)(T)之間是一種線性關(guān)系,并只相差下個(gè)隨機(jī)誤差(E),即X=T+E這里的測(cè)量誤差E指的是引起測(cè)量不一致的變因所產(chǎn)生的效應(yīng),即指隨機(jī)誤差,不包括系統(tǒng)誤差。 分析假設(shè)公理: (1)若一具人的某種心理特質(zhì)可以用平行的測(cè)驗(yàn)分?jǐn)?shù)反復(fù)測(cè)量足夠多次,則其觀察分?jǐn)?shù)的平均值會(huì)接近于真分?jǐn)?shù)。即E(X)=T或E(E)=1 0 (2)真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零。 即P(T,E)=0 (3)各平行測(cè)驗(yàn)上的誤差分?jǐn)?shù)之間的相關(guān)為零。 2、引申: (1)在一次測(cè)量中,被試觀察分?jǐn)?shù)的方差等于其真分?jǐn)?shù)方差與誤差分?jǐn)?shù)方差之和。S2X=ST2+S2E (2)真分?jǐn)?shù)可以分成兩部分:與測(cè)量目的有關(guān)變異S2V和與測(cè)量目的無關(guān)的變異S2I,即:ST2=S2V+S2I (3)一次測(cè)驗(yàn)中,一個(gè)團(tuán)體的實(shí)測(cè)分?jǐn)?shù)之間的變異性是由與測(cè)量目的有關(guān)的變異數(shù)SV2、穩(wěn)定的但出自無關(guān)來源的變異數(shù)SI2和測(cè)量誤差的變異數(shù)SE2所決定的。 即:S2X=SV2+SI2+SE2 第二節(jié) 信度(reliability) 一、什么是信度 定義:指的是測(cè)量結(jié)果的穩(wěn)定性程度(或叫可靠性)。也指同一被試在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)(或用另一套相等的測(cè)驗(yàn))重復(fù)測(cè)量,所得結(jié)果的一致程度。 1、理論定義:傳統(tǒng)的信度理論認(rèn)為,每一個(gè)測(cè)驗(yàn)的實(shí)得分?jǐn)?shù)(X)總是由真實(shí)分?jǐn)?shù)(T)和誤差(E),兩個(gè)部份構(gòu)成的,公式為: X=T+E 討論一組測(cè)驗(yàn)分?jǐn)?shù)的特性時(shí),可用方差導(dǎo)標(biāo)具體分?jǐn)?shù),公式: (測(cè)驗(yàn)實(shí)得分?jǐn)?shù)的方差)= (測(cè)驗(yàn)真分?jǐn)?shù)的方差)+(測(cè)驗(yàn)誤差的方差) 2、操作定義: 定義1:一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)變異數(shù)(方差)與總變異數(shù)(總方差、實(shí)得分?jǐn)?shù)的方差)的比率,或者是真實(shí)分?jǐn)?shù)方差占總方差的的百分比。計(jì)算公式: rxx=ST2/SX2 定義2:信度乃是一個(gè)被試團(tuán)體的真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平方。即 rxx=ptx2 定義3:信度乃是一個(gè)測(cè)驗(yàn)X(A卷)與它的任意一個(gè)“平行測(cè)驗(yàn)”X/(B卷)的相關(guān)系數(shù)。即rxx=pXX`2 二、信度的指標(biāo) (一)信度系數(shù):大部分情況下,信度是信度系數(shù)為指標(biāo),它是一種相關(guān)系數(shù)。理論上說就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)的方差的比值,公式是:rxx=ptx2 (二)信度指數(shù):是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)的標(biāo)準(zhǔn)差的比值,公式是: 信度指數(shù)的平方就是信度系數(shù) rxx=ST2/SX2 (三)標(biāo)準(zhǔn)誤:指出個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的變異量。信度系數(shù)表示一組測(cè)量的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度,標(biāo)準(zhǔn)誤表示個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的變異量。 用一組被試兩次測(cè)量結(jié)果來代替同一個(gè)人反復(fù)實(shí)測(cè),有了信度的另一個(gè)指標(biāo): 測(cè)量標(biāo)準(zhǔn)誤。測(cè)量的標(biāo)準(zhǔn)誤與信度之間呈反比關(guān)系:標(biāo)準(zhǔn)誤越小,信度越高;標(biāo)準(zhǔn)誤越大,信度越低。 三、信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋 (一)解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān) (二)比較信度可以接受的水平 (三)解釋個(gè)人分?jǐn)?shù)的意義: (四)比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異: 四、信度的類型及估計(jì)方法 (一)重測(cè)信度(再測(cè)信度): 1、含義與計(jì)算 又稱穩(wěn)定性系數(shù)。他的計(jì)算方法是采用重測(cè)法,即使用同一測(cè)驗(yàn),在同樣條件下對(duì)同一組被試前后施測(cè)兩次測(cè)驗(yàn),求兩次得分間的相關(guān)系數(shù)。 2、使用的前提條件 (1)所測(cè)量的心理特性必須是穩(wěn)定的。 (2)遺忘和練習(xí)的效果基本上相互抵消。 (3)在時(shí)間間隔中沒有學(xué)習(xí)另外的與測(cè)驗(yàn)有關(guān)的東西,或者說每人學(xué)習(xí)其他東西的程度都一樣。 3、優(yōu)缺點(diǎn): 優(yōu)點(diǎn): (1) 它最符合重復(fù)測(cè)驗(yàn)的涵義,是重復(fù)測(cè)驗(yàn)最簡(jiǎn)單最明確的方式 (2)首測(cè)和再測(cè)只需要一套測(cè)驗(yàn)題目,省時(shí)、省力 (3)同一套題目無論施測(cè)幾次,所測(cè)的屬性是完全相同的。 缺點(diǎn): (1)同一組被試對(duì)同一個(gè)測(cè)驗(yàn)先后兩次作答相互之間是不獨(dú)立的。 (2)如果兩次施測(cè)時(shí)間間隔較長(zhǎng),在此期間被試的身心發(fā)展,新知識(shí)的獲得,都會(huì)使兩次測(cè)驗(yàn)結(jié)果不相同。 (3)同一個(gè)被試對(duì)現(xiàn)一個(gè)測(cè)驗(yàn)先后兩次作答,對(duì)測(cè)驗(yàn)的興趣不同,影響測(cè)驗(yàn)結(jié)果。 (4)兩次施測(cè)的環(huán)境不同,也是產(chǎn)生測(cè)量誤差的因素。 (二)復(fù)本信度(Alternate-form reliability) 1、含義與計(jì)算: 含義:又稱等值性系數(shù)。它是以兩個(gè)平行或復(fù)本的測(cè)驗(yàn)(等值但題目不同)來測(cè)量同一群體,然后求得被試在兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù),這個(gè)相關(guān)系數(shù)就代表了復(fù)本信度的高低。復(fù)本信度反映的是測(cè)驗(yàn)在內(nèi)容上的等值性,故稱等值性系數(shù)。復(fù)本信度的高低關(guān)鍵取決于復(fù)本測(cè)驗(yàn)的選擇。 2、使用的前提條件: (1)要兩份或兩份以上真正平行的測(cè)驗(yàn) (2)被試要有條件接受兩個(gè)測(cè)驗(yàn)。主要取決于時(shí)間、經(jīng)費(fèi)等幾方面。 3、優(yōu)缺點(diǎn): 優(yōu)點(diǎn): (1)一個(gè)測(cè)驗(yàn)的復(fù)本使得測(cè)驗(yàn)數(shù)目的增加,對(duì)于所欲測(cè)量的屬性相聯(lián)系的行為總體代表性強(qiáng),因此,一個(gè)測(cè)驗(yàn)的兩個(gè)復(fù)本在兩三天至一周對(duì)同一組被試施測(cè)時(shí),獲得的復(fù)本信度系數(shù)是相當(dāng)準(zhǔn)確的。 (2)測(cè)驗(yàn)的兩個(gè)復(fù)本,如果在不同時(shí)間使用,其信度不僅可以反映在不同時(shí)間的穩(wěn)定性,而且還可以反映對(duì)于不同測(cè)題的一致性。 (3)兩個(gè)復(fù)本在同時(shí)使用時(shí),可以避免再測(cè)驗(yàn)信度的缺點(diǎn)。 缺點(diǎn): (1)編制兩個(gè)完全相等的測(cè)驗(yàn)是很困難的, (2)復(fù)本法只能減少而不能完全排除練習(xí)和記憶的影響。 (3)被試同時(shí)接受性質(zhì)相似的兩個(gè)測(cè)驗(yàn)可能減少完成測(cè)驗(yàn)的積極性。 4、 適用范圍 (1)如果兩個(gè)復(fù)本的施測(cè)相隔一段時(shí)間,則稱穩(wěn)定與等值系數(shù)。穩(wěn)定與等值系數(shù)既考慮了測(cè)驗(yàn)在時(shí)間上的穩(wěn)定性,也考慮了不同題目樣本反應(yīng)的一致性,因而是更為嚴(yán)格的信度考察方法,也是應(yīng)用較為廣泛的方法。 (2)在實(shí)際應(yīng)用時(shí),為了抵消施測(cè)順序的效應(yīng),應(yīng)該有半數(shù)的被試先作A本再作B本,另一半被試先作B本再作A本。 (3)復(fù)本測(cè)驗(yàn)不僅適用于難度測(cè)驗(yàn),也是估計(jì)速度測(cè)驗(yàn)信度的最好方法。 (三)分半信度(split-half reliability) 1、含義與計(jì)算 指采用分半法估計(jì)所得的信度系數(shù)。這種方法估計(jì)信度系數(shù)只需一種測(cè)驗(yàn)形式,實(shí)施一次測(cè)驗(yàn)。通常是在測(cè)驗(yàn)實(shí)施后將測(cè)驗(yàn)按奇、偶數(shù)分為等值的兩半,并分別計(jì)算每位被試在兩半測(cè)驗(yàn)上的得分,求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。 常見的是將測(cè)題按其序列號(hào)的奇偶分,這種分法的前提是:測(cè)題并非隨機(jī)排列,而是按某種順序(如難度)排列;如果隨機(jī)排列的題目,則必須是所有題目平等的(要么難度相等,要么性質(zhì)一樣);如果測(cè)驗(yàn)有多個(gè)分量表,應(yīng)該在分量表內(nèi)部排好順序,再把各分量表分兩半組合起來求相關(guān)。 2、計(jì)算 (1)兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)相等(方差齊性) 先計(jì)算兩半測(cè)驗(yàn)的積差相關(guān)系數(shù),再進(jìn)行校正。常用的修正公式是:斯皮爾曼-布朗公式: (2)兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)不等(方差不齊),可采用: 弗朗那根公式 或盧倫公式中的任一一個(gè)。 例題:對(duì)初一年級(jí)學(xué)生進(jìn)行地理成績(jī)測(cè)驗(yàn),每答對(duì)1題得1分,答錯(cuò)1題得0分,測(cè)題從易到難排列如表所示,試估計(jì)該測(cè)驗(yàn)的分半信度。 學(xué)生 1 2 3 4 5 6 7 8 9 10 奇數(shù)題得分X 1 0 2 2 1 3 2 2 1 3 偶數(shù)題得分Y 0 1 0 1 1 2 3 2 2 3 總分 1 1 2 3 2 5 5 4 3 6 3、使用條件及范圍 分半信度通常是在只能施測(cè)一次或沒有復(fù)本的情況下使用。而且,在使用斯皮爾-布朗公式時(shí)要求全體被試在兩半測(cè)驗(yàn)上得分的變異數(shù)要相等。當(dāng)一個(gè)測(cè)驗(yàn)無法分成對(duì)等的兩半時(shí),分半信度不宜使用。 (四)同質(zhì)性信度(homogeneity reliability) 1、含義:指測(cè)驗(yàn)內(nèi)部所有題目間的一致性。 題目的一致性有兩層含義:其一是指所有題目都測(cè)的是同一種心理特質(zhì);其二是指所有題目之間都具有較高的正相關(guān)??傊|(zhì)性信度就是一個(gè)測(cè)驗(yàn)所測(cè)內(nèi)容或特質(zhì)的相同程度。 2、測(cè)量同質(zhì)性的基本公式: 3、庫德-理查遜公式:適用于客觀性試題(0、1記分) 3、克倫巴赫系數(shù)(多重記分測(cè)驗(yàn)) 例題:某態(tài)度量表共7題,100個(gè)被試在各題上的得分方差分別是0.81,0.82,0.79,0.83,0.85,0.76,0.77,測(cè)驗(yàn)總分的方差為14.00,則此測(cè)量的的信度為0.70. 4、注意: 當(dāng)各個(gè)測(cè)題的得分有較高的正相關(guān)時(shí),不論題目的內(nèi)容和形式如何,測(cè)驗(yàn)即為同質(zhì)的;若所有題目看起來好像測(cè)量的是同一特質(zhì),但相關(guān)很低或?yàn)樨?fù)相關(guān)時(shí),測(cè)驗(yàn)即為異質(zhì)的。 對(duì)于一些復(fù)雜的、異質(zhì)的心理學(xué)變量,采用單一的同質(zhì)性測(cè)驗(yàn)是不行的,因而常常采用若干相對(duì)異質(zhì)的分測(cè)驗(yàn),并使每個(gè)分測(cè)驗(yàn)內(nèi)容具有同質(zhì)性,這樣每個(gè)分測(cè)驗(yàn)就能用來預(yù)測(cè)異質(zhì)效標(biāo)的某一方面。 (五)評(píng)分者信度(scorer reliability) 1、含義與計(jì)算:指的是多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致性程度。是用于測(cè)量不同評(píng)分者之間所產(chǎn)生的誤差。 式中W為和諧系數(shù),K為評(píng)分者的人數(shù),N為被評(píng)對(duì)象數(shù),RI為每一對(duì)象被評(píng)的等級(jí)總和。 例子:假設(shè)有三位專家給六篇論文評(píng)等級(jí),結(jié)果如表所示,試計(jì)算此次評(píng)分者的評(píng)分者信度。 專家 1 2 3 4 5 6 1 2 4 1 5 6 3 2 3 4 1 5 6 2 3 3 5 1 4 6 2 Ri 8 13 3 14 18 7 2、注意的問題:為了衡量評(píng)分者之間的信度高低,可隨機(jī)抽取若干份測(cè)驗(yàn)卷,由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分,然后再根據(jù)每份測(cè)驗(yàn)卷的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān),即得評(píng)分者信度。一般要求在成對(duì)的受過訓(xùn)練的評(píng)分者之間平均一致性達(dá)0.90以上,才認(rèn)為評(píng)分是客觀的。當(dāng)多個(gè)評(píng)分者評(píng)定多個(gè)對(duì)象 ,并以等級(jí)法記分時(shí),可采用肯德爾和諧系數(shù)作為評(píng)分者信度的估計(jì)。 五、標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度估計(jì) 1、對(duì)相關(guān)法信度系數(shù)進(jìn)行校正 為了對(duì)標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度做出較為準(zhǔn)確的估計(jì),利文斯頓提出了對(duì)相關(guān)法信度系數(shù)的校正公式: 2、用決策的一致性作為信度指標(biāo) 林德曼與梅倫達(dá)的一致性公式: C為一致性,n為在兩次施測(cè)中均未達(dá)到標(biāo)的人數(shù),b為在兩次施測(cè)中均已達(dá)標(biāo)的人數(shù),f為只在第一次施測(cè)中達(dá)標(biāo)的人數(shù),s為只在第二次施測(cè)中達(dá)標(biāo)的人數(shù),v為f或s中較小的值。 六、各種信度系數(shù)相應(yīng)誤差方差的來源 信度系數(shù)類型 誤差方差來源 重測(cè)信度 時(shí)間取樣 復(fù)本信度(連續(xù)施測(cè)) 內(nèi)容取樣 復(fù)本信度(間隔施測(cè)) 時(shí)間和內(nèi)容取樣 分半信度 內(nèi)容取樣 同質(zhì)性信度 內(nèi)容的異質(zhì)性 評(píng)分者信度 評(píng)分者之間的差異 七、影響信度的因素 (一)樣本的特征:信度常用信度系數(shù)來表示,信度系數(shù)就是相關(guān)系數(shù),相關(guān)系數(shù)受樣本團(tuán)體得分分布、樣本是否異質(zhì)及樣本團(tuán)體平均能力水平的影響。 1、樣本團(tuán)體分?jǐn)?shù)分布的影響:當(dāng)分布范圍增大時(shí),其信度估計(jì)就較高;當(dāng)分布范圍減小時(shí),相關(guān)系數(shù)隨之下降,信度值則較低。 2、樣本團(tuán)體異質(zhì)性的影響:若獲得信度的取樣團(tuán)體較為異質(zhì)的話,往往會(huì)高估測(cè)驗(yàn)的信度,相反則會(huì)低估測(cè)驗(yàn)的信度。 3、樣本團(tuán)體平均能力水平的影響:對(duì)于不同水平的團(tuán)體,題目具有不同的難度,每個(gè)題目在難度上的微小差異累計(jì)起來便會(huì)影響信度。 (二)測(cè)驗(yàn)的長(zhǎng)度: 1、測(cè)驗(yàn)越長(zhǎng),測(cè)驗(yàn)的測(cè)題取樣或內(nèi)容取樣越有代表性。 2、測(cè)驗(yàn)越長(zhǎng) ,被試的猜測(cè)因素影響就越小。 3、測(cè)驗(yàn)的項(xiàng)目越多,在每個(gè)項(xiàng)目上的隨機(jī)誤差就可以相互抵消。 (三)測(cè)驗(yàn)的難度:難度對(duì)信度的影響只存在于某些測(cè)驗(yàn)中,如智力測(cè)驗(yàn)、成就測(cè)驗(yàn)、 能力傾向測(cè)驗(yàn)等。如果一個(gè)測(cè)驗(yàn)對(duì)某團(tuán)體而言太容易,會(huì)使所得分?jǐn)?shù)都集中在高分端;當(dāng)題目太困難時(shí),得分就會(huì)集中在低分端。兩種情況均會(huì)使信度樣本的分?jǐn)?shù)范圍變窄,從而使測(cè)驗(yàn)變得不夠可靠。從理論上說,只有難度水平為50%時(shí),才能使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大,求得的信度也最高。 (四)測(cè)驗(yàn)的時(shí)間間隔:以再測(cè)法或復(fù)本法求信度,兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度系數(shù)越大;間隔時(shí)間越久,其它變因介入的可能性越大,受外界的影響越大,信度系數(shù)便越低。 第三節(jié) 測(cè)驗(yàn)的效度 在測(cè)量活動(dòng)中,測(cè)量者對(duì)所使用的測(cè)量工具非常信任,他會(huì)采取復(fù)測(cè)行為以判斷測(cè)量有無誤差;如果測(cè)量者對(duì)所使用的測(cè)量工具發(fā)生懷疑,那他往往會(huì)去找一公認(rèn)非常準(zhǔn)確的測(cè)量工具對(duì)先前的測(cè)值進(jìn)行檢驗(yàn)。這種在原測(cè)量工具之外尋求新的證據(jù)來肯定或否定某一測(cè)量工具準(zhǔn)確性的做法就是在研究測(cè)量的效度問題。心理測(cè)量是一種間接測(cè)量,心理測(cè)量更重視測(cè)量的效度研究。 一、效度(validity) (一)定義:效度是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度,或者簡(jiǎn)單地說是指一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性?;蚴侵敢粋€(gè)測(cè)驗(yàn)或量表實(shí)際能測(cè)出其所要測(cè)的心理特質(zhì)的程度。 1、關(guān)于效度的概念,我們要特別注意以下幾點(diǎn): (1)效度是一個(gè)相對(duì)的概念。這種相對(duì)性表現(xiàn)在兩個(gè)方面: ①效度是相對(duì)于一定的測(cè)量目的而言的。 ②心理特質(zhì)是較隱蔽的特性,只能通過他的行為表現(xiàn)來進(jìn)行推測(cè),因此,心理測(cè)量不可能達(dá)到百分之百的準(zhǔn)確,而只能達(dá)到某種程度的準(zhǔn)確。 (2)效度是測(cè)量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。任一誤差的存在,測(cè)量的效度都會(huì)受到影響 (3)判斷一個(gè)測(cè)量是否有效要從多方面收集證據(jù) 2、在測(cè)驗(yàn)理論中,效度被定義為在一組測(cè)量中,與測(cè)量目標(biāo)有關(guān)的真實(shí)方差(或稱有效方差,由所要測(cè)量的變因引起的有效變異)與總方差(實(shí)得變異數(shù))的比率,即 3、一組測(cè)驗(yàn)分?jǐn)?shù)的總方差等于真實(shí)方差與誤差方差之和,而真實(shí)方差又可分為兩部分,即有關(guān)的方差和無關(guān)的但穩(wěn)定的方差,后者也就是所謂系統(tǒng)誤差帶來的方差 S2X=SV2+SI2+SE2 由于有效方差是一個(gè)理論值,無法測(cè)量,所以效度和信度一樣是一個(gè)理論上的概念。 二、效度和信度的關(guān)系 (一)信度是效度的必要而非充分條件。 (二)效度是受信度制約的:信度系數(shù)的平方根是效度系數(shù)的最高限度, 可見,一個(gè)測(cè)驗(yàn)的效度總是受它的信度所制約。 三、效度的類型及評(píng)估方法 (一)內(nèi)容效度(Content Validity) 1、定義:指的是項(xiàng)目對(duì)欲測(cè)的內(nèi)容或行為范圍的取樣的適當(dāng)程度。也即測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測(cè)驗(yàn)是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。 一個(gè)測(cè)驗(yàn)要具備較好的內(nèi)容效度必須滿足兩個(gè)條件: (1)要確定好內(nèi)容范圍,并使測(cè)驗(yàn)的全部項(xiàng)目均在此范圍內(nèi)。所謂內(nèi)容范圍可以是具體知識(shí)或技能,也可以是復(fù)雜的行為。要對(duì)所測(cè)量的心理特性有個(gè)明確的概念,并劃定出哪些行為與這心理特性有關(guān)。 (2)測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。 2、內(nèi)容效度的評(píng)估方法: (1)專家判斷法: (2)統(tǒng)計(jì)分析法 (3)經(jīng)驗(yàn)推測(cè)法: 3、內(nèi)容效度的應(yīng)用 (1)是編制任何測(cè)驗(yàn)應(yīng)加以考慮的基本方面。 (2)較適用于評(píng)價(jià)教育成就測(cè)驗(yàn)和職業(yè)選拔測(cè)驗(yàn)。 (3)對(duì)標(biāo)準(zhǔn)參照測(cè)驗(yàn)更為重要,是因?yàn)樵跇?biāo)準(zhǔn)參照測(cè)驗(yàn)中我們主要關(guān)心的是被試對(duì)一定范圍的知識(shí)、技能掌握得如何。 (4)注意內(nèi)容效度與表面效度的關(guān)系(5)它缺乏可靠的數(shù)量指標(biāo),因而妨礙了各測(cè)驗(yàn)間的相互比較。 (二)構(gòu)想效度(construct Validity) 1954年提出,有人翻譯為構(gòu)思效度,也有叫結(jié)構(gòu)效度。它是指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想和特質(zhì)的程度,即測(cè)驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。 1、構(gòu)想效度的特點(diǎn): (1)其大小首先取決于事先假定的心理特質(zhì)理論 (2)當(dāng)實(shí)際測(cè)量的資料無法證實(shí)我們的理論假設(shè)時(shí),并不一定就表明該測(cè)驗(yàn)結(jié)構(gòu)效不高,因?yàn)檫€有可能是理論假設(shè)不成立,或者該實(shí)驗(yàn)設(shè)計(jì)不能對(duì)該假設(shè)作適當(dāng)?shù)臋z驗(yàn)等情況,當(dāng)然這就使得結(jié)構(gòu)效度的獲取更為困難。 (3)結(jié)構(gòu)效度通過測(cè)量什么、不測(cè)量什么的證據(jù)累積起來給以確定,因而不可能有單一的數(shù)量指標(biāo)來描述結(jié)構(gòu)效度。 結(jié)構(gòu)效度主要應(yīng)用于智力測(cè)驗(yàn)、人格測(cè)驗(yàn)等一些心理測(cè)驗(yàn)方面。 2、結(jié)構(gòu)效度的確定方法: (1)提出理論假設(shè),并把這一假設(shè)分解成一些細(xì)小的綱目,以解釋被試在測(cè)驗(yàn)上的表現(xiàn)。 (2)依據(jù)理論框架,推演出有關(guān)測(cè)驗(yàn)成績(jī)的假設(shè)。 (3)用邏輯和實(shí)證的方法來驗(yàn)證假設(shè)。 3、構(gòu)想效度的估計(jì)方法: (1)測(cè)驗(yàn)內(nèi)法(對(duì)測(cè)驗(yàn)本身的分析): (2)測(cè)驗(yàn)間的相互比較: ①相容效度 ②區(qū)分效度是構(gòu)思效度的又一個(gè)證據(jù)。 ③因素效度:(3)效標(biāo)關(guān)聯(lián)法,效度的研究證明:一個(gè)測(cè)驗(yàn)若效標(biāo)度理想,那么該測(cè)驗(yàn)所預(yù)測(cè)的效標(biāo)的性質(zhì)和種類就可以作為分析測(cè)驗(yàn)構(gòu)思效度的指標(biāo),另一種證實(shí)構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。 (4)實(shí)驗(yàn)法和觀察法證實(shí):觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異是驗(yàn)證構(gòu)思效度的方法。 3、對(duì)構(gòu)想效度的評(píng)價(jià) (1)構(gòu)想效度促使研究者把著眼點(diǎn)放在提出假設(shè)上、檢驗(yàn)假設(shè)上,使得測(cè)驗(yàn)成為理論研究的重要工具,而不再只是實(shí)際決策的輔助工具,從而使測(cè)驗(yàn)有了更廣闊的發(fā)展情景。 (2)主要缺點(diǎn)是,有些構(gòu)想概論模糊,沒有一致的定義,確定效度時(shí)沒有明確的操作步驟,沒有單一的數(shù)量指標(biāo)來描述有效程度。 (三)效標(biāo)效度 1、定義:又稱實(shí)證效度,反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo)。由于這種效度是看測(cè)驗(yàn)對(duì)效標(biāo)預(yù)測(cè)如何,所以叫效標(biāo)效度。這種效度需在實(shí)踐中檢驗(yàn),所- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 心理測(cè)量學(xué) 教案 鄭日昌版
鏈接地址:http://www.820124.com/p-6683871.html