心理測(cè)量學(xué)教案(鄭日昌版).doc

上傳人：xin****828

文檔編號(hào)：6683871

上傳時(shí)間：2020-03-02

格式：DOC

頁數(shù)：67

大?。?10.50KB

《心理測(cè)量學(xué)教案(鄭日昌版).doc》由會(huì)員分享，可在線閱讀，更多相關(guān)《心理測(cè)量學(xué)教案(鄭日昌版).doc（67頁珍藏版）》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

第一章心理測(cè)驗(yàn)總論 [教學(xué)目的與要求] （1）識(shí)記并了解心理測(cè)驗(yàn)的發(fā)展歷史（2）掌握心理測(cè)驗(yàn)的性質(zhì) （3）了解心理測(cè)驗(yàn)的種類 [教學(xué)重點(diǎn)與難點(diǎn)]心理測(cè)驗(yàn)的性質(zhì) [教學(xué)時(shí)數(shù)]2學(xué)時(shí) 第一節(jié) 心理測(cè)驗(yàn)的歷史一、中國古代的心理測(cè)驗(yàn)思想 1、孔子：把人分為中人、中人以上、中人以下三個(gè)類別，“中人以上，可以語上也；中人以下，不可以語上也”。（相當(dāng)于現(xiàn)代測(cè)量學(xué)中的命名量表和次序量表） 2、孟子：“權(quán)，然后知輕重；度，然后知長(zhǎng)短。物皆然，心為甚?！泵鞔_指出了心理能力和心理特征與物理現(xiàn)象一樣，具有可測(cè)量的特性。 3、（南朝）劉勰：世界上最早的“分心測(cè)驗(yàn)”，認(rèn)為一心不能二用。 4、（南北朝）顏之推：周歲試兒，其是1925年格塞爾嬰兒發(fā)展量表的前導(dǎo)。 5、“七巧板”又稱益智圖、唐圖（Tangram），為當(dāng)代多數(shù)智力測(cè)驗(yàn)和創(chuàng)造力測(cè)驗(yàn)所使用。 6、隋煬帝科舉制度的開端，被認(rèn)為是世界上最早的心理測(cè)驗(yàn)的實(shí)踐。當(dāng)時(shí)的考試方法：貼經(jīng)和對(duì)偶，類似于現(xiàn)代西方言語測(cè)驗(yàn)中常見的填字和類比。 7、、中國古代心理測(cè)驗(yàn)的思想，包含著典型的東方文化特點(diǎn)： A、他們都是描述性的，沒有定量的標(biāo)準(zhǔn)； B、往往將心理特點(diǎn)與道德觀念聯(lián)系起來（局限性）二、科學(xué)心理測(cè)驗(yàn)產(chǎn)生的原因（一）對(duì)智力落后著分類和訓(xùn)練的早期關(guān)注 1、心理測(cè)驗(yàn)產(chǎn)生的最初原因：對(duì)智力落后和精神病人治療的需要。 2、法國醫(yī)生埃斯克羅：1838年出版了兩卷本著作，第一次明確地對(duì)智力落后與精神病人作出了區(qū)分，他認(rèn)為精神病是以情緒障礙為標(biāo)志。(發(fā)現(xiàn)一個(gè)人的語言能力是他智力水平的最可靠的指標(biāo)) 3、法國醫(yī)生塞國恩（E.Sequin）：訓(xùn)練智力落后者的先驅(qū)。1837年，他創(chuàng)建了第一座教育智力落后兒童的學(xué)校，1846年出版了《白癡：用生理方法進(jìn)行診斷和治療》。其首創(chuàng)方法感官訓(xùn)練（sense-training）、肌肉訓(xùn)練(muscle-training)至今仍在全世界范圍內(nèi)的智力落后兒童教育機(jī)構(gòu)。其Sequin Form Board拼圖板被心理測(cè)驗(yàn)的非語言測(cè)驗(yàn)所采用，其操作方法是要求受測(cè)者盡快地將不同形狀的圖片嵌入適當(dāng)?shù)陌疾蹆?nèi)。 4、法國心理學(xué)家比奈開始致力于推動(dòng)建立鑒別不能適應(yīng)正常學(xué)校學(xué)習(xí)但是可教育兒童的方法，鑒別出后安排接受一系列特殊教育課程。比奈與“兒童心理學(xué)研究會(huì)”的同事們努力推動(dòng)法國公共教育部開展一項(xiàng)促進(jìn)智能不足兒童學(xué)習(xí)能力計(jì)劃，并成立了專門的研究小組，這個(gè)小組的成立是心理測(cè)驗(yàn)發(fā)展史上一個(gè)極為重大的歷史事件。（二）實(shí)驗(yàn)心理學(xué)的發(fā)展 1、馮特：1879年他在德國萊比錫大學(xué)建立了心理學(xué)史上第一個(gè)實(shí)驗(yàn)室，引發(fā)了個(gè)別差異的研究。 2、實(shí)驗(yàn)心理學(xué)的誕生和發(fā)展，給心理測(cè)驗(yàn)帶來了另一個(gè)副產(chǎn)品：嚴(yán)格的標(biāo)準(zhǔn)化程序。三、心理測(cè)驗(yàn)的發(fā)展（金瑜P7-9） 1、高爾頓：英國生物學(xué)家和心理學(xué)家高爾頓是倡導(dǎo)測(cè)驗(yàn)運(yùn)動(dòng)的主要人物。他設(shè)計(jì)了測(cè)量差異的方法，1884年，他在倫敦國際博覽會(huì)中專門設(shè)立了個(gè)“人體測(cè)量學(xué)實(shí)驗(yàn)室”六年中積累了9337人的資料，雖不是正式的心理測(cè)驗(yàn)，但可視為心理測(cè)驗(yàn)的開端。他還是評(píng)定量表和問卷法應(yīng)用的先驅(qū)，他的另一個(gè)重要貢獻(xiàn)是為心理測(cè)驗(yàn)奠定了統(tǒng)計(jì)學(xué)基礎(chǔ)，并第一個(gè)提出了相關(guān)的概念。（皮爾遜相關(guān)） 2、卡特爾：美國心理學(xué)家，從師馮特。1890年，卡特爾在《心理》雜志上發(fā)表“心理測(cè)驗(yàn)與測(cè)量”，這是心理測(cè)驗(yàn)第一次出現(xiàn)于心理學(xué)文獻(xiàn)中。 3、世界上第一個(gè)智力測(cè)驗(yàn)：比內(nèi)與助手西蒙在《心理學(xué)年報(bào)》上發(fā)表了一篇文章，題為：“診斷異常兒童智力的新方法”，是世界上第一個(gè)正式的心理測(cè)驗(yàn)。比內(nèi)－西蒙量表自1905年發(fā)表后，在1908年修訂，1908年量表題目總數(shù)達(dá)到了59個(gè)，所有測(cè)題按年齡分組，組別從3-13歲，測(cè)驗(yàn)的結(jié)果用“智力水平”表示，但其通常翻譯和提法為“智力年齡”。后又經(jīng)1911年修訂一次。 4、心理測(cè)驗(yàn)的蓬勃發(fā)展：（1）操作測(cè)驗(yàn)的發(fā)展：理論上的缺陷和實(shí)際上的需要，所以就有操作測(cè)驗(yàn)的問世和發(fā)展。（2）團(tuán)體智力測(cè)驗(yàn)的發(fā)展：這是心理測(cè)驗(yàn)方式的極大進(jìn)步，也擴(kuò)大了測(cè)驗(yàn)的應(yīng)用范圍。（3）能力傾向測(cè)驗(yàn)的發(fā)展：韋克斯勒所編的學(xué)前兒童、學(xué)齡兒童、成人智力量表。（4）人格測(cè)驗(yàn)的發(fā)展：心理測(cè)驗(yàn)的另一領(lǐng)域是涉及情感或行為等非智力方面的人格評(píng)估，通常包括對(duì)性格、氣質(zhì)、情緒狀態(tài)、人際關(guān)系、動(dòng)機(jī)、興趣和態(tài)度的測(cè)量。（5）現(xiàn)代西方心理測(cè)驗(yàn)的發(fā)展，受到計(jì)算機(jī)的產(chǎn)生和發(fā)展，以及統(tǒng)計(jì)方法的改進(jìn)的極大影響。四、現(xiàn)代心理測(cè)驗(yàn)在中國的發(fā)展：以1949年中華人民共和國成立為分期（一）中華人民共和國成立前心理測(cè)驗(yàn)的發(fā)展 1、1916年，樊炳清先生首先介紹了比內(nèi)－西蒙智力量表； 2、 1920年，廖世承和陳鶴琴在南京高等師范學(xué)校開設(shè)心理測(cè)驗(yàn)課，并用心理測(cè)驗(yàn)試測(cè)投考該校的學(xué)生，這便是中國正式開始的科學(xué)心理測(cè)驗(yàn)； 3、1921年，他倆正式出版《心理測(cè)驗(yàn)法》一書，成為中國最早的心理測(cè)驗(yàn)專著； 4、1922年，中華教育改進(jìn)社聘請(qǐng)美國教育心理測(cè)驗(yàn)專家麥考爾來華講學(xué)，并主持編制心理測(cè)驗(yàn)事宜； 5、 1924年，陸志韋發(fā)表了《訂正比內(nèi)西蒙智力測(cè)驗(yàn)說明書》，30年代又與吳天敏再次做了修訂； 6、 1931年，由艾偉、陸志韋、陳鶴琴、蕭孝嶸等倡議，組織并成立了中國測(cè)驗(yàn)學(xué)會(huì)； 7、1932年，《測(cè)驗(yàn)》雜志創(chuàng)刊。（二）中華人民共和國成立后心理測(cè)驗(yàn)的發(fā)展 1、 1979年，林傳鼎、張厚粲等以國外資料為參考，編制了少年兒童學(xué)習(xí)能力測(cè)驗(yàn)； 2、 1989年，成立中國心理學(xué)會(huì)心理測(cè)驗(yàn)專業(yè)委員會(huì)，標(biāo)志著中國心理測(cè)驗(yàn)已進(jìn)入了一個(gè)新的高速發(fā)展時(shí)期。第二節(jié) 心理測(cè)驗(yàn)的性質(zhì) 一、測(cè)量的基本問題（一）測(cè)量的定義 1、定義：測(cè)量就是根據(jù)一定的法則，用數(shù)字對(duì)事物加以確定。 a一定的法則：是指測(cè)量行為發(fā)生時(shí)采用的規(guī)則或方法。 b事物：是指我們要測(cè)量的感興趣的事物的屬性或特征。 c數(shù)字：可以表示數(shù)量，也可以不表示數(shù)量。 d通常人們所說的測(cè)量，指的是給事物確定出一種數(shù)量化的價(jià)值。 2、測(cè)量的要素：一是參照點(diǎn)，二是單位 a參照點(diǎn)：一種是絕對(duì)的零點(diǎn)；一種是相對(duì)參照點(diǎn)，是認(rèn)為確定的。最理想的參照點(diǎn)是絕對(duì)零點(diǎn)，心理測(cè)驗(yàn)中所用的參照點(diǎn)都是相對(duì)的，因而測(cè)量的結(jié)果常常不能以“倍數(shù)”的方式解釋。 b理想的單位的條件：有明確的意義和有相等的價(jià)值。 3、測(cè)量的量表：量表就是有參照點(diǎn)和單位的連續(xù)體。斯蒂文斯將量表由低到高依次為： a命名量表：是水平最低的一種測(cè)量量表，用數(shù)字來代替事物或?qū)κ挛镞M(jìn)行分類； b順序量表：不僅表明類別，還能表明不通類別的大小等級(jí)，或具有某種屬性的程度； c等距量表：不僅有大小關(guān)系，而且又有相等的單位，因此可以加減運(yùn)算，但沒有絕對(duì)零點(diǎn)，所以不能做乘除運(yùn)算； d比例量表：是最精確的測(cè)量，既有相等的單位，又有絕對(duì)零點(diǎn)。二、心理測(cè)量的基本概念 1、定義：是根據(jù)一定的法則用數(shù)字對(duì)人的行為加以確定，即依據(jù)一定的心理學(xué)理論，使用一定的操作程序，給人的行為和心理屬性確定出一種數(shù)量化的價(jià)值。 2、特點(diǎn)：（1）心理測(cè)量的間接性（2）心理測(cè)量的相對(duì)性 3、心理測(cè)量的水平心理測(cè)量，不論是對(duì)智力，還是對(duì)能力傾向或人格的測(cè)量，都只具有等級(jí)量表的特征。測(cè)驗(yàn)分?jǐn)?shù)一般只能顯示個(gè)體智力、能力、人格上的等級(jí)位次，而沒有一個(gè)相等的單位，故它不是一個(gè)等距量表。但由于多數(shù)心理特征具有常態(tài)分布的特征，且沒有絕對(duì)零點(diǎn)，所以我們也可以把測(cè)量后直接得到的原始分?jǐn)?shù)轉(zhuǎn)化為常態(tài)分布下的標(biāo)準(zhǔn)分?jǐn)?shù)，把這些量表當(dāng)作等距量表來處理。三、心理測(cè)驗(yàn)的基本問題（一）心理測(cè)驗(yàn)和心理測(cè)量的的聯(lián)系和區(qū)別心理測(cè)驗(yàn)是了解人心理的工具，主要在名詞上使用。而心理測(cè)量則是運(yùn)用測(cè)驗(yàn)為工具，達(dá)到了解人類心理的實(shí)踐活動(dòng)，它主要是在“動(dòng)詞”意義上使用。因此，相對(duì)而言，心理測(cè)量的意義范圍更廣一些。能被應(yīng)用于實(shí)際心理測(cè)量的心理測(cè)驗(yàn)才是真正有效的測(cè)驗(yàn)工具才是真正有效的測(cè)驗(yàn)工具。（二）心理測(cè)驗(yàn)的定義心理測(cè)驗(yàn)就是通過觀察人的少數(shù)有代表性行為，對(duì)于貫穿在人的全部行為活動(dòng)中心理特點(diǎn)作出推論和數(shù)量化分析的一種科學(xué)手段。心理測(cè)驗(yàn)即是依據(jù)一定的心理學(xué)理論，使用一定的操作程序，給人的行為確定出一種數(shù)量化的價(jià)值。（三）心理測(cè)驗(yàn)的要素 1、行為樣本：對(duì)少數(shù)經(jīng)過慎重選擇的樣本進(jìn)行觀察，來間接推知被試的心理特征。 2、標(biāo)準(zhǔn)化：是指測(cè)驗(yàn)編制、實(shí)施、記分以及測(cè)驗(yàn)分?jǐn)?shù)解釋程序的一致性，標(biāo)準(zhǔn)化的量一個(gè)重要步驟是建立有代表性的常模。 3、客觀性：在不受被試主觀判斷支配的范圍內(nèi)，測(cè)驗(yàn)的實(shí)施、評(píng)分、解釋應(yīng)是客觀的，要盡量減少主試和被試的隨意程度?？陀^性另一個(gè)主要方面是測(cè)題或整個(gè)測(cè)驗(yàn)的難度水平的確定必須客觀。神經(jīng)心理測(cè)驗(yàn)客觀性最高，智力測(cè)驗(yàn)較高，人格問卷次之，投射測(cè)驗(yàn)的客觀性較低。（四）心理測(cè)驗(yàn)的性質(zhì) 1、心理測(cè)驗(yàn)的間接性； 2、心理測(cè)驗(yàn)的相對(duì)性； 3、心理測(cè)驗(yàn)的客觀性：心理測(cè)驗(yàn)標(biāo)準(zhǔn)化包括： ①測(cè)驗(yàn)用的項(xiàng)目或作業(yè)、實(shí)測(cè)說明、實(shí)測(cè)者的言語態(tài)度及實(shí)測(cè)時(shí)的物理環(huán)境等，均經(jīng)過標(biāo)準(zhǔn)化。 ②評(píng)分記分的原則和手續(xù)經(jīng)過了標(biāo)準(zhǔn)化，對(duì)反應(yīng)的量化是客觀的。 ③分?jǐn)?shù)轉(zhuǎn)換和解釋經(jīng)過了標(biāo)準(zhǔn)化，對(duì)結(jié)果的推論是客觀的。第三節(jié) 心理測(cè)驗(yàn)的種類一、按測(cè)驗(yàn)功能分類： 1、能力測(cè)驗(yàn)：智力測(cè)驗(yàn)：比內(nèi)－西蒙智力測(cè)驗(yàn)、韋克斯勒兒童和成人智力量表。特殊能力測(cè)驗(yàn)：如音樂、繪畫等 2、成就測(cè)驗(yàn)：用于測(cè)量個(gè)人（團(tuán)體）經(jīng)過某種正式教育或訓(xùn)練之后對(duì)知識(shí)和技能掌握的程度。學(xué)科測(cè)驗(yàn) 3、人格測(cè)驗(yàn)：用于測(cè)量性格、氣質(zhì)、興趣、態(tài)度、品德、情緒、動(dòng)機(jī)、信念、價(jià)值觀等方面的個(gè)性心理特征，即個(gè)性中除能力以外的部分。明尼蘇達(dá)多項(xiàng)人格調(diào)查表（MMPI）、16種人格因素問卷（16PF）、艾森克人格問卷（EPQ）、羅夏墨跡測(cè)驗(yàn)、主題統(tǒng)覺測(cè)驗(yàn)（TAT）。二、按測(cè)驗(yàn)對(duì)象分類 1、個(gè)別測(cè)驗(yàn)：優(yōu)點(diǎn)：主試可以仔細(xì)觀察被試的言語情緒，并有充分的機(jī)會(huì)與被試合作，所以其結(jié)果正確可靠。缺點(diǎn)：時(shí)間不經(jīng)濟(jì)，不能在短時(shí)間呢您收集到大量的資料。 2、團(tuán)體測(cè)驗(yàn)：優(yōu)點(diǎn)：時(shí)間經(jīng)濟(jì)，主試不必接受嚴(yán)格的專業(yè)訓(xùn)練即可擔(dān)任。缺點(diǎn)：主試對(duì)被試的行為不能作切實(shí)的控制，所得結(jié)果不及個(gè)別測(cè)驗(yàn)正確可靠。三、按測(cè)驗(yàn)方式分類： 1、紙筆測(cè)驗(yàn)：言語作為刺激。MMPI、EPQ、16PF及韋克斯勒兒童和成人智力量表中的言語量表部分。優(yōu)點(diǎn)：實(shí)施方便，團(tuán)體測(cè)驗(yàn)多用，有肢體殘疾而無言語困難的病人只能用此。缺點(diǎn)：受被試文化程度的影響。 2、操作測(cè)驗(yàn)：也稱非文字測(cè)驗(yàn)。羅夏墨跡測(cè)驗(yàn)、主題統(tǒng)覺測(cè)驗(yàn)、瑞文測(cè)驗(yàn)及韋克斯勒兒童和成人智力量表中的操作量表部分。優(yōu)點(diǎn)：不受文化因素的限制。 3、口頭測(cè)驗(yàn) 4、電腦測(cè)驗(yàn) 四、按測(cè)驗(yàn)?zāi)康姆诸悾? 1、描述性測(cè)驗(yàn)：目的在于對(duì)個(gè)人或團(tuán)體的能力、性格、興趣、知識(shí)水平等進(jìn)行描述。 2、診斷性測(cè)驗(yàn)：目的在于對(duì)個(gè)人或團(tuán)體的某種行為問題進(jìn)行診斷。 3、預(yù)示性測(cè)驗(yàn)：目的在于通過測(cè)驗(yàn)分?jǐn)?shù)預(yù)示一個(gè)人將來的表現(xiàn)和所能達(dá)到的水平。五、按測(cè)驗(yàn)難度分類 1、速度測(cè)驗(yàn) 2、難度測(cè)驗(yàn) 六、按測(cè)驗(yàn)要求分類 1、最高作為測(cè)驗(yàn) 2、典型作為測(cè)驗(yàn) 七、按測(cè)驗(yàn)性質(zhì)分類 1、構(gòu)造性測(cè)驗(yàn)：在此種測(cè)驗(yàn)中，所呈現(xiàn)的刺激和被試的任務(wù)是明確的。 2、投射性測(cè)驗(yàn)：在此種測(cè)驗(yàn)中，刺激沒有明確意義，問題模糊，對(duì)被試的反應(yīng)也沒有明確規(guī)定。八、按測(cè)驗(yàn)解釋分類 1、常模參照測(cè)驗(yàn) 2、標(biāo)準(zhǔn)參照測(cè)驗(yàn) 九、按測(cè)驗(yàn)應(yīng)用分類 1、教育測(cè)驗(yàn) 2、職業(yè)測(cè)驗(yàn) 3、臨床測(cè)驗(yàn) 第四節(jié) 心理測(cè)驗(yàn)的功能與應(yīng)用一、心理測(cè)驗(yàn)的功能：最基本的功能是測(cè)量個(gè)體差異或行為反應(yīng)。（一）從實(shí)際應(yīng)用角度看： ①人才選拔； ②崗位安置 ③臨床診斷； ④教育評(píng)價(jià)； ⑤心理咨詢和治療（二）從理論研究角度看： ①搜集材料：心理測(cè)驗(yàn)是收集個(gè)體差異資料最快捷的辦法。 ②提出和驗(yàn)證假設(shè) ③實(shí)驗(yàn)分組二、測(cè)驗(yàn)的應(yīng)用（一）錯(cuò)誤的測(cè)驗(yàn)觀 1、測(cè)驗(yàn)萬能論 2、測(cè)驗(yàn)無用論： ①某些人格測(cè)驗(yàn)侵犯了個(gè)人隱私； ②測(cè)驗(yàn)為宿命論和種族歧視提供了心理學(xué)依據(jù)。 3、心理測(cè)驗(yàn)即智力測(cè)驗(yàn) （二）正確的測(cè)驗(yàn)觀 1、重要的心理學(xué)研究方法和決策的輔助工具：心理測(cè)驗(yàn)法的出現(xiàn)是心理科學(xué)發(fā)展史上的一大進(jìn)步，是心理學(xué)研究中不可缺少的研究方法之一。 2、作為研究方法和測(cè)量工具尚不完善：過分夸大心理測(cè)驗(yàn)的科學(xué)性和準(zhǔn)確性是不對(duì)的。 3、科學(xué)地看待心理測(cè)驗(yàn)，防止亂用測(cè)驗(yàn)： ①測(cè)驗(yàn)使用者必須具備一定的資格； ②慎重選擇測(cè)驗(yàn)量表； ③與被試建立良好的協(xié)調(diào)關(guān)系； ④正確解釋測(cè)驗(yàn)結(jié)果； ⑤注意測(cè)驗(yàn)的保密。第二章心理測(cè)驗(yàn)的編制 [教學(xué)目的與要求] （1）掌握心理測(cè)驗(yàn)編制的一般程序（2）心理測(cè)驗(yàn)的難度與區(qū)分度的定義及 [教學(xué)重點(diǎn)與難點(diǎn)]心理測(cè)驗(yàn)的項(xiàng)目分析 [教學(xué)時(shí)數(shù)]4學(xué)時(shí) 第一節(jié) 編制測(cè)驗(yàn)的一般程序一、確定測(cè)驗(yàn)?zāi)康? （一）心理測(cè)驗(yàn)的對(duì)象:首先要明確測(cè)量的對(duì)象，也就是測(cè)驗(yàn)編成后要用于哪些團(tuán)體。 A年齡 B教育水平：在編制兒童測(cè)驗(yàn)時(shí)，要同時(shí)考慮教育水平和年齡的影響。在承認(rèn)測(cè)驗(yàn)中，一般只考慮教育水平的影響。 C文化背景（二）測(cè)驗(yàn)的目標(biāo)：是指編制的測(cè)驗(yàn)是測(cè)什么的，即用來測(cè)量什么樣的心理變量或行為特征。目標(biāo)分析以測(cè)驗(yàn)不同而異，一般分為三種情況： A工作分析：主要任務(wù)是對(duì)所預(yù)測(cè)的行為活動(dòng)作具體分析，我們稱之為任務(wù)分析或工作分析。 B對(duì)特定概念下定義：如果測(cè)驗(yàn)是為了測(cè)量某種特殊的心理品質(zhì)或特點(diǎn)，那么測(cè)驗(yàn)編制者就必須給所要測(cè)量的心理或行為特質(zhì)下定義，然后必須發(fā)現(xiàn)該特質(zhì)所包含的維量將通過什么行為表現(xiàn)出來或怎樣進(jìn)行測(cè)量。 C確定測(cè)驗(yàn)的具體內(nèi)容：如果測(cè)驗(yàn)是描述性的顯示測(cè)驗(yàn)，它的目標(biāo)分析的主要任務(wù)則是確定顯示的內(nèi)容和技能。（三）測(cè)驗(yàn)用途：所編出的測(cè)驗(yàn)是要對(duì)被試做描述，還是做診斷，抑或是選拔和預(yù)示。二、擬定編制計(jì)劃編制計(jì)劃，實(shí)際上是對(duì)測(cè)驗(yàn)的總體設(shè)計(jì)，指出測(cè)驗(yàn)的內(nèi)容結(jié)構(gòu)和項(xiàng)目形式等，以及對(duì)每個(gè)內(nèi)容、目標(biāo)的相對(duì)重視程度。根據(jù)布魯姆最早提出教育目標(biāo)的分類問題。他把學(xué)習(xí)的心理活動(dòng)分成認(rèn)知、精神運(yùn)動(dòng)和情感三個(gè)領(lǐng)域，又把認(rèn)知領(lǐng)域具體分為知識(shí)、理解、應(yīng)用、分析和綜合、評(píng)價(jià)。三、設(shè)計(jì)測(cè)試項(xiàng)目（一）搜集有關(guān)資料 1、資料要豐富 2、資料要有普遍性（二）選擇項(xiàng)目形式 1、測(cè)驗(yàn)的目的和材料性質(zhì) 2、接受測(cè)驗(yàn)的團(tuán)體的特點(diǎn) 3、各種實(shí)際因素：時(shí)間，人數(shù)、經(jīng)費(fèi)等（三）編寫和修訂項(xiàng)目 1、項(xiàng)目的范圍要與測(cè)驗(yàn)計(jì)劃相一致 2、項(xiàng)目的數(shù)量要比最后所需的數(shù)目多一倍至幾倍，以備篩選和編制復(fù)本 3、項(xiàng)目的難度必須符合測(cè)驗(yàn)?zāi)康男枰? 4、項(xiàng)目的說明必須清楚四、項(xiàng)目的試測(cè)和分析（一）試測(cè) 1、預(yù)測(cè)對(duì)象應(yīng)取自將來正式測(cè)驗(yàn)準(zhǔn)備應(yīng)用的群體 2、預(yù)測(cè)的實(shí)施過程與情境應(yīng)力求與將來正式測(cè)試時(shí)的情況相近似 3、預(yù)測(cè)的時(shí)限可稍寬一些，最好使每個(gè)被試都能將項(xiàng)目做完，以搜集較充分的反應(yīng)資料，使統(tǒng)計(jì)分析的結(jié)果更為可靠。 4、在預(yù)測(cè)過程中應(yīng)隨時(shí)記錄被試的反應(yīng)情形，如在不同時(shí)限內(nèi)一般被試所完成的題數(shù)、題意不清之處及其他有關(guān)問題。（二）項(xiàng)目分析包括質(zhì)的分析和量的分析質(zhì)的分析是從內(nèi)容取樣的適當(dāng)性、題目的思想性以及表達(dá)是否清楚等方面加以分析。量的分析是對(duì)預(yù)測(cè)結(jié)果進(jìn)行統(tǒng)計(jì)分析，確定項(xiàng)目的難度、區(qū)分度、備選答案的適宜性等。五、合成測(cè)驗(yàn) 1、項(xiàng)目的選擇：要考慮測(cè)驗(yàn)的目的、性質(zhì)與功能，區(qū)分度，難度 2、項(xiàng)目的編排：由易到難，有并列直進(jìn)式，混合螺旋式 A一般原則：a測(cè)題的難度排列易逐步上升；b盡可能將同類型的測(cè)題組合在一起；c各種類型測(cè)題本身的特點(diǎn)； B常見試題排列方式：a并列直進(jìn)式b混合螺旋式 3、編造復(fù)本測(cè)驗(yàn)的各份復(fù)本必須等值，所謂等值需符合下列幾個(gè)條件：（1）各份測(cè)驗(yàn)測(cè)量的是同一種心理特質(zhì)；（2）各份測(cè)驗(yàn)包含相同的內(nèi)容范圍，但題目不應(yīng)有重復(fù)；（3）各份測(cè)驗(yàn)題型相同，題目數(shù)量相等，并且有大體相同的難度分布。六、測(cè)驗(yàn)使用的標(biāo)準(zhǔn)化 1、施測(cè)過程標(biāo)準(zhǔn)化 2、評(píng)分計(jì)分標(biāo)準(zhǔn)化 3、分?jǐn)?shù)解釋標(biāo)準(zhǔn)化七、搜集信度、效度資料（一）信度指的是測(cè)量的可靠性或一致性。（二）效度指的是測(cè)量的有效性或正確性。 A搜集有關(guān)資料：題目的有關(guān)來源 a已出版的標(biāo)準(zhǔn)測(cè)驗(yàn) b理論和專家的經(jīng)驗(yàn) c臨床觀察和記錄 B命題的原則及編寫要領(lǐng) a命題的原則（理解）： ○1內(nèi)容方面：符合測(cè)驗(yàn)的目的，取樣有代表性，相互獨(dú)立，互不牽掛； ○2文字方面：準(zhǔn)確，簡(jiǎn)明扼要，少使用雙重否定句； ○3理解方面：不要超出受測(cè)團(tuán)體的知識(shí)水平和理解能力，不要有爭(zhēng)議誤解； ○4社會(huì)敏感性方面：應(yīng)盡量避開社會(huì)敏感性問題，如涉及社會(huì)禁忌或個(gè)人隱私的題目不應(yīng)使用。菲利普對(duì)于涉及社會(huì)敏感性問題，怎樣鼓勵(lì)被試作出真實(shí)回答的策略： ◇1命題時(shí)假定被試具有某種行為，使他不得不在確實(shí)沒有該行為時(shí)才否定，可避免否定過多的傾向。 ◇2命題時(shí)假定規(guī)范不一致。 ◇3指出該行為是常見的，雖然是違規(guī)的。 b測(cè)題的編制要領(lǐng)：根據(jù)被試的要求不同分為 ○1提供型：要求被試給出正確答案。 ○2選擇題：要求被試在有限幾個(gè)答案中選擇正確的答案。由題干和選項(xiàng)構(gòu)成。題干：呈現(xiàn)一個(gè)問題的情境，一般由直接問句或不完全的陳述句構(gòu)成。選項(xiàng)：?jiǎn)栴}的多種可能答案，常常是包含一個(gè)正確答案，若干（一般是1～5個(gè)）錯(cuò)誤答案，其中的錯(cuò)誤的答案叫做“誘答”。八、編寫測(cè)驗(yàn)手冊(cè) 1、本測(cè)驗(yàn)的目的和功用 2、測(cè)驗(yàn)的理論背景以及選擇項(xiàng)目的根據(jù) 3、測(cè)驗(yàn)的實(shí)施方法、時(shí)限及注意事項(xiàng) 4、測(cè)驗(yàn)的標(biāo)準(zhǔn)答案和記分方法 5、常模表或其他有助于分?jǐn)?shù)轉(zhuǎn)化與解釋的資料 6、測(cè)驗(yàn)的信度、效度資料，包括信度系數(shù)、效度系數(shù)以及這些數(shù)據(jù)是在什么情境下得到的第二節(jié) 測(cè)驗(yàn)的項(xiàng)目分析一、項(xiàng)目的難度分析（一）定義： 1、難度：是指項(xiàng)目的難易程度。P在能力測(cè)驗(yàn)中通常需要一個(gè)反映難度水平的指標(biāo)，在非能力測(cè)驗(yàn)中，類似的指標(biāo)是“通俗性”，即取自相同總體的樣本中，能在答案方向上回答該題的的人數(shù)。 2、難度的指標(biāo)：以通過率表示難度時(shí)，通過人數(shù)越多，即P值越大，難度就越低；P值越小，難度越高。因?yàn)镻值大小與難度高低成反比，有人將其稱作易度。（二）難度的計(jì)算 1、原始定義法（1）客觀試題（二分法記分）： R：答對(duì)該題的人數(shù)；N：參加測(cè)驗(yàn)的總?cè)藬?shù) 由于選擇題允許猜測(cè)，所以通過率可能因機(jī)遇作用而變大。備選答案的數(shù)目越少，機(jī)遇的作用越大，越不能真正反映測(cè)驗(yàn)的難度。為此，吉爾福特提出了一個(gè)P值校正公式。 CP：校正后的難度值；P：實(shí)際得到的通過率；K：選項(xiàng)數(shù)目例題：假定某題有75％的被試通過，若該題有5個(gè)備選答案，則校正后的通過率為：當(dāng)有4個(gè)備選答案時(shí)，CP=0.67；有3個(gè)，CP＝0.63；有2個(gè)，CP＝0.54） b非二分記分：例題某一數(shù)學(xué)能力測(cè)驗(yàn)題的滿分為20分，全體被試在該題上的平均分?jǐn)?shù)為15分，則該題的難度為： P＝15/20＝0.75 例：一個(gè)題目的難度值為0.75，分別計(jì)算此題有四個(gè)選項(xiàng)、三個(gè)選項(xiàng)、兩個(gè)選項(xiàng)時(shí)大的難度值（2）主觀題的平均數(shù)法 2、極端分組法（1）客觀題的極端分組法根據(jù)測(cè)驗(yàn)分?jǐn)?shù)按高低排序，用兩個(gè)極端組在某項(xiàng)目上的平均通過率表示項(xiàng)目的難度 PH、PL分別為高分組與低分組的通過率。步驟： A、按測(cè)驗(yàn)總分由高到低排序 B、從高分段向下選出全部試卷的27％作為高分組 C、從低分段向上選出全部試卷的27％作為低分組 D、按照上述公式計(jì)算項(xiàng)目難度值例：100人參加某測(cè)驗(yàn)，高分組與低分組各取27人，其中第一題高分組20人答對(duì)，低分組10人答對(duì)。這道題的難度系數(shù)是多少？（2）主觀題的極端分組法步驟： A、按測(cè)驗(yàn)總分由高到低排序 B、從高分段向下選出全部試卷的25％作為高分組 C、從低分段向上選出全部試卷的25％作為低分組 D、按照上述公式計(jì)算項(xiàng)目難度值 XH：高分組所得總分； XL：低分組所得總分；H：該題最高分；L：該題最低分；N：考生總?cè)藬?shù)的25％（三）難度對(duì)測(cè)驗(yàn)的影響 1、難度對(duì)測(cè)驗(yàn)分?jǐn)?shù)分布的影響（1）P值越小 →測(cè)驗(yàn)項(xiàng)目越難→測(cè)驗(yàn)分?jǐn)?shù)集中在低分端→分?jǐn)?shù)分布呈正偏態(tài)分布。（2）P值越大→測(cè)驗(yàn)項(xiàng)目越易→ 測(cè)驗(yàn)分?jǐn)?shù)集中在高分端→分?jǐn)?shù)分布呈負(fù)偏態(tài)分布。即：測(cè)驗(yàn)項(xiàng)目過份容易或過份難，都會(huì)造成測(cè)驗(yàn)分?jǐn)?shù)偏離正態(tài)分布，而使測(cè)驗(yàn)分?jǐn)?shù)的離散程度變小。 2、難度對(duì)測(cè)驗(yàn)鑒別力的影響測(cè)驗(yàn)的主要功效之一就是鑒別考生實(shí)際水平的高低。自欺欺人適量難度可以加大考生得分的差異，從而提高測(cè)驗(yàn)的鑒別力。 P值越接近0.50，試題的鑒別能力就越高；相反，P值越接近1.00或0，試題的鑒別能力就越低。 3、難度與測(cè)驗(yàn)?zāi)康牡年P(guān)系項(xiàng)目難度應(yīng)根據(jù)測(cè)驗(yàn)?zāi)康膩泶_定，不能認(rèn)為測(cè)驗(yàn)項(xiàng)目都必須保持值等于0.50最好。事實(shí)上，一方面，如果每個(gè)項(xiàng)目的難度都等于0.50，測(cè)驗(yàn)項(xiàng)目之間存在高度相關(guān)，會(huì)使測(cè)驗(yàn)分?jǐn)?shù)的分布呈雙峰狀態(tài)，即有5%的人所有題目都答對(duì)，得滿分，另外5%的人全部答錯(cuò)，得0分。為此，難度水平的確定應(yīng)根據(jù)測(cè)驗(yàn)的目的，性質(zhì)及題目的形成。（1）對(duì)于一般的常模、參照測(cè)驗(yàn)而言，其目的在于測(cè)量個(gè)體差異，一般只要求測(cè)驗(yàn)題目的平均難度為0.50，而個(gè)題難度可在0.50+0.20之間。（2）當(dāng)測(cè)驗(yàn)用與選拔或診斷時(shí)，題目的難度值應(yīng)更多地接近錄取率。（3）就選擇題而言，P值應(yīng)大于概率水平。P值若等于概率，說明被試純粹憑猜測(cè)作答；P值若小于概率，說明題目很可能存在問題。（4）整個(gè)測(cè)驗(yàn)的難度水平取決于組成測(cè)驗(yàn)的題目的難度。（四）難度的轉(zhuǎn)換難度指出的僅僅是題目的相對(duì)難度，不能客觀地指出題目難度之間差異大小 P向Z的轉(zhuǎn)換 n假定每個(gè)試題所要測(cè)量地潛在特質(zhì)或能力是呈正態(tài)分布的，可將P值作為正態(tài)曲線下的概率面積，以此轉(zhuǎn)換成Z分?jǐn)?shù) 二、項(xiàng)目的區(qū)分度D （一）區(qū)分度的概念區(qū)分度是測(cè)驗(yàn)對(duì)被試實(shí)際水平的區(qū)分程度。是測(cè)驗(yàn)項(xiàng)目分析的重要內(nèi)容是作為評(píng)價(jià)項(xiàng)目質(zhì)量、篩選項(xiàng)目的主要指標(biāo)與依據(jù) 通常用D表示，取值范圍為＋1.00至－1.00 D越高時(shí)，試題的質(zhì)量越好，D值范圍在-1.00和+1.00之間，值越大，試題的區(qū)分能力越強(qiáng)。當(dāng)D為正值時(shí)，說明試題是積極區(qū)分，即高分組通過率高，低分組通過率低。為D負(fù)值時(shí)，說明試題有消極區(qū)分，高組通過率低，低組通過率高。D為0時(shí)，說明試題無區(qū)分用（二）區(qū)分度對(duì)測(cè)驗(yàn)的影響 1.區(qū)分度與難度的關(guān)系 l試題的區(qū)分度與難度有密切關(guān)系。試題難度過大或過小，其區(qū)分度都較低。當(dāng)難度值為1.00或0時(shí)，高分組和低分組或全部通過得滿分，或全部未通過得0分，這時(shí)區(qū)分度都為0分。這兩種情況，都表示試題沒有鑒別考生水平高低的能力。所以，調(diào)整試題難度是提高試題區(qū)分度的重要方法。右表可說明難度與區(qū)分度的關(guān)系。 A、假如樣本中通過某一項(xiàng)目的人數(shù)比率為1.00或0，說明高分組與低分組在通過率上不存在差異，因此D為0；假如項(xiàng)目的通過率為0.50，則可能是高分組的所有人都通過了，而低分組卻無人通過，這樣D的最大值可能達(dá)到1.00。 B、為了使整個(gè)測(cè)驗(yàn)項(xiàng)目的潛在區(qū)分度最大，似乎應(yīng)該使每個(gè)項(xiàng)目的難度處于0.50水平，但事實(shí)并非如此簡(jiǎn)單。如果每一個(gè)項(xiàng)目的難度均處于0.50，由于項(xiàng)目難度相同，有可能大多趨向于有關(guān)的內(nèi)容或技能，結(jié)果造成項(xiàng)目同質(zhì)性提高。在極端情況下，有可能50％的被試全部通過各項(xiàng)目得滿分，另外50％的被試全部為0分，形成U形分布，這樣反而降低總分的區(qū)分能力。如果測(cè)驗(yàn)的所有項(xiàng)目都是中等難度，只有項(xiàng)目的內(nèi)在相關(guān)為0時(shí)，整個(gè)測(cè)驗(yàn)才能產(chǎn)生常態(tài)分布?？紤]到一般測(cè)驗(yàn)項(xiàng)目之間具有某種程度的相關(guān)難度的分布要廣一些，梯度多一些，是合乎需要的。 2.區(qū)分度與信度的關(guān)系一個(gè)良好的測(cè)驗(yàn)，信度必須要高。測(cè)驗(yàn)的信度與項(xiàng)目的區(qū)分度有著密切的關(guān)系，事實(shí)上，由試題的區(qū)分度還可以估計(jì)測(cè)驗(yàn)的信度。整個(gè)測(cè)驗(yàn)中各試題的區(qū)分度值的平均數(shù)越高，測(cè)驗(yàn)的信度就越高。值的平均數(shù)與信度的關(guān)系如右表。（三）區(qū)分度計(jì)算方法 1、極端分組法（1）客觀性試題區(qū)分度的計(jì)算公式： D＝PH－PL 按測(cè)驗(yàn)總分從高到低排序確定測(cè)驗(yàn)總分最高的27％的被試作為高分組，最低的27％的被試為低分組分別求出這兩組被試通過試題的百分比（2）主觀性試題區(qū)分度的計(jì)算公式：說明： XH：高分組所得總分；XL：低分組所得總分；H：該題最高分；L：該題最低分；N：考生總?cè)藬?shù)的25％步驟：按測(cè)驗(yàn)總分由高到低排序；分別確定測(cè)驗(yàn)總分的25％、25％作為高低分組；列出試題分析表；將數(shù)據(jù)帶入以上公式加以計(jì)算 2、相關(guān)法考慮中間數(shù)據(jù) 以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)（效標(biāo)分?jǐn)?shù)不易得到時(shí)，以測(cè)驗(yàn)總分代替）的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo) 相關(guān)越高，區(qū)分能力越好具體方法： ①點(diǎn)二列相關(guān)：適用于一類變量為二分稱名變量，另一類變量為連續(xù)變量的成對(duì)變量的相關(guān)計(jì)算。 ②二列相關(guān)：適用于兩個(gè)連續(xù)變量，但其中一個(gè)變量被人為分成兩類。 ③ 相關(guān)：適用于兩個(gè)變量均為二分稱名變量。積差相關(guān)法，點(diǎn)二列相關(guān)，二列相關(guān)，Φ相關(guān) （一）（二）（三）提高區(qū)分度的方法 1、使試題的難度適中，使整個(gè)考試難度適中 2、著重考察復(fù)雜的學(xué)習(xí)結(jié)果（四）區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn) 以上標(biāo)準(zhǔn)僅作參考，不是絕對(duì)的。事實(shí)上，項(xiàng)目區(qū)分度的要求應(yīng)根據(jù)測(cè)驗(yàn)?zāi)康亩?，若測(cè)驗(yàn)?zāi)康脑谟谶x人，主要評(píng)判被試的個(gè)別差異，那么區(qū)分度要求高些；若測(cè)驗(yàn)只是考察被試對(duì)所學(xué)知識(shí)的掌握情況，可不過多考慮區(qū)分度。三、項(xiàng)目分析的特殊問題（一）選擇題反應(yīng)模式的分析對(duì)于選擇題，除了分析其難度的區(qū)分度外，還要分析被試對(duì)每個(gè)備選答案的反應(yīng)情況。一般要做以下分析： 1、如果正確的備選答案被所有被試所選擇，則說明該題目太易或者題目中可能提供了某種暗示； 2、如果某個(gè)錯(cuò)誤答案沒有一個(gè)被試選擇，說明該選項(xiàng)不具迷惑性，錯(cuò)得過于明顯，一般說來，除非有2%以上的人選擇，否則這個(gè)備選答案就應(yīng)該修改。 3、如果所有被試的選擇了同一個(gè)錯(cuò)誤答案，可能是編制測(cè)驗(yàn)時(shí)把答案定錯(cuò)了，也可能是教學(xué)中發(fā)生了錯(cuò)誤。 4、如果所有被試的選擇集中在兩個(gè)答案上，二者選擇率相近，，說明該題可能有兩個(gè)正確答案或另一個(gè)答案也有一定道理。 5、如果高分組對(duì)正確答案的選擇與低分組相等或低于，說明所考察的東西與水平無關(guān)。 6、如果一個(gè)題目被試未答人數(shù)過多或選擇各個(gè)備選答案人數(shù)相等則說明題目過難或題意不清。（二）標(biāo)準(zhǔn)參照測(cè)驗(yàn)的項(xiàng)目分析標(biāo)準(zhǔn)參照測(cè)驗(yàn)主要用于判斷被試是否掌握了某些知識(shí)技能，是達(dá)到了一個(gè)事先確定的標(biāo)準(zhǔn)，測(cè)驗(yàn)結(jié)果只與既定標(biāo)準(zhǔn)比較而不在被試之間作比較。因此測(cè)驗(yàn)分?jǐn)?shù)的變異性不是標(biāo)準(zhǔn)參照測(cè)驗(yàn)的必要條件。所以，常模參照測(cè)驗(yàn)的項(xiàng)目分析方法不完全適用于標(biāo)準(zhǔn)參照測(cè)驗(yàn)。 1、難度分析標(biāo)準(zhǔn)參照測(cè)驗(yàn)可以采用常模參照測(cè)驗(yàn)的方法計(jì)算難度，但是在篩選項(xiàng)目時(shí)，對(duì)難度水平的要求與常模參照測(cè)驗(yàn)不同。由于標(biāo)準(zhǔn)參照測(cè)驗(yàn)的目的是為了考察被試對(duì)某方面的知識(shí)技能的掌握情況，因此，只要能反映教育目標(biāo)或教育者認(rèn)為重要的內(nèi)容，無論其難度為多少，都可以編入測(cè)驗(yàn)。 2、區(qū)分度分析標(biāo)準(zhǔn)參照測(cè)驗(yàn)一般分?jǐn)?shù)變異較小，不適合用相關(guān)法來計(jì)算區(qū)分度，但是可以采用鑒別指數(shù)的方法計(jì)算，即比較兩組的通過率。方法一根據(jù)測(cè)驗(yàn)分?jǐn)?shù)將被試分為達(dá)標(biāo)組與未達(dá)標(biāo)組，然后分別計(jì)算它們?cè)谀骋豁?xiàng)目上的通過率，兩組考生通過率之差，便是該項(xiàng)目的區(qū)分度，其公式為： D=ps-pn 式中ps、pn為達(dá)標(biāo)組與未達(dá)標(biāo)組在某一項(xiàng)目上的通過率。這種方法主要的問題是分組標(biāo)準(zhǔn)不同，得到的區(qū)分度值不同。方法二用同一測(cè)驗(yàn)對(duì)同一組被試在教學(xué)前后各施測(cè)一次，分別統(tǒng)計(jì)各項(xiàng)目前后測(cè)的通過率，二者之差便是項(xiàng)目的區(qū)分度。其公式為： D=ppost-ppre D值越高，說明項(xiàng)目對(duì)教學(xué)效果越敏感，所以有人將其稱做教學(xué)效果敏感指數(shù)，其公式也可寫為其中S 為敏感指數(shù)，RA、RB分別為前測(cè)、后測(cè)通過人數(shù)，N為總?cè)藬?shù)。此種方法的主要缺點(diǎn)是：（1）同一測(cè)驗(yàn)施測(cè)兩次可能會(huì)產(chǎn)生練習(xí)效應(yīng)，成績(jī)的提高究竟是由教學(xué)引起的，還是由練習(xí)引起的難以分辨；（2）只有等兩次施測(cè)后才能進(jìn)行項(xiàng)目分析；（3）當(dāng)D值低時(shí)，難于做出明確的解釋，無法確定是由試題不良還是由教學(xué)不當(dāng)所致。式中ppost、ppre分別為項(xiàng)目在后測(cè)和前測(cè)中的通過率。方法三取兩組條件相近的考生，一組接受過同測(cè)驗(yàn)有關(guān)的學(xué)科教學(xué)，另一組沒有接受過此種教學(xué)。施測(cè)同一測(cè)驗(yàn)后，分別統(tǒng)計(jì)每組考生答對(duì)某題的人數(shù)，兩組考生通過率之差便是該題的區(qū)分度。公式為D=pi-pu 式中pi、pu分別為教學(xué)組和未經(jīng)教學(xué)組對(duì)某題的通過率。此方法的缺點(diǎn)是，兩組考生除在教學(xué)方面不同外在其他有關(guān)方面必須同質(zhì)，而這一點(diǎn)是難以做到的。項(xiàng)目特征曲線：是項(xiàng)目特征函數(shù)或項(xiàng)目反應(yīng)函數(shù)的圖解形式，它反映了被試對(duì)某一測(cè)驗(yàn)項(xiàng)目的正確反應(yīng)概率與該項(xiàng)目所對(duì)應(yīng)的能力或特質(zhì)的水平之間的一種函數(shù)關(guān)系。這一方法不僅適用于項(xiàng)目分析，而且也適用于某些測(cè)驗(yàn)量表的編制。 A項(xiàng)目特征曲線可圖解測(cè)驗(yàn)的鑒別力，項(xiàng)目鑒別力的高低主要在于其曲線的傾斜度，曲線坡度越陡，鑒別能力越好，預(yù)測(cè)的誤差越小。 B項(xiàng)目特征曲線可以圖解項(xiàng)目難度。 C項(xiàng)目特征曲線還可以圖解選擇題的誘答反應(yīng)。第三章測(cè)量的誤差及其檢驗(yàn) [教學(xué)目的與要求] （1）了解測(cè)量誤差的種類與來源（2）掌握信度的定義、意義及其估計(jì)方法（3）掌握效度的定義、意義及其估計(jì)方法 [教學(xué)重點(diǎn)與難點(diǎn)]信度與效度的估計(jì) [教學(xué)時(shí)數(shù)]4學(xué)時(shí) 第一節(jié) 測(cè)量的誤差一、誤差的種類（一）誤差的定義誤差是在測(cè)量中與目的無關(guān)的因素所產(chǎn)生的不準(zhǔn)確的或不一致的結(jié)果。（二）誤差的種類 1、隨機(jī)誤差：與測(cè)量目的無關(guān)的偶然因素引起的變化規(guī)律的誤差，使得多次的測(cè)量結(jié)果不一致，這種誤差的大小和方向是隨機(jī)的。既影響測(cè)量的準(zhǔn)確性又影響一致性。 2、系統(tǒng)誤差：與測(cè)量目的無關(guān)的因素引起的恒定的有規(guī)律的誤差，它穩(wěn)定地存在于每一次測(cè)量中。只影響測(cè)量的準(zhǔn)確性。二、誤差的來源（一）測(cè)驗(yàn)自身引起的誤差主要來源于測(cè)驗(yàn)的編制過程，其中項(xiàng)目取樣影響最大。（二）施測(cè)過程引起的誤差 1、測(cè)試環(huán)境 2、測(cè)試時(shí)間 3、主試因素 4、意外干擾 5、評(píng)分記分（三）被試引起的誤差 1、應(yīng)試動(dòng)機(jī) 2、測(cè)驗(yàn)焦慮 3、測(cè)驗(yàn)經(jīng)驗(yàn) 4、練習(xí)效應(yīng) 5、反應(yīng)傾向 6、生理變因三、真分?jǐn)?shù) （一）含義真分?jǐn)?shù)是指測(cè)量沒有誤差時(shí)所得到的真值。其操作定義是無數(shù)次測(cè)量結(jié)果的平均值。（二）數(shù)學(xué)模型及其假設(shè) 1、CTT模型——經(jīng)典測(cè)驗(yàn)理論假定，觀察分?jǐn)?shù)（X）與真分?jǐn)?shù)（T）之間是一種線性關(guān)系，并只相差下個(gè)隨機(jī)誤差（E），即X=T+E這里的測(cè)量誤差E指的是引起測(cè)量不一致的變因所產(chǎn)生的效應(yīng)，即指隨機(jī)誤差，不包括系統(tǒng)誤差。分析假設(shè)公理：（1）若一具人的某種心理特質(zhì)可以用平行的測(cè)驗(yàn)分?jǐn)?shù)反復(fù)測(cè)量足夠多次，則其觀察分?jǐn)?shù)的平均值會(huì)接近于真分?jǐn)?shù)。即E（X）=T或E（E）=1 0 （2）真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零。即P（T，E）=0 （3）各平行測(cè)驗(yàn)上的誤差分?jǐn)?shù)之間的相關(guān)為零。 2、引申：（1）在一次測(cè)量中，被試觀察分?jǐn)?shù)的方差等于其真分?jǐn)?shù)方差與誤差分?jǐn)?shù)方差之和。S2X=ST2+S2E （2）真分?jǐn)?shù)可以分成兩部分：與測(cè)量目的有關(guān)變異S2V和與測(cè)量目的無關(guān)的變異S2I，即：ST2=S2V+S2I （3）一次測(cè)驗(yàn)中，一個(gè)團(tuán)體的實(shí)測(cè)分?jǐn)?shù)之間的變異性是由與測(cè)量目的有關(guān)的變異數(shù)SV2、穩(wěn)定的但出自無關(guān)來源的變異數(shù)SI2和測(cè)量誤差的變異數(shù)SE2所決定的。即：S2X=SV2+SI2+SE2 第二節(jié) 信度（reliability）一、什么是信度定義：指的是測(cè)量結(jié)果的穩(wěn)定性程度（或叫可靠性）。也指同一被試在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)（或用另一套相等的測(cè)驗(yàn)）重復(fù)測(cè)量，所得結(jié)果的一致程度。 1、理論定義：傳統(tǒng)的信度理論認(rèn)為，每一個(gè)測(cè)驗(yàn)的實(shí)得分?jǐn)?shù)（X）總是由真實(shí)分?jǐn)?shù)（T）和誤差（E），兩個(gè)部份構(gòu)成的，公式為： X=T+E 討論一組測(cè)驗(yàn)分?jǐn)?shù)的特性時(shí)，可用方差導(dǎo)標(biāo)具體分?jǐn)?shù)，公式：（測(cè)驗(yàn)實(shí)得分?jǐn)?shù)的方差）＝（測(cè)驗(yàn)真分?jǐn)?shù)的方差）＋（測(cè)驗(yàn)誤差的方差） 2、操作定義：定義1：一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)變異數(shù)（方差）與總變異數(shù)（總方差、實(shí)得分?jǐn)?shù)的方差）的比率，或者是真實(shí)分?jǐn)?shù)方差占總方差的的百分比。計(jì)算公式： rxx=ST2/SX2 定義2：信度乃是一個(gè)被試團(tuán)體的真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平方。即 rxx=ptx2 定義3：信度乃是一個(gè)測(cè)驗(yàn)X（A卷）與它的任意一個(gè)“平行測(cè)驗(yàn)”X/（B卷）的相關(guān)系數(shù)。即rxx=pXX`2 二、信度的指標(biāo) （一）信度系數(shù)：大部分情況下，信度是信度系數(shù)為指標(biāo)，它是一種相關(guān)系數(shù)。理論上說就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)的方差的比值，公式是：rxx=ptx2 （二）信度指數(shù)：是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)的標(biāo)準(zhǔn)差的比值，公式是：信度指數(shù)的平方就是信度系數(shù) rxx=ST2/SX2 （三）標(biāo)準(zhǔn)誤：指出個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的變異量。信度系數(shù)表示一組測(cè)量的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度，標(biāo)準(zhǔn)誤表示個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的變異量。用一組被試兩次測(cè)量結(jié)果來代替同一個(gè)人反復(fù)實(shí)測(cè)，有了信度的另一個(gè)指標(biāo)：測(cè)量標(biāo)準(zhǔn)誤。測(cè)量的標(biāo)準(zhǔn)誤與信度之間呈反比關(guān)系：標(biāo)準(zhǔn)誤越小，信度越高；標(biāo)準(zhǔn)誤越大，信度越低。三、信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋（一）解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān) （二）比較信度可以接受的水平（三）解釋個(gè)人分?jǐn)?shù)的意義：（四）比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異：四、信度的類型及估計(jì)方法（一）重測(cè)信度（再測(cè)信度）： 1、含義與計(jì)算又稱穩(wěn)定性系數(shù)。他的計(jì)算方法是采用重測(cè)法，即使用同一測(cè)驗(yàn)，在同樣條件下對(duì)同一組被試前后施測(cè)兩次測(cè)驗(yàn)，求兩次得分間的相關(guān)系數(shù)。 2、使用的前提條件（1）所測(cè)量的心理特性必須是穩(wěn)定的。（2）遺忘和練習(xí)的效果基本上相互抵消。（3）在時(shí)間間隔中沒有學(xué)習(xí)另外的與測(cè)驗(yàn)有關(guān)的東西，或者說每人學(xué)習(xí)其他東西的程度都一樣。 3、優(yōu)缺點(diǎn)：優(yōu)點(diǎn)：（1）它最符合重復(fù)測(cè)驗(yàn)的涵義，是重復(fù)測(cè)驗(yàn)最簡(jiǎn)單最明確的方式（2）首測(cè)和再測(cè)只需要一套測(cè)驗(yàn)題目，省時(shí)、省力（3）同一套題目無論施測(cè)幾次，所測(cè)的屬性是完全相同的。缺點(diǎn)：（1）同一組被試對(duì)同一個(gè)測(cè)驗(yàn)先后兩次作答相互之間是不獨(dú)立的。（2）如果兩次施測(cè)時(shí)間間隔較長(zhǎng)，在此期間被試的身心發(fā)展，新知識(shí)的獲得，都會(huì)使兩次測(cè)驗(yàn)結(jié)果不相同。（3）同一個(gè)被試對(duì)現(xiàn)一個(gè)測(cè)驗(yàn)先后兩次作答，對(duì)測(cè)驗(yàn)的興趣不同，影響測(cè)驗(yàn)結(jié)果。（4）兩次施測(cè)的環(huán)境不同，也是產(chǎn)生測(cè)量誤差的因素。（二）復(fù)本信度（Alternate-form reliability） 1、含義與計(jì)算：含義：又稱等值性系數(shù)。它是以兩個(gè)平行或復(fù)本的測(cè)驗(yàn)（等值但題目不同）來測(cè)量同一群體，然后求得被試在兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)，這個(gè)相關(guān)系數(shù)就代表了復(fù)本信度的高低。復(fù)本信度反映的是測(cè)驗(yàn)在內(nèi)容上的等值性，故稱等值性系數(shù)。復(fù)本信度的高低關(guān)鍵取決于復(fù)本測(cè)驗(yàn)的選擇。 2、使用的前提條件：（1）要兩份或兩份以上真正平行的測(cè)驗(yàn) （2）被試要有條件接受兩個(gè)測(cè)驗(yàn)。主要取決于時(shí)間、經(jīng)費(fèi)等幾方面。 3、優(yōu)缺點(diǎn)：優(yōu)點(diǎn)：（1）一個(gè)測(cè)驗(yàn)的復(fù)本使得測(cè)驗(yàn)數(shù)目的增加，對(duì)于所欲測(cè)量的屬性相聯(lián)系的行為總體代表性強(qiáng)，因此，一個(gè)測(cè)驗(yàn)的兩個(gè)復(fù)本在兩三天至一周對(duì)同一組被試施測(cè)時(shí)，獲得的復(fù)本信度系數(shù)是相當(dāng)準(zhǔn)確的。（2）測(cè)驗(yàn)的兩個(gè)復(fù)本，如果在不同時(shí)間使用，其信度不僅可以反映在不同時(shí)間的穩(wěn)定性，而且還可以反映對(duì)于不同測(cè)題的一致性。（3）兩個(gè)復(fù)本在同時(shí)使用時(shí)，可以避免再測(cè)驗(yàn)信度的缺點(diǎn)。缺點(diǎn)：（1）編制兩個(gè)完全相等的測(cè)驗(yàn)是很困難的，（2）復(fù)本法只能減少而不能完全排除練習(xí)和記憶的影響。（3）被試同時(shí)接受性質(zhì)相似的兩個(gè)測(cè)驗(yàn)可能減少完成測(cè)驗(yàn)的積極性。 4、適用范圍（1）如果兩個(gè)復(fù)本的施測(cè)相隔一段時(shí)間，則稱穩(wěn)定與等值系數(shù)。穩(wěn)定與等值系數(shù)既考慮了測(cè)驗(yàn)在時(shí)間上的穩(wěn)定性，也考慮了不同題目樣本反應(yīng)的一致性，因而是更為嚴(yán)格的信度考察方法，也是應(yīng)用較為廣泛的方法。（2）在實(shí)際應(yīng)用時(shí)，為了抵消施測(cè)順序的效應(yīng)，應(yīng)該有半數(shù)的被試先作A本再作B本，另一半被試先作B本再作A本。（3）復(fù)本測(cè)驗(yàn)不僅適用于難度測(cè)驗(yàn)，也是估計(jì)速度測(cè)驗(yàn)信度的最好方法。（三）分半信度（split-half reliability） 1、含義與計(jì)算指采用分半法估計(jì)所得的信度系數(shù)。這種方法估計(jì)信度系數(shù)只需一種測(cè)驗(yàn)形式，實(shí)施一次測(cè)驗(yàn)。通常是在測(cè)驗(yàn)實(shí)施后將測(cè)驗(yàn)按奇、偶數(shù)分為等值的兩半，并分別計(jì)算每位被試在兩半測(cè)驗(yàn)上的得分，求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。常見的是將測(cè)題按其序列號(hào)的奇偶分，這種分法的前提是：測(cè)題并非隨機(jī)排列，而是按某種順序（如難度）排列；如果隨機(jī)排列的題目，則必須是所有題目平等的（要么難度相等，要么性質(zhì)一樣）；如果測(cè)驗(yàn)有多個(gè)分量表，應(yīng)該在分量表內(nèi)部排好順序，再把各分量表分兩半組合起來求相關(guān)。 2、計(jì)算（1）兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)相等（方差齊性）先計(jì)算兩半測(cè)驗(yàn)的積差相關(guān)系數(shù)，再進(jìn)行校正。常用的修正公式是：斯皮爾曼－布朗公式：（2）兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)不等（方差不齊），可采用：弗朗那根公式或盧倫公式中的任一一個(gè)。例題：對(duì)初一年級(jí)學(xué)生進(jìn)行地理成績(jī)測(cè)驗(yàn)，每答對(duì)1題得1分，答錯(cuò)1題得0分，測(cè)題從易到難排列如表所示，試估計(jì)該測(cè)驗(yàn)的分半信度。學(xué)生 1 2 3 4 5 6 7 8 9 10 奇數(shù)題得分X 1 0 2 2 1 3 2 2 1 3 偶數(shù)題得分Y 0 1 0 1 1 2 3 2 2 3 總分 1 1 2 3 2 5 5 4 3 6 3、使用條件及范圍分半信度通常是在只能施測(cè)一次或沒有復(fù)本的情況下使用。而且，在使用斯皮爾-布朗公式時(shí)要求全體被試在兩半測(cè)驗(yàn)上得分的變異數(shù)要相等。當(dāng)一個(gè)測(cè)驗(yàn)無法分成對(duì)等的兩半時(shí)，分半信度不宜使用。（四）同質(zhì)性信度（homogeneity reliability） 1、含義：指測(cè)驗(yàn)內(nèi)部所有題目間的一致性。題目的一致性有兩層含義：其一是指所有題目都測(cè)的是同一種心理特質(zhì)；其二是指所有題目之間都具有較高的正相關(guān)?？傊|(zhì)性信度就是一個(gè)測(cè)驗(yàn)所測(cè)內(nèi)容或特質(zhì)的相同程度。 2、測(cè)量同質(zhì)性的基本公式： 3、庫德-理查遜公式：適用于客觀性試題（0、1記分） 3、克倫巴赫系數(shù)（多重記分測(cè)驗(yàn)）例題：某態(tài)度量表共7題，100個(gè)被試在各題上的得分方差分別是0.81,0.82,0.79,0.83,0.85,0.76,0.77,測(cè)驗(yàn)總分的方差為14.00，則此測(cè)量的的信度為0.70. 4、注意：當(dāng)各個(gè)測(cè)題的得分有較高的正相關(guān)時(shí)，不論題目的內(nèi)容和形式如何，測(cè)驗(yàn)即為同質(zhì)的；若所有題目看起來好像測(cè)量的是同一特質(zhì)，但相關(guān)很低或?yàn)樨?fù)相關(guān)時(shí)，測(cè)驗(yàn)即為異質(zhì)的。對(duì)于一些復(fù)雜的、異質(zhì)的心理學(xué)變量，采用單一的同質(zhì)性測(cè)驗(yàn)是不行的，因而常常采用若干相對(duì)異質(zhì)的分測(cè)驗(yàn)，并使每個(gè)分測(cè)驗(yàn)內(nèi)容具有同質(zhì)性，這樣每個(gè)分測(cè)驗(yàn)就能用來預(yù)測(cè)異質(zhì)效標(biāo)的某一方面。（五）評(píng)分者信度（scorer reliability） 1、含義與計(jì)算：指的是多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致性程度。是用于測(cè)量不同評(píng)分者之間所產(chǎn)生的誤差。式中W為和諧系數(shù)，K為評(píng)分者的人數(shù)，N為被評(píng)對(duì)象數(shù)，RI為每一對(duì)象被評(píng)的等級(jí)總和。例子：假設(shè)有三位專家給六篇論文評(píng)等級(jí)，結(jié)果如表所示，試計(jì)算此次評(píng)分者的評(píng)分者信度。專家 1 2 3 4 5 6 1 2 4 1 5 6 3 2 3 4 1 5 6 2 3 3 5 1 4 6 2 Ri 8 13 3 14 18 7 2、注意的問題：為了衡量評(píng)分者之間的信度高低，可隨機(jī)抽取若干份測(cè)驗(yàn)卷，由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分，然后再根據(jù)每份測(cè)驗(yàn)卷的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān)，即得評(píng)分者信度。一般要求在成對(duì)的受過訓(xùn)練的評(píng)分者之間平均一致性達(dá)0.90以上，才認(rèn)為評(píng)分是客觀的。當(dāng)多個(gè)評(píng)分者評(píng)定多個(gè)對(duì)象，并以等級(jí)法記分時(shí)，可采用肯德爾和諧系數(shù)作為評(píng)分者信度的估計(jì)。五、標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度估計(jì) 1、對(duì)相關(guān)法信度系數(shù)進(jìn)行校正為了對(duì)標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度做出較為準(zhǔn)確的估計(jì)，利文斯頓提出了對(duì)相關(guān)法信度系數(shù)的校正公式： 2、用決策的一致性作為信度指標(biāo) 林德曼與梅倫達(dá)的一致性公式： C為一致性，n為在兩次施測(cè)中均未達(dá)到標(biāo)的人數(shù)，b為在兩次施測(cè)中均已達(dá)標(biāo)的人數(shù)，f為只在第一次施測(cè)中達(dá)標(biāo)的人數(shù)，s為只在第二次施測(cè)中達(dá)標(biāo)的人數(shù)，v為f或s中較小的值。六、各種信度系數(shù)相應(yīng)誤差方差的來源信度系數(shù)類型誤差方差來源重測(cè)信度時(shí)間取樣復(fù)本信度（連續(xù)施測(cè)）內(nèi)容取樣復(fù)本信度（間隔施測(cè)）時(shí)間和內(nèi)容取樣分半信度內(nèi)容取樣同質(zhì)性信度內(nèi)容的異質(zhì)性評(píng)分者信度評(píng)分者之間的差異七、影響信度的因素（一）樣本的特征：信度常用信度系數(shù)來表示，信度系數(shù)就是相關(guān)系數(shù)，相關(guān)系數(shù)受樣本團(tuán)體得分分布、樣本是否異質(zhì)及樣本團(tuán)體平均能力水平的影響。 1、樣本團(tuán)體分?jǐn)?shù)分布的影響：當(dāng)分布范圍增大時(shí)，其信度估計(jì)就較高；當(dāng)分布范圍減小時(shí)，相關(guān)系數(shù)隨之下降，信度值則較低。 2、樣本團(tuán)體異質(zhì)性的影響：若獲得信度的取樣團(tuán)體較為異質(zhì)的話，往往會(huì)高估測(cè)驗(yàn)的信度，相反則會(huì)低估測(cè)驗(yàn)的信度。 3、樣本團(tuán)體平均能力水平的影響：對(duì)于不同水平的團(tuán)體，題目具有不同的難度，每個(gè)題目在難度上的微小差異累計(jì)起來便會(huì)影響信度。（二）測(cè)驗(yàn)的長(zhǎng)度： 1、測(cè)驗(yàn)越長(zhǎng)，測(cè)驗(yàn)的測(cè)題取樣或內(nèi)容取樣越有代表性。 2、測(cè)驗(yàn)越長(zhǎng) ，被試的猜測(cè)因素影響就越小。 3、測(cè)驗(yàn)的項(xiàng)目越多，在每個(gè)項(xiàng)目上的隨機(jī)誤差就可以相互抵消。（三）測(cè)驗(yàn)的難度：難度對(duì)信度的影響只存在于某些測(cè)驗(yàn)中，如智力測(cè)驗(yàn)、成就測(cè)驗(yàn)、能力傾向測(cè)驗(yàn)等。如果一個(gè)測(cè)驗(yàn)對(duì)某團(tuán)體而言太容易，會(huì)使所得分?jǐn)?shù)都集中在高分端；當(dāng)題目太困難時(shí)，得分就會(huì)集中在低分端。兩種情況均會(huì)使信度樣本的分?jǐn)?shù)范圍變窄，從而使測(cè)驗(yàn)變得不夠可靠。從理論上說，只有難度水平為50％時(shí)，才能使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大，求得的信度也最高。（四）測(cè)驗(yàn)的時(shí)間間隔：以再測(cè)法或復(fù)本法求信度，兩次測(cè)驗(yàn)相隔時(shí)間越短，其信度系數(shù)越大；間隔時(shí)間越久，其它變因介入的可能性越大，受外界的影響越大，信度系數(shù)便越低。第三節(jié) 測(cè)驗(yàn)的效度在測(cè)量活動(dòng)中，測(cè)量者對(duì)所使用的測(cè)量工具非常信任，他會(huì)采取復(fù)測(cè)行為以判斷測(cè)量有無誤差；如果測(cè)量者對(duì)所使用的測(cè)量工具發(fā)生懷疑，那他往往會(huì)去找一公認(rèn)非常準(zhǔn)確的測(cè)量工具對(duì)先前的測(cè)值進(jìn)行檢驗(yàn)。這種在原測(cè)量工具之外尋求新的證據(jù)來肯定或否定某一測(cè)量工具準(zhǔn)確性的做法就是在研究測(cè)量的效度問題。心理測(cè)量是一種間接測(cè)量，心理測(cè)量更重視測(cè)量的效度研究。一、效度（validity）（一）定義：效度是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度，或者簡(jiǎn)單地說是指一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性?；蚴侵敢粋€(gè)測(cè)驗(yàn)或量表實(shí)際能測(cè)出其所要測(cè)的心理特質(zhì)的程度。 1、關(guān)于效度的概念，我們要特別注意以下幾點(diǎn)：（1）效度是一個(gè)相對(duì)的概念。這種相對(duì)性表現(xiàn)在兩個(gè)方面： ①效度是相對(duì)于一定的測(cè)量目的而言的。 ②心理特質(zhì)是較隱蔽的特性，只能通過他的行為表現(xiàn)來進(jìn)行推測(cè)，因此，心理測(cè)量不可能達(dá)到百分之百的準(zhǔn)確，而只能達(dá)到某種程度的準(zhǔn)確。（2）效度是測(cè)量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。任一誤差的存在，測(cè)量的效度都會(huì)受到影響（3）判斷一個(gè)測(cè)量是否有效要從多方面收集證據(jù) 2、在測(cè)驗(yàn)理論中，效度被定義為在一組測(cè)量中，與測(cè)量目標(biāo)有關(guān)的真實(shí)方差（或稱有效方差，由所要測(cè)量的變因引起的有效變異）與總方差(實(shí)得變異數(shù))的比率，即 3、一組測(cè)驗(yàn)分?jǐn)?shù)的總方差等于真實(shí)方差與誤差方差之和，而真實(shí)方差又可分為兩部分，即有關(guān)的方差和無關(guān)的但穩(wěn)定的方差，后者也就是所謂系統(tǒng)誤差帶來的方差 S2X=SV2+SI2+SE2 由于有效方差是一個(gè)理論值，無法測(cè)量，所以效度和信度一樣是一個(gè)理論上的概念。二、效度和信度的關(guān)系（一）信度是效度的必要而非充分條件。（二）效度是受信度制約的：信度系數(shù)的平方根是效度系數(shù)的最高限度，可見，一個(gè)測(cè)驗(yàn)的效度總是受它的信度所制約。三、效度的類型及評(píng)估方法（一）內(nèi)容效度(Content Validity) 1、定義：指的是項(xiàng)目對(duì)欲測(cè)的內(nèi)容或行為范圍的取樣的適當(dāng)程度。也即測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性，從而確定測(cè)驗(yàn)是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。一個(gè)測(cè)驗(yàn)要具備較好的內(nèi)容效度必須滿足兩個(gè)條件：（1）要確定好內(nèi)容范圍，并使測(cè)驗(yàn)的全部項(xiàng)目均在此范圍內(nèi)。所謂內(nèi)容范圍可以是具體知識(shí)或技能，也可以是復(fù)雜的行為。要對(duì)所測(cè)量的心理特性有個(gè)明確的概念，并劃定出哪些行為與這心理特性有關(guān)。（2）測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。 2、內(nèi)容效度的評(píng)估方法：（1）專家判斷法：（2）統(tǒng)計(jì)分析法（3）經(jīng)驗(yàn)推測(cè)法： 3、內(nèi)容效度的應(yīng)用（1）是編制任何測(cè)驗(yàn)應(yīng)加以考慮的基本方面。（2）較適用于評(píng)價(jià)教育成就測(cè)驗(yàn)和職業(yè)選拔測(cè)驗(yàn)。（3）對(duì)標(biāo)準(zhǔn)參照測(cè)驗(yàn)更為重要，是因?yàn)樵跇?biāo)準(zhǔn)參照測(cè)驗(yàn)中我們主要關(guān)心的是被試對(duì)一定范圍的知識(shí)、技能掌握得如何。（4）注意內(nèi)容效度與表面效度的關(guān)系（5）它缺乏可靠的數(shù)量指標(biāo)，因而妨礙了各測(cè)驗(yàn)間的相互比較。（二）構(gòu)想效度（construct Validity） 1954年提出，有人翻譯為構(gòu)思效度，也有叫結(jié)構(gòu)效度。它是指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想和特質(zhì)的程度，即測(cè)驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想，解釋的程度如何。 1、構(gòu)想效度的特點(diǎn)：（1）其大小首先取決于事先假定的心理特質(zhì)理論（2）當(dāng)實(shí)際測(cè)量的資料無法證實(shí)我們的理論假設(shè)時(shí)，并不一定就表明該測(cè)驗(yàn)結(jié)構(gòu)效不高，因?yàn)檫€有可能是理論假設(shè)不成立，或者該實(shí)驗(yàn)設(shè)計(jì)不能對(duì)該假設(shè)作適當(dāng)?shù)臋z驗(yàn)等情況，當(dāng)然這就使得結(jié)構(gòu)效度的獲取更為困難。（3）結(jié)構(gòu)效度通過測(cè)量什么、不測(cè)量什么的證據(jù)累積起來給以確定，因而不可能有單一的數(shù)量指標(biāo)來描述結(jié)構(gòu)效度。結(jié)構(gòu)效度主要應(yīng)用于智力測(cè)驗(yàn)、人格測(cè)驗(yàn)等一些心理測(cè)驗(yàn)方面。 2、結(jié)構(gòu)效度的確定方法：（1）提出理論假設(shè)，并把這一假設(shè)分解成一些細(xì)小的綱目，以解釋被試在測(cè)驗(yàn)上的表現(xiàn)。（2）依據(jù)理論框架，推演出有關(guān)測(cè)驗(yàn)成績(jī)的假設(shè)。（3）用邏輯和實(shí)證的方法來驗(yàn)證假設(shè)。 3、構(gòu)想效度的估計(jì)方法：（1）測(cè)驗(yàn)內(nèi)法（對(duì)測(cè)驗(yàn)本身的分析）：（2）測(cè)驗(yàn)間的相互比較： ①相容效度 ②區(qū)分效度是構(gòu)思效度的又一個(gè)證據(jù)。 ③因素效度：（3）效標(biāo)關(guān)聯(lián)法，效度的研究證明：一個(gè)測(cè)驗(yàn)若效標(biāo)度理想，那么該測(cè)驗(yàn)所預(yù)測(cè)的效標(biāo)的性質(zhì)和種類就可以作為分析測(cè)驗(yàn)構(gòu)思效度的指標(biāo)，另一種證實(shí)構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。（4）實(shí)驗(yàn)法和觀察法證實(shí)：觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異是驗(yàn)證構(gòu)思效度的方法。 3、對(duì)構(gòu)想效度的評(píng)價(jià) （1）構(gòu)想效度促使研究者把著眼點(diǎn)放在提出假設(shè)上、檢驗(yàn)假設(shè)上，使得測(cè)驗(yàn)成為理論研究的重要工具，而不再只是實(shí)際決策的輔助工具，從而使測(cè)驗(yàn)有了更廣闊的發(fā)展情景。（2）主要缺點(diǎn)是，有些構(gòu)想概論模糊，沒有一致的定義，確定效度時(shí)沒有明確的操作步驟，沒有單一的數(shù)量指標(biāo)來描述有效程度。（三）效標(biāo)效度 1、定義：又稱實(shí)證效度，反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn)，簡(jiǎn)稱效標(biāo)。由于這種效度是看測(cè)驗(yàn)對(duì)效標(biāo)預(yù)測(cè)如何，所以叫效標(biāo)效度。這種效度需在實(shí)踐中檢驗(yàn)，所

下載提示(請(qǐng)認(rèn)真閱讀)

1.請(qǐng)仔細(xì)閱讀文檔，確保文檔完整性，對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
2.下載的文檔，不會(huì)出現(xiàn)我們的網(wǎng)址水印。
3、該文檔所得收入（下載+內(nèi)容+預(yù)覽）歸上傳者、原創(chuàng)作者；如果您是本文檔原作者，請(qǐng)點(diǎn)此認(rèn)領(lǐng)！既往收益都?xì)w您。

同意并開始全文預(yù)覽

文檔包含非法信息？點(diǎn)此舉報(bào)后獲取現(xiàn)金獎(jiǎng)勵(lì)！

文檔加載中……請(qǐng)稍候！
如果長(zhǎng)時(shí)間未打開，您也可以點(diǎn)擊刷新試試。

下載文檔到電腦，查找使用更方便

9.9 積分

還剩頁未讀，繼續(xù)閱讀

舉報(bào)

版權(quán)申訴 word格式文檔無特別注明外均可編輯修改；預(yù)覽文檔經(jīng)過壓縮，下載后原文更清晰！ 立即下載

配套講稿：: 如PPT文件的首頁顯示word圖標(biāo)，表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
特殊限制：: 部分文檔作品中含有的國旗、國徽等圖片，僅作為作品整體效果示例展示，禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
關(guān) 鍵詞：: 心理測(cè)量學(xué) 教案鄭日昌版

溫馨提示:
1: 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

裝配圖網(wǎng)所有資源均是用戶自行上傳分享，僅供網(wǎng)友學(xué)習(xí)交流，未經(jīng)上傳用戶書面授權(quán)，請(qǐng)勿作他用。

關(guān)于本文

本文標(biāo)題：心理測(cè)量學(xué)教案(鄭日昌版).doc
鏈接地址：http://www.820124.com/p-6683871.html

相關(guān)資源更多

正為您匹配相似的精品文檔

相關(guān)搜索

心理測(cè)量學(xué) 教案 鄭日昌版

關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

備案號(hào):蜀ICP備2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)

本站為文檔C2C交易模式，即用戶上傳的文檔直接被用戶下載，本站只是中間服務(wù)平臺(tái)，本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私，請(qǐng)立即通知裝配圖網(wǎng)，我們立即給予刪除！

影音先锋男人资源在线观看,精品国产日韩亚洲一区91,中文字幕日韩国产,2018av男人天堂,青青伊人精品,久久久久久久综合日本亚洲,国产日韩欧美一区二区三区在线

心理測(cè)量學(xué)教案(鄭日昌版).doc

最新文檔