心理測量學知識(第二版)-宋彩玲.ppt
《心理測量學知識(第二版)-宋彩玲.ppt》由會員分享,可在線閱讀,更多相關《心理測量學知識(第二版)-宋彩玲.ppt(85頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、心理測量學知識,主講:宋彩玲 E-mail: QQ:767238415 13053300816,講課內(nèi)容,第一節(jié)概述 第二節(jié) 測驗的常模 第三節(jié)測驗的信度 第四節(jié) 測驗的效度 第五節(jié) 項目分析 第六節(jié) 測驗編制的一般程序 第七節(jié) 心理測驗的使用,3,第一節(jié) 概述,第一單元 測量與測量量表 第二單元 心理測驗的基本概念 第三單元 心理測驗的分類 第四單元 糾正錯誤的測驗觀 第五單元 心理測驗在心理咨詢中的應用 第六單元 心理測驗的發(fā)展史,4,第一單元 測量與測量量表,什么是測量 測量要素 測量量表,5,什么是測量,測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。從字面上看,該定義包括三個主要的
2、元素:事物;數(shù)字;法則。 1.“事物”,指的是我們要測量的對象,更準確地說,就是引起我們興趣的事物的屬性或特征。 2.“數(shù)字”,是代表某一事物或事物某一屬性的量。 3.“法則”,代表的是測量所依據(jù)的規(guī)則和方法。,6,測量要素,任何測量都應該具備這樣兩個要素:即參照點和單位。 參照點:要確定事物的量,必須有一個計算的起點,這個起點叫做參照點。 絕對零點 人定的參照點即相對零點 單位:是測量的基本要求,沒有單位就無法進行測量 確定的意義 有相同的價值,7,測量量表,測量的本質(zhì)是根據(jù)某一法則將事物數(shù)量化,即在一個定有單位和參照點的連續(xù)體上把事物的屬性表現(xiàn)出來,這個連續(xù)體稱為量表。 量表的
3、四種水平 命名量表 :代號/類別 順序量表 :在順序量表中,既無相等單位,又無絕對零點,數(shù)字僅表示等級,并不表示某種屬性的真正量或絕對值。 等距量表 :不但有大小關系,而且具有相等的單位,其數(shù)值可以相互做加、減運算,但沒有絕對的零點,因此不能做乘、除運算。 等比量表 :是最高水平的量表,既有相等單位又有絕對零點。 那么,心理測量中使用的量表一般是什么量表呢?一般說來,心理測量是在順序量表上進行的。,8,第二單元 心理測驗的基本概念,心理測驗的定義 心理測驗的性質(zhì),9,心理測驗的定義,所謂心理測驗,就是依據(jù)心理學理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的行為,對于貫穿在人的全部行為活動
4、中的心理特點作出推論和數(shù)量化分析的一種科學手段。 四要素:1、人的行為 2、行為樣本是只有代表性的樣本 3、標準化 4、常模,10,心理測驗的性質(zhì),心理測量的間接性 迄今為止,我們還無法直接測量人的心理,只能通過測量人的外顯行為,即通過測量人們對測驗題目的反應來推論出他的心理特質(zhì)。 心理測量的相對性 我們在比較不同人之間的行為或心理特征時,沒有絕對的標準,也沒有絕對的零點,我們有的只是一個連續(xù)的行為序列。 心理測量的客觀性:1、測驗的刺激是客觀的2、對反應的量化是客觀的3、對結果的推論是客觀的,11,第三單元 心理測驗的分類,按測驗的功能分類 智力測驗、特殊能力測驗、
5、人格測驗 按測驗材料的性質(zhì)分類 文字測驗、操作測驗 按測驗材料的嚴謹程度分類 客觀測驗、投射測驗 按測驗的方式分類 個別測驗、團體測驗 按測驗的要求分類 最高作為測驗、典型行為測驗,12,第四單元 糾正錯誤的測驗觀,錯誤的測驗觀 測驗萬能論 測驗無用論 某些人格測驗侵犯了個人隱私,違背民主原則 測驗為宿命論和種族歧視提供了心理學依據(jù) 心理測驗即智力測驗 正確的測驗觀 心理測驗是重要的心理學研究方法之一,是決策的輔助工具 心理測驗作為研究方法和測量工具尚不完善,13,第五單元 心理測驗在心理咨詢中的應用,智力測驗:可在求助者有特殊要求時及對方有可疑智力障礙的情況下應用; 人格測驗:有助于治療者對
6、求助者人格特征的了解,以便于對其問題有更深入的理解,并可針對性地開展咨詢與心理治療工作; 心理評定量表:用于檢查求助者某方面心理障礙的存在與否或其程度如何。,14,第六單元 心理測驗的發(fā)展史,科學心理測驗的產(chǎn)生與發(fā)展 現(xiàn)代心理測驗在我國的發(fā)展,15,科學心理測驗的產(chǎn)生與發(fā)展(1),三個重要人物:1、首先倡導科學心理測驗的學者是英國生物學家和心理學家高爾頓(F. Galton),因此他的工作被視為心理測驗的開端。此外,高爾頓也為心理測驗奠定了統(tǒng)計學基礎。 2、1890年,卡特爾在心理雜志上發(fā)表“心理測驗與測量”一文,這是心理測驗第一次出現(xiàn)于心理學文獻中。并認為心理測驗的結果應與常模進行比較。 3
7、、 1905年,比內(nèi)(A.Binet)與其助手西蒙(T.Simon)研究制作了世界上第一個正式的心理測驗。,16,二十世紀心理測驗的發(fā)展,操作測驗的發(fā)展 由于理論上的缺陷和實際上的需要,所以有操作測驗的問世。 團體智力測驗的發(fā)展 團體測驗始于第一次世界大戰(zhàn),在推孟的研究生歐提斯所編團體智力測驗的基礎上發(fā)展了陸軍甲種和乙種智力測驗。 能力傾向測驗的發(fā)展 分析個人心理品質(zhì)的內(nèi)部結構,為職業(yè)選拔與安置提綱依據(jù)。 普通能力傾向(智力)測驗也向多元化發(fā)展。 人格測驗的發(fā)展 測量情感或行為等非智力方面的人格因素。,17,現(xiàn)代心理測驗在我國的發(fā)展,我國近代心理測驗大約源于1914年前后。 本世紀二、
8、三十年代,我國心理學家曾兩次修訂過比內(nèi)-西蒙量表。 1979年后,全國各地的心理學家組織起多個協(xié)作組,先后對國外的廣泛采用的智力和人格測量工具進行修訂。 近些年來我國的心理學家正在致力于測驗本土化,編制適合我國文化背景的智力測驗,適應行為量表等,并已取得了初步成功。,18,第二節(jié) 測驗的常模,第一單元 常模團體 第二單元 常模的類型 第三單元 常模分數(shù)的表示方法,19,第一單元 常模團體,常模團體的性質(zhì) 常模團體的條件 取樣的方法 常模分數(shù)與常模,20,常模團體的性質(zhì),常模團體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。,,常模團體,,常模團體的確定步驟,,確定一般總體,
9、,確定目標總體,確定樣本,,22,常模團體的條件,群體的構成必須明確界定 可以用來區(qū)分和限定群體的變量是很多的,如性別、年齡、職業(yè)、文化程度、民族、地理地域、社會經(jīng)濟地位等。 依據(jù)不同的變量確定群體,便可得到不同的常模。 常模團體必須是所測群體的代表性樣本 當所要測量的群體很小時,將所有的人逐個測量,其平均分便是該群體的最可靠的常模。 在群體較大時,因為時間和人力物力的限制,只能測量一部分人作為總體的代表,這就提出了取樣是否適當?shù)膯栴} 一般采用隨機取樣或分層取樣的方法,有時可把兩者結合。 樣本的大小要適當 總體數(shù)目小,只有幾十個人,則需要100%的樣本。如果總體數(shù)目大,相應的樣本也大,一般最低
10、不小于30或100個。 全國性常模,一般應有20003000人為宜。,23,取樣的方法,取樣即從目標總體中選擇有代表性的樣本 簡單隨機抽樣:在簡單隨機抽樣中,每個人或抽樣單位都有相同的機會作為常模中的一部分。 系統(tǒng)抽樣(等距抽樣):有時在總體數(shù)目為N的情況下,若要選擇K分之一的被試作為樣本,則可以在抽樣范圍內(nèi)選擇每個第K個人來構成樣本。 分組抽樣:有時總體數(shù)目較大,無法進行編號,而且群體又有多樣性,這時可以先將群體進行分組,再在組內(nèi)進行隨機取樣。 分層抽樣:它是先將目標總體按某種變量(如年齡)分成若干層次,再從各層次中隨機抽取若干被試,最后把各層的被試組合成常模樣本。包括分層比例抽樣和分層非比
11、例抽樣,24,常模分數(shù)與常模,常模分數(shù) 常模分數(shù)就是施測常模樣本被試后,將被試者的原始分數(shù)按一定規(guī)則轉(zhuǎn)換出來的導出分數(shù)(量表分數(shù))。 導出分數(shù)具有一定的參照點和單位,它實際上是一個有意義的測驗量表,它與原始分數(shù)等值,可以進行比較 常模 常模分數(shù)構成的分布,就是通常所說的常模(norm),它是解釋心理測驗分數(shù)的基礎。 常模有一般常模與特殊常模之分,25,第二單元 常模的類型,發(fā)展常模 百分位常模 標準分常模 智商的計算及意義,26,發(fā)展常模,發(fā)展順序量表 智力年齡 年級當量,27,發(fā)展常模(1)/發(fā)展順序量表,最直觀的發(fā)展常模是發(fā)展順序量表,因為它告訴人們多大的兒童具備什么能力或行為就表明其發(fā)育
12、正常,相應能力或行為早于某年齡出現(xiàn),說明發(fā)育超前,否則即為發(fā)育滯后。 最早的一個范例是葛塞爾發(fā)展程序表,其中按月份顯示出兒童在運動水平、適應性、語言、社會性四個方面的大致發(fā)展水平。 皮亞杰的研究著重于從嬰兒到十多歲兒童認知過程的發(fā)展,尤其注重某些特殊概念的形成,其中最著名的工作就是對守恒概念的研究。,28,發(fā)展常模(2)/智力年齡,智齡是年齡量表上度量智力的單位。 智齡的計算:假如某兒童4、5、6歲組的題目全部通過,7歲通過4題,8歲通過3題,9歲通過2題,其智齡為()。以其全部通過的最高年齡為起點,6+4*2+3*2+2*2=6歲+18月= 7歲6個月,,,29,在吳天敏修訂的比內(nèi)西蒙量表中
13、,某兒童通過了4歲組的全部題目,5歲組通過3題,6歲組通過2題,7歲組通過1題,其智力為()。 (A)4歲3個月 (B)4歲6個月 (C)5歲 (D)5歲2個月,,31,發(fā)展常模(3)/年級當量,年級當量實際上就是年級量表,測驗結果說明屬哪一年級的水平,在教育成就測驗中最常用。其表述方式常常是:某學生的算術是6年級水平,閱讀是4年級水平,理解是5年級的水平等。 年級量表的單位通常為10個月間隔,在一學年中假設兩個月的假期在所測量目標上的發(fā)展是不重要的,因此以10個月為一個年級。例如,40(或4.0)表示四年級開始時的平均成績,45(或4.5)表示學年中間的平均成績。,32,百分位常模,百分等級
14、 指在常模樣本中低于這個分數(shù)的人數(shù)百分比。 百分點 百分點也稱百分位數(shù),與百分等級的計算方法正好相反。百分等級是計算低于某測驗分數(shù)的人數(shù)百分比,而百分點則是計算處于某一百分比例的人對應的測驗分數(shù)是多少。 四分位數(shù)和十分位數(shù) 百分位數(shù)是將量表分成100份,而四分位數(shù)是將量表分成四等份,相當于百分等級的25%、50%和75%對應的三個百分分成的四段。十分位數(shù)也可以依此類推出,1%10%為第一段,91%100%為第十段。,33,標準分常模,標準分數(shù)是將原始分數(shù)與平均數(shù)的距離以標準差為單位表示出來的量表。因為它的基本單位是標準差,所以叫標準分數(shù)。 1線性轉(zhuǎn)換的標準分數(shù) 2非線性轉(zhuǎn)換的標準分數(shù) 對
15、每個原始分數(shù)值計算累積百分比; 在常態(tài)曲線面積表中,求出對于該百分比的標準(z)分數(shù)。 T分數(shù):平均數(shù)為50,標準差為10 標準九分:以5為平均數(shù),以2為標準差 標準十分:平均數(shù)為5.5,標準差為1.5; 標準二十分:平均數(shù)為10,標準差為3。,34,智商的計算及其意義,比率智商 離差智商 必須指出,從不同測驗獲得的離差智商只有當標準差相同或接近時才可以比較,標準差不同,其分數(shù)的意義便不同 (見附表)。,35,第三單元 常模分數(shù)表示法,轉(zhuǎn)換表表示法 一個轉(zhuǎn)換表顯示出一個特定的標準化樣組的原始分數(shù)與其相對應的等值分數(shù)百分位、標準分數(shù)、T分數(shù)或者其它任何分數(shù)。因此測驗的使用者利用轉(zhuǎn)換表可將原始分數(shù)
16、轉(zhuǎn)換為與其對應的導出分數(shù),從而對測驗的分數(shù)作出有意義的解釋。 剖面圖表示法 剖面圖是將測驗分數(shù)的轉(zhuǎn)換關系用圖形表示出來。從剖面圖上可以很直觀地看出被試在各個分測驗上的表現(xiàn)及其相對的位置。,16PF剖面圖,37,第三節(jié) 測驗的信度,第一單元 信度的概念 第二單元 信度的估計方法 第三單元 信度與測驗分數(shù)的解釋 第四單元 影響信度的因素,38,第一單元 信度的概念,信度的定義 信度是指同一被試在不同時間內(nèi)用同一測驗(或用另一套相等的測驗)重復測量,所得結果的一致程度。 在測量理論中,信度被定義為:一組測量分數(shù)的真分數(shù)方差與總方差(實得分數(shù)的方差)的比率。 X=T+E SX2=ST2+SE2 rxx
17、=ST2/SX2=1-SE2/SX2 信度的指標 信度系數(shù)和信度指數(shù) rxx=rXT2=ST2/SX2 測量標準誤,39,第二單元 信度的估計方法,重測信度 復本信度 內(nèi)部一致性信度 評分者信度,40,信度的估計方法(1),重測信度(test-retest reliability) 又稱穩(wěn)定性系數(shù)。它的計算方法是采用重測法,即使用同一測驗,在同樣條件下對同一組被試者前后施測兩次測驗,求兩次得分間的相關系數(shù)。 最適宜的時距隨測驗的目的、性質(zhì)和被試特點而異,一般是兩周到四周較宜,間隔時間最長不超過六個月。,41,信度的估計方法(2),復本信度(alternate-form reliability)
18、 又稱等值性系數(shù), 它是以兩個等值但題目不同的測驗(復本)來測量同一群體,然后求得被試者在兩個測驗上得分的相關系數(shù),這個相關系數(shù)就代表了復本信度的高低。 如果兩個復本的施測相隔一段時間,則稱穩(wěn)定與等值系數(shù)。 在計算復本信度時,應該有半數(shù)的被試先作A本再作B本,另一半被試先作B本再作A本,由此可以抵消施測順序的效應。,42,信度的估計方法(3),內(nèi)部一致性信度(internal consistency reliability) 分半信度(split-half reliability) 是在測驗實施后將測驗按奇、偶數(shù)分為等值的兩半,并分別計算每位被試在兩半測驗上的得分,求出這兩半分數(shù)的相關系數(shù)。
19、分半法經(jīng)常會低估信度,必須修正,借以估計整個測驗的信度。 同質(zhì)性信度(homogeneity reliability) 同質(zhì)性主要代表測驗內(nèi)部所有題目間的一致性。當各個測題的得分有較高的正相關時,不論題目的內(nèi)容和形式如何,則測驗為同質(zhì)的。相反,即使所有題目看起來好象測量同一特質(zhì),但相關很低或為負相關時,則測驗為異質(zhì)的。,43,信度的估計方法(4),評分者信度(scorer reliability) 一般要求在成對的受過訓練的評分者之間平均一致性達0.90以上,才認為評分是客觀的。 當多個評分者評定多個對象,并以等級法記分時,可采用肯德爾和諧系數(shù)作為評分者信度的估計。,44,第三單元 信度與測驗
20、分數(shù)的解釋,解釋真實分數(shù)與實得分數(shù)的相關 信度系數(shù)可以解釋為總的方差中有多少比例是由真實分數(shù)的方差決定的,也就是測驗的總變異中真分數(shù)造成的變異占百分之幾。 確定信度可以接受的水平 當rxx<0.70時,測驗不能用于對個人作出評價或預測,而且不能作團體比較;當0.70rxx<0.85時,可用于團體比較;當rxx0.85時,才能用來鑒別或預測個人成績或作為。 解釋個人分數(shù)的意義 其一是估計真實分數(shù)的范圍;其二是了解實得分數(shù)再測時可能的變化情形。這就是測量標準誤的應用。 比較不同測驗分數(shù)的差異 這種比較包括兩個人不同分數(shù)的差別和同一被試在兩個測驗上的差別。這就是差異分數(shù)的標準誤問題。,45,第四單元
21、 影響信度的因素,樣本特征 樣本團體的異質(zhì)性:一般而言,若獲得信度的取樣團體較常模總體為異質(zhì)的話,往往會高估測驗的信度,相反會低估測驗的信度。 樣本團體的平均能力水平 測驗的長度;一般來說,在一個測驗中增加同質(zhì)的題目,可以使信度提高。 測驗的難度:通常難度的平均水平為0.50較好。 測量的時間間隔,46,第四節(jié) 測驗的效度,第一單元 效度的概念 第二單元 效度評估的方法 第三單元 效度的功能 第四單元 影響效度的因素,47,第一單元 效度的概念,效度的定義 效度是指所測量的與所要測量的心理特點之間的符合程度,或者簡單地說是指一個心理測驗的準確性. 在測驗理論中,效度被定義為在一組測量中,與測量
22、目標有關的真實方差(或稱有效方差)與總方差的比率. rxy=Sv2/Sx2 SX2=ST2+SE2=SV2+SI2+SE2 效度的性質(zhì) 效度具有相對性 效度具有連續(xù)性,48,專欄5-4 信度與效度的關系,信度是效度的必要而非充分條件 效度高必然信度高,而信度高并不一定保證效度高,說明信度高只是效度高的必要條件,并不是效度高的充分條件。 效度是受信度制約的 信度系數(shù)與效度系數(shù)之間有這樣一種關系:信度系數(shù)的平方根是效度系數(shù)的最高限度。用公式表示如下:,信度低效度低,信度高效度低,信度高效度高,50,第二單元 效度的估計方法,內(nèi)容效度 構想效度 效標效度,51,內(nèi)容效度,定義: 指的是測驗題目對
23、有關內(nèi)容或行為取樣的適用性,從而確定測驗是否是所欲測量的行為領域的代表性取樣。 估計方法 專家判斷法 定義好測驗內(nèi)容的總體范圍; 編制雙向細目表,確定內(nèi)容和技能各自所占的比例; 由每位評判者在評定量表上作出判斷。 統(tǒng)計分析法 計算兩個評分者之間評定的一致性(評分者信度) 兩個測驗復本上得分之相關(復本信度) 再測法也可用于內(nèi)容效度的評估(測驗-學習-再測驗) 經(jīng)驗推測法 這種效度是通過實踐來檢驗效度 內(nèi)容效度與表面效度,52,構想效度,定義:是指測驗能夠測量到理論上的構思或特質(zhì)的程度,即測驗的結果是否能證實或解釋某一理論的假設、術語或構思,解釋的程度如何。 估計方法 對測驗本身的分析 測驗的內(nèi)
24、容效度 測驗的同質(zhì)性 分析被試者對題目的反應特點 測驗間的相互比較 相容效度是構思效度的一個證據(jù)。 區(qū)分效度是構思效度的又一個證據(jù)。 因素分析法也是建立構思效度的常用方法。 效標效度的研究證明(效標分組/分數(shù)分組,年齡變化) 實驗法和觀察法證實(訓練),53,效標效度,定義:又稱實證效度,反映的是測驗預測個體在某種情境下行為表現(xiàn)的有效性程度。 估計方法 相關法:相關法是評估效標效度最常用的方法,它是求測驗分數(shù)與效標資料間的相關,這一相關系數(shù)稱為效度系數(shù)。 區(qū)分法 :分析高分組與低分組分布的重疊量?;蛘哂嬎忝恳唤M內(nèi)得分超過(或低于)另一組平均數(shù)的人數(shù)百分比,或者計算兩組分布的共同區(qū)的百分比。重疊
25、量越大,說明兩組分數(shù)差異越小,即測驗的效度越差。 命中率法:命中率法是當測驗用來做取舍的依據(jù)時,用其正確決定的比例作為效度指標的一種方法。,54,第三節(jié) 效度意義的確定,預測效標分數(shù) 在測驗工作中,人們感興趣的是從測驗分數(shù)預測效標成績,因此最常用的是Y對X的回歸方程。 預測誤差 效度系數(shù)的實際意義常常以決定性系數(shù)來表示,意旨相關系數(shù)的平方,其表達式是rxy2,它表示測驗正確預測或解釋的效標的方差占總方差的比例。 另一種表達方法是估計的標準誤,簡寫為Sest,它是指所有具有某一測驗分數(shù)的被試其效標分數(shù)(Y)分布的標準差,也即真正效標分數(shù)落在某一范圍內(nèi)有多大可能性。 預測效率指數(shù),55,第四單元
26、影響效度的因素,測驗本身的因素: 測驗取材的代表性、測驗長度、試題類型、難度、區(qū)分度以及編排方式都會影響效度。 測驗實施中的干擾因素 主試的影響因素 被試的影響因素 樣本團體的性質(zhì) 樣本團體的異質(zhì)性 干涉變量 效標的性質(zhì) 效標與測驗分數(shù)之間的關系是否線性相關也是需要注意的一個因素。 效標測量本身的可靠性如何亦是值得考慮的一個問題。,56,第五節(jié) 項目分析,第一單元 項目的難度 第二單元 項目的區(qū)分度,項目分析,,定性分析,定量分析,,難 度,區(qū)分度,58,第一單元 項目的難度,難度(difficulty)的定義:是指項目的難易程度。 難度的計算 二分法記分的項目 非二分記分的項目 難度水平的確
27、定 項目的難度:P值越接近于0.50,區(qū)別力越高。 測驗的難度 如果被試樣本具有代表性,對于中等難度的測驗,其測驗總分應該接近常態(tài)分配。 對于正偏態(tài)分布,必須增加足夠數(shù)量的較容易的項目;對于負偏態(tài)分布,必須增加足夠數(shù)量的有較高難度的項目。,59,第二單元 項目的區(qū)分度,定義:也叫鑒別力,是指測驗項目對被試者的心理特性的區(qū)分能力。 計算方法 鑒別指數(shù) D=PH-PL 相關法 點二列相關:適用于一類變量為二分稱名變量,另一類變量為連續(xù)變量的成對變量的相關計算。 二列相關:適用于兩個連續(xù)變量,但其中一個變量被人為分成兩類 相關法:適用于兩個變量均為二分稱名變量。若將測驗總分按及格、不及格或錄取、淘汰
28、劃分,便可計算相關系數(shù)。 區(qū)分度與難度的關系,60,例題:某測驗,被試共18人,高分組和低分組若各取總?cè)藬?shù)的27%,則兩組各為5人,第1題高分組5人全部答對,低分組5人中有1人答對,則該題的鑒別指數(shù)為:D == 5/5 1/5 == 0.80 D -1,1,D值越大,項目的鑒別力越大,表示項目的質(zhì)量越好。當D=1時,高分組被試全部通過,低分組被試全部失敗。相反,如果低分組的被試全部通過,高分組的被試全部失敗,則D=-1。如果兩組的通過率相等,則D=0。(教材表5-6),61,第六節(jié) 測驗編制的一般程序,第一單元 測驗的目標分析 第二單元 測題的編寫 第三單元 測題的編排與組織,62,第一單
29、元 測驗的目標分析,測驗的對象 測驗的用途 測驗的目標,63,測驗的對象,描述: 在編制測驗時必須明確測量對象,也就是該測驗編成后要用于何種團體。如WAIS,我們不能用于兒童,而編制時也不會出1+1=?的題目,因為這樣的題目對幼年兒童比較合適。 要考慮的因素: 年齡、文化程度、社會經(jīng)濟條件、文化背景、智力水平及閱讀水平等。,64,心理測驗的用途,描述: 心理測驗的用途就是指我們編制測驗是干什么用的,是要對被試做描述,還是做診斷,抑或是選拔和預示,這一點在測驗編制前就應明確。用途不同,編制測驗時的取材范圍及試題難度等也不盡相同。 測驗的分類: 顯示性測驗:指測驗題目和要測量的特征相似的測驗,比如
30、成就測驗,它所反映的是被試具有什么能力,能完成什么任務。 預測性測驗:為了預測一些沒有被測量的行為的測驗,即希望測驗能作出對未知情況的預測。,65,測驗的目標,描述: 指編制的測驗是測什么的,即測什么樣的心理特征或人格特點。 目標分析 工作分析 第一是確定哪些心理特征和行為可以使要預測的活動達到成功 第二是建立衡量被試是否成功的標準,這個標準我們稱之為效標 對特定的概念下定義 確定測驗的具體內(nèi)容,66,第二單元 測題的編寫,搜集資料 命題原則 編制要領,67,搜集資料,已出版的標準測驗 最簡單、最直接的方法是從已經(jīng)出版的各種標準測驗中選擇合適的題目 理論和專家的經(jīng)驗 理論和專家經(jīng)驗有時也可以作
31、為題目的來源之一 臨床觀察和記錄 臨床的觀察也可以作為題目的來源,68,命題原則 (1),內(nèi)容方面 試題要符合測驗的目的; 內(nèi)容取樣要有代表性; 題目間內(nèi)容相互獨立,互不牽連,對不同題目的回答不致相互影響; 文字方面 使用準確的當代語言,避免使用生僻的字句或詞匯 語句要簡明扼要,既要排除與答案無關的因素,又不能遺漏答題所依據(jù)的必要條件; 最好是一句話說明一個概念,盡量少使用雙重否定句 理解方面 題目內(nèi)容不能超出受測團體的知識水平和理解能力; 答案明確,不引起爭議; 題目格式不要被人誤解; 社會敏感性方面 避開社會敏感性問題,如涉及社會禁忌或個人隱私的題目不應使用。,69,命題原則 (2),可是
32、有些測驗必須涉及這類社會敏感性問題,那么怎樣鼓勵被試作出真實的回答呢?菲力普(Phillips,D. L.)列舉了幾條策略值得參考: 命題時假定被試具有某種行為,使他不得不在確實沒有該行為時才否定,可避免否定答案過多的傾向。 命題時假定規(guī)范不一致 指出該行為是常見的,雖然是違規(guī)的,70,編制要領,對心理測驗的題目進行分類的標準很多,常見的分類是根據(jù)對被試的要求不同來分,可以分為兩大類:提供型(supply)和選擇型(selection)題目。 提供型題目:要求被試提供答案 論文題: 簡答題 填充題 選擇型題目:要求被試在幾個選項中選擇正確答案 是非題 選擇題 匹配題,71,第三單元 測驗的編排
33、和組織,合成測驗 測驗的預試 信度與效度考察 常模制定 編寫指導手冊,72,合成測驗,篩選與審定試題 選擇試題形式 審定題目 測題的編排 編排原則 測同一因素的放在一起; 同類型的測題盡可能組合在一起,可以省略對每類試題的答案說明; 題目的難度排列宜逐步上升。 編排方式 并列直進式 混合螺旋式,73,測驗的預試,測驗的預測 預試對象必須和將來正式測驗準備測試的對象相似 預試的實施過程與情境應力求與正式測驗的情況相似 預試的時限可稍寬些,以搜集充分的反應資料 應將被試的各種反應情形隨時加以記錄。 項目分析 確定題目的難度、區(qū)分度、備選答案的合適度等 為了檢驗所選出的項目的性能是否真正符合要求,通
34、常需再選取來自同一總體的另一樣本再測一次,并進行第二次項目分析,看兩次分析結果是否一致,74,編寫指導手冊,測驗的目的和功用。 測驗編制的理論背景以及測驗中的材料是根據(jù)什么原則、應用什么方法選擇出來的,許多手冊還提供選擇題目的統(tǒng)計指標。 如何實施測驗的說明。 測驗的標準答案和記分標準。 常模資料,包括常模表、常模適用的團體及對測驗分數(shù)如何做解釋。 測驗的基本特征,包括難度、鑒別力、信度、效度和因素分析的資料,以及這些資料取得的條件和情境,包括調(diào)查的樣本和時間。,75,第七節(jié) 心理測驗的使用,第一單元 主試的資格 第二單元 測驗的選擇 第三單元 測驗前的準備及注意事項 第四單元 測驗實施的程序及
35、要素 第五單元 被試誤差及控制方法 第六單元 測驗的評分 第七單元 測驗結果的報告,76,第一單元 主試的資格,知識結構 基礎知識 相關專業(yè)知識 專業(yè)理論知識和專業(yè)技能 專業(yè)理論知識 專業(yè)技能 職業(yè)道德 測驗的保密和控制使用 測驗中個人隱私的保護,77,第二單元 測驗的選擇,所選測驗必須適合測量的目的 所選測驗必須符合心理測量學的要求 信度、效度如何,常模樣本是否符合你的測試對象 標準化測驗必須經(jīng)常修訂,使測驗內(nèi)容、常模樣本、分數(shù)解釋更符合變化了的時代 考慮是否符合我國國情,78,第三單元 測驗前的準備及注意事項,測驗前的準備工作 預告測驗 準備測驗材料 熟悉測驗指導語 熟悉測驗的具體程序 測
36、驗中主試的職責 按照指導語的要求實施測驗 測驗前不講太多無關的話 對于被試的反應,主試不應做出點頭、皺眉、搖頭等暗示性反應 對特殊問題要有心理準備 建立協(xié)調(diào)關系,79,第四單元 測驗實施的程序及要素,指導語 對被試的指導語 對主試的指導語 時限 典型行為測驗/最高作為測驗/速度測驗 測驗的時間安排,也是影響測驗結果的一個重要因素 測驗的環(huán)境條件 物理環(huán)境 意外干擾,80,第五單元 被試誤差及控制方法,應試技巧與練習效應 應試技巧 練習效應 動機和焦慮因素 反應定勢 求“快”與求“精確”反應定勢 喜好正面敘述的反應定勢 喜好特殊位置的反應定勢 喜好長選項的反應定勢 猜測的反應定勢,81,第六單元
37、 測驗的評分,原始分數(shù)的獲得 及時而清楚地記錄反應情況 要有一張標準答案或正確反應的表格,即記分鍵 將被試的反應和記分鍵比較,對反應進行分類 原始分數(shù)的轉(zhuǎn)換,82,第七單元 測驗結果的報告,測驗分數(shù)的綜合分析 把測驗分數(shù)視為一個范圍而不是一個確定的點 分數(shù)與他的遺傳特征、測驗前的學習與經(jīng)驗以及測驗情境的關系。 除了常模資料外,還應了解測驗的信度、效度資料。 不同測驗的分數(shù)不能直接比較。以百分等級為中介線性等值 報告分數(shù)的具體建議 使用當事人所理解的語言。 要保證當事人知道這個測驗測量或預測什么。 要使當事人知道他是和什么團體在進行比較。 要使當事人認識到分數(shù)只是一個“最好”的估計。 要使當事人
38、知道如何運用他的分數(shù)。 要考慮測驗分數(shù)將給當事人帶來什么心理影響。 要讓當事人積極參與測驗分數(shù)的解釋。,83,50、常模樣本量一般不小于( D )。 (A) 100或500 (B) 800或1000 (C) 20或25 (D)30或100 51、韋克斯勒將離差智商的平均數(shù)定位100,標準差定為( B )。 (A) 17 (B)15 (C) 11 (D)13 52、一般要求在成對的受過訓練的評分者之間平均一致性達到(C )以上,才認為評分是客觀的。 (A)0.70 (B)0.80 (C)0.90 (D) 1.00,84,53、以再測法或復本法求信度,兩次測驗相隔時間越短,其信度系數(shù)( A )。 (A)越大 (B) 越低 (C)越小 (D)不變 54、項目區(qū)分度也叫( B ),是指測驗項目對被試者的心理特性的區(qū)分能力。 (A) 難度 (B)鑒別力 (C)信度 (D)效度 55、信度只受( B )的影響。 (A)系統(tǒng)誤差 (B)隨機誤差 (C)恒定效應 (D)概化作用,85,,謝謝!,
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。