《教育測量與評價》PPT課件.ppt
,教育測量與評價,教育評價與測量黃光揚,畢業(yè)于湖南師范大學 講師 教育學碩士 國家二級心理咨詢師,個人聯(lián)系方式 電話:15874118045 Q Q: 851570859,曾祥志,一、課程學習的意義,教育測量與評價是所有成功教學的基礎,也是諸多教育決策的重要依據(jù)。 “評價是所有成功教學的基礎。” 格蘭朗德 “評價是重要的意圖不是為了證明,而是為了改進?!?斯塔費爾比姆,一、課程學習的意義,教育測量與評價是當今世界教育科學研究的三大領(lǐng)域之一。,國際性教育評價組織簡介:,國際教育評估協(xié)會:1975年在瑞士日內(nèi)瓦成立,當時有18個國家參加,其宗旨是幫助世界各地的教育機構(gòu)通過發(fā)展和應用評價技術(shù)來提高教育質(zhì)量和促進教育機會均等。 IAEA在20世紀80年代前后完成了兩個重要的研究項目: 其一,研究與編寫了教師用的評價指南,并譯成各種文字,以幫助世界各地區(qū)教師提高測驗的技能; 其二,為準備出國深造的學生,用多種語言文字編寫了熟練能力的國際測驗,以便學生以其愿意使用的語言參加能力測驗,然后附加所在國的語言測驗。,國際性教育評價組織簡介:,國際教育成就評價協(xié)會( International Association for the Evaluation of Educational Achievement) :1962年成立。我國1984年參加了IEA。 IEA組織的宗旨是開展和促進教育的多國研究,尤其是對基礎教育的質(zhì)量進行比較研究,探討共同的問題。,一、課程學習的意義,一、課程學習的意義,教育測量與評價主要是研究對教育現(xiàn)象進行測量和價值判斷的理論、方法和技術(shù)。 教育測量與評價是一門應用性的學科,但又是一門綜合性的課程。,一、課程學習的意義,教育測量與評價在教育改革中具有重要的作用 教育改革常常以教育測量與評價的改革為突破口; 考試與評價改革成為基礎教育新課程改革的重要內(nèi)容。,一、課程學習的意義,教育測量與評價是教師的專業(yè)素養(yǎng)和能力 正確評價學生的發(fā)展是教師職業(yè)能力的重要組成部分; 國外教師教育普遍開設“教育測量與評價”類課程。,二、教學目標,三、教學內(nèi)容的組織,四、教材和參考書,1.教育測量與評價華東師范大學出版社,黃光揚主編,2012年。 2.教育評價學高等教育出版社,涂艷國主編,2007年。 3.教育測量與評價廣東高等教育出版社,胡中鋒主編,1999年。 3.如何進行教育評價華語教學出版社,單志艷著,2007。 4.教育測量與評價高等教育出版社,王漢瀾主編,2002年8月。 5.教學中的測驗與評價中國輕工業(yè)出版社,董奇主編,2003年1月。 6.教育測量學人民教育出版社,張敏強著,1998年7月。 7.教育評價學人民教育出版社,陳玉琨著,1999年12月。 8.回歸生活的中小學教育評價浙江大學出版社,賈群生著,2004年。,四、學習與考核方式,課堂講授為主,輔之以課外集體討論學習。 結(jié)合各自的實際情況,學以致用,要求積極參與討論,保質(zhì)保量地完成作業(yè)。 計分辦法:平時作業(yè)、考察占30,期末考試70。,第一章 教育測量與評價的學科發(fā)展,第一節(jié) 教育測量與評價的基本問題 第二節(jié) 教育測量與評價的發(fā)展歷史 第三節(jié) 教育測量與評價的學科地位和作用,第一節(jié) 教育測量與評價的基本問題,測量,教育測量,教育評價,一、測量的含義與要素,(一)測量的含義 史蒂文斯:從廣義而言,測量系根據(jù)法則給事物分派數(shù)字。 測量這一定義包含了三方面的特性: 1、法則給事物的屬性分派數(shù)字的依據(jù) 2、事物測量的對象或目標 3、數(shù)字描述事物屬性的符號,一、測量的含義與要素,(一)測量的含義 測量即: 根據(jù)某些法則與程序 用數(shù)字 對事物在量上的規(guī)定性 予以確定和描述的過程,(二)測量的三要素,1、單位 具有明確的意義 要有相等的價值 2、參照點 絕對零點 相對零點 3、量表 具有一定單位和參照點的連續(xù)體 具有準確性 具備操作的簡約性 教育測量工具:試卷 測試題 重視命題的研究,二、教育測量的含義與特點,(一)教育測量的含義: 教育測量即: 根據(jù)測量學的原理和方法 針對學校教育影響下學生各個方面的發(fā)展 側(cè)重從量的規(guī)定性上 予以確定和描述的過程 思考: 心理屬性是否也可以客觀地進行測量呢?,二、教育測量的含義與特點,(一)教育測量的含義: 教育測量即: 根據(jù)測量學的原理和方法 針對學校教育影響下學生各個方面的發(fā)展 側(cè)重從量的規(guī)定性上 予以確定和描述的過程 思考: 心理屬性是否也可以客觀地進行測量呢?,兩個理論基礎:,桑代克:無論什么東西,只要存在,總存在于數(shù)量之中。 精神與社會測量導論 麥克爾:任何東西,存在于數(shù)量中的,都可以被測量。 麥柯爾(W.A.mecall),美國近代教育測量專家,近代西方教育實驗理論和方法在中國傳播歷程中的關(guān)鍵性人物。 這兩句話,看成是構(gòu)成一切測驗和量化評價的公理。,(二)教育測量的特點,1、測量結(jié)果的間接性和推斷性 2、測量對象的模糊性和測量誤差的不可避免性 3、量表具有多樣性,結(jié)果具有相對抽象性,量表的類型,1. 類別量表(norminal scale)稱名量表 2. 順序量表(ordinal scale)位次量表 根據(jù)事物的特性和設定的法則在分類的基礎上確定同類客體中各元素之間的相對順序,只關(guān)心研究對象的順序,不問津間距是否一致。 3. 等距量表(interval scale)間距量表 在賦值時有相等的度量單位,采用相對零點,被測所對應的測量值由明確的距離關(guān)系 4. 比率量表(ratio scale) 采用絕對零點,針對總體而不是樣本,不但能確定一個被測比另一個被測大(?。┒嗌伲疫€能得出其間的倍數(shù)關(guān)系,有關(guān)量表水平的說明,說明: 事物的復雜性決定測量量表的不同層次和水平 四種量表的測量水平由前往后逐漸提高,信息量不斷增大,前一種量表的特點和功能蘊涵于后一種量表之中。(定性、定量) 不可過分苛求測量的高層次 不能把低層次量表的數(shù)據(jù)按高層次量表的意義理解或作統(tǒng)計處理 教育測量是在順序量表上進行的,但需要用等距量表報告分數(shù) 加強命題的研究 把原始分數(shù)轉(zhuǎn)換到一個有相等單位的量表上,通常轉(zhuǎn)化為標準分 教育測量中使用的量表: 百分量表 百分等級量表 標準分數(shù)(Z)量表 T量表,問題思考:,1、在百分制的評分方法中,60分比55分多5分,90分比85分多5分,這兩個相差的5分,是否是由相等的標準來確定的? 2、一個在測量中得80分的學生的知識量是否等于在同一測驗中得40分學生知識量的兩倍?,結(jié)論:,教育測量的度量單位是相對的,使得教育測量具有不等距性和不穩(wěn)定性。 一個學生的學業(yè)成績好壞、智力高低和能力大小等,都是就其在所在團體的整個分數(shù)序列、行為序列中的地位來說的,其測量的分數(shù)單位,并非絕對的。 為了使教育測量的分數(shù)具有可靠性、可比性,必須根據(jù)標準測量的原理和方法,編制測驗量表,制定科學的評分標準和方法,并將測量所得的原始分數(shù)轉(zhuǎn)換為可以直接比較的量表分數(shù)(百分等級分數(shù)、標準分數(shù)、T分數(shù)等)。,三、教育評價的概念與特點,評價泛指 衡量、判斷 人物或事物的 價值 教育評價: 由美國泰勒于1930年首次提出,在美國國會1965年通過的初等及中等教育法案中得以合法化。,拉爾夫泰勒(Ralph Tyler)“當代課程評價之父”、“現(xiàn)代課程理論之父”,“評價過程在本質(zhì)上是確定課程和教學大綱在實際上實現(xiàn)教育目標的程度的過程。” 課程與教學的基本原理 (Basic Principles of Curriculum and Instruction)被譽為“現(xiàn)代課程理論的圣經(jīng)”。,日本的橋本重治:,“評價是與教育的目標和價值有明確關(guān)系的概念,是按照教育目標和價值觀對學生的學習成果及教育計劃的效果等進行測量的過程。因此,評價概念的重點在于以教育目標為標準的價值判斷。”,日本的橋本重治:,他規(guī)納出評價五大特點: 評價離開了教育目標就不能成立; 評價是囊括性的; 評價是連續(xù)的; 評價不僅是教師進行的,學生自身也要展開自我評價和相互評價; 評價法必須提高到科學的高度。,格蘭朗德:,評價是為了確定學生達到教學目標的程度,收集、分析和解釋信息的(課堂)系統(tǒng)過程。 一個完整的評價計劃可用公式表達為: 評價測量(定量描述)非測量(定性描述)價值判斷,斯塔費爾比姆:,“評價最重要的意圖不是為了證明,而是為了改進。” “評價是一種劃定、獲取和提供敘述性和判斷性信息的過程。這些信息涉及研究對象的目標、設計、實施和影響的價值及優(yōu)缺點,以便指導如何決策、滿足教學效能核定的需要,并增加對研究對象的了解?!?美國教育評價標準委員會:,“教育評價是對教育目標和它的優(yōu)缺點與價值判斷的系統(tǒng)調(diào)查,為教育決策提供依據(jù)的過程”。(1981年提出),布魯姆(B.S.Bloom) :,“據(jù)我看來,評價乃是系統(tǒng)收集證據(jù)用以確定學習者實際上是否發(fā)生了某些變化,確定學生個體變化的數(shù)量或程度。” “評價是為了某個目的而進行的,對各種想法、作品、解答、方法、資料等的價值作出判斷的活動。,華東師范大學陳玉琨教授:,教育評價是對教育活動滿足社會與個體需要的程度作出判斷的活動,是對教育活動現(xiàn)實的(已經(jīng)取得的)或潛在的(還未取得,但有可能取得的)價值作出判斷,以期達到教育價值增值的過程。,教育評價的概念,“教育評價”包含如下幾個共同的要點: 第一,強調(diào)以教育目標為標準的價值判斷過程; 第二,強調(diào)用多種方法(測量和非測量)系統(tǒng)收集資料與信息; 第三,教育評價的對象應該是“教育者的發(fā)展變化及構(gòu)成其變化的各種因素。”這就既包括了學生評價,也包括了教師評價等與學生成長發(fā)展相關(guān)的所有因素。 第四,強調(diào)為學生發(fā)展和教育決策服務,評價的最終目的是為了改進與發(fā)展。 第五,不同時期,不同學者所提出的教育評價概念的側(cè)重點有所不同。,教育評價,注重效果:美國的泰勒(側(cè)重課程評價) 格蘭朗德和布盧姆基于教學評價和學生評價,注重資料的獲得:(美)克龍巴赫、 斯塔弗爾比姆,注重評價方法、手段:(中國)張秀理、 (日本)長谷川容,教育評價的概念,教育評價即: 根據(jù)一定的標準(教育目標的達成與否) 運用可行的方法(測量、非測量、系統(tǒng)收集資料信息的方法) 對教育的要素、過程和效果(教育計劃、課程、學習結(jié)果、教育現(xiàn)象、教學活動、教育目標或程序) 進行價值評判的活動(為學生發(fā)展、教育決策等),四、教育評價相關(guān)概念辨析,教育測量與教育評價 教育統(tǒng)計與教育評價 教育評估與教育評價,教育測量與教育評價,二者的聯(lián)系: 教育測量:根據(jù)一定的理論、規(guī)則,運用一定的測量工具對教育現(xiàn)象進行數(shù)量化描述的過程; 教育測量為教育評價提供客觀的數(shù)據(jù)信息,是教育評價的基礎,教育評價要在教育測量所獲得的客觀信息的基礎上進行 。,教育測量與教育評價,二者區(qū)別: 測量:對事物數(shù)量特征的獲得,強調(diào)數(shù)量化的方法與結(jié)果;評價:對教育現(xiàn)象客體的價值進行判斷,強調(diào)定性與定量相結(jié)合的方法 測量:客觀性;評價:客觀性與主觀性的兩種屬性 測量:任務是對事物的量的認識;評價:認識活動,人的意識對實踐活動及其結(jié)果的綜合反映,教育測量與教育統(tǒng)計,教育測量與統(tǒng)計是教育評價獲取教育事實材料的一種定量手段。 教育統(tǒng)計運用數(shù)理統(tǒng)計的原理與方法,對教育測量獲得的數(shù)據(jù)信息進行整理、描述、推斷的過程。 描述統(tǒng)計:計算一個學生各門功課的總成績;計算一個班級一門或多門課程成績的平均分、標準差(常模); 推斷統(tǒng)計:把學生個體成績與全班平均分相比,對進步情況進行推斷;把兩個班級平均分相比較,對教材、教學方法效果進行推斷。 因此: 測量結(jié)果需要進行整理和描述。 統(tǒng)計在測量結(jié)果的基礎上進行,測量結(jié)果是統(tǒng)計的前提; 統(tǒng)計包括描述統(tǒng)計與推斷統(tǒng)計。,1904年以前,教育測量的萌芽期 19041915年,教育測量的開拓 1915-1930年,教育測量的興盛期 1930-1940年,教育測量的批判期 1929-1933年,教育評價的產(chǎn)生 1940-1957年,教育評價的平穩(wěn)期 19571972年,批判泰勒模式時期 1972-現(xiàn)在,專業(yè)化時期,第二節(jié) 教育測量與評價的發(fā)展歷史,1904年以前(教育測量的萌芽期),中國是考試制度的發(fā)源地 606年以前,中國古典教育評價萌生期 先秦至魏晉南北朝時期,選士測評活動 西周、春秋:選士制(德行與道藝) 兩漢:察舉制(最早的試題;對策、射策;太學博士官) 魏晉南北朝:九品中正制(曹操創(chuàng)建,上上、上中、上下),1904年以前(教育測量的萌芽期),中國是考試制度的發(fā)源地 606年1905年,科舉時期 隋唐以來至清末,科舉考試為主要手段 以封建禮教為基本標準,對個人學識德能進行測評判斷 科舉制的特征:逐級考核、制度完備、考場嚴格、命題規(guī)范 科舉制的考核方法:口試、貼經(jīng)、墨義、策間、詩賦,中國科舉制度的世界地位,(法)伏爾泰:“人類精神,肯定想象不出比這樣的政府更好的政府。在這個政府里,重要的衙門彼此統(tǒng)屬,任何事情都在那里決定,而其成員,都是先經(jīng)過幾場嚴格的考試的?!?中國科舉制度的世界地位,孫中山:“現(xiàn)在各國的考試制度,差不多都是學英國的。窮流溯源,英國的考試制度,原來還是從我們中國學過去的?!?英國在1570-1870年期間,用英文出版有關(guān)中國文官制度和政治制度的書籍70多種,大量介紹與研究中國的科舉制度,極力主張英國政府實行中國式的文官考試制度。(英國在1855年建立了文官考試制度。),1845年美國賀拉斯曼將“筆試”引入美國 1864年英國費舍的作業(yè)量表集 1897年美國賴斯的拼字實驗,1904年,桑代克精神與社會測量導論的問世,標志著以科學理論為指導的教育測量理論的誕生。 桑代克:無論什么東西,只要存在,總存在于數(shù)量之中 麥克爾:任何東西,存在于數(shù)量中的,都可以被測量 這兩句話,看成是構(gòu)成一切測驗和量化評價的公理。 1909年,桑代克根據(jù)“等距原理”發(fā)明了編制量表的單位,編制了標準化的測驗量表。,19041915年教育測量的開拓期,在桑代克的影響下,教育測量的運動轟轟烈烈的開展: 測驗品種有算術(shù)測驗、書法測驗、學科測驗、智力測驗、個性測驗、興趣測驗等,在數(shù)量上已有3000多種 20世紀初,心理測驗就已走上標準化與客觀化的路程。 法國比納等人1905年創(chuàng)編并發(fā)表了世界上第一個標準化智力測驗; 英國斯皮爾曼“能力結(jié)構(gòu)二因素學說”與英國著名的11歲兒童考試制度 美國伍德沃斯的第一個標準化人格測驗,1915-1930年教育測量的興盛期,1930-1940年教育測量的批判期,對教育測量批判的原因,教育測量雖然能使教育成就定量化、客觀化、標準化;但畢竟不能測量出人的學力和人格的全部內(nèi)容。 第一次大戰(zhàn)以后,人們的教育觀點發(fā)生了很大的變化,不在將教育看成是單純的傳授知識,而是將人的全面發(fā)展作為教育目標。而人的全面的重要因素如:社會道德、人的情緒態(tài)度、動機 興趣、鑒賞力等是不能光靠測量的。,對教育測量批判的原因,教育測量存在的弊端: 為測量而測量,盲目追求量化,忽視教育服務對象的整體目標與價值。 教育測量的理論基礎只有心理學、統(tǒng)計學和測量學,而沒有教育學原理。,教育評價產(chǎn)生的社會背景,19291933年席卷美國、波及全球的經(jīng)濟大蕭條 社會與教育危機四起 生產(chǎn)過剩、工廠倒閉、工人下崗 學校因經(jīng)濟不景氣,部分學校關(guān)閉,有些學校的班級減少。 整個社會和教育皆處于反省之中,教育評價產(chǎn)生的社會背景,1930年美國有25%的失業(yè),青年近乎100%找不到工作,1910年1417歲的青年17%上大學,而到1930年上升到51%。 有相當一部分人上高中并不想上大學,而當時的美國高中設課就是為了上大學服務的,為此中學設課與失業(yè)青年的需求就產(chǎn)生了尖銳的矛盾。,美國的“八年研究”是教育評價的催生劑,美國進步主義聯(lián)盟負責人艾欽于19331940年領(lǐng)導了中學課程改革實驗研究,其中課程評價委員會由俄亥俄州的州立大學教授泰勒主持,這就是美國教育歷史上著名的“八年研究”,也是教育評價問世的開始。,八年研究的內(nèi)容,泰勒教授選了30所參加實驗的高中學生,對這些學生進行了4年中學、4年大學學習的追蹤研究,歷時“八年”,這也是“八年”研究的由來。,八年研究的內(nèi)容,當時選進步學校和和傳統(tǒng)學校學生各1475人,按性別、年齡、種族、學業(yè)能力傾向、家庭、社會環(huán)境、職業(yè)興趣和嗜好等基本原則進行一一配對,進行比較。,八年研究的基本原則,評價是八年研究的有機組成部分,泰勒認為課程計劃和編制必須回答以下四個基本問題: 1、學校應幫助學生達到什么目標? 2、提供哪些教育經(jīng)驗才能實現(xiàn)這些目標? 3、怎樣才能有效組織這些教育經(jīng)驗? 4、怎樣才能確定這些目標正在得到實現(xiàn)?,八年研究的內(nèi)容,結(jié)果發(fā)現(xiàn): 來自實驗的學生在大學四年中,每年獲學術(shù)性榮譽略多; 具有更強的理智、好奇心和學習動機; 思維更精密、更系統(tǒng)、更客觀; 對教育的意義有更清晰的看法; 對新情況有更強的應變能力; 具有更有效的解決問題的辦法; 更多的參加有組織的學習團體; 獲得非學術(shù)的榮譽更多些; 對職業(yè)的選擇有更好的定向; 更積極的關(guān)注全國和全世界的事物。,新舊課程優(yōu)劣的評價比較,教育評價的問世,八年研究后泰勒等人的研究結(jié)論是: 舊課程及其教育測驗是教科書主義,測驗內(nèi)容只是要求學生記誦教材中的知識,是片面的,不能反映學生的全面發(fā)展。 泰勒提出:以全面發(fā)展的教育目標為核心和依據(jù)的兩條相互依存的原理,即課程編制原理和評價活動原理,也就是“泰勒原理”,教育評價的創(chuàng)始人泰勒,在八年工作報告即史密斯泰勒報告中,第一次提出“教育評價”,這個報告被稱為“劃時代的教育評價宣言”,宣布了教育評價的誕生。 給出了教育評價的原理、方法和手段,奠定了泰勒-“當代教育評價之父”的地位,同時也迎來了美國教育史上“泰勒時期“到來。,教育評價的發(fā)展,19401957年教育評價的平穩(wěn)期 特點: 教育評價的理論在不斷的進行深入研究 布魯姆完成教育目標分類學 教育評價活動沒有普及,評價的發(fā)展,這與當時美國的歷史背景有關(guān),二戰(zhàn)后,美國處于“籌劃與享受生活的時代”。 社會對教育的發(fā)展很少提出新的要求。,評價的發(fā)展,19571972批判泰勒模式時期 特點: 1957年前蘇聯(lián)的人造衛(wèi)星上天 引發(fā)美國對教育的不滿 開始批判泰勒教育模式,評價的發(fā)展,1972-現(xiàn)在 專業(yè)化時期 特點: 高等學校出現(xiàn)了許多教育評價的碩士、博士、博士后專業(yè)點 各類教育評價研究中心紛紛建立 美國有西密執(zhí)安大學評價中心、洛杉磯加里福尼亞大學研究中心等 教育評價專著、雜志大量出版 如:評價研究評價評論評價信息等,六 教育測量與評價理論的發(fā)展,1、測驗的統(tǒng)計模型為教育測量學科發(fā)展提供了強有力的理論支持 20C50年代前后形成的經(jīng)典測驗理論(Classical Test Theory ,簡稱CTT); 20C60年代創(chuàng)立的概化理論(GT)、項目反應理論(Item Response Theory, IRT) 以及認知診斷理論;,六 教育測量與評價理論的發(fā)展,2、教育目標分類學促進教育測量與教育評價的學科整合。 20C中葉以后,在泰勒行為目標評價理論的影響下,美國的布盧姆、克拉斯沃爾、哈羅和辛普森等人相繼完成了認知領(lǐng)域、情感領(lǐng)域和動作技能領(lǐng)域的教育目標分類。,六 教育測量與評價理論的發(fā)展,3、教育評價學科內(nèi)容的發(fā)展 泰勒行為目標模式 斯塔費爾比姆的CIPP模式(Context,Input,Process & Product) 斯克里文的目的游離模式(Goal free evaluation) 歐文斯的反對者模式(Adeversary model) 斯塔克的應答模式(Responsive model) 斯克里文提出的消費者導向模式(Consumer-oriented evaluation) 自然探究模式(Natural-inquiry model) 教育鑒賞和教育評論評價模式 元評價(Meta- evaluation ),六、 現(xiàn)代教育測量與評價的發(fā)展趨勢,教育測量與評價的政治性得到加強 教育測量與評價的教育功能得到強化 教育測量與評價的理論研究得到突破性進展 計算機技術(shù)的發(fā)展提高了測驗的效率 測量理論與認知心理學結(jié)合更加緊密,思考與討論,1、考試是不是評價? 2、評價=表揚或激勵? 3、傳統(tǒng)的教育評價存在哪些不足?,
收藏
- 資源描述:
-
,教育測量與評價,教育評價與測量黃光揚,畢業(yè)于湖南師范大學 講師 教育學碩士 國家二級心理咨詢師,個人聯(lián)系方式 電話:15874118045 Q Q: 851570859,曾祥志,一、課程學習的意義,教育測量與評價是所有成功教學的基礎,也是諸多教育決策的重要依據(jù)。 “評價是所有成功教學的基礎?!?格蘭朗德 “評價是重要的意圖不是為了證明,而是為了改進。” 斯塔費爾比姆,一、課程學習的意義,教育測量與評價是當今世界教育科學研究的三大領(lǐng)域之一。,國際性教育評價組織簡介:,國際教育評估協(xié)會:1975年在瑞士日內(nèi)瓦成立,當時有18個國家參加,其宗旨是幫助世界各地的教育機構(gòu)通過發(fā)展和應用評價技術(shù)來提高教育質(zhì)量和促進教育機會均等。 IAEA在20世紀80年代前后完成了兩個重要的研究項目: 其一,研究與編寫了教師用的評價指南,并譯成各種文字,以幫助世界各地區(qū)教師提高測驗的技能; 其二,為準備出國深造的學生,用多種語言文字編寫了熟練能力的國際測驗,以便學生以其愿意使用的語言參加能力測驗,然后附加所在國的語言測驗。,國際性教育評價組織簡介:,國際教育成就評價協(xié)會( International Association for the Evaluation of Educational Achievement) :1962年成立。我國1984年參加了IEA。 IEA組織的宗旨是開展和促進教育的多國研究,尤其是對基礎教育的質(zhì)量進行比較研究,探討共同的問題。,一、課程學習的意義,一、課程學習的意義,教育測量與評價主要是研究對教育現(xiàn)象進行測量和價值判斷的理論、方法和技術(shù)。 教育測量與評價是一門應用性的學科,但又是一門綜合性的課程。,一、課程學習的意義,教育測量與評價在教育改革中具有重要的作用 教育改革常常以教育測量與評價的改革為突破口; 考試與評價改革成為基礎教育新課程改革的重要內(nèi)容。,一、課程學習的意義,教育測量與評價是教師的專業(yè)素養(yǎng)和能力 正確評價學生的發(fā)展是教師職業(yè)能力的重要組成部分; 國外教師教育普遍開設“教育測量與評價”類課程。,二、教學目標,三、教學內(nèi)容的組織,四、教材和參考書,1.教育測量與評價華東師范大學出版社,黃光揚主編,2012年。 2.教育評價學高等教育出版社,涂艷國主編,2007年。 3.教育測量與評價廣東高等教育出版社,胡中鋒主編,1999年。 3.如何進行教育評價華語教學出版社,單志艷著,2007。 4.教育測量與評價高等教育出版社,王漢瀾主編,2002年8月。 5.教學中的測驗與評價中國輕工業(yè)出版社,董奇主編,2003年1月。 6.教育測量學人民教育出版社,張敏強著,1998年7月。 7.教育評價學人民教育出版社,陳玉琨著,1999年12月。 8.回歸生活的中小學教育評價浙江大學出版社,賈群生著,2004年。,四、學習與考核方式,課堂講授為主,輔之以課外集體討論學習。 結(jié)合各自的實際情況,學以致用,要求積極參與討論,保質(zhì)保量地完成作業(yè)。 計分辦法:平時作業(yè)、考察占30,期末考試70。,第一章 教育測量與評價的學科發(fā)展,第一節(jié) 教育測量與評價的基本問題 第二節(jié) 教育測量與評價的發(fā)展歷史 第三節(jié) 教育測量與評價的學科地位和作用,第一節(jié) 教育測量與評價的基本問題,測量,教育測量,教育評價,一、測量的含義與要素,(一)測量的含義 史蒂文斯:從廣義而言,測量系根據(jù)法則給事物分派數(shù)字。 測量這一定義包含了三方面的特性: 1、法則給事物的屬性分派數(shù)字的依據(jù) 2、事物測量的對象或目標 3、數(shù)字描述事物屬性的符號,一、測量的含義與要素,(一)測量的含義 測量即: 根據(jù)某些法則與程序 用數(shù)字 對事物在量上的規(guī)定性 予以確定和描述的過程,(二)測量的三要素,1、單位 具有明確的意義 要有相等的價值 2、參照點 絕對零點 相對零點 3、量表 具有一定單位和參照點的連續(xù)體 具有準確性 具備操作的簡約性 教育測量工具:試卷 測試題 重視命題的研究,二、教育測量的含義與特點,(一)教育測量的含義: 教育測量即: 根據(jù)測量學的原理和方法 針對學校教育影響下學生各個方面的發(fā)展 側(cè)重從量的規(guī)定性上 予以確定和描述的過程 思考: 心理屬性是否也可以客觀地進行測量呢?,二、教育測量的含義與特點,(一)教育測量的含義: 教育測量即: 根據(jù)測量學的原理和方法 針對學校教育影響下學生各個方面的發(fā)展 側(cè)重從量的規(guī)定性上 予以確定和描述的過程 思考: 心理屬性是否也可以客觀地進行測量呢?,兩個理論基礎:,桑代克:無論什么東西,只要存在,總存在于數(shù)量之中。 精神與社會測量導論 麥克爾:任何東西,存在于數(shù)量中的,都可以被測量。 麥柯爾(W.A.mecall),美國近代教育測量專家,近代西方教育實驗理論和方法在中國傳播歷程中的關(guān)鍵性人物。 這兩句話,看成是構(gòu)成一切測驗和量化評價的公理。,(二)教育測量的特點,1、測量結(jié)果的間接性和推斷性 2、測量對象的模糊性和測量誤差的不可避免性 3、量表具有多樣性,結(jié)果具有相對抽象性,量表的類型,1. 類別量表(norminal scale)稱名量表 2. 順序量表(ordinal scale)位次量表 根據(jù)事物的特性和設定的法則在分類的基礎上確定同類客體中各元素之間的相對順序,只關(guān)心研究對象的順序,不問津間距是否一致。 3. 等距量表(interval scale)間距量表 在賦值時有相等的度量單位,采用相對零點,被測所對應的測量值由明確的距離關(guān)系 4. 比率量表(ratio scale) 采用絕對零點,針對總體而不是樣本,不但能確定一個被測比另一個被測大(小)多少,而且還能得出其間的倍數(shù)關(guān)系,有關(guān)量表水平的說明,說明: 事物的復雜性決定測量量表的不同層次和水平 四種量表的測量水平由前往后逐漸提高,信息量不斷增大,前一種量表的特點和功能蘊涵于后一種量表之中。(定性、定量) 不可過分苛求測量的高層次 不能把低層次量表的數(shù)據(jù)按高層次量表的意義理解或作統(tǒng)計處理 教育測量是在順序量表上進行的,但需要用等距量表報告分數(shù) 加強命題的研究 把原始分數(shù)轉(zhuǎn)換到一個有相等單位的量表上,通常轉(zhuǎn)化為標準分 教育測量中使用的量表: 百分量表 百分等級量表 標準分數(shù)(Z)量表 T量表,問題思考:,1、在百分制的評分方法中,60分比55分多5分,90分比85分多5分,這兩個相差的5分,是否是由相等的標準來確定的? 2、一個在測量中得80分的學生的知識量是否等于在同一測驗中得40分學生知識量的兩倍?,結(jié)論:,教育測量的度量單位是相對的,使得教育測量具有不等距性和不穩(wěn)定性。 一個學生的學業(yè)成績好壞、智力高低和能力大小等,都是就其在所在團體的整個分數(shù)序列、行為序列中的地位來說的,其測量的分數(shù)單位,并非絕對的。 為了使教育測量的分數(shù)具有可靠性、可比性,必須根據(jù)標準測量的原理和方法,編制測驗量表,制定科學的評分標準和方法,并將測量所得的原始分數(shù)轉(zhuǎn)換為可以直接比較的量表分數(shù)(百分等級分數(shù)、標準分數(shù)、T分數(shù)等)。,三、教育評價的概念與特點,評價泛指 衡量、判斷 人物或事物的 價值 教育評價: 由美國泰勒于1930年首次提出,在美國國會1965年通過的初等及中等教育法案中得以合法化。,拉爾夫泰勒(Ralph Tyler)“當代課程評價之父”、“現(xiàn)代課程理論之父”,“評價過程在本質(zhì)上是確定課程和教學大綱在實際上實現(xiàn)教育目標的程度的過程?!?課程與教學的基本原理 (Basic Principles of Curriculum and Instruction)被譽為“現(xiàn)代課程理論的圣經(jīng)”。,日本的橋本重治:,“評價是與教育的目標和價值有明確關(guān)系的概念,是按照教育目標和價值觀對學生的學習成果及教育計劃的效果等進行測量的過程。因此,評價概念的重點在于以教育目標為標準的價值判斷?!?日本的橋本重治:,他規(guī)納出評價五大特點: 評價離開了教育目標就不能成立; 評價是囊括性的; 評價是連續(xù)的; 評價不僅是教師進行的,學生自身也要展開自我評價和相互評價; 評價法必須提高到科學的高度。,格蘭朗德:,評價是為了確定學生達到教學目標的程度,收集、分析和解釋信息的(課堂)系統(tǒng)過程。 一個完整的評價計劃可用公式表達為: 評價測量(定量描述)非測量(定性描述)價值判斷,斯塔費爾比姆:,“評價最重要的意圖不是為了證明,而是為了改進。” “評價是一種劃定、獲取和提供敘述性和判斷性信息的過程。這些信息涉及研究對象的目標、設計、實施和影響的價值及優(yōu)缺點,以便指導如何決策、滿足教學效能核定的需要,并增加對研究對象的了解。”,美國教育評價標準委員會:,“教育評價是對教育目標和它的優(yōu)缺點與價值判斷的系統(tǒng)調(diào)查,為教育決策提供依據(jù)的過程”。(1981年提出),布魯姆(B.S.Bloom) :,“據(jù)我看來,評價乃是系統(tǒng)收集證據(jù)用以確定學習者實際上是否發(fā)生了某些變化,確定學生個體變化的數(shù)量或程度?!?“評價是為了某個目的而進行的,對各種想法、作品、解答、方法、資料等的價值作出判斷的活動。,華東師范大學陳玉琨教授:,教育評價是對教育活動滿足社會與個體需要的程度作出判斷的活動,是對教育活動現(xiàn)實的(已經(jīng)取得的)或潛在的(還未取得,但有可能取得的)價值作出判斷,以期達到教育價值增值的過程。,教育評價的概念,“教育評價”包含如下幾個共同的要點: 第一,強調(diào)以教育目標為標準的價值判斷過程; 第二,強調(diào)用多種方法(測量和非測量)系統(tǒng)收集資料與信息; 第三,教育評價的對象應該是“教育者的發(fā)展變化及構(gòu)成其變化的各種因素?!边@就既包括了學生評價,也包括了教師評價等與學生成長發(fā)展相關(guān)的所有因素。 第四,強調(diào)為學生發(fā)展和教育決策服務,評價的最終目的是為了改進與發(fā)展。 第五,不同時期,不同學者所提出的教育評價概念的側(cè)重點有所不同。,教育評價,注重效果:美國的泰勒(側(cè)重課程評價) 格蘭朗德和布盧姆基于教學評價和學生評價,注重資料的獲得:(美)克龍巴赫、 斯塔弗爾比姆,注重評價方法、手段:(中國)張秀理、 (日本)長谷川容,教育評價的概念,教育評價即: 根據(jù)一定的標準(教育目標的達成與否) 運用可行的方法(測量、非測量、系統(tǒng)收集資料信息的方法) 對教育的要素、過程和效果(教育計劃、課程、學習結(jié)果、教育現(xiàn)象、教學活動、教育目標或程序) 進行價值評判的活動(為學生發(fā)展、教育決策等),四、教育評價相關(guān)概念辨析,教育測量與教育評價 教育統(tǒng)計與教育評價 教育評估與教育評價,教育測量與教育評價,二者的聯(lián)系: 教育測量:根據(jù)一定的理論、規(guī)則,運用一定的測量工具對教育現(xiàn)象進行數(shù)量化描述的過程; 教育測量為教育評價提供客觀的數(shù)據(jù)信息,是教育評價的基礎,教育評價要在教育測量所獲得的客觀信息的基礎上進行 。,教育測量與教育評價,二者區(qū)別: 測量:對事物數(shù)量特征的獲得,強調(diào)數(shù)量化的方法與結(jié)果;評價:對教育現(xiàn)象客體的價值進行判斷,強調(diào)定性與定量相結(jié)合的方法 測量:客觀性;評價:客觀性與主觀性的兩種屬性 測量:任務是對事物的量的認識;評價:認識活動,人的意識對實踐活動及其結(jié)果的綜合反映,教育測量與教育統(tǒng)計,教育測量與統(tǒng)計是教育評價獲取教育事實材料的一種定量手段。 教育統(tǒng)計運用數(shù)理統(tǒng)計的原理與方法,對教育測量獲得的數(shù)據(jù)信息進行整理、描述、推斷的過程。 描述統(tǒng)計:計算一個學生各門功課的總成績;計算一個班級一門或多門課程成績的平均分、標準差(常模); 推斷統(tǒng)計:把學生個體成績與全班平均分相比,對進步情況進行推斷;把兩個班級平均分相比較,對教材、教學方法效果進行推斷。 因此: 測量結(jié)果需要進行整理和描述。 統(tǒng)計在測量結(jié)果的基礎上進行,測量結(jié)果是統(tǒng)計的前提; 統(tǒng)計包括描述統(tǒng)計與推斷統(tǒng)計。,1904年以前,教育測量的萌芽期 19041915年,教育測量的開拓 1915-1930年,教育測量的興盛期 1930-1940年,教育測量的批判期 1929-1933年,教育評價的產(chǎn)生 1940-1957年,教育評價的平穩(wěn)期 19571972年,批判泰勒模式時期 1972-現(xiàn)在,專業(yè)化時期,第二節(jié) 教育測量與評價的發(fā)展歷史,1904年以前(教育測量的萌芽期),中國是考試制度的發(fā)源地 606年以前,中國古典教育評價萌生期 先秦至魏晉南北朝時期,選士測評活動 西周、春秋:選士制(德行與道藝) 兩漢:察舉制(最早的試題;對策、射策;太學博士官) 魏晉南北朝:九品中正制(曹操創(chuàng)建,上上、上中、上下),1904年以前(教育測量的萌芽期),中國是考試制度的發(fā)源地 606年1905年,科舉時期 隋唐以來至清末,科舉考試為主要手段 以封建禮教為基本標準,對個人學識德能進行測評判斷 科舉制的特征:逐級考核、制度完備、考場嚴格、命題規(guī)范 科舉制的考核方法:口試、貼經(jīng)、墨義、策間、詩賦,中國科舉制度的世界地位,(法)伏爾泰:“人類精神,肯定想象不出比這樣的政府更好的政府。在這個政府里,重要的衙門彼此統(tǒng)屬,任何事情都在那里決定,而其成員,都是先經(jīng)過幾場嚴格的考試的。”,中國科舉制度的世界地位,孫中山:“現(xiàn)在各國的考試制度,差不多都是學英國的。窮流溯源,英國的考試制度,原來還是從我們中國學過去的。” 英國在1570-1870年期間,用英文出版有關(guān)中國文官制度和政治制度的書籍70多種,大量介紹與研究中國的科舉制度,極力主張英國政府實行中國式的文官考試制度。(英國在1855年建立了文官考試制度。),1845年美國賀拉斯曼將“筆試”引入美國 1864年英國費舍的作業(yè)量表集 1897年美國賴斯的拼字實驗,1904年,桑代克精神與社會測量導論的問世,標志著以科學理論為指導的教育測量理論的誕生。 桑代克:無論什么東西,只要存在,總存在于數(shù)量之中 麥克爾:任何東西,存在于數(shù)量中的,都可以被測量 這兩句話,看成是構(gòu)成一切測驗和量化評價的公理。 1909年,桑代克根據(jù)“等距原理”發(fā)明了編制量表的單位,編制了標準化的測驗量表。,19041915年教育測量的開拓期,在桑代克的影響下,教育測量的運動轟轟烈烈的開展: 測驗品種有算術(shù)測驗、書法測驗、學科測驗、智力測驗、個性測驗、興趣測驗等,在數(shù)量上已有3000多種 20世紀初,心理測驗就已走上標準化與客觀化的路程。 法國比納等人1905年創(chuàng)編并發(fā)表了世界上第一個標準化智力測驗; 英國斯皮爾曼“能力結(jié)構(gòu)二因素學說”與英國著名的11歲兒童考試制度 美國伍德沃斯的第一個標準化人格測驗,1915-1930年教育測量的興盛期,1930-1940年教育測量的批判期,對教育測量批判的原因,教育測量雖然能使教育成就定量化、客觀化、標準化;但畢竟不能測量出人的學力和人格的全部內(nèi)容。 第一次大戰(zhàn)以后,人們的教育觀點發(fā)生了很大的變化,不在將教育看成是單純的傳授知識,而是將人的全面發(fā)展作為教育目標。而人的全面的重要因素如:社會道德、人的情緒態(tài)度、動機 興趣、鑒賞力等是不能光靠測量的。,對教育測量批判的原因,教育測量存在的弊端: 為測量而測量,盲目追求量化,忽視教育服務對象的整體目標與價值。 教育測量的理論基礎只有心理學、統(tǒng)計學和測量學,而沒有教育學原理。,教育評價產(chǎn)生的社會背景,19291933年席卷美國、波及全球的經(jīng)濟大蕭條 社會與教育危機四起 生產(chǎn)過剩、工廠倒閉、工人下崗 學校因經(jīng)濟不景氣,部分學校關(guān)閉,有些學校的班級減少。 整個社會和教育皆處于反省之中,教育評價產(chǎn)生的社會背景,1930年美國有25%的失業(yè),青年近乎100%找不到工作,1910年1417歲的青年17%上大學,而到1930年上升到51%。 有相當一部分人上高中并不想上大學,而當時的美國高中設課就是為了上大學服務的,為此中學設課與失業(yè)青年的需求就產(chǎn)生了尖銳的矛盾。,美國的“八年研究”是教育評價的催生劑,美國進步主義聯(lián)盟負責人艾欽于19331940年領(lǐng)導了中學課程改革實驗研究,其中課程評價委員會由俄亥俄州的州立大學教授泰勒主持,這就是美國教育歷史上著名的“八年研究”,也是教育評價問世的開始。,八年研究的內(nèi)容,泰勒教授選了30所參加實驗的高中學生,對這些學生進行了4年中學、4年大學學習的追蹤研究,歷時“八年”,這也是“八年”研究的由來。,八年研究的內(nèi)容,當時選進步學校和和傳統(tǒng)學校學生各1475人,按性別、年齡、種族、學業(yè)能力傾向、家庭、社會環(huán)境、職業(yè)興趣和嗜好等基本原則進行一一配對,進行比較。,八年研究的基本原則,評價是八年研究的有機組成部分,泰勒認為課程計劃和編制必須回答以下四個基本問題: 1、學校應幫助學生達到什么目標? 2、提供哪些教育經(jīng)驗才能實現(xiàn)這些目標? 3、怎樣才能有效組織這些教育經(jīng)驗? 4、怎樣才能確定這些目標正在得到實現(xiàn)?,八年研究的內(nèi)容,結(jié)果發(fā)現(xiàn): 來自實驗的學生在大學四年中,每年獲學術(shù)性榮譽略多; 具有更強的理智、好奇心和學習動機; 思維更精密、更系統(tǒng)、更客觀; 對教育的意義有更清晰的看法; 對新情況有更強的應變能力; 具有更有效的解決問題的辦法; 更多的參加有組織的學習團體; 獲得非學術(shù)的榮譽更多些; 對職業(yè)的選擇有更好的定向; 更積極的關(guān)注全國和全世界的事物。,新舊課程優(yōu)劣的評價比較,教育評價的問世,八年研究后泰勒等人的研究結(jié)論是: 舊課程及其教育測驗是教科書主義,測驗內(nèi)容只是要求學生記誦教材中的知識,是片面的,不能反映學生的全面發(fā)展。 泰勒提出:以全面發(fā)展的教育目標為核心和依據(jù)的兩條相互依存的原理,即課程編制原理和評價活動原理,也就是“泰勒原理”,教育評價的創(chuàng)始人泰勒,在八年工作報告即史密斯泰勒報告中,第一次提出“教育評價”,這個報告被稱為“劃時代的教育評價宣言”,宣布了教育評價的誕生。 給出了教育評價的原理、方法和手段,奠定了泰勒-“當代教育評價之父”的地位,同時也迎來了美國教育史上“泰勒時期“到來。,教育評價的發(fā)展,19401957年教育評價的平穩(wěn)期 特點: 教育評價的理論在不斷的進行深入研究 布魯姆完成教育目標分類學 教育評價活動沒有普及,評價的發(fā)展,這與當時美國的歷史背景有關(guān),二戰(zhàn)后,美國處于“籌劃與享受生活的時代”。 社會對教育的發(fā)展很少提出新的要求。,評價的發(fā)展,19571972批判泰勒模式時期 特點: 1957年前蘇聯(lián)的人造衛(wèi)星上天 引發(fā)美國對教育的不滿 開始批判泰勒教育模式,評價的發(fā)展,1972-現(xiàn)在 專業(yè)化時期 特點: 高等學校出現(xiàn)了許多教育評價的碩士、博士、博士后專業(yè)點 各類教育評價研究中心紛紛建立 美國有西密執(zhí)安大學評價中心、洛杉磯加里福尼亞大學研究中心等 教育評價專著、雜志大量出版 如:評價研究評價評論評價信息等,六 教育測量與評價理論的發(fā)展,1、測驗的統(tǒng)計模型為教育測量學科發(fā)展提供了強有力的理論支持 20C50年代前后形成的經(jīng)典測驗理論(Classical Test Theory ,簡稱CTT); 20C60年代創(chuàng)立的概化理論(GT)、項目反應理論(Item Response Theory, IRT) 以及認知診斷理論;,六 教育測量與評價理論的發(fā)展,2、教育目標分類學促進教育測量與教育評價的學科整合。 20C中葉以后,在泰勒行為目標評價理論的影響下,美國的布盧姆、克拉斯沃爾、哈羅和辛普森等人相繼完成了認知領(lǐng)域、情感領(lǐng)域和動作技能領(lǐng)域的教育目標分類。,六 教育測量與評價理論的發(fā)展,3、教育評價學科內(nèi)容的發(fā)展 泰勒行為目標模式 斯塔費爾比姆的CIPP模式(Context,Input,Process & Product) 斯克里文的目的游離模式(Goal free evaluation) 歐文斯的反對者模式(Adeversary model) 斯塔克的應答模式(Responsive model) 斯克里文提出的消費者導向模式(Consumer-oriented evaluation) 自然探究模式(Natural-inquiry model) 教育鑒賞和教育評論評價模式 元評價(Meta- evaluation ),六、 現(xiàn)代教育測量與評價的發(fā)展趨勢,教育測量與評價的政治性得到加強 教育測量與評價的教育功能得到強化 教育測量與評價的理論研究得到突破性進展 計算機技術(shù)的發(fā)展提高了測驗的效率 測量理論與認知心理學結(jié)合更加緊密,思考與討論,1、考試是不是評價? 2、評價=表揚或激勵? 3、傳統(tǒng)的教育評價存在哪些不足?,
展開閱讀全文