發展
自19世紀中葉起到本世紀30年代的八十多年,為教育評價的第一個時期──"心理測驗時期",教育測量的研究取得了一系列的成果,在考試的定量化、客觀化與標準化方面,取得了重要的進展。強調以量化的方法對學生學習狀況進行測量。然而,當時的考試與測驗只要求學生記誦教材的知識內容,較為片面。無法真正反映學生的學習過程。到20世紀30年代~50年代是教育測量的第二個時期──"目標中心時期",
泰勒(Tyler,R)提出了以教育目標為核心的教育評價原理,即教育評價的泰勒原理,並明確提出了"教育評價"(education evaluation)的概念,從而把教育評價與
教育測量區分開來,教育評價學就是在泰勒原理的基礎上誕生與發展起來的。在西方,一般人們都把泰勒稱為"教育評價之父"。60年代是教育測量的第三個時期──"標準研製時期"(20世紀50~70年代),以
布盧姆為主的教育家,提出了對教育目標進行評價的問題,由美國教育學家斯克里文(Scriven,M.)、
斯塔克(Stake,R.E.)和開洛洛(Kellogg,T.E.)等人對教育評價理論作出巨大的貢獻。學者們把1967年界定為美國教育評價發展的轉折點。到了20世紀70年代以後,教育評價發展到第四個時期──"結果認同時期"。這一時期在非常關注評價結果的認同問題。關注評價過程,強調評價過程中評價給予個體更多被認可的可能。總之,重視評價對個體發展的建構作用,因此,又稱為"個體化評價時期"。
20世紀30年代以來興起的現代教育評價主要有這幾方面的特點:
1. 評價目的轉變。早期的教育評價主要為了“選拔適合教育的兒童”,而現代教育評價的目的則更注重“創造適合兒童的教育”,即由重視鑑定轉向更加重視改進教與學,以最大限度地形成教育目標;
2. 評價對象的擴展。早期教育評價對象主要是教學領域,集中在對學生的學習成績的評定上,以此為基礎對教學計畫和課程編制的優劣得失作出判斷,現代教育評價的對象擴展到了所有教育領域,巨觀和微觀教育活動的一切方面皆可作為評價對象;
3. 評價結果形式的革新。早期教育評價既重視以數量的形式表示評價結果,也重視用語言描述的形式表示評價結果,還重視以數量和描述相結合的形式表示評價結果;
4. 強調評價對象的參與。早期教育評價把評價對象看作只是被動地接受評價,現代教育評價則把評價對象看作是評價的主體,強調評價對象自我評價的重要性,並引導評價對象參與從指定評價方案到取得評價結果的全過程上,強調評價對象對評價結果的認同。
迄今為止,人類教育評價走過了這樣一條歷史途徑:從觀察、測量到測量與質性研究並重,並給出診斷和意義以及價值判斷。教育評價的發展大致經歷了測量、描述、判斷、建構和綜合等階段。
第一代教育評價叫測量。測量是獲取教育數據的有效可靠方法,主要追求測量與測量結果的標準化、客觀化,主要是測量技術與手段大量套用(真分數理論與技術的套用)。
第二代教育評價是描述。描述是對測量所得數據進行事實還原,再解釋學生學習達成教育目標的程度,主要以教育目標理論或概化理論為套用,對每一次測驗與考試的結果進行描述或描述性分析。這種“雙基”測驗與考試,正是導致“應試”的技術源頭。
第三代教育評價叫判斷。描述對於目標而言,具有統一性,而學生是多元化的、個性化的,所以在判斷學生價值上就出現了衝突。追求學生認知的多元化,就導致了必須以多元化的價值標準來判定學生髮展。在此背景下,根據測量所得的事實判斷學生髮展情況、以能力傾向判斷學生髮展的項目反應理論產生。對於這類評價來說,制定價值判斷標準尤為重要。
20世紀80年代,第四代教育評價——“建構”時代開始了,主要研究教育建構過程、方法和特徵,認知診斷理論和多維項目反應理論成為這個時期教育評價研究和套用的主流。認知診斷理論以“知識結構+認知結構+思維模型”為基礎,對認知的形成過程做出診斷和判斷,即對教育的過去進行診斷和判斷。多維項目反應理論則是對多重顯性能力測量並對學生的未來發展做出診斷與預測,即對教育未來進行診斷和判斷。
評價類型
依據評價標準,可分為相對評價、絕對評價和個體內差異評價、常模參照評價與標準參照評價;依據評價的功能,可分為診斷性評價、形成性評價、終結性評價;依據評價對象的範疇,可分為整體評價和單項評價、群體評價和個體評價;依據評價學校的級次,可分為高等學校評價、中等學校評價、初等學校評價;依據評價學校的類別,可分為職業學校評價、專業學校評價、師範學校評價、特殊教育學校評價;依據評價主體的身份,可分為自我評價與他人評價;依據是否採用數學方法,可分為量化評價與非量化評價等。
(一)診斷性、形成性與總結性評價
診斷性評價指對評價對象的現實狀況及存在的問題、產生的原因所進行的價值判斷。在教學活動過程中進行的診斷性評價,其主要目的是分析原因,以便對症下藥採取相應的改進手段。良好的診斷評價有助於教師把學生適當地分置在教學順序中,正確找出妨礙學生學習的原因,從而保證教與學的成功。
形成性評價指對正在進行的教育活動作出的價值判斷,也稱過程性評價,其特點是通過及時揭示問題、及時反饋以促進工作的改進。形成性評價一般以反饋調控和改進完善為主要目的。如對教學過程開展形成性評價,往往是通過診斷教學方案、計畫、過程、進展情況和存在問題,並及時反饋,及時改進、調控、校正,以達到提高教學質量的目的。我國將形成性評價運用擴展到整個學校教育領域,控制學習工作過程,及時或定期檢查學校各項計畫的執行情況,分析工作上的問題,及時加以改進。
總結性評價指對評價對象一定時期內的全面狀況所進行的價值判斷,也稱終結性評價,總結性評價旨在對教育活動作出總結性的結論,甄別優劣,鑑定分等,為各級決策人員提供參考依據。這種評價注重對教育活動的結果作總體分析,提供描述性信息,關心對效率的陳述,並強調自身的效果。其特點是在學習或教學活動後,就學習或教學的效率,對學生、教師或課程編制者作出價值判斷。評價者一般應獨立於計畫實施者及協助者,以保證對評價對象持客觀態度,得出可靠的結論。
(二)常模參照評價與標準參照評價
在教育評價中,由於評價基準不同,解釋也就不同,常將它們分為目標參照評價和常模參照評價,又稱絕對評價和相對評價。
目標參照評價,又稱絕對評價,它是指以預先設定的、期待的教育目標為評價基準,來衡量評價對象到達完滿程度的一種評價。有人也稱它為標準參照評價。在學校以學生為教育對象的測定中,關心的是每一個學生的發展,因此也叫做到達度評價,學校中教學評價多屬於此類。
常模參照標準評價,又稱相對評價,它是指在某一個集團中(班級、學校、地區、國家),以這個集團的平均狀況為基準,評價每個被評對象在這個集團中所處的相對位置的一種教育評價。它的客觀性很強,並已經經過近百年的發展,有一套測量和統計方法,它適用於選拔性考試。它是以常態分配的理論為基礎,所表示的是學生之間的比較,而與教育目標無很大直接的關係。一般大型的標準化考試、升學考試、心理測試,以及各種競賽性考試等屬於此類評價。
如果是用測驗來進行上述兩種評價,那么這兩種評價方式又稱為常模參照測驗和標準參照測驗。這兩種測驗的主要差異在於解釋分數的方法不同。
常模參照測驗,是指參照常模群體的水平解釋分數的測驗。常模群體可以是一個特別選定的團體,也可以是被測者所在群體本身。常模群體的平均分數(或百分數等)一般可以反映它的水平,稱為常模。以常模為參照點,將被測個人的成績與常模比較,並把比較的結果所反映出來的差異數量化,參照常模解釋分數,便於個體間的比較和選拔工作的進行。
標準參照測驗,它是指依據某種特定操作標準可以直接解釋測量結果的測驗。操作標準一般可以通過界定個體所應該完成的任務確定。對標準參照測驗來說,它的分數解釋是以界定良好的任務或行為領域為基礎的,是與預先設計的特定標準相對照所確定的,有了這個條件,我們便可以從較少的有代表性的測驗題目的反反應情況,推斷出被試的真實水平。用目標表示領域,並且題目是該領域中行為的有代表性樣本,這時的目標參照測驗就是標準參照測驗。標準參照測驗主要用於鑑定的目的。
(三)量化評價與質性評價
量化評價顧名思義主要是一種數量化的評價,它主要運用統計與測量的方法,對被評價的資料信息進行數位化處理;質性評價主要是在描述的基礎上進行評判,通常表現為書面的“鑑定”或“評語”。一般來講,書面的評語通常比簡單的分數或等級更清晰地傳達出被評價者的優點與缺點,但這種評價方法不夠精確,且主觀性較強。
評價定義
評價是一種價值判斷的活動,是對客體滿足主體需要程度的判斷。教育評價是對教育活動滿足社會與個體需要的程度做出判斷的活動。是對教育活動現實的(已經取得的)或潛在的(還未取得,但可能取得的)價值做出判斷,以期達到教育價值增值的過程。
從人們對教育評價的觀點來看,可以將教育評價視為根據一定的教育價值觀或教育目標,運用可行的科學手段,通過系統地蒐集信息資料和分析整理,對教育活動、教育過程和教育結果進行價值判斷,從而不斷自我完善和為教育決策提供依據的過程。這是一般定義,它適用於對普通教育領域裡各種教育現象進行價值闡述。其特點主要有:教育評價是一個過程,是一種有一定程式和系統活動過程;教育評價以一定教育目標或一定教育價值觀為依據;教育評價以對評價對象的功能、狀態和效果進行價值判斷為核心;教育評價以科學的評價方法、技術為手段;教育評價最終目的在於不斷完善評價對象行為,提高教育質量,為教育決策服務。
根據這一定義,進行教育評價的一般步驟是:1. 確定分析評價目標,指定評價方案,做好評價的準備工作;2. 選擇評價開始時間,蒐集評價對象信息,並加以整理;3. 分析評價信息形成評價結論;4. 根據評價結果,提出改善評價對象行為,達到預期目標。
在研究評價時,我們要注意評價、評估和測量(Evaluation、Assessment、Measurement)的區別。評價、評估和測量所共同者為測驗。它們常常(但不總是)使用測驗,然而它們當眾沒有一個與測驗同義,並且這三個過程各自所要求的測驗種類可能也不同。
測量指“將一數字表示的量指派於.......”這一定義適用於大多數的教育情景,許多智慧能力或教育方面其他的量只能間接地測量。這樣的測驗典型地用來測量這樣的量,如這裡水平、在不同情境中套用一原理的能力、習得或遺忘的材料有多少。測量很少是為測量而測量的,它可以包括在一項評估或評價之中,但是更宜將它看作為一種基本的研究步驟。
評估這個術語應當儘可能地專用於人。它包括的活動主要有:分等第(正式的和非正式的)、考察、鑑定等等。我們可以評估學習在特定科目上所取得的成就,可以評估應試者從事特定職業的能力傾向,可以評估教師的從教能力,等等。
人們一般把“教育評價”這個術語專用於計畫課程和各組組織變數這樣的抽象實體。這一用法含有對某事物的重要性或價值作估量的意思,這通常涉及到與其他的方案、課程或組織模式作比較。正像可以將評估描述為是大多數教育工作者所做的一種例行活動一樣,評價是主要從事研究和發展工作的人們所進行的一項活動。
評價目的
(1)管理人員為教育提供了人力和財力,他們想知道究竟他們的計畫是否順利進行,唯一的途徑是了解學生在課程學習中實施的情況如何。如果評價的結果與他們所期待的不同的話,他們就要調整計畫,以便日後能更好地完成任務。
(2)教師把管理人員的計畫付之實施,他們想知道在教學過程中已做了些什麼,下一步該做什麼;學生已經掌握的或能做的東西;不知道或不能做的東西。如果想計畫順利地進行,很大程度上得看教師能否最終實現計畫的表現。
(3)沒有人會比家長更想知道自己的孩子在學校學得怎么樣。家長不能看見學生在課堂上的表現,他們得從學校和教師對孩子的表現的反饋中做出評價。
(4)最後是──學生想知道他們完成任務的情況,知道他們今後該怎么做,從自己的成功中獲得信心和滿足感。
評價功能
(一)導向、監督功能
教育評價意義之一就是通過評價手段得出實證性發現和診斷性意見,能夠為區域教育質量的提升、教育行政部門制定政策、改進工作提供數據支持和科學參考及有效監督。
(二)鑑定、管理功能
鑑定是教育評價最根本最主要的功能,鑑定的目的在於檢驗教育工作和教學成果,從而為提高教育質量、完善教育管理系統、規範教學秩序、加強對教育工作者的專業培訓等提供依據。
(三)診斷、激勵功能
對學生在學業、綜合素質、發展潛能等方面的現狀、矛盾和問題進行診斷,分析原因,“對症下藥”。
評價原則
教育評價原則是教育評價規律的反映,是教育評價活動成功與否的主要因素之一,對教育評價活動具有普遍的指導意義,教育評價原則是以對教育評價過程基本規律的主觀反映為基礎而做出的,是教育評價主要經驗的總結和概括,具有主觀和客觀雙重屬性,其客觀性主要體現在違背或偏離了教育評價過程中的客觀規律,教育評價的原則就是不能有效地規範、約束和指導教育評價活動,其主觀性則體現在按照評價者的評價要求、主要意圖、評價活動的歷史局限和主體水平的局限等,因而原則的概括和套用都帶有主觀性。
(一)效用評價
效用評價指對某種教育行為、方式具有的效力和作用所進行的價值判斷。在效用評價中,將教育行為或方式看作一種商品或服務,評價的是它在特定時期內滿足人的需要的能力。效用本身與受教育對象的感受,與社會價值沒有必然聯繫,它注重的是一定教育行為方式下,教育對象或群體發生的變化程度。教育對象發生的變化被賦予價值觀,就有正效用與負效用之分。教育行為及方式的效用是其客觀存在的屬性,但會因人、因時、因地而異。同一教育行為對不同教育對象,其效用是不可比的。同一教育行為在不同時期或不同地點,其效用也可能不同。效用可以分為確定情況下的效用和不確定情況下的效用。評價前者時只考慮確定因素,而不考慮隨機因素;評價後者時不僅考慮確定因素,也考慮隨機因素。
(二)定性評價與定量評價相結合
評價方法按是否採用數學方法分類可以分為定性評價與定量評價。定量評價是指採用定量計算的方法,即手機數據資料,用一定的數學模型或數學方法,採取統計處理手段進行的評價。定性評價是指不通過定量計算的方法,而是採用定性描述、解釋的方法作出的價值判斷。但定性評價也必須有評價的標準和依據,也必須在取得有關資料的基礎上作出科學判斷。
人們對於教育評價中的數量化方法越來越重視了。在教育評價中排斥數量化的方法是不對的。但是,如果過分強調數量化方法也是不對的。第一,數量化方法固然很需要,也很重要,但它並不是進行教育評價的唯一方法。如果認為教育評價必須都數量化,很多教育現象由於不能數量化,因而會有許多教育現象會被排斥在評價範圍之外,這樣對教育的發展是不利的。第二,過分強調數量化的人往往誤認為用數量化方法進行評價最客觀、最準確,但實際上用數量化方法並不能排除評價工作中的主觀因素的影響。從累計分數法中,我們可以看出,儘管採用了數量化方法,而在實際評價中把教育問題轉化成數學問題時,或者是對用數學方法導出結果進行解釋時都難免摻雜主觀因素。那種認為只要運用了數學方法就是實現了客觀化的想法是幼稚的。數量化方法與非數量化方法各有所長,也各有所短。因此,在評價工作中,不宜提倡一種方法而拋棄另一種方法。
(三)靜態評價與動態評價相結合
靜態評價是對評價對象目標到達程度的評價,其特點是不考慮原油狀態和發展趨勢,只考慮評價對象在特定時空範圍內的現實狀況。它有利於橫向比較,有利於強化競爭機制,但無法進行縱向比較。動態評價是根據動態原理提出的進行教育評價活動的行為法則。其基本要求是教育評價過程中要注意對評價對象的歷史情況、發展水平及發展趨勢進行評價,並研究其對一定社會需要的敏感程度和回響能力。另外,評價的目的、內容、標準、方式應隨時間的變化而逐步改進,評價的結論也應根據教育活動、教學水平的發展而不斷修正。動態評價的使用有利於指導、激發被評價對象的進取精神,明確前進方向,有利於激發評價對象的進取精神,但無法進行橫向比較。只有將靜態評價與動態評價結合起來,才能相互補充,避免出現相對主義現象。
(四)他人評價與自我評價相結合
他人評價指評價對象自身以外任何客體實施的評價,也叫“外部評價”。它包括除“自我評價”以外的所有評價。如社會評價、領導評價、同行評價、行政評價、學生評價等。他人評價有以下特點:客觀性強,用他人的新角度審視同一事物可以避免主觀片面性;真實性強,可避免對自己評價過低或者評價過高;要求嚴格,參與評價和組織評價的人員都不是清楚自己的身份與職責,因而能夠比較認真負責地完成評價工作。他人評價的主要缺點是在組織實施的過程中耗費的人力與財力都比較多,因而不宜頻繁進行。
自我評價,指評價主體自己依據評價原理對照一定的評價標準主動評價自身的評價類型。廣義的自我評價包括教師對自己工作的總結,部門負責人對本部門工作所做的自我檢查。狹義的自我評價特指那些嚴格按照與他人評價相同的標準所進行的評價。自我評價收到普遍歡迎,並且的到廣泛應該是由於它具備了以下一些特徵:不受時間和場合的限制,簡便易行;省時,省力,耗資較少;可在較長時間內連續操作,機動靈活。自我評價的實施有利於激發被評價者的積極性,但客觀性不足,因而自我評價極少獨立使用。自我評價一般在他人評價之前,或者穿插在他人評價中進行,用以證實或者完善他人評價的結果。對於規模比較大的評價活動,通常的做法是先進行自我評價, 在此基礎上再組織適當規模的他人評價,綜合發揮兩類評價各自的優勢,最大限度彌補二者之不足,以求達到儘可能理想的效果。
衡量標準
(一)評價的內容對象應是重要的、全面的
教育評價的對象不外乎學生和教師,無論是對學生的發展進行評價,還是對教師的教育教學工作進行評價,都涉及“評什麼”的問題。對良好的教育評價而言,確定“評什麼”是首要的,它涉及有關教育目的、目標等方面的價值定位;至於“如何評”,只是一個技術或方法問題,同確定教育的目的、目標相比,它的重要性是第二位的。以學生髮展評價為例,回答“評什麼”的問題,實際上也就是要回答教育的目標指向或定位問題。根據美國學者布魯姆的意見,教育目標領域涉及“認知”、“情感”、和“動作技能”三大領域。在認知領域,布魯姆將教育的目標劃分為知識、理解、運用、分析、綜合與評價六個層次,後來安德森等人對布魯姆的認知教育目標分類體系進行了修改,新的分類體系的主要特徵是將認知目標分為兩個維度:一個是“知識”,另一個是“認知過程”。安德森將“知識”按從具體到抽象分為四類,即事實、概念、程式和元認知;將“認知過程”按從低級到高級分為六個水平,即記憶、理解、套用、分析、評價和創造。從這裡可以看出,如果要對學生的發展進行全面的、綜合的評價,就不能只針對認識領域的目標進行評價,還必須關注學生在社會情感方面的發展。即便是只針對認識領域的目標進行評價,也不能只針對低層次的認知目標進行評價,忽視對高層次思維技能或深層理解進行評價。總而言之,好的教育評價要求評價者首先要對教育的根本目的或目標有正確、深入的了解,以防漏掉那些主要的、基本的、重要的評價對象。比如,若對教師的教育工作進行評價,只評價學生書本知識掌握得如何,不看學生智力發展得怎樣;只看學生考分的高低,不看學生人格、個性發展是否健全,像這樣的教育評價只能對教育的發展起誤導作用。
(二)評價的方法與手段應是科學的、合理的、可行的
當我們確定了要評價什麼時,接下來就要考慮評價的方法與手段是否科學合理的問題。所謂評價方法與手段的科學性,主要是指評價採用的方法、手段是否真正能夠檢測出評價者所要檢測的東西。換句話說,評價的方法與手段必須與評價的對象或內容相適應,評價的對象或內容不一樣,需要採取的評價方法與手段也會跟著不一樣。比如,若要對學生的交往技能、操作技能、運動技能、社會性發展等進行評價,採用筆紙測驗就顯得不太合適;要對學生高層次的思維技能(如分析、評價、創造等)或者解決真實情境中的真實問題的表現進行評價,採用填空題、選擇題(含判斷題)、匹配題等測驗題型就顯得不太合適。此外,評價標準是否與評價的任務和目的具有內在的、理性的關聯,各個評價標準之間是否具有內在的邏輯一致性,各個評價指標權重大小的分配是否合理,所有這些都涉及評價的方法與手段的科學性與合理性問題。至於評價方法與手段的可行性問題,也不容忽視。
(三)評價應是公正的、客觀的,符合教育倫理準則的
任何評價如果要有效的話,都必須以事實為依據,以“標準”為準繩,儘量減少評價者個人主觀因素或外界因素對評價的干擾與影響,防止評價者把自己的個人偏見帶入評價過程。在這裡,僅以評價偏見的客服為例,來談談評價的公正性與客觀性問題。“評價偏見”是指某些評價者由於性別、種族、社會經濟地位、宗教信仰或其他特徵,在評價中受到冒犯或不公平的對待。“這個測驗不公平”,說的就是評價偏見。
評價不僅僅是一種技術活動,更是一種人文活動。好的評價必須符合教育專業的倫理準則,不論是評價的方法、手段、程式,還是評價的標準,都必須是正當的、合法的,符合有關教育的倫理準則。比如,評價標準的制定應基於民主的程式;標準一旦確立後,就應當始終如一地加以執行;蒐集評價信息的方式應是正當的,對評價結果的利用也應當是正當的、合法的,避免給當事人造成傷害,等等。
(四)評價應對學生或教師的發展起到促進作用
好的教育評價應能促進和激勵學生更多、更好地投入學習,幫助教師不斷地反思和改進其教學,促進教師在專業上不斷地得到成長與進步。以學生髮展評價為例,好的教育評價應以促進學生髮展為目的。比如,在評分中充分考慮學生的努力與進步程度,將那些在考試中取得明顯進步或進步最大的學生姓名單獨張榜公布,予以表彰或獎勵;採用靈活、彈性的“延時評分”以取代一次性評分(即當教師發現學生作業中的錯誤時,暫不評分,將作業返還學生,讓學生自己去發現並糾正作業中的錯誤,直到正確無誤或學生自己滿意時才給予最後的評分;或者教師先用鉛筆記下第一次作業的評分,允許學生將錯誤多的作業重做一遍,然後用新的評分取代原始評分);引導學生參與評價標準的制定,學會對自己的作品進行自我評價,不斷提高自我評價的技能,等等。上面列舉的這類評價措施,都對學生的發展具有正面的引導與激勵作用。
評價主體
教育評價的主體可分為"個體評價"與"
社會評價"兩種不同的類型。
個體評價
個體評價是一種以個人為評價主體的評價,"個體"可以指一個人,也可以指具有共同利益的一群人。嚴格來說,個體評價以可以分為兩種類型:(1)個體的自我評價。此時,自我評價的主體是自我,評價的客體是自我的行為與結果。
(2)個體對他人他事的評價個體對自身以外的其他客體的評價,是個體對他人它事的評價。例如,學生對教師的評價就是屬於這一類型。
社會評價
是指從一定社會的角度來考察和評定現象的社會價值,判斷現象對社會的作用之善惡、美醜、功過及其程度。
評價模式
教育評價的模式是相對固定的評價程式,它是在一定的理論指導下對教育評價的基本範圍、內容、過程和程式的規定。西方教育評價的模式一般都有較大的適用範圍。不但可以廣泛地用於學生評價,在實踐中也被廣泛地運用於課程與教學方案評價等各個方面。教學評價的主要有以下三種模式:
泰勒模式
泰勒模式誕生於本世紀30年代,泰勒評價模式與現代學生評價的關係最為密切。這一模式的基本觀點集中體現在所謂的"泰勒原理"中。泰勒原理是由兩條密切相關的基本原理組成的:一條是"評價活動的原理";另一條是課程編制的原理。泰勒評價模式的評價步驟包括以下幾個方面:
(1)確定教育方案的目標;
(2)根據行為和內容對每個目標加以定義;
(3)確定套用目標的情景;
(4)確定套用目標情景的途徑;
(5)設計取得記錄的途徑;
(6)決定評定方式;
(7)決定獲取代表性樣本的方法。
CIPP模式
CIPP模式誕生於本世紀60年代。有人對泰勒評價模式提出疑問,認為,如果評價以目標為中心、依據,那么,目標的合理性又根據什麼去判斷?教育除了活動要達到預期的目標外,還會產生各種非預期的效應、效果,這些非預期的效果等要不要進行評價?……。在西方,有一種教育流派認為,教育乃是個人自我實現的過程,用統一的目標模式去統一個人的自由發展,去評價教育、教學的結果,從根本上是不可以接受的。因此,他們對泰勒模式更為豐滿。1966年斯塔弗比姆首創了CIPP評價模式。這是由背景(context)評價、輸入(input)評價、過程(process)評價和成果(product)評價這四種評價組成的一種綜合評價模式。
傳統弊端
從傳統評價的特點、未來教育評價發展趨勢和教育評價科學化要求來看,傳統評價的弊端突出表現以下幾點。
(一)教育評價的指標體系不夠科學
教育評價的指標體系是將評價所依據的有關教育目標逐步分解成各級指標而形成的一個系統化的具有聯繫的指標群。教育評價就是通過觀察測量被評對象具體的外化的行為指標並進行價值判斷的過程。因此,設計出一個比較有效、簡明、科學的指標系統,將直接影響著評價結果的科學性和可信性。然而,由於教育活動所涉及的多是精神產品,在大多數情況下教育評價要將不可直接觀察的事物轉化為可觀察事物的一種替代物,然後才能進行評價。由於指標和我們真正要評價的屬性並非必然一致,因此就必須存在評價的效度問題。往往是評價並沒有得到真正想評價的東西,而我們得到的並非我們想要評價的。
教育評價既存在著由於指標體系不夠科學而導致的評價的信度、效度不高這一現象,同時也存在有些評價內容由於人們到目前為止還沒有找到一個直接測量這種信息量的科學方法,從而使人們迴避對這些因素的測評,加之評價指標過於抽象,操作性差、造成評價結論的主觀性等問題,影響了教育評價的科學性。科學的教育評價需要科學的評價指標體系,而建立科學的評價指標體系的難度是很大的。因為教育評價的對象主要是人的活動,評價對象的特殊性、複雜性決定了教育評價的困難性,這在某種程度上也是評價指標體系不夠科學的一個重要原因。
(二)教育評價的價值標準單一化、片面化
教育評價發展到今天,許多方面由於人們極端化的最求而走向它的反面。不僅無助於促進學生的健康發展,而且還阻礙、肢解著學生的發展,使學校教師、學生成為評價的“奴隸”。因為評價片面強調知識的價值,忽視學生的主體價值,導致學生的畸形發展。最明顯的表現就是教育評價在有些國家尤其是開發中國家,已演變成純粹的升學考試的分數競爭,而根本不顧及作為學習成果的現實所達到的能力、學習的全面考核,評價被限制在測定記憶、理解有關知識為中心的極其狹隘的領域。而且在許多情況下這種極端片面、狹隘的評價結果不僅被視為整體學力的代表,甚至還被看成是學生個人價值的代表。因此,越來越多的學校為了得到能在外觀上反映出來的更為理想的評價結果,甚至不惜犧牲有助於學生髮展的活動,而只將教學與學習限制在狹小範圍之內。最能說明這一問題的現象就是在升學競爭中,無論教師還是學生都只重視同提高升學考試分數這個表有關係的課程的學習,至於與升學考試無關的課程、活動則被忽視。不僅如此,即使升學考試科目的學習也是偏重知識的理解記憶以及單純的運用,而忽視這些科目本來的認知能力、情感態度、價值觀念的綜合培養。所以在這種情況下,即使制定了比較均衡的課程學習計畫,但實際的教學與學習活動也會在升學考試的壓力下失去平衡。
(三)教育評價的目的、功能極端狹隘化
教育評價的根本目的在於促進教育工作的改進和教育質量的提高,評價不是為了證明,而是為了改進。然而,由於人們在教育評價的過程中極端強化終結性評價,相對忽視形成性評價、診斷性評價,從而在多數場合下教育評價最終只能起到各種意義上的分等劃類的作用,造成了不是為了教育的評價,而是為了評價的教育現象。在實踐中表現為把考試、測驗、分數作為評價的主要工具,評價的功能被窄化到僅僅是對被評對象作出某種資格證明,如選拔評優、分級排名次等,忽視了評價的診斷、調節功能和教育、改進功能。評價主要被用來鑑定、區分學生、選拔適合教育教學模式的學生,而不是創造適合學生髮展的教育教學。可見,教育評價的畸形發展已從根本上束縛了學校教育,成為奴化教師和學生的異己力量,不從根本上改變這種狀況,教育評價很難發揮積極的促進作用。
定義
教學評價是以教學目標為依據,按照科學的標準,運用一切有效的技術手段,對教學過程及結果進行測量,並給予價值判斷的過程。 教學評價:是對教學工作質量所作的測量、分析和評定。它包括:對學生學業成績的評價,對教師教學質量的評價和進行
課程評價。
評價要求
1、 明確多次評價的目的和評價對象,以解決評價的方向性問題。2、 明確每次評價的內容,評價的具體目標。3、 明確為評價而準備的條件。4、 對評價資料進行客觀、科學的判斷。