含義 ACTS是英文全稱Ability and Competence Test System的首字母縮寫,中文名稱為“學業素質與能力評價系統”。該評價系統的核心技術即ACTS
學業評價 技術。ACTS學業評價技術以教育目標分類學、
認知建構理論 、多元智慧型理論等國際套用廣泛的教育理論為基礎,借鑑國際最新的測量評價發展趨勢,通過構建一個以“知識、技能、能力”為顯性維度,以“方法、過程、策略”以及“情感、價值、態度”為隱性維度的三維多元多層測量評價技術模型,以多元、分項、多維的方式來測量、評價、診斷和甄別學生在“三維目標”和“學科學習目標”上所取得的成績、存在的問題和原因以及未來發展的潛力,從根本上解決了當前學科教育評價不能診斷、不能反映課程目標和標準,以及評價不與國際接軌的問題。
背景 國際背景 開展診斷性的、以學科為單元或以認知特性為單元的評價是當今世界各國評價和考試改革的趨勢之一,其評價結果既可以為政府決策提供參考,又可以為學區、學校或考生提供服務。
國內背景
中國教育主管部門推動教育評價改革的努力歷時已久。從2001年《基礎教育課程改革綱要(試行)》、2002年《
教育部關於積極推進中國小評價與考試制度改革的通知 》,到2013年的《
教育部關於推進中國小教育質量綜合評價改革的意見 》,由社會專業機構參與教育評價的“第三方”模式的政策指向已經越來越清晰。然而,教育評價要改革成功、要想在中國走出一條第三方的“康莊大道”,僅有制度、政策的推動遠遠不夠。考察第三方教育評價發展較為成熟的美國,其成功經驗給予我們的重要啟示是:專業機構的專業技術能被市場和國際所認可,才是教育評價改革成功及第三方教育評價之路得以“走得好、走得遠”的關鍵保證和保障。因此,在當今的中國,教育評價技術的科學化、專業化,是推動教育評價改革、推廣第三方教育評價亟待解決的首要問題。在筆者看來,無論是哪個第三方專業機構,其教育評價技術若想得到社會各方的認可和信任,並得到大範圍推廣,必須能妥善解決中國教育評價中存在的一系列問題,因此,必須要滿足以下幾個基本的前提條件:
第一,要符合國家提出的關於教育評價與考試改革的新要求。
無論是2002年《
教育部關於積極推進中國小評價與考試制度改革的通知 》,還是2013年《
教育部關於推進中國小教育質量綜合評價改革的意見 》,都明確指出我國當前教育評價與考試中突出的問題是“評價內容上重考試分數忽視學生綜合素質和個性發展,在評價方式上重最終結果忽視學校進步和努力程度,在評價結果使用上重甄別證明忽視診斷和改進”,因此嚴重阻礙學生的健康發展和教師的專業提升。針對這一問題,2013年教育部出台的檔案特彆強調要“更加注重發揮評價的引導、診斷、改進、激勵等功能”。從上述兩個檔案中不難看出,歷經十多年,我國教育評價與考試改革的主題基本未曾發生變化;這也意味著,教育評價與考試中的難題始終沒有得到根本性的破解。因此,任何一項教育評價技術,若不能在“引導、診斷、改進和激勵”功能上取得實質性的突破,就無法滿足國家提出的關於評價與考試改革的要求,也必然無法為社會各方所認可和信任。
第二,要符合新課程改革的課程目標和標準要求。
我國新一輪的課程改革始於1999年,歷經十餘年的探索和實踐,在2011年推出了教育改革的重要成果——課程標準(2011版)。以學科教育為例,學科教育的課程目標、標準和評價,是基於“三維目標”( 《基礎教育課程改革綱要(試行)》)及“學科學習目標”(《
教育部關於積極推進中國小評價與考試制度改革的通知 》)。新版的課程標準,將以往的教學大綱中規定的“
雙基 ”課程目標調整為“知識與技能,過程與方法,情感態度和價值觀”的
三維課程目標 ,並依此形成和完善課程標準。同時,針對
課程評價 ,2011版的課程標準中也明確指出課程評價應“全面落實課程目標”。根據泰勒的課程編制原理,教學的封閉循環系統是先有課程目標和標準,然後依據課程目標和標準組織並實施教學,最後採用評價來診斷和評估教學實踐的成果在多大程度上實現了課程目標和標準,從而為教學實踐的調整提供重要的參考信息。教育評價的科學規律應該是教學服從於課程目標、評價與課程目標標準相匹配,才能使教育的結果向著課程目標、標準所引導的方向發生。道理似乎很簡單,但是我國現行的考試與評價,由於種種原因(主要是由於體制和技術落後問題),評價目標依舊是“雙基”課程目標,評價標準實質仍是“雙向”細目,評價目標、標準與新課程目標、標準嚴重脫節。加上評價技術和方法落後,評價手段單一,從而導致國家所倡導的素質教育在實踐中成為“鏡中之花,“
水中之月 ”。
除了學科教育的這種評價現狀外,基於“基礎性發展目標”的“
綜合素質評價 ”(也稱“基礎素質評價”),以及基於
學業評價 和綜合素質評價及人才培養目標的“綜合評價”,在我國目前基本處於空白。根據《基礎教育課程改革綱要(試行)》與《
教育部關於積極推進中國小評價與考試制度改革的通知 》等檔案,2010年教育部發布了《綜合實踐活動課程指導綱要(2010)》、《綜合實踐活動課程標準(2010)》,2013年發布了《
教育部關於推進中國小教育質量綜合評價改革的意見 》,並給出了《中國小教育質量綜合評價指標框架(試行)》,明確提出了基於“基礎性發展目標”的“綜合素質評價”,以及基於學業評價和綜合素質評價及人才培養目標的“綜合評價”。
綜合實踐活動課程 、綜合素質評價以及綜合評價的提出,對我國教育評價提出了更新、更高的要求。
課程改革走到今天,許多學者都紛紛指出,現有的評價目標、標準、理論、技術、方法等若不能有實質性的改變,課程改革的“瓶頸”將無法突破,以至於全國政協副秘書長、民進中央副主席、
中國教育學會 副會長、中國新教育實驗發起人、博士生導師朱永新教授說“慶父不死,魯難未已;評價不改,教育難興”。因此,新型的教育評價技術必須要解決評價目標、標準、內容、理論、方法等,與新課程目標和標準相匹配的問題。
第三,要能與國外、國際學業成績評估接軌。
我國新一輪的教育改革發生的背景是全球化、知識經濟以及信息化時代的到來導致教育的國際競爭越演越烈。我國教育與國際接軌已是毋庸置疑,教育改革的目的是“樹德立人”,以及人才培養能適應未來的國際競爭,作為“教育實施、教育評價、教育諮詢”這個教育自循環系統中一個重要的環節,教育評價也必然要與國際接軌。
當前,國際上影響較大的教育評價項目主要有兩個,分別是
國際經濟合作 與發展組織(OECD)主持的
國際學生評價項目 (簡稱
PISA ),以及
國際教育成就評價協會 (IEA)主持的第三次國際數學和科學教育的再研究(簡稱TIMSS-R)。這兩個國際學業成就評估項目的參與國家和地區都超過了40個以上,評估結果也成為各個參與國制定教育政策、推進教育改革的重要參考。此外,也有越來越多的國內學者在關注和研究美國國內唯一的國家基礎教育質量監測和評價體系——“全國教育進展評價(簡稱NAEP)”。這些評估項目的共同特點是有明確的評估理念,有多元、多維的評估指標。尤其是NAEP項目,還為每一位學生提供項目、多指標的教育報告卡,來展示該學生“知道什麼”和“能做什麼”。
隨著中國中
高考改革 的推進,中國與其他國家之間考試以及評價成績,進行對接、異質比較、等值轉換等的問題也會日益突出。中國教育評價若不能從這些國外、國際評估項目中學習和借鑑先進的理念和經驗,發展出既滿足本土需求,又能與國際接軌的理念、技術和方法,並能有效進行成績之間的異質比較或等值轉換,中國教育仍會將因為無法有效可靠的接軌,而處於被動局面甚至“
閉關鎖國 ”狀態,中國的教育評價改革難以實現,教育評價第三方之路也會行將不遠。
如上所述,在中國教育“深化教育領域綜合改革”之下,只有革新教育評價技術,才能破解中國教育評價改革難題。
歷時10餘年,由國內民間專業機構公眾青少年素質能力研究中心、公眾
教育研究院 、公眾考試研究院,研發的ACTS
學業評價 技術、ICTS綜合素質評價技術和TAST考試技術,正是滿足上述條件的新型教育評價技術。
ACTS學業評價技術,是針對“學科學習目標”的學業評價技術;ICTS綜合素質評價技術,是針對“基礎性發展目標”的綜合素質評價技術;TAST考試技術,是針對人才培養目標的評估與選拔技術
理論依據 ACTS
學業評價 與考試技術以中國新課程標準提出的“
知識與技能,過程與方法,情感與價值 ”的三維目標為基礎,以
教育目標分類學、 認知建構理論 、多元智慧型理論 等為主要理論和方法依據,結合教育領域、心理學領域最新的研究成果,包括對
非智力因素 的研究成果以及
三位一體腦理論 等,形成了一個以“知識、技能、能力”為顯性維度,以“方法、過程、策略”以及“價值、情感、態度”為隱性維度的
三維測量 評價模型。
測量模型參見附屬檔案中的學生成績單樣稿。
同傳統的測驗和考試相比,無論是在
試題編制 還是試題分析以及成績分數的呈現等等上,ACTS
學業評價 與考試技術都有著傳統的測驗和考試無法比擬的優勢。舉例如下:
表1 ACTS學業評價與考試技術與傳統的測驗和考試的簡略對比
對比項目
傳統的測驗和考試
ACTS學業評價與考試技術
以知識、技能的
雙向細目表 為試題編制的指導,不能符合新課程標準的三維目標要求。
以知識、技能和能力的多項細目表為試題編制指導,符合新課程標準的三維目標要求。
試題分析
通過對單題得分和得分率情況來分析學生的知識掌握情況以及教師教學的情況。題目本身帶有單一化造成的偶然性,而且題目之間的
關聯度 低,得出的結論帶有偶然性和相對片面。
通過對構成測量點的一類試題進行
關聯分析 ,不僅發現學生在知識上的掌握情況,更能夠判斷學生的技能訓練以及能力發展的情況;同時,班級群體的特徵分析,也對教師的教學情況給出更為科學、客觀和直觀的說明。
試題賦分
以題型為賦予權重的依據,同一題型權重相同。因為忽略了同一題型內部試題之間的難度差異,會導致答對難度不同、但題目數量相同的學生獲得相同的分數,從而無法有效區分不同能力的學生。
以布魯姆的認知領域教育目標的認知等級和能力類型為賦予權重的依據。隨著認知等級的提高以及能力類型在學科中的主導型的提高,權重也會逐漸提高,從而可以有效地區分學生的認知水平以及能力類型。
分數合成
所有單題得分的簡單線性相加,無法區分學生在不同的知識點、技能項以及能力項之間表現出的差異。
按不同的知識點、技能項和能力項將分數分別合成,在此基礎上,又進一步合成總成績,非線性相加的成績合成方式非常有效地區分學生在不同知識點、技能項以及能力項之間形成的細微差異。
成績呈現
僅有一個總體分數,只能提供學生達標的情況,所能提供的用於評價、甄別、診斷、教研、教學、學習、輔導、專項訓練等有效信息非常有限。
以數據表的形式呈現,不僅提供學生達標的信息,同時還提供學生與群體比較,與他人比較的信息。此外,16-18個分項指標,每個指標都對應5個數據,真正實現了多元、多維的評價、甄別、診斷等。能提供用於評價、教研、教學、學習、輔導、專項訓練等豐富的有效信息。
解釋系統
成績解釋依賴於任課教師對學生的長期了解,是建立在教師與學生之間的長期交往經驗基礎之上,無法普遍推廣。
根據
心理測量 的理論、
認知建構理論 以及三位一體腦理論等,形成一套科學、規範的解釋系統,不依賴於人際交往的經驗,可以高效實用和普遍推廣。
套用範圍 作為符合素質教育理論和實踐的新型?>
學業評價 與考試技術,在學校教研、教學、輔導、招生等上有著廣泛的套用範圍及作用。具體如下:
套用範圍
功能
新學期伊始的配置性評價
客觀、全面地了解學生,對預計實施的新知識的掌握情況,以便更好地運用“就近發展區”和“腳手架”理論對掌握程度不同的學生實施因材施教和
個性化教學 和輔導的設計。
學期中間的過程性評價
了解學生對已經學過、練過以及發展的知識、技能和能力情況進行檢測,以了解教學在學生身上發生的效果,為及時調整教研方向、教學進度、教學重點,彌補前期的教學不足提供重要參考。
綜合評估學生在一學期結束時,全部教學以及訓練對學生的知識學得、技能習得及能力養成所產生的影響,為教師和家長制定符合學生學習情況和特點的假期學習計畫提供重要的參考。
選拔性及鑑定性評價
競賽、升學考試的選拔性評價不僅可以呈現出學生的知識、技能和能力發展情況在
同輩群體 中的位置,同時還能呈現學生的學習特點以及學習潛能,中立的第三方評價具有公正、客觀特點,可以成為招生學校選拔優質、有潛能學生的重要參考。
套用價值 ACTS
學業評價 與考試技術既可以使用ACTS研究隊伍自己編制的試題,也可以通過解析和修改學校自行編制的試題,在數據合成及分析的基礎上,為學生個人、班級和年級提供相應的
成績報告單 。這些由數十個數據組成的成績報告單,輔以相應的諮詢和解讀,能真正實現素質教育對新型學業評價技術提出的3個“有利於”的要求。
首先,ACTS 學業評價與考試的“學生個人成績”(見附屬檔案1 )能實現“有利於學生個體的發展”:
多元、多維度的評價指標有助於學生了解自己在學習中的長短板;多方位、多角度的對比有助於學生認識自己在學習上的優劣勢;知識、技能、能力的顯性三維的測量、評價、甄別與診斷,有助於學生找到並確診認知要素和成果結構中存在的長短板和不均衡問題;在此顯性三維
關聯分析 中,有助於學生髮現和確診學習上存在的問題點、困難點、盲點及其形成的原因和機制,進而找到解決問題的方向和方法。相同的分數,不同的知識、技能和能力結構,有助於學生更正確的認識和看待自己,從而樹立更明確和準確的學習目標和提高方向。方法、過程、策略的隱性三維的測量、評價、甄別與診斷,有助於學生髮現並確診在認知過程和技能形成以及能力養成中存在的長短板和不均衡問題;在此隱性三維關聯分析中,有助於學生髮現和確診學習風格和習慣中存在的問題點、困難點、盲點及其形成的原因和機制,進而找到在日常學習和精力分配上深度解決問題的方向和方法。相同的時間,不同的學習過程和精力分配結構,有助於學生更深度的認識和看待自己,從而建立更為優秀的學習方法和
學習習慣 ,也更有助於學生建立起強大的自信心和可靠的
自我效能感 。價值、情感、態度的隱性三維的測量、評價、甄別與診斷,有助於學生髮現並確診在學習過程、方向、目的上存在的價值(目標、意義)、情感(美感、偏好)、態度(積極、消極等)之長短板和不均衡等問題;在此隱性三維
關聯分析 中,有助於學生髮現和確診在學習和成長過程中存在的最深層次的問題點、困難點、盲點,及其形成的社會性及個性原因,進而找到在學習和成長過程中深度解決根本性問題的方向和方法。相同的學習,不同的價值、情感和態度開發與成長,有助於學生深度發現自我和環境影響等,從而建立深度的學習目的、方向和動力,不但有助於解決困擾學生學習和成長以及成才的根本性和基礎性問題,也有助於學生樹立更高更強的學習與成長目標和理想,更有助於學生的卓越成長和長足發展。
其次,ACTS 學業評價 班級成績單(見附屬檔案2 )能實現“有利於教師的提高和教學改進”:
成就 1、ACTS
學業評價 與考試技術,已經和黑龍江、北京、天津、山東、江蘇、河北、河南、安徽、陝西、四川等省市的數千所重點優質學校、十幾所教育局、三十多所教科研機構合作過,積累了幾十萬名以上學生的真實有效數據;並獲得了良好的聲譽和來自公立教育界、民辦教育界、教科研機構的普遍讚許和支持。
2 、2009年以ACTS學業評價和考試理論及技術為基礎,申報了國家教育部教育科學“十一五”規劃重點課題《新教育試驗與素質教育行動策略的研究》之重點子課題《素質教育學業評價與考試研究》,獲得批准立項,並將於2012年7月份結題。
3、2010年
山東省濟南市教育局 教研室以ACTS學業評價與考試技術為基礎,在濟南市
全日制學校 開展基於ACTS學業評價技術的教研、教學、學習、評價試驗,並申報
山東省教育廳 教科研課題,試驗取得成功。2011年繼續申報了基於ACTS學業評價與考試技術的教研、教學、學習三項全國教育科學“十二五”規劃課題,均被批准立項。
4、以ACTS學業評價與考試技術為基礎的“素質教育學業評價標準體系研究”課題已經通過了全國教育科學“十二五”規劃課題江蘇省領導小組的審批並正式立項。
5、以ACTS學業評價技術為指導的
石家莊市教育局 教研室的以國小數學教研和教學為內容的研究,已成立課題組,即將申報全國教育科學“十二五”規劃課題。
6、2011年,全球最大的中學生國際交流機構——美國納賽爾文化交流協會(Nacel Open Door),與ACTS達成深度合作。
7 、 2012年,全國教育科學“十一五”、“十二五”規劃重大綜合性課題——中國新教育試驗,與ACTS達成深度合作,並聯合成立新評價與考試研究所。
8、2012年,與
托福 考試認證具有同等效力的
美國密西根考試 (Michigan English Test)中國考試中心與ACTS達成深度合作,並聯合成立:美國密西根考試(Michigan English Test)(中國)考試分中心。