本文系陜西師范大學研究生教育綜合改革研究與實踐項目,項目編號:GERP-21-42。


中共中央、國務院于2020年10月頒發了《深化新時代教育評價改革總體方案》,這是新中國第一個以中央名義下發的關于教育評價的文件,方案中明確要求:扭轉不科學的教育評價導向,堅決克服唯分數、唯升學、唯文憑、唯論文、唯帽子的頑瘴痼疾??梢姡嘘P教育評價的改革及探索已成為全國教育界,特別是中小學關注的熱點。隨著大數據、人工智能技術的發展,教育評價必將轉向以服務為導向,智能化為特征的第五代變革,強化傳統評價功能,引領學生學習、教師教學、學校管理等向立體化評價過渡,即教師和學生不同學段學習、教學全過程的縱向評價,學生德智體美勞全要素的橫向評價,從而使教育評價更全面、更客觀、更科學。

方案中強調,堅持把立德樹人作為根本標準,突出評價的教育作用,突出評價的推動作用,突出評價的導向作用,突出評價的貫通作用?!案母飳W生評價”不僅僅是“改革學習評價”的一字之差,內涵、外延和價值取向都相去甚遠。

一、教育評價理論與方法概述

教育評價是當今教育科學研究三大領域之一,是教育科學研究的方法論基礎,是數量化方法在教育科學研究的直接滲透,是教育工作者,特別是中小學教育教學管理干部、教師必備的一種重要科學工具。

隨著中小學教育教學改革及教育科學研究,尤其是教育教學實驗及各類考試研究的不斷深入,教育評價理論和方法已列為各類中小學教師及教育教學管理干部培訓的重要方面。通過全國許多省份中小學教師及教育教學管理干部舉辦的各類有關教育評價理論與方法的培訓,起到了很好的效果。教育評價理論包含三個學科:教育統計學、教育測量學、教育評價學。

“教育統計學”是運用數理統計方法去研究教育對象的一門應用學科,研究如何收集、整理、分析、推斷教育現象中的數據。教育學與心理學中許多問題借助于統計學都可以予以量化,從而揭示教育規律和心理規律,這對改進中小學教育教學管理干部的管理水平、培養中小學教師教育的科研能力、正確開展教育與心理實驗和提高教學質量和實際工作效率都將是十分必要的。這門學科形成于20世紀初的美國,辛亥革命后傳入我國,被列為師范院校必修課程。20世紀20年代以后,這門學科主要處于描述性階段,即以圖表、計算均值、標準差、相關系數等描述收集到的數據;20世紀40年代以后,隨著教育科學本身及統計學的進一步發展,用抽樣的辦法,通過部分數據的研究以最大的把握性來對整體的某些特征進行統計推斷。20世紀60年代以后,隨著計算機的普及,人們從多方位、多指標、多維度去分析教育現象,從而使教育統計已不限于簡單的描述性和推斷性統計,而是擴充到與多元分析等許多新興學科相結合的綜合方向上,所涉及的工具更具多樣化、系統化。

“教育測量學”是依照某種法則,運用統計的工具,通過測驗對教育現象的屬性化性質予以量化形成的學科。具體來說,隨著中高考及學校各類考試制度的逐步完善,運用教育測量的方法對中高考命題、施測、評卷、分數報告及錄取的科學化分析取得了積極的進展。其測評的方法也日趨多樣化、系統化,考試作為教育工作的重要環節,中小學教師掌握考試命題技術、考試設計,運用 “四度”(難度、區分度、信度、效度)進行考試質量分析,已成為中小學教育教學改革的重要方面。

“教育評價學”是運用教育統計工具對測量結果的科學評判,如中小學教育工作的檢查和評定,教師的教學質量和教材水平的評議,以及學生學業成就、智能水平、品德行為的評定等都要應用教育評價的理論和方法。廣義的教育評價包括對教育活動的一切方面的評價,狹義的教育評價主要是對教學方面,特別是對學生學習質量進行評價。

隨著2022年4月義務教育新課標的頒布,對當前中小學課堂教學改革提出了更高的要求,“教學評”一體化已成為常規,也是學校落實基于新課標下教學改革的重點。從評價方式來看,在“形成性評價”基礎上發展起來的“學習性評價”“增值評價”正在中小學課堂評價中實踐,對促進和幫助學生高效學習起到了極大的推動作用。

教育統計、教育測量與教育評價相對獨立,但又有一定聯系,教育統計是工具,教育測量是手段,教育評價是對教育測量結果的科學評判。20世紀60年代以后,隨著現代科學技術向現代教育科學研究領域的輻射、滲透和交叉,人們越來越多地使用了與現代教育研究方法相適應的各種統計測評方法的拓廣和延伸。例如,在經典測量理論(CTT)基礎上發展起來的題目反應理論(IRT)等。評價方法已從多方位、多指標、多維度的時空動態模式上去探討、去分析,使教育統計、測量及評價方法由簡單的、直觀的描述性方法和一元統計推斷方法擴充到了與多元統計分析等諸多新興應用學科相結合的綜合方向上。

二、教育評價理論與方法的實踐和探索

1.教育統計與測評用于教育教學管理

教育統計與測量是實現教育教學管理科學化、現代化的重要工具。近年來,隨著教育教學管理定量化研究的不斷深入,人們越來越多地認識到教育教學管理作為一個系統其運動和變化的某種量的規律。如對于學校管理的重要環節教學和學生工作,利用統計模型探索出一套切合實際的工作程序。只有根據統計、測量提供的數據,教育教學管理部門才能心中有數,準確客觀地分析出學校教育教學的基本情況,獲得指導管理工作的客觀依據。同時,結合定性化的分析,提出改進的方法和措施。又如中小學教育評估問題,近年來我們經常使用因素分析、聚類分析等方法建立評估模型;再如學生能力的評估,我們利用近鄰判別分析的方法建立學生的能力類別等,為社會輸送人才提供可供選擇的工作種類。

2.教育統計與測評用于高考命題研究

隨著高中新課程標準實施,依據國務院《關于深化考試招生制度改革實施意見》《深化新時代教育評價改革總體方案》以及《中國高考評價體系和說明》的要求,依據教育測量學基本理論,在高考命題中應遵循以下基本原則,總體要求:深化高考內容改革,堅持立德樹人,服務選拔,導向教學,加強全面考查和引導,增強基礎性、綜合性,優化情境設計,增強試題開放性、靈活性,減少死記硬背,機械刷題,落實“重思維、重應用、重創新”,使高考由“解答問題”向“解決問題”轉化。(1)考試設計要求:含題型設計、題量設計、考試目標設計、試卷編制、命題細目表要求(兩個維度,一個配分),題型主客觀題按各科要求確定,題量一般控制在考生思考時間與答卷書寫時間為2∶1。(2)命題模式評價:除應符合學生發展(育人方面的反映和表現),還應體現反饋和修正(每套模擬試題考試結束后征集專家研討,聽取實踐主體學校教師、學生的意見和反饋信息),從而及時修正。(3)試卷“四度”要求:每套試卷具有較高信度、效度,必要的區分度和適當的難度。首先,命題具有較高信度(可信性、一致性程度,取值0-1之間),效度(有效性、準確性程度,取值0-1之間,也可用定性內容效度予以衡量)。其次,必要的區分度(區分鑒別能力的數量指標),注意是必要的(這是由高考的選拔性、屬性來考慮的);適當的難度,注意是適當的(新高考改革強調適當降低難度),從測量學理論,一般整卷平均難度達到0.5即能保持最大的區分度,但從強調必要的區分度考慮,難度控制在0.6-0.65之間,不同的模擬試卷(三套)難度分別控制在0.65、0.62、0.6,以便于及時修正和調控。(4)命題考查目標:強調“必備知識、關鍵能力、學科素養、核心價值”,這一目標較傳統的布魯姆考查目標(識記、領會、綜合、分析、應用、評價)有更深層次的內涵和拓展。(5)體現新課改要求:命題既重視知識與技能,更重視過程與方法、情感與價值觀,從而引導教師的教學注重過程。(6)命題內容維度:以“四層考查”(必備知識、關鍵能力、學科素養、核心價值)為目標,以“四翼考查”(基礎性、綜合性、應用性、創新性)為基準。(7)命題遵循原則:入門寬,深入難,開口大,出口小,主要是從區分度角度考慮,除了試題易、中、難比例(0.3、0.5、0.2),文理科略有差異,除難度的坡度設計外,每道題難度的起點一般不要太高,這就是入門寬,開口大,但進入試題后不易,這就是深入難,出口小。

3.教育統計與測評用于各級各類學校試題試卷分析

各級各類學??荚嚨脑嚲矸治鲆彩切聲r代教育評價的重要內容之一,科學地進行試卷分析能夠有效地提高教育教學質量。試卷分析通常有定性分析和定量分析,經典教育測量理論(CTT)和方法通常用于定量分析,以“四度”(信度、效度、難度、區分度)為工具進行考試質量分析,已廣泛應用于各類試卷的分析中,陜西師范大學通過對2021級教育碩士、師范類專業本科生有目標地進行培訓后,撰寫了100多篇有關中小學的試題試卷分析報告,極大地提高了學生學習教育評價相關理論的積極性,西安醫學院、陜西師范大學、西安翻譯學院等單位應用教育測量方法制定了試題試卷分析模板,通過對全校各學科期末考試的試卷分析,對促進教育教學起到一定的推動作用,陜西省教育考試院利用試題試卷分析模版對每年高考、學業水平考試數據進行統計分析,對考生和學校提供了有價值的參考。

三、當今教育評價領域有待進一步探討的問題

1.教育統計與測評課程建設

教育統計與測評作為一門教育類學科的重要課程,目前已廣泛在高校相關專業“教育學、心理學、小學教育、學前教育以及師范類各專業”的研究生、本科、??茖W生中開設,并對各類中小學、幼兒園教育管理干部、教師進行培訓。陜西師范大學研究生教改項目《教育統計與測評課程建設及在研究生教育教學實踐中的應用》已完成了“教育統計與測評”教學大綱的修訂意見,教學大綱、課程目標達成評價分析報告,教學進度及開課計劃等,無疑對這門課程的建設起到了積極的推動作用。

根據新時代教育評價理論,重新修訂的“教育統計與測評教學大綱,課程目標達成評價分析報告”等較為系統地架構了課程從理論、方法到實踐的各個環節,結合新時代教育評價特點,在原有課程的基礎上,以劉新平、張運良主編的《教育統計與測評導論》(第三版)為教材版本,增加了多元、多層次教育統計分析,增值評價及各類中小學質量檢測分析案例和部分理論與應用研究成果,豐富了課程的資源,為各專業開設這門課程提供了有力支撐。通過對陜西師范大學來自全國各地中小學在職教師(教育碩士)(共11屆3000余人)開設“教育測量與評價”課程及實踐活動,有力地推動了教育評價理論和方法在中小學的實踐和應用。

2.教育評價理論與方法的普及

教育統計與測評作為教育科學研究的方法論基礎有較強的實踐應用背景,作為數量化方法的滲透,要有一定的數學及統計學基礎,特別是教育評價已在大中小學及教科研機構得到的廣泛關注,故這一領域的普及工作就顯得尤為重要,陜西省教育考試與評價研究會作為陜西省內唯一的專業研究會,自2002年正式成立以來,至目前,研究會在高等教育、基礎教育、民辦教育、學前教育、職業教育等各個領域,通過各類課題、項目、講座、培訓、研討等,為全省教育評價的普及工作起到了積極的推動作用,建議有條件的單位,特別是中小學組建相應的教育評價研究中心或教育質量監測中心,集中或分散開展教育評價基礎知識的培訓,以適應新時代教育評價的要求,這對于落實中央“深化新時代教育評價改革整體方案”具有重要意義。

3.教育評價實踐基地建設

按照中央“深化教育評價改革總體方案”以及破“五唯”精神,在普及教育測評的基礎上,加強教育測評實踐基地建設勢在必行,在高校普遍開設教育統計與測評課的同時,根據各中小學實際,組織學生利用寒暑假到實踐基地予以鍛煉,幫助學校進行教育測評基礎知識培訓,既能提升學生實施教育評價的能力,又能對學校教育測評工作提供幫助(如高中考命題指導、學生生涯規劃、學校教育教學質量監測、試題試卷分析等),幫助學校完成教育評價研究課題,學生教育測評能力有了顯著提高,通過對西安市八十三中、陜西白河高級中學、陜西漢中龍崗中學、西安高新第一學校、漢中中學、武功觀音堂九年制學校等調查反饋,建議有條件的大學在完成教育統計與測評課程的同時,有針對性地在中小學建立實踐基地,這有助于教育評價的各項舉措落到實處。

展望未來,自中共中央、國務院2020年頒布《深化新時代教育評價改革總體方案》以來,教育評價已引起教育界的極大關注。教育評價已上升為政府主導下,引領教育教學改革與發展的政策導向,教育評價正呈現立體化(全過程的縱向評價、全要素的橫向評價)發展的趨勢。近期教育部印發了普通高中辦學質量評價指南,進一步明確了評價的主要內容,加快建立以發展素質教育為導向的普通高中學校辦學質量評價體系,全面提高普通高中辦學質量的格局正在逐步形成,這為新時代教育評價理論及其應用指明了方向。基于教育統計測評模型的教育實證研究、基于大數據的評價模型的逐步建立等,教育評價創新塑造教育未來的局面必將打開。

作者單位 延安大學西安創新學院   陜西師范大學

責任編輯:張言