- 相關(guān)推薦
試論基于課程標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評價(jià)
試論基于課程標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評價(jià)
摘要:為什么要將學(xué)生學(xué)業(yè)成就評價(jià)建立在課程標(biāo)準(zhǔn)之上,意義何在?為了設(shè)計(jì)基于課程標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評價(jià),地方或?qū)W校怎樣對課程標(biāo)準(zhǔn)進(jìn)行進(jìn)一步的處理,將其轉(zhuǎn)化為評價(jià)標(biāo)準(zhǔn)?怎樣讓學(xué)生的學(xué)業(yè)成就評價(jià)建立在課程標(biāo)準(zhǔn)之上?本文圍繞這三個(gè)核心問題,給出思考和行動(dòng)的框架,并不在求得劃一的程序,旨在引發(fā)有益的思考。
關(guān)鍵詞:課程標(biāo)準(zhǔn);學(xué)業(yè)成就評價(jià)
Abstract: What's the significance of assessing students'achievements on the bases of curriculum standards? What should the localities and schools do to transform the curriculum standards into assessment standards to assess students' achievements? What could we make the do to assessment students' achievements based on the curriculum? Some thinking and action frames procedure but expects to initiate some helpful thinking.
在我國當(dāng)前的教育環(huán)境下,課程標(biāo)準(zhǔn)取代教學(xué)大綱并不難,難在要使課程標(biāo)準(zhǔn)真正發(fā)揮作用,成為教材編寫、教師教學(xué)和學(xué)生學(xué)業(yè)成就評價(jià)的依據(jù)。這三點(diǎn)中無論哪一點(diǎn)都不是一件簡單的事情,尤以學(xué)生學(xué)業(yè)成就評價(jià)為最。只有當(dāng)評價(jià)這一最后的出口是基于標(biāo)準(zhǔn)的時(shí)候,前兩者才有可能是基于標(biāo)準(zhǔn)的。但關(guān)于基于標(biāo)準(zhǔn)的評價(jià),目前國內(nèi)還沒有太多研究,在對學(xué)生學(xué)業(yè)成就評價(jià)改革的方向、內(nèi)容的眾說紛紜中,標(biāo)準(zhǔn)似乎被有意無意地遺忘了。事實(shí)上,這次課程改革的諸多理念都凝聚在標(biāo)準(zhǔn)上,如果在評價(jià)和標(biāo)準(zhǔn)間遲遲不能建立有意義的聯(lián)系,將使我們的評價(jià)和標(biāo)準(zhǔn)都無所依托。這就難怪美國加利福尼亞大學(xué)的評價(jià)研究中心(CSE,Center for the Study of Evaluation)在2002年的報(bào)告中宣稱:基于標(biāo)準(zhǔn)的教育體系的成功依賴于兩個(gè)要素:強(qiáng)有力的標(biāo)準(zhǔn)和能衡量出標(biāo)準(zhǔn)所期望的學(xué)習(xí)結(jié)果的評價(jià);诖,本文旨在厘清基于標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評價(jià)中的三個(gè)關(guān)鍵問題,為地方和學(xué)校進(jìn)一步設(shè)計(jì)基于標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評價(jià)提供思考和行動(dòng)的框架。①
一、為什么學(xué)生學(xué)業(yè)成就評價(jià)要基于課程標(biāo)準(zhǔn)
意義的問題看似簡單,但如果我們不能開展廣泛而有益的探討,厘清“為什么這樣做”的清晰意義,并讓實(shí)踐者建立堅(jiān)定的行動(dòng)決心,政策和實(shí)踐往往會出現(xiàn)反彈和逆流。因此,我們需要從最原點(diǎn)的問題來思考:“學(xué)生學(xué)業(yè)成就評價(jià)的目的是什么?課程標(biāo)準(zhǔn)是怎樣促成學(xué)生學(xué)業(yè)成就評價(jià)達(dá)成此目的?”從最根本的層面上說,學(xué)生學(xué)業(yè)成就評價(jià)有兩個(gè)目的。對外,要能滿足公眾問(accountability)的要求;對內(nèi),要能滿足學(xué)生學(xué)習(xí)改善(improving learning)的要求。而從下文的分析中我們可以看到,這兩個(gè)目的的實(shí)現(xiàn)都離不開課程標(biāo)準(zhǔn)。課程標(biāo)準(zhǔn)是學(xué)生學(xué)業(yè)成就評價(jià)達(dá)至公平、有效的基石,它承擔(dān)著學(xué)業(yè)成就評價(jià)標(biāo)準(zhǔn)的功能和職責(zé)。 [2][1]Key words: curriculum standards; achievement assessm
(一)課程標(biāo)準(zhǔn)規(guī)范學(xué)業(yè)成就評價(jià)的設(shè)計(jì)理念
任何一種學(xué)業(yè)成就評價(jià)都是基于對教學(xué)、學(xué)習(xí)、學(xué)習(xí)者的能力的假設(shè)而做出的,這些隱藏的設(shè)計(jì)理念在很大程度上決定了學(xué)業(yè)成就評價(jià)的性質(zhì)、范圍、方法、使用的工具。課程標(biāo)準(zhǔn)的意義就在于對不同類型的學(xué)生學(xué)業(yè)成就評價(jià)從基本的設(shè)計(jì)理念上進(jìn)行統(tǒng)一。
當(dāng)前實(shí)踐中的各級考試很少以學(xué)習(xí)、教學(xué)、學(xué)習(xí)者的能力的共同期望為設(shè)計(jì)基礎(chǔ)。不同的考試之間沒有聯(lián)系,甚至出現(xiàn)相互矛盾的情況。在這種情況下,難以保證教育質(zhì)量,難以應(yīng)對日益強(qiáng)烈的問責(zé)要求,更難以促進(jìn)學(xué)生的學(xué)習(xí)。課程標(biāo)準(zhǔn)所蘊(yùn)涵的“為了每一位兒童發(fā)展”的理念旨在促進(jìn)學(xué)生全面、持續(xù)、和諧地發(fā)展,它相信每一個(gè)兒童的可塑性和巨大的潛力。它認(rèn)為真正的有效教學(xué)不是灌輸,而在于從學(xué)生已有的生活經(jīng)驗(yàn)和概念基礎(chǔ)出發(fā),幫助學(xué)生建構(gòu)他們自身的知識框架。這種觀念給各級學(xué)業(yè)成就評價(jià)的設(shè)計(jì)帶來新的可能性,只有建立在這一理念基礎(chǔ)上的學(xué)業(yè)成就評價(jià)才能真正應(yīng)對今日的公眾問責(zé),才能真正促進(jìn)學(xué)生的學(xué)業(yè)改善。
(二)課程標(biāo)準(zhǔn)提供學(xué)業(yè)成就評價(jià)的維度框架
學(xué)業(yè)成就評價(jià)應(yīng)該評什么?當(dāng)前的學(xué)業(yè)成就評價(jià)的考察維度是比較單一的,有的甚至僅僅測量了學(xué)生的記憶力。地方或?qū)W校往往通過設(shè)立特定的分?jǐn)?shù)界限比較各地、各校、各學(xué)生之間的差異,衡定誰好誰劣,借此達(dá)到問責(zé)要求。缺少專業(yè)評價(jià)素養(yǎng)的公眾很難追問:這張考卷考察的是學(xué)生的哪些能力呢?不同考卷所代表的80分差異在何處?但是,很多研究都表明,為了應(yīng)對越來越激烈的競爭和挑戰(zhàn),為了促進(jìn)學(xué)生的有效學(xué)習(xí),學(xué)業(yè)成就評價(jià)的維度需要并正在擴(kuò)大。而課程標(biāo)準(zhǔn)正給我們設(shè)計(jì)學(xué)生學(xué)業(yè)成就維度框架提供參照。
課程標(biāo)準(zhǔn)是對學(xué)習(xí)結(jié)果的界定。它對學(xué)習(xí)結(jié)果的理解并不像一般人理解的那樣,只是學(xué)習(xí)成績,它包括多種學(xué)習(xí)結(jié)果,以數(shù)學(xué)課程標(biāo)準(zhǔn)為例,就從知識與技能、數(shù)學(xué)思考、解決問題、情感與態(tài)度等四個(gè)方面作出限定。總之,它“倡導(dǎo)學(xué)生主動(dòng)參與、樂于探究、勤于動(dòng)手,培養(yǎng)學(xué)生搜集和處理信息的能力、獲取新知識的能力、分析和解決問題的能力以及交流與合作的能力!保4][3]課程標(biāo)準(zhǔn)給我們設(shè)計(jì)學(xué)業(yè)成就評價(jià)的維度提供參照,它促使我們思考:學(xué)業(yè)成就評價(jià)到底評哪些維度?它們之間的比重是均衡的嗎?學(xué)業(yè)成就評價(jià)應(yīng)該設(shè)計(jì)怎樣的工具、方法來測量、報(bào)告、解釋它們?
(三)課程標(biāo)準(zhǔn)限定學(xué)業(yè)成就評價(jià)的內(nèi)容范圍和認(rèn)知要求
學(xué)生學(xué)業(yè)成就評價(jià)需要基于統(tǒng)一的內(nèi)容范圍和一致的認(rèn)知要求。如果不同類型的學(xué)業(yè)成就評價(jià)是基于不同范圍的學(xué)習(xí)內(nèi)容和不同程度的認(rèn)知要求而制定的,必然會引起極大的混亂。當(dāng)前的很多學(xué)業(yè)成就評價(jià)是經(jīng)不起追問的:選擇考察的樣本能夠代表同樣的知識內(nèi)容嗎?對認(rèn)知的要求有偏差嗎?這就導(dǎo)致學(xué)校和教師對到底要學(xué)哪些知識,要學(xué)到何種程度感到無所適從,只能用大量的題海戰(zhàn)術(shù)來對付。因此,課程標(biāo)準(zhǔn)要對學(xué)業(yè)成就評價(jià)在內(nèi)容范圍和認(rèn)知要求上做出限定。
課程標(biāo)準(zhǔn)從本質(zhì)上說就是設(shè)立全國學(xué)生要知道些什么,做些什么的底線。它不僅劃定了學(xué)習(xí)的領(lǐng)域和疆界,還給出學(xué)到何種程度的描述,即內(nèi)容標(biāo)準(zhǔn)和表現(xiàn)標(biāo)準(zhǔn),前者劃定了學(xué)習(xí)的領(lǐng)域,保證學(xué)生學(xué)到、考到的內(nèi)容是全面而均衡的。后者回答“很好是多好?”“怎樣好才是足夠好?”等問題,促進(jìn)學(xué)生在不同程度上的學(xué)習(xí)。通過將學(xué)生學(xué)業(yè)成就評價(jià)設(shè)立在標(biāo)準(zhǔn)之上,可以規(guī)范不同類型的學(xué)業(yè)成就評價(jià),減少偏題、怪題,也可以比較容易地形成一套教師、學(xué)校、地方和國家不同層級協(xié)調(diào)一致的綜合的學(xué)生學(xué)業(yè)成就評價(jià)體系。
二、怎樣將課程標(biāo)準(zhǔn)轉(zhuǎn)化為評價(jià)標(biāo)準(zhǔn)
在解決意義問題之后,我們需要關(guān)注的一個(gè)瓶頸問題是如何將課程標(biāo)準(zhǔn)變成評價(jià)標(biāo)準(zhǔn),因?yàn)檎n程標(biāo)準(zhǔn)的規(guī)定性相對而言是比較弱的。它按照年段進(jìn)行設(shè)計(jì),是對學(xué)生課時(shí)目標(biāo)的累積期望,而且目前的課程標(biāo)準(zhǔn)對學(xué)生的認(rèn)知要求并不十分明確,這就使課程標(biāo)準(zhǔn)的規(guī)定性要大大低于教學(xué)大綱,顯得比較“含糊”,作為評價(jià)標(biāo)準(zhǔn)就顯得規(guī)定性不足。因此,在設(shè)計(jì)基于標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評價(jià)的時(shí)候,地方和學(xué)校就不能直接應(yīng)用標(biāo)準(zhǔn),而是要對標(biāo)準(zhǔn)進(jìn)行一定的處理,將年段的內(nèi)容標(biāo)準(zhǔn)進(jìn)一步細(xì)化為年級內(nèi)容標(biāo)準(zhǔn)、單元內(nèi)容標(biāo)準(zhǔn)、每節(jié)課的內(nèi)容標(biāo)準(zhǔn)等等,并制定出相應(yīng)的表現(xiàn)標(biāo)準(zhǔn),以作為評分時(shí)的依據(jù)。它們之間的關(guān)系用下圖可以表示得更加清楚。
圖1 各級標(biāo)準(zhǔn)之間的關(guān)系
(一)內(nèi)容標(biāo)準(zhǔn)的技術(shù)考量
國家對基礎(chǔ)教育的絕大多數(shù)課程都已經(jīng)設(shè)定標(biāo)準(zhǔn),但是綜合實(shí)踐活動(dòng)和校本課程還沒有統(tǒng)一標(biāo)準(zhǔn),所以在考慮內(nèi)容標(biāo)準(zhǔn)的時(shí)候,又分成兩種情況,一種是針對那些已有標(biāo)準(zhǔn)的課程,另一種是針對那些沒有統(tǒng)一標(biāo)準(zhǔn)的課程。對已有的內(nèi)容標(biāo)準(zhǔn)的處理可以遵循以下幾個(gè)步驟: 第一,對內(nèi)容標(biāo)準(zhǔn)的處理進(jìn)行規(guī)劃。對諸如誰參加內(nèi)容標(biāo)準(zhǔn)的處理工作,責(zé)任和權(quán)限如何,資金怎樣分配,技術(shù)如何保障,時(shí)間如何安排等一系列問題的規(guī)劃。在確定參與人員時(shí),最重要的是選擇多樣性的代表。
第二,進(jìn)行背景研究,深入理解課程標(biāo)準(zhǔn)。搜集并研究與標(biāo)準(zhǔn)有關(guān)的各類文獻(xiàn)。尋找課程標(biāo)準(zhǔn)中所有的關(guān)鍵概念、命題、公式,并確認(rèn)它們的邏輯關(guān)系。這一步的研究保證課程標(biāo)準(zhǔn)中的所有內(nèi)容在地方和學(xué)校自行形成的標(biāo)準(zhǔn)中得到全面體現(xiàn)。
第三,對內(nèi)容標(biāo)準(zhǔn)細(xì)化、調(diào)適。這一階段是極為重要的,雖然在地方和學(xué)校形成的各級[6][5]
內(nèi)容標(biāo)準(zhǔn)中必須覆蓋國家制訂的所有標(biāo)準(zhǔn),但對不同地方和學(xué)校來說,可以有不同的組織和呈現(xiàn)方式,也應(yīng)該針對不同情況進(jìn)行細(xì)化。在這一階段,地方和學(xué)校應(yīng)該提供機(jī)會建立不同類型的溝通機(jī)制和討論機(jī)制。將大量的基層教師納入其中,傾聽他們的聲音。
第四,運(yùn)用多樣的方法對處理后的標(biāo)準(zhǔn)進(jìn)行評論和驗(yàn)證?梢圆捎猛獠吭u論委員會、中介機(jī)構(gòu)、焦點(diǎn)小組等方式。
第五,在內(nèi)容標(biāo)準(zhǔn)處理的最后階段,應(yīng)該將研究的資料和結(jié)果加以總結(jié)整理,并告知不同的利害關(guān)系人。
標(biāo)準(zhǔn)的形成并不是一勞永逸的,而建立的評價(jià)又是高利害的,因此,應(yīng)該每隔一段時(shí)間就對標(biāo)準(zhǔn)進(jìn)行再檢視和修訂。同時(shí),要防止這樣的誤解:只有評價(jià)可以修改,標(biāo)準(zhǔn)就一定是正確的,事實(shí)上,通過評價(jià)的數(shù)據(jù)對標(biāo)準(zhǔn)進(jìn)行進(jìn)一步的完善也是一種可行并必要的方法。
學(xué)校內(nèi)實(shí)施的課程有一小部分是沒有標(biāo)準(zhǔn)的,如綜合實(shí)踐活動(dòng)、地方課程、校本課程,這些課程因?yàn)槭歉鶕?jù)學(xué)校、地方的具體情況而開設(shè)的,所以無法制訂統(tǒng)一的內(nèi)容標(biāo)準(zhǔn)。但是,對那些有條件的地方和學(xué)校來說,引導(dǎo)教師們積極討論,審慎思考“學(xué)生應(yīng)該知道什么,能做什么”,開發(fā)出一定的核心內(nèi)容標(biāo)準(zhǔn),也是可行的,而且這本身就是非常有益于對這類課程的性質(zhì)、意義、教學(xué)和評價(jià)策略的專業(yè)探討。形成新的內(nèi)容標(biāo)準(zhǔn)的步驟大致也是遵從上面的步驟,但要考慮到教材、評價(jià)之間的一致性。
(二)表現(xiàn)標(biāo)準(zhǔn)的技術(shù)考量
基于標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評價(jià)需要清晰的表現(xiàn)標(biāo)準(zhǔn),才不至于在設(shè)計(jì)評價(jià)或者制定評分量規(guī)時(shí)引起歧義。惟在于國家層面上的表現(xiàn)標(biāo)準(zhǔn)比較模糊,例如,數(shù)學(xué)標(biāo)準(zhǔn)第一學(xué)段的“數(shù)與代數(shù)”,“能靈活運(yùn)用不同的方法解決生活中的簡單問題,并能對結(jié)果的合理性進(jìn)行判斷”。對這些表述,都是很難達(dá)成共識的,什么程度算“熟練”,怎樣才是“靈活”,都需要地方和學(xué)校進(jìn)一步明晰。因此,為讓地方、學(xué)校、教師明白什么樣的好才是好,做到什么程度就夠了,地方和學(xué)校在國家標(biāo)準(zhǔn)的基礎(chǔ)上進(jìn)一步發(fā)展起來的表現(xiàn)標(biāo)準(zhǔn),應(yīng)該是清楚、具體、可測的。
完整的表現(xiàn)標(biāo)準(zhǔn)體系包括以下四個(gè)方面,地方和學(xué)?梢越柚韵驴蚣懿⒏鶕(jù)自己已經(jīng)開發(fā)出來的內(nèi)容標(biāo)準(zhǔn)思考對表現(xiàn)標(biāo)準(zhǔn)的處理:(1)表現(xiàn)水平:學(xué)生表現(xiàn)級別,如優(yōu)秀、比較優(yōu)秀、一般等;(2)表現(xiàn)描述:描述各級表現(xiàn)水平上學(xué)生知道什么,應(yīng)該做什么;(3)范例:說明各個(gè)表現(xiàn)水平上學(xué)生作業(yè)樣例(應(yīng)該包括與內(nèi)容標(biāo)準(zhǔn)的整個(gè)范圍和深度有關(guān)的樣例);(4)分?jǐn)?shù)線:區(qū)分各級表現(xiàn)水平的分?jǐn)?shù)。
[7]②
表注:這一問題是整個(gè)表現(xiàn)標(biāo)準(zhǔn)形成過程中最為重要的問題。關(guān)于如何編制有如下一些過程和策略:收集國內(nèi)外已有的表現(xiàn)描述文本;與專家協(xié)商;研究內(nèi)容標(biāo)準(zhǔn);研究評價(jià)資料;描述出各個(gè)表現(xiàn)水平的期望草案。
在進(jìn)一步形成表現(xiàn)標(biāo)準(zhǔn)的過程中,地方或?qū)W校可思考如下一些問題,可能更有助于表現(xiàn)標(biāo)準(zhǔn)的合理化:
對教師來說,限于時(shí)間、精力和能力,往往不可能開發(fā)出如上所述的非常精致和完善的表現(xiàn)標(biāo)準(zhǔn),所以教師在進(jìn)一步思考表現(xiàn)標(biāo)準(zhǔn)的時(shí)候,尤其是在處理綜合實(shí)踐活動(dòng)、校本課程等沒有統(tǒng)一的表現(xiàn)標(biāo)準(zhǔn)參照的課程的時(shí)候,有一個(gè)簡易的辦法,就是將已經(jīng)制訂的內(nèi)容標(biāo)準(zhǔn)的關(guān)鍵特征轉(zhuǎn)為“我能”的陳述。從學(xué)生的角度看,“我能”的陳述可以幫助學(xué)生獲得標(biāo)準(zhǔn)所要求的關(guān)于學(xué)習(xí)目標(biāo)的清晰圖像。如“我能閱讀關(guān)于科學(xué)、歷史等主題的教材或文章”,“我能選擇一個(gè)我喜歡的作者或是某種類型的文章并閱讀其中的節(jié)選”。
三、怎樣讓學(xué)生學(xué)業(yè)成就評價(jià)建立在標(biāo)準(zhǔn)之上
這是基于標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評價(jià)中很關(guān)鍵的一個(gè)問題。它保證學(xué)業(yè)成就的分?jǐn)?shù)是基于課程標(biāo)準(zhǔn)的測驗(yàn),保證從學(xué)業(yè)成就測驗(yàn)而來的結(jié)果與解釋的有效推論。美國在開發(fā)基于標(biāo)準(zhǔn)的測驗(yàn)的過程中,州的典型做法是要求測驗(yàn)開發(fā)者創(chuàng)建與課程標(biāo)準(zhǔn)匹配的測驗(yàn),再對其進(jìn)行匹配度(alignment of standards and assessment)檢驗(yàn)和一系列的試卷分析。迄今為止,已有四種比較成熟的模式來幫助判斷學(xué)生學(xué)業(yè)成就評價(jià)和標(biāo)準(zhǔn)之間的匹配、一致程度:(1)韋伯模式(Webb model);(2)實(shí)施課程的調(diào)查模式(surveys of enacted curriculum model);(3)成就公司模式(Achieve Inc.model);(4)基礎(chǔ)教育委員會模式(Council for Basic Education model)。③我們對這四種模式進(jìn)行總結(jié),提煉出如下的操作程序。
(一)形成考察匹配程度的維度
衡量評價(jià)和標(biāo)準(zhǔn)之間的關(guān)系,并不是簡單的是或否的問題,而是一系列的集中性回答匹配程度的維度。這四種模式雖然關(guān)鍵特征、所使用的方法各有不同,但都是將基于標(biāo)準(zhǔn)的評價(jià)分成若干維度來審視。僅在于一開始就思考評價(jià)維度的形成是比較困難的,我們可以從問題入手,將“怎樣將評價(jià)建立在標(biāo)準(zhǔn)之上”這個(gè)大問題分解成如下幾個(gè)小問題。
(1)是否每個(gè)評價(jià)衡量的都是在標(biāo)準(zhǔn)里反映出的內(nèi)容和技術(shù)?
(2)是否每個(gè)評價(jià)都是對標(biāo)準(zhǔn)所反映的重要的知識與技能的公平、有效的抽樣?每種評價(jià)在何種程度上衡量了那個(gè)年級水平的關(guān)鍵內(nèi)容和技術(shù)?
(3)是否每個(gè)評價(jià)都具有足夠的挑戰(zhàn)性?因?yàn)橐獪y量標(biāo)準(zhǔn)中所強(qiáng)調(diào)的知識和技能是很容易的,而對那些復(fù)雜的概念、拓展性推理和高級思維很難測量。
當(dāng)然,這樣的分解并不是絕對的,還可以有其他的分解方法?紤]到對初次涉入此領(lǐng)域的地方或?qū)W校來說,還是比較抽象的。如成就公司發(fā)展出了如下四個(gè)維度:內(nèi)容的集中性
(content centrality);表現(xiàn)的集中性(performance centrality);挑戰(zhàn)(challenge);平衡和范圍(balance and range);A(chǔ)教育委員會發(fā)展出了另外四個(gè)維度:內(nèi)容(content)、內(nèi)容平衡(content balance)、嚴(yán)密(rigor)、項(xiàng)目反應(yīng)類型(item response type)。地方或?qū)W?梢愿鶕(jù)自己的實(shí)際情況進(jìn)行維度的開發(fā)。
(二)考察測驗(yàn)細(xì)目表
在評價(jià)員將自己的觀點(diǎn)加在評價(jià)之前,首先要傾聽評價(jià)開發(fā)者的聲音,最省力的途徑就是考察細(xì)目表。因?yàn)闇y驗(yàn)細(xì)目表是測驗(yàn)形成的依據(jù),所以第二步就考察測驗(yàn)細(xì)目表,檢視開發(fā)者自己的題目和標(biāo)準(zhǔn)之間的一致性。當(dāng)然,這要建立在評論員對標(biāo)準(zhǔn)和與之相關(guān)的各種文本進(jìn)行深入研究的基礎(chǔ)上。
評論員要審慎查看細(xì)目表檢測的是哪些標(biāo)準(zhǔn),是否包括了應(yīng)當(dāng)有的標(biāo)準(zhǔn),對標(biāo)準(zhǔn)的理解和所列舉的范例是否適當(dāng),每一個(gè)標(biāo)準(zhǔn)所分配的題目數(shù)及題目質(zhì)量等是否合適,并在檢視過程中就先行剔除那些明顯不符合標(biāo)準(zhǔn)或有錯(cuò)誤的題目。在分析測驗(yàn)細(xì)目表時(shí),要輪流檢查每一個(gè)題目,并確認(rèn)題目內(nèi)容和標(biāo)準(zhǔn)內(nèi)容是否匹配。有時(shí)候一個(gè)題目會牽涉幾個(gè)標(biāo)準(zhǔn),這時(shí)評論員就要非常謹(jǐn)慎,區(qū)分這個(gè)題目主要是測量哪一個(gè)標(biāo)準(zhǔn)。必要時(shí),評論員可以自己對照標(biāo)準(zhǔn)形成測驗(yàn)細(xì)目表,并將自己的細(xì)目表和測驗(yàn)開發(fā)者形成的細(xì)目表加以比較。這一階段結(jié)束后,最好要有一個(gè)簡要的報(bào)告呈現(xiàn)給開發(fā)者,以作為改進(jìn)測驗(yàn)之用。
(三)對題目逐一進(jìn)行分析
測驗(yàn)題目通常都由兩個(gè)方面組成。一是題目的內(nèi)容,二是題目的認(rèn)知要求,如記憶、選擇、分析、歸納等等,所以對題目的分析也從這兩方面來進(jìn)行。前者要求評論員檢視每一個(gè)題目內(nèi)容和與之相連的標(biāo)準(zhǔn)內(nèi)容。在進(jìn)行分析的時(shí)候,評論員要考慮標(biāo)準(zhǔn)的特性和細(xì)化程度,以及它要評價(jià)的內(nèi)容的范圍。后者要求評論員考慮每個(gè)題目的認(rèn)知要求和標(biāo)準(zhǔn)所描述的認(rèn)知要求之間匹配的質(zhì)量。這一點(diǎn)往往被人們忽略,但卻是非常重要的,常見的錯(cuò)誤就是當(dāng)標(biāo)準(zhǔn)強(qiáng)調(diào)高級思維的時(shí)候,而測驗(yàn)題中往往只是用背誦、記憶的方式來檢測。
值得注意的是,在這里要考察的并不僅僅是題目,還包括對標(biāo)準(zhǔn)的進(jìn)一步處理,因?yàn),有時(shí)評價(jià)不是基于標(biāo)準(zhǔn)的原因在于標(biāo)準(zhǔn),當(dāng)標(biāo)準(zhǔn)過于寬泛或是用詞含糊時(shí),也會出現(xiàn)不能匹配的現(xiàn)象,因此,韋伯也指出,匹配度的檢驗(yàn)程序必不可少的一步是學(xué)術(shù)標(biāo)準(zhǔn)的系統(tǒng)性分析,并認(rèn)為標(biāo)準(zhǔn)分析應(yīng)該先于評價(jià)分析進(jìn)行。[10] [9][8]
(四)整體測驗(yàn)的質(zhì)量分析
完整的考察標(biāo)準(zhǔn)和評價(jià)的匹配程度不僅要考察單個(gè)的題目,還要對整體的試卷進(jìn)行分析。對一個(gè)個(gè)題目的考察是基礎(chǔ),對整體的試卷進(jìn)行分析以考察標(biāo)準(zhǔn)之間的相互聯(lián)系更為重要。以成就公司模式為例,在它發(fā)展出的四個(gè)維度中,前兩個(gè)維度是對單個(gè)的題目進(jìn)行的分析,而后兩個(gè)維度“挑戰(zhàn)”“平衡和范圍”就是考察整體試卷的質(zhì)量。挑戰(zhàn)又可以分成兩個(gè)方面,一是挑戰(zhàn)的來源,二是挑戰(zhàn)的水平。前者是保證題目的難度來自標(biāo)準(zhǔn)所指向的知識和技能。后者要評論員考慮到被評價(jià)的概念的性質(zhì)和學(xué)生要得出答案所要進(jìn)行的思維類型,測驗(yàn)中的
一系列題目對特定年級水平的學(xué)生是否富有挑戰(zhàn)性做出總體的判斷。它認(rèn)為考慮挑戰(zhàn)這個(gè)因素是保證我們可以基于測驗(yàn)做出這樣的推論:學(xué)生在這些題目上做得好是因?yàn)閷W(xué)生掌握了富有挑戰(zhàn)性的學(xué)科內(nèi)容,學(xué)生在這些題目上表現(xiàn)不好,就是因?yàn)樗麤]有掌握
試論基于課程標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評價(jià)
這些內(nèi)容,而不是因?yàn)閷W(xué)生的背景知識等其他原因。平衡和范圍是指整個(gè)測驗(yàn)應(yīng)該覆蓋標(biāo)準(zhǔn)的完整范圍,同時(shí)也要注意不同重點(diǎn)之間的適度平衡。此處的基于標(biāo)準(zhǔn)的學(xué)生評價(jià)并非從測量學(xué)的角度來講,它不是標(biāo)準(zhǔn)化測驗(yàn)(standardized test),也不是標(biāo)準(zhǔn)參照測驗(yàn)(criterion-referenced test),更不是20世紀(jì)70~80年代提倡的“最低能力”、“掌握學(xué)習(xí)”。
尤其是對累積性標(biāo)準(zhǔn)考慮,各個(gè)學(xué)校是不同的。要經(jīng)過一個(gè)年級段才能達(dá)成的目標(biāo)怎樣將其納入到各個(gè)不同的年級和單元主題中去,各個(gè)地方和學(xué)校的考慮是大不相同的。 ②①
可以看到,這四種模式都是由外部的中介機(jī)構(gòu)接受州或地方的委托而做的,這樣就可以避免對內(nèi)部評價(jià)的公信度的拷問。但是,這樣的機(jī)構(gòu)在我們國家現(xiàn)在還是缺失的,隨著改革的繼續(xù)推進(jìn),獨(dú)立的能夠?qū)y驗(yàn)進(jìn)行評估的機(jī)構(gòu)的建立勢在必行。
參考文獻(xiàn):
[1]Robert Rothman,Jean B.Slattery,and Jennifer L.Vranek.2002.Benchmarking and Alignment of Standards and Testing.CSE Technical Report 566.http://www.cse.ucla.edu.
[2]Stephen Chappuis,Richard Stiggins,Judith Arter,and Jan Chappuis.Assessment For Learning.Portland,OR:Assessment Training Institute.2005.
[3]Mien Segers,Filip Dochy and Educardo Cascallar.Optimising New Modes of Assessment;In Search of Qualities and Standards.Dordrecht;Boston:Kluwer Academic Publishers.2003.3. [4]教育部.基礎(chǔ)教育課程改革綱要(試行),2001.
[5]No child left behind issue brief:a guide to standards-based assessment 2000.http://www.ecs.org/ clearinghouse.
[6]Goals 2000:Educate America Act.http://www.ed.gov/ legislation/Goals 2000/The Act.
[7]Hansche.Meeting the Requirements of Title I:Handbook for the development of Performances Standards.Washington,DC:Council of Chief States School Officers.1998.
[8]Robert Rothman,Jean B.Slattery,and Jennifer L.Vranek.Benchmarking and Alignment of Standards and Testing.CSE Technical Report 566.2002.
[9]Council of Chief State School Officers.Models for Alignment Analysis and Assistance to States.ERIC.2002.
[10]Webb N L.Alignment of Science and Mathematics Standards and Assessments in Four States.Washington,DC:Council of Chief State School Officers.1999.
③
【試論基于課程標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評價(jià)】相關(guān)文章:
學(xué)生學(xué)業(yè)成就自我評價(jià)11-10
學(xué)生學(xué)業(yè)評價(jià)評語12-28
學(xué)業(yè)成就方面自我評價(jià)范文(通用7篇)12-01
學(xué)生學(xué)業(yè)評價(jià)評語大全05-18