多元評量及在國小英語教學的運用(Multiple Assessment and Teaching)
撰寫人: 王秋瑩(Written by Sherrie Wang)
南投國小專任英語教師
兼南投縣國教輔導團英語科輔導員(國小組)
前言:
長久以來,人們如家長、學生、甚至是老師對於考試的印象是負面的。對於家長而言,家中有考生,所有家中的作息一律以考生的為中心,若學生有段考,一切的家庭活動就必須要等到段考結束。倘若考生面對的是國中基測,那可更不得了,家中每位成員就必須練就察顏觀色的工夫,深怕惹惱考生而引起考生罷考的戲碼,全家仰考生鼻息過日子,只求考生在考試的過程中順利考上明星學校。如果考生順利考上,家人從此過著幸福快樂的日子,反之,則天昏地暗。對學生而言,考試早已與焦慮畫上等號,伴隨焦慮的症狀包括頭痛、肚子痛、排斥上學,進而演變成逃學、甚至說謊及偷竊(citation)。對於老師而言,考試的負面情緒更是不言而喻,考試完後的批改考卷,科任 老師聽到電話如催命鐘一聲聲的來自班導師的催討成績”你是所有科任 老師中考卷改的最慢的”、或是”我所有的成績都登錄好了,就只有英語老師最慢”、甚至”英語老師的動作改成績最慢”,於是考試或是評量的時間就成為最大的夢懨,連作夢都夢到自己拿著紅筆永無止盡地重複著批改考券,直到天色漸白。幸運地,國小英語因為離國中基測還有一段時間,所以國小英語教師在教學的時候,比起國中 老師享有更多的自由課程計畫的空間。於是多元評量在課堂上的運用度可以更多更廣。本篇文章將從多元評量的基本概念、實施評量原因、目的及方式,最後將從現階段在英語教學中長實施的多元評量的種類來探討。
上述提到,評量的種種缺點以及對學生產生的負面的影響,其中負面的影響更包括了對教學產生了引導作用(washback phenomenon),亦稱為考試領導教學,但是如果將考試的內容做適當的調整後,將收到正向的回饋,如國內學者認為學生的作文能力普遍低落,為了突險出作文的重要性,也希望學校將作文教學做為教學重點,於是將英語作文納入大學聯考,成為一反向的導引作用的一個很好的例子。雖然評量的為學習者及教學皆帶來負面的影響,但是評量的持續實施評量的原因是仍然有其重要性,本文將從實施多元評量的原因、多元評量應該具備的要件、在英語教學中可以實施評量的要素、及多元評評量在英語教學現場的實例等四方面來說明。
首先實施評量的原因包括
1.
測試出教材難易度是否適合學生:
ㄧ個實施正確的及公平的評量可以測試出學生的對於學習內容的吸收情形,並反映出教材的難易度是否適合學生學習,有可能係因為學習內容對學習者而言困難度過高,所以不適合學生。教學者在施測後便可以根據評量結果做教材的調整、調整教學方法,或是實施補救教學。
2.
評量可以用來發現學生的進步情形。
3.
評量結果可以用來了解學生對於學習材料的吸收情形,作為以後教學調整的依據(形成性評量)。比如說,教學者在教授完”What does she/he like?” “He/She likes hamburger.” (朗文出版社,Here We
Go版本,第八冊),單元之後實施期中評量之後發現,大多數的學生對於第三人稱單數動詞加S的概念錯誤,於是將”Where does she go?”,”She Goes to School.” (Reading A-Z),利用小書單一句型,藉由重複練習的方式提供學生大量練習第三人稱單數時動詞要加S的概念,讓學生在閱讀小書時自然而然地將此概念養成習慣。
4.
評量的結果可以用來發現學生是否有學生方面的困難(診斷性評量)。比如說,某生在上課時對於教學者任何的口語方式的問題回應都沒有問題,但是期中評量時的結果完全無法反應,或是無反應,經過測試後發現該生對於閱讀性的輸入完全無法理解,因而建議此生需做進一步的診斷,結果發現此生有閱讀性困難(dyslexia)。
5. 評量的結果可以用來了解學生的學習強項、或是學生的學習弱項,比如說,一個智力正常的學生在課堂反應低於同儕,在定期評量時,對於試卷上的問題無法做出反應,除去閱讀性困難的問題後,經調查後發現此生為外籍配偶之子,父親平日忙於家計,其印尼籍母親為此生平日主要及唯一的互動及交談對象,在缺乏語言的刺激如及國語及台語,導致此生對於學校的互動產生由語言隔閡所帶來的困難,如看不懂國字而無法理解題意,更遑論回答問題。此種狀況在外籍配偶人數激增的情況下著這種現象,隨著外籍配偶之子的年紀漸漸達到學齡,教育單位應該在學校李資源班或是增設學習中心來因應此現象,提供外籍配偶之子學習的機會。
二、評量應該具備的要件,茲分評量範圍(一) 應該配合教學目標、(二) 評量方式需要多樣化、(三) 須講求信度及效度、(四) 形成性評量及總結性評量應該並重、(五) 應配合學生的年齡層 (六) 評量應以 老師的評量為主,自我評量及同儕評量為輔 (七) 評量時語意表達應重於語言形式的正確
及(八) 評量的結果目的在了解學習困難及學生進步情形而非獲得學期成績,等八方面來說明:
在開始討論評量應具備的要件之前,應討論評量的定義,但在對評量下定義之前,我們應該先了解什麼是評鑑、評量與測驗,並需先分辨其不同之處為何。
評量的定義:葉錫南 教授對於”評鑑(evaluation)、評量(assessment)、
及測驗(testing)三項在目的及範圍上有所區分(2001, p42)。測驗範圍最小,也最明確,其試題皆有最「正確」及最「明確」的答案如段考、定期評量或月考。評量的範圍較廣,評量的方式也較多元,評量利用測驗,面談(interview)、實作或工作計畫(project)、檔案評量(portfolio assessment)等方式來診斷學生的語言能力(2001,
p43)。評鑑層次在三者中屬最高,是用一種”有系統地蒐集相關資料以改善課程、評估其成效、了解學生的態度(Brown, 1989)。
(一) 在英語的學習中,所評量的內容如學生的知識及語言的運用應該以課程綱要中所列出的課程目標為依據,因為在課程設計時,課程的內容就以課程綱要為圭臬,倘若評量的內容與課程綱要偏離,那麼不但老師的教學內容顯得沒有目標,也容易讓學生對於學習內容無所適從,所以評量的內容一定要和課程綱要中所訂定的課程目標習習相關。
(二) 評量的方式必須多元,多元的觀念可以從多方面來探討。若多元係指時間的多元,那就是說評量的時間不僅僅是月考,就評量的時間來說評量可以是在學期末(總結性評量),亦可以指學期中經長性的評量,如小考、月考、期中評量等(形成性評量)。就形式多元來說,評量形式的多元可以是傳統的紙筆測驗式的評量,或是活動式的評量如闖關或是遊戲式的評量等。若是指內容式的多元,那麼評量便指各種語言形式的評量包括聽說讀寫四種語言基本能力的評量。多元亦可指評量工具的多元,除了傳統的指筆測驗之外,其他的工具的運用如電腦、多媒體的融入都可以讓我們達到工具多元的目的。評量者的多元亦可以讓我們達到多元評量的目的,傳統的評量者除了老師以外,加上同儕的評量或是自我評量都是多元評量的展現。
(三) 講求信度與效度:首先測驗所應具信度及效度是評量所應具備的重要條件之一,效度是指一個評量工具可以準確及精準地測驗出學生對於學習內容的吸收及理解程度,張春興指出((2005,p143) 效度係指一個測驗的準確度,一個有效的測驗必須要能夠精準地測驗出學生的能力(現代心理學,p407)。要使得考試效度高,教學內容及考試的內容緊緊相扣是提高效度的方法之ㄧ。例如,教學的內容一直都以訓練學生的聽及說的能力為主,那麼考試的內容及方式就必須以考出學生的聽力及說的能力為中心,在這個情形下如果考試的內容是以考出學生的閱讀及書寫的能力,那麼此次的考試效度相對也會很低。所以,要提高評量的效度必須要教學內容以及評量的內容緊緊相扣,不可偏離。
信度,係指其可靠的程度而言,一個測驗要有信度才能令人相信,換句話說,一個測驗信度高係指其重複施測的前後結果一致,也就是其一致性高,亦可以說其可信度高。在英語教學的測驗上比方說,施測者為三年級所出題的96學年度上學期其中評量試題的測驗結果,同一份試題拿給97學年度同期三年級的學生施測其結果倘若一致,我們就可以判定此測驗有其信度。
(四)
形成性評量及總結性評量應並重,形成性評量在教學中目的是要提供教學者一個檢視教學有效的立即性回饋(feedback),過內學者郭生玉(2000, p293)指出形成性評量主要目的在於不斷提供回饋給學生和教師,使他們知道學習的成功與失敗。對學生而言,此種回饋可以增強學習效益,且可提出須修正的學習錯誤;對教師而言,他有助於教師調整教學和實施團體與個別的補救教學措施」,教學者不僅應該善用型成性評量的結果來做教學上的調整,另外教學者亦應該用由形成性評量所得的結果對於有進步的學生做立即性的獎勵,對於退步的學生或是考不好的學生也應該將實施補救教學的依據。所以,實施形成性評量固然重要,更重要的是教學者如何善用實施教學評量後所得的結果,Brown(2000, p149) 指出,在教學的過程中如果沒有適當給學生回饋,形成性評量對於學生的學習技能是沒有幫助的。 總結性評量的主要目的在於教學單元所列教學目標達成的程度、教學方法是否有效、以及用來評定學生的學習成效,相較於形成性評量,總結性評量所涵蓋的難度範圍較廣,通常是取可以代表學習內容的樣本作為試題。(歐滄和,民91)。
(五)
應配合學生的年齡層,根據桑代克的學習準備律,一個個體的學習要有效,必須要其心理已經有所準備,且其個體的心理發展必須要準備好要學習其教材學習內容,否則會引起反效果。加上,評量為學習完畢後的課程活動,其評量的內容必須要和教學活動緊緊相扣(郭生玉,1990),所以,不僅是教學活動要配合學生的年齡層,評量的內容及方式也必須要配合學生了年齡層。
(六)
評量應該以 老師評量為主,同儕評量及自評為輔。傳統上,評量皆以老師為主,但是在多元評量裡,可以加入同儕評量及自評,實施這兩種評量方式的好處是藉由自評及同儕評量可以提供老師不同角度的資訊,其結果亦可以顯現出由老師評量不同的結果。加上,實施自評及同儕評量可以透露出學生對自己學習負責的訊息,這樣在改進學生的學習態度及調整學習策略方面都有其正面的影響,可惜在英語的學習現場,尤其是國小階段,學生的英語能力尚不足以評量同儕的學習結果,所以在此階段的評量應以教師評量為主,同儕評量及自評為輔。
(七)
評量時語意的表達重於語言形式的正確,在溝通式教學法裡主張語言的學習目的在與他人溝通,與其他學科強調學習學科內容的正確性有所不同,在外語的學習過程中學習者應該將能夠將目標語言做正確的語意表達、及用字遣詞能夠精準的運用視為最終目標,但是在英語學習的初期,我們應該以溝通為主,以免英語初學者爲了顧及語言使用的正確性,裹足不前,甚至因而產生挫折感進而放棄學習。
(八)
評量的結果目的在了解學習困難及學生進步情形而非獲得學期成績,教學者實施評量的目的應該在於發現學生對於學習內容的了解及吸收情形,或是在於診斷學生學習的困難所在,並針對發現的學習問題實施補救教學。英語老師要評量某一項目,應該適度地增加評量的次數,並且使用各種不同的評量方式來確定學生是否已經學會,至於分數的評定,應該以鼓勵學生為原則,適時給予鼓勵其增強,以增加學生對於學習英語的成就感,及培養其對英語學習的興趣。
多元評量除了給學生充分的機會展現能力以外,藉由多次多元的結果或者是成績也可以提高評量的效度。但是,隨著評量的次數增加,或許會讓學生對於英語產生一直考試的疑慮,爲了避免學生對英語學習對於考試產稱焦慮,評量方式的使用建議可以多使用形成性的評量,並以不同的活動、遊戲的方式來進行,才可以達到多元評量的基本目的。
在討論完多元評量的基本特色以後,還有教育部頒布的課程綱要也是實施多元評量時必須要注意的事項,在課程綱要中第一條明定國小英語教學目標為(1)培養學生溝通的能力,(2) 了解西方文化,(3) 培養學生學習英語的興趣(課程綱要,p13)。在這個情況下,教學內容必須要遵循上述三個教學目標,當然,評量的內容也必須要在上述三項的課程目標為主,不能偏離,另外課程綱要也指出,國小英語學習在於學習態度的培養,反之國中的英語學習偏向認知方面的目標(國小課程綱要,P31)。
在美國心理學家葛敦(Gardner,1985)的多元智慧(Multiple-intelligent
theory)裡面提出,人的智力是多元的,所以他將智力分為語言、數理、空間、音樂、運動、社交及自知等七大項能力,如果測驗內容是為智力取向,學生的智力將會窄化(張春興,p431)。換句話說,學生的學習是透過多元向的方式來學習,所以,我們的測驗也應該是多元的,這樣一來才夠符合不同專長學生的需求。也就是說有些學生可能分屬於空間型或是音樂型的或是其他型態的學習,如果我們的學習總是偏重在認知的學習,而測驗也偏重於認知的測驗,這樣的情況下,測驗總偏好於認知型的學生,對於其他智力的學生不公平。如果遇到評量的內容為其強項,那麼此生對於該項評量便為擅長。倘若視覺型的學生來參加屬於聽音、辨音的評量,便無法享受其優勢。有鑑於此,學者專家皆提議應該要將評量的方式使用多元的方式來舉行,以便符合不同學習類型的學生,以符合不同學生的需求。
多元評量的特色包括:
1.
多元評量不同於傳統式的紙筆評量,多元評量通成要求學生來表演、創造、產出或是完成某項工作。闖關遊戲比如說,要求學生必須在某個程度內完成某項工作,有時候教師在教室內設定一個虛擬的虛場合要求學生達成某項要求,也是屬於多元評量的範圍。比如說,朗文出版社出版的New Go Super Kids版本的教科書第一冊第四單元”Food”,課文的內容和到速食店購買各類食物,教學者在實施評量時將教師佈置成速食店虛擬現場,讓學生在教室的環境裏練習目標語言,也是多元評量的一種選擇。
2.
多元評量的第二特色是要求學生在真實或虛擬的情況下做出施測者的要求,施測者藉由受測者的表現來打成績。比如說,英語老師在 教授有關食物內容,及對話 ”What do you like? I like ____.” (朗文出版社,第三單元),在實施教學後的評量將學生便將學生帶到實際的現場如速食餐廳或是虛擬的餐廳—將教室佈置成速食餐廳的狀讓學生學習,而在實施測驗時也將在虛擬或是實際的現場速食餐廳實施。
3.
多元評量的特色,比起傳統的評量,多元評量偏重於學生的學習歷程,所以評量的重點也在檢視學生的學習歷程及學習的結果。在檢視學生學習的歷程中,學生的學習問題及學習困難可以在歷程中顯現出來,換句話說,多元評量的重點在於提供學生學習歷程的重要資訊,英語老師便可以發現學生的進步情形,或是因此發現學生學習問題。
III、多元評量在英語教室實例
在本文中,茲提出一些多元評量的實例,以供參考:
1. 活動式句型/文法測驗
句型/文法給人的印象一向是枯燥乏味,因此難免讓學生望之生畏,爲了要克服這樣的問題,我們建議將文法的學習融入學生喜歡的活動中,並透過學生喜歡的活動或是遊戲來評量其表現,以期增加句型/文法學習及評量的趣味性。但為求活動式的評量客觀,教師可以設計合適的評量表如下:
評量句型:What do
you like?
|
評量結果
|
||
在學習中
|
能正確判斷句型文法結構
|
Yes
|
No
|
能正確使用句型文法結構
|
|
|
|
在各自練習時
|
能正確判斷句型文法結構
|
|
|
能正確使用句型文法結構
|
|
|
|
在溝通式的練習中
|
能正確判斷句型文法結構
|
|
|
能正確使用句型文法結構
|
|
|
因為句型/文法和字彙都是語言學習的基礎,所以建議老師在評量的時候,應注重在學生學習及進步的歷程,所以評量僅以能達成、不能達成為評量重點。
2. 評量實例二
教學單元: numbers
(1-10)
適合年級: 三年級
評量活動:
教師在從事這個評量活動前需要將數字1-10做練習直到學生完全熟練後,必須 教授英語chants,”Bubble Gum” 之後,可參考下列步驟從事活動是評量。
(1) 選出一位同學或是由老師擔任第一位”It”
(2) 請全班同學一起唱”Bubble
Gum”的chant之後,老師喊出一個數字。
(3) 班上同學需要依據老師給的數字,組成一組後蹲下。比如,IT 若喊出5, 小朋友必須找到五個人成為一組後蹲下。
(4) 在幫上同學完成後,沒有找到自己組的小朋友就可以當為下一次的it。
(5) 老師可以在活動的過程中仔細觀察反應慢的同學,作為改進教學,或是實施補救教學的依據。
Bubble Gum 的歌詞如下:
Bubble gum, bubble gum in a dish.
How many pieces do you need?
5
(6) 可參考使用下列檢核表
○○學生學習評量單
|
||||
座號
|
評量內容
|
是
|
否
|
備註
|
|
是否樂意參與活動
|
|
|
|
|
是否可以單獨唱完此歌曲?
|
|
|
|
|
是否可以聽懂數字1-10
|
|
|
|
|
在聽懂數字後是否可以做出正確的反應
|
|
|
|
|
是否可以說出數字1-10
|
|
|
|
雖然,多元評量在英語教學領域多受青睞,許多專家學者及喜愛嘗試的英語教學者也都多多提倡,但是這並不表示多元評量可以完全地取代傳統式的評量。多元評量著重在提供教學者一個不同於傳統式評量一個另類的實施評量的方式,
教學者必須要注意到的是不論是教學或是評量兩者在實施時都不應該引起學生的焦慮,換言之,評量的結果應該要被老師用來做為調整教學的工具,或是用來記錄學生的學習歷程,如果因為實施評量而引起學生的考試焦慮(test anxiety)就萬萬不可。實施多元評量的目地在提供施測者一個另外的思考方式及參考,多元評量的實施可以是一張自評表、或是一個檢核表(Check List),這個表格可以由教學者自己設計適合自己使用的表格,不須要將評量的方式設計地非常地複雜。在教學的現場教師是最了解學生,也是最了解學生的學習歷程的,教學者應該要善用這種優勢,適時地鼓勵學生,維持好師生關係,讓學生無偽於學習英語,進而喜歡上英語。
參考文獻
葉錫南 (February, 2001) 多元化評量。國民中小學英語教學活動設計及
評量指引﹙第二章,頁41-73﹚。 教育部。
李茂興(民85):諮商與心理治療的理論與實施(Corey原著,5th)。台北:揚智出版社。
金樹人(民86):生涯諮商與輔導。台北:東華書局。
郭生玉(民74):心理與教育測驗。台北市:精華書局。
林清山(民81):心理與教育統計。台北市:東華書局。
張春興(民83):現代心理學。台北市:東華書局。
張春興(民85):教育心理學—三化取向。台北市:東華書局。
張春興:教育心理學-三化取向。台北市:東華書局。
林清山(民80):教育心理學-認知取向(Mayer原著)。台北市:遠流出版社
葛樹人 (民85) : 心理測驗學。台北市:桂冠書局
葉重新 (民88) : 心理測驗。台北市:三民書局
林幸臺 (民75) : 心理測驗導論。台北:五南書局
林清山 (民67) : 心理與教育統計學。台北:東華書局
孫邦正、鄒季琬 (民72) : 心理與教育測驗。台北:台灣商務印書館
陳英豪、吳裕益 (民71) :測驗的編製與運用。台北:偉文書局
簡茂發(民67) : 信度與效度,社會及行為科學研究法上冊。台北:東華書局
陸祖昆(民77) :創造心理學。台北:五洲出版社
評量是教學的一部分 教學設計時就必須將評量考量近來,多元評量可以檢視學生的多元能力,老師應當多加注意
回覆刪除