大學(xué)英語四、六級考試現(xiàn)在考生數(shù)已達(dá)到每年900萬,由于命題的科學(xué)性、評分的一致性、組織的嚴(yán)密性、成績的可比性和可解釋性,大學(xué)英語四、六級考試在社會(huì)上已有廣泛影響,并且已經(jīng)在國際上受到重視。由于種種原因,四、六級考試結(jié)果可能對學(xué)生有重要影響,因此是一項(xiàng)高風(fēng)險(xiǎn)考試,組織這樣一項(xiàng)考試是極其嚴(yán)肅的心理測量學(xué)科學(xué)工作,又是一項(xiàng)艱苦細(xì)致的、政策性很強(qiáng)的工作。
大學(xué)英語四、六級考試是一種大規(guī)模標(biāo)準(zhǔn)化考試。人們常常把標(biāo)準(zhǔn)化考試等同于多項(xiàng)選擇題,又把多項(xiàng)選擇題等同于模擬試題集,于是指責(zé)標(biāo)準(zhǔn)化考試考不出學(xué)生水平等等,這是一種極大的誤解。英語標(biāo)準(zhǔn)化考試是指采用教育測量技術(shù)對學(xué)生的英語能力進(jìn)行客觀、準(zhǔn)確、公正的測量,并提供一種公認(rèn)的客觀標(biāo)準(zhǔn), 通過對學(xué)生語言運(yùn)用的抽樣檢查來確定學(xué)生的實(shí)際語言能力。大規(guī)模標(biāo)準(zhǔn)化考試為了保證考試的信度和效度,對考試有很高的質(zhì)量要求。大學(xué)英語四、六級考試在設(shè)計(jì)時(shí)力求做到:
1) 評分具有客觀性、一致性
2) 對教學(xué)具有正確的指導(dǎo)性
3) 分?jǐn)?shù)具有可比性、可解釋性
4) 施考條件對所有考生以及不同考次的考生一律平等
5) 便于施考
為了保證考試的效度,大學(xué)英語四、六級考試通過調(diào)查研究制定了考試大綱、定義了所測量的英語語言能力、編制了詳細(xì)的考試內(nèi)容規(guī)范,使歷年測試在形式和內(nèi)容上都穩(wěn)定不變,保持了評價(jià)標(biāo)準(zhǔn)的穩(wěn)定性。
考試的最終結(jié)果是以分?jǐn)?shù)的形式報(bào)道考生成績,這就涉及分?jǐn)?shù)的可解釋性問題。如果分?jǐn)?shù)任意性很大而且又不可解釋,不同考次的成績因?yàn)闆]有經(jīng)過等值處理而不可比較,那么這樣的考試就不符合標(biāo)準(zhǔn)化考試的規(guī)范要求,就很難說是科學(xué)的考試。
為此,大規(guī)模標(biāo)準(zhǔn)化考試一般不采用原始分(即答對題數(shù))來報(bào)道考生成績,因?yàn)檫@樣做分?jǐn)?shù)的信息量太小,通常要進(jìn)行一系列的分?jǐn)?shù)轉(zhuǎn)換過程,使最后報(bào)道的分?jǐn)?shù)不但信息量大而且具有可解釋性。
大學(xué)英語四、六級考試每次考試結(jié)束后到發(fā)布考試成績之前,要經(jīng)過一系列的統(tǒng)計(jì)處理,分為數(shù)據(jù)輸入、數(shù)據(jù)處理、成績計(jì)算及統(tǒng)計(jì)分析三部分,其流程如圖1所示。
其中數(shù)據(jù)輸入后的數(shù)據(jù)處理包括三個(gè)部分:
1)客觀題部分首先要作加權(quán)處理,加權(quán)反映了語言測試設(shè)計(jì)者對語言能力不同部分的不同要求,反映了對不同教學(xué)目標(biāo)的側(cè)重。大學(xué)英語四、六級考試中閱讀能力、聽力、詞匯等各個(gè)部分每答對一題的得分都是不同的。在經(jīng)過加權(quán)處理后,還要對客觀題部分用IRT(試題響應(yīng)理論)模型作等值處理,以濾除不同考次間題目難易變化對得分的影響。盡管大學(xué)英語四、六級考試的全部題目在實(shí)際使用前都要經(jīng)過“命題—審題—試題項(xiàng)目分析—復(fù)審—構(gòu)卷”的漫長過程,在實(shí)考前整個(gè)試卷的難易度均已得到控制,但預(yù)測是在考生中抽樣進(jìn)行的,與實(shí)考結(jié)果難免會(huì)有所差異,這些差異須要通過IRT等值處理加以濾除,不能因題目難易而影響考生得分,這樣做也保證了不同考次之間分?jǐn)?shù)的可比性(見圖2);
2)主觀題部分,如作文,要通過調(diào)整以濾除閱卷員主觀因素的影響。
為了保證閱卷員的閱卷信度(包括閱卷員本人的評分一致性、閱卷員之間的評分一致性、閱卷點(diǎn)之間的評分一致性),大學(xué)英語四、六級考試采取了一系列措施,包括制定明確的評分標(biāo)準(zhǔn)、確定評分參照卷(range-finders)、嚴(yán)格的閱前培訓(xùn)、閱卷過程隨機(jī)抽查等等。在采取以上這些有效措施后依然存在的誤差可以稱為系統(tǒng)誤差,大學(xué)英語四、六級考試開發(fā)了一套軟件系統(tǒng),根據(jù)考生在主、客觀題上得分的相關(guān)性進(jìn)行調(diào)整,以濾除系統(tǒng)誤差。
事實(shí)上,四、六級考試每次要在全國范圍內(nèi)動(dòng)員1500~2000名教師閱卷,閱卷工作是一種辛苦的付出,閱卷過程有嚴(yán)格的質(zhì)量控制措施,并且用計(jì)算機(jī)濾除閱卷員的主觀因素,使閱卷信度達(dá)到0.87,這在國內(nèi)各種大規(guī)?荚囍惺呛懿蝗菀鬃龅降。
3)分?jǐn)?shù)的正態(tài)化處理。
大規(guī)模標(biāo)準(zhǔn)化考試的記分體制根據(jù)考試目的的不同通常采用正態(tài)分制或等級分制。這兩種記分體制所表示的分?jǐn)?shù)都帶有大量信息,便于用戶使用。
大學(xué)英語四、六級考試的性質(zhì)和目的,決定大學(xué)英語四、六級考試是一種尺度相關(guān)-常模參照考試(criterion-related norm-referenced test), 其記分體制采用以百分制為形式的正態(tài)分制。
所謂常模參照考試是指以某一常模作為參照系來反映考生成績的考試,首先要按照某一參照性群體建立常模,通常用均值和標(biāo)準(zhǔn)差來表示;某一考生的成績是通過他的成績在常模群體中與其他考生成績比較的相對位置來表示的。常模參照考試所表示的分?jǐn)?shù)是相對的,只有保持常模的穩(wěn)定性才能保證分?jǐn)?shù)解釋的穩(wěn)定性。尺度參照考試則要參照一定的尺度對學(xué)生進(jìn)行考核。學(xué)生的成績不是通過與其他考生的比較,而是通過與某種特定的尺度進(jìn)行比較而得到解釋的,學(xué)生的成績必須達(dá)到某一尺度方能及格。這種特定尺度的選擇或制定是尺度參照考試的關(guān)鍵,對于大學(xué)英語四、六級考試來說,這一尺度就是教學(xué)大綱中規(guī)定的教學(xué)要求。但不論哪一種性質(zhì)的考試,分?jǐn)?shù)的解釋必須與某個(gè)參照系作比較,才能表示出分?jǐn)?shù)所代表的意義。而常模一經(jīng)建立,其分?jǐn)?shù)的意義和解釋也是確定的,不會(huì)發(fā)生考生相互影響得分的問題。
作為一種尺度相關(guān)常模參照考試,大學(xué)英語四、六級考試采用正態(tài)分制報(bào)導(dǎo)考生成績,均值為72分,標(biāo)準(zhǔn)差為12分;為了適應(yīng)我國傳統(tǒng),以百分制為形式,60分為及格,85分優(yōu)秀。
四級考試(CET-4)的報(bào)導(dǎo)分?jǐn)?shù)有兩方面的含義:1)判斷考生是否達(dá)到了《大學(xué)英語教學(xué)大綱》所規(guī)定的四級教學(xué)要求;2)表示考生在標(biāo)準(zhǔn)樣組即常模中的位置,常模由中國六所重點(diǎn)大學(xué)(北京大學(xué)、清華大學(xué)、上海交通大學(xué)、復(fù)旦大學(xué)、中國科技大學(xué)、西安交通大學(xué))的近萬名本科生組成。大學(xué)英語六級考試報(bào)導(dǎo)分的常模也由上述六所重點(diǎn)大學(xué)的本科生組成。大學(xué)英語四、六級考試的分?jǐn)?shù)每次都分別經(jīng)過等值處理,報(bào)導(dǎo)分的分?jǐn)?shù)含義保持不變,四、六級考試分?jǐn)?shù)相對于上述六校中一個(gè)學(xué)年的理論群體。
這一記分體制為用戶選拔人才提供了方便,例如若
CET-4報(bào)導(dǎo)分 百分位(優(yōu)于…) CET-6報(bào)導(dǎo)分
60 分 16%
62 分 20%
66 分 30%
69 分 40%
72 分 50%
75 分 60% 60 分
65% 64 分
78 分 70% 68 分
78% 72 分
82 分 80%
85 分 86% 76 分
87 分 90% 80 分
93 分 96% 85 分
99 分 99% 90 分
100 分 100% 100 分
某考生四級得85分,則相當(dāng)于他的英語成績在上述六所重點(diǎn)院校中優(yōu)于86%的學(xué)生,而跟這位考生來自哪一所學(xué)校無關(guān);又如若某考生六級得85分,則相當(dāng)于在上述六所重點(diǎn)院校中優(yōu)于96% 的學(xué)生,也跟這位考生來自哪一所學(xué)校無關(guān);同理,在選拔人才時(shí),若要挑選相當(dāng)于在上述六所重點(diǎn)院校中英語四級成績最優(yōu)秀的10% 的學(xué)生,則可以定為四級87分;要選拔英語六級成績最優(yōu)秀的10%的學(xué)生,則可以定為六級80分。這樣就為人才的選拔和合理使用提供了方便。
由于大學(xué)英語四、六級考試測量的科學(xué)性和分?jǐn)?shù)的可解釋性,目前境外和國外已不少大學(xué)采用大學(xué)英語四、六考試考試成績作為錄取大陸地區(qū)學(xué)生申請碩士、博士學(xué)位的英語成績證明。
大學(xué)英語四、六級考試口語考試的成績報(bào)道則采用等級分制,其能力等級標(biāo)準(zhǔn)如圖5所示。事實(shí)證明我國非英語專業(yè)的大學(xué)生有些已經(jīng)具有很高的口頭交際能力,凡獲得A等和B等證書的學(xué)生都可以用流利的英語進(jìn)行口頭交際,達(dá)到相互溝通的目的;獲得C等證書的學(xué)生也已經(jīng)預(yù)備初步的英語口語交際能力。這些學(xué)生為我國廣大的非英語專業(yè)的大學(xué)生學(xué)好英語樹立了榜樣。
等級 等 級 描 述
A等 能用英語就熟悉的題材進(jìn)行口頭交際,基本上沒有困難
B等 能用英語就熟悉的題材進(jìn)行口頭交際,雖有些困難,但不影響交際
C等 能用英語就熟悉的題材進(jìn)行簡單的口頭交際
D等 尚不具有英語口頭交際能力
以上這些措施不但保證了大學(xué)英語四、六級考試分?jǐn)?shù)的科學(xué)性和可解釋性,而且由于分?jǐn)?shù)含有大量信息,也可以反饋到教學(xué)中幫助改進(jìn)教學(xué),同時(shí)也便于用人單位有效地選拔人才和合理地使用人才。(完)
全國大學(xué)英語四、六級考試委員會(huì)主任 楊惠中 2004.1.
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |