免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
HSK的分?jǐn)?shù)解釋問(wèn)題(安哥夫等級(jí)劃分法)

摘要:任何一組考試題目或考試任務(wù),都可以得到一個(gè)“正確回答數(shù)”或“正確回答比例”,都可以得到一個(gè)“分?jǐn)?shù)”。但是,并不是任何一個(gè)分?jǐn)?shù)都可以根據(jù)考試的目的做出解釋?zhuān)伎梢员毁x予“意義”,都可以成為決策的合理依據(jù)。本文探討了與分?jǐn)?shù)解釋有關(guān)的一些問(wèn)題,指出分?jǐn)?shù)解釋的依據(jù)是工作分析和效度研究,指出分?jǐn)?shù)等值的重要性。

 

關(guān)鍵詞:測(cè)驗(yàn) 分?jǐn)?shù) 分?jǐn)?shù)解釋

 

任何一組考試題目或考試任務(wù),都可以得到一個(gè)“正確回答數(shù)”或“正確回答比例”,都可以得到一個(gè)“分?jǐn)?shù)”。但是,并不是任何一個(gè)分?jǐn)?shù)都可以根據(jù)考試的目的做出解釋?zhuān)伎梢员毁x予“意義”,都可以成為決策的合理依據(jù)。

對(duì)于一個(gè)高信度的考試來(lái)說(shuō),80分的意義是“我們有95%的把握說(shuō)該考生的真分?jǐn)?shù)在75—85分之間”。對(duì)于一個(gè)信度不高的考試來(lái)說(shuō),80分的意義則可能是“我們有95%的把握說(shuō)該考生的真分?jǐn)?shù)在60—100分之間”。

對(duì)于一個(gè)高效度的考試來(lái)說(shuō),我們可以很有把握地說(shuō)“高分者必高能”。對(duì)于一個(gè)效度不高的考試來(lái)說(shuō),則可能像今天的許多考試那樣遭到“高分低能”的批評(píng)。中國(guó)歷史上的“八股考試”就曾經(jīng)遭到近代許多進(jìn)步思想家們“高分低能”的猛烈攻擊。

考試的信度和效度是對(duì)分?jǐn)?shù)進(jìn)行解釋的基礎(chǔ),是賦予分?jǐn)?shù)以意義的前提。即使是一個(gè)高信度、高效度的考試,也不一定具有意義。例如,在一個(gè)大學(xué)畢業(yè)生求職簡(jiǎn)歷中的學(xué)習(xí)成績(jī)單上寫(xiě)著“現(xiàn)代漢語(yǔ)80分”。即使他所參加的“現(xiàn)代漢語(yǔ)”考試具有很高的信度和效度,根據(jù)他的這個(gè)成績(jī),我們也很難判斷他的“現(xiàn)代漢語(yǔ)”課程學(xué)得究竟如何,更不用說(shuō)據(jù)此去推測(cè)他的現(xiàn)代漢語(yǔ)水平的高低。如果任課老師評(píng)分政策比較嚴(yán)格,他這門(mén)課程可能學(xué)得很好;如果任課老師評(píng)分政策比較寬松,他這門(mén)課程可能學(xué)得并不好?;蛘哒f(shuō),我們從這個(gè)分?jǐn)?shù)中的到的有關(guān)該求職者的評(píng)價(jià)信息很有限。分?jǐn)?shù)中包含信息很少的原因是缺乏必要的參照系。

HSK(商務(wù))、HSK(旅游)、HSK(文秘)、HSK(少兒)等HSK專(zhuān)項(xiàng)考試的開(kāi)發(fā)工作已經(jīng)啟動(dòng)。建立合理的、豐富的分?jǐn)?shù)解釋系統(tǒng)是專(zhuān)項(xiàng)考試開(kāi)發(fā)的重要內(nèi)容之一。為了對(duì)考試分?jǐn)?shù)做出合理的解釋?zhuān)岣呖荚嚨男哦?、效度是基礎(chǔ)。同時(shí),還需要為分?jǐn)?shù)解釋提供一個(gè)合理的參照系。本文將討論幾個(gè)與分?jǐn)?shù)參照系有關(guān)的問(wèn)題。

 

一、常模參照與標(biāo)準(zhǔn)參照

根據(jù)評(píng)價(jià)參照系的不同,可以將考試劃分為常模參照性(normreferenced)考試和標(biāo)準(zhǔn)參照性(criterionreferenced)考試。常模參照性考試的評(píng)價(jià)參照系是一組人的平均水平。這組人通常是考試的目標(biāo)團(tuán)體的一個(gè)具有代表性的樣本。常模參照性考試關(guān)注的問(wèn)題是“他在哪兒”,關(guān)注考生在一組人中的相對(duì)位置,通常用于對(duì)考生的排隊(duì)和擇優(yōu)。常模參照性評(píng)價(jià)通過(guò)將某一考生與一組考生相比較而對(duì)考生的水平做出評(píng)價(jià),是一種相對(duì)評(píng)價(jià)。智力測(cè)驗(yàn)、高等學(xué)校入學(xué)考試等屬于典型的常模參照性考試。

1963年R.Glaser首先提出了標(biāo)準(zhǔn)性參照考試的概念。標(biāo)準(zhǔn)參照性考試的評(píng)價(jià)參照系是一組知識(shí)和技能,是一組需要完成的任務(wù),因此,標(biāo)準(zhǔn)參照性考試也可以被視為“基于任務(wù)(taskbased)”的考試。標(biāo)準(zhǔn)參照性考試關(guān)注的問(wèn)題是“他能做什么(cando)”,關(guān)注考生所具有的知識(shí)和技能,關(guān)注考生所能夠完成的任務(wù)。標(biāo)準(zhǔn)參照性考試通過(guò)將考生所具有的知識(shí)技能水平與考試目的所要求的知識(shí)技能水平相比較,對(duì)考生的水平做出評(píng)價(jià),是一種絕對(duì)評(píng)價(jià)。畢業(yè)考試、任職資格考試、執(zhí)照考試等屬于標(biāo)準(zhǔn)參照性考試。在這些考試中,如果全體考生都達(dá)到了標(biāo)準(zhǔn),則可以全部予以接受,如果全體考生都未達(dá)到標(biāo)準(zhǔn),則可以全部予以拒絕。

一般說(shuō)來(lái),當(dāng)考試對(duì)象總體的范圍比較清楚時(shí),適于采用常模參照性考試,例如,智力測(cè)驗(yàn)的對(duì)象是某一年齡階段的兒童,總體比較容易界定;當(dāng)考試所包含的知識(shí)、能力范圍比較清楚時(shí),適于采用標(biāo)準(zhǔn)參照性考試,例如,掃盲測(cè)驗(yàn)所包含的知識(shí)范圍是一定數(shù)量的漢字,范圍比較容易界定。

在由美國(guó)教育研究協(xié)會(huì)(AERA)、美國(guó)心理學(xué)會(huì)(APA)和美國(guó)國(guó)家教育測(cè)量學(xué)會(huì)(NCME)等三個(gè)機(jī)構(gòu)聯(lián)合頒布的《教育與心理測(cè)驗(yàn)標(biāo)準(zhǔn)》1999年最新版中說(shuō):“一些量表分?jǐn)?shù)主要用于解釋常模參照性測(cè)驗(yàn),另一些量表分?jǐn)?shù)主要用于解釋標(biāo)準(zhǔn)參照性測(cè)驗(yàn)成績(jī)。在實(shí)踐中,二者并非總是截然分開(kāi)的。一個(gè)測(cè)驗(yàn)分?jǐn)?shù)可以同時(shí)產(chǎn)生標(biāo)準(zhǔn)參照性和常模參照性的量表。例如,最初可能通過(guò)刻畫(huà)某人在團(tuán)體中的位置而建立起一個(gè)常模參照性的分?jǐn)?shù)量表,一段時(shí)間以后,隨著研究的深入和經(jīng)驗(yàn)的增加,人們對(duì)不同的量表分?jǐn)?shù)等級(jí)所反映的能力有了進(jìn)一步的理解。這時(shí),對(duì)分?jǐn)?shù)量表也可以做出標(biāo)準(zhǔn)參照的解釋。另一方面,一個(gè)教育評(píng)估的結(jié)果可以按順序排列的熟練程度等級(jí)量表進(jìn)行報(bào)告,不同等級(jí)可以通過(guò)描述不同水平的學(xué)生可以完成的任務(wù)來(lái)定義,這是一個(gè)標(biāo)準(zhǔn)參照性量表。一旦以這種標(biāo)準(zhǔn)參照的等級(jí)分?jǐn)?shù)報(bào)告了一個(gè)州中某一年級(jí)(如八年級(jí))的全體學(xué)生的評(píng)估結(jié)果后,這一等級(jí)分?jǐn)?shù)也傳達(dá)了有關(guān)考生在群體中相對(duì)位置的信息?!保ǖ?0頁(yè))

筆者認(rèn)為,“常模參照——標(biāo)準(zhǔn)參照”僅僅是刻畫(huà)考試特征的一個(gè)維度(如下圖),在實(shí)際的考試實(shí)踐中,幾乎不存在純粹的常模參照性考試或標(biāo)準(zhǔn)參照性考試,每個(gè)考試都處在這一維度上的一點(diǎn),有的靠近“常模參照”一端,有的靠近“標(biāo)準(zhǔn)參照”一端。即使是典型的常模參照性考試如高考,也需要確定考試計(jì)劃,確定一定的考試內(nèi)

容,也包含一定的“標(biāo)準(zhǔn)參照”,否則,就不必請(qǐng)專(zhuān)家命題,只要靠統(tǒng)計(jì)選題就行了;即使是典型的標(biāo)準(zhǔn)參照性考試如掃盲測(cè)驗(yàn),“脫盲標(biāo)準(zhǔn)”的判定也離不開(kāi)對(duì)人口文化背景這一“常?!钡膮⒄?。

許多考試的分?jǐn)?shù)都可以從多方面進(jìn)行解釋?zhuān)疾灰欢ㄖ挥幸环N參照系。筆者認(rèn)為,HSK主要是一種標(biāo)準(zhǔn)參照考試,原則上講,它的合格標(biāo)準(zhǔn)應(yīng)是能夠使用漢語(yǔ)完成交際任務(wù),能夠適應(yīng)漢語(yǔ)社會(huì)中的工作、學(xué)習(xí)和生活。在理想狀態(tài)下,合格標(biāo)準(zhǔn)的確定方式可以是:首先界定語(yǔ)言交際能力所包含的知識(shí)、技能范圍,界定這一范圍所包含的字、詞、語(yǔ)法、語(yǔ)言功能、文化等。之后,對(duì)總體做代表性抽樣,試卷應(yīng)是總體的一個(gè)具有代表性的樣本。根據(jù)考生在這一試卷上的表現(xiàn)可以推知他的語(yǔ)言交際能力。但是,由于語(yǔ)言現(xiàn)象的復(fù)雜性,準(zhǔn)確界定漢語(yǔ)知識(shí)能力范圍是一件很困難的事情。因此,當(dāng)我們對(duì)考生的漢語(yǔ)水平進(jìn)行評(píng)價(jià)時(shí),不僅需要以今天尚不夠清晰的、尚未能明確界定的“標(biāo)準(zhǔn)”作為參照系,還需要借助常模來(lái)建立參照系。不僅需要與“知識(shí)技能”比,而且需要與“人”比。

HSK目前采用的常模樣組是北京語(yǔ)言大學(xué)1988年的1、2年級(jí)學(xué)年結(jié)業(yè)時(shí)的留學(xué)生。在這個(gè)常模樣組中,體現(xiàn)了當(dāng)時(shí)北京語(yǔ)言大學(xué)的教師們關(guān)于“具有初級(jí)和中級(jí)漢語(yǔ)水平”的看法,體現(xiàn)了教師們認(rèn)為“具有初級(jí)和中級(jí)漢語(yǔ)水平”的學(xué)生所應(yīng)該具有的語(yǔ)言知識(shí)和技能。

HSK專(zhuān)項(xiàng)考試的分?jǐn)?shù),也可以考慮從“常?!焙汀皹?biāo)準(zhǔn)”兩個(gè)方面提供解釋信息,建立分?jǐn)?shù)解釋的參照系。從標(biāo)準(zhǔn)方面,可以在工作分析的基礎(chǔ)之上,界定從事商務(wù)、旅游、文秘等工作所需要的漢語(yǔ)方面的知識(shí)技能,從“能做什么”的角度對(duì)分?jǐn)?shù)進(jìn)行解釋。從常模方面,可以通過(guò)收集常模資料,建立從事商務(wù)、旅游、文秘工作的人的漢語(yǔ)水平的“常?!?,從“處于何處”的角度對(duì)分?jǐn)?shù)進(jìn)行解釋。

 

二、基于工作分析之上的“能做”解釋

與HSK普通考試相比,HSK專(zhuān)項(xiàng)考試的分?jǐn)?shù)更需要回答“能做什么”的問(wèn)題。為了對(duì)考試分?jǐn)?shù)做出“能做什么”的解釋?zhuān)托枰M(jìn)行工作分析。

工作分析是對(duì)某一種職業(yè)活動(dòng)進(jìn)行調(diào)查研究的過(guò)程。工作分析通常所要回答的主要問(wèn)題包括:這項(xiàng)工作包含哪些活動(dòng)(如腦力或體力,執(zhí)行或決策)?這些活動(dòng)的復(fù)雜程度如何(如事務(wù)性或管理性,重復(fù)性或創(chuàng)造性)?這項(xiàng)工作的環(huán)境條件怎樣?工作中使用哪些技術(shù)手段(如算盤(pán)、計(jì)算機(jī)或局域網(wǎng))?這項(xiàng)工作的影響面多大(如影響全鄉(xiāng)、全縣、全省或全國(guó))?工作活動(dòng)對(duì)人的能力有哪些要求(如言語(yǔ)、數(shù)量或邏輯推理)?這項(xiàng)工作對(duì)人在教育程度方面有哪些要求(如中學(xué)、大專(zhuān)、本科或碩士)?這項(xiàng)工作對(duì)人的知識(shí)有哪些要求?這項(xiàng)工作對(duì)人的個(gè)性特征有哪些要求?不稱(chēng)職的工作人員可能造成多大的損害?等等。

在工作分析的基礎(chǔ)之上,我們才可以操作化地界定商務(wù)、旅游、文秘等職業(yè)工作需要哪些漢語(yǔ)方面的知識(shí)和技能,才能據(jù)此確定HSK專(zhuān)項(xiàng)考試的內(nèi)容,才能對(duì)考試分?jǐn)?shù)做出“能作什么”的解釋。這方面,我們可以從美國(guó)教育測(cè)驗(yàn)服務(wù)中心(ETS)編制的“國(guó)際交流英語(yǔ)考試(Testof English for InternationalCommunication,簡(jiǎn)稱(chēng)TOEIC或托業(yè))”考試中得到一些借鑒?!巴袠I(yè)”是一個(gè)面向母語(yǔ)非英語(yǔ)者的英語(yǔ)水平考試,主要用于職業(yè)領(lǐng)域。在“托業(yè)”的開(kāi)發(fā)和完善過(guò)程中,ETS進(jìn)行了大量的工作分析研究。例如,ETS向8601名在日本參加“托業(yè)”考試的人進(jìn)行了一項(xiàng)包含75個(gè)問(wèn)題的調(diào)查問(wèn)卷。問(wèn)卷中包含了一系列“你能做什么”的問(wèn)題,例如:你能聽(tīng)懂售貨員對(duì)商品的價(jià)格介紹嗎?你能聽(tīng)懂火車(chē)站內(nèi)關(guān)于火車(chē)乘坐站臺(tái)和出發(fā)時(shí)間的通知嗎?你能在餐廳點(diǎn)菜嗎?你能向醫(yī)生解釋自己的癥狀嗎?你能讀懂流行的小說(shuō)嗎?你能給上司寫(xiě)一份便函解釋請(qǐng)假的理由嗎?等等。在這份調(diào)查中,被調(diào)查者可以在每個(gè)問(wèn)題的5種回答中選一種。這5種回答是:1.完全不能;2.能,但有很大困難;3.能,但有一些困難;4.能,但有一點(diǎn)困難;5.能。

經(jīng)過(guò)統(tǒng)計(jì)分析,ETS從這項(xiàng)調(diào)查中得到關(guān)于在“托業(yè)”中達(dá)到不同分?jǐn)?shù)水平的人“能做什么”的豐富信息,為“托業(yè)”增加了更多的分?jǐn)?shù)解釋信息。在“托業(yè)”的分?jǐn)?shù)解釋手冊(cè)中,詳細(xì)描述了各個(gè)分?jǐn)?shù)段的考生“能做什么”和“不能做什么”。例如,在關(guān)于聽(tīng)力考試成績(jī)?cè)?55-425之間(滿分495分)的考生“能做什么”方面,列出了“理解簡(jiǎn)單問(wèn)題”、“理解社會(huì)情景”、“理解慢語(yǔ)速指示”等項(xiàng)目,在“能作但有一定困難”方面,列出了“理解同事關(guān)于工作的討論”、“在社交環(huán)境中自我介紹”、“談?wù)撟约旱穆殬I(yè)目標(biāo)”等項(xiàng)目,在“不能做”方面,列出了“不能對(duì)求職者進(jìn)行面試”等。

“托業(yè)”的主要使用者是全球的4000多家跨國(guó)企業(yè)。由于提供了豐富的分?jǐn)?shù)解釋信息,一些企業(yè)制定了自己的“托業(yè)”成績(jī)應(yīng)用標(biāo)準(zhǔn)。例如,一家企業(yè)自己規(guī)定,達(dá)到220分者可以擔(dān)任技術(shù)員,檔案管理員,送貨、收貨員,實(shí)驗(yàn)室技術(shù)員,電工等;達(dá)到470分者可以擔(dān)任接線員,簿記員,電腦操作員,訂單處理員,秘書(shū)等;達(dá)到730分者可以擔(dān)任工程師,客戶服務(wù)經(jīng)理,金融分析師,會(huì)計(jì)師,部門(mén)經(jīng)理,秘書(shū)主管,質(zhì)量監(jiān)督部門(mén)經(jīng)理等;達(dá)到860分者可以任職人事主管經(jīng)理,項(xiàng)目主管,研發(fā)工程師,經(jīng)理主管人員,高級(jí)會(huì)計(jì)師,高級(jí)投資經(jīng)理,市場(chǎng)拓展經(jīng)理等。

在專(zhuān)項(xiàng)HSK考試中,需要在工作分析的基礎(chǔ)之上,為測(cè)驗(yàn)分?jǐn)?shù)的使用者提供更豐富的關(guān)于考生“能做什么”的分?jǐn)?shù)解釋信息。

 

三、分?jǐn)?shù)等值

在任何證書(shū)考試中,保持試卷難度的穩(wěn)定性和保證分?jǐn)?shù)的公平性,都是考試編制者所需要考慮的問(wèn)題。與普通HSK一樣,專(zhuān)項(xiàng)HSK也是水平考試和證書(shū)考試,必須保證在不同時(shí)間、使用不同試卷的考生可以得到公平的對(duì)待,必須保證證書(shū)的授予標(biāo)準(zhǔn)不隨試卷難度而起伏,必須保證不同試卷得分之間具有可比性。如果今年一個(gè)標(biāo)準(zhǔn),明年又一個(gè)標(biāo)準(zhǔn),如果對(duì)使用這一份試卷的人一個(gè)標(biāo)準(zhǔn),對(duì)使用另一份試卷的人又一個(gè)標(biāo)準(zhǔn),那么,不僅會(huì)大大影響HSK專(zhuān)項(xiàng)考試的信度和效度,而且會(huì)對(duì)測(cè)驗(yàn)分?jǐn)?shù)使用者的決策產(chǎn)生誤導(dǎo),會(huì)使考生受到不公平的對(duì)待。將測(cè)驗(yàn)不同版本的分?jǐn)?shù)統(tǒng)一在一個(gè)量表上的過(guò)程即等值(equating)。等值是測(cè)驗(yàn)公平性的保證。盡管我們?cè)诿}過(guò)程中總是盡量保持考試難度的穩(wěn)定性,但不同試卷之間在難度、信度、分?jǐn)?shù)分布方面的差別很難完全避免,這種差別會(huì)使考生受到不公平的對(duì)待。同時(shí),實(shí)現(xiàn)題目等值是題庫(kù)建設(shè)的需要,是實(shí)現(xiàn)計(jì)算機(jī)化適應(yīng)性測(cè)驗(yàn)的前提。

HSK從1990年正式開(kāi)考以來(lái),一直堅(jiān)持了統(tǒng)計(jì)等值。HSK所有的正式試卷都被等值到1989年曾經(jīng)在北京語(yǔ)言大學(xué)學(xué)生中施測(cè)過(guò)的一份標(biāo)準(zhǔn)試卷。

等值可以“共同組”的方式進(jìn)行,也可以“共同題”的方式進(jìn)行。所謂共同組方式,就是在很短時(shí)間距離內(nèi)向同一組考生施測(cè)兩份不同的試卷。由于考生是同一組人,兩份試卷的分?jǐn)?shù)差異就是試卷難度的差異。經(jīng)過(guò)換算,可以實(shí)現(xiàn)分?jǐn)?shù)等值。所謂共同題方式,就是在分別施測(cè)于兩組不同考生的兩份試卷中包含一些共同題。兩份試卷的成績(jī)之間總會(huì)有差距,由于考生不同,我們無(wú)法判斷造成成績(jī)差異的原因是考生水平的差異還是試卷難度的差異。由于有共同題,我們可以借助共同題來(lái)估計(jì)出兩組考生水平之間的差距,并進(jìn)而估計(jì)出兩份試卷難度之間的差距。

HSK所采用的是共同題設(shè)計(jì),新試卷中都會(huì)包含約占試卷總題量六分之一的共同題。在1998年以前,我們采用Tucker觀察分?jǐn)?shù)線性等值模型對(duì)等值數(shù)據(jù)進(jìn)行處理。由于基于經(jīng)典測(cè)驗(yàn)理論的線性等值只能實(shí)現(xiàn)試卷之間的等值,不能實(shí)現(xiàn)不同題目之間的難度等值,不能滿足題庫(kù)建設(shè)的需要,從1998年開(kāi)始,我們開(kāi)始同時(shí)采用線性等值和基于項(xiàng)目反應(yīng)理論(IRT)的單參數(shù)Logictic模型進(jìn)行等值。

當(dāng)兩份不同試卷的實(shí)際難度差別較大時(shí),好的等值方法一般都可以改進(jìn)分?jǐn)?shù)的可比性,可以減少測(cè)量誤差,可以保證考試的公平性。但是,由于等值中包含一系列很強(qiáng)的假設(shè),由于存在等值誤差,在兩份試卷的實(shí)際難度差異很小的時(shí)候,有可能統(tǒng)計(jì)等值處理不僅不能改進(jìn)分?jǐn)?shù)的可比性,而且會(huì)引入更大的測(cè)量誤差。在考試實(shí)踐中,我們并不知道不同試卷之間真實(shí)的難度差距,我們必須進(jìn)行等值處理,我們別無(wú)選擇。等值的意義類(lèi)似于為測(cè)驗(yàn)“買(mǎi)保險(xiǎn)”。在不發(fā)生交通事故的情況下,每年不菲的車(chē)輛保險(xiǎn)就似乎得不償失。但一旦發(fā)生交通事故,車(chē)輛保險(xiǎn)可以幫助我們避免大的損失。我們購(gòu)買(mǎi)保險(xiǎn)是為了預(yù)防發(fā)生交通事故,同樣,我們進(jìn)行統(tǒng)計(jì)等值處理是為了避免由于試卷難度相差過(guò)大而導(dǎo)致嚴(yán)重的不公平現(xiàn)象。(謝小慶,2000)

實(shí)現(xiàn)計(jì)算機(jī)化適應(yīng)性考試是大勢(shì)所趨。這一過(guò)程中,主要的難點(diǎn)就是等值。在計(jì)算機(jī)化適應(yīng)性考試中,由于根據(jù)考生的回答情況隨機(jī)向考生提供測(cè)試題目,不同考生回答一組相同題目的可能性很小。怎樣保證回答不同題目的考生可以得到公平的對(duì)待、可以得到具有可比性的分?jǐn)?shù)?這是實(shí)現(xiàn)計(jì)算機(jī)化適應(yīng)性考試的難點(diǎn)。

為了使HSK專(zhuān)項(xiàng)考試更好地滿足社會(huì)上不同的需要,將來(lái)可以考慮在“正式版”之外開(kāi)發(fā)價(jià)格較低的“精簡(jiǎn)版”?!熬?jiǎn)版”在信度方面達(dá)不到“正式版”的水準(zhǔn),但簡(jiǎn)便易行,價(jià)格便宜。一些關(guān)系到公司利益和人員命運(yùn)的重要決策,可以采用“正式版”。在一些考試成績(jī)對(duì)公司利益和個(gè)人命運(yùn)影響不是很大的時(shí)候,可以采用“精簡(jiǎn)版”。例如,分?jǐn)?shù)僅僅是一個(gè)語(yǔ)言培訓(xùn)項(xiàng)目的分班依據(jù)時(shí),可以采用“精簡(jiǎn)版”。在“正式版”和“精簡(jiǎn)版”之間,也存在一個(gè)分?jǐn)?shù)等值的問(wèn)題。

解決好分?jǐn)?shù)等值問(wèn)題,是開(kāi)發(fā)HSK專(zhuān)項(xiàng)考試的一個(gè)難點(diǎn),也是對(duì)考試開(kāi)發(fā)者的一個(gè)挑戰(zhàn)。

 

四、分?jǐn)?shù)及格線的合理設(shè)定

及格線(cut-off score或 cutscore)設(shè)定問(wèn)題也是標(biāo)準(zhǔn)設(shè)定(standardsetting)問(wèn)題。如果劃分等級(jí)和頒發(fā)證書(shū),就需要決定將多少分確定為及格線。在許多職業(yè)領(lǐng)域的證書(shū)、執(zhí)照、資格考試中設(shè)立了及格分?jǐn)?shù)線,如醫(yī)生、護(hù)士、律師、建筑師、會(huì)計(jì)、電工等許多職業(yè)資格考試和執(zhí)照考試。設(shè)立及格線是為了保護(hù)病人、顧客、住戶和用戶們的利益,不具有相應(yīng)資格的從業(yè)人員可能對(duì)服務(wù)對(duì)象造成損害。及格線常??梢詾闇y(cè)驗(yàn)的使用者提供更豐富的分?jǐn)?shù)解釋信息,幫助他們做出更明智的人事決策。

在專(zhuān)項(xiàng)HSK開(kāi)發(fā)過(guò)程中可能面臨的另一個(gè)挑戰(zhàn)是如何合理地設(shè)定及格分?jǐn)?shù)線。在通用HSK中,需要為發(fā)放不同等級(jí)的證書(shū)確立及格線。今天看來(lái),這一及格線的設(shè)定不是很合理。根據(jù)教育部的有關(guān)規(guī)定,達(dá)到HSK3級(jí)才能進(jìn)入中國(guó)大學(xué)學(xué)習(xí)漢語(yǔ)授課的理工科專(zhuān)業(yè)課程。許多學(xué)校的經(jīng)驗(yàn)顯示,這一及格線設(shè)定偏低。

在托福、托業(yè)考試中,沒(méi)有在分?jǐn)?shù)之外設(shè)定等級(jí),不頒發(fā)證書(shū),也就不存在設(shè)定及格線的問(wèn)題。如果HSK專(zhuān)項(xiàng)考試不準(zhǔn)備劃分級(jí)別,不準(zhǔn)備頒發(fā)證書(shū),也就不存在這個(gè)問(wèn)題。相反,則需要認(rèn)真研究及格線的合理設(shè)定問(wèn)題。

關(guān)于及格線設(shè)定的研究已經(jīng)長(zhǎng)達(dá)幾十年,提出的設(shè)定方法已經(jīng)多達(dá)幾十種。這些方法大致可以分為兩類(lèi),一類(lèi)是基于實(shí)證研究數(shù)據(jù)的方法,一類(lèi)是基于專(zhuān)家經(jīng)驗(yàn)判斷的方法。

及格線可以根據(jù)收集的實(shí)證數(shù)據(jù)來(lái)確定。例如,導(dǎo)游人員漢語(yǔ)水平合格的及格線,可以根據(jù)一組具有代表性的在崗導(dǎo)游人員的漢語(yǔ)考試的平均分?jǐn)?shù)來(lái)確定,也可以根據(jù)一組導(dǎo)游培訓(xùn)課程中在讀學(xué)生的漢語(yǔ)考試的平均分?jǐn)?shù)來(lái)確定??梢钥吹?,在這些以實(shí)證數(shù)據(jù)確定及格線的過(guò)程中,也離不開(kāi)專(zhuān)家的判斷,需要專(zhuān)家做出“哪些人可以算具備了導(dǎo)游需要的漢語(yǔ)水平”的判斷。

通常,及格線的確定基于專(zhuān)家的經(jīng)驗(yàn)判斷。這種判斷不能靠一、兩個(gè)專(zhuān)家“拍腦袋”產(chǎn)生,不能靠一、兩個(gè)專(zhuān)家“眉頭一皺、計(jì)上心來(lái)”,而需要通過(guò)一定的方式將眾多專(zhuān)家的判斷最終凝聚為一個(gè)及格分?jǐn)?shù)。

在及格線設(shè)定的過(guò)程中有兩個(gè)要素。第一是試卷。及格線是針對(duì)一份特定的試卷而言。脫離一份特定的試卷,談不到及格線。第二是專(zhuān)家經(jīng)驗(yàn)。及格線設(shè)定的依據(jù)是專(zhuān)家的經(jīng)驗(yàn)。

今天,在及格線設(shè)定中使用最廣泛的方法,是長(zhǎng)期工作于ETS的心理測(cè)量學(xué)家安哥夫(W.H.Angoff)于1971年提出的方法及其改進(jìn)方式。30年來(lái),安哥夫本人和其他研究者對(duì)這一方法進(jìn)行了許多改進(jìn)。安哥夫方法要求專(zhuān)家們首先在心中形成一個(gè)假想的最低能力組,之后對(duì)考試的每一道題目進(jìn)行評(píng)估,估計(jì)最低能力組可以正確回答這道題的概率。經(jīng)過(guò)統(tǒng)計(jì)匯總,這些概率最后的總和就是我們需要的及格線。

安哥夫方法主要依賴(lài)專(zhuān)家評(píng)判。因此,實(shí)施這種方法的一個(gè)重要環(huán)節(jié)是專(zhuān)家的挑選和培訓(xùn)。只有保證參加評(píng)判者是真正的專(zhuān)家,保證專(zhuān)家領(lǐng)會(huì)了研究者的意圖,才能獲得預(yù)期的結(jié)果。

此外,及格線的設(shè)定還可以采用埃伯(Ebel)方法、吉杰(Jaeger)方法、萊德?tīng)査够∟edelsky)方法等。(武曉宇等)

在及格線的設(shè)定中,我們可能犯兩種錯(cuò)誤。一種是標(biāo)準(zhǔn)過(guò)高,導(dǎo)致“錯(cuò)拒”;一種是標(biāo)準(zhǔn)過(guò)低,導(dǎo)致“誤取”。任何一種錯(cuò)誤幾率的降低都會(huì)增加另一種錯(cuò)誤幾率的提高。對(duì)此,需要有清楚地認(rèn)識(shí)。

及格線的設(shè)定是有代價(jià)的。對(duì)于分?jǐn)?shù)臨近及格線的考生,出現(xiàn)錯(cuò)誤決策的可能性是較大的。那些剛剛在分?jǐn)?shù)線以上的考生和那些剛剛在分線以下的考生之間可能僅僅有一、二分之差,很難說(shuō)他們之間存在實(shí)質(zhì)的差別。對(duì)于這部分考生,可能造成不公平。對(duì)此,也需要有所考慮。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
完善新高考學(xué)業(yè)水平等級(jí)考試賦分方案的三種策略
HSK初、中、高級(jí)口語(yǔ)考試大綱 及樣卷
50%跨專(zhuān)業(yè)!平均70分!今晚交大文管第一次模擬考評(píng)講!
如何編制雙向細(xì)目表?
【真題解鎖】欄目“拍了拍”你,速來(lái)做題~
【辨析】信度和效度
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服