日本高清在线3344www,伊人激情综合网,99久久中文字幕伊人

人機交互中的一個重要問題：認(rèn)知負(fù)荷測量

2017.11.28

由于工作記憶負(fù)荷對認(rèn)知負(fù)荷理論的重要性，測量這種負(fù)荷一直是研究人員的高度優(yōu)先事項。雖然可以通過預(yù)測實驗結(jié)果證明對理論的有效性的支持，但是另外提供對認(rèn)知負(fù)荷的獨立測量是有用的。在本章中，我們描述了用于測量認(rèn)知負(fù)荷的各種方法，以及它們在過去30年中的發(fā)展情況。

認(rèn)知負(fù)荷的間接測量

在認(rèn)知負(fù)荷理論的早期，認(rèn)知負(fù)荷不是直接測量的?；跈z驗問題解決和學(xué)習(xí)之間的關(guān)系的實驗結(jié)果假設(shè)，幾種技術(shù)用于間接評估認(rèn)知負(fù)荷。

計算模型

對認(rèn)知負(fù)荷理論的初步研究集中在作為學(xué)習(xí)策略的問題解決的低效率上。假設(shè)高問題解決搜索導(dǎo)致比低問題解決搜索更大的工作記憶負(fù)荷。在Sweller及其同事在20世紀(jì)80年代進行的一系列實驗中，證明了需要相當(dāng)多的問題解決搜索的學(xué)習(xí)策略導(dǎo)致了較差的學(xué)習(xí)成果，而不是采用遠遠少于問題解決搜索的策略。為了解釋這些結(jié)果，Sweller（1988）認(rèn)為，因為使用一些問題解決的啟發(fā)式方法導(dǎo)致了不必要的問題解決搜索，強加了高額外的認(rèn)知負(fù)荷。相比之下，減少問題解決搜索的過程被假定為可以減少認(rèn)知負(fù)荷。

理論表明問題解決搜索確實增加了由計算模型表示的認(rèn)知負(fù)荷。 Sweller（1988）使用生產(chǎn)系統(tǒng)模型來比較高搜索策略和低搜索策略，發(fā)現(xiàn)更高的搜索需要更復(fù)雜的模型來模擬問題解決過程，對應(yīng)于在工作記憶中保存和處理更多的信息。類似地，Ayres和Sweller（1990）使用生產(chǎn)系統(tǒng)模型來模擬多步幾何問題的問題解決解決方案提供了證據(jù)表明高搜索策略比更簡單的策略需要更多的工作記憶資源。

計算模型提供的間接證據(jù)限制了它們作為認(rèn)知負(fù)荷的指標(biāo)的使用。然而，在認(rèn)知負(fù)荷理論框架內(nèi)，計算模型是第一次嘗試提供一定程度的獨立證據(jù)，認(rèn)知負(fù)荷是教學(xué)設(shè)計中的一個重要因素。他們是認(rèn)知負(fù)荷理論起源的一個重要因素。

獲取期間的績效

在認(rèn)知負(fù)荷理論的這個早期階段，在獲取或?qū)W習(xí)階段期間的績效指標(biāo)也用于支持觀察到的效果的認(rèn)知負(fù)荷解釋。由于沒有直接的量度，Chandler和Sweller（1991，1992）認(rèn)為教學(xué)時間可以用作度量認(rèn)知負(fù)荷。理論上認(rèn)為，如果學(xué)生被要求使用提高認(rèn)知負(fù)荷的策略學(xué)習(xí)一個主題，那么認(rèn)知負(fù)荷的這種增加將在學(xué)習(xí)階段影響績效。不僅將通過測試分?jǐn)?shù)指示未來績效受到影響，而且還將影響獲得期間的績效。早期的研究支持這個論點（見Owen＆Sweller，1985; Sweller，Chandler，Tierney，＆Cooper，1990; Sweller和Cooper，1985）。還發(fā)現(xiàn)在預(yù)期的高認(rèn)知負(fù)荷條件下獲得期間的錯誤率更高（參見Owen和Sweller，1985; Sweller＆Cooper，1985）。增加的認(rèn)知負(fù)荷可能對學(xué)習(xí)時間和獲取任務(wù)的準(zhǔn)確性產(chǎn)生負(fù)面影響。

問題解決中的錯誤率

錯誤率也被用于識別問題中的認(rèn)知負(fù)荷的差異。 Ayres和Sweller（1990）表明，由于在這些點上的高工作記憶負(fù)荷，學(xué)生經(jīng)常在特定點處在幾何域中的問題求解時產(chǎn)生誤差。在后來的研究中，Ayres（2001）證明錯誤率在需要順序計算的數(shù)學(xué)任務(wù)上有所不同。高錯誤率對應(yīng)于決策處于其最大強度的位置，其中許多變量需要考慮。雖然這兩個研究調(diào)查問題解決而不是教學(xué)程序，他們提供了額外的證據(jù)，錯誤率可用于確定工作記憶的需求。

認(rèn)知負(fù)荷的主觀測量

最初，認(rèn)知負(fù)荷的理論考慮被用于預(yù)測教學(xué)有效性，主要通過認(rèn)知負(fù)荷的間接測量，如錯誤率和學(xué)習(xí)時間，如上所述。隨著認(rèn)知負(fù)荷理論的發(fā)展和更多的教學(xué)效果被確定，對認(rèn)知負(fù)荷的更直接測量的需要變得明顯。例如，Chandler和Sweller（1991）和Sweller和Chandler（1994）指出了認(rèn)知負(fù)荷直接測量方法的缺乏。 Paas（1992）打破了僵局，他通對認(rèn)知負(fù)荷的主觀測量發(fā)展提供了重大突破。

心理努力的主觀測量

基于由Bratfisch，Borg和Dornic（1972）開發(fā)的以前的儀器，Paas（1992）推斷學(xué)習(xí)者能夠內(nèi)省在學(xué)習(xí)和測試期間投入的心理努力的量，并且這種“努力的強度”可以被認(rèn)為是認(rèn)知負(fù)荷的“指數(shù)”（第429頁）。 Paas，Tuovinen，Tabbers和van Gerven（2003）后來將精神努力的定義改進為“認(rèn)知負(fù)荷的方面，認(rèn)知負(fù)荷是指實際分配以適應(yīng)任務(wù)強加的要求的認(rèn)知能力：因此，它可以被認(rèn)為反映了實際的認(rèn)知負(fù)荷“（第64頁）。

使用從非常非常低的心理努力（1）到非常非常高的心理努力（9）的9點Likert量表，要求學(xué)習(xí)者在學(xué)習(xí)和測試周期中的各個點評估他們的心理努力。 Paas（1992）比較了假設(shè)提高或降低認(rèn)知負(fù)荷的教學(xué)程序，發(fā)現(xiàn)自我評估的心理努力和測試表現(xiàn)之間的匹配。執(zhí)行低認(rèn)知負(fù)荷的教學(xué)設(shè)計的學(xué)習(xí)者具有優(yōu)越的學(xué)習(xí)結(jié)果，并且將其心理努力評價低于被假執(zhí)行高認(rèn)知負(fù)荷的設(shè)計的學(xué)生。

Paas和vanMerri?nboer（1994）的后續(xù)研究再次證明了Paas的研究結(jié)果（1992）。此外，Paas和vanMerri?nboer（1994）也通過心率的光譜分析收集生理測量數(shù)據(jù)。然而，與自評量表相反，生理測量不能檢測治療組之間的差異，并且只能區(qū)分精神上無活性和活動期。表明主觀評分比生理測量更敏感和干擾更少。而且9分制量表是高度可靠的（參見Paas，vanMerri?nboer，＆Adam，1994）。

難度的主觀測量

這些早期試驗的主觀測量的成功導(dǎo)致其他人采用主觀尺度作為認(rèn)知負(fù)荷的量度。然而，許多研究者要求學(xué)生評價他們發(fā)現(xiàn)學(xué)習(xí)任務(wù)有多困難或容易，而不是使用術(shù)語心理努力。例如，在一系列實驗中，Marcus，Cooper和Sweller（1996）證明，主觀的困難度量根據(jù)任務(wù)的元素交互水平而顯著變化。此外，Ayres（2006a）發(fā)現(xiàn)，主觀難度測量可以檢測任務(wù)中元素交互性的變化。

無論所使用的措辭（精神努力或困難程度），簡單的主觀評定量表，或許令人驚訝地被證明是可用于區(qū)分由不同教學(xué)過程施加的認(rèn)知負(fù)荷的最敏感的量度。它已廣泛用于確定第IV部分中討論的各種教學(xué)程序施加的相對認(rèn)知負(fù)荷。 Paas等人（2003b）記錄了超過25項使用1992年和2002年之間的認(rèn)知負(fù)荷的主觀測量的研究。從那以后有了更多的研究。

主觀評分的變化

Van Gog和Paas（2008）指出，心理努力和困難程度可能是不同的結(jié)構(gòu)在考慮后果時。一些初步研究調(diào)查兩種尺度之間的差異支持這種觀點（Ayres＆Youssef，2008）。問一個學(xué)生他或她找到一個任務(wù)有多難，這與詢問完成任務(wù)花費了多少精力不同。雖然這兩個措施經(jīng)常相關(guān)，但困難程度并不總是與努力程度匹配。例如，非常困難的問題可能對一些學(xué)習(xí)者要求過多以至于他們不能做出任何實際的努力。

除了測量的潛在差異，van Gog和Paas（2008）還確定了收集心理評定作為進一步變化的時間。 Paas和vanMerri?nboer（1994）使用了學(xué)習(xí)者解決測試問題后收集的心理努力措施。相比之下，許多其他研究人員在采集（教學(xué)）階段完成后收集了數(shù)據(jù)。這兩種策略不一定是可比的，并且可能產(chǎn)生不同的結(jié)果。在討論效率措施時，將討論這些一些差異。

主觀測量的一致性

盡管有這些不同的程序，但是在通過認(rèn)知負(fù)荷理論（也參見Moreno，2004; vanMerri?nboer，Schuurman，De Croock，＆Paas，2002）預(yù)測的匹配績效數(shù)據(jù)中，困難程度或精神努力的主觀測量具有很少的差異或矛盾。然而，在一些研究中，盡管在績效測試中存在組間差異，但在主觀測量之間沒有發(fā)現(xiàn)統(tǒng)計學(xué)上的顯著差異（參見Cuevas，Fiore，＆Oser，2002; Hummel，Paas，＆Koper，2004; Kester，Kirschner， Merri?nboer，2005）。還有一些研究，其中基于主觀測量存在認(rèn)知負(fù)荷差異，但是對績效測試沒有組治療效應(yīng)（Homer，Plass，＆Blake，2008; Van Gerven，Paas，vanMerri?nboer，Hendriks，＆Schmidt，2003）。在Kalyuga，Chandler和Sweller（2004）中，三個實驗中的每一個產(chǎn)生不同的結(jié)果：認(rèn)知負(fù)荷差異，沒有測試效應(yīng);認(rèn)知負(fù)荷差異和相應(yīng)的測試效應(yīng);沒有認(rèn)知負(fù)荷差異，但具有測試效果?？尚械氖牵谝恍┨囟ǖ臈l件和材料下，不會發(fā)生預(yù)期的匹配。當(dāng)然，當(dāng)考慮任何統(tǒng)計上確定的效果時，不可避免地會存在匹配的失敗。主觀評級量表和測試績效之間的相關(guān)性不夠完美。盡管偶爾存在不一致，主觀測量產(chǎn)生了深刻的影響，并且為提供證據(jù)支持認(rèn)知負(fù)荷理論提供了有用的工具。

效率測量

基于Paas（1992）的自我評價量表，Paas和vanMerri?nboer（1993）開發(fā)了一種效率測量，其將精神努力與任務(wù)績效指標(biāo)相結(jié)合。 Paas和vanMerri?nboer認(rèn)為，考慮學(xué)習(xí)的認(rèn)知成本是很重要的。即使兩種不同的教學(xué)方法可能產(chǎn)生相同的學(xué)習(xí)成果，但是實現(xiàn)這些水平的績效的努力是一個重要的考慮。如果一個教學(xué)策略產(chǎn)生與另一個策略相同的績效，但是所花費的認(rèn)知資源較少，則該第一策略更有效。效率（E）使用下式計算：

其中Z_Ptest表示標(biāo)準(zhǔn)化（Z分?jǐn)?shù)）測試分?jǐn)?shù)，Z_Etest表示在測試期后收集的標(biāo)準(zhǔn)化心理努力分?jǐn)?shù)。該公式基于從點到線（在這種情況下為y = x）的垂直距離的數(shù)學(xué)計算。效率差異可以通過簡單的圖形表示來描述（見圖6.1）。當(dāng)績效和精神努力的Z分?jǐn)?shù)相等時，E的值為零，如圖1所示。 6.1由對角線（y = x）表示。該線上的所有點等于E = 0，而線上方的點（E> 0）表示有效學(xué)習(xí)并且指向低于線（E <0）的無效學(xué)習(xí)。 Paas等人（2003b）進一步解釋說，高教學(xué)效率是由于高的任務(wù)績效和低的心理努力（圖中的區(qū)域H），而低的教學(xué)效率來自低的任務(wù)績效和高的心理努力（圖中的區(qū)域L）。

在對效率測量的回顧中，van Gog和Paas（2008）記錄了在1993-2007年期間，超過30個認(rèn)知負(fù)荷理論相關(guān)的研究使用了效率測量。然而，如上所述，van Gog和Paas（2008）也指出，收集精神評級的方式有所不同，這些變化影響效率測量，因為精神評級是效率公式的組成部分。 Van Gog和Paas認(rèn)為，這些不同的方法測量了不同類型的效率。使用在測試績效之后收集的心理努力評級，測量獲取認(rèn)知結(jié)構(gòu)（如模式）的學(xué)習(xí)后果，而使用采集后測量，指示培訓(xùn)效率。

我們同意，學(xué)習(xí)效率可能是一個良好的圖式獲取和自動化的指示器。如果學(xué)習(xí)者已經(jīng)獲得了新的圖式，并且可以用更少的努力使用它們，則圖式獲取可以被認(rèn)為是魯棒的，即使教學(xué)方法更苛刻。然而，教學(xué)效率具有重要作用，因為它顯示了學(xué)習(xí)過程的有效性，這是第四部分討論的認(rèn)知負(fù)荷影響的關(guān)鍵考慮。知道遵循教學(xué)設(shè)計是多么困難或容易是認(rèn)知負(fù)荷理論的關(guān)鍵。盡管在方法上有這些差異，但是在測試中計算訓(xùn)練效率和使用學(xué)習(xí)信息的效率是重要的，并且可以提供與教學(xué)設(shè)計相關(guān)的重要信息。

計算效率的問題

盡管其廣泛使用，Hoffman和Schraw（2010）已經(jīng)確定了與教學(xué)效率計算相關(guān)的一些問題。在效率評價中，因為它基于績效和努力的標(biāo)準(zhǔn)化分?jǐn)?shù)之間的差異（差異），Hoffman和Schraw將Paas和vanMerri?nboer的原始模型歸類為偏差模型。他們認(rèn)為，很難解釋減去兩個概念上彼此不同的變量的意義。他們指出，它類似于減去個人智力和體重的z分?jǐn)?shù)?？赡芎茈y知道得到的分?jǐn)?shù)究竟是什么。

Hoffman和Schraw還指出，由于z分?jǐn)?shù)是標(biāo)準(zhǔn)參考的，因此效率測量只能基于組間數(shù)據(jù)，因此不能用于比較個體效率。另一方面，他們還建議，如果比較整體的差異，則比較個體效率的問題不是問題。如第四部分所示，在認(rèn)知負(fù)荷理論的大部分下進行的大多數(shù)研究完全側(cè)重于整體群體差異，因此個體比較并不是一個問題。作為偏差模型的替代，Hoffman和Schraw描述了兩種其他方法的優(yōu)點（1）基于績效和主觀評級的比率的可能性模型（例如，Kalyuga和Sweller，2005; Kalyuga，2008b;更多細節(jié)見第13章）和（2）基于概率比的條件似然模型。

Hoffman和Schraw并不貶低偏差模型，他們認(rèn)為不同的模型適合不同的研究目標(biāo)。如果目的是調(diào)查績效和努力得分排名之間的差異，那么Paas和vanMerri?nboer的偏差模型具有優(yōu)點。然而，基于Hoffman和Schraw分析，績效和主觀評級（似然模型）的比率計算非常簡單，并且可以用于確定單獨的效率測量。這些個體測量可以容易地組合以提供在比較整體處理效果時必不可少的組效率。我們期望未來的研究更好地利用似然模型。

通過輔助任務(wù)衡量認(rèn)知負(fù)荷

上述主觀測量是用于測量認(rèn)知負(fù)荷的最常用的工具。然而，評估工作記憶負(fù)荷的傳統(tǒng)方法是結(jié)合主任務(wù)（雙任務(wù)方法）使用輔助任務(wù)（參見Britton＆Tesser，1982; Kerr，1973）進行測量。第二個任務(wù)要求學(xué)習(xí)者進行額外的認(rèn)知活動，這是輔助學(xué)習(xí)或解決問題的主要任務(wù)。例如，學(xué)習(xí)者可能被要求以特定方式響應(yīng)作為輔助任務(wù)的特定聲音以及學(xué)習(xí)如何解決一類數(shù)學(xué)問題作為主要任務(wù)，如果主任務(wù)施加了沉重的認(rèn)知負(fù)荷，則輔助任務(wù)的績效降低。相比之下，主任務(wù)上較低的認(rèn)知負(fù)荷可導(dǎo)致輔助任務(wù)的績效提高。

通常，輔助任務(wù)是非常不同的，并且比主任務(wù)需要更少的工作記憶資源;然而，Sweller（1988）創(chuàng)造了這種格式的替代品。 Sweller認(rèn)為，要求學(xué)生通過解決問題涉及兩個過程：（1）解決問題，主要任務(wù)和（2）從經(jīng)驗中學(xué)習(xí)，輔助任務(wù)。換句話說，當(dāng)學(xué)習(xí)者把解決問題作為主要任務(wù)時，這可能會干擾學(xué)生的問題，學(xué)生將其視為輔助任務(wù)。問題越復(fù)雜，對它的了解越少?；谔囟ǖ诙蝿?wù)的經(jīng)驗證據(jù)，包括記住公司和前述問題的解決方案支持這個論點。旨在減少與解決問題相關(guān)聯(lián)的認(rèn)知負(fù)荷的教學(xué)過程增加了關(guān)于先前問題的信息量。

在更傳統(tǒng)的使用輔助任務(wù)中，Marcus等人（1996）研究了元素交互性，特別是與僅作為文本呈現(xiàn)的相同信息相比，圖如何可以減少元素交互性。在這項研究中，使用了兩種類型的輔助任務(wù)，學(xué)習(xí)情節(jié)構(gòu)成每種情況下的主要任務(wù)。在一個實驗中，輔助任務(wù)正在識別在學(xué)習(xí)情節(jié)期間隨機呈現(xiàn)的音調(diào)。聽到這個聲音，學(xué)習(xí)者不得不通過按下腳踏板來響應(yīng)。響應(yīng)時間被用來衡量如何認(rèn)知地要求主要任務(wù)，指示認(rèn)知負(fù)荷。在第二個實驗中，輔助任務(wù)是記住在學(xué)習(xí)期間呈現(xiàn)的兩位數(shù)字。在這種情況下，使用二次任務(wù)的回憶的準(zhǔn)確性作為認(rèn)知負(fù)荷的測量。對于這兩種類型的次要測量，發(fā)現(xiàn)匹配學(xué)習(xí)成果的顯著結(jié)果。使用圖表和低元素互動材料導(dǎo)致更好的學(xué)習(xí)成果和更強的二次任務(wù)績效。因此，支持認(rèn)知負(fù)荷解釋。

Chandler和Sweller（1996）也采用了雙重任務(wù)的方法來表明，第二個任務(wù)，回憶一封信，受到教學(xué)模式的影響。對于這個輔助任務(wù)，兩個單獨的字母，由音調(diào)提示，在采集期間在計算機屏幕上分開8秒。學(xué)生需要記住第一封信，同時記住第二封信。結(jié)果表明，意在減少認(rèn)知負(fù)荷的優(yōu)越學(xué)習(xí)策略導(dǎo)致在輔助任務(wù)的更高的分?jǐn)?shù)。此外，在學(xué)習(xí)材料元素交互性高的時候，僅發(fā)現(xiàn)教學(xué)策略和次要測量的顯著差異。對于低元素互動性的材料，更多的工作記憶資源可用于克服無效的學(xué)習(xí)策略，因此輔助任務(wù)的績效不受影響。關(guān)于問題解決任務(wù)，與學(xué)習(xí)任務(wù)相反，Halford，Maybery和Bain（1986）和Ayres（2001）使用輔助任務(wù)方法證明了高元素交互性與相應(yīng)高的工作記憶負(fù)荷相關(guān)聯(lián)。

通常，輔助任務(wù)是非常不同的，并且比主任務(wù)需要更少的工作記憶資源;然而，Sweller（1988）創(chuàng)造了這種格式的替代品。 Sweller認(rèn)為，要求學(xué)生通過解決問題涉及兩個過程：（1）解決問題，主要任務(wù)和（2）從經(jīng)驗中學(xué)習(xí)，輔助任務(wù)。換句話說，當(dāng)學(xué)習(xí)者把解決問題作為主要任務(wù)時，這可能會干擾學(xué)生的問題，學(xué)生將其視為輔助任務(wù)。問題越復(fù)雜，對它的了解越少?；谔囟ǖ诙蝿?wù)的經(jīng)驗證據(jù)，包括記住公司和前述問題的解決方案支持這個論點。旨在減少與解決問題相關(guān)聯(lián)的認(rèn)知負(fù)荷的教學(xué)過程增加了關(guān)于先前問題的信息量。

在更傳統(tǒng)的使用輔助任務(wù)中，Marcus等人（1996）研究了元素交互性，特別是與僅作為文本呈現(xiàn)的相同信息相比，圖如何可以減少元素交互性。在這項研究中，使用了兩種類型的輔助任務(wù)，學(xué)習(xí)情節(jié)構(gòu)成每種情況下的主要任務(wù)。在一個實驗中，輔助任務(wù)正在識別在學(xué)習(xí)情節(jié)期間隨機呈現(xiàn)的音調(diào)。聽到這個聲音，學(xué)習(xí)者不得不通過按下腳踏板來響應(yīng)。響應(yīng)時間被用來衡量如何認(rèn)知地要求主要任務(wù)，指示認(rèn)知負(fù)荷。在第二個實驗中，輔助任務(wù)是記住在學(xué)習(xí)期間呈現(xiàn)的兩位數(shù)字。在這種情況下，使用二次任務(wù)的回憶的準(zhǔn)確性作為認(rèn)知負(fù)荷的測量。對于這兩種類型的次要測量，發(fā)現(xiàn)匹配學(xué)習(xí)成果的顯著結(jié)果。使用圖表和低元素互動材料導(dǎo)致更好的學(xué)習(xí)成果和更強的二次任務(wù)績效。因此，支持認(rèn)知負(fù)荷解釋。

Chandler和Sweller（1996）也采用了雙重任務(wù)的方法來表明，第二個任務(wù)，回憶一封信，受到教學(xué)模式的影響。對于這個輔助任務(wù)，兩個單獨的字母，由音調(diào)提示，在采集期間在計算機屏幕上分開8秒。學(xué)生需要記住第一封信，同時記住第二封信。結(jié)果表明，意在減少認(rèn)知負(fù)荷的優(yōu)越學(xué)習(xí)策略導(dǎo)致在輔助任務(wù)的更高的分?jǐn)?shù)。此外，在學(xué)習(xí)材料元素交互性高的時候，僅發(fā)現(xiàn)教學(xué)策略和次要測量的顯著差異。對于低元素互動性的材料，更多的工作記憶資源可用于克服無效的學(xué)習(xí)策略，因此輔助任務(wù)的績效不受影響。關(guān)于問題解決任務(wù)，與學(xué)習(xí)任務(wù)相反，Halford，Maybery和Bain（1986）和Ayres（2001）使用輔助任務(wù)方法證明了高元素交互性與相應(yīng)高的工作記憶負(fù)荷相關(guān)聯(lián)。

然而，使用輔助任務(wù)更有優(yōu)勢。主要優(yōu)點是他們可以在任務(wù)期間提供幾乎連續(xù)的認(rèn)知負(fù)荷測量，而主觀測量法僅指示任務(wù)完成后的總認(rèn)知負(fù)荷。在下一節(jié)討論，將介紹生理測量，它可以提供更準(zhǔn)確的測量瞬時認(rèn)知負(fù)荷。

據(jù)我們所知，尚未使用輔助任務(wù)計算測量效率。沒有理由不計算。Hoffman和Schraw（2010）討論的所有效率衡量標(biāo)準(zhǔn)，一旦認(rèn)知負(fù)荷值標(biāo)準(zhǔn)建立，就可以使用輔助任務(wù)像使用主觀評級一樣來輕松計算。

認(rèn)知負(fù)荷的生理測量

Paas和vanMerri?nboer（1994）比較了主觀測量與心率的頻譜分析，得出結(jié)論，主觀測量顯示更多的潛力。在隨后的十年中，認(rèn)知負(fù)荷理論研究人員進行了很少的隨訪生理研究。然而，在最近的時期，人們對這些措施的重新出現(xiàn)了興趣。認(rèn)知突起反應(yīng)是已經(jīng)測試的一種策略。 Van Gerven，Paas，vanMerri?nboer和Schmidt（2004）引用Kahneman和Beatty的工作（1966），認(rèn)為瞳孔大小可能與記憶負(fù)荷有關(guān)。使用需要工作記憶負(fù)荷有差異的一系列任務(wù)，發(fā)現(xiàn)對于瞳孔擴張根據(jù)增加的工作記憶水平的增加而增加。然而，還發(fā)現(xiàn)突起反應(yīng)策略可能具有年齡限制，因為老年參與者沒有在一些認(rèn)知任務(wù)上顯示這種相關(guān)性。

評論者提倡使用諸如功能磁共振成像（fMRI，參見Paas，Ayres，＆Pachman，2008; Whelan，2007）和腦電圖（EEG，參見Antonenko，Paas，Grabner＆van Gog，2010）來測量認(rèn)知負(fù)荷，這種提議與更復(fù)雜的技術(shù)的發(fā)展相吻合。生理測量方法可能有相當(dāng)大的優(yōu)點的證據(jù)已經(jīng)開始出現(xiàn)。例如，Antonenko和Niederhauser（2010）在一項研究超文本學(xué)習(xí)的研究中使用了主觀測量法和腦電圖測量。使用心理努力量表作為主觀測量法量表，并且EEG捕獲α，β和θ腦波節(jié)律?？冃Х?jǐn)?shù)表明，使用超文本引線（引入文本鏈接節(jié)點在一起）導(dǎo)致比使用沒有引線的超文本具有更好的學(xué)習(xí)成果。雖然沒有心理努力測量沒有發(fā)現(xiàn)組間差異，使用彩虹文本引線的組alpha，beta和theta測量值顯著較低。結(jié)論是超文本導(dǎo)致認(rèn)知負(fù)荷降低，但只有EEG測量足夠敏感以顯示這種差異。在討論主觀方法的失敗時，Antonenko和Niederhauser認(rèn)為EEG方法的一個優(yōu)點是它反映了各種類型的負(fù)荷，如瞬時，峰值，平均，累積以及總體負(fù)荷，而主觀測量可以僅測量總負(fù)荷。（關(guān)于認(rèn)知負(fù)荷的時間方面的更多信息，參見Xie＆Salvendy，2000）

Van Gog，Rikers和Ayres（2008）也討論了認(rèn)知負(fù)荷瞬時測量的優(yōu)點。 Van Gog 等。區(qū)分在在線方法（諸如在學(xué)習(xí)和測試期間可以收集的眼睛跟蹤和心率監(jiān)視）和離線數(shù)據(jù)（例如僅在活動完成之后可以在不中斷任務(wù)的情況下集主觀測量）。在過去幾年中，對認(rèn)知負(fù)荷理論和多媒體教學(xué)環(huán)境的研究使用眼動跟蹤來進一步了解認(rèn)知過程（見van Gog＆Scheiter，2010）。一些證據(jù)也已經(jīng)出現(xiàn)，眼睛跟蹤可以用于測量認(rèn)知負(fù)荷的波動。 Underwood，Jebbert和Roberts（2004）發(fā)現(xiàn)，文本和圖片的不同組合需要不同水平的認(rèn)知處理，這與眼睛注視的相應(yīng)變化相匹配?？偟膩碚f，有人認(rèn)為，眼睛長時間的注視反映更多的認(rèn)知處理。因此，眼睛跟蹤數(shù)據(jù)具有顯著的優(yōu)點，因為它不僅指示學(xué)習(xí)者聚焦注意的位置，而且指示多久，因此意味著認(rèn)知負(fù)荷的相應(yīng)變化。

另一個顯示出潛力的在線策略是使用語言復(fù)雜性的指標(biāo)。雖然本質(zhì)上不是生理的，但語言復(fù)雜性具有生理學(xué)措施的許多特征，包括在學(xué)習(xí)和測試任務(wù)的同時在線使用的能力。 Khawaja，Chen和Marcus（2010）認(rèn)為隨著任務(wù)難度的增加，詞匯密度降低。這種效果在一個有叢林火災(zāi)事故管理團隊的研究中得到了證明。隨著叢林火災(zāi)任務(wù)變得更具挑戰(zhàn)性，包括意外事件的發(fā)生，操作團隊的語音模式改變，根據(jù)任務(wù)復(fù)雜性變得不那么密集。因此，語言復(fù)雜性的度量可能是另一個有用的在線的認(rèn)知負(fù)荷的指標(biāo)。

在不祥的開始之后，可替代主觀測量的認(rèn)知負(fù)荷測量指標(biāo)（如生理指標(biāo)）正在獲得相當(dāng)大關(guān)注。一些技術(shù)是有希望的，但是確定當(dāng)前的研究重點是否會產(chǎn)生可靠的結(jié)果還為時過早。在過去，生理測量已被證明不足以表明認(rèn)知負(fù)荷理論使用的教學(xué)設(shè)計的所產(chǎn)生的認(rèn)知負(fù)荷差異。目前試圖找到足夠敏感的生理測量是否能夠成功仍有待觀察。

測量不同類型的認(rèn)知負(fù)荷

在識別不同類別的認(rèn)知負(fù)荷之后（參見Sweller，vanMerri?nboer，＆Paas，1998），基于認(rèn)知負(fù)荷的理論預(yù)測變得更加復(fù)雜。不是僅僅使用總認(rèn)知負(fù)荷來論證為什么教學(xué)設(shè)計會或不會有效，研究人員開始在制定他們的假設(shè)時區(qū)分認(rèn)知負(fù)荷的類別。因此，在過去十年中，對不同類型的認(rèn)知負(fù)荷的單獨測量引起廣大關(guān)注。

理論上，假設(shè)內(nèi)在和外在認(rèn)知負(fù)荷增加了總的認(rèn)知負(fù)荷，通過實驗方法區(qū)分內(nèi)在和外在認(rèn)知負(fù)荷是一件簡單的事情。在教學(xué)實驗中，如果內(nèi)在認(rèn)知負(fù)荷保持恒定，但外來認(rèn)知負(fù)荷在教學(xué)條件之間變化，則主觀評定量表所指示的認(rèn)知負(fù)荷測量的任何差異必定是外在認(rèn)知負(fù)荷的引起的。類似地，通過保持外在認(rèn)知負(fù)荷恒定和不同的內(nèi)在認(rèn)知負(fù)荷，任何測量的差異即是內(nèi)在認(rèn)知負(fù)荷的差異。 Ayres（2006a）在第一次測量內(nèi)在認(rèn)知負(fù)荷的嘗試中使用了這個邏輯。

使用問題解決任務(wù)Ayres（2006a）要求學(xué)生完成一系列需要連續(xù)計算的代數(shù)問題。由于學(xué)生以前沒有提供任何額外的指導(dǎo)已經(jīng)接受這些任務(wù)的教學(xué)，Ayres推理說，由于教學(xué)因素的外在認(rèn)知負(fù)荷是不變的。在以前的研究中，Ayres（2001）發(fā)現(xiàn)，學(xué)生根據(jù)計算的位置展示具體的錯誤概況。一些計算在元素交互性上比其他計算更高，導(dǎo)致在那些點的錯誤率更大。在Ayres（2006a）的研究中，當(dāng)學(xué)生完成每個問題時，他們被要求評估他們?nèi)绾稳菀谆蚶щy地發(fā)現(xiàn)每個計算。結(jié)果表明難度等級和錯誤模式之間的一致匹配。通過他們的主觀評級，學(xué)生實際上能夠識別問題內(nèi)的元素交互性（內(nèi)在認(rèn)知負(fù)荷）的顯著差異。他還發(fā)現(xiàn)，具有更多領(lǐng)域特定知識的學(xué)生比知識較少的學(xué)生能夠更好地通過其評級來識別內(nèi)在負(fù)荷的差異。最有可能的情況是專業(yè)知識使學(xué)生更深入地反映每個計算中涉及的內(nèi)部過程和負(fù)荷等級而得到更準(zhǔn)確地結(jié)果。即使具有高水平的領(lǐng)域?qū)I(yè)知識的學(xué)生幾乎沒有錯誤，他們?nèi)匀荒軌騾^(qū)分元素交互水平。在這項研究中，沒有嘗試提供不同類別的認(rèn)知負(fù)荷的單獨測量。相反，外在認(rèn)知負(fù)荷保持恒定，因此負(fù)荷的任何差異可以被認(rèn)為是由于內(nèi)在負(fù)荷引起的。

DeLeeuw和Mayer（2008）使用了一種混合的方法，包括主觀測量和輔助任務(wù)，以調(diào)查不同的儀器是否可以分別測量內(nèi)在的，外在的和相關(guān)認(rèn)知負(fù)荷。 DeLeeuw和Mayer認(rèn)為內(nèi)在認(rèn)知負(fù)荷可以通過增加多媒體課程和外在負(fù)荷中的解釋性句子的數(shù)量，通過改變由相同的口頭和書面文本組成的冗余材料來操縱。對轉(zhuǎn)移任務(wù)的績效被認(rèn)為是對相關(guān)認(rèn)知負(fù)荷的衡量。采集了三個測量認(rèn)知負(fù)荷的指標(biāo)：對輔助任務(wù)（在課程期間的顏色的背景變化）的響應(yīng)時間，在課程期間采集的主觀心理努力評級和在課程之后得到的主觀難度評級。在兩個實驗中，發(fā)現(xiàn)輔助任務(wù)對冗余操作（外部負(fù)荷）最敏感，心理努力評級對句子復(fù)雜性（內(nèi)在負(fù)荷）的變化最敏感，并且難度評級對轉(zhuǎn)移成功的差異最敏感。在轉(zhuǎn)移測試中獲得高分的學(xué)生被假定投入更多的精力投入，而那些得分低的學(xué)生投入不夠。

這些結(jié)果表明，不同的測量方法可以利用不同的過程和顯示不同的敏感性。然而，可能有一些疑問，使用的三種方法是否可以區(qū)分不同類型的認(rèn)知負(fù)荷。不清楚的是為什么輔助任務(wù)應(yīng)該對外在認(rèn)知負(fù)荷比心理努力評級更敏感，或者為什么心理努力評級應(yīng)該對內(nèi)在認(rèn)知負(fù)荷特別敏感。此外，我們懷疑轉(zhuǎn)移績效是否必然是相關(guān)負(fù)荷的量度。此外，需要注意的是，根據(jù)當(dāng)前的公式，相關(guān)認(rèn)知負(fù)荷僅僅是由內(nèi)在元素相互作用施加的負(fù)荷量的反映，因此不獨立地貢獻總負(fù)荷。然而，有趣的是，這些不同的測量方法根據(jù)操縱的性質(zhì)產(chǎn)生不同的結(jié)果。很少有其他研究（其他實例參見Cierniak，Scheiter，＆Gerjets，2009b; van Gerven等，2003）在同一研究中同時使用了主觀評級和認(rèn)知負(fù)荷的輔助任務(wù)測量。

在試圖測量認(rèn)知負(fù)荷的不同方面，一些研究者已經(jīng)受到稱為NASA任務(wù)負(fù)荷指數(shù)（NASA-TLX，Hart＆Staveland，1988）的多維尺度的影響。 NASA-TLX包括六個子量表，用于衡量與完成任務(wù)相關(guān)的不同因素：（1）精神需求（需要多少精神和知覺活動），（2）身體需求（需要多少體力活動？）（3）時間要求（具有多大的時間壓力），（4）績效（你認(rèn)為你在實現(xiàn)實驗任務(wù)設(shè)定的目標(biāo)上有多成功？）（5）努力（你在完成任務(wù)期間付出的精神上的和身體上的努力程度）和（6）挫折水平（任務(wù)期間感覺到的不安全，沮喪，激怒，壓力與安全，內(nèi)容和放松程度）。通過組合六個子量表來實現(xiàn)心理負(fù)荷的總體測量。

在最近對其使用的反思中，Hart（2006）指出，NASA-TLX量表主要用于側(cè)重于接口設(shè)計和評估的研究，包括自動化和決策輔助設(shè)備的影響。此外，與航空使用的原始設(shè)計一致，許多研究集中在空中交通管制和其他航空活動。相比之下，認(rèn)知負(fù)荷理論研究者集中在學(xué)習(xí)環(huán)境，并經(jīng)常通過選擇僅僅一些子量表，以及改變項目的措辭來修改測試工具。為了測量不同的認(rèn)知負(fù)荷類別，Gerjets，Scheiter和Catrambone（2006）從NASA-TLX中選擇了三個項目（參見Gerjets，Scheiter，＆Catrambone，2004）。他們是“任務(wù)要求”（完成學(xué)習(xí)任務(wù)需要多少精神和體力活動），“努力”（參與者如何努力工作來理解學(xué)習(xí)環(huán)境的內(nèi)容）和“操縱需求”參與者必須投入很多精力來操縱學(xué)習(xí)環(huán)境）。 Gerjets 等人（2006）認(rèn)為，這些項目中的每一個可以分別對應(yīng)于內(nèi)在的，相關(guān)的和外在的負(fù)荷。來自操作實例的復(fù)雜性的研究的結(jié)果表明，與測試績效數(shù)據(jù)有廣泛的一致性。換句話說，具有最高學(xué)習(xí)成果的團體報告最低的認(rèn)知負(fù)荷。然而，沒有相關(guān)證據(jù)表明三種測量對應(yīng)于所提出的不同類型的認(rèn)知負(fù)荷。

在研究認(rèn)知負(fù)荷的測量方法的更多差異中，還存在將項目的措辭與不同類型的負(fù)荷所表示的概念相一致的趨勢。例如Cierniak 等（2009b，第318頁）使用了諸如“你的學(xué)習(xí)內(nèi)容有多難？你在學(xué)習(xí)材料有多難？你在學(xué)習(xí)中集中了多少？“措辭的選擇是為了將”學(xué)習(xí)內(nèi)容“與內(nèi)在負(fù)荷聯(lián)系起來，并將”與材料的學(xué)習(xí)“與外部負(fù)荷聯(lián)系起來。有人認(rèn)為，集中反映了對學(xué)習(xí)相關(guān)過程的關(guān)注，因此代表了相關(guān)負(fù)荷。在這項研究中，發(fā)現(xiàn)認(rèn)知負(fù)荷測量和績效數(shù)據(jù)之間的顯著匹配。

然而，有時測試績效和認(rèn)知負(fù)荷測量之間的匹配與理論預(yù)測不一致。 Gerjets，Scheiter，Opfermann，Hesse和Eysink（2009）使用了更多的措辭。學(xué)生被要求評價“領(lǐng)域的難度”（預(yù)期的內(nèi)在認(rèn)知負(fù)荷）和“他們在理解示例時所付出的努力”（預(yù)期的相關(guān)認(rèn)知負(fù)荷）。對于外部負(fù)荷，使用了兩個項目：“區(qū)分重要和不重要的信息”和“評估與環(huán)境處理的難度”。然而，這項研究沒有找到認(rèn)知負(fù)荷測量和學(xué)習(xí)成果之間的預(yù)期匹配。

在測量不同類型的認(rèn)知負(fù)荷的心理測驗嘗試中的上述不一致是不可預(yù)料的。認(rèn)知負(fù)荷的類別之間的心理測量差別要求學(xué)習(xí)者指示他們正在經(jīng)歷的認(rèn)知負(fù)荷是否是由于特定類別的認(rèn)知負(fù)荷。我們懷疑學(xué)習(xí)者(特別是新手)是否能夠做出必要的區(qū)分。例如，當(dāng)試圖學(xué)習(xí)一些新概念時，學(xué)習(xí)者可能能夠準(zhǔn)確地指示他們找到任務(wù)困難的程度。他們可能不太準(zhǔn)確地將其困難歸因于材料的內(nèi)在性質(zhì)或提供材料的方式。在大多數(shù)情況下，除非他們知道相關(guān)的替代教學(xué)程序，例如本書第四部分討論的教學(xué)程序，否則學(xué)習(xí)者可能不能理解教學(xué)程序如何改變。如果學(xué)習(xí)者不熟悉教學(xué)設(shè)計原則，他們不能表明他們正在經(jīng)歷的難度水平是由于教學(xué)設(shè)計不足還是由于他們所處理的信息的自然復(fù)雜性。在這些情況下，設(shè)計用于指示認(rèn)知負(fù)荷是否歸因于一個類別而不是另一個類別的心理測量程序可能失?。?/span>Kirschner，Ayres，＆Chandler，2011）。

有一種心理測量的認(rèn)知負(fù)荷類別的替代方法。隨機對照實驗，改變一個類別，同時保持另一個恒定提供內(nèi)在和外在類別的認(rèn)知負(fù)荷的獨立性的一個很好的指標(biāo)，同時指示相關(guān)的教學(xué)后果。由于相對內(nèi)在或外在認(rèn)知負(fù)荷可以如第四部分所討論的通過實驗確定，我們不能使用心理測量手段確定認(rèn)知負(fù)荷類別的影響是否是關(guān)鍵的。

本章概述了研究人員用于測量認(rèn)知負(fù)荷的主要方法。它描述了在認(rèn)知負(fù)荷理論的早期階段，間接方法如錯誤率，任務(wù)完成時間和計算模型被用來作為評價指標(biāo)。各種教學(xué)效果可以通過認(rèn)知負(fù)荷的波動來解釋。這些間接測量與績效測試分?jǐn)?shù)結(jié)合使用加強了理論。當(dāng)Paas（1992）提出一個單一的心理努力主觀測量時，發(fā)生了間接測量的顯著變化。這種測量及其導(dǎo)數(shù)（難度標(biāo)度）以及教學(xué)效率的測量已經(jīng)用于許多研究中，并且是認(rèn)知負(fù)荷理論的發(fā)展中的非常有用的工具。在大多數(shù)情況下，主觀測量已經(jīng)提供了支持所有認(rèn)知負(fù)荷理論效應(yīng)的協(xié)作證據(jù)。然而，主觀評級量表不提供實時數(shù)據(jù)。它們僅提供事件后的認(rèn)知負(fù)荷的指示，因此不能用于在學(xué)習(xí)或解決問題期間確定認(rèn)知負(fù)荷的變化。能夠提供實時數(shù)據(jù)的替代措施是使用輔助任務(wù)。

輔助任務(wù)的使用頻率低于主觀評定量表，因為它們往往更具干擾性，需要更復(fù)雜的實驗條件，并且通常需要更復(fù)雜的設(shè)備。輔助任務(wù)的優(yōu)勢，即他們在學(xué)習(xí)和解決問題過程中測量認(rèn)知負(fù)荷的能力，也是一個缺點。它們可能難以使用。相反，主觀評級量表可以在學(xué)習(xí)或問題解決發(fā)作之后立即呈現(xiàn)，并且通常需要不超過約30秒來管理。然而，輔助任務(wù)已經(jīng)成功地用于認(rèn)知負(fù)荷理論研究以顯示預(yù)測的認(rèn)知負(fù)荷變化。確定認(rèn)知負(fù)荷（例如眼睛跟蹤）和生理學(xué)方法（例如使用EEG數(shù)據(jù)）的其他同時和連續(xù)方法已開始作為潛在測量方法出現(xiàn)，但仍處于測試的早期階段，但仍然被證明有效。

總之，已經(jīng)使用多種方法來測量認(rèn)知負(fù)荷。心理努力或困難的主觀測量已經(jīng)到最多的使用，并且已經(jīng)非常成功地使用。它的一個偉大的優(yōu)勢是，它很容易使用，并且非常不引人注目。相反，主觀測量法用于測量不同類型的認(rèn)知負(fù)荷的嘗試不太成功。鑒于我們需要區(qū)分認(rèn)知負(fù)荷的類別，我們嚴(yán)重懷疑心理測量技術(shù)能否有意義地區(qū)分這些構(gòu)造，特別是在研究新手的學(xué)習(xí)時。已經(jīng)有使用適當(dāng)?shù)膶嶒炘O(shè)計的實驗證明替代方案存在。第四部分討論這些實驗的結(jié)果。

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

打開APP，閱讀全文并永久保存查看更多類似文章

一個指導(dǎo)人機系統(tǒng)評估的框架

認(rèn)知負(fù)荷理論的解讀及啟示

在線學(xué)習(xí)研究30年

面向智能時代的跨媒體學(xué)習(xí)方式、理論與資源環(huán)境

想讓智能汽車更“聰明”，學(xué)點HMI人因?qū)W很有必要

績效監(jiān)測與測量結(jié)果記錄表

更多類似文章 >>

免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版