汪海波,薛澄岐,黃劍偉,宋廣麗
(1. 東南大學機械工程學院, 江蘇 南京 211189; 2. 安徽工業(yè)大學機械工程學院,安徽 馬鞍山 243002)
基于認知負荷的人機交互數(shù)字界面設(shè)計和評價*
汪海波1,2,薛澄岐1,黃劍偉1,宋廣麗1
(1. 東南大學機械工程學院, 江蘇 南京 211189; 2. 安徽工業(yè)大學機械工程學院,安徽 馬鞍山 243002)
復雜系統(tǒng)信息量大,信息結(jié)構(gòu)復雜,容易造成數(shù)字界面設(shè)計與用戶認知失衡, 文中針對這一問題,基于認知負荷的視角,展開了界面設(shè)計和評價研究以提高人-數(shù)字界面交互工效。從數(shù)字界面信息加工機制出發(fā),結(jié)合認知資源有限理論和認知圖式理論探討了數(shù)字界面認知負荷的生成機理,提出了數(shù)字界面外在認知負荷、內(nèi)在認知負荷和相關(guān)認知負荷的3個來源及相應的減少認知負荷的界面設(shè)計策略。將視覺搜索機制和眼動生理評估有效結(jié)合起來,提出了基于搜索深度-搜索廣度和內(nèi)斂度-發(fā)散度的數(shù)字界面眼動認知評價模型,在一定程度上實現(xiàn)了數(shù)字界面研究的認知根源挖掘和主客觀統(tǒng)一。
認知負荷;數(shù)字界面;認知圖式;眼動
引 言
如今,大到戰(zhàn)機/船舶駕駛艙操縱、核電廠控制、戰(zhàn)場指揮,小到家用電器、消費類電子產(chǎn)品,功能強大的軟件數(shù)字界面已越來越多地取代了傳統(tǒng)的人-機(器)硬件界面而成為當今人機交互的主要載體,操作者主要通過數(shù)字界面完成交互信息監(jiān)控、決策分析和突發(fā)問題的解決。對于大型復雜系統(tǒng),其數(shù)字界面信息量大,信息結(jié)構(gòu)復雜,容易造成界面設(shè)計與用戶認知失衡,因此,從認知負荷的視角開展人機交互數(shù)字界面的設(shè)計和評價研究具有重要的理論意義和現(xiàn)實意義。
目前對數(shù)字界面的設(shè)計和評價研究多集中在可用性范疇(即界面設(shè)計的可用性原則),以及對人-界面交互過程的有效性、交互效率和用戶滿意度進行評估[1],典型的可用性測試方法有用戶訪談、問卷調(diào)查等滿意度主觀評價以及任務完成時間、任務完成被試百分比、錯誤類型和數(shù)量等客觀績效評估[2]。眼動生理評估方法目前也是該研究領(lǐng)域的熱點,文獻[3]和[4]較早利用眼動技術(shù)進行了網(wǎng)站界面可用性測試,文獻[5]和[6]很好地探索了眼動路徑、注視熱點、注視點數(shù)量和注視時間等眼動數(shù)據(jù)在界面可用性測試中的應用。
但當前基于可用性的數(shù)字界面設(shè)計和評價方法具有一定的局限性,本文從認知負荷的視角,將數(shù)字界面信息加工、認知理論、視覺搜索機制和眼動生理評估有效結(jié)合起來,探討了數(shù)字界面認知負荷的生成機制、來源途徑、界面設(shè)計策略及眼動評價模型。
認知負荷這一術(shù)語早在20世紀70年代就有人使用[7],但把認知負荷作為一種理論并在此基礎(chǔ)上進行實驗研究的是澳大利亞的認知心理學家John Sweller[8]。他于20世紀80年代末90年代初提出的認知負荷理論的理論基礎(chǔ)主要是資源有限理論和圖式理論。資源有限理論認為人的認知資源是有限的,主要表現(xiàn)在工作記憶的容量有限。雖然工作記憶與注意是兩個不同的概念,但它們在控制性加工的過程中是一種共生的關(guān)系。如圖1所示,當集中注意對某些信息進行深度加工時,工作記憶中的目標信息相應減少,而工作記憶中的信息超過一定的容量,其實也是注意資源不足的問題。認知負荷理論通常從“認知資源”的角度描述注意,從“認知容量”的角度來描述工作記憶,其核心思想可以概括為在意識控制下的信息加工過程中,在認知資源與認知容量之間相互作用的關(guān)系,主要表現(xiàn)在工作記憶的容量有限。若加工某個信息所需要的認知資源超過了人所具有的認知資源總量,就會造成認知超負荷。
圖1 信息加工過程模型
圖式理論認為知識能以不同的方式來表征不同的信息,并以圖式的形式存儲于長時記憶中。認知心理學家認為,“人”心智表征的事實、觀念和概念統(tǒng)稱為陳述性知識,它由一些稱之為組塊的基本認知單元所組成。文獻[9]提出了3種不同類型的組塊:時間序列、表象和命題?!皥D式”就是這些陳述性知識在記憶中有組織的有內(nèi)在聯(lián)系的記憶結(jié)構(gòu),一般分為自然范疇圖式、代表事件的腳本圖式和文本圖式3大類?!叭恕睆念愃剖录亩啻谓?jīng)驗中抽取共同元素的過程就是圖式的形成過程。文獻[10]主張用同化和順應這兩個概念來說明主體的認知結(jié)構(gòu)與環(huán)境之間的關(guān)系,主體在與環(huán)境的不斷同化與順應過程中,擴大了主體的認知結(jié)構(gòu),適應了變化著的客觀世界?,F(xiàn)代認知心理學則從學習的主動角度刻畫圖式的發(fā)展。一個圖式可以包括若干個子圖式,圖式與圖式之間也可以聯(lián)結(jié)形成新圖式,許多個圖式可以聯(lián)結(jié)為陳述性知識網(wǎng)絡(luò),這是知識在記憶中得以儲存的一種模型。知識的學習可以表征為給這一網(wǎng)絡(luò)增加了某一新的圖式或組塊,或在各信息組塊間增加了新的聯(lián)結(jié),或改變了聯(lián)結(jié)的性質(zhì)或強度[10]。
在個體加工新信息的時候,長時記憶中的圖式根據(jù)信息元素的使用方式來組織信息,它提供知識組織和存儲的機制,可以減少工作記憶負荷。如圖2所示,因為圖式不管大小在記憶中都被當作一個實體來看待,子元素或者低級圖式可以被整合到高一級的圖式,不再需要工作記憶空間,因此,圖式使工作記憶在處理的信息量上沒有明顯限制,盡管處理的元素數(shù)量有限。圖式經(jīng)過大量的實踐能成為自動化過程,圖式自動化不需要有意識的控制,它不會消耗認知資源,不會給個體帶來認知負荷。
圖2 認知圖式作用機制
影響人機交互數(shù)字界面認知負荷的因素很多,概括起來有3點:界面元素的組織和呈現(xiàn)方式,系統(tǒng)和界面的復雜性,操作者的專長水平(即先前知識經(jīng)驗)。它們決定了數(shù)字界面認知負荷來源的3個途徑:外在認知負荷(Extraneous Cognitive Load:ECL)、內(nèi)在認知負荷(Intrinsic Cognitive Load:ICL)和相關(guān)認知負荷(Germane Cognitive Load:GCL)。
2.1 外在認知負荷
外在認知負荷也稱為無效認知負荷,是由操作者在認知界面過程中所具有的對認知沒有貢獻的心理活動引起的,它與界面元素的組織和呈現(xiàn)方式有關(guān),使認知的界面信息與圖式?jīng)]有關(guān)聯(lián)。大量關(guān)于認知負荷的研究都表明,在經(jīng)常遇到的與認知加工有關(guān)的任務中,在很多情況下都存在外在認知負荷,認知進程受到阻礙,因此,優(yōu)化界面元素的組織和呈現(xiàn)方式是降低數(shù)字界面操作者外在認知負荷的重要途徑。其具體策略如下:
1) 在界面元素的組織上,要遵循一定的視覺搜索原則,要符合人的視覺搜索規(guī)律,使操作者以最短的視覺搜索線路找到所需信息,并依據(jù)圖式理論建立信息之間的聯(lián)系進而整合信息,減少操作者的分散注意,從而降低操作者外在認知負荷。
2) 在界面元素的呈現(xiàn)方式上,根據(jù)信息的特性和操作者的任務需要選擇適合的呈現(xiàn)方式,例如利用色彩來表達區(qū)域和等級信息,利用圖形文字來表達定量、定向的內(nèi)容。另外,在適當?shù)臅r間呈現(xiàn)適當?shù)男畔⒁彩墙档屯庠谡J知負荷的有效策略。
2.2 內(nèi)在認知負荷
內(nèi)在認知負荷是指在工作記憶中同時得到加工的、新整合進認知圖式中的元素的數(shù)量,文獻[11]認為內(nèi)在認知負荷的高低是由將要認知的材料的特征與個體專業(yè)知識之間的關(guān)系決定的。如果界面較復雜,而且操作者在該領(lǐng)域的專業(yè)知識較貧乏,那么要理解所認知的界面就必須同時注意多個不同的元素,這些元素就會同時在工作記憶中得到加工,工作記憶的負擔就會加重,從而產(chǎn)生較高的內(nèi)在認知負荷。反之,如果操作者對該領(lǐng)域的知識有豐富的經(jīng)驗,那么在其認知過程中,就會比專業(yè)知識貧乏的操作者產(chǎn)生較少的內(nèi)在認知負荷。文獻[12]提出把認知材料分解成具有完整意義的、可單獨呈現(xiàn)的模塊,模塊化的樣例呈現(xiàn)方式可以降低認知者的內(nèi)在認知負荷。
2.3 相關(guān)認知負荷
相關(guān)認知負荷也稱有效認知負荷,是指個體在完成某一任務過程中仍有多余的認知資源時,個體便可以把剩余的認知資源用到下一步的認知加工中,讓個體在工作記憶的元素活動中加入更高級的有意識的認知加工(如重組、抽象、比較和推理等)。這樣的加工也會增加認知負荷,但是這種認知負荷不會阻礙信息認知,反而可以促進信息處理。
認知負荷的3種類型共同存在于用戶對數(shù)字界面的認知過程中,三者的總量不能超過認知資源總量,否則會造成認知負荷超載。如圖3所示,認知負荷總量包含內(nèi)在認知負荷、外在認知負荷和相關(guān)認知負荷,三者之間是此消彼長的關(guān)系。因此通過界面設(shè)計可最大限度地降低外在認知負荷,增加相關(guān)認知負荷,使認知負荷總和保持在工作記憶容量許可的范圍內(nèi),合理利用有限的認知資源,達到較好的數(shù)字界面認知效果。
圖3 認知負荷來源途徑
3.1 視覺搜索質(zhì)量眼動評價
視覺搜索一般分為深度優(yōu)先搜尋和廣度優(yōu)先搜尋2種。用戶搜索信息時,一個設(shè)計良好的數(shù)字界面應使用戶以較少的對整個界面的瀏覽搜索出很多需要的信息,應使用戶集中注意對某些信息進行深度加工。此時工作記憶中的目標信息相應減少,避免了工作記憶容量不足和注意資源不足帶來的認知負荷過載問題。同時相關(guān)研究表明,用戶在視覺搜索信息時,專家用戶比新手用戶具有更多的深度優(yōu)先搜索[13]。因此能夠用深度優(yōu)先搜索和廣度優(yōu)先搜索代表的視覺搜索質(zhì)量來評價數(shù)字界面的優(yōu)劣。
直接引入搜索深度和搜索廣度兩個概念,視覺搜索質(zhì)量好的界面應該是搜索深度值大,搜索廣度值小。使用凝視次數(shù)(回視)、掃描路徑的集中程度分析視覺搜索質(zhì)量。眼動指標中凝視次數(shù)(回視)跟搜索深度負相關(guān);掃描路徑長度是各凝視點之間來回搜索距離的和,凝視點多,掃描路徑越擴散,代表需要更多的廣度搜尋,搜索廣度同掃描路徑成正比。因此,可定義搜索深度D= 1/N,N為凝視次數(shù);搜索廣度S=∑L,L為掃描路徑的長度。
3.2 信息加工水平眼動評價
數(shù)字界面認知眼動評價,需要從信息加工的角度考察用戶的眼動行為表征。多數(shù)學者認為凝視時間、凝視次數(shù)、總的完成時間(含凝視時間和掃視時間)與信息加工有關(guān),凝視時間和總的完成時間越長,凝視次數(shù)越多,界面設(shè)計就越差。這種看法存在片面性,沒有將界面中的信息加工認知與一般視覺活動分開。本研究認為,分析界面的信息加工應該選擇一個興趣區(qū)域,興趣區(qū)域中的凝視時間和凝視次數(shù)占整個界面的完成時間和凝視次數(shù)的比例越大,說明用戶對界面的信息加工越好,無效的外在認知負荷較少,整個界面越內(nèi)斂。引入內(nèi)斂度概念,內(nèi)斂度IN定義如下:
IN=(Na×Ta)/ (N×T)
(1)
式中:Na為興趣區(qū)域AOI的凝視次數(shù);N為整個界面的凝視次數(shù);Ta為興趣區(qū)域的凝視時間;T為凝視時間和掃視時間之和,即總的時間。
文獻[14]表明,凝視的持續(xù)時間越長,加工難度就越大,與用戶解釋界面元素表征耗時就越長。因此,在此基礎(chǔ)上計算有效凝視時間之和與凝視次數(shù)的比值來反映加工的發(fā)散程度。發(fā)散度值越高,表示其單個元素的信息加工越難,界面認知負荷越高,整體不夠收斂,偏發(fā)散,數(shù)字界面設(shè)計差。
發(fā)散度DI定義如下:
DI=Ta/Na
(2)
本文從認知負荷的視角探索人機交互數(shù)字界面設(shè)計和評價方法。根據(jù)認知資源有限理論和圖式理論總結(jié)了數(shù)字界面認知負荷的生成機理;從數(shù)字界面設(shè)計角度出發(fā)闡述了其認知負荷的3個來源途徑及相應的設(shè)計控制策略;圍繞信息視覺搜索和信息加工,提出了基于搜索深度-搜索廣度、內(nèi)斂度-發(fā)散度的數(shù)字界面認知評價模型。從數(shù)字界面認知機理的挖掘探索數(shù)字界面的設(shè)計和評價,對傳統(tǒng)的可用性研究是一種很好的補充,對數(shù)字界面設(shè)計研究有很好的啟發(fā)和借鑒意義。
[1]ISO/DIS9241-11DraftInternationalStandard.Ergonomicrequirementsforofficeworkwithvisualdisplayterminals(VDRs),part11:guidanceonusability[S].Geneva,Switzerland:InternationalOrganizationforStandardization, 1995.
[2]BABCOCKJ,LIPPSM,PELZJ.Howpeoplelookatpicturesbefore,duringandafterimagecapture:BuswellRevisited[C]//ProceedingsofSPIE,HumanVisionandElectronicImaging.SanJose:SPIEPress, 2002.
[3]ELLISS,CANDERAR,MISNERJ.Windowstothesoulwhateyemovementstellusaboutsoftwareusability[C] //ProceedingsoftheUsabilityProfessionals′Association.WashingtonDC:UPAPress, 1998.
[4]JOACHIMST.Optimizingsearchenginesusingclickthrou-ghdata[C]//Proceedingsofthe8thACMSIGK-DDInternationalConferenceonKnowledgeDiscoveryandDataMining.NewYork:CAMPress, 2002.
[5] 王海燕,卞婷,薛澄岐. 基于眼動跟蹤的戰(zhàn)斗機顯示界面布局的實驗評估[J].電子機械工程, 2011,27(6):50-53.
[6] 劉青, 薛澄岐,FALKHOEHN. 基于眼動跟蹤技術(shù)的界面可用性評估[J]. 東南大學學報, 2010,40(2): 331-334.
[7]ATWOODM,POLSONPA.Processmodelforwater-jugProblems[J].CognitivePsychology, 1976(8): 196-216.
[8] 許遠理,李亦菲,朱新明. 評價問題難度的一種新方法:認知負荷測量模型[J]. 心理學動態(tài),1998,6(2):6 -10.
[9]ANDERSONJR.Architectureofcognition[M].Cambridge,MA:HarvardUniversityPress,1983.
[10]FETSOT,MCCLUREJ. 教育心理學[M]. 吳慶麟, 譯. 上海:上海人民出版社,2008.
[11]SWELLERJ.Cognitiveloadduringproblemsolving:eff-ectonlearning[J].CognitiveScience, 1988, 12(2): 257-285.
[12]GERJETSP,SCHEITERK,CATRAMBR.Designinginstructionalexamplestoreduceintrinsiccognitiveload:Molarversusmodularpresentationofsolutionprocedures[J].InstructionalScience, 2004,32(1): 33-58.
[13] 史忠植. 認知科學[M]. 安徽:中國科技大學出版社,2008.
[14] 張光強,沈模衛(wèi),陶嶸.可用性測試中的視覺跟蹤技術(shù)[J].人類工效學,2001,7(4):9-13.
汪海波(1978-),男,博士,副教授,主要研究方向為人機交互及人機界面設(shè)計。
Design and Evaluation of Human-computer Digital Interface Based on Cognitive Load
WANG Hai-bo1,2,XUE Cheng-qi1,HUANG Jian-wei1,SONG Guang-li1
(1.SchoolofMechanicalEngineering,SoutheastUniversity,Nanjing211189,China; 2.SchoolofMechanicalEngineering,AnhuiUniversityofTechnology,Ma′anshan243002,China)
A large amount of information and complicated structure for complex systems is likely to cause imbalance between the digital interface design and user awareness. The interface design and evaluation are studied based on the perspective of cognitive load in order to improve the interaction ergonomics of human-computer digital interface. From the information processing model, the formation mechanism of digital interface cognitive load is explored combined with the limited cognitive resources theory and the cognitive schema theory. Three sources of extraneous cognitive load, intrinsic cognitive load and germane cognitive load and the corresponding interface design strategy to reduce the cognitive load are put forward. With visual search and the eye-tracking evaluation combined, the two-eye movement cognitive evaluation model of digital interface is built based on search depth-search scope and inside collect-divergence. The cognitive origin of human-digital interface interactive is probed and the unity of subjective and objective is achieved.
cognitive load; digital interface; cognitive schema; eye-tracking
國家自然科學基金資助項目(71071032);國家自然科學基金資助項目(71271053);教育部人文社會科學青年基金資助項目(12YJC760019)
2013-07-23
TP302
A
1008-5300(2013)05-0057-04