吳曉偉 龍青云 易艷紅 黃務(wù)蘭
(上海商學(xué)院 上海 200235)
隨著可用數(shù)據(jù)量的增加,數(shù)據(jù)可視化變得越來越流行和重要??梢暬軌蚝啙嵉乇硎緩?fù)雜的底層數(shù)據(jù),能從數(shù)據(jù)中提取有用的信息,掌握信息的含義,并直觀地表示結(jié)果。近年來,國外學(xué)者開始對數(shù)據(jù)可視化素養(yǎng)(Data Visualization Literacy,DVL)進行研究,以期在大數(shù)據(jù)環(huán)境下對數(shù)據(jù)素養(yǎng)能力的認(rèn)識進行提升和補充。一個人閱讀、理解和解釋數(shù)據(jù)可視化的能力會強烈影響他/她的任務(wù)和交流。換言之,數(shù)據(jù)可視化素養(yǎng)正變得與閱讀和理解文本的能力同等重要[1]。最近的一項研究表明,普通人的可視化素養(yǎng)水平較低,在理解和解釋數(shù)據(jù)可視化方面存在局限性[2],可見數(shù)據(jù)可視化素養(yǎng)教育的重要性。目前,數(shù)據(jù)可視化素養(yǎng)本土研究相對匱乏,尤其缺乏評價框架和測試量表,這不利于大數(shù)據(jù)環(huán)境下國家對人才培養(yǎng)的要求。本文梳理國內(nèi)外數(shù)據(jù)可視化素養(yǎng)研究,結(jié)合人力資源領(lǐng)域的KSAO模型,提出基于KSAO模型的數(shù)據(jù)可視化素養(yǎng)評價框架,并以大學(xué)生新生數(shù)據(jù)可視化素養(yǎng)量表設(shè)計為例說明量表設(shè)計過程,以期給后續(xù)的大學(xué)數(shù)據(jù)可視化教育內(nèi)容、模式提供參考和指引。
在構(gòu)建數(shù)據(jù)可視化素養(yǎng)框架前,有必要對現(xiàn)有的數(shù)據(jù)可視化和數(shù)據(jù)可視化素養(yǎng)方面的概念有所了解。
18—19世紀(jì),人們就已經(jīng)掌握了整套統(tǒng)計數(shù)據(jù)可視化工具,如常用的柱狀圖、折線圖、直方圖、餅圖、時間線等[3]。1967年Bertin出版了《圖形符號學(xué)》一書,確定了構(gòu)成圖形的基本要素,奠定了現(xiàn)代信息可視化的理論基礎(chǔ)[4]。1982年2月,美國國家基金會首次召開了“科學(xué)可視化”命名的會議??茖W(xué)可視化聚焦于科學(xué)、工程領(lǐng)域的可視化分析,數(shù)據(jù)通常表達的是二維、三維空間或者包含時間維度,目前已經(jīng)成為可視化分析技術(shù)中最成熟分支。同時期,多維統(tǒng)計圖形的誕生使可視化表現(xiàn)數(shù)據(jù)的范圍從傳統(tǒng)的統(tǒng)計數(shù)據(jù)擴大到多源、多層次、高維的數(shù)據(jù)。1995年,召開了專門面向抽象、高維數(shù)據(jù)的信息可視化會議——IEEE Information Visualization。信息可視化主要處理非結(jié)構(gòu)化、非幾何化的抽象數(shù)據(jù),如金融交易、社會網(wǎng)絡(luò)、文本數(shù)據(jù)等[3]。
進入21世紀(jì),社會進入了大數(shù)據(jù)時代。數(shù)據(jù)可視化登堂入室,它綜合了科學(xué)可視化、信息可視化、可視分析學(xué),其呈現(xiàn)對象可以是任何數(shù)據(jù)類型,任意數(shù)據(jù)特性。數(shù)據(jù)可視化還原甚至增強數(shù)據(jù)中的全部結(jié)構(gòu)和細(xì)節(jié),真正做到視物致知。
數(shù)據(jù)可視化素養(yǎng)到目前還沒有統(tǒng)一定義。2014年,Boy等人第一次提出了可視化素養(yǎng)概念,將其定義為“良好的使用數(shù)據(jù)可視化(如線圖)以有效、高效和自信的方式處理信息的能力[5]。Boy的可視化素養(yǎng)注重從可視化呈現(xiàn)中提取信息,沒有考慮用可視化來分析、解決問題。2015年,B?rner 認(rèn)為數(shù)據(jù)可視化素養(yǎng)是指從數(shù)據(jù)的可視化表示中產(chǎn)生意義并解釋模式、趨勢和相關(guān)性的能力[2]。Lee認(rèn)為上述兩種定義均有一定缺陷,即:a.詞語使用的模糊性,如良好、有效、高效和自信的方式;b.狹義的任務(wù)類型,例如解釋模式、趨勢以及相關(guān)性。素養(yǎng)在韋氏字典中被定義為“讀寫能力”,其有消費和生產(chǎn)兩個方面。當(dāng)素養(yǎng)與其他學(xué)科(如信息素養(yǎng)、健康素養(yǎng)和能源素養(yǎng))相結(jié)合的時候,更多的是指從消費角度來理解和使用某些東西的能力。Lee從這個視角出發(fā)把數(shù)據(jù)可視化素養(yǎng)定義為在數(shù)據(jù)可視化中閱讀和解釋可視化數(shù)據(jù)并從中提取信息的能力和技能[6]。
2019年,B?rner整理了近年來的數(shù)據(jù)可視化素養(yǎng)研究成果,提出了數(shù)據(jù)可視化素養(yǎng)框架體系,該框架由需求洞察(Insight Needs)、數(shù)據(jù)類別(Data Scales)、數(shù)據(jù)分析(Analyses)、可視化呈現(xiàn)(Visualizations)、圖形符號(Graphic symbols)、圖像變量(Graphic variables)、交互方式 (Interactions) 等7個維度構(gòu)成,每個維度包括了數(shù)據(jù)可視化所需的各種知識要素,其來源于廣泛的文獻研究[7-8]。B?rner的框架內(nèi)容體現(xiàn)了數(shù)據(jù)可視化流程——任務(wù)解析、數(shù)據(jù)理解、尋求可視化方法、可視化實現(xiàn)、發(fā)現(xiàn)知識的五個階段[9]。
綜合上述文獻研究,我們把數(shù)據(jù)可視化素養(yǎng)定義為一種既能從可視化呈現(xiàn)中提取數(shù)據(jù)、信息和知識又能運用可視化處理數(shù)據(jù)、指導(dǎo)決策和完成任務(wù)的能力。具有良好數(shù)據(jù)可視化素養(yǎng)的大學(xué)生應(yīng)能根據(jù)任務(wù)需要在數(shù)據(jù)域與可視化域之間進行切換,能充分利用和發(fā)揮可視化勝于讀、寫、計算的優(yōu)勢。
近年來,研究用戶的數(shù)據(jù)可視化素養(yǎng)已經(jīng)成為數(shù)據(jù)可視化研究的熱門主題。比如Boy等人提出了基于項目反應(yīng)理論的可視化素養(yǎng)評估方法,試圖了解大眾對數(shù)據(jù)可視化理解的現(xiàn)狀[5];B?rner讓273名博物館訪問者觀看了20種不同可視化效果的數(shù)據(jù)來確定青少年和成人對可視化呈現(xiàn)的熟悉程度[2];有的還提出了學(xué)習(xí)不熟悉的可視化的各種方法,以提高用戶的可視化素養(yǎng)[10-11]。一些研究人員定性地調(diào)查了用戶在努力理解數(shù)據(jù)可視化時的認(rèn)知活動,建立信息可視化感知的扎根模型[12]。知名的可視化國際會議也認(rèn)識到這一主題的重要性。如EuroVIS 2014研討會:走向可視化素養(yǎng);IEEE VIS 2014研討會:走向開放的可視化素養(yǎng)測試平臺;IEEE VIS 2015中的一個小組討論:VIS,下一代:跨越研究者——從業(yè)者鴻溝的教學(xué)[6]。從已有研究可以發(fā)現(xiàn),當(dāng)前研究存在三方面不足:a.評估量表沒有完全體現(xiàn)數(shù)據(jù)可視化素養(yǎng)中的“數(shù)據(jù)”要素構(gòu)成。量表主要集中在可視化技能測試,對數(shù)據(jù)和數(shù)據(jù)分析的題項幾乎很少涉及。b.作為一種素養(yǎng)測試,還要體現(xiàn)素養(yǎng)對人的通用能力的提升作用,這需要專門的測試題項。c.沒有認(rèn)識到數(shù)據(jù)可視化素養(yǎng)是分層、分階段的。數(shù)據(jù)可視化素養(yǎng)除了通識素養(yǎng)(社會必備的基礎(chǔ)素養(yǎng)),還有按學(xué)歷層次、按專業(yè)、按職業(yè)的特定素養(yǎng)。本文認(rèn)為可以把人力資源管理中的KSAO模型結(jié)合數(shù)據(jù)可視化概念來建立數(shù)據(jù)可視化評估框架,再根據(jù)特評估對象特征設(shè)計相應(yīng)的量表,能很好彌補當(dāng)前研究不足。
數(shù)據(jù)可視化素養(yǎng)量表可以參考人力資源領(lǐng)域中廣泛應(yīng)用的KSAO模型進行設(shè)計。KSAO模型用知識、技能、能力、其他個性特質(zhì)來描述崗位資質(zhì)[13]。具體來說知識是執(zhí)行工作所需要的專業(yè)知識、管理知識、行業(yè)知識等,這些可以通過學(xué)校教育、行業(yè)培訓(xùn)獲得;技能是在工作中運用某種工具或者操作某種設(shè)備以及相關(guān)的技巧和經(jīng)驗,可以通過課堂訓(xùn)練,日常實踐來掌握;能力是指人的通用能力,如邏輯思維能力、學(xué)習(xí)能力、觀察能力、解決問題的能力、基本的表達能力等;其他主要是指有效完成某一工作需要的其他個性特質(zhì),包括對員工的工作要求、工作態(tài)度、工作意識、個人個性以及其他的特殊要求。
KSAO模型和素養(yǎng)內(nèi)涵具有很好的契合度。經(jīng)濟合作與發(fā)展組織(OECD)認(rèn)為素養(yǎng)不只是知識與技能。它是在特定情境中,通過利用和調(diào)動心理社會資源(包括技能和態(tài)度)、以滿足復(fù)雜需要的能力。素養(yǎng)的內(nèi)涵要體現(xiàn)四種關(guān)系:素養(yǎng)與知識、素養(yǎng)與基本技能、素養(yǎng)與情境、素養(yǎng)與表現(xiàn)[14]。KSAO中的K、S對應(yīng)了前兩者關(guān)系,而A、O對應(yīng)了后兩者。KSAO模型結(jié)合專業(yè)素養(yǎng)特點,能全面描述素養(yǎng)的評價內(nèi)涵,已被應(yīng)用在學(xué)生和教師的數(shù)據(jù)素養(yǎng)評價中[13-15]。同樣,根據(jù)數(shù)據(jù)可視化定義和參考相關(guān)的研究成果,結(jié)合KSAO模型中各模塊內(nèi)涵,則可以得到基于KSAO的數(shù)據(jù)可視化素養(yǎng)評價框架,如表1所示。表中的指標(biāo)具體釋義將在后面的量表設(shè)計中展開。
表1 基于KSAO的數(shù)據(jù)可視化素養(yǎng)評價框架
基于KSAO的數(shù)據(jù)可視化素養(yǎng)評價框架有以下四個方面的優(yōu)勢:其一,具有科學(xué)性。各模塊指標(biāo)概念界定清晰,能充分反應(yīng)可視化素養(yǎng)的成長路徑,即意識——知識——技能——能力。通過“其他特質(zhì)”模塊,加入數(shù)據(jù)可視化意識、數(shù)據(jù)可視化安全以及社會法律道德維度,體現(xiàn)了數(shù)據(jù)可視化作為一種素養(yǎng)必備的社會倫理觀、道德觀。其二,具有通用性。指標(biāo)內(nèi)容充分考慮了現(xiàn)階段國內(nèi)外的數(shù)據(jù)可視化素養(yǎng)的研究成果,選取和匯總了國內(nèi)外文獻中具有廣泛性、權(quán)威性的評價指標(biāo)。其三,具有可操作性。研究人員能夠根據(jù)測試人員社會背景、知識結(jié)構(gòu),依據(jù)框架各維度要求,便捷地設(shè)計相關(guān)量表題項。其四,具有很好的指導(dǎo)性。KSAO來源于人力資源評價,體現(xiàn)了企業(yè)對入職員工的基本知識和技能要求。按照KSAO框架設(shè)計出來的數(shù)據(jù)可視化素養(yǎng)量表可以較好評估當(dāng)前學(xué)生可視化課程設(shè)置是否符合社會、行業(yè)和企業(yè)的要求,能對現(xiàn)有的教學(xué)內(nèi)容、教學(xué)模式給與針對性指導(dǎo)。綜上,基于KSAO的數(shù)據(jù)可視化素養(yǎng)評價框架與基于數(shù)據(jù)可視化流程的B?rner框架相比,評價內(nèi)容更全面,更具有實操性。
本文以大學(xué)新生為例來說明數(shù)據(jù)可視化量表如何設(shè)計。量表要依據(jù)數(shù)據(jù)可視化素養(yǎng)評價框架,同時要結(jié)合大學(xué)新生測試群體的知識結(jié)構(gòu)進行開發(fā)。為更好了解大學(xué)新生的狀況,本研究邀請了10位專家對題項內(nèi)容把關(guān)。其中2位中學(xué)老師從事數(shù)學(xué)和信息技術(shù)的教學(xué)工作,高校老師中2位教授,3位副教授,主要從事計算機基礎(chǔ)、大數(shù)據(jù)分析、大數(shù)據(jù)可視化、電商運營等方向的教學(xué)和科研。3位行業(yè)專家來自大型電商平臺的營銷部門、政府輿情管理部門。最終量表是否合適,還要進行內(nèi)容效度和信度分析。由于數(shù)據(jù)可視化遠沒有讀寫、算術(shù)那樣成熟和普及,有些名詞術(shù)語還沒有統(tǒng)一,故在測試前,應(yīng)對量表中涉及的專業(yè)詞匯向測試對象解釋說明。
3.1.1數(shù)據(jù)知識
數(shù)據(jù)是理解和實現(xiàn)可視化分析的基礎(chǔ)。數(shù)據(jù)可以分為四類:定類數(shù)據(jù)、定序數(shù)據(jù)、定距數(shù)據(jù)、定比數(shù)據(jù)[4]。不同類型的數(shù)據(jù)適用不同的統(tǒng)計運算和數(shù)據(jù)分析。在數(shù)據(jù)可視化中,一般把上述四類簡化為三類:定類數(shù)據(jù)、定序數(shù)據(jù)、數(shù)值型數(shù)據(jù)(包括定距數(shù)據(jù)與定比數(shù)據(jù))。
在B?rner框架中,除了常規(guī)的統(tǒng)計分析外,對于數(shù)據(jù)分析還要能用時序分析發(fā)現(xiàn)數(shù)據(jù)的發(fā)展趨勢,通過空間分析解析數(shù)據(jù)的空間分布,通過主題分析揭示文本內(nèi)容的主要構(gòu)成,通過關(guān)系分析發(fā)現(xiàn)映射數(shù)據(jù)之間的相關(guān)性以及網(wǎng)絡(luò)結(jié)構(gòu)[7]。
數(shù)據(jù)知識方面要求測試者具備常用的統(tǒng)計學(xué),還需對地理學(xué)、語言學(xué)、網(wǎng)絡(luò)科學(xué)等學(xué)科技術(shù)有所了解。數(shù)據(jù)類型與數(shù)據(jù)分析的理解能力是數(shù)據(jù)可視化素養(yǎng)的核心構(gòu)成要素,決定了能否正確選擇合適圖形符號、圖形變量進行可視化呈現(xiàn),這是數(shù)據(jù)可視化素養(yǎng)與只強調(diào)讀取可視化信息的可視化素養(yǎng)區(qū)別。
大學(xué)新生的數(shù)據(jù)知識主要參考國內(nèi)中學(xué)數(shù)學(xué)教材,并對兩位中學(xué)教師進行了咨詢,考慮到可視化圖表應(yīng)用場景,數(shù)據(jù)知識主要集中在基本的統(tǒng)計知識方面。知識點包括數(shù)據(jù)類型識別和基本統(tǒng)計知識。統(tǒng)計知識方面主要測試學(xué)生對平均數(shù)、中位數(shù)、眾數(shù)、極差、方差認(rèn)識,以及頻率、回歸分析等掌握,主要采取單項選擇題形式,見表2所示。
表2 數(shù)據(jù)知識題項
3.1.2可視化知識
大學(xué)新生的可視化知識主要從熟悉的中學(xué)教材、主流的網(wǎng)絡(luò)媒體以及接觸過的可視化工具來習(xí)得。通過查閱國內(nèi)中學(xué)教材,可以發(fā)現(xiàn)中學(xué)課堂教學(xué)中已經(jīng)接觸過的可視化圖有6種類型:折線圖、條形圖、餅圖、散點圖、直方圖、莖葉圖。分析新浪、網(wǎng)易、人民網(wǎng)3個主流媒體新聞稿中的可視化圖表使用頻率及主流可視化軟件如Tableau、Power BI、ECharts、EXECL中的基本可視化圖形類型,我們可以得到常見的可視化圖有折線圖、條形圖、堆疊條形圖、餅圖、散點圖、直方圖、面積圖、堆疊面積圖、矩形樹形圖、瀑布圖、氣泡圖、地圖、熱圖、漏斗圖、盒須圖、甘特圖等。
可視化呈現(xiàn)是通過可視化編碼來實現(xiàn)的,可視化編碼是將數(shù)據(jù)信息映射為可視化元素的技術(shù),這是數(shù)據(jù)可視化的核心。測試者應(yīng)對3個方面的知識有基本的了解。其一,要認(rèn)識到不同的圖形實質(zhì)是不同數(shù)據(jù)類型的組合。比如折線圖是由一個定序數(shù)據(jù)和一個數(shù)值型數(shù)據(jù)構(gòu)成。餅圖是由一個定類數(shù)據(jù)和一個數(shù)值型數(shù)據(jù)構(gòu)成等。其二,要能了解可視化編碼中的圖像符號和圖像變量的含義和作用。圖像符號具有分類性質(zhì),主要包括點、線、面積、體積4種幾何符號,不同符號可以表示不同的數(shù)據(jù)屬性,是數(shù)據(jù)屬性到可視化元素的映射;圖像變量通常由位置(平面或空間坐標(biāo))、長度、大小(粗細(xì))、形狀、方向(角度,斜度)、顏色(色調(diào)、飽和度、亮度)、紋理等構(gòu)成。有的圖像變量有分類性質(zhì),有的有定量性質(zhì)。比如可以用形狀來表示訂單的產(chǎn)品類別、所在地區(qū)等類別屬性,用長度表示訂單利潤、銷售額等定量值。其三,要對各種可視化圖形的應(yīng)用場景有所了解。參考螞蟻數(shù)據(jù)可視化圖表場景分類,應(yīng)用場景主要包括8種情況:比較、趨勢、組成、占比、分布、排名、關(guān)系、空間[16]。比如折線圖可以用來比較、趨勢分析,堆疊面積圖有比較、趨勢和組成分析的應(yīng)用等。
根據(jù)Lee的研究,測試圖形選擇需綜合考慮可視化圖表普及性以及測試對象對圖表教育的熟悉程度[6]。根據(jù)國內(nèi)情況,并咨詢高中、大學(xué)學(xué)科教師,本文選取折線圖、條形圖、堆疊條形圖、餅圖、散點圖、直方圖、面積圖、堆疊面積圖、氣泡圖、瀑布圖、熱圖、矩形樹狀圖作為知識測試題項。題項重點考查測試者對基本圖形中的數(shù)據(jù)類型、圖形符號和圖形變量的認(rèn)知。題項描述盡量不出現(xiàn)可視化的專業(yè)詞匯,用通俗易懂的文字描述,回答采用對錯或者單項選擇方式??紤]到后面可視化技能測試,為節(jié)約篇幅,我們把知識和技能題項合并在一起,見表3所示。
表3 可視化基本知識與讀取理解技能題項
3.2.1可視化圖形的讀取和理解技能
Bertin提出用3個層次來解釋圖形:初級、中級和綜合。初級是從可視化圖表中簡單地提取信息。中級涉及趨勢和關(guān)系的檢測。綜合層面是對整體結(jié)構(gòu)的比較及基于數(shù)據(jù)和背景知識的推論[4]。Boy提出了6種初中級讀取任務(wù):最大值、最小值、變化量、交點、平均值、比較值[5]。B?rner數(shù)據(jù)可視化素養(yǎng)框架中把任務(wù)分為7種:分類/聚類、排序、分布(包括特異值)、比較、趨勢(過程和時間)、成分、相關(guān)性/關(guān)系,這些任務(wù)以中高級任務(wù)為主[7]。結(jié)合可視化應(yīng)用場景,本文采用9種基本測試任務(wù):檢索、比較、占比、排序、分布(異常)、分類、關(guān)系、趨勢、預(yù)測。其中檢索、比較、占比、范圍、分布屬于初級,關(guān)系、趨勢屬于中級,預(yù)測屬于高級。表3是對常用圖形給出了相關(guān)的知識與技能的測試題項,要求測試者進行對錯或者單項選擇。
3.2.2可視化呈現(xiàn)能力
可視化呈現(xiàn)能力是數(shù)據(jù)域到圖形域的轉(zhuǎn)換能力。題項設(shè)計主要側(cè)重考察測試者能否找到合適的圖形與任務(wù)場景中的數(shù)據(jù)進行匹配。從可視化基礎(chǔ)知識可知,不同的可視化呈現(xiàn)由不同數(shù)據(jù)類型構(gòu)成,應(yīng)用的場景也是完全不同的。比如要觀察定序數(shù)據(jù)(時間)和數(shù)值型數(shù)據(jù)變化時常用的圖形是折線圖和面積圖,如果選擇散點圖就不適合,因為散點圖用于觀察2~3個數(shù)值型數(shù)據(jù)之間的關(guān)系,若選擇用條形圖、餅圖、氣泡圖就更不能完成任務(wù)要求了。咨詢高中教師,根據(jù)大學(xué)新生對圖表的熟悉程度,設(shè)計如下題項:Q64、若想了解中國自2000年以來每年GDP變化趨勢,用哪個圖形呈現(xiàn)比較好;Q65、若想了解中國各省市自治區(qū)2019年GDP情況,用哪個圖形呈現(xiàn)較好;Q66、如果想了解一個人體重和高度是否存在一定的關(guān)系,用哪個圖形呈現(xiàn)較好;Q67、如果想要描述一個家庭全年各種支出占比情況,用哪個圖呈現(xiàn)較好;Q68、比較男女同學(xué)語文、數(shù)學(xué)、外語三科平均分情況,用哪個圖呈現(xiàn)較好;Q69、描述2000年后,每年居民收入、支出、存款趨勢,用哪個圖呈現(xiàn)較好;Q70、要了解全班同學(xué)每分鐘跳繩個數(shù)情況,用哪個圖呈現(xiàn)較好。Q64-Q70題項,分別了解測試者對常用的折線圖、散點圖、條形圖、堆積條形圖、餅圖、面積圖、堆積面積圖、直方圖的應(yīng)用能力,涵蓋了比較、占比、排序、分布(異常)、分類、關(guān)系、趨勢等任務(wù)場景。題項回答用單項選擇或者對錯形式進行。
3.2.3數(shù)據(jù)可視化軟件應(yīng)用能力
數(shù)據(jù)可視化軟件大致分兩類:一類是不需要編程能直接使用的,另一類是作為工具庫,需通過編程使用。對于非專業(yè)人員,如果能掌握一些主流的非編程數(shù)據(jù)可視化軟件對數(shù)據(jù)可視化能力提升會有助推作用。數(shù)據(jù)可視化軟件應(yīng)用能力設(shè)計兩個題項:Q71、RAWGraphs、ChartBlocks、Tableau、Excel、Power BI、QlikView、Echarts、Plotly、Google Charts、AntV這些可視化軟件,你聽說過的有幾款( ),如果你還知曉的是其他數(shù)據(jù)可視化軟件,請列出它們( ),你平時需要圖表制作時,常用的軟件是( );Q72、你對知曉的可視化軟件的熟練程度( )。題項Q71主要詢問測試者對主流數(shù)據(jù)可視化軟件知曉程度,該題項采用選擇題回答,同時給予測試者開放的回答,知曉軟件越多,說明測試人員對可視化工具越熟悉。題項Q72采用五級里克特量表對熟練程度進行回答。
3.3數(shù)據(jù)可視化相關(guān)的通用能力題項設(shè)計
各種素養(yǎng)的訓(xùn)練最終是為了提高通用能力。數(shù)據(jù)可視化素養(yǎng)培育和提升最終會在學(xué)生的空間感、反應(yīng)速度、邏輯思維、學(xué)習(xí)能力、觀察能力、解決問題能力、表達能力這些通用能力上得到體現(xiàn)。題項Q73-Q75主要考察測試者是否能把數(shù)據(jù)可視化與日常學(xué)習(xí)、與人溝通、困難問題解決進行結(jié)合,提高任務(wù)完成的效率。具體如下:Q73、平時,在學(xué)習(xí)(課堂教學(xué)、課后作業(yè)、論文寫作)中是否用圖形、圖像這些可視化工具;Q74、當(dāng)你解決問題遇到困難時,是否會用一些圖形、圖像或者可視化工具來幫助打開思路;Q75、當(dāng)你和別人溝通有問題時,是否會借助一些圖形、圖像或者其他可視化工具。測試者采用幾乎不、非常少、一般、比較多、經(jīng)常五級里克特回答。
3.4.1數(shù)據(jù)可視化意識
數(shù)據(jù)可視化意識主要是指測試者能夠意識到可視化圖表已在大數(shù)據(jù)社會下被廣泛使用,可視化呈現(xiàn)在新聞報道、社會媒體、公共場所、政府工作、企業(yè)運營中隨處可見,可視化已經(jīng)和文字、聲音一樣成為基本的信息來源渠道。同時能意識到,要讀懂和理解可視化圖表需要一定的知識和技能訓(xùn)練,數(shù)據(jù)可視化能力和讀寫、算術(shù)一樣,只有通過學(xué)習(xí)與實踐才能提升。設(shè)計題項Q76-Q78如下:Q76、我感覺到可視化呈現(xiàn),如折線圖、柱狀圖、直方圖、餅圖、散點圖、氣泡圖、樹形圖、地圖等在新聞、媒體、公共場所中越來越隨處可見;Q77、通過可視化呈現(xiàn),我可以像文字、聲音一樣獲得信息;Q78、讀懂可視化呈現(xiàn)需要像讀寫、算術(shù)一樣進行訓(xùn)練和學(xué)習(xí)。題項回答用“完全同意”“同意”“不一定”“不同意”“完全不同意”五級里克特量表進行選擇。
3.4.2與數(shù)據(jù)可視化相關(guān)的安全和法律道德安全和法律道德主要考察測試者面對可視化圖形、圖像時是否有較高的網(wǎng)絡(luò)安全意識和知識產(chǎn)權(quán)意識。設(shè)計題項Q79、Q80如下:Q79、當(dāng)你用圖形、圖像在和別人交流或在網(wǎng)絡(luò)上發(fā)布的時候,是否意識到圖形、圖像蘊含大量的數(shù)據(jù)信息,有安全隱患;Q80、當(dāng)你在下載和應(yīng)用別人的圖形、圖像作品時候,是否認(rèn)為它們有知識產(chǎn)權(quán)的保護,要注意法律問題。題項回答均采用五級李克特回答。
本文用專家調(diào)查法對量表進行內(nèi)容效度檢測,內(nèi)容效度一般用內(nèi)容效度比、效度系數(shù)指標(biāo)來整體衡量[17]。內(nèi)容效度比(Content Validation Ratio)用CVR來表示,當(dāng)CVR為負(fù)值時候,說明認(rèn)同題項內(nèi)容合適的專家不足一半,一般要把CVR<0題項刪除或者重新出題。CVR值越靠近1,說明量表的效度越好。效度系數(shù)用B來表示,B值越接近0,表明各個專家對題項效度的認(rèn)識越趨向一致,指標(biāo)體系的有效性就越高。
表4是本文邀請的10位專家對量表內(nèi)容效度打分情況,考慮到篇幅只顯示了部分。表中Q34題的CVR值是-0.4,值小于0,此題需重新出題。Q34題是對面積圖的可視化知識進行測試,專家認(rèn)為要突出面積圖中的面積概念,故改為“11月用電量大于1月份用電量,是否意味著11月區(qū)間面積要大于1月區(qū)間面積”。表4的其他所有題項的CVR值均大于0,說明專家對這些題項認(rèn)同度高。量表整體CVR=0.91,量表內(nèi)容效度能很好符合框架各維度的含義,另外,效度系數(shù)B=0.08,專家認(rèn)知基本趨于一致。
表4 數(shù)據(jù)可視化素養(yǎng)量表內(nèi)容效度分析(部分)
同時,對該校2021級信管專業(yè)新生進行測試,獲取量表的克隆巴赫信度系數(shù),總體Alpha系數(shù)為0.891,大于0.6,說明量表具有較好的信度。
本文提出了基于KSAO模型的數(shù)據(jù)可視化素養(yǎng)框架,依托此框架,結(jié)合大學(xué)新生的特點,開發(fā)數(shù)據(jù)可視化素養(yǎng)量表,該量表具有較好的內(nèi)容效度和信度。后面將用此量表對學(xué)校新生進行測試和評估,通過總體和各維度得分分析,可以獲得當(dāng)前大學(xué)新生的數(shù)據(jù)可視化素養(yǎng)現(xiàn)狀,能對未來的數(shù)據(jù)可視化教學(xué)給與指引。面向大學(xué)新生的量表設(shè)計思路給各種場景的數(shù)據(jù)可視化能力測試提供了一種路徑。我們可以按照專業(yè)特點、學(xué)生分類、職業(yè)分類和數(shù)據(jù)可視化素養(yǎng)框架進行結(jié)合開發(fā)各種有針對性的量表。根據(jù)量表的測試分析,可以為后續(xù)的數(shù)據(jù)可視化課程體系、培訓(xùn)內(nèi)容、教育模式、教學(xué)方法給提供有價值的指導(dǎo)。