王 奕 張 靜 王正興
(1.南京特殊教育師范學(xué)院圖書館 南京 210038;2.中國藥科大學(xué)圖書館 南京 210009;3.江蘇海洋大學(xué)圖書館 連云港 222005)
當(dāng)今信息時(shí)代,世界在追蹤多樣化的人類信息活動(dòng)。人們的行為和偏好被用許多方式獲取,并以數(shù)據(jù)的方式記錄。在給定的數(shù)據(jù)運(yùn)用賦權(quán)范圍內(nèi),對大量數(shù)據(jù)的理解和分析,可以影響到個(gè)人和社會(huì)生活的所有領(lǐng)域決策,特別是在知識創(chuàng)新、科學(xué)創(chuàng)造的數(shù)據(jù)學(xué)術(shù)和情報(bào)分析活動(dòng)中發(fā)揮著重要的作用。
人類信息活動(dòng)過程中產(chǎn)生的數(shù)據(jù)理解和分析,尤其是通過數(shù)據(jù)間的交互、融合而產(chǎn)生新的知識信息是數(shù)據(jù)科學(xué)的前沿領(lǐng)域,其中最大的挑戰(zhàn)是因生態(tài)系統(tǒng)的復(fù)雜性帶來的數(shù)據(jù)產(chǎn)生、收集、編輯和使用[1]問題。這是因?yàn)樯鷳B(tài)系統(tǒng)中的數(shù)據(jù)收集、編輯和用戶需要存在多人甚至群體參與的復(fù)雜場景,其“場景制作”要求與單一個(gè)人的數(shù)據(jù)制作的情況是不同的,它的復(fù)雜性引發(fā)了如何促進(jìn)對大量數(shù)據(jù)的操作、分析,理解的問題。如果不能解決對數(shù)據(jù)的理解,人們就無法與數(shù)據(jù)交互,必然影響到個(gè)人和組織充分利用這些數(shù)據(jù),更談不上數(shù)據(jù)價(jià)值的挖掘和增值。知識信息創(chuàng)新、數(shù)據(jù)情報(bào)分析、科學(xué)信息利用、復(fù)用、再生使用,呼吁在海量數(shù)據(jù)分析的基礎(chǔ)上研究人們?nèi)绾闻c數(shù)據(jù)交互,由此,在人-機(jī)交互(HCI)基礎(chǔ)上的一個(gè)新的研究領(lǐng)域“人-數(shù)交互”(human-data interaction HDI)研究正在興起( HDI目前尚無公認(rèn)的中文譯名,本文僅根據(jù)其含義譯作“人-數(shù)交互”)。
第一篇使用到術(shù)語“人-數(shù)交互”(HDI)的文章發(fā)表在2006年,這是一篇題為《一種用于基因組數(shù)據(jù)中的集群建模、可視化和發(fā)現(xiàn)的可視化統(tǒng)計(jì)數(shù)據(jù)分析器(VISDA)工具》的文章[2],2008年,Simoff等人在介紹可視化數(shù)據(jù)挖掘的書籍中提及術(shù)語HDI[3],2010年,Cafaro 等人在《RFID本地化有形和健全的多用戶交互與博物館展品》中將“人與數(shù)據(jù)的交互”作為關(guān)鍵詞列出,但它沒有明確地在正文中使用。較早定義HDI一詞和相關(guān)概念,并在接下來的幾年中經(jīng)常被引用的出版物主要是Elmqvist[4]和Cafaro[5]的成果。
1.1概念與定義HDI字面意義明確了兩個(gè)關(guān)鍵性概念:一是側(cè)重對“數(shù)據(jù)”的定義,即:“人類信息活動(dòng)過程中產(chǎn)生的數(shù)據(jù)”的交互,二是側(cè)重對“數(shù)據(jù)交互”操作者的定義,即:是“人類通過某種方法主動(dòng)干預(yù)或促成”數(shù)據(jù)交互。由于產(chǎn)生、收集和使用數(shù)據(jù)的環(huán)境不同,以及人們對于數(shù)據(jù)交互的理解與使用的交互方法不同,一些關(guān)于HDI的相關(guān)研究試圖解釋闡明該領(lǐng)域的目標(biāo)、邊界和前沿,Elmqvist, N.;Cafaro,; Mortier、Hornung等人介紹了問題,討論了概念。這就產(chǎn)生了HDI的幾種概念[6]。
Elmqvist(2011)認(rèn)為HDI指的是“對大型、非結(jié)構(gòu)化和復(fù)雜數(shù)據(jù)集的人為操作、分析和感測”。他提出了一種通過創(chuàng)建物理推理環(huán)境來支持人類數(shù)據(jù)交互的方法[4]。類似的,Cafaro (2012)使用HDI一詞來表示“大型數(shù)據(jù)集中提供個(gè)性化、上下文感知和可理解的數(shù)據(jù)”的問題。他解釋HDI涉及的是“使用體現(xiàn)交互來促進(jìn)用戶探索豐富數(shù)據(jù)集的技術(shù)”[5]。Mortier等人(2013)定義HDI通常涉及人類、數(shù)據(jù)集和分析之間的相互作用……,無論是作為在線系統(tǒng)的用戶還是作為數(shù)據(jù)收集的對象,HDI都是對我們(個(gè)人或集體)決策以及采取的行動(dòng)的分析。他們強(qiáng)調(diào),這個(gè)術(shù)語意味著個(gè)人和他們發(fā)出的信號之間的明確聯(lián)系。根據(jù)作者的說法,HDI涉及數(shù)據(jù)和用于分析數(shù)據(jù)的算法,以及數(shù)據(jù)的使用方式和使用者[7]。他們主張HDI側(cè)重于個(gè)人數(shù)據(jù)和開放數(shù)據(jù)。并提出了與數(shù)據(jù)進(jìn)行有意義的交互的三個(gè)關(guān)鍵方面:a.易讀性:涉及使數(shù)據(jù)分析算法對人透明和可理解,涉及數(shù)據(jù)和處理;b.代理:與處理數(shù)據(jù)的能力相關(guān),與處理數(shù)據(jù)的系統(tǒng)相關(guān),使人們有能力控制、通知和糾正數(shù)據(jù)和推論;c.可協(xié)商性:關(guān)注在數(shù)據(jù)方面出現(xiàn)的動(dòng)態(tài)關(guān)系,以及個(gè)人理解和態(tài)度如何隨時(shí)間變化[8]。
1.2特定觀點(diǎn)Hornung等人使用了以人為中心的視角[1]。認(rèn)為HDI除了可能適用于數(shù)據(jù)的法律和監(jiān)管框架外,還涉及社會(huì)規(guī)范的形成。提出HDI的主要目標(biāo)之一應(yīng)該是設(shè)計(jì)交互,使利益相關(guān)者能夠促進(jìn)期望的、并避免不期望的數(shù)據(jù)使用后果。他們認(rèn)為,有必要考慮復(fù)雜的背景因素,包括信仰體系,參與方的價(jià)值觀和規(guī)范?!盀榱四軌蚶斫饨Y(jié)果,甚至設(shè)計(jì)出促進(jìn)或抑制某些結(jié)果的‘?dāng)?shù)據(jù)交互’”。參與方不僅限于直接訪問和使用數(shù)據(jù)的人員,還包括影響和受其使用結(jié)果影響的人員。
Hornung等人還從數(shù)據(jù)生命周期的角度闡明HDI應(yīng)是完整的數(shù)據(jù)生命周期:數(shù)據(jù)源、選擇、清理、映射和顯示。并可根據(jù)符號學(xué)方法[9]提供一些符號學(xué)框架,以推動(dòng)理解數(shù)據(jù)意義的系統(tǒng)過程,包括物理層、經(jīng)驗(yàn)層、句法層、語義層、語用層和社會(huì)層。他們提出,HDI的設(shè)計(jì)問題必須考慮到符號框架中的一個(gè)層、數(shù)據(jù)生命周期中的一個(gè)階段和一個(gè)涉眾的組合。
Locoro豐富了HDI概念,提出了一種區(qū)分不同數(shù)據(jù)狀態(tài)的方法,將其分為三類:a.原始數(shù)據(jù),深深植根于工作實(shí)踐的信息。這些數(shù)據(jù)與衍生數(shù)據(jù)不同,從原始數(shù)據(jù)中產(chǎn)生,目的不同于那些與原始數(shù)據(jù)生產(chǎn)和使用實(shí)踐相關(guān)的數(shù)據(jù)。b.衍生數(shù)據(jù)分為二級數(shù)據(jù)(通過轉(zhuǎn)換和研究生成,使其更適合其特定的專業(yè)解釋)。c.三級數(shù)據(jù)(從二級數(shù)據(jù)轉(zhuǎn)換而成,使其易于使用和有價(jià)值)。后者可用于不可預(yù)測和非結(jié)構(gòu)化的任務(wù),并在信息服務(wù)方面?zhèn)鬟_(dá)給更廣泛的消費(fèi)者群體[10]。
此外,Crabtree提出了一個(gè)愿景,強(qiáng)調(diào)“通過設(shè)計(jì)實(shí)施隱私保護(hù)措施”,要使個(gè)人或群體的數(shù)據(jù)社會(huì)價(jià)值得到保護(hù)、經(jīng)濟(jì)價(jià)值得到回報(bào),就沒必要實(shí)現(xiàn)數(shù)據(jù)監(jiān)管的社會(huì)學(xué)功能,也就沒有什么可監(jiān)管的了[11]。
2020年Eliane Zambon Victorelli等人綜述了上述基本概念與特定觀點(diǎn)[6],并分析認(rèn)為:大多數(shù)時(shí)候,HDI這個(gè)術(shù)語是用人類操縱的辦法來處理大型和復(fù)雜的數(shù)據(jù)集中的數(shù)據(jù)交互問題的。該定義涉及個(gè)性化、語境的上下文識別和理解,并需采用具體的交互方法。這個(gè)術(shù)語的定義帶來了實(shí)際的好處是它鼓勵(lì)數(shù)據(jù)重用、組合和不同人群、不同目標(biāo)共用數(shù)據(jù)協(xié)調(diào)在相關(guān)領(lǐng)域的實(shí)踐,實(shí)現(xiàn)“人-數(shù)交互”的目標(biāo)。他們還滿懷信心地相信:定義HDI術(shù)語另一個(gè)好處是強(qiáng)調(diào)了研究人員和實(shí)踐者從各個(gè)相關(guān)領(lǐng)域?yàn)镠DI設(shè)計(jì)建立一個(gè)更好的基礎(chǔ)框架,服務(wù)于HDI理論研究和實(shí)際應(yīng)用的理解溝通。
根據(jù)上述研究者對的HDI的概念描述和觀點(diǎn)表達(dá),按照定義是“對于一種事物的本質(zhì)特征或一個(gè)概念的內(nèi)涵和外延所作的簡要說明”(參見百度百科“定義”)。本文將HDI定義為:人類通過創(chuàng)建物理推理環(huán)境,在給定的數(shù)據(jù)運(yùn)用賦權(quán)范圍內(nèi),對人類信息活動(dòng)過程中產(chǎn)生的大型、非結(jié)構(gòu)化和復(fù)雜數(shù)據(jù)集中不易理解、不具備自行交互能力的數(shù)據(jù)的主動(dòng)干預(yù)。以人對數(shù)據(jù)的操作、分析和感測,實(shí)現(xiàn)提供個(gè)性化、上下文感知和可理解的數(shù)據(jù)的交互過程。按照“術(shù)語是與某一知識活動(dòng)或領(lǐng)域中的概念相聯(lián)系的詞與詞組。”(參見俄羅斯學(xué)者格里尼奧夫著《術(shù)語學(xué)》,商務(wù)印書館,2011,P25)將HDI定義與術(shù)語“人-機(jī)交互”(HCI)定義:人與計(jì)算機(jī)之間使用某種對話語言,以一定的交互方式,為完成確定任務(wù)的人與計(jì)算機(jī)之間的信息交換過程”(參見百度百科“人機(jī)交互”)對應(yīng),用中文表述HDI為“人-數(shù)交互”。
Eliane Zambon Victorelli等人采取文獻(xiàn)檢索方法,在Web of Science、Scopus、IEEEXplore,ACM數(shù)字圖書館,愛思唯爾科學(xué)指導(dǎo)和施普林格鏈接等數(shù)據(jù)庫中對HDI研究相關(guān)論文與作者進(jìn)行文獻(xiàn)調(diào)研,他們以“人—數(shù)據(jù)交互”作為搜索詞,以2017年5月30日前出版,用英語寫作為條件。通過讀取數(shù)據(jù)庫文章的標(biāo)題,摘要,關(guān)鍵詞,結(jié)論和章節(jié)(必要時(shí)全文)。篩選具有HDI研究信息背景的相關(guān)論文和作者,并提取相關(guān)論文的出版年份、出版物來源和類型(會(huì)議或期刊文章)、作者、研究名稱、論文影響力(谷歌學(xué)者引文)、研究貢獻(xiàn)類型、研究方法、研究背景、應(yīng)用領(lǐng)域、分析問題的類型、對個(gè)人數(shù)據(jù)的看法、數(shù)據(jù)生命周期的各個(gè)階段、研究的結(jié)果類型等10多種文獻(xiàn)形式和內(nèi)容特征,用文獻(xiàn)綜述和可視化分析的方法從研究領(lǐng)域與主題等方面概述了HDI研究進(jìn)展[6],初步勾勒出了“HDI”研究的現(xiàn)狀和趨勢概貌。
2.1研究領(lǐng)域從文獻(xiàn)發(fā)表的期刊看,涉及的主要期刊有《顆粒計(jì)算》《BMC 生物信息學(xué)》《計(jì)算機(jī)和地球科學(xué) 》《人類行為中的計(jì)算機(jī)》《國際生產(chǎn)經(jīng)濟(jì)學(xué)雜志》《口譯》《人工智能》《多媒體工具和應(yīng)用 》《個(gè)人和無處不在的計(jì)算》等等。
從文獻(xiàn)發(fā)表的所在會(huì)議看:有“計(jì)算系統(tǒng)中的人為因素會(huì)議(2017) ”“ 歐洲計(jì)算機(jī)支持合作工作會(huì)議(2015) ”“腦信息學(xué)與健康國際會(huì)議(2014 年)”“ 國際計(jì)算機(jī)信息系統(tǒng)和工業(yè)管理會(huì)議(2015)”“人機(jī)交互國際會(huì)議設(shè)計(jì)和評估、用戶和上下文(2015) ”“走向有意義的互聯(lián)網(wǎng)系統(tǒng)國際會(huì)議(2014)”“社會(huì)意識組織和技術(shù)的影響和挑戰(zhàn)會(huì)議(16) ”“語義網(wǎng)會(huì)議(2017) “等等。
從文獻(xiàn)題名看:有概論性的《人-數(shù)據(jù)交互的挑戰(zhàn)與機(jī)遇》《人與數(shù)據(jù)交互的體現(xiàn)》《交互用戶研究的價(jià)值和質(zhì)量 》《探索開放數(shù)據(jù)的交互性—一種基于實(shí)證的方法》等。有人文社會(huì)科學(xué)領(lǐng)域的《視覺參數(shù)交互(V2PI) 》《從內(nèi)部解讀數(shù)據(jù):通過透視法支持博物館展品中的人與數(shù)據(jù)交互 》《了解、發(fā)現(xiàn)、獲取—在國內(nèi)環(huán)境中處理和組織音樂》等、經(jīng)濟(jì)與管理領(lǐng)域的《扶持新的經(jīng)濟(jì)參與者:個(gè)人數(shù)據(jù)監(jiān)管和數(shù)字經(jīng)濟(jì)》《物聯(lián)網(wǎng)中的人類數(shù)據(jù)交互:所有權(quán)方面 》,也有自然科學(xué)領(lǐng)域的《通過人類與數(shù)據(jù)的相互作用分析,確定磁性數(shù)據(jù)的有效解釋方法》、還有與醫(yī)療健康相關(guān)的《關(guān)于生物醫(yī)學(xué)信息學(xué)中交互式知識發(fā)現(xiàn)和數(shù)據(jù)挖掘的熱點(diǎn)思想高級教程 》《通過飲食配方交互追蹤健康》等等,可見HDI 研究涉及學(xué)科領(lǐng)域非常廣泛。
另外,從涉及的研究層次看,基礎(chǔ)性研究普遍受到關(guān)注,如與數(shù)據(jù)交互利益相關(guān)者的個(gè)人資料研究[7-8, 12]等,數(shù)據(jù)所有權(quán)和同意研究,具體交互研究,數(shù)據(jù)可視化、挖掘和分析。其次是各領(lǐng)域應(yīng)用研究,如:健康信息學(xué)、城市化與智慧城市、地質(zhì)和石油[13]、博物館等,最后是相關(guān)研究,包括學(xué)習(xí)和教育[14]、圖像處理等[15]。
再從研究的類型看,47種研究成果中,28項(xiàng)為實(shí)證研究, 14項(xiàng)成果為理論研究,15項(xiàng)研究成果是實(shí)證研究與“應(yīng)對挑戰(zhàn)”的對策研究(研究類型有交叉)[6]。
2.2研究主題
2.2.1 基礎(chǔ)性研究主題 a.個(gè)人數(shù)據(jù)研究??偟膩碚f,術(shù)語“個(gè)人數(shù)據(jù)”是指其他人創(chuàng)建的關(guān)于我們的數(shù)據(jù)或我們創(chuàng)建的數(shù)據(jù)[8]。已經(jīng)發(fā)表的論文中,首先,有7篇是關(guān)注這類數(shù)據(jù)產(chǎn)生和收集、以及使用所帶來的隱私和道德相關(guān)問題。強(qiáng)調(diào)要以一種合乎道德和可操作的方式鼓勵(lì)個(gè)人公開自己的數(shù)據(jù)和吸引用戶,從有關(guān)各方之間的對話開始,圍繞易讀性、代理性和可協(xié)商性推進(jìn)個(gè)人數(shù)據(jù)的HDI[8]。作者們還提請注意:一是要保護(hù)高度敏感的個(gè)人數(shù)據(jù)不受未經(jīng)授權(quán)的訪問和損害。特別是個(gè)人信息在與健康相關(guān)的數(shù)據(jù)集中,數(shù)據(jù)隱私和安全保護(hù)尤其重要[16-17]。二是需要開發(fā)社會(huì)模型和數(shù)據(jù)共享機(jī)制,使用戶能夠在這一過程中發(fā)揮積極作用[18]。其次,許多文章對個(gè)人數(shù)據(jù)及其與數(shù)字技術(shù)設(shè)計(jì)的關(guān)系提出了建設(shè)性意見[7]。第三,是圍繞個(gè)人數(shù)據(jù)的發(fā)布,跟蹤和研究用戶在網(wǎng)絡(luò)中的交互[19]。另外,還有4篇文章涉及包括音樂[20]食物和飲食習(xí)慣[21]以及健康相關(guān)的特定類型的個(gè)人數(shù)據(jù)[16-17]。
b.數(shù)據(jù)所有權(quán)和許可研究。有9篇文章涉及到關(guān)于數(shù)據(jù)所有權(quán)的討論。一些作者指出:需要設(shè)計(jì)專門的傳感器,以跟蹤、監(jiān)測人類日?;顒?dòng)產(chǎn)生的數(shù)據(jù)在網(wǎng)絡(luò)上與用戶的交互情況,以解決特定領(lǐng)域數(shù)據(jù)的所有權(quán)問題。例如衛(wèi)生領(lǐng)域[16]學(xué)習(xí)分析[14]或跨部門行為[22]。還有一些作者對屬于團(tuán)體的數(shù)據(jù)進(jìn)行了所有權(quán)討論。包括合作工作產(chǎn)生的數(shù)據(jù)來源分組、管理、談判、授權(quán)和透明度/意識機(jī)制[18],以及數(shù)據(jù)的權(quán)利管理[14]。Chowdhury 和 Dhawan還提出了一些特定情況下的數(shù)據(jù)所有權(quán)模型,比如不同維度的智慧城市下的數(shù)據(jù)所有權(quán)模型[23]、與互聯(lián)網(wǎng)相關(guān)的設(shè)備物聯(lián)網(wǎng)數(shù)據(jù)所有權(quán)模型[24]。此外,還有文章針對有明確的個(gè)人知道或許可的數(shù)據(jù)收集活動(dòng),對改進(jìn)數(shù)據(jù)收集許可提出了有價(jià)值建議[25]。
c.體驗(yàn)式交互研究。數(shù)據(jù)交互的常見主題是沉浸式物理體驗(yàn)交互設(shè)計(jì)。Cafaro等人的研究考慮了一種系統(tǒng)直接由人控制的用戶交互的方法。根據(jù)這種方法,人們成為自己交互的對象, 這一主題推動(dòng)了人類數(shù)據(jù)交互及其定義的進(jìn)一步研究。在體驗(yàn)交互理念的驅(qū)動(dòng)下,HDI被定義為探索體驗(yàn)交互,以方便用戶探索豐富數(shù)據(jù)集的技術(shù)[5]。值得注意的是,其他HDI定義并沒有完全明確這種類型的交互,這個(gè)定義不僅涉及內(nèi)置交互,而且還涉及與數(shù)據(jù)的不同交互形式。一些學(xué)者,研究了體驗(yàn)式交互的不同方面,例如使用被動(dòng)標(biāo)簽(RFID)技術(shù)[26]或增強(qiáng)現(xiàn)實(shí)設(shè)備[27];此外,還研究了輔助交互的相關(guān)設(shè)備,例如有形透鏡或幾何體[5],甚至包括地毯的質(zhì)地和顏色[28]。還有研究者以寓言或手勢隱喻為例,分析從多維度、多視角促進(jìn)交互,以便更容易地學(xué)習(xí)交互方法和提升交互效果[6]。目前這些交互研究的動(dòng)機(jī)和實(shí)驗(yàn)環(huán)境大多發(fā)生在博物館。它們的結(jié)果是體驗(yàn)式交互的設(shè)計(jì)指南。
d.數(shù)據(jù)可視化、挖掘和分析。有12項(xiàng)研究涉及數(shù)據(jù)可視化交互實(shí)現(xiàn)問題。一些研究者提出了支持可視化交互的框架,以促進(jìn)領(lǐng)域?qū)<抑R的整合。其思想是結(jié)合人類智能,幫助實(shí)現(xiàn)精確和有意義的數(shù)據(jù)可視化及建模。這類研究的例子有Zhu等人構(gòu)建的基因組數(shù)據(jù)可視化工具和理解研究[2, 29];Prado等人開發(fā)的科研究數(shù)據(jù)發(fā)布、共享、發(fā)現(xiàn)和重用的工具[30]。此外,Holzinger提出了在復(fù)雜的高維數(shù)據(jù)集(如生物醫(yī)學(xué)數(shù)據(jù))中發(fā)現(xiàn)知識的有用工具[31]。Freitas和Curry以提高數(shù)據(jù)質(zhì)量為重點(diǎn),提出了博物館策展人與數(shù)據(jù)交互的方法,以提高策展效率,減少領(lǐng)域?qū)<以诓哒箶?shù)據(jù)時(shí)的障礙[32]。 Hall等人研究設(shè)計(jì)了一些方法來解決缺乏關(guān)注重要數(shù)據(jù)的能力的問題。例如,將信息可視化技術(shù)與數(shù)據(jù)轉(zhuǎn)換和分析技術(shù)相結(jié)合,幫助因緊急請求而不知所措的風(fēng)險(xiǎn)分析人員發(fā)現(xiàn)相關(guān)數(shù)據(jù)[33]。一些作者研究了適合“外行人”日?;顒?dòng)感官化的數(shù)據(jù)可視化制作。 Pacheco 等人創(chuàng)建了一個(gè)基于位置的增強(qiáng)現(xiàn)實(shí)系統(tǒng),以增強(qiáng)在戶外環(huán)境中具有文化遺產(chǎn)內(nèi)容的HDI[27, 34]。另一方面,Locoro描述了第三方用戶在零星和短期交互中視覺化的適用性需求,并探討如何使可視化能夠適應(yīng)這種需求[10]。還有一些作者討論了用于數(shù)據(jù)可視化的交互式工具的可用性評估。他們強(qiáng)調(diào)信息質(zhì)量及其對洞察力的價(jià)值。Cabitza等人進(jìn)行了一項(xiàng)用戶研究,以評估圖表形式呈現(xiàn)的常見開放式醫(yī)學(xué)專家數(shù)據(jù)集其感知效用是否會(huì)增加[35]。Locoro等人提出了一個(gè)模型來評估信息復(fù)雜性和美學(xué)之間的權(quán)衡,他們的工作衡量了信息圖形的質(zhì)量對信息感知和用戶交互的影響程度[36]。 此外,Leman等人為HDI創(chuàng)建了一種方法,根據(jù)該方法,用戶被嵌入到生成可視化效果的環(huán)境中,對設(shè)計(jì)支持?jǐn)?shù)據(jù)生命周期的交互式數(shù)據(jù)可視化工具和應(yīng)用程序作出了貢獻(xiàn)[37]。而Hornung等人 通過調(diào)查與HCI相關(guān)的數(shù)據(jù)生成、收集、編輯和使用問題,提出了符號學(xué)視角的數(shù)字可視化框架[1]。
2.2.2 應(yīng)用性研究主題 a.健康信息學(xué)。衛(wèi)生部門需要似乎是HDI研究的重要?jiǎng)恿χ?。交互式?shù)據(jù)可視化工具被認(rèn)為是醫(yī)療領(lǐng)域大數(shù)據(jù)分析不可或缺的工具,人們可以通過這些工具,理解復(fù)雜的人類生態(tài)特征、醫(yī)藥、健康數(shù)據(jù)[35]。
b.城市化與智慧城市。HDI的第一篇論文,就是以幾何體和桌面顯示的交互,模擬城市教育規(guī)劃應(yīng)用的實(shí)例。今后,智能城市建設(shè)和服務(wù)仍然是HDI研究的激勵(lì)因素和熱門話題,并且研究通常會(huì)與物聯(lián)網(wǎng)應(yīng)用、公共空間中的傳感器運(yùn)用相關(guān)。當(dāng)人們在公共空間活動(dòng)時(shí),他們必須感到自己的隱私不會(huì)受到侵犯,也就是說,不能以犧牲個(gè)人隱私為代價(jià)實(shí)現(xiàn)智慧城市的預(yù)期目標(biāo)。Chowdhury和Dhawan和Mashhadi還提出了稱為“設(shè)計(jì)隱私”的關(guān)于空間設(shè)備和所有權(quán)模型的建議[24,38]。Cavoukian和CibBA,建議在協(xié)同城市規(guī)劃中使用粒度計(jì)算來提高數(shù)據(jù)的易讀性和增強(qiáng)智慧城市設(shè)施智能。Wilke和Portmann,的關(guān)于智慧城市環(huán)境研究的論文,展示了一個(gè)運(yùn)用自動(dòng)化數(shù)據(jù)處理迭代程序,通過用戶數(shù)據(jù)輸入和交互實(shí)現(xiàn)支持集體決策的案例[39]。
c.博物館。這一領(lǐng)域的研究包括博物館中的人類數(shù)據(jù)交互,側(cè)重于體現(xiàn)人的交互。這個(gè)話題在文章《從內(nèi)部解讀數(shù)據(jù):支持博物館展品的人—數(shù)據(jù)交互》[28]中有詳細(xì)報(bào)道和討論。
由于HDI研究正處于早期研究階段,在基礎(chǔ)、應(yīng)用和相關(guān)三個(gè)層次,基礎(chǔ)性研究主題是當(dāng)前研究熱點(diǎn),應(yīng)用研究尚顯稚嫩,相關(guān)研究亟待展開(本文不作研究主題介紹)。
Eliane Zambon Victorelli等人根據(jù)文獻(xiàn)綜述,結(jié)合可視化分析和對HDI領(lǐng)域的理解,認(rèn)為,目前與HDI研究仍然處于初級階段,在基礎(chǔ)性研究、過程性研究、影響因素研究和應(yīng)用領(lǐng)域拓展上呈現(xiàn)出復(fù)雜的研究挑戰(zhàn),他們整合了一系列開放性的研究挑戰(zhàn)方向[6]。
3.1基礎(chǔ)性研究挑戰(zhàn)
3.1.1 個(gè)人數(shù)據(jù)的易讀性和代理性 個(gè)人資料的概念及其含義已被廣泛討論,但仍有許多問題有待研究。個(gè)人數(shù)據(jù)的HDI提出了研究如何使人們理解數(shù)據(jù)及其含義的必要性。一個(gè)復(fù)雜的挑戰(zhàn)是,如何利用以人為中心的數(shù)據(jù)驅(qū)動(dòng)世界觀,滿足人們了解數(shù)據(jù)本身及其影響的需求[8]。一個(gè)人在某一特定時(shí)間的有效觀點(diǎn)可能不具有另一個(gè)人或另一時(shí)間的相同解釋。為了實(shí)現(xiàn)感知目標(biāo),重要的是如何根據(jù)所考慮的視角變化去以有效視圖的方法理解數(shù)據(jù)。同時(shí),它還與提供的HDI機(jī)制相關(guān),這些機(jī)制應(yīng)該允許用戶通過反饋(交互),影響和修正相關(guān)數(shù)據(jù)的意義演變。未來的挑戰(zhàn)包括設(shè)計(jì)支持?jǐn)?shù)據(jù)編輯和數(shù)據(jù)呈現(xiàn)的機(jī)制,以使用戶能夠在獲得推論的基礎(chǔ)上糾正和改進(jìn)數(shù)據(jù)[8]。Crabtree和Mortier進(jìn)一步的研究建議是:允許以用戶為中心的機(jī)制支持個(gè)人通過積極參與維護(hù)自己的數(shù)據(jù)來自主行動(dòng)。個(gè)人數(shù)據(jù)易讀性的挑戰(zhàn)包括可視化處理器將從數(shù)據(jù)源中獲取什么?必須找到測量或模擬個(gè)人數(shù)據(jù)收集效果的方法,并且必須考慮到此收集的效果可能跨越多個(gè)實(shí)體和多個(gè)時(shí)間段。從其他角度看,應(yīng)該對個(gè)人數(shù)據(jù)發(fā)現(xiàn)進(jìn)行研究,包括元數(shù)據(jù)發(fā)布、消費(fèi)者分析、可發(fā)現(xiàn)性政策、身份機(jī)制和個(gè)人數(shù)據(jù)跟蹤,也包括數(shù)據(jù)共享過程的實(shí)時(shí)連接[18]。
3.1.2 數(shù)據(jù)所有權(quán)模型與價(jià)值 人們通過各種方式收集的數(shù)據(jù)具有經(jīng)濟(jì)價(jià)值,必須由法律和監(jiān)管框架加以考慮。研究界需要通過促進(jìn)相關(guān)行業(yè)和用戶之間的交流來解決數(shù)據(jù)所有權(quán)的微妙問題。 在大數(shù)據(jù)世界里,多樣性和速度,再加上公共空間被人操縱監(jiān)控器,需要討論什么是個(gè)人數(shù)據(jù)及其經(jīng)濟(jì)價(jià)值。用戶必須能夠扮演重要角色。他們應(yīng)該能夠協(xié)商收集到的信息使用權(quán),以推動(dòng)重要決策[24]。同時(shí),考慮到有意或無意共享的數(shù)據(jù),有必要繼續(xù)討論個(gè)人數(shù)據(jù)的概念[40]。需要考慮如何授權(quán)用戶從共享數(shù)據(jù)中獲取價(jià)值的模型。應(yīng)該評估如何讓人們意識到他們正在保護(hù)哪些數(shù)據(jù),他們同意使用哪些數(shù)據(jù),以及可以從他們的數(shù)據(jù)中得出哪些推論。挑戰(zhàn)在于提高用戶的這種意識,同時(shí)尊重分析算法生產(chǎn)者的商業(yè)和經(jīng)濟(jì)利益。需要在不破壞新商業(yè)模式的情況下重新平衡個(gè)人權(quán)利,但要避免經(jīng)濟(jì)力量過度集中在數(shù)據(jù)聚合商手中[7]。 增加和更新的數(shù)據(jù)收集可以改變已經(jīng)做出數(shù)據(jù)許可和所有權(quán)決定的環(huán)境,這需要重新審視和重新整理上下文[8]。重要的是研究如何支持人們在環(huán)境變化時(shí)重新評估他們的決定。需要進(jìn)一步研究支持個(gè)人數(shù)據(jù)所有權(quán)和控制的機(jī)制,包括數(shù)據(jù)源的組織管理、協(xié)商、授權(quán)、透明度/意識機(jī)制和權(quán)限管理[18]。盡管政府和學(xué)術(shù)界都對這一問題進(jìn)行了廣泛的討論,但由于技術(shù)的不斷進(jìn)步,這可能還是一個(gè)持續(xù)的挑戰(zhàn)。隨著新技術(shù)的出現(xiàn),將不得不重新考慮商業(yè)模式,以期既能符合道德規(guī)范,又允許經(jīng)濟(jì)價(jià)值的開發(fā)。
3.1.3 數(shù)據(jù)的語義理解 盡管大量數(shù)據(jù)的易讀性相關(guān)研究取得了有希望的實(shí)際成果,但還需要進(jìn)一步研究,以減少數(shù)據(jù)挖掘的困難和對信息的充分了解,以普及使用和分析數(shù)據(jù)的能力。 為此,需要提高解釋數(shù)據(jù)含義的能力。兩個(gè)或多個(gè)數(shù)據(jù)之間的關(guān)系可能呈現(xiàn)相似或相反的特征,并根據(jù)上下文對相同信息進(jìn)行多種解釋。有必要進(jìn)一步研究,數(shù)據(jù)的豐富語義內(nèi)涵是如何影響數(shù)據(jù)交互和人們的感知的。
3.2過程性研究挑戰(zhàn)
3.2.1 用戶參與交互設(shè)計(jì)過程的參與度 除了允許用戶理解、更正和改進(jìn)數(shù)據(jù)的發(fā)布接受機(jī)制之外,有作者還研究了在設(shè)計(jì)數(shù)據(jù)消費(fèi)環(huán)境的過程中,通過創(chuàng)建可視化或通過動(dòng)態(tài)創(chuàng)建、配置個(gè)性化基于數(shù)據(jù)的產(chǎn)品和服務(wù),以實(shí)現(xiàn)最終用戶參與。挑戰(zhàn)在于確保最終用戶(無論是外行還是專家)有能力使數(shù)據(jù)消費(fèi)空間適合他們,從而滿足他們的需求并提供見解。這就需要以更有價(jià)值的方式提供數(shù)據(jù),并提高最終用戶在數(shù)據(jù)使用周期(就更好的解釋而言)和生產(chǎn)(就質(zhì)量改進(jìn)而言)中的參與度[10]。進(jìn)一步的研究將轉(zhuǎn)向HDI如何支持用戶服務(wù)的協(xié)同創(chuàng)建。在此背景下,HDI應(yīng)提供捕捉用戶對服務(wù)的實(shí)際需求、更好地理解服務(wù)上下文(自動(dòng))和直接參與服務(wù)設(shè)計(jì)(直接反饋)的方法[41]。考慮到利益相關(guān)者的參與是所有設(shè)計(jì)階段的基礎(chǔ),有必要研究有利于人們參與設(shè)計(jì)的設(shè)計(jì)方法,也有利于人們參與設(shè)計(jì)的構(gòu)思和施工步驟,這樣用戶就是數(shù)據(jù)消費(fèi)空間設(shè)計(jì)的合作者。
3.2.2 在數(shù)據(jù)分析中超越人和機(jī)器的限制 理解如何設(shè)計(jì)可視化是很重要的,它允許人們(包括那些沒有受過統(tǒng)計(jì)培訓(xùn)的人)提取各種各樣的信息,并讓用戶遠(yuǎn)離潛在的誤導(dǎo)性解釋。為了使可視化設(shè)計(jì)成功,設(shè)計(jì)者需要知道用戶如何理解可視化信息,以創(chuàng)建數(shù)據(jù)的統(tǒng)計(jì)視圖。研究的目的是了解和尋找彌補(bǔ)人類在視覺數(shù)據(jù)分析方面的局限性的方法。Correll, M.和Newman, G.E根據(jù)視覺系統(tǒng)提取信息(如平均值、變化和趨勢)能力的知識,對可視化設(shè)計(jì)進(jìn)行了探索[42-43]。今后需要在克服統(tǒng)計(jì)數(shù)量的統(tǒng)計(jì)視覺估計(jì)偏差的技術(shù)方面深入研究,同時(shí),數(shù)據(jù)分析應(yīng)該進(jìn)行實(shí)驗(yàn)評估,要評估哪些類型的數(shù)據(jù)交互有助于超越人類在數(shù)據(jù)分析方面的局限性,并使用戶能夠?yàn)樽约簶?gòu)建大量數(shù)據(jù)的統(tǒng)計(jì)視圖,這是一項(xiàng)開放性的挑戰(zhàn)。通常的數(shù)據(jù)分析,預(yù)測函數(shù)的選擇是由自動(dòng)算法執(zhí)行的,這些算法很少能夠很好地捕捉數(shù)據(jù)集的特征。通過計(jì)算機(jī)產(chǎn)生計(jì)算和圖表。 這兩種類型的結(jié)果都有其類型的局限性,應(yīng)加以分析和研究。在某些情況下,觀察數(shù)據(jù)比摘要統(tǒng)計(jì)量更能顯示數(shù)據(jù)集的結(jié)構(gòu)和更清晰的圖像。需要通過創(chuàng)建可用于預(yù)測和促進(jìn)決策的可視化觀測數(shù)據(jù)模型來進(jìn)一步理解信息或數(shù)據(jù),這也從一個(gè)側(cè)面說明了可視化在數(shù)據(jù)分析中的重要性,在HDI研究中,可以通過將這兩種分析結(jié)合、交互的途徑,以協(xié)作的方式為取得最終解決方案作出貢獻(xiàn)。
3.2.3 體驗(yàn)式交互 虛擬現(xiàn)實(shí)(Virtual Reality,VR)支持的三維信息的可視化和復(fù)雜數(shù)據(jù)導(dǎo)航能力在一些科學(xué)應(yīng)用中起到了促進(jìn)作用。虛擬現(xiàn)實(shí)技術(shù)在科學(xué)數(shù)據(jù)可視化方面的一個(gè)優(yōu)點(diǎn)是賦予用戶直觀探索和與環(huán)境交互的自由。盡管如此,在虛擬現(xiàn)實(shí)中,仍有一些與HDI相關(guān)的挑戰(zhàn)需要面對,包括如何與數(shù)據(jù)進(jìn)行恰當(dāng)?shù)慕换?。VR中的數(shù)據(jù)處理和數(shù)值模擬,特別是那些與數(shù)據(jù)、人類認(rèn)知和自動(dòng)化算法的混合相互作用,必須由多學(xué)科人員組成的研究團(tuán)體協(xié)同解決[44]。Shin等人指出的另一個(gè)重要的研究空白是通過采用可穿戴活動(dòng)跟蹤器(WAT)來理解豐富的人類信息交互。有必要確定認(rèn)知、社會(huì)和生態(tài)維度,并解釋用戶、WAT和WAT中包含的信息工具之間的動(dòng)態(tài)關(guān)系[45]。目前對社會(huì)活動(dòng)系統(tǒng)進(jìn)行的研究已經(jīng)涉及這類問題。 2019年Caceffo等人從技術(shù)對人的代理的影響、人類經(jīng)驗(yàn)對技術(shù)的影響和群體社會(huì)互動(dòng)對環(huán)境的影響角度研究了社會(huì)活動(dòng)系統(tǒng)與技術(shù)遞進(jìn)的交互過程問題[46],今后這一領(lǐng)域的研究將向制度設(shè)計(jì)和評估方向推進(jìn)。
3.2.4 完整數(shù)據(jù)生命周期的系統(tǒng)視圖 一些學(xué)者從消費(fèi)的角度廣泛討論HDI,認(rèn)為需要找到一種概念框架,允許各種利益相關(guān)者系統(tǒng)地查看數(shù)據(jù)生命周期內(nèi)數(shù)據(jù)狀態(tài)和變化,從句法、語義甚至是上下文中確定數(shù)據(jù)的作用,得以從社會(huì)層面判斷數(shù)據(jù)使用的意圖和影響。 因此,必須對數(shù)據(jù)的生產(chǎn)、收集、處理和使用進(jìn)行系統(tǒng)的調(diào)查,重點(diǎn)是它們所引起的社會(huì)影響[1]。另外,數(shù)據(jù)的生成、收集、編輯和使用過程,場景可以有很大的不同,在設(shè)計(jì)用于數(shù)據(jù)操作的工具時(shí)必須考慮它們。必須找到設(shè)計(jì)一種方法,以便更好地了解誰是與數(shù)據(jù)交互的人員,誰是這次交互中的其他利益相關(guān)者,以及哪些任務(wù)與數(shù)據(jù)交互的完整場景中涉及的每個(gè)角色相關(guān)。在人機(jī)交互和數(shù)據(jù)可視化領(lǐng)域,有關(guān)于設(shè)計(jì)指南或啟發(fā)式的研究都需從生產(chǎn)到使用的數(shù)據(jù)生命周期的完整視圖。同時(shí)還應(yīng)考慮到數(shù)據(jù)生命周期的各個(gè)階段不是獨(dú)立的,需要了解它們是如何相互影響的。例如,如果數(shù)據(jù)收集階段持續(xù)了很長一段時(shí)間,對已經(jīng)創(chuàng)建并提供給用戶的數(shù)據(jù)可視化產(chǎn)生了什么影響?
3.3影響因素研究挑戰(zhàn)
3.3.1 社會(huì)和文化因素影響考量 HDI的一個(gè)重要因素是判斷模糊性和跨社會(huì)和文化邊界交叉引用術(shù)語的人為因素[12]。重要的是讓用戶能夠理解和參與數(shù)據(jù)的基礎(chǔ)設(shè)施和接口,要從人們認(rèn)識數(shù)據(jù)方式的角度推理并去創(chuàng)建和使用類比類型,并以此為據(jù),決定如何在不同社區(qū)和文化中使用、發(fā)布和分發(fā)個(gè)人數(shù)據(jù)[4]。
3.3.2 決策過程中的數(shù)據(jù)影響 目前,關(guān)于如何評估使用可視化支持決策的有效性的研究很少。一個(gè)關(guān)鍵的挑戰(zhàn)是尋找方法來評估所使用的技術(shù)如何影響所做決策的質(zhì)量。決策往往涉及個(gè)人偏好,而這些偏好本身確實(shí)難以捕捉,這使得決策的質(zhì)量難以衡量[47]。在識別決策質(zhì)量的客觀和主觀指標(biāo)方面需要深入研究。以進(jìn)一步確定評估數(shù)據(jù)的各個(gè)維度如何、在多大程度上影響決策過程的方法,以及它們所傳遞的信息的附加值。
3.4應(yīng)用領(lǐng)域相關(guān)研究挑戰(zhàn)HDI的一個(gè)重要挑戰(zhàn)是研究支持與特定領(lǐng)域的數(shù)據(jù)互動(dòng),重點(diǎn)是這些領(lǐng)域活動(dòng)所需的背景和任務(wù),例如:a.自然語言接口或模式無關(guān)的查詢公式,以支持醫(yī)療保健專業(yè)人員對數(shù)據(jù)過程性質(zhì)量評估,因?yàn)樗鼈兇龠M(jìn)了交互的易用性,這些交互完全集成在特定的工作流中[16];b.HDI對于圖形數(shù)據(jù)庫查詢和結(jié)果分析至關(guān)重要,特別是對于大規(guī)模圖形數(shù)據(jù)的可視化[48]。 c.HDI如何提高大數(shù)據(jù)質(zhì)量,充分支持領(lǐng)域?qū)<液团R時(shí)用戶進(jìn)行數(shù)據(jù)管理。 比如醫(yī)療領(lǐng)域治療活動(dòng)在很大程度上取決于大數(shù)據(jù)背景下突出顯示的規(guī)模和多樣性[22]。
我國圖書情報(bào)界圍繞云計(jì)算和物聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)技術(shù)、圖書館下的大數(shù)據(jù)以及大數(shù)據(jù)應(yīng)用等五個(gè)方面推進(jìn)信息組織研究的數(shù)據(jù)化變革[49]。不同學(xué)科領(lǐng)域的數(shù)據(jù)組織必須根據(jù)其特點(diǎn)采取特定組織方式,才能使數(shù)據(jù)形成用戶需要的情報(bào)和知識,服務(wù)于數(shù)據(jù)運(yùn)用。目前,國內(nèi)外數(shù)據(jù)加工和情報(bào)組織主要沿著完整的數(shù)據(jù)鏈流程,在不同的環(huán)節(jié)采取相應(yīng)的方式處理數(shù)據(jù)關(guān)系。如在數(shù)據(jù)搜集到數(shù)據(jù)整合階段,采取海量文獻(xiàn)信息分析整合技術(shù)、面向?qū)W科信息集成的領(lǐng)域分析數(shù)據(jù)集構(gòu)建方法[50];在數(shù)據(jù)分析階段,采取建模、知識圖譜構(gòu)建和可視化數(shù)據(jù)挖掘方法[51];在知識組織階段,采取本體組織法、集成構(gòu)建法、概念網(wǎng)絡(luò)組織法,知識信息與基礎(chǔ)語義信息融合法[52]。這些方法在不同程度上把數(shù)據(jù)轉(zhuǎn)換為知識,以利情報(bào)服務(wù)機(jī)構(gòu)提供更加有效的數(shù)據(jù)運(yùn)用服務(wù)。但是還面臨著“許多數(shù)據(jù)本身不易理解、數(shù)據(jù)之間不具備自行交互能力,人們無法充分利用這些數(shù)據(jù)”的問題[6]。圖情學(xué)科應(yīng)該關(guān)注這一社會(huì)需求,堅(jiān)守人文傳統(tǒng),重視交叉融合。發(fā)揮人文優(yōu)勢、加強(qiáng)理論創(chuàng)新,積極在以下幾個(gè)方面參與HDI研究。
4.1基礎(chǔ)性概念定義HDI是數(shù)據(jù)在人與機(jī)器的協(xié)同干預(yù)或者參與下的相互作用。要站在圖書情報(bào)學(xué)科立場上,借鑒符號學(xué)、社會(huì)認(rèn)知學(xué)和認(rèn)識論等去理解分析信息和數(shù)據(jù)[53]。從人與人、人與數(shù)據(jù)、數(shù)據(jù)與數(shù)據(jù)之間的交互,實(shí)現(xiàn)數(shù)據(jù)復(fù)用、再生增殖、知識創(chuàng)造角度拓展研究HDI基本問題,豐富現(xiàn)有基本理論成果:a.HDI概念(定義);b.HDI原理,針對不同層級領(lǐng)域數(shù)據(jù)、不同生命周期狀態(tài)數(shù)據(jù)探尋其交互原理;c.HDI要素:數(shù)據(jù)交互環(huán)境(復(fù)雜的背景因素包括信仰體系、參與方的價(jià)值觀和規(guī)范)、數(shù)據(jù)交互施動(dòng)者(數(shù)據(jù)生產(chǎn)者、使用者)、參與交互的數(shù)據(jù)(采集、表示、存儲(chǔ)和數(shù)據(jù)處理邏輯);d.HDI與相關(guān)概念:HDI與知識組織、HDI與數(shù)據(jù)關(guān)聯(lián)、HDI與HCI(人機(jī)交互)、HDI與模型-數(shù)據(jù)交互(MDI)等等。
4.2個(gè)人(團(tuán)體)數(shù)據(jù)的“資源化”對個(gè)人數(shù)據(jù)的研究是 HDI走向人的“支持”和“參與”交互的根本。數(shù)據(jù)生產(chǎn)者的支持是開放科學(xué)政策許可、環(huán)境優(yōu)化的首要環(huán)節(jié),從事知識創(chuàng)新、科學(xué)創(chuàng)造的專家及其群體用戶的參與,是實(shí)現(xiàn)人類與數(shù)據(jù)互動(dòng),使利益相關(guān)者能夠促進(jìn)期望的、并避免不期望的數(shù)據(jù)使用后果[1]的“科學(xué)施動(dòng)”保障。所以需要將個(gè)人數(shù)據(jù)作為 HDI的資源來研究[1]。早在2013年國家社會(huì)科學(xué)基金項(xiàng)目“大數(shù)據(jù)時(shí)代圖書館用戶信息的資源化研究”已經(jīng)涉及[54],需要進(jìn)一步拓展研究:a.個(gè)人(團(tuán)體)基本數(shù)據(jù)研究。對數(shù)據(jù)的產(chǎn)生、收集、處理和使用過程中的個(gè)人和團(tuán)體進(jìn)行數(shù)據(jù)調(diào)查,包括各利益相關(guān)者身份特征、發(fā)現(xiàn)政策、信息消費(fèi)分析等,以便更好地了解誰是與數(shù)據(jù)交互的人員,誰是此交互中的其他涉眾,以及數(shù)據(jù)交互的完整場景中涉及的每個(gè)角色。b.個(gè)人(團(tuán)體)動(dòng)態(tài)數(shù)據(jù)研究。用戶動(dòng)態(tài)數(shù)據(jù)的收集和科學(xué)處理直接決定HDI可能行、可行性和可達(dá)性。在數(shù)據(jù)共享過程中,用戶可能跨越多個(gè)實(shí)體和多個(gè)時(shí)間段形成實(shí)時(shí)連接的行為數(shù)據(jù)[15],需要跟蹤這些數(shù)據(jù),確定有可能經(jīng)過人工數(shù)據(jù)交互產(chǎn)生新知識的那些數(shù)據(jù)的生產(chǎn)者、使用者和再生增殖的施動(dòng)者,重用、復(fù)用者。以便發(fā)現(xiàn)和支持用戶發(fā)起和參與HDI。
4.3數(shù)據(jù)語義理解的“人文化”與技術(shù)HDI的核心問題是通過“人文化”的方式,對那些不易理解和相互之間不具備自行交互能力的數(shù)據(jù)及其數(shù)據(jù)集的“人工干預(yù)”,消彌兩者間交互的“人文”障礙,打通兩者技術(shù)方法的“語義理解”溝通路徑。其研究包括:a.數(shù)據(jù)調(diào)查。搜索、調(diào)查內(nèi)容在語義含混不清的原始數(shù)據(jù)和包含豐富語義的異構(gòu)和非結(jié)構(gòu)化數(shù)據(jù)格式文本或圖像,并分類分析,使得這類數(shù)據(jù)可訪問和處理。 b.數(shù)據(jù)的語義理解的“人文化”研究,選擇不同學(xué)科領(lǐng)域樣本數(shù)據(jù),從多維度、多視角研究,如,兩個(gè)或多個(gè)數(shù)據(jù)之間的關(guān)系可能呈現(xiàn)相似或相反的特征,要根據(jù)上下文對相同信息進(jìn)行多種解釋。以探索數(shù)據(jù)的語義豐富性機(jī)理,并從影響數(shù)據(jù)交互和感知的角度去演繹、推理。探索語義豐富的潛力,提高數(shù)據(jù)的易讀性和集成度,以加強(qiáng)和實(shí)現(xiàn)人類數(shù)據(jù)交互。c.數(shù)據(jù)語義理解技術(shù)研究。嘗試采用單詞計(jì)算方法、感知模型形式推理方法或者粒度分析方法,探討通過語義標(biāo)簽對數(shù)據(jù)進(jìn)行豐富化的預(yù)處理,從原始數(shù)據(jù)中提取相關(guān)信息并使其語義明確[55]。數(shù)據(jù)的語義理解涉及到結(jié)構(gòu)性、半結(jié)構(gòu)性及非結(jié)構(gòu)性數(shù)據(jù),人類認(rèn)知和自動(dòng)化算法的混合相互作用非常復(fù)雜,需要資深領(lǐng)域數(shù)據(jù)專家引領(lǐng)并確認(rèn),圖書情報(bào)界作為知識信息數(shù)據(jù)的組織者、整合者應(yīng)該在這方面主動(dòng)配合,成為數(shù)據(jù)學(xué)術(shù)的參與者、合作者。
4.4數(shù)據(jù)的“多維度”關(guān)聯(lián)路徑與策略在近年來的數(shù)據(jù)科學(xué)研究中,數(shù)據(jù)的語義層研究發(fā)生了很大變化,如資源層的URI,元數(shù)據(jù)記錄層的RDA、DCMI抽象模型、DACS、CCO,詞表層級的RDF詞匯表、簡單知識組織系統(tǒng)SKOS、OWL語言等等[56]。語義網(wǎng)的表現(xiàn)形式關(guān)聯(lián)數(shù)據(jù)的發(fā)布標(biāo)準(zhǔn)也從四星模型升級到七星模型[57];這些都為數(shù)據(jù)的“多維度”關(guān)聯(lián)改善了路徑提供了優(yōu)化策略。參考國外相關(guān)研究進(jìn)展,今后我國圖情界應(yīng)該在以下方面扎實(shí)推進(jìn)HDI路徑與策略研究:a.按照符號學(xué)框架方法下的數(shù)據(jù)層級交互原理分別從物理層、經(jīng)驗(yàn)層、句法層、語義層、語用層和社會(huì)層,設(shè)計(jì)問題并形成推動(dòng)理解各層意義的過程路徑。b.按照不同數(shù)據(jù)生命周期狀態(tài)(階段),分別從原始數(shù)據(jù)、二級數(shù)據(jù)、三級數(shù)據(jù)角度討論策略體系構(gòu)成。c.涉眾的組合。遵循社會(huì)學(xué)的人與人之間的價(jià)值觀趨同為交互條件,計(jì)算機(jī)科學(xué)的人與機(jī)器之間、人與數(shù)據(jù)之間、數(shù)據(jù)與數(shù)據(jù)之間有相互依賴的必要性和可行性為交互條件,并依據(jù)信息科學(xué)的擬人律、輔人律和共生律構(gòu)建策略體系。
4.5數(shù)據(jù)的“可視化”分析與“體驗(yàn)式交互”實(shí)踐“數(shù)據(jù)可視化”分析和“體驗(yàn)式交互”是綜合提高HDI能力的有效工具和方法。本世紀(jì)以來,我國圖情界在利用可視化工具方面,通過把數(shù)據(jù)轉(zhuǎn)化為可以交互的圖形圖像,利用自動(dòng)計(jì)算與緊密耦合可視化交互界面,理解、分析復(fù)雜的數(shù)據(jù)對象,降低了對復(fù)雜數(shù)據(jù)的認(rèn)知壁壘,提高洞察數(shù)據(jù)內(nèi)在規(guī)律的能力,在知識挖掘、知識發(fā)現(xiàn)方面有了長足進(jìn)展,積累了比較豐富的經(jīng)驗(yàn)。今后在HDI研究上應(yīng)更加重視可視化工具運(yùn)用。a.數(shù)據(jù)分析可視化。借助功能強(qiáng)大的可視化數(shù)據(jù)分析平臺(tái),將比較分散、數(shù)據(jù)結(jié)構(gòu)有可能不統(tǒng)一的、不易理解的數(shù)據(jù)輔以人工操作,將數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,做出完整的分析圖表,展示數(shù)據(jù)分析的過程和數(shù)據(jù)鏈走向,盡量滿足數(shù)據(jù)在信息系統(tǒng)中有良好的交互性特征,為HDI奠定運(yùn)作基礎(chǔ)。b.可視化數(shù)據(jù)“人文化”分析。了解和尋找彌補(bǔ)人類在視覺數(shù)據(jù)分析方面的局限性的方法,以克服概念模型和可視化圖表統(tǒng)計(jì)數(shù)量的統(tǒng)計(jì)視覺估計(jì)偏差。在體驗(yàn)式交互實(shí)踐方面,我國圖情界還未涉及,需要尋求多種技術(shù)方法推動(dòng)數(shù)據(jù)交互場景構(gòu)建,關(guān)注運(yùn)用虛擬(增強(qiáng))現(xiàn)實(shí)技術(shù)的在體驗(yàn)式互動(dòng)中運(yùn)用的進(jìn)展及其對HDI的作用,創(chuàng)造條件投入HDI增強(qiáng)現(xiàn)實(shí)體驗(yàn)。
4.6HDI影響因素?cái)?shù)據(jù)多樣性源于跨領(lǐng)域研究對應(yīng)的研究方法的廣泛性,更因?yàn)閿?shù)據(jù)來源的多樣性,因此,研究環(huán)境的很多因素都會(huì)影響到數(shù)據(jù)來源、記錄和表現(xiàn)形式[54]影響事物何時(shí)以及如何轉(zhuǎn)換為數(shù)據(jù)的因素包括兩大類,其中,第一類因素是學(xué)者與數(shù)據(jù)起源的距離,包括數(shù)據(jù)源source和數(shù)據(jù)資源resource,元數(shù)據(jù)以及數(shù)據(jù)溯源provenance,第二類因素是影響事物轉(zhuǎn)換為數(shù)據(jù)的外部影響因素,包括經(jīng)濟(jì)學(xué)與數(shù)據(jù)價(jià)值、數(shù)據(jù)產(chǎn)權(quán)以及倫理觀、互動(dòng)理論與方法。因此,a.需要研究數(shù)據(jù)從起源到使用之間的距離,即從時(shí)間、地點(diǎn)、背景、方法、理論、語言和專業(yè)知識維度去“度量”這個(gè)“信息距離”[58](當(dāng)然還包括合作者之間的地理距離),并從元數(shù)據(jù)、數(shù)據(jù)溯源和分類機(jī)制等角度研究數(shù)據(jù)內(nèi)部的HDI。b.外部影響因素研究,一是數(shù)據(jù)的價(jià)值研究,包括數(shù)據(jù)如何、 為何具有社會(huì)價(jià)值,數(shù)據(jù)如何、為何以及能否成為經(jīng)濟(jì)商品。二是數(shù)據(jù)產(chǎn)權(quán)與倫理與情景之間的關(guān)系,三是研究跨社會(huì)、學(xué)科和文化邊界交叉引用數(shù)據(jù)的人為判斷模糊性[18]因素,探索新的思考和理解數(shù)據(jù)的方式,使用戶能夠理解和參與HDI。
4.7多領(lǐng)域探索的應(yīng)用性研究在國外,HDI研究正不斷拓展學(xué)科領(lǐng)域和應(yīng)用范圍。目前看在醫(yī)藥、健康、智慧城市、智慧公共設(shè)施(博物館、展覽館)、化工、地質(zhì)地理眾多領(lǐng)域都有應(yīng)用嘗試,我國圖情界可以借鑒國外研究:a.選擇一些代表性領(lǐng)域(如中醫(yī)、中藥、中西醫(yī)結(jié)合?;瘜W(xué)化工,有機(jī)與無機(jī)互補(bǔ)),一方面通過數(shù)據(jù)檢索搜索和析出樣本領(lǐng)域數(shù)據(jù)庫中HDI若干實(shí)例(盡管以往學(xué)界主觀上沒有提出HDI,而在用戶的知識生產(chǎn)和科技創(chuàng)新實(shí)踐中客觀上已經(jīng)有HDI成果存在)。另一方面通過田野調(diào)查、走訪請教專家,搜集HDI成功案例,探索其基本規(guī)律。b.在現(xiàn)有領(lǐng)域數(shù)據(jù)庫中按照數(shù)據(jù)組織規(guī)則,提取一批本身不易理解、不具備自行交互能力的數(shù)據(jù)樣本,在HDI路徑和策略引導(dǎo)下,依靠領(lǐng)域?qū)<壹捌淇蒲袌F(tuán)隊(duì)有意識地對樣本數(shù)據(jù)通過數(shù)據(jù)可視化賦予用戶直觀探索和與環(huán)境交互展開HDI實(shí)驗(yàn),實(shí)證。
HDI研究剛剛在起步階段,目前僅在國外刊物上有相關(guān)概念討論和觀點(diǎn)綜述的報(bào)導(dǎo)。只要我國圖書情報(bào)界以大數(shù)據(jù)時(shí)代為背景,以領(lǐng)域數(shù)據(jù)庫為支撐,堅(jiān)持新文科建設(shè)背景下的HDI理論創(chuàng)新、圖書情報(bào)學(xué)科立場上的HDI研究方向、數(shù)據(jù)學(xué)術(shù)視角下的HDI應(yīng)用目標(biāo)、人文數(shù)字理念下的HDI實(shí)踐探索,兼顧技術(shù)理性與人文價(jià)值,兼顧時(shí)代氣息與傳統(tǒng)特色,兼顧本土情境和全球視野[59],就能做到打破數(shù)據(jù)封閉和數(shù)據(jù)局限的傳統(tǒng)模式,全面正確地利用自身產(chǎn)生的數(shù)據(jù),充分合理地利用外界所有的大量相關(guān)數(shù)據(jù),科學(xué)有效地交互各種不易理解的數(shù)據(jù)、服務(wù)于科研和產(chǎn)業(yè)創(chuàng)新,逐步形成“數(shù)據(jù)情報(bào)交互”服務(wù)模式,豐富圖書情報(bào)學(xué)情報(bào)分析和知識服務(wù)理論和方法體系。提升新一代圖書情報(bào)機(jī)構(gòu)信息技術(shù)新能力和繁榮知識服務(wù)新業(yè)態(tài)。