洪霞
[摘要]信息和通信技術(shù)的發(fā)展促進(jìn)了信息檢索系統(tǒng)和服務(wù)的升級,也造成了很大的環(huán)境污染和生態(tài)破壞。為了環(huán)境的可持續(xù)發(fā)展,綠色I(xiàn)T和云計(jì)算已經(jīng)成為減少能耗、建設(shè)低碳社會的關(guān)鍵要素之一。綠色檢索系統(tǒng)及其服務(wù)理念可以在減少政府、企業(yè)以及教育和科研機(jī)構(gòu)的信息系統(tǒng)的能耗方面發(fā)揮重要作用。在分析綠色檢索系統(tǒng)面臨的主要挑戰(zhàn)的基礎(chǔ)上,提出了構(gòu)建一個(gè)綠色檢索系統(tǒng)的4個(gè)關(guān)鍵因素:標(biāo)準(zhǔn)化、可共享、可重用以及綠色的用戶行為。
[關(guān)鍵詞] 信息檢索;綠色信息技術(shù);云計(jì)算;綠色信息檢索
1引言
隨著通信技術(shù)和網(wǎng)絡(luò)的發(fā)展,各種搜索引擎已經(jīng)成為人們最常使用的工具,信息檢索工具大大方便了用戶在網(wǎng)絡(luò)或數(shù)字圖書館中尋找知識和信息。但是,這些植根于信息和通信技術(shù)(Information and Communication Technologies,ICT)設(shè)備上的信息檢索系統(tǒng)也造成了很大的環(huán)境污染和生態(tài)破壞[1]。據(jù)國際信息技術(shù)調(diào)研機(jī)構(gòu)估計(jì),人類因使用信息技術(shù)設(shè)備增排的二氧化碳量占到人類二氧化碳總排放量的2%左右,為了維持全球電腦的正常運(yùn)行,人類每年會向大氣層增加排放大約3 500萬噸廢氣[2]。在環(huán)境問題如此日益突出的今天,我們對信息檢索系統(tǒng)的依賴越大,對環(huán)境的不良影響也會越大。因此,探討如何在發(fā)展信息檢索系統(tǒng)的同時(shí)保持環(huán)境的可持續(xù)發(fā)展具有重要的現(xiàn)實(shí)意義。
為了可持續(xù)發(fā)展,在本文的研究中,首先提出綠色信息檢索應(yīng)該是經(jīng)濟(jì)的、環(huán)保的和可持續(xù)發(fā)展的,而綠色信息技術(shù)(或簡稱綠色I(xiàn)T)和云計(jì)算技術(shù)的應(yīng)用有助于綠色檢索系統(tǒng)的構(gòu)建;其次,本文認(rèn)為綠色的用戶行為是構(gòu)建綠色信息系統(tǒng)的條件之一;基于相關(guān)的研究,本文認(rèn)為云計(jì)算和綠色I(xiàn)T在減少信息和通信技術(shù)對環(huán)境的影響方面發(fā)揮著關(guān)鍵作用。在此基礎(chǔ)上,本文提出了構(gòu)建綠色信息檢索系統(tǒng)的4個(gè)要點(diǎn):標(biāo)準(zhǔn)化、可共享、可重用以及綠色的用戶行為。
2文獻(xiàn)述評與理論背景
2.1 綠色I(xiàn)T與云計(jì)算
一般而言,綠色I(xiàn)T可以概括為符合社會進(jìn)步與環(huán)境保護(hù)要求,滿足經(jīng)濟(jì)可持續(xù)發(fā)展而采取的舉措和方案[3]。綠色I(xiàn)T的目標(biāo)是通過采取多項(xiàng)措施,從信息設(shè)備的生產(chǎn)和使用環(huán)境進(jìn)行優(yōu)化,并同時(shí)加大虛擬化和數(shù)據(jù)中心的建設(shè),以期降低信息技術(shù)對環(huán)境的不良影響。
現(xiàn)有的研究發(fā)現(xiàn),云計(jì)算通過共享計(jì)算和網(wǎng)絡(luò)資源減少了經(jīng)濟(jì)和環(huán)境成本,因此被認(rèn)為是實(shí)現(xiàn)綠色I(xiàn)T最合適的選擇之一[4]。云計(jì)算作為一種以服務(wù)的方式提供計(jì)算資源的新型計(jì)算資源組織分配和使用模式,其服務(wù)類型可以分為基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺即服務(wù)(PaaS)、軟件即服務(wù)(SaaS)[5]。不同的服務(wù)類型都涉及不同級別的資源共享,依據(jù)不同的服務(wù)水平,云計(jì)算可以選擇不同的方式共享軟硬件資源和信息,以期達(dá)到合理的經(jīng)濟(jì)和環(huán)境效益。一般而言,云計(jì)算的環(huán)境效益可能來自以下幾個(gè)方面:1)減少服務(wù)器能源消耗。云計(jì)算通過優(yōu)化計(jì)算資源的使用,根據(jù)需求動(dòng)態(tài)劃分或釋放不同的物理和虛擬資源,僅在需要時(shí)使用完全的計(jì)算能力,在不需要時(shí)可以進(jìn)行通過調(diào)度使其休眠,最終減少服務(wù)器的電力能源消耗[6]。2)減少網(wǎng)絡(luò)的能源消耗。云計(jì)算通過網(wǎng)絡(luò)向用戶提供服務(wù),并根據(jù)不同的任務(wù)和服務(wù)類型自動(dòng)控制和優(yōu)化網(wǎng)絡(luò)占用,最大化地減少了網(wǎng)絡(luò)堵塞,從而減少了能源消耗[7]。3)減少終端設(shè)備能源消耗。對于最終用戶而言,云計(jì)算服務(wù)提供者負(fù)責(zé)維護(hù)基礎(chǔ)設(shè)施及軟件平臺,終端用戶一般是通過網(wǎng)頁瀏覽器來獲取資源,而無需關(guān)注通過何種設(shè)備介入資源,因而可以最大幅度降低終端設(shè)備的購置和維護(hù),從而降低了能源消耗[8]。
2.2 云計(jì)算與信息檢索
利用檢索詞“云計(jì)算”與“信息檢索”分別在ISI Web of Knowledge數(shù)據(jù)庫和中國知網(wǎng)(CNKI)數(shù)據(jù)庫進(jìn)行相關(guān)檢索,結(jié)果發(fā)現(xiàn)最早的相關(guān)研究論文發(fā)表于2008年,說明此領(lǐng)域的相關(guān)研究處于起步階段,國外的相關(guān)研究論文共檢索到81篇,國內(nèi)相關(guān)研究論文16篇。此外,相關(guān)研究并不僅局限于云計(jì)算和信息檢索,也包含了云計(jì)算和信息管理、信息檢索和資源共享等多方面。如Basirat和Khan[9]探討了如何使用分布式的模式識別方法進(jìn)行數(shù)據(jù)的云存儲和云檢索;Bales等人[10]討論了使用手機(jī)和其他計(jì)算設(shè)備,尤其是智能手機(jī)進(jìn)行信息訪問和獲取。安俊秀[11]提出了分布式云檢索數(shù)據(jù)存儲方案;付永貴[12]針對云計(jì)算平臺下的信息檢索的特性,提出一個(gè)新的信息檢索模型。
這些研究表明,信息檢索的研究人員越來越多地開始把云計(jì)算作為擴(kuò)展他們研究領(lǐng)域的一個(gè)新機(jī)會。但正如前文所討論的,目前的檢索系統(tǒng)和相關(guān)服務(wù)缺乏對環(huán)境影響的研究,具體來說,就是綠色信息檢索系統(tǒng)和服務(wù)如何能在不同的應(yīng)用環(huán)境下訪問和使用不同形式的數(shù)字信息,并以此來促進(jìn)環(huán)境的可持續(xù)發(fā)展。然而,綠色信息檢索系統(tǒng)研究面臨的主要挑戰(zhàn)是缺乏一個(gè)合適的方法來計(jì)算信息檢索系統(tǒng)和服務(wù)所排放的溫室氣體。
目前對環(huán)境影響評價(jià)使用較多的方法是生命周期評價(jià)分析(Life Cycle Analysis,LCA)方法。然而研究發(fā)現(xiàn),現(xiàn)有的LCA方法還很不成熟,存在模型不成熟、可操作性差等不足[13]。因此,本文的研究將在已有研究的基礎(chǔ)上,結(jié)合Raghavan等人[14]的評價(jià)方法,對綠色檢索系統(tǒng)的環(huán)境影響進(jìn)行分析。
3信息檢索系統(tǒng)對環(huán)境的影響分析
針對LCA方法的缺點(diǎn),Raghavan等人提出了一個(gè)比LCA廉價(jià)、高效的方法,這個(gè)方法能較為方便地評價(jià)互聯(lián)網(wǎng)的能源消耗,以及信息檢索系統(tǒng)和服務(wù)的溫室氣體排放量。該方法認(rèn)為,在對信息檢索的能源消耗進(jìn)行評價(jià)之前,需要評價(jià)兩種能源消耗:1)用于建設(shè)信息檢索系統(tǒng)和服務(wù)所需要設(shè)備的能源消耗,如服務(wù)器、網(wǎng)絡(luò)、路由等;2)數(shù)據(jù)庫和搜索引擎創(chuàng)建的能源消耗,包括數(shù)據(jù)的存儲和維護(hù),以及訪問和獲取、使用數(shù)字信息的各種設(shè)備的能源消耗?;谶@個(gè)判斷,如果要估算一個(gè)信息檢索系統(tǒng)或服務(wù)的能源消耗,需要從以下幾個(gè)方面進(jìn)行評估:1)構(gòu)建和管理信息檢索系統(tǒng)(服務(wù))需要不同的通信設(shè)施和IT設(shè)備,這些設(shè)備的生產(chǎn)和最終回收所需要的能源;2)構(gòu)建和管理信息檢索系統(tǒng)(服務(wù))需要不同的通信設(shè)施和IT設(shè)備,這些IT設(shè)備進(jìn)行網(wǎng)絡(luò)通信所需要的能源;3)構(gòu)建和管理信息檢索系統(tǒng)(服務(wù))需要商業(yè)活動(dòng)、辦公設(shè)備等,這些與此相關(guān)的活動(dòng)所需要的能源;4)用戶訪問信息系統(tǒng)時(shí)需要各種不同的終端設(shè)備,這些終端設(shè)備的制造、維護(hù)和回收處理所需要的能源;5)不同的用戶終端進(jìn)行網(wǎng)絡(luò)通信時(shí)所需要的能源。
將上述的能源消耗累計(jì)就可以估算出一個(gè)信息檢索系統(tǒng)(服務(wù))的能源和環(huán)境成本。很明顯,一方面,隨著系統(tǒng)訪問次數(shù)的增加,每次訪問的固化能(embodied energy)會減??;另一方面,用戶端的能源消耗會隨著用戶數(shù)量的增加而增加。因此,基于這種判斷,我們可以采取一系列措施用于平衡信息檢索服務(wù)的能源消耗,例如,通過使用云計(jì)算模式使服務(wù)器的計(jì)算和網(wǎng)絡(luò)資源的使用最優(yōu)化,然后在客戶端使用較為簡單的終端減少能源消耗,等等。
Raghavan等人的研究發(fā)現(xiàn),互聯(lián)網(wǎng)的能源消耗中有53%是固化能,同時(shí),終端機(jī)器(如臺式電腦、筆記本電腦等)的能源消耗占整個(gè)互聯(lián)網(wǎng)能源消耗的一半左右。也就是說,信息檢索系統(tǒng)和個(gè)人終端是互聯(lián)網(wǎng)能源消耗的主要貢獻(xiàn)者。而云計(jì)算可以減少信息檢索系統(tǒng)的固化能,此外,用戶的行為(如在信息檢索時(shí)選擇的終端類型、檢索的時(shí)長、檢索的行為習(xí)慣等)也會對減少能源消耗有著重要的作用。因此,為了構(gòu)建綠色的檢索系統(tǒng),可以通過云計(jì)算的使用,以及改變用戶習(xí)慣,最終達(dá)到綠色目標(biāo)。
4綠色檢索系統(tǒng)(服務(wù))構(gòu)建
為了減少溫室氣體的排放和能源消耗,在運(yùn)用信息檢索系統(tǒng)時(shí)可以采用以下方法:1)改進(jìn)信息檢索系統(tǒng),使之更為高效,以便在處理檢索、處理和生成檢索結(jié)果的整體時(shí)間減少;2)通過瘦客戶機(jī)的使用,幫助用戶獲取信息的同時(shí)降低能源消耗;3)減少終端用戶設(shè)備的設(shè)計(jì)功耗,通過減少網(wǎng)絡(luò)通信時(shí)長,最終降低能源消耗。此外,基于已有的研究,還可以采用一些通用的方法來構(gòu)建綠色信息檢索系統(tǒng)。在本研究中,我們認(rèn)為推動(dòng)綠色檢索系統(tǒng)構(gòu)建有4個(gè)關(guān)鍵要素,即標(biāo)準(zhǔn)化、共享性、重用性以及綠色的用戶行為。
4.1 標(biāo)準(zhǔn)化
相關(guān)的研究發(fā)現(xiàn),云計(jì)算技術(shù)的優(yōu)勢主要體現(xiàn)在數(shù)字內(nèi)容的創(chuàng)建、組織和處理過程中的標(biāo)準(zhǔn)化。此外,Hargreaves等人[15]在數(shù)字經(jīng)濟(jì)的相關(guān)研究中為支持知識密集型活動(dòng)的創(chuàng)新提出了一些建議,其中關(guān)于標(biāo)準(zhǔn)化的建議,對于信息檢索系統(tǒng)的發(fā)展同樣具有重要的參考作用。因此,以標(biāo)準(zhǔn)化為基礎(chǔ),通過云架構(gòu)的PaaS和SaaS層,利用云計(jì)算技術(shù)遠(yuǎn)程訪問和獲取數(shù)據(jù),將極大地方便信息檢索。同時(shí),相對于本地化數(shù)據(jù)中心的數(shù)據(jù)托管而言,將數(shù)字內(nèi)容移送到云端也將顯著減少溫室氣體的排放。
然而,云計(jì)算這種遠(yuǎn)程接入的真正優(yōu)勢主要體現(xiàn)在以下方面:首先,云端中的數(shù)據(jù)必須使用標(biāo)準(zhǔn)元數(shù)據(jù)格式對各種來源的數(shù)字化信息進(jìn)行處理,以便創(chuàng)建可以檢索的數(shù)字內(nèi)容;其次,標(biāo)準(zhǔn)化模式和工具的使用可以使開發(fā)人員忽略數(shù)字信息的格式,開發(fā)出標(biāo)準(zhǔn)化的信息檢索系統(tǒng)。因此,在開放標(biāo)準(zhǔn)的基礎(chǔ)上,數(shù)字信息創(chuàng)建的標(biāo)準(zhǔn)化將大大地有助于信息檢索的發(fā)展,包括數(shù)據(jù)內(nèi)容的識別、索引以及使用特定的數(shù)據(jù)挖掘工具創(chuàng)建特定領(lǐng)域的使用等方面。
4.2 共享性
在過去的十年中,TREC(文本檢索會議)為共享資源提供了良好發(fā)展契機(jī)。此外,作為TREC的一種新的信息服務(wù)模式,眾包(crowd sourcing)信息檢索成為資源共享的成功案例[16]。同時(shí),云計(jì)算的主要優(yōu)勢體現(xiàn)為共享性。相對于在本地服務(wù)器上對數(shù)據(jù)信息進(jìn)行相互獨(dú)立地檢索,這些不斷涌現(xiàn)的共享技術(shù)和共享檢索標(biāo)準(zhǔn)為降低溫室氣體的排放起到了重要的作用。
目前,對于共享數(shù)據(jù)和檢索標(biāo)準(zhǔn)而言,如何使用開放標(biāo)準(zhǔn)和技術(shù),進(jìn)行不同模式的合作與交流是需要重點(diǎn)研究的問題,也是綠色檢索系統(tǒng)能否成功的一個(gè)重要因素。
4.3 重用性
信息檢索工具和內(nèi)容的重用性在很長的時(shí)間內(nèi)將是信息檢索和數(shù)字圖書館研究領(lǐng)域的一個(gè)研究重點(diǎn)。例如,TREC研究會為了改進(jìn)信息檢索,已經(jīng)對檢索工具和內(nèi)容的重用性進(jìn)行了長時(shí)間的相關(guān)研究。而將云計(jì)算基礎(chǔ)架構(gòu)引入到相關(guān)研究中將大大推動(dòng)研究進(jìn)展,這是因?yàn)?,各種研究數(shù)據(jù)集、索引內(nèi)容以及各項(xiàng)指標(biāo)和工具都可以存儲在云端,方便在各種研究和應(yīng)用開發(fā)活動(dòng)中使用。
顯然,云計(jì)算基礎(chǔ)構(gòu)架有利于數(shù)據(jù)的共享,也有利于綠色檢索的研究。這是因?yàn)檠芯咳藛T不再需要對已經(jīng)建成的數(shù)字資源和應(yīng)用程序進(jìn)行重新設(shè)計(jì)和獲取,同時(shí)也節(jié)約了能源。此外,這些已有的索引、日志數(shù)據(jù)、各種數(shù)據(jù)分析,可以重新利用以進(jìn)行進(jìn)一步的研究,最終有利于減少溫室氣體的排放,也有利于綠色檢索系統(tǒng)的構(gòu)建。
4.4 綠色的用戶行為
在信息化社會中,人類的信息行為是其主要研究領(lǐng)域,同時(shí)也是信息檢索研究的一個(gè)重要方面。此外,任何信息系統(tǒng)(服務(wù))的成敗取決于它如何滿足用戶的信息需求,因此,用戶的行為特征成為信息系統(tǒng)需要考慮的因素。在這個(gè)基礎(chǔ)上,綠色的用戶行為已經(jīng)成為綠色I(xiàn)T的一個(gè)重要組成部分[3],目前已經(jīng)有相關(guān)的研究關(guān)注用戶行為的能源消耗以及用戶行為對環(huán)境的影響[17]。
在氣候變化的背景下,綠色的用戶行為可能意味著一系列與能源使用有關(guān)的行為改變,如生活習(xí)慣、商業(yè)慣例等。此外,正如前文所述,綠色的用戶行為是環(huán)境可持續(xù)發(fā)展的重要推動(dòng)者。已有調(diào)查發(fā)現(xiàn),無節(jié)制的打印浪費(fèi)了大量紙張的同時(shí)也增加了環(huán)境壓力。而云計(jì)算和綠色I(xiàn)T可以在幫助用戶更加方便地訪問和獲取信息的同時(shí),引導(dǎo)用戶獲取信息行為方式的改變。例如iPad、電子書等各種移動(dòng)終端的大量出現(xiàn)既方便了用戶隨時(shí)隨地獲取知識,又減少了紙張打印,最終減少能源消耗。
此外,相對于傳統(tǒng)的信息獲取方式而言,已有研究發(fā)現(xiàn),用戶通過低能耗的終端連接到云端,并訪問和獲取數(shù)據(jù)可以顯著地減少溫室氣體的排放[18]。雖然已經(jīng)取得了一些改變,但是為了綠色信息檢索系統(tǒng)的建設(shè),從而實(shí)現(xiàn)社會的可持續(xù)發(fā)展,還需要對改變用戶信息獲取行為進(jìn)行更多的研究。
5結(jié)語
隨著現(xiàn)代網(wǎng)絡(luò)技術(shù)、設(shè)備的不斷出現(xiàn),促進(jìn)了社會信息化水平的快速發(fā)展,人們對信息系統(tǒng)的依賴程度越來越高,信息檢索已經(jīng)成為我們?nèi)粘I钪忻懿豢煞值囊粋€(gè)組成部分。然而,這也增加了溫室氣體的排放。因此,面向可持續(xù)發(fā)展的低成本、低能耗的綠色檢索已經(jīng)成為未來信息技術(shù)領(lǐng)域面臨的重大挑戰(zhàn)。
為了構(gòu)建和發(fā)展綠色信息檢索系統(tǒng),首先需要知道一個(gè)信息檢索系統(tǒng)中哪個(gè)系統(tǒng)組件或服務(wù)產(chǎn)生多少溫室氣體,然后才可以尋找適當(dāng)?shù)姆绞綔p少這些排放。基于已有的相關(guān)研究,本文認(rèn)為,云計(jì)算和綠色I(xiàn)T在減少信息和通信技術(shù)對環(huán)境的影響方面發(fā)揮著關(guān)鍵作用。通過對標(biāo)準(zhǔn)化、共享性、重用性和綠色的用戶行為的探討,有助于構(gòu)建綠色檢索系統(tǒng)和服務(wù),并最終實(shí)現(xiàn)信息檢索系統(tǒng)的可持續(xù)發(fā)展。
[參考文獻(xiàn)]
[1] Gobinda Chowdhury. Building Environmentally Sustainable Information Services: A Green is Research Agenda[J].Journal of the American Society for Information Science and Technology, 2012, 63(4): 633—647.
[2] IT并非“無煙產(chǎn)業(yè)”環(huán)境保護(hù)呼喚綠色I(xiàn)T[EB/OL]. [2013-04-26].http://www.cioage.com/art/200807/72612.htm.
[3] Jenkin T A, Webster J, McShane L. An Agenda for Green Information Technology and Systems Research[J] .Information and Organization, 2011, 21(1):1—24.
[4] Hayes B. Cloud Computing[J] . Communications of the ACM, 2008, 51(7):9—11.
[5] 李喬,鄭 嘯.云計(jì)算研究現(xiàn)狀綜述[J] .計(jì)算機(jī)科學(xué),2011,38(4):32—37.
[6] Liu J, Zhao F, Liu X, He W. Challenges towards Elastic Power Management in Internet Data Centers [C]//Proceedings of the IEEE International Conference on Distributed Computer Systems Workshops, 2009: 65—72.
[7] 張亞明,劉海鷗.云計(jì)算研究綜述——基于技術(shù)與商業(yè)價(jià)值雙重視角[J] .中國科技論壇,2010(8):126—133.
[8] Cervone H F. An Overview of Virtual and Cloud Computing [J] .OCLC Systems and Services, 2010, 26(3): 162—165.
[9] Basirat A H, Khan A I. Evolution of Information Retrieval in Cloud Computing by Redesigning Data Management Architecture from a Scalable Associative Computing Perspective [J]. Neural Information Processing. Models and Applications, 2010: 275—282.
[10] Bales E, Sohn T, Setlur V. Planning, Apps, and the High-End Smartphone: Exploring the Landscape of Modern Cross-Device Reaccess[J].Pervasive Computing Lecture Notes in Computer Science, 2011(6696):1—18.
[11] 安俊秀.基于服務(wù)器集群的云檢索系統(tǒng)的研究與示范[J] .計(jì)算機(jī)科學(xué),2010,37(7):179—182.
[12] 付永貴.基于云計(jì)算的余弦向量度量法文本檢索模型[J] .情報(bào)科學(xué),2012,30(5):736—739.
[13] 向東,汪勁松,段廣洪.綠色產(chǎn)品生命周期分析工具開發(fā)研究[J] .中國機(jī)械工程,2002,13(20):1760—1764.
[14] B Raghavan, J Ma. The Energy and Energy of the Internet[C]//Proceedings of the 10th ACM Workshop on Hot Topics in Networks. Cambridge, Massachusetts,2011: 1—6.
[15] Hargreaves I. Digital Opportunity: A Review of Intellectual Property and Growth[EB/OL] . [2013-04-26] . http://dera.ioe.ac.uk/16295/1/ipreview-finalreport.pdf.
[16] 郎宇浩.基于長尾理論面向“眾包”的信息服務(wù)模式研究[J].情報(bào)科學(xué),2012,30(10):1545—1549.
[17] JISC. Green ICT: Managing Environmentally Sustainable ICT in Education and Research. Energy Dashboard and User Behavior[EB/OL]. [2013-05-31].http://greenict.jiscinvolve.org/wp/2011/06/30/energy-dashboards-and-user-behaviour/.
[18] Baliga J, Ayre R W A, Hinton K, Tucker R S. Green Cloud Computing: Balancing Energy in Processing, Storage, and Transport [C]//Proceedings of IEEE, 2011, 99(1): 149—167.