亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)與圖書館信息服務新構想

        2015-02-13 07:41:17吳敏慧廣東省立中山圖書館廣州510110
        圖書館理論與實踐 2015年2期
        關鍵詞:信息服務大數(shù)據(jù)圖書館

        ●吳敏慧(廣東省立中山圖書館,廣州 510110)

        大數(shù)據(jù)與圖書館信息服務新構想

        ●吳敏慧(廣東省立中山圖書館,廣州510110)

        [關鍵詞]大數(shù)據(jù);信息服務;信息產(chǎn)品;圖書館

        [摘要]運用大數(shù)據(jù)的相關關系和核心價值提出圖書館信息服務新構想,針對大數(shù)據(jù)的特征提出應將大數(shù)據(jù)變小,及對大數(shù)據(jù)進行價值提煉,并闡述了圖書館信息服務的新機遇。

        1 大數(shù)據(jù)核心價值及其應用

        (1)大數(shù)據(jù)的核心價值。舍恩伯格認為,大數(shù)據(jù)的核心價值是預測,大數(shù)據(jù)不是要教會機器像人一樣思考,而是把數(shù)學算法運用到海量的數(shù)據(jù)上來預期事情發(fā)生的可能性。[1]大數(shù)據(jù)時代是人工智能、機器學習和數(shù)據(jù)挖掘等技術迅速發(fā)展所驅動的一個歷史進程,這個進程要求我們將信號轉化為數(shù)據(jù),將數(shù)據(jù)分析為信息,將信息提煉為知識,以知識促成決策和行動。正是基于大數(shù)據(jù)的核心價值,2013年3月22日,奧巴馬政府宣布投資2億美元拉動大數(shù)據(jù)相關產(chǎn)業(yè)發(fā)展,將大數(shù)據(jù)戰(zhàn)略上升為國家意志,奧巴馬政府將數(shù)據(jù)定義為“未來的新石油”,積極發(fā)展起如蘋果、谷歌、亞馬遜等一批世界級互聯(lián)網(wǎng)企業(yè)。2013年9月底,百度公司董事長李彥宏在中關村為習近平總書記、李克強總理等中共中央政治局常委講解大數(shù)據(jù),李彥宏認為大數(shù)據(jù)有兩個重要價值,一是促進信息消費,加快經(jīng)濟轉型升級;二是關注社會民生,帶動社會管理創(chuàng)新。

        (2)大數(shù)據(jù)的應用案例。案例一,2012年11月的美國總統(tǒng)大選,眾多政治分析師和專家直到11月6日選舉日仍認為今年美國總統(tǒng)選舉難分勝負,稱民主黨候選人貝拉克·奧巴馬和共和黨候選人米特·羅姆尼旗鼓相當。美國天才統(tǒng)計學家納特·西爾弗(Nate Silver)則在當天稱,奧巴馬將贏得大多數(shù)人的選舉票,可能性90.9%。結果證明西爾弗的英明,奧巴馬所獲選舉人票數(shù)遠超羅姆尼。這次預測中,西爾弗根據(jù)多個數(shù)據(jù)點和大量的計算機建模,對每次民意調查及美國各大電視網(wǎng)給出的選舉預測結果等進行深度統(tǒng)計分析,非常準確地預測了美國50個州的投票勝負,2008年他也猜中了50個州中的49個。他稱,現(xiàn)在有那么多的民意調查數(shù)據(jù),我就是從這堆大數(shù)據(jù)當中挖出自己所要的東西的。[2]

        案例二,熱播美劇《紙牌屋》的高收視率,緣于制作方Netflix(北美最大的付費訂閱視頻網(wǎng)站)通過其網(wǎng)站上的用戶每天超過3000萬條的播放記錄,包括用戶在何時、何地、何種設備上觀看什么內容,用戶給節(jié)目添加的恐怖、必看等個性標簽,并在記錄暫停、倒退、快進、評分、搜索的同時,進行大量截圖,分析用戶在音量、畫面色彩甚至場景選取上的喜好等,然后進行精準運算,預測出美國演員凱文·史派西、美國導演大衛(wèi)·芬奇和BBC出品(英國廣播公司拍攝的電視劇或戲劇)三種元素結合在一起的電視劇產(chǎn)品將會大火特火,由此大獲成功。開創(chuàng)了大數(shù)據(jù)影響電視劇制作的先河,也將大數(shù)據(jù)的概念從技術層面下沉到生活層面。[3]

        2 圖書館信息服務新構想

        利用大數(shù)據(jù)的相關關系,能進一步提高受眾信息反饋的價值,拓展圖書館對受眾分析的廣度和深度,推動圖書館信息服務出現(xiàn)一些方向性調整,如從單向性的專題報告或輿情監(jiān)測向趨勢性預測報告和數(shù)據(jù)驅動型信息專題轉變,規(guī)劃“內容+關系”的圖書館信息服務新構想。

        2.1運用大數(shù)據(jù)的相關關系

        隨著科技的迅猛發(fā)展,人們在數(shù)據(jù)搜集、數(shù)據(jù)傳輸、數(shù)據(jù)存儲及數(shù)據(jù)處理能力等方面都取得了極大的進步,使人們除了可以通過因果關系的方式來認識世界外,還可以根據(jù)海量的數(shù)據(jù)依靠相關性理論來進一步認識世界。所謂“相關性”是指兩個或者兩個以上變量的取值之間存在某種規(guī)律性。例如,如果A和B

        經(jīng)常一起發(fā)生,我們只需要注意到如果B發(fā)生了,就可以預測A也發(fā)生了。這樣即使我們不能直接測量或觀察A,也有助于預測A可能會發(fā)生什么。例如,經(jīng)濟學家巴曙松就曾提出用“榨菜指數(shù)”觀察農(nóng)民工回流和中國城鎮(zhèn)化發(fā)展的觀點,即從關注榨菜銷量(B)的變化來觀察農(nóng)民工(A)的流向變化。這就是說,如果找到某個現(xiàn)象的良好關聯(lián)物,相關關系就可以幫助我們捕捉現(xiàn)在和預測未來。這種通過洞察細微數(shù)據(jù)之間相關性的分析方法,為我們認知世界打開了一扇新的窗戶。按照這樣的思路,未來圖書館信息服務可以在利用常規(guī)數(shù)據(jù)之外,再結合大數(shù)據(jù)之間的相關關系,從原有的靜態(tài)收集數(shù)據(jù)向動態(tài)跟蹤數(shù)據(jù)拓展,提供更加精準的信息服務。大數(shù)據(jù)中的相關關系可成為今后圖書館信息服務新思維、新領域及重點關注的方向,幫助我們走出對直覺、經(jīng)驗、常規(guī)邏輯推斷、因果關系分析等傳統(tǒng)的路徑依賴,拓寬思路飛躍到由大量的、非傳統(tǒng)的數(shù)據(jù)匯集而成的海量數(shù)據(jù)之中,不斷發(fā)現(xiàn)新的關聯(lián)模式。

        2.2關注大數(shù)據(jù)的核心價值

        全球大數(shù)據(jù)權威專家、美國物理學會院士艾伯特—拉斯洛·巴拉巴西認為,建立在相關關系分析法基礎上的預測是大數(shù)據(jù)的核心,有充分的證據(jù)證明,人類行為的93%是可以預測的,人類大部分行為都受制于規(guī)律、模型以及原理法則。他認為,通過找出一個關聯(lián)物并監(jiān)控它,就能預測未來,進而尋找到通往未來的鑰匙。[4]現(xiàn)時網(wǎng)絡的普及和網(wǎng)上強大的功能搜索,造成了人們有問題的第一個想法就是“自己上網(wǎng)查一查”,而不是馬上采取實質性的行動,所以,網(wǎng)上的搜索記錄完全可以成為預測某些事件發(fā)生的有力憑證。

        2014年4月24日第四屆技術開放日上,百度公司正式宣布推出“大數(shù)據(jù)引擎”(該引擎包括開放云、數(shù)據(jù)工廠、百度大腦),將打造一個開放平臺,采取邀請制和免費模式,吸引通信、金融、物流、制造、農(nóng)業(yè)等行業(yè)擁有海量數(shù)據(jù)卻不知如何處理的傳統(tǒng)企業(yè)進駐,為這些公司提供存儲、關聯(lián)、分析大數(shù)據(jù)的能力。據(jù)悉,百度“大數(shù)據(jù)引擎”的開放是漸進式的,目前主要與政府、非政府組織、制造、醫(yī)療、金融、零售和教育等傳統(tǒng)領域率先展開合作。百度公司董事長李彥宏表示,未來會有更多行業(yè)被卷入,而且被卷入的速度越來越快,是一個加速發(fā)展的過程,將產(chǎn)生一場新的工業(yè)革命。

        未來的圖書館信息服務應順應大數(shù)據(jù)的發(fā)展潮流,著重于關注大數(shù)據(jù)的核心價值,從目前描述事件過去狀態(tài)的信息產(chǎn)品、專題報告和輿情研究,向能預測事件未來發(fā)展方向的信息產(chǎn)品延伸轉變。例如,利用大數(shù)據(jù)對疾病爆發(fā)、失業(yè)率、社會情緒、智能交通等進行預測,幫助政府部門提高應急處理能力和安全防范能力。[5]

        3 大數(shù)據(jù)帶來的問題思考

        3.1大數(shù)據(jù)的收集和價值提煉

        大數(shù)據(jù)具有體量大、模式多、速度快、價值總量高但價值密度低的特征,使得傳統(tǒng)的數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)處理方式都不再適用。大數(shù)據(jù)從各種源頭通過不同渠道產(chǎn)生,常包含圖像、視頻、音頻、數(shù)據(jù)流、文本、網(wǎng)頁等不同的數(shù)據(jù)格式,因此其模態(tài)是多種多樣的。面對如此龐雜的數(shù)據(jù),圖書館大數(shù)據(jù)采集必須解決三個問題,一是如何收集大數(shù)據(jù),二是如何將大數(shù)據(jù)變小,三是如何對大數(shù)據(jù)進行價值提煉。

        (1)大數(shù)據(jù)的收集。圖書館大數(shù)據(jù)的數(shù)據(jù)源很廣泛,主要有:圖書館現(xiàn)有內部網(wǎng)各應用系統(tǒng)產(chǎn)生的數(shù)據(jù)(如圖書期刊外借數(shù)據(jù)、數(shù)據(jù)庫檢索動態(tài)數(shù)據(jù)、網(wǎng)站瀏覽量、網(wǎng)頁點擊率、人均瀏覽量、平均訪問時長、受訪域名和頁面、訪客屬性等),也有來自圖書館外互聯(lián)網(wǎng)的數(shù)據(jù)(如社交網(wǎng)絡數(shù)據(jù)及互聯(lián)網(wǎng)上資料)和物聯(lián)網(wǎng)等。但在數(shù)據(jù)源廣泛、數(shù)據(jù)量巨大的背景下,大數(shù)據(jù)決策者必須清楚地確定數(shù)據(jù)采集原則,即能夠采集到的數(shù)據(jù),并不意味著值得或需要去采集它,需要采集的數(shù)據(jù)和能夠采集到的數(shù)據(jù)的“交集”,才是我們確定要去采集的數(shù)據(jù)。

        (2)將大數(shù)據(jù)變小是在不改變數(shù)據(jù)基本屬性的前提下對數(shù)據(jù)進行清洗,在盡量不損失價值的條件下減小數(shù)據(jù)規(guī)模。為此,需要研究大數(shù)據(jù)的抽樣、去重、過濾、篩選、壓縮、索引、提取元數(shù)據(jù)等數(shù)據(jù)變換方法,直接將大數(shù)據(jù)變小,這可看作是大數(shù)據(jù)的物理變化。這時,數(shù)據(jù)分析及信息檢索策略顯得尤為重要。可采用分析主題、找出核心概念、選取規(guī)范化詞組、批量刪除重復無用數(shù)據(jù)、先選用上位詞普選再用下位詞來縮小數(shù)據(jù)范圍的方法。

        (3)對大數(shù)據(jù)進行價值提煉可看作是大數(shù)據(jù)的化學反應,由于大數(shù)據(jù)中包含大量的非結構化數(shù)據(jù),需要進行結構化的解讀和梳理,這時人機的交互分析中人的智慧顯得尤為重要,必須通過群體智慧對數(shù)據(jù)的價值進行發(fā)酵和提煉。信息人員首先要評價數(shù)據(jù)的質量與意義,需要認真考察諸如數(shù)據(jù)來源是否可靠,時效性如何,包含了怎樣的主題,應選擇哪些相關數(shù)據(jù),出于何種目的、采用什么方法收集而來等一系列

        思考與選擇。其次再對數(shù)據(jù)進行處理,去除不必要干擾性的數(shù)據(jù),清理其中的各種誤差,并將來源紛雜、格式各異的數(shù)據(jù)轉換為統(tǒng)一格式,最終確定需要呈現(xiàn)的數(shù)據(jù)信息。[6]

        3.2大數(shù)據(jù)的安全和隱私問題

        現(xiàn)實中,大數(shù)據(jù)已經(jīng)在我們的身邊。當你在互聯(lián)網(wǎng)上檢索閱讀時,搜索引擎公司會記錄你的閱讀檢索習慣,并根據(jù)這些信息自動向你推薦相關廣告;當你在社交網(wǎng)絡上進行言論交流時,這些網(wǎng)站會記錄你的言論;當你駕車上路時,電子導航系統(tǒng)會自動定位并記錄你所到位置的所有數(shù)據(jù)。這些信息安全和隱私問題在大數(shù)據(jù)時代已經(jīng)防不勝防。所以圖書館需要設立一個隱私保護模式,如區(qū)分數(shù)據(jù)用途、規(guī)范數(shù)據(jù)使用者、如何評估潛在風險、如何規(guī)避或減輕潛在的傷害等。因而,圖書館要在充分評估大數(shù)據(jù)風險的基礎上,認真研究從數(shù)據(jù)生成、數(shù)據(jù)收集到數(shù)據(jù)分析應用的數(shù)據(jù)保密問題,確保信息安全。特別是圖書館信息開發(fā)針對的高端讀者群,更要把保護高端讀者隱私問題放在首要位置。

        同時,對已開發(fā)的信息產(chǎn)品,圖書館要建立良好的信息產(chǎn)品保密管理制度,如設置專人專職處理信息和文獻傳遞工作、文檔加密、身份驗證等,以防范無關人員對電子文件非法訪問和隨意改動。對大數(shù)據(jù)的開發(fā),圖書館則應通過制定相關法律法規(guī)來規(guī)范大數(shù)據(jù)開發(fā)利用行為,建立大數(shù)據(jù)使用規(guī)范和安全標準,促使數(shù)據(jù)使用者以負責任的態(tài)度使用數(shù)據(jù),履行保護用戶隱私的責任,加大對信息竊取及篡改的懲罰力度,優(yōu)化大數(shù)據(jù)發(fā)展環(huán)境,以確保數(shù)據(jù)在內部流轉、系統(tǒng)流轉乃至外部流轉的過程中是安全可控的。

        4 大數(shù)據(jù)時代圖書館信息服務新機遇

        4.1大數(shù)據(jù)催生圖書館新職業(yè)

        由于大數(shù)據(jù)的典型特征,圖書館學界在大數(shù)據(jù)時代將催生一批新的專業(yè)技術崗位,如信息數(shù)據(jù)分析師、圖書數(shù)據(jù)分析師等。正如復旦大學計算機研究所所長施伯樂所說,無論是個人、企業(yè)還是國家,誰能更好地抓住數(shù)據(jù)、理解數(shù)據(jù)、分析數(shù)據(jù),誰就能在下一波的社會競爭中脫穎而出,數(shù)據(jù)的知識將成為個人知識結構中的必備要素和基礎。圖書館信息數(shù)據(jù)分析師的數(shù)據(jù)分析能力也必須要從基礎性分析、推測性分析提高到更加成熟的預測性分析上。推測性分析是根據(jù)數(shù)據(jù)的連貫性、概率性、相關類推原則等對事物發(fā)展進行定性推測,目前圖書館大多采用這種定性推測,也就是以信息人員的經(jīng)驗為主觀判斷,對事物的未來發(fā)展作出描述性推測;預測性分析則要善于分析大型的數(shù)據(jù)集以識別其趨勢,并通過建立模型進行預測,發(fā)現(xiàn)數(shù)據(jù)與事物之間的相關關系,從而準確預測事物發(fā)展方向,及時提供解決方案。

        4.2未來信息服務的對策

        未來信息服務的對策,一是加強用戶研究與交互數(shù)據(jù)的利用,對用戶數(shù)據(jù)進行深度分析并建立用戶模型,開展精準服務、知識關聯(lián)服務,提供預測性信息服務產(chǎn)品;二是通過數(shù)據(jù)了解現(xiàn)有的知識服務過程發(fā)生了什么、用戶需要什么服務,利用數(shù)據(jù)對圖書館與用戶的交互關系進行數(shù)據(jù)挖掘、分析和預測可能發(fā)生的信息行為;三是加強數(shù)字資源的整合、分析和挖掘,識別定位高質量信息,為客戶提供解決問題的信息服務;四是將現(xiàn)有成熟的信息采集工作模式與先進的數(shù)學模型結合,實現(xiàn)工作效率的提升;五是關注和融入社交網(wǎng)站,擴大圖書館的受眾面,實時了解讀者的需求,提升圖書館在讀者個人文化生活中的作用和影響。

        總而言之,大數(shù)據(jù)應用技術將是未來圖書館服務創(chuàng)新的重要領域,圖書館界應關注和研究與之相關的技術應用和發(fā)展,建立和完善新型的知識服務模式,提高圖書館在日新月異的科學技術和社會環(huán)境下的競爭力。

        [參考文獻]

        [1](英)維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤譯.杭州:浙江人民出版社,2013.

        [2]王鵬.大數(shù)據(jù)成功預測美國大選[EB/OL].[2012-11-07].http://www.csdn.net/article.

        [3]成雅.大數(shù)據(jù)如何捧紅《紙牌屋》[N].南京日報,2013-09-09(A091).

        [4](美)艾伯特—拉斯洛·巴拉巴西.爆發(fā):大數(shù)據(jù)時代預見未來的新思維[M].馬慧譯.北京:中國人民大學出版社,2012:8.

        [5]陳超.圖書館如何迎接大數(shù)據(jù)時代?[J].圖書館雜志,2014(1):4-7.

        [6]吳敏慧.圖書館政府決策信息采集分析[J].大學圖書情報學刊,2013(3):31-34.

        [收稿日期]2014-04-21 [責任編輯]菊秋芳

        [作者簡介]吳敏慧(1969-),女,館員,廣東省立中山圖書館信息部《文化內參》責任編輯,研究方向:文獻信息開發(fā)。

        [文章編號]1005-8214(2015)02-0014-03

        [文獻標志碼]A

        [中圖分類號]G252;G250.73

        猜你喜歡
        信息服務大數(shù)據(jù)圖書館
        圖書館
        小太陽畫報(2018年1期)2018-05-14 17:19:25
        飛躍圖書館
        公共圖書館科技創(chuàng)新服務探析
        農(nóng)業(yè)高校圖書館專利信息服務研究
        價值工程(2016年29期)2016-11-14 02:28:03
        基于價值共創(chuàng)共享的信息服務生態(tài)系統(tǒng)協(xié)同機制研究
        科技視界(2016年18期)2016-11-03 22:02:50
        微信公眾平臺在高校圖書館信息服務中的應用研究
        科技視界(2016年21期)2016-10-17 19:25:20
        基于大數(shù)據(jù)背景下的智慧城市建設研究
        科技視界(2016年20期)2016-09-29 10:53:22
        去圖書館
        亚洲肥婆一区二区三区| 中文字幕亚洲欧美日韩在线不卡| 国产精品亚洲专区无码web| 亚洲国产精品亚洲高清| 日本午夜剧场日本东京热| 人人爽人人爽人人片av| 国产偷国产偷亚洲清高| 欧美亚洲另类国产18p| 亚洲精品一区二区三区四区久久 | 国产精品国产三级国产a| 国产成人无码a区在线观看视频| 精品国产群3p在线观看| 女人被狂躁c到高潮视频| 久久人人爽人人爽人人片亞洲 | 亚洲av永久综合网站美女| 最新国产熟女资源自拍| 男女做爰猛烈啪啪吃奶动 | 国产亚洲精品美女久久久| 国产成人免费a在线视频| 精品熟妇av一区二区三区四区| 亚洲av迷人一区二区三区| 专干老肥熟女视频网站300部| 精品伊人久久香线蕉| 中文天堂一区二区三区| 精品国产一区二区三区色搞| 精品国产人妻一区二区三区| 在线精品日韩一区二区三区| 久久99免费精品国产| 18岁日韩内射颜射午夜久久成人| 久久婷婷国产剧情内射白浆| 国产西西裸体一级黄色大片| 国产av天堂亚洲av刚刚碰| 亚洲av永久精品爱情岛论坛| 国产亚洲精品A在线无码| 日韩女优一区二区在线观看| 亚洲高清乱码午夜电影网| 夜色阁亚洲一区二区三区| 国产av一区二区三区国产福利| 天堂网站一区二区三区| 日本不卡在线视频二区三区| 亚洲一区不卡在线导航|