亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        倪光南話大數(shù)據(jù)其應(yīng)用:倪光南院士在中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)2013年學(xué)術(shù)年會(huì)主題報(bào)告

        2013-03-18 03:00:24閆城榛
        中國(guó)傳媒科技 2013年15期
        關(guān)鍵詞:數(shù)據(jù)挖掘

        本刊記者 閆城榛

        記者:您認(rèn)為大數(shù)據(jù)指的是什么方面的數(shù)據(jù)?是不是就是用戶的行為數(shù)據(jù)?還是其他方面的數(shù)據(jù)?您認(rèn)為目前哪些才是真正大數(shù)據(jù)的掌握者?為什么?

        倪院士:在大數(shù)據(jù)出現(xiàn)之前,數(shù)據(jù)挖掘方法已在很多企業(yè)中應(yīng)用并取得了很好的效果。那時(shí),數(shù)據(jù)挖掘的對(duì)象主要是企業(yè)數(shù)據(jù)庫(kù)的數(shù)據(jù),這些數(shù)據(jù)往往是在企業(yè)運(yùn)營(yíng)中形成的,一般用關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ),是所謂的結(jié)構(gòu)化數(shù)據(jù)。現(xiàn)在我們所說(shuō)的大數(shù)據(jù),范圍要寬得多,主要是社會(huì)日常運(yùn)作和各種服務(wù)中實(shí)時(shí)產(chǎn)生的數(shù)字?jǐn)?shù)據(jù),如在線搜索、新聞、博客、微博等社交媒體、移動(dòng)電話和短信、熱線電話、電子商務(wù)交易、遙感遙測(cè)數(shù)據(jù)……。這類數(shù)據(jù)大多是所謂的非結(jié)構(gòu)化數(shù)據(jù)(文本、語(yǔ)音、圖像、視頻等等),其中很多是用戶的行為數(shù)據(jù),而運(yùn)營(yíng)商、服務(wù)提供商等等在運(yùn)營(yíng)中掌握了大量數(shù)據(jù),因此他們?cè)诖髷?shù)據(jù)方面具有良好的資源條件。

        記者:大數(shù)據(jù)的應(yīng)用已滲透到各個(gè)行業(yè),因此大數(shù)據(jù)的研究一定要依托于某一特定領(lǐng)域和特定行業(yè)。相較于其他行業(yè),大數(shù)據(jù)應(yīng)用在商業(yè)領(lǐng)域走在了前端,您認(rèn)為為什么會(huì)出現(xiàn)這種現(xiàn)象?真正將大數(shù)據(jù)應(yīng)用起來(lái)需要滿足哪些條件?

        倪院士:如上所述,因?yàn)閿?shù)據(jù)挖掘在大數(shù)據(jù)出現(xiàn)之前早已在商業(yè)領(lǐng)域得到應(yīng)用,所以大數(shù)據(jù)應(yīng)用在這個(gè)領(lǐng)域走在前端是理所當(dāng)然的。不過,隨著大數(shù)據(jù)的發(fā)展,它在非商業(yè)領(lǐng)域的應(yīng)用也發(fā)展很快。例如現(xiàn)在政府部門很重視輿情分析,這就是大數(shù)據(jù)在社會(huì)領(lǐng)域中的應(yīng)用。在這個(gè)領(lǐng)域,真正要將大數(shù)據(jù)應(yīng)用起來(lái),首先是需要打破部門的界線,達(dá)到數(shù)據(jù)的最大程度的共享;然后是發(fā)展大數(shù)據(jù)分析方法,挖掘出隱藏在大數(shù)據(jù)中的規(guī)律;最后還需要分析者的正確解釋和判斷,從中獲得能反映真實(shí)情況的結(jié)論。

        記者:媒體行業(yè)作為文化產(chǎn)業(yè)的重要組成部分之一,正經(jīng)歷著轉(zhuǎn)型與升級(jí)的陣痛期。身處大數(shù)據(jù)時(shí)代,對(duì)擁有大量新聞報(bào)道內(nèi)容數(shù)據(jù),同時(shí)相對(duì)缺乏用戶行為數(shù)據(jù)的傳統(tǒng)媒體而言,是福是禍?對(duì)此您怎么看?如何能夠讓傳統(tǒng)媒體補(bǔ)上用戶行為數(shù)據(jù)這一短板?

        倪院士:現(xiàn)在,傳統(tǒng)媒體正受到網(wǎng)絡(luò)媒體、社交媒體的挑戰(zhàn),有的辦不下去了,余下的也面臨轉(zhuǎn)型升級(jí)的問題。不過傳統(tǒng)媒體不會(huì)就此消失,它仍然有它的價(jià)值。一般說(shuō)來(lái),前者具有權(quán)威性、普適化的優(yōu)勢(shì),后者具有實(shí)時(shí)性、個(gè)性化的優(yōu)勢(shì),兩者將會(huì)共存下去。如何使兩者互相融合,取長(zhǎng)補(bǔ)短,這是需要探索的新問題。

        記者:“棱鏡門”事件的爆發(fā)讓人們更加意識(shí)到大數(shù)據(jù)所面臨著的隱私和數(shù)據(jù)安全的問題。大數(shù)據(jù)想要做到創(chuàng)造價(jià)值最大化還需解決哪些困難?如何解決?

        倪院士:“棱鏡門”事件表明數(shù)據(jù)安全的重要性。由于大量采用進(jìn)口軟硬件,中國(guó)缺乏保障網(wǎng)絡(luò)空間安全的能力,因此今后特別要重視使網(wǎng)絡(luò)系統(tǒng)、信息系統(tǒng)采用自主可控的國(guó)產(chǎn)軟硬件。如果說(shuō),早些時(shí)候,我國(guó)大量采用進(jìn)口裝備是不得已的話,那么,今天繼續(xù)這樣做,那就是觀念問題。實(shí)際上,國(guó)產(chǎn)軟硬件大多已達(dá)到實(shí)用水平,正是因?yàn)槿A為、中興產(chǎn)品的性價(jià)比超過了思科,美國(guó)政府才不得不以安全為由,幫助思科將華為、中興趕出美國(guó)市場(chǎng)。那為什么思科等美國(guó)公司在中國(guó)市場(chǎng)上卻能壓倒中國(guó)公司呢?這主要是崇洋迷外的觀念以及外國(guó)跨國(guó)公司的公關(guān)所致,中國(guó)只有突出信息安全,才能改變這種狀況。

        除了從技術(shù)方面保障數(shù)據(jù)安全外,還需要著手制訂保護(hù)隱私權(quán)的法規(guī)和建立相應(yīng)的機(jī)制,使大數(shù)據(jù)的應(yīng)用不致帶來(lái)不良的副作用。

        倪光南院士在中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)2013年學(xué)術(shù)年會(huì)主題報(bào)告

        編輯整理 閆城榛

        今天我所發(fā)表的觀點(diǎn)僅供參考。

        從商業(yè)智能(BI)到大數(shù)據(jù)

        首先,“大數(shù)據(jù)”的概念在今年可謂炙手可熱。但是,從歷史上來(lái)看,這種基于數(shù)據(jù)的應(yīng)用在過去數(shù)據(jù)挖掘和商業(yè)智能等方面已經(jīng)有了很多成功的案例。

        我在這里舉兩個(gè)大家耳熟能詳?shù)睦印?/p>

        20世紀(jì)90年代沃爾瑪?shù)某泄芾砣藛T分析銷售數(shù)據(jù)時(shí)發(fā)現(xiàn)了一個(gè)令人難于理解的現(xiàn)象:在某些特定的情況下,“啤酒”與“尿布”兩件看上去毫無(wú)關(guān)系的商品會(huì)經(jīng)常出現(xiàn)在同一個(gè)購(gòu)物籃中,并非我們主觀印象中那樣,以為這兩種物品毫無(wú)關(guān)聯(lián)。這樣,他們?cè)谀虿钾浌窀浇胖昧似【?,結(jié)果銷量大幅上升。

        無(wú)獨(dú)有偶,美國(guó)第二大超市Target為了抓住含金量很高的一個(gè)顧客群體——孕婦,通過數(shù)據(jù)挖掘建立了一個(gè)模型,選出了25種典型商品的消費(fèi)數(shù)據(jù)構(gòu)建了“懷孕預(yù)測(cè)指數(shù)”,由此,它能在很小的誤差范圍內(nèi)預(yù)測(cè)到顧客的懷孕情況,從而能早早地把孕婦優(yōu)惠廣告夾雜在其他一大堆與懷孕不相關(guān)的商品廣告中發(fā)出去,有效地招攬了孕婦顧客群。這種優(yōu)惠廣告間接地令一個(gè)蒙在鼓里的父親意外發(fā)現(xiàn)他高中生的女兒懷孕了,一時(shí)轟動(dòng)全美。

        為什么我們今天重視“大數(shù)據(jù)”呢?原因是,大數(shù)據(jù)自出現(xiàn)以來(lái)經(jīng)歷了非常大的發(fā)展.。雖然商業(yè)智能在數(shù)據(jù)的應(yīng)用方面已經(jīng)發(fā)揮了一些作用、產(chǎn)生了一些成果,但是現(xiàn)在我們所說(shuō)的“大數(shù)據(jù)”與之相比,還是有質(zhì)的提高。

        對(duì)此,我將商業(yè)智能和大數(shù)據(jù)從四個(gè)方面進(jìn)行了對(duì)比。第一是數(shù)據(jù)量的大小,我們現(xiàn)在衡量數(shù)據(jù)已經(jīng)不以TB作為等級(jí),而至少是PB,而且我認(rèn)為肯定還會(huì)持續(xù)提高。據(jù)Gartener分析,我們數(shù)據(jù)的年增長(zhǎng)幅度為60%左右,所以我們認(rèn)為這個(gè)標(biāo)準(zhǔn)是與日俱增的。第二,過去我們所說(shuō)的數(shù)據(jù)更多的是結(jié)構(gòu)化的數(shù)據(jù),而現(xiàn)在主要為非結(jié)構(gòu)化信息,如文本、圖形、音頻、視頻、遙感遙測(cè)信息……,而且是實(shí)時(shí)信息,而不是陳舊的歷史數(shù)據(jù)庫(kù)中的內(nèi)容。第三,我們數(shù)據(jù)的來(lái)源已經(jīng)不是單純的企業(yè)交易用的數(shù)據(jù),而主要是社會(huì)日常運(yùn)作和各種服務(wù)中實(shí)時(shí)產(chǎn)生的數(shù)字?jǐn)?shù)據(jù),如在線搜索、新聞、博客、微博等社交媒體、移動(dòng)電話和短信、熱線、電子商務(wù)交易、遙感遙測(cè)數(shù)據(jù)……。第四,大數(shù)據(jù)的應(yīng)用領(lǐng)域已經(jīng)由自然科學(xué)范疇擴(kuò)展至社會(huì)科學(xué)范疇,如經(jīng)濟(jì)學(xué)和社會(huì)學(xué)應(yīng)用、政治政策應(yīng)用等。

        大數(shù)據(jù)的一些特性

        如我剛剛所說(shuō),大數(shù)據(jù)指的不是數(shù)據(jù)庫(kù)中的歷史數(shù)據(jù),而是實(shí)時(shí)數(shù)據(jù),通常指的是幾小時(shí)、幾天、幾星期這種尺度范圍。我要強(qiáng)調(diào)的,大數(shù)據(jù)實(shí)時(shí)性的時(shí)間尺度是和場(chǎng)景有關(guān)的,這種實(shí)時(shí)性容許我們建立一種反饋過程,如果我們制定政策,就能夠通過分析大數(shù)據(jù)隨時(shí)得到反饋,所以這種實(shí)時(shí)數(shù)據(jù)對(duì)于我們政策的制定和通過反饋檢驗(yàn)政策具有很好的效果。

        換句話說(shuō),大數(shù)據(jù)的“實(shí)時(shí)”性并不意味著真正的實(shí)時(shí),而往往是近似的“實(shí)時(shí)”:在一個(gè)相對(duì)短、相對(duì)新的時(shí)間里產(chǎn)生并可資利用;在一個(gè)與場(chǎng)景有關(guān)的短時(shí)期里,即能容許作出響應(yīng),并判定效果的一個(gè)時(shí)間段里(即容許產(chǎn)生一個(gè)反饋過程)產(chǎn)生并可資利用。

        科學(xué)研究的第四范式

        目前大家對(duì)于大數(shù)據(jù)的研究一般認(rèn)為它是一種新的科學(xué)研究范式(方法)。

        科學(xué)研究范式(paradigm)的發(fā)展過程,最早是實(shí)驗(yàn)型科研(Experimental Science),這已有幾千年的歷史了,后來(lái)發(fā)展到理論型科研(Theoretical Science),這也有數(shù)百年的歷史了。近幾十年,隨著計(jì)算機(jī)技術(shù)的發(fā)展,發(fā)展到計(jì)算型科研(Computational Science)。我們可以運(yùn)用計(jì)算機(jī)技術(shù)進(jìn)行仿真、模擬,補(bǔ)充了我們過去實(shí)驗(yàn)方法的不足。比如,核武器的試驗(yàn)、航天飛行器的性能試驗(yàn)等等,不需要真的去做實(shí)驗(yàn),而只需要在計(jì)算機(jī)上面模擬就行了?,F(xiàn)在則推進(jìn)到第四范式——以大數(shù)據(jù)為基礎(chǔ)的數(shù)據(jù)密集型科研(Dataintensive Science)(見圖1)。也就是說(shuō),大數(shù)據(jù)給了我們一種新的科學(xué)研究方法,因?yàn)槟M法仍然需要理論指導(dǎo),比如要有航天飛行器的運(yùn)動(dòng)方程、天氣預(yù)報(bào)的數(shù)學(xué)模型等。但是大數(shù)據(jù)沒有任何的理論指導(dǎo),沒有任何的方程或模型,人們希望通過大數(shù)據(jù)的分析找出新的規(guī)律來(lái)。當(dāng)然,這種新的科學(xué)研究方法是否能像實(shí)驗(yàn)科學(xué)、理論科學(xué)和計(jì)算機(jī)仿真科學(xué)一樣為人類的科學(xué)研究發(fā)揮作用,仍需實(shí)踐和時(shí)間來(lái)證明。

        大數(shù)據(jù)生態(tài)系統(tǒng)

        大數(shù)據(jù)本身有一個(gè)生態(tài)系統(tǒng)(見圖2),從數(shù)據(jù)的來(lái)源來(lái)看,可能來(lái)自于個(gè)人、公共部門和私人部門。數(shù)據(jù)進(jìn)來(lái)以后需要進(jìn)行共享作為數(shù)據(jù)源,最后人們運(yùn)用各式各樣的方法對(duì)數(shù)據(jù)進(jìn)行挖掘和分析以便對(duì)人類的應(yīng)用進(jìn)行指導(dǎo),比如對(duì)突發(fā)事件更快的跟蹤和響應(yīng)、對(duì)危機(jī)性質(zhì)和變化的更好了解、對(duì)需要服務(wù)地區(qū)的準(zhǔn)確定位、對(duì)供求關(guān)系的預(yù)測(cè)能力等等。

        典型的大數(shù)據(jù)處理流程包括:數(shù)據(jù)的獲取和記錄、數(shù)據(jù)的清潔/抽取/標(biāo)注、數(shù)據(jù)的整合/聚類/表達(dá)、數(shù)據(jù)的分析/建模和數(shù)據(jù)解釋等5個(gè)階段。在處理的過程中,異構(gòu)性、規(guī)模、即時(shí)性、復(fù)雜性和隱私權(quán)等問題是大數(shù)據(jù)想要?jiǎng)?chuàng)造價(jià)值所需解決的困難。

        圖1 (來(lái)源:潘柱廷,《攻擊大數(shù)據(jù)》)

        圖2 (圖片來(lái)源:http://www3.weforum.org/docs/WEF_TC_MFS_BigDataBigImpact_Briefing_2012.pdf )

        圖3

        圖4

        大數(shù)據(jù)和云計(jì)算

        我們現(xiàn)在講大數(shù)據(jù)往往和云計(jì)算聯(lián)系在一起,譬如前不久召開的云計(jì)算大會(huì),50%以上的題目將云計(jì)算與大數(shù)據(jù)結(jié)合了起來(lái)。如果說(shuō)大數(shù)據(jù)是一座蘊(yùn)含巨大價(jià)值的礦藏,云計(jì)算則可以被看作是采礦作業(yè)的得力工具;而且,云計(jì)算也是為了解決大數(shù)據(jù)等“大”問題而發(fā)展起來(lái)的技術(shù),沒有大數(shù)據(jù)的需求,云計(jì)算的功用也將得不到完全發(fā)揮。因此,大數(shù)據(jù)與云計(jì)算是相輔相成的。

        對(duì)于大數(shù)據(jù)而言,云計(jì)算的意義不僅在于通過相關(guān)技術(shù)解決各種具體問題,還在于通過云計(jì)算構(gòu)建一種通用、高效和可靠的大數(shù)據(jù)支撐平臺(tái),掌握以數(shù)據(jù)流為中心的系統(tǒng)集成思想,在大數(shù)據(jù)應(yīng)用層面探索更廣闊的內(nèi)涵。

        為了更好地利用大數(shù)據(jù)的價(jià)值,我們需要用一種新的思路來(lái)考慮支撐整個(gè)數(shù)據(jù)處理過程的體系架構(gòu),即把分層的思路從單一系統(tǒng)的架構(gòu)中延展到整個(gè)平臺(tái)范圍,將整個(gè)數(shù)據(jù)處理平臺(tái)按照分層的思路統(tǒng)一規(guī)劃設(shè)計(jì),依據(jù)系統(tǒng)不同組件的物理和邏輯特性在系統(tǒng)范圍內(nèi)分層。

        圖3是一個(gè)基于大數(shù)據(jù)應(yīng)用的云計(jì)算架構(gòu),我們可以看到很多層次。在應(yīng)用層中有很多大數(shù)據(jù)方面的應(yīng)用,它可以從云計(jì)算中獲取各種服務(wù)。

        在大數(shù)據(jù)應(yīng)用的各種技術(shù)中,可視化是一種非常重要的技術(shù)。比如,我們想要評(píng)估每個(gè)國(guó)家的因特網(wǎng)產(chǎn)業(yè)發(fā)展?fàn)顩r,我們用圖表很難清楚地表現(xiàn)世界上眾多國(guó)家和地區(qū),但用可視化技術(shù)就能一目了然。

        關(guān)聯(lián)性分析 發(fā)現(xiàn)異常

        對(duì)大數(shù)據(jù)最重要的是分析數(shù)據(jù)找出規(guī)律。所以,我們需要運(yùn)用很多分析方法將大數(shù)據(jù)中的規(guī)律提取出來(lái),從中找出關(guān)聯(lián)性,發(fā)現(xiàn)異常,尤為重要。

        很多時(shí)候,從新的數(shù)字?jǐn)?shù)據(jù)源提供的數(shù)據(jù)中發(fā)現(xiàn)的關(guān)聯(lián)性會(huì)正確地反映傳統(tǒng)的官方統(tǒng)計(jì),從而能提供更便宜、更快的、近似的預(yù)測(cè)。

        許多新數(shù)據(jù)源的價(jià)值不僅在于它的規(guī)模和速度,還在于它所包含信息的豐富性。在許多情況下,大數(shù)據(jù)不僅是官方統(tǒng)計(jì)數(shù)據(jù)的代替或作為它的近似,而且能對(duì)它進(jìn)行補(bǔ)充,增加深度和細(xì)節(jié)。

        定性的社會(huì)媒體信息越多,越有助于描繪出一個(gè)關(guān)于事件的全貌,便于做出快速響應(yīng)。這里,大數(shù)據(jù)的規(guī)模、速度和數(shù)據(jù)本性的組合具有很大的價(jià)值。

        發(fā)現(xiàn)相關(guān)性只是手段,重要目的是利用相關(guān)性以及其他手段來(lái)發(fā)現(xiàn)人類社會(huì)活動(dòng)的異常,幫助制訂正確的反應(yīng)策略。

        舉個(gè)例子,“Google登革熱趨勢(shì)”利用搜索數(shù)據(jù)近乎實(shí)時(shí)地估計(jì)登革熱在全球的傳播情況。圖5中橙色線條代表實(shí)際病例數(shù)量,藍(lán)色線條代表谷歌中關(guān)于登革熱病案的搜索,我們可以直觀地看到其中的關(guān)聯(lián)性。衛(wèi)生部門發(fā)布報(bào)表常常需要花費(fèi)大量時(shí)間將全國(guó)醫(yī)院、診所的病例搜集起來(lái),這個(gè)過程往往需要花費(fèi)十天半個(gè)月。但是,當(dāng)知道這兩者之間的關(guān)聯(lián)性之后,人們就可以通過搜索情況來(lái)及時(shí)判斷、預(yù)測(cè),究竟這個(gè)傳染病是需要加強(qiáng)控制還是可以暫時(shí)放松。這樣,大數(shù)據(jù)可以用于指導(dǎo)人們對(duì)于傳染病的防御。如圖4所示。

        大數(shù)據(jù)時(shí)代的美國(guó)總統(tǒng)選舉

        上述事例告訴我們。大數(shù)據(jù)對(duì)于社會(huì)政策的制定具有不可小覷的作用。

        美國(guó)總統(tǒng)奧巴馬清楚知道他所身處的已經(jīng)不是那個(gè)“電視機(jī)總統(tǒng)”的時(shí)代。奧巴馬競(jìng)選活動(dòng)經(jīng)理Jim Messina曾說(shuō)過:“我們要用數(shù)據(jù)去衡量這場(chǎng)競(jìng)選活動(dòng)中的每一件事情?!逼┤邕x民的傾向,奧巴馬要知道他的演講要對(duì)誰(shuí)講、講什么問題。

        他的芝加哥競(jìng)選總部還任命Rayid Ghani為“首席科學(xué)家”,此人是埃森哲技術(shù)實(shí)驗(yàn)室的分析性研究帶頭人,新的大數(shù)據(jù)庫(kù)能讓競(jìng)選團(tuán)隊(duì)籌集到比他們?cè)A(yù)料到的更多的資金。

        美國(guó)總統(tǒng)的選舉過程表明,華盛頓那些基于直覺與經(jīng)驗(yàn)決策的競(jìng)選人士的優(yōu)勢(shì)在急劇下降,取而代之的是數(shù)量分析專家與電腦程序員的工作,一位官員說(shuō):“在政治領(lǐng)域,大數(shù)據(jù)的時(shí)代已經(jīng)到來(lái)?!?/p>

        中國(guó)大數(shù)據(jù)的發(fā)展現(xiàn)狀

        和其他國(guó)家一樣,中國(guó)對(duì)大數(shù)據(jù)也予以高度關(guān)注。以南京為例,我們簡(jiǎn)單介紹一下我國(guó)基于大數(shù)據(jù)的智慧城市應(yīng)用實(shí)例。

        智慧南京中心綜合運(yùn)行管理平臺(tái)(一期)是江蘇省郵電規(guī)劃設(shè)計(jì)院聯(lián)合南京市發(fā)改委、南京市信息中心探索智慧城市建設(shè)的階段性成果。他們?cè)诨诖髷?shù)據(jù)的智慧城市應(yīng)用方面,例如在智能交通、公共安全、城市管理、應(yīng)急系統(tǒng)等方面都取得了一些成績(jī)。

        出租車輛狀態(tài)“可視化”智能分析:運(yùn)用大數(shù)據(jù)挖掘技術(shù),對(duì)全市出租車的實(shí)時(shí)運(yùn)行狀態(tài)進(jìn)行分析、實(shí)時(shí)跟蹤,可以獲得出租車的實(shí)時(shí)區(qū)域上下客熱點(diǎn)分布圖,為出租車運(yùn)營(yíng)服務(wù)管理提供支撐。

        公交數(shù)據(jù)智能分析:運(yùn)用大數(shù)據(jù)挖掘技術(shù)、物聯(lián)網(wǎng)技術(shù),可以實(shí)時(shí)獲得某路公交車的日平均運(yùn)營(yíng)狀態(tài)熱點(diǎn)分布圖,得到不同時(shí)段、站間車內(nèi)客流分布,為公交區(qū)間、班次優(yōu)化提供支撐。

        通過數(shù)據(jù)監(jiān)測(cè)人流異常變化:通過大數(shù)據(jù)數(shù)據(jù)挖掘推演城市人流變化情況,可監(jiān)測(cè)熱點(diǎn)區(qū)域人群密度異常變化情況,為城市管理者提供預(yù)警信息。

        基于智能交通大數(shù)據(jù)挖掘的全城“電子圍欄”:通過智能交通系統(tǒng)建立覆蓋全城的柔性“電子圍欄”,可動(dòng)態(tài)實(shí)時(shí)監(jiān)測(cè)車輛運(yùn)行軌跡,為城管部門管理渣土車、?;奋囕v、交通部門管理違章、限行車輛,公安案件偵破等提供有力支撐。

        智能交通大數(shù)據(jù)挖掘典型應(yīng)用——套牌車分析:套牌車是城市安全的一大隱患,借助交通大數(shù)據(jù)挖掘分析,可以方便實(shí)時(shí)監(jiān)測(cè)城市道路套牌車。

        實(shí)時(shí)路況分析:通過實(shí)時(shí)交通大數(shù)據(jù)挖掘,可精確反應(yīng)實(shí)時(shí)交通路況,為百姓出行提供指導(dǎo),有效疏導(dǎo)交通擁堵,大大減小社會(huì)出行成本。

        城市道路總體服務(wù)水平分析:通過大數(shù)據(jù)挖掘技術(shù),可以分析各類因素(如道路占挖、惡劣天氣等)對(duì)交通的影響,為城市管理提供有力支撐。

        應(yīng)急協(xié)同系統(tǒng)(如圖5):一旦發(fā)生污染類事故,應(yīng)急協(xié)同系統(tǒng)可以結(jié)合氣象數(shù)據(jù)、人口數(shù)據(jù)、住房數(shù)據(jù)及城市其他資源數(shù)據(jù),對(duì)可能影響區(qū)域的大小、人員數(shù)量進(jìn)行推測(cè),為應(yīng)急事件處置提供決策支撐。

        2012年10月17日15時(shí)許,南京市應(yīng)天大街賽虹橋高架上發(fā)生一起槍擊案,一輛奧迪車在行駛過程中被一輛轎車逼停,車上下來(lái)3名男子持非制式霰彈槍向奧迪車車窗連開3槍,后3人駕車逃離現(xiàn)場(chǎng)。警方通過目擊者提供的嫌疑車輛模糊特征,運(yùn)用智慧南京中心的案件協(xié)作偵破功能,根據(jù)案發(fā)時(shí)段及案發(fā)地區(qū)的數(shù)百條過車流水信息迅速鎖定車牌號(hào)為蘇ATD130的車輛為嫌疑車輛。通過套牌車智能分析功能,警方將套牌別克車從海量信息中篩選出來(lái),從而明確別克車為嫌疑人使用的車輛。在明確了嫌疑車輛后,案件協(xié)作偵破功能繪制出了案發(fā)前該嫌疑車輛的行駛軌跡,連同相關(guān)視頻信息一并提交給警方。最終協(xié)助警方僅用10小時(shí)偵破該案。

        圖5 (由江蘇省郵電規(guī)劃設(shè)計(jì)院提供)

        大數(shù)據(jù)對(duì)決策者的意義

        大數(shù)據(jù)在社會(huì)科學(xué)領(lǐng)域具有重大的作用,比如說(shuō)城市管理。非常重要的一點(diǎn)是可以利用大數(shù)據(jù)對(duì)各種事件、趨勢(shì)進(jìn)行提前預(yù)測(cè),比如說(shuō)災(zāi)情的情況、搶險(xiǎn)的效果、還有對(duì)政策的反饋等等。

        早期預(yù)警:早期檢測(cè)居民使用數(shù)字設(shè)備和服務(wù)中的異常可以在時(shí)間上快速響應(yīng)危機(jī);

        實(shí)時(shí)感知:大數(shù)據(jù)可以描繪一幅關(guān)于現(xiàn)實(shí)情況的很細(xì)粒度的且及時(shí)的表述,它有助于制定行動(dòng)計(jì)劃和政策;

        實(shí)時(shí)反饋:大數(shù)據(jù)具有實(shí)時(shí)監(jiān)測(cè)居民的能力,使其可用來(lái)了解在哪里政策和行動(dòng)計(jì)劃發(fā)生問題并可作出必要的調(diào)整。

        應(yīng)當(dāng)指出:實(shí)時(shí)的大數(shù)據(jù)信息不能代替政府決策時(shí)傳統(tǒng)應(yīng)用的定量的統(tǒng)計(jì)證據(jù),但如正確理解的話,它可以表明哪里需要做進(jìn)一步的調(diào)查,或者哪里需要作出立即的響應(yīng),而這是其他手段無(wú)法做到的。

        對(duì)大數(shù)據(jù)的挑戰(zhàn)

        應(yīng)用大數(shù)據(jù)面臨若干挑戰(zhàn);一方面關(guān)系到數(shù)據(jù)本身,包括它的獲取、共享和消除對(duì)隱私的顧慮。另一方面關(guān)系到對(duì)它的分析結(jié)果的解讀。

        隱私是最敏感的問題,涉及觀念上、法律上以及技術(shù)上的問題。按照ITU的定義:隱私權(quán)是個(gè)人控制或影響關(guān)于他們自身的信息是否披露的權(quán)利。我們必須警惕新技術(shù)的興起可能會(huì)對(duì)它造成損害并應(yīng)設(shè)置必要的防護(hù)。當(dāng)前,很多運(yùn)營(yíng)商和服務(wù)商積累了海量的用戶數(shù)據(jù),你的賬號(hào)、你的地址、你的購(gòu)物習(xí)慣甚至你在瀏覽某條新聞所花費(fèi)的時(shí)間等等,悉數(shù)掌握在他們手中。這些數(shù)據(jù)如何被正確、安全的使用,是需要我們持續(xù)關(guān)注、探討的一項(xiàng)重要話題。

        大數(shù)據(jù)應(yīng)用對(duì)新的數(shù)據(jù)源進(jìn)行分析方面提出的挑戰(zhàn)有:如何使數(shù)據(jù)得到合適的描述即對(duì)數(shù)據(jù)進(jìn)行摘要;如何通過演繹,解釋數(shù)據(jù)或使數(shù)據(jù)變得有意義;如何定義和檢測(cè)數(shù)據(jù)的異常,等等。

        在此我們還需要注意數(shù)據(jù)分析解讀不當(dāng)可能造成誤導(dǎo),有時(shí)表面的相關(guān)不一定表明存在真正的因果關(guān)系。

        Google Correlate是谷歌發(fā)布的一項(xiàng)數(shù)據(jù)挖掘工具,它允許用戶上傳自己的數(shù)據(jù)系列到服務(wù)器并整理出各種類型的圖像,再配合互聯(lián)網(wǎng)搜索結(jié)果整合出趨勢(shì)。有人利用Google Correlate發(fā)現(xiàn),人的增重和出租公寓具有相關(guān)關(guān)系(見圖6)??墒呛苊黠@,這種相關(guān)性更多的是一種巧合。這種時(shí)候需要利用人的經(jīng)驗(yàn)、智慧對(duì)大數(shù)據(jù)的分析結(jié)果進(jìn)行判斷,在這里,有經(jīng)驗(yàn)的分析家是十分重要的。見圖6所示。

        圖6

        把握大數(shù)據(jù)的機(jī)遇

        當(dāng)今世界進(jìn)入大數(shù)據(jù)時(shí)代是一客觀趨勢(shì),數(shù)據(jù)成為寶貴的資產(chǎn),能否充分利用大數(shù)據(jù)關(guān)系到一個(gè)系統(tǒng)的智慧,一個(gè)企業(yè)的前途,一個(gè)機(jī)構(gòu)的效率,一項(xiàng)決策的成敗。

        市場(chǎng)研究公司IDC預(yù)測(cè)的2013年九大科技發(fā)展趨勢(shì),其中第七個(gè)趨勢(shì)就是“大數(shù)據(jù)將發(fā)展壯大”。IDC認(rèn)為,“就如2012年移動(dòng)設(shè)備和云計(jì)算成為了每家公司的必需品那樣,大數(shù)據(jù)將在2013年被每一個(gè)人所使用。”IDC表示,大數(shù)據(jù)市場(chǎng)的年增長(zhǎng)率將達(dá)到40%,2012年該市場(chǎng)的規(guī)模約為50億美元,到2013年規(guī)模為100億美元,到2017年規(guī)模將達(dá)到530億美元。

        另一家著名的咨詢公司麥肯錫的全球研究所也認(rèn)為,大數(shù)據(jù)是下一個(gè)創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力提高的前沿。

        可以預(yù)見,會(huì)有越來(lái)越多的人關(guān)注大數(shù)據(jù)、運(yùn)用大數(shù)據(jù),希望我今天的發(fā)言可以對(duì)在座的媒體朋友給出一些參考,謝謝大家!■

        猜你喜歡
        數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        數(shù)據(jù)挖掘技術(shù)綜述與應(yīng)用
        河南科技(2014年19期)2014-02-27 14:15:26
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
        高級(jí)數(shù)據(jù)挖掘與應(yīng)用國(guó)際學(xué)術(shù)會(huì)議
        91网红福利精品区一区二| 精品国产亚洲亚洲国产 | 国产三级韩三级日产三级| 蜜桃传媒网站在线观看| 国产婷婷色一区二区三区| 亚洲亚洲人成综合网络| 亚洲精品夜夜夜| 激情综合五月天开心久久| 91乱码亚洲精品中文字幕| 2021国产精品视频网站| 少妇aaa级久久久无码精品片 | 国产综合色在线精品| 国产综合久久久久| 思思99热| 超短裙老师在线观看一区二区 | 国产亚洲精品97在线视频一| 性生交片免费无码看人| 久久乐国产精品亚洲综合| 国产人成无码视频在线1000| 国产女主播一区二区三区在线观看 | 亚洲一区二区自拍偷拍| 亚洲男女视频一区二区| 亚洲另类丰满熟妇乱xxxx| 摸进她的内裤里疯狂揉她动图视频| 国产手机在线αⅴ片无码观看 | 中文字幕丰满人妻av| 久久精品国产亚洲av麻豆图片| 日本不卡在线视频二区三区| 综合久久久久6亚洲综合| 国产精品美女主播在线| 狠狠躁夜夜躁人人爽超碰97香蕉| 国产三级精品三级在线观看| 九九99国产精品视频| 少妇激情一区二区三区| 男人天堂这里只有精品| 在线看片免费人成视频久网下载| 国产精品白浆一区二区免费看 | 中文字幕亚洲乱码熟女在线| 亚洲中文字幕久久精品色老板| 男女猛烈xx00免费视频试看| 日韩精品无码一区二区三区免费|