亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù):還是大錯(cuò)誤?

        2014-03-14 02:54:10紀(jì)元
        中國教育網(wǎng)絡(luò) 2014年5期
        關(guān)鍵詞:趨勢

        大數(shù)據(jù):還是大錯(cuò)誤?

        五年前,谷歌的一個(gè)研究小組在全球頂級的科學(xué)雜志《自然》上宣布了一個(gè)令人矚目的成果。該小組可以追蹤美國境內(nèi)流感的傳播趨勢,而這一結(jié)果不依賴于任何醫(yī)療檢查。他們的追蹤速度甚至比美國疾控中心(CDC)要快得多。谷歌的追蹤結(jié)果只有一天的延時(shí),而CDC則需要匯總大量醫(yī)師的診斷結(jié)果才能得到一張傳播趨勢圖,延時(shí)超過一周。谷歌能算得這么快,是因?yàn)樗麄儼l(fā)現(xiàn)當(dāng)人們出現(xiàn)流感癥狀的時(shí)候,往往會(huì)跑到網(wǎng)絡(luò)上搜索一些相關(guān)的內(nèi)容。

        “谷歌流感趨勢”不僅快捷、準(zhǔn)確、成本低廉,而且沒有使用什么理論。谷歌流感趨勢的成功,很快就成為了商業(yè)、技術(shù)和科學(xué)領(lǐng)域中最新趨勢的象征。興奮的媒體記者們不停地在問,谷歌給我們帶來了什么新的科技?

        然而在“大數(shù)據(jù)”里,大多數(shù)公司感興趣的是所謂的“現(xiàn)實(shí)數(shù)據(jù)”,諸如網(wǎng)頁搜索記錄、信用卡消費(fèi)記錄和移動(dòng)電話與附近基站的通信記錄等。谷歌流感趨勢就是基于這樣的現(xiàn)實(shí)數(shù)據(jù)。甚至這類數(shù)據(jù)比對撞機(jī)的數(shù)據(jù)規(guī)模還要大(如Facebook),更重要的是雖然這類數(shù)據(jù)的規(guī)模很大,但卻相對容易采集。它們往往是由于不同的用途被搜集起來并雜亂地堆積在一起,而且可以實(shí)時(shí)地更新。人們的通信、娛樂以及商務(wù)活動(dòng)都已經(jīng)轉(zhuǎn)移到互聯(lián)網(wǎng)上,互聯(lián)網(wǎng)也已經(jīng)進(jìn)入我們的手機(jī)、汽車甚至是眼鏡。因此人們的整個(gè)生活都可以被記錄和數(shù)字化,這些在十年前都是無法想象的。

        大數(shù)據(jù)的鼓吹者們提出了4個(gè)令人興奮的論斷,每一個(gè)都能從谷歌流感趨勢的成功中印證: 第一,數(shù)據(jù)分析可以生成驚人準(zhǔn)確的結(jié)果;第二,因?yàn)槊恳粋€(gè)數(shù)據(jù)點(diǎn)都可以被捕捉到,所以可以徹底淘汰過去那種抽樣統(tǒng)計(jì)的方法;第三,不用再尋找現(xiàn)象背后的原因,我們只需要知道兩者之間有統(tǒng)計(jì)相關(guān)性就行了;第四, 不再需要科學(xué)的或者統(tǒng)計(jì)的模型。

        不幸的是,上述信條都是極端樂觀和過于簡化了。在谷歌、Facebook和亞馬遜這些公司不斷通過人們所產(chǎn)生的數(shù)據(jù)來理解我們生活的過程中,現(xiàn)實(shí)數(shù)據(jù)支撐起了新互聯(lián)網(wǎng)經(jīng)濟(jì)。愛德華·斯諾登揭露了美國政府?dāng)?shù)據(jù)監(jiān)聽的規(guī)模和范圍,很顯然安全部門同樣癡迷從我們的日常數(shù)據(jù)中挖掘點(diǎn)什么東西出來。

        雖然大數(shù)據(jù)在科學(xué)家、企業(yè)家和政府眼里看起來充滿希望,但如果忽略了一些以前所熟知的統(tǒng)計(jì)學(xué)中的教訓(xùn),大數(shù)據(jù)可能注定會(huì)讓我們失望。 劍橋大學(xué)Spiegelhalter教授曾說到:“大數(shù)據(jù)中有大量的小數(shù)據(jù)問題。這些問題不會(huì)隨著數(shù)據(jù)量的增大而消失,它們只會(huì)更加突出?!?/p>

        在那篇關(guān)于谷歌流感趨勢預(yù)測的文章發(fā)表4年以后,新的一期《自然雜志消息》報(bào)道了一則壞消息:在最近的一次流感爆發(fā)中谷歌流感趨勢不起作用了。這個(gè)工具曾經(jīng)可靠地運(yùn)作了十幾個(gè)冬天,在海量數(shù)據(jù)分析和不需要理論模型的條件下提供了快速和準(zhǔn)確的流感爆發(fā)趨勢。然而這一次它迷路了,谷歌的模型顯示這一次的流感爆發(fā)非常嚴(yán)重,疾控中心在慢慢匯總各地?cái)?shù)據(jù)以后,卻發(fā)現(xiàn)谷歌的預(yù)測結(jié)果比實(shí)際情況夸大了幾乎一倍。

        這種不需要任何理論的純粹的相關(guān)性分析方法,其結(jié)果難免是脆弱的。谷歌將使用新的數(shù)據(jù)再次校準(zhǔn)流感趨勢這個(gè)產(chǎn)品,重新來過。

        我們再回頭來看看大數(shù)據(jù)的4個(gè)基礎(chǔ)信條。其一,如果簡單地忽略掉那些反面的數(shù)據(jù),比如Target的懷孕預(yù)測算法,那么很容易就會(huì)過高地估計(jì)算法的精確度。其二,如果在一個(gè)固定不變的環(huán)境里做預(yù)測,可以認(rèn)為因果關(guān)系不再重要。而當(dāng)我們處在一個(gè)變化的世界中,或者是我們自己就想要改變這個(gè)環(huán)境,這種想法就很危險(xiǎn)了。其三,“N=所有”,以及采樣偏差無關(guān)緊要,這些前提在絕大多數(shù)的實(shí)際情況下都是不成立的。最后,當(dāng)數(shù)據(jù)里的假象遠(yuǎn)遠(yuǎn)超過真相的時(shí)候,還持有“數(shù)據(jù)足夠大的時(shí)候,就可以自己說出結(jié)論了”這種觀點(diǎn)就顯得太過天真。

        大數(shù)據(jù)已經(jīng)到來,但它并沒有帶來新的真理?,F(xiàn)在的挑戰(zhàn)是要吸取統(tǒng)計(jì)學(xué)中老的教訓(xùn),在比以前大得多的數(shù)據(jù)規(guī)模下去解決新的問題、獲取新的答案。

        (來源:FT Magazine 編譯:紀(jì)元)

        猜你喜歡
        趨勢
        趨勢
        退休的未來趨勢
        英語世界(2023年12期)2023-12-28 03:36:16
        趨勢
        趨勢
        初秋唇妝趨勢
        Coco薇(2017年9期)2017-09-07 21:23:49
        未來直銷的七大趨勢
        趨勢
        流行色(2016年10期)2016-12-05 02:27:24
        SPINEXPO?2017春夏流行趨勢
        關(guān)注醫(yī)改新趨勢
        “去編”大趨勢
        真人抽搐一进一出视频| 日本一区二区三区四区在线看| 翘臀诱惑中文字幕人妻| 亚洲国产中文字幕视频| 久久亚洲私人国产精品va| 亚洲成a人片在线看| 国产99久久精品一区| 大香蕉av一区二区三区| 色哟哟精品视频在线观看| 亚洲人成网站77777在线观看| 91精品国产综合久久青草| 日韩av一区二区不卡| 国产乱人伦av在线a麻豆| 亚洲国产一区二区三区亚瑟| 挑战亚洲美女视频网站| 国产tv不卡免费在线观看| av永久天堂一区二区三区| 国产精品原创巨作AV女教师 | 欧美综合图区亚洲综合图区| 青草草视频在线观看华人免费| 国产成a人亚洲精品无码樱花| 236宅宅理论片免费 | 国产精品亚洲五月天高清| 国产精品一级av一区二区| 亚洲av免费不卡在线观看| 国产成人无码a区在线观看视频| 国产人成亚洲第一网站在线播放 | 99无码精品二区在线视频 | 国产鲁鲁视频在线播放| 国产一级黄色性生活片| 亚洲av无码国产精品色软件| 福利视频一二三在线观看| 久久丁香花综合狼人| 亚洲一区二区国产一区| 免费操逼视频| 日韩欧美国产亚洲中文| 亚洲免费精品一区二区| 能看不卡视频网站在线| 亚洲成av人在线观看网址| 中国精学生妹品射精久久| 久草久热这里只有精品|