本文從一則搞笑的大數(shù)據(jù)應用案例入手:某超市通過分析一位女顧客的購物數(shù)據(jù)(包括購物清單,瀏覽物品,咨詢信息,視頻監(jiān)控信息lt;超市內(nèi)徘徊區(qū)域gt;等),根據(jù)分析結(jié)果給該女顧客寄來了孕嬰童試用品,這一舉動讓該女顧客的父親非常生氣,立馬致電該超市投訴,因為她女兒還未成年。超市經(jīng)理立馬登門拜訪道歉,不過事實是,不久后這位小女孩因遮蓋不住隆起的腹部而不得不向父親告知真相:她真的懷孕了。對于企業(yè)而言,大數(shù)據(jù)有時候就像是一個偵探家,能夠撥開重重迷霧,找到問題的本質(zhì)以及解決方案,而關(guān)鍵在于,你是否真的懂得如何去駕馭它,讓它為你服務。
在經(jīng)歷了喊口號、布局深耕之后,大數(shù)據(jù)應用開始顯現(xiàn)出巨大的商業(yè)價值,觸角已延伸到零售、金融、教育、醫(yī)療、體育、制造、影視、政府等各行各業(yè)。
在維克托·邁爾·舍恩伯格的《大數(shù)據(jù)時代》一書中解釋,大數(shù)據(jù)是指不用隨機分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)的方法。大數(shù)據(jù)是繼云計算、物聯(lián)網(wǎng)之后IT產(chǎn)業(yè)又一次顛覆性的技術(shù)變革,消費者的網(wǎng)絡足跡是互聯(lián)網(wǎng)基因牐韁械淖慵?、点祸楌仮留褳谋接窂恼\顏叩男愿?、浦櫌意愿谍xチ換ゴ笫菥褪茄芯棵扛鲇沒櫧形墓獺4笫荻雜誥梅⒄?、企业决策、讬r滴窳鞒蹋愿鋈松罘絞降榷冀藪蟮撓跋?。看髷?shù)據(jù)作為當下非?;鸨囊粋€詞,其價值不言而喻,今天,《互聯(lián)網(wǎng)周刊》不談價值,通過聚攏一些實實在在的應用,如電商、傳統(tǒng)金融、互聯(lián)網(wǎng)金融、醫(yī)療、制造五大領(lǐng)域的案例,進而衍射出大數(shù)據(jù)內(nèi)在的應用邏輯。
“用戶畫像”直擊零售商需求
在如此激烈而又龐大的市場中,電商們迫切想知道的想必就是用戶需求。當這個用戶登陸網(wǎng)站的瞬間,就能猜出來這個用戶今天為何而來,然后從電商的商品庫里面把合適的商品找出來并推薦給他,進而展現(xiàn)出符合客戶需求的產(chǎn)品都有哪幾款。這種服務是消費者想要的,但是誰能幫助電商們做到呢?
隨著互聯(lián)網(wǎng)和電子商務的快速發(fā)展,“用戶畫像”這個概念悄然而生,它抽象地描述了一個用戶的信息全貌,是進行個性化推薦、精準營銷、廣告投放等應用的基礎(chǔ)。
如某電子商務平臺通過客戶的網(wǎng)絡瀏覽記錄(點擊、鏈接等)和購買記錄等掌握客戶的消費模式,從而分析并分類客戶的消費相關(guān)特性如收入、家庭特征、購買習慣等,最終掌握客戶特征,并基于這些特征判斷其可能關(guān)注的產(chǎn)品與服務,從消費者進入網(wǎng)站開始,在列表頁、單品頁、購物車頁等四個頁面,部署了5種應用不同算法的推薦欄為其推薦感興趣的商品,從提高商品曝光,促進交叉/向上銷售兩個角度對網(wǎng)站進行全面的優(yōu)化,應用后商城提升下定訂單轉(zhuǎn)化率增長66.7%、下定商品轉(zhuǎn)化率增長18%、推薦欄上線前后動銷量增長46%。將消除個人信息后的數(shù)據(jù)魔方賣給商家,方便商家調(diào)整產(chǎn)品投放策略,提升服務,精準挽留客戶,進而提高客戶黏性。
還有,在互聯(lián)網(wǎng)沖擊下,大部分傳統(tǒng)零售商必須要做改變,大數(shù)據(jù)下的用戶思維便成為符合其需求的一種互聯(lián)網(wǎng)思維方式和實際體驗。那何為大數(shù)據(jù)體系下的用戶思維呢?其實就是以“用戶畫像”最為核心和基礎(chǔ),通過線上、線下,交易、交互等各種結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),讓用戶更加完整的展現(xiàn)在企業(yè)面前,該用戶是誰?她在哪里?怎么聯(lián)系到她?她需要什么產(chǎn)品?她通過哪些渠道購買?她的購買習慣是怎樣的?,在完整的用戶畫像面前,零售企業(yè)相對于面對“裸泳”的用戶,用戶需要什么,怎么獲取,怎么營銷一目了然。未來的經(jīng)濟將越來越是一個消費者體驗式經(jīng)濟,誰能在精準刻畫消費者畫像的同時提升消費者體驗,誰就將引領(lǐng)并占有市場。
客戶價值最大化破冰傳統(tǒng)金融業(yè)
在大數(shù)據(jù)時代,越來越多的企業(yè)管理者已意識到了業(yè)務分析的重要性。業(yè)務分析洞察已經(jīng)成為了企業(yè)轉(zhuǎn)型的有利抓手。當然,銀行也不例外,從以產(chǎn)品為中心,也就是銷售產(chǎn)品和服務轉(zhuǎn)向現(xiàn)在以客戶為中心,更像零售業(yè)和制造商。對于以客戶為中心的企業(yè),最重要的一點是了解到客戶到底是誰,以及客戶到底有怎樣的需求。
當下,銀行業(yè)都在大力投入資金做著以下三件事:一是建立客戶的單一視窗,將以前不同銀行部門所了解的客戶情況集成在一起;二是按照用戶行為對用戶進行分類,將之前按照地理區(qū)域、年齡、收入分類改為按照用戶行為來對用戶進行分類;三是為客戶提供質(zhì)量一致的客戶體驗,不管用戶通過銀行網(wǎng)點、移動設備還是社交媒體等渠道來使用銀行服務,都要為客戶提供質(zhì)量一致的體驗。
隨著互聯(lián)網(wǎng),特別是移動互聯(lián)網(wǎng)的不斷發(fā)展,互聯(lián)網(wǎng)金融也在給傳統(tǒng)金融業(yè)帶來不小的沖擊,不過,互聯(lián)網(wǎng)金融是否會對銀行等傳統(tǒng)機構(gòu)構(gòu)成威脅仍無法得出定論。但是,這并不表示銀行業(yè)可以忽視這股沖擊的浪潮,在這個大數(shù)據(jù)不斷壯大的時代,傳統(tǒng)金融業(yè)如何利用大數(shù)據(jù)來不斷創(chuàng)新與變革,如何借助大數(shù)據(jù)降低金融風險,提升客戶體驗,進而挖掘客戶價值最大化是每個企業(yè)都應該深入思考的問題。
如某金融全牌照集團公司希望學習美國花旗集團對已有客戶價值挖掘最大化的經(jīng)驗,對現(xiàn)有保險客戶進行深度分析,通過對已有客戶的大數(shù)據(jù)分析及問卷調(diào)查來細分人群、刻畫人群需求特征,從而制定針對不同客戶群體的集保險、銀行、投資、證券、資產(chǎn)管理、信托等一攬子綜合金融產(chǎn)品策略,為客戶提供一站式財務金融解決方案,以期得到每個客戶最大價值。
在選用大數(shù)據(jù)解決方案后,通過分析已有保險客戶數(shù)據(jù)及外部調(diào)研問卷,將人群細分為統(tǒng)計學上顯著區(qū)別的人群;根據(jù)群體規(guī)模、年齡、性別、教育水平、家庭特征、現(xiàn)階段的收入、消費、理財?shù)刃袨槟J揭约八麄兯幍纳c財富階段,精準分析群體的需求動因后制定有針對性的產(chǎn)品策略及營銷策略。
面對來勢洶洶的互聯(lián)網(wǎng)企業(yè),傳統(tǒng)金融業(yè)們也在加快步伐,但還是沒有互聯(lián)網(wǎng)企業(yè)動作快。目前,互聯(lián)網(wǎng)金融業(yè)正從單純的支付業(yè)務向轉(zhuǎn)賬匯款、跨境結(jié)算、小額信貸、現(xiàn)金管理、資產(chǎn)管理、供應鏈金融、基金和保險代銷、信用卡還款等傳統(tǒng)銀行業(yè)務領(lǐng)域滲透。除了存款,銀行的主要業(yè)務幾乎已遇到全面挑戰(zhàn)?;ヂ?lián)網(wǎng)金融正在叫板傳統(tǒng)金融,傳統(tǒng)金融業(yè)又該何去何從?值得思考。
精準營銷加速互聯(lián)網(wǎng)金融沖刺
在國外,大數(shù)據(jù)金融領(lǐng)域的應用相對成熟,我們先來回顧一下在美國做得非常典型的大數(shù)據(jù)金融的三大案例。
人們習慣性地認為,只有銀行才能建立信用體系,然而在大數(shù)據(jù)時代,互聯(lián)網(wǎng)公司運用大數(shù)據(jù)控制信貸風險已初露端倪。
在進行數(shù)據(jù)處理之前,對業(yè)務的理解、對數(shù)據(jù)的理解非常重要,這決定了要選取哪些數(shù)據(jù)源進行數(shù)據(jù)挖掘,而且越來越多的互聯(lián)網(wǎng)在線動態(tài)大數(shù)據(jù)被添加進來。例如一個虛假的借款申請人信息就可以通過分析網(wǎng)絡行為痕跡被識別出來,一個真實的互聯(lián)網(wǎng)用戶總會在網(wǎng)絡上留下蛛絲馬跡。對征信有用的數(shù)據(jù)的時效性也非常關(guān)鍵,通常被征信行業(yè)公認的有效的動態(tài)數(shù)據(jù)通常是從現(xiàn)在開始倒推24個月的數(shù)據(jù)。?通過多渠道獲得的數(shù)據(jù)來源,利用數(shù)學運算和統(tǒng)計學的模型進行分析,從而評估出借款者的信用風險,典型的企業(yè)是美國的ZestFinance。這家企業(yè)的大部分員工是數(shù)據(jù)科學家,他們并不特別地依賴于信用擔保行業(yè),用大數(shù)據(jù)分析進行風險控制是ZestFinance的核心技術(shù)。他們的原始數(shù)據(jù)來源非常廣泛。犓塹氖莨こУ暮誦募際鹺突蓯撬強⒌?0個基于學習機器的分析模型,對每位信貸申請人的超過1萬條原始信息數(shù)據(jù)進行分析,并得出超過7萬個可對其行為做出測量的指標,而這一過程在5秒鐘內(nèi)就能全部完成。事實上,在美國,征信公司或者大數(shù)據(jù)挖掘公司的產(chǎn)品不僅用于提供給相關(guān)企業(yè)用于降低金融信貸行業(yè)的風險,同時也用于幫助做決策判斷和市場營銷,還有,利用社交網(wǎng)站的大數(shù)據(jù)進行網(wǎng)絡借貸的典型是美國的Lending Club。Lending club于2007年5月24日在facebook上開張,通過在上面鑲嵌的一款應用搭建借貸雙方平臺。利用社交網(wǎng)絡關(guān)系數(shù)據(jù)和朋友之間的相互信任聚合人氣。借款人被分為若干信用等級,但是卻不必公布自己的信用歷史。?還有犚患以諉攔仙碳姨峁┙鶉諦糯竦墓綤abbage,于2010年4月上線,主要目標客戶是ebay、Amazon、PayPal等電商。它的奇特之處在于,其通過獲取ebay等公司的網(wǎng)店店主的銷售、信用記錄、顧客流量、評論、商品價格和存貨等信息,以及他們在Facebook和Twitter上與客戶的互動信息,借助數(shù)據(jù)挖掘技術(shù),把這些店主分成不同的風險等級,以此來確定提供貸款金額數(shù)量與貸款利率水平,風險過高則拒絕,風險高低與利率成正比,與貸款金額成反比。
顯然,若以銀行體系來評價這類網(wǎng)上商家大多數(shù)都不符合銀行的貸款資格,不過在互聯(lián)網(wǎng)時代,Kabbage的案例說明了運用大量數(shù)據(jù)足以支撐這些小微企業(yè)信用評價體系。當然,Kabbage的這種模式也在國內(nèi)被成功運用,其中,宜信的互聯(lián)網(wǎng)金融產(chǎn)品就是以互聯(lián)網(wǎng)為獲客主要渠道,除了借貸信用記錄,還結(jié)合大數(shù)據(jù)分析技術(shù),捕捉來自大眾點評、豆瓣等社交網(wǎng)絡上的有用信息,幫助信用審核人員多維度分析借款客戶的信用狀況。
大數(shù)據(jù)對于互聯(lián)網(wǎng)金融的助推作用首要體現(xiàn)在尋找合適的目標用戶,實現(xiàn)精準營銷?;ヂ?lián)網(wǎng)金融領(lǐng)域的新創(chuàng)企業(yè)或做貸款,或賣產(chǎn)品,憑借高額收益率,手續(xù)費優(yōu)惠,吸引用戶選擇自己。然而,在越來越多同類企業(yè)吹響混戰(zhàn)號角的同時,互聯(lián)網(wǎng)金融企業(yè)也不得不面對來自同行業(yè)的競爭。欲在競爭激烈的市場中占有一席之地,互聯(lián)網(wǎng)金融企業(yè)需要更精準地定位產(chǎn)品,并推送給自己的目標人群。誰是潛在的購買者?如何找到他們?并讓他們產(chǎn)生興趣?精準營銷的實現(xiàn)程度是互聯(lián)網(wǎng)金融企業(yè)存活與崛起的關(guān)鍵所在,這個領(lǐng)域雖然未達到成熟的發(fā)展狀態(tài),但確實已經(jīng)有了一些有參考價值的營銷案例。如:
大數(shù)據(jù)通過動態(tài)定向技術(shù)查看互聯(lián)網(wǎng)用戶近期瀏覽過的理財網(wǎng)站,搜索過的關(guān)鍵詞,通過瀏覽數(shù)據(jù)建立用戶模型,進行產(chǎn)品實時推薦的優(yōu)化投放,直擊用戶所需。
其次就是風控。通過分析大量的網(wǎng)絡交易及行為數(shù)據(jù),可對用戶進行信用評估,這些信用評估可以幫助互聯(lián)網(wǎng)金融企業(yè)對用戶的還款意愿及還款能力做出結(jié)論,繼而為用戶提供快速授信及現(xiàn)金分期服務。
事實上一個人或一個群體的信用好壞取決于諸多變量,如收入、資產(chǎn)、個性、習慣等,且呈動態(tài)變化狀態(tài)??梢哉f數(shù)據(jù)在個人信用體系中體現(xiàn)為芝麻信用,它便于解決陌生人之間以及商業(yè)交易場景中最基本的身份可信性問題,以及幫助互聯(lián)網(wǎng)金融產(chǎn)品和服務的提供者識別風險與危機。這些數(shù)據(jù)廣泛來源于網(wǎng)上銀行,電商網(wǎng)站,社交網(wǎng)絡,招聘網(wǎng),婚介網(wǎng),公積金社保網(wǎng)站,交通運輸網(wǎng)站,搜索引擎,最終聚合形成個人身份認證,工作及教育背景認證,軟信息(包括消費習慣,興趣愛好,影響力,社交網(wǎng)絡)等維度的信息。
對于P2P網(wǎng)貸行業(yè)而言,能否利用互聯(lián)網(wǎng)技術(shù)有效地搜集用戶信息,并對用戶的信用信息進行判定和管理,成為考量一家P2P網(wǎng)貸平臺風控水平的重要標準。嚴密的風控手段是保證平臺出借人的資金安全的重要環(huán)節(jié),在風控技術(shù)手段創(chuàng)新探索方面,宜信宜人貸作為行業(yè)技術(shù)創(chuàng)新的代表,顯然走得更快人一步。其已通過精確的風險建模,實現(xiàn)了對用戶資質(zhì)的高效審批,為用戶提供更便捷的體驗。它是基于對自身平臺數(shù)萬名借款用戶的了解,同時借鑒宜信八年累積的對于用戶的了解,從地域、年齡段、職業(yè)、等多維度對借款用戶進行了劃分,通過精確的風險模型建立,宜信宜人貸建立了一套獨有的,行之有效的信用評估系統(tǒng),通過對用戶信息的多維度考察,能夠快速對用戶的信用資質(zhì)進行評定,從而極大地提升服務效率。
P2P小額信貸機構(gòu)如何使用個人及機構(gòu)的外部數(shù)據(jù)建立自己的征信系統(tǒng),在極其有限的客戶實質(zhì)接觸基礎(chǔ)上僅憑問卷數(shù)據(jù)、自有數(shù)據(jù)庫等對不同客戶進行信用評估,并結(jié)合內(nèi)部業(yè)務數(shù)據(jù)建立風險定價系統(tǒng)、風險預警系統(tǒng)、風險管控方案、應對欺詐規(guī)則、懲罰方案等一系列影響核心業(yè)務盈利能力的系統(tǒng)方案是機構(gòu)盈利模式的核心。采用大數(shù)據(jù)解決方案后,通過自建、購買、客戶授權(quán)后合作分享等多種方式整合包括互聯(lián)網(wǎng)社交網(wǎng)絡數(shù)據(jù)在內(nèi)的多種數(shù)據(jù)、建立個人及機構(gòu)消費、借貸、財務交易、資金往來等多源信用數(shù)據(jù)庫,在此基礎(chǔ)上建立符合自身業(yè)務范圍的客制化信用評估模型,根據(jù)此模型評估借、貸款雙方的信用等級。通過建模確立如何匹配借貸雙方,與具體業(yè)務相應的風險評級、授權(quán)等級、額度發(fā)放等級以及與此相應的風險價格等,并通過已有拖欠、欺詐案例反饋回模型進行機器識別,進一步完善模型。
未來,依托于互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)的發(fā)展,相信將會出現(xiàn)更優(yōu)質(zhì),更便捷的P2P網(wǎng)貸服務,來幫助更多有信用的借款人釋放信用的價值,讓信用生金。
個性化數(shù)據(jù)為醫(yī)療插上智慧的翅膀
凱文·凱利(KK)在《失控》的第22章,“預言機”里曾提到:信息就是數(shù)據(jù),數(shù)據(jù)一旦流動,就創(chuàng)造出透明。社會一旦聯(lián)網(wǎng),就可以了解自己。所以,很多熱衷于大數(shù)據(jù)概念的人,他知道哪里有數(shù)據(jù),卻沒有辦法去促成數(shù)據(jù)的流動。
所以,第一要義,數(shù)據(jù)如何才能形成流動?它的驅(qū)動力在哪里?以現(xiàn)在很熱的醫(yī)療健康大數(shù)據(jù)為例,來探究數(shù)據(jù)是如何流動的?
維克托·邁爾-舍恩伯格的《大數(shù)據(jù)時代》一書中有兩個關(guān)于大數(shù)據(jù)與公共衛(wèi)生結(jié)合的案例令人印象深刻:
喬布斯自罹癌至離世長達8年之久,這幾乎創(chuàng)造了胰腺癌歷史上的奇跡。據(jù)悉,喬布斯曾在此期間支付大量費用獲得了自己包括整個基因密碼在內(nèi)的數(shù)據(jù)文檔。借此,醫(yī)生們能基于喬的特定基因組成以及大數(shù)據(jù)按所需效果用藥,并調(diào)整醫(yī)療方案。
(薛女士點評:個性化治療,基于基因分析的個性化用藥及診療雖然目前還比較昂貴,但它是未來人類財富水平提高后高端醫(yī)療的一個趨勢,而且成本也會隨著大數(shù)據(jù)模型的完善逐漸降低,變得越來越親民)
如果上述案例是個體的,那么帶來群體價值的案例,便是Google成功預測流感爆發(fā)期。2009年甲型H1N1流感爆發(fā)幾周前,Google通過對人們網(wǎng)上搜索記錄的觀察、分析、建模,結(jié)果顯示,他們的預測與官方數(shù)據(jù)的相關(guān)性高達97%,且判斷比疾控中心更及時。
(薛女士點評:這個案例里流行病的預測完全是基于搜索引擎用戶終端的第一手時空數(shù)據(jù),它是疾病時空分析的一個代表,類似的研究還有霧霾源頭、傳播、流動的時空分析,肺癌等疾病的時空分析。)
從個人健康管理到公共健康管理,大數(shù)據(jù)在對個人醫(yī)療的改變以及極富價值的預警能力吸引著IT巨頭們迫不及待與醫(yī)療聯(lián)姻。例如在中國,某慢性病管理遠程醫(yī)療解決方案供應商計劃外包商保的糖尿病遠程管理業(yè)務,需要提供:人群的糖尿病管理方案包括接觸、回應、問卷、回饋、互動、宣教、指導、測試結(jié)果報告、產(chǎn)品銷售等各個環(huán)節(jié)的方案設計以及人群配合度、依從性、短期及長期醫(yī)療效果、經(jīng)濟效果評估方案。遠程醫(yī)療提供方方案中的的成本、經(jīng)濟效益回報會作為與商保、社保合作方案中的重要組成部分。
(薛女士點評:這種慢性病管理的解決方案設計在國外已經(jīng)比較成熟,但面對中國獨特國情即人口還未深度老齡化、重治療輕預防理念未完全轉(zhuǎn)變、醫(yī)?;鹩噙\營、人們還未充分意識到防未病、治輕癥的長遠經(jīng)濟效益、對慢病管理的費用還單純視為開支,慢性病管理被醫(yī)保采納,按照大數(shù)據(jù)解決方案被執(zhí)行及深入人民群眾的生活還有很長的路要走。)
通過采用大數(shù)據(jù)解決方案,利用既往研究、文獻及歷史數(shù)據(jù)中的結(jié)果為外包業(yè)務人群設計糖尿病病管理全流程數(shù)據(jù)分析方案,包括數(shù)據(jù)生成、采集、分析方案等,依據(jù)一定假設利用糖尿病決策樹模型來逐層確定慢病管理各個環(huán)節(jié)中的成本及產(chǎn)出。應接觸人群、反饋人群、互動人群、依從人群、效果人群、對比人群生成及最終的醫(yī)療效果、經(jīng)濟效果評估方案是本項目的關(guān)鍵。利用遠程終端的客戶反饋數(shù)據(jù)分析提高客戶反饋、依從、購買產(chǎn)品的策略,平衡成本與樣本規(guī)模,提高供應商的投產(chǎn)比;使用統(tǒng)計學方法清楚論證及展示慢性病管理遠程醫(yī)療解決方案的醫(yī)療夾著及經(jīng)濟學價值,投入產(chǎn)出比。
雖然我們談了許多關(guān)于醫(yī)療行業(yè)大數(shù)據(jù)的價值和作用,但今天的大數(shù)據(jù)在醫(yī)療行業(yè)應用仍然處于初級應用的階段,部分醫(yī)療機構(gòu)僅使用了初級功能如BI等,要想讓醫(yī)療行業(yè)把大數(shù)據(jù)發(fā)揮出最大的價值,需要解決以下幾方面問題:
從技術(shù)角度來看,數(shù)據(jù)采集及標準問題。收集數(shù)據(jù)是大數(shù)據(jù)基礎(chǔ),但目前醫(yī)療機構(gòu)采集數(shù)據(jù)的規(guī)范度有限,阻礙了大數(shù)據(jù)的應用;從醫(yī)療經(jīng)營角度來看,管理層缺乏數(shù)據(jù)價值認知問題。雖然目前醫(yī)療機構(gòu)領(lǐng)導們對于數(shù)據(jù)的重視程度很高,但是范圍僅僅局限于對于內(nèi)部的數(shù)據(jù)認知,從總體來看,并沒有意識到外部數(shù)據(jù)如互聯(lián)網(wǎng)數(shù)據(jù)與內(nèi)部數(shù)據(jù)的結(jié)合所產(chǎn)生的價值;從投入成本角度來看,現(xiàn)在大數(shù)據(jù)的投入產(chǎn)出比不明確?,F(xiàn)在IT投資都需要講ROI(投資回報率),由于醫(yī)療行業(yè)缺乏大數(shù)據(jù)的成熟案例,考慮到成本因素,企業(yè)決策者大都不都不敢隨便在大數(shù)據(jù)領(lǐng)域砸錢;從產(chǎn)品角度來看,大數(shù)據(jù)產(chǎn)品單一,行業(yè)成熟度不夠。
(薛女士點評:從數(shù)據(jù)存儲與分享的角度來看,醫(yī)療數(shù)據(jù)的社會共享度很差,每個醫(yī)院都為自己數(shù)據(jù)的存儲、備份、遷移大傷腦筋,不愿意花更多精力與成本開發(fā)基于數(shù)據(jù)的疾病預防與管理。個性化治療、傳染病流行病防治、臨床路徑、詢證醫(yī)學、基因測序治療很多知識產(chǎn)權(quán)像金子一樣可以從數(shù)據(jù)中二次、三次開發(fā)出來,而坐在金礦上的人明白自己暫時還不具備挖掘金礦的能力,但也不愿意請別人來挖掘或是聯(lián)合其他礦主共同開發(fā)。)
從以上問題我們可以看出,醫(yī)療行業(yè)開展大數(shù)據(jù)仍然有一段路要走,不過面對所存在的問題,未來隨著技術(shù)的推進、意識的提高、成本的下降以及相關(guān)政策的成熟,相信用不了幾年時間就可以逐步解決問題,未來,大數(shù)據(jù)必然能夠為醫(yī)療行業(yè)提供更好的服務。
數(shù)據(jù)分析模型讓制造業(yè)煥然一新
工業(yè)4.0時代正撲面而來。這是繼以蒸汽機、大規(guī)模流水線生產(chǎn)和電氣自動化為標志的前三次工業(yè)革命之后的第四次工業(yè)革命。其特點是通過充分利用嵌入式控制系統(tǒng),即物理信息融合系統(tǒng)(其中大數(shù)據(jù)扮演主角),實現(xiàn)制造業(yè)向智能化轉(zhuǎn)型。
20年滄桑巨變,今天中國已是全球制造業(yè)大國。來自中國工業(yè)與信息化部的統(tǒng)計數(shù)據(jù)顯示,2013年中國工業(yè)占GDP的37%,提供全國25%的就業(yè)崗位。在500余種工業(yè)產(chǎn)品中,有220多種產(chǎn)量居世界第一。中國制造業(yè)在全球的占比約為20%。然而,中國制造業(yè)面對云蒸霞蔚的移動互聯(lián)網(wǎng)和大數(shù)據(jù)景觀卻有些不知所措,若不趕緊扭轉(zhuǎn)局面,有可能逐漸喪失制造業(yè)大國的地位。大而不強是我們的軟肋,大多數(shù)中國工廠依然龜縮在產(chǎn)業(yè)鏈低端,缺少制造的核心材料、設備、工藝,停留在近乎原始的OEM(貼牌代工)階段,缺乏原創(chuàng)技術(shù)和創(chuàng)新產(chǎn)品。不過,憑借龐大的內(nèi)需市場支撐,中國制造的優(yōu)勢尚存,13億人口積累的消費數(shù)據(jù)十分可觀。因此,如果能在大數(shù)據(jù)挖掘和分析上下點功夫,中國制造業(yè)還能保持較強的競爭力。
在中國制造業(yè)依托大數(shù)據(jù)打翻身仗的陣營中,小米可謂特立獨行的領(lǐng)頭羊。2010年成立的小米公司是中國制造業(yè)企業(yè)的成功典范,其主打產(chǎn)品小米手機已蜚聲海外,被業(yè)內(nèi)視作蘋果、三星的潛在威脅。小米超越同行的業(yè)績,緣于其用包括軟件、硬件和應用生態(tài)的整體方法,小米在創(chuàng)造全新用戶體驗的同時,高擎大數(shù)據(jù)的旗幟,顛覆了中國制造業(yè)公司的傳統(tǒng)做法。有了這樣的底氣,小米董事長雷軍才敢與傳統(tǒng)制造業(yè)的空調(diào)玫瑰—格力掌門人董明珠立下10億元的對賭承諾。
那么,大數(shù)據(jù)是如何幫助研發(fā)人員提高新藥研發(fā)效率的呢?相關(guān)專業(yè)人士認為:首先,由于藥物的生物過程和藥物模型越來越復雜,大數(shù)據(jù)可以通過利用分子和臨床數(shù)據(jù),預測建模來幫助識別那些具有很高可能性被成功開發(fā)為藥物的安全有效的潛力備選新分子。其次,利用大數(shù)據(jù)可以幫助提升臨床試驗的效率。例如篩選臨床試驗受試者的篩選標準通過大數(shù)據(jù),可以瞄準特定人群,這樣臨床試驗就可以規(guī)模更小、時間更短、成本更低,更加有效。同時可以通過大數(shù)據(jù)分析來實時監(jiān)控臨床試驗,及早發(fā)現(xiàn)可能出現(xiàn)的問題,避免試驗過程中成本增加或出現(xiàn)不必要的延誤。第三,相對于原來僵化的數(shù)據(jù)孤島,使用大數(shù)據(jù)可以幫助數(shù)據(jù)在不同功能單元之間順暢流動。通過打破內(nèi)部各功能之間的信息壁壘并提升跟外部合作伙伴的協(xié)作,制藥公司可以大幅擴展他們的知識和數(shù)據(jù)網(wǎng)絡,如與外部合作伙伴——醫(yī)生和CRO共享關(guān)鍵數(shù)據(jù)。數(shù)據(jù)的這種順暢流動,對能創(chuàng)造商業(yè)價值的實時預測性數(shù)據(jù)進行分析非常關(guān)鍵。
此外,為確保合理分配稀缺的研發(fā)資金,項目組合與產(chǎn)品線相關(guān)的快速決策至關(guān)重要。但制藥企業(yè)經(jīng)常發(fā)現(xiàn),他們很難做出適當?shù)臎Q定。比如哪個項目該繼續(xù),或者有時更重要的是,哪個項目該砍掉?;谛畔⒓夹g(shù)的項目組合管理能快速無縫地實現(xiàn)數(shù)據(jù)驅(qū)動的決策。通過數(shù)據(jù)分析當前項目的商業(yè)開發(fā)機會,預測其市場競爭力,幫助企業(yè)客觀地做出決定,以確保研發(fā)投入的合理性。
雖然大數(shù)據(jù)可以有效地幫助研發(fā)人員提升新藥研發(fā)效率,但目前大數(shù)據(jù)技術(shù)還有一些方面需要改進。牛津大學統(tǒng)計學教授彼得·多納利指出,目前大數(shù)據(jù)技術(shù)面臨的問題有三:首先,信息采集不足。大數(shù)據(jù)要發(fā)揮作用,首先要有足夠的病人、藥物等相關(guān)信息,這是數(shù)據(jù)分析的基礎(chǔ),然而許多病人可能出于隱私考慮不愿提供這些信息,制藥企業(yè)也有可能因為商業(yè)利益不愿共享藥物成分等敏感信息,這就直接導致信息采集不足。
其次,要從海量信息中得出有用的結(jié)論,專業(yè)的數(shù)據(jù)分析必不可少,采集到足夠信息后,需要由相關(guān)領(lǐng)域的專業(yè)人士與信息技術(shù)專家一起對數(shù)據(jù)進行有針對性的歸納和分析,而這種跨學科、跨領(lǐng)域合作能否順利實現(xiàn),是大數(shù)據(jù)技術(shù)實際應用中的重要問題,而且正考驗著制藥企業(yè)的大數(shù)據(jù)整合能力。
第三,在技術(shù)層面還存在網(wǎng)絡容量有限的問題。很多新藥研發(fā)機構(gòu)現(xiàn)有的基礎(chǔ)設施無法滿足海量信息分析和處理的需求,因此如何降低存儲成本,以及提升應用價值就成為大數(shù)據(jù)所面臨的關(guān)鍵技術(shù)難題。
雖然尚待完善,但毫無疑問的是,大數(shù)據(jù)在新藥研發(fā)中必將發(fā)揮越來越大的作用。
結(jié)語
從目前來看,大數(shù)據(jù)的應用范圍正在持續(xù)擴大,大數(shù)據(jù)的觸角正逐漸深入到各個領(lǐng)域,同時也是明天我們治理交通擁堵、霧霾天氣、看病難、食品安全等“城市病”的利器,也會為政府打開了解社情民意的更大窗口。
我們現(xiàn)在看這個世界,比如分析家中食品腐爛,主要就是依賴于我們的眼睛再加上我們的經(jīng)驗,但如果我們有一臺顯微鏡,我們一下就看到壞細菌,那么分析起來完全就不一樣了。大數(shù)據(jù)就是我們的顯微鏡,它可以讓我們從全新視角來發(fā)現(xiàn)新的商業(yè)機會,并可能重構(gòu)商業(yè)模型。我們的產(chǎn)品設計可能不一樣了,很多事情不用猜了,客戶的習慣和偏好一目了然,我們的設計就能輕易命中客戶的心窩;我們的營銷也完全不同了,我們知道客戶喜歡什么、討厭什么,更有針對性。特別是顯微鏡再加上廣角鏡,我們就有更多全新的視野了。這個廣角鏡就是跨行業(yè)的數(shù)據(jù)流動,使我們過去看不到的東西都能看到了。所以,最終大數(shù)據(jù)一定是跨行業(yè)流動的。
然而,我們也應該清楚地知道大數(shù)據(jù)在應用過程中尚存在很多問題:各政府、各行業(yè)間不公開和分享數(shù)據(jù),造成數(shù)據(jù)之間的割裂,無法產(chǎn)生數(shù)據(jù)的深度價值和綜合價值;很多應用系統(tǒng)涉及公民財產(chǎn)及隱私甚至國家安全,信息安全問題成為大數(shù)據(jù)應用重要難題;大數(shù)據(jù)市場尚未形成有效的評價、資格認證和準入機制等。當然,最重要的還是有賴于行業(yè)對于大數(shù)據(jù)時代到來的認識,警惕和應對。
特別鳴謝:本文得到了薛慶女士的大力支持與顧問,作為一名具有十幾年實戰(zhàn)經(jīng)驗的海歸北美精算師,她曾就職于美國藍盾藍十字保險公司,德國慕尼黑再保險公司,埃森哲咨詢。對大數(shù)據(jù)在健康醫(yī)療保險領(lǐng)域的全價值鏈戰(zhàn)略咨詢、項目分析、數(shù)據(jù)挖掘與決策實施頗有心得。憑借國際經(jīng)驗與視野,立足國內(nèi)市場,當下薛慶正攜手她的小伙伴們即她在北美曾經(jīng)的同學、同事組成了一個專門開發(fā)大數(shù)據(jù)解決方案的團隊。團隊在金融、醫(yī)療及健康大數(shù)據(jù)分析的自有數(shù)據(jù)庫、外部數(shù)據(jù)庫調(diào)用、問題抽象,數(shù)據(jù)傳輸及清洗,算法,模型等重要環(huán)節(jié)均積累有多年經(jīng)驗。團隊目前正針對中小微企業(yè)及互聯(lián)網(wǎng)公司開發(fā)各類關(guān)于精準營銷,風險厘定及控制,量化分析、商業(yè)智能等方面的解決方案。她的Email地址是:jackiepgh@sina.com