從數(shù)據(jù)科學(xué)的角度出發(fā),信息化時(shí)代不存在嚴(yán)格意義的數(shù)據(jù)治理,信息化時(shí)代的主要特征是數(shù)字化,即將現(xiàn)實(shí)世界進(jìn)行數(shù)字化的描述,采用人工錄入或者傳感器感知的方式對(duì)現(xiàn)實(shí)世界進(jìn)行參數(shù)化記錄。記錄下來的各類參數(shù),利用管理人員的各類現(xiàn)有經(jīng)驗(yàn),整理出數(shù)據(jù)處理的邏輯,進(jìn)行程序編寫,完成對(duì)信息的處理。
數(shù)據(jù)治理和傳統(tǒng)信息處理模式的根本區(qū)別
傳統(tǒng)信息處理模式幾乎完全依賴人類的現(xiàn)有經(jīng)驗(yàn)進(jìn)行信息處理,對(duì)于人類經(jīng)驗(yàn)并沒有覆蓋的領(lǐng)域,就只能利用窮舉的方法來進(jìn)行處理。而窮舉的方法,只適用于條件簡(jiǎn)單的小范圍領(lǐng)域,例如下象棋,棋盤很小,棋子的可選落點(diǎn)很有限,因此能夠使用窮舉來完成。而對(duì)于圍棋這種19X19的自由落點(diǎn),其走法的窮舉將超越整個(gè)宇宙的質(zhì)子總數(shù)。因此,傳統(tǒng)的信息處理無法應(yīng)對(duì)這種應(yīng)用,直到機(jī)器學(xué)習(xí)成熟,才能夠?qū)崿F(xiàn)擊敗人類冠軍的AlphaGo而機(jī)器學(xué)習(xí),則是數(shù)據(jù)治理中的一個(gè)重要環(huán)節(jié),機(jī)器擊敗了人類冠軍,其實(shí)是數(shù)據(jù)治理對(duì)于依賴人類經(jīng)驗(yàn)的信息處理模式的超越和替代。因此,我們可以明顯的看出,數(shù)據(jù)治理和傳統(tǒng)信息處理模式的根本區(qū)別:
傳統(tǒng)信息處理:依賴人類現(xiàn)有經(jīng)驗(yàn)并進(jìn)行有限演化,形成信息處理邏輯并通過編程實(shí)現(xiàn)輸入和輸出。
數(shù)據(jù)治理:僅僅依賴數(shù)據(jù)本身,通過數(shù)據(jù)本身的特征,自適應(yīng)的演化處理邏輯,自適應(yīng)的實(shí)現(xiàn)輸入和輸出(輸入輸出也是數(shù)據(jù)處理邏輯之一)。
這兩種模式的直接結(jié)果就是:傳統(tǒng)信息處理只能在人現(xiàn)有的經(jīng)驗(yàn)基礎(chǔ)上做得更快更準(zhǔn)確;數(shù)據(jù)治理則可以向人提供全新的“經(jīng)驗(yàn)”。
旅游領(lǐng)域中的人工智能探索
在旅游領(lǐng)域,存在著海量的數(shù)據(jù),這些數(shù)據(jù)多數(shù)是人工錄入,處理邏輯多數(shù)是統(tǒng)計(jì)和簡(jiǎn)單分析,這種級(jí)別的信息處理僅僅能應(yīng)對(duì)簡(jiǎn)單事件。而游客、管理人員、從業(yè)人員的近乎開放型的咨詢和事務(wù)辦理,則是一種可能性遠(yuǎn)遠(yuǎn)超過圍棋數(shù)量的大自由維度信息處理。因此,旅游行業(yè)的咨詢、非常規(guī)事務(wù)辦理始終無法脫離人的主觀處理。而人主觀處理的最大問題就是,因?yàn)樨?zé)任心不同、經(jīng)驗(yàn)不同、工作態(tài)度不同,其處理結(jié)果天差地別。
基于上述考量,浙江省旅游信息中心有限公司對(duì)浙江省旅游數(shù)據(jù)的綜合管理和應(yīng)用制定了高起點(diǎn)高標(biāo)準(zhǔn)的要求,從建立之初就要求是在真正的數(shù)據(jù)治理體系之上,以便人工智能應(yīng)用能夠快速落地,服務(wù)全省旅游管理者、從業(yè)者和游客。在考察了國(guó)內(nèi)眾多人工智能領(lǐng)域公司之后,選擇了廈門杜若科技公司的研發(fā)團(tuán)隊(duì)對(duì)浙江省旅游度假區(qū)信息的數(shù)據(jù)治理進(jìn)行試點(diǎn)。廈門杜若的研發(fā)總監(jiān)唐娜博士(曾是大數(shù)據(jù)和人工智能領(lǐng)域公認(rèn)的世界級(jí)公司的首席技術(shù)經(jīng)理)和她的團(tuán)隊(duì)已經(jīng)初步形成并發(fā)展了完全自主知識(shí)產(chǎn)權(quán)的基于人工智能的數(shù)據(jù)治理產(chǎn)品線,覆蓋了數(shù)據(jù)治理全生命周期的所有必要環(huán)節(jié)。該公司目前已經(jīng)申請(qǐng)數(shù)據(jù)治理體系相關(guān)發(fā)明專利58項(xiàng),已獲得授權(quán)24項(xiàng),實(shí)審中26項(xiàng),申請(qǐng)實(shí)用新型專利37項(xiàng),獲得授權(quán)26項(xiàng)。浙江省旅游信息中心對(duì)浙江省旅游數(shù)據(jù)治理的試點(diǎn)首先從《浙江省旅游度假區(qū)信息管理系統(tǒng)》入手,將系統(tǒng)中結(jié)構(gòu)化的數(shù)據(jù),以無障礙大數(shù)據(jù)采集的技術(shù)實(shí)現(xiàn)解構(gòu),形成自由格式的大數(shù)據(jù),在這些數(shù)據(jù)基礎(chǔ)上,通過開放式的訓(xùn)練,完成初步數(shù)據(jù)治理。
治理的初步結(jié)果可實(shí)現(xiàn):形成基于自然語言的數(shù)據(jù)管理,對(duì)于《浙江省旅游度假區(qū)信息管理系統(tǒng)》中有記錄的所有數(shù)據(jù),各級(jí)管理人員均可以自然語言對(duì)話的方式進(jìn)行任意查詢(界面類似微信的一問一答),數(shù)據(jù)治理系統(tǒng)會(huì)根據(jù)各級(jí)人員的權(quán)限和身份,以及過往查詢的歷史和習(xí)慣進(jìn)行針對(duì)性的回答。簡(jiǎn)單地說,就讓人工智能系統(tǒng)認(rèn)識(shí)你,并且記住你的各種習(xí)慣和特點(diǎn),針對(duì)和你交流的全部經(jīng)歷來回答你的提問,并且會(huì)將它與所有人交流的經(jīng)驗(yàn)也作為數(shù)據(jù)進(jìn)行治理,從而,使用它的人群越大、人群種類越復(fù)雜,它就越聰明,就像人的閱歷越豐富,交流的時(shí)候溝通越暢通。
同時(shí),逐步形成自學(xué)習(xí)的數(shù)據(jù)治理模式,對(duì)于《浙江省旅游度假區(qū)信息管理系統(tǒng)》中的所有數(shù)據(jù),任何人除了查詢之外的應(yīng)用模式,可以用文字以自然語言對(duì)話的方式“教會(huì)”人工智能系統(tǒng),例如對(duì)哪幾個(gè)指標(biāo)進(jìn)行怎樣的加工處理和比對(duì),某些指標(biāo)達(dá)到多少時(shí)應(yīng)當(dāng)做什么樣的事情來主動(dòng)應(yīng)對(duì)等等。隨著系統(tǒng)學(xué)習(xí)的應(yīng)用模式越來越多,系統(tǒng)將可以逐步區(qū)分《浙江省旅游度假區(qū)信息管理系統(tǒng)》中記錄的哪些數(shù)據(jù)存在不合理(例如假數(shù)據(jù)),哪些景區(qū)或者度假區(qū)有多大的概率出現(xiàn)什么樣的事件等等。
隨著浙江省旅游信息數(shù)據(jù)治理的逐步推進(jìn),浙江省旅游信息中心會(huì)將更多系統(tǒng)的數(shù)據(jù)納入人工智能系統(tǒng),通過更多用戶從更多維度向系統(tǒng)提供更多的規(guī)則數(shù)據(jù)(教會(huì)系統(tǒng)應(yīng)用模式就是在向系統(tǒng)提供規(guī)則數(shù)據(jù))在達(dá)到一定基礎(chǔ)量的時(shí)候,系統(tǒng)將能夠從互聯(lián)網(wǎng)、專業(yè)文獻(xiàn)庫中自動(dòng)檢索數(shù)據(jù),并根據(jù)數(shù)據(jù)質(zhì)量主動(dòng)納入大數(shù)據(jù)庫,從而實(shí)現(xiàn)更高級(jí)別的數(shù)據(jù)治理。浙江旅游信息中心攜手廈門杜若科技探索的目標(biāo)是:在旅游領(lǐng)域,培訓(xùn)出具有旅游行為綜合分析能力超越人類極限的的人工智能系統(tǒng),協(xié)助做好管理旅游的同時(shí),做到以游客為本、唯服務(wù)至上,為所有來浙江的游客提供最適合個(gè)體需求的旅游新體驗(yàn)。
(作者單位: 浙江旅游信息中心有限公司)