史超
今天發(fā)布的這個產(chǎn)品是一個統(tǒng)一政務信息資源庫平臺。我們梳理了很多在政府領(lǐng)域遇到的問題,政府里面的信息化項目非常多,就會造成一個非常大的問題,就是數(shù)據(jù)煙囪。數(shù)據(jù)煙囪一直存在很多年,有大量技術(shù)可以幫助我們整合數(shù)據(jù),但整合完以后如何應用這些數(shù)據(jù),做政務資源整合非常重要。
實際上,統(tǒng)一政務信息資源庫不是一個單獨的產(chǎn)品。拓爾思從1993年成立一直到現(xiàn)在,20多年來積累了大大小小的應用場景,這里面涵蓋很多技術(shù),包括數(shù)據(jù)采集技術(shù)、文本挖掘技術(shù)、存儲技術(shù)等,這些技術(shù)都是通過長期積累,匯聚成了這樣一個平臺。拓爾思統(tǒng)一政務信息資源庫主要做非結(jié)構(gòu)化數(shù)據(jù),在整合過程中需要做統(tǒng)一數(shù)據(jù)管理,要按照用戶資源進行自動分類管理,幫助用戶進行業(yè)務梳理。
拓爾思統(tǒng)一政務信息資源庫涵蓋了六大能力:第一,數(shù)據(jù)多元歸集能力。我們需要借助自然語言處理技術(shù)、文本挖掘技術(shù)識別哪些數(shù)據(jù)對未來應用是有用的,這是我們在整個數(shù)據(jù)歸集當中非常重要的體現(xiàn)。信息技術(shù)發(fā)展多年,很重要的一點就是減少編碼,讓我們的可視化操作更簡單,更符合用戶的需求。第二,數(shù)據(jù)智能處理能力。其實,就是文本挖掘。由于整合的都是非結(jié)構(gòu)化數(shù)據(jù),要求接入的所有數(shù)據(jù)都能達標,達標的目標是什么?輔助決策,提高政府理政效能,基于這些標簽進行后續(xù)管理。? ? 第三,數(shù)據(jù)共享聯(lián)通能力。國家層面經(jīng)常強調(diào)政務透明化,公開常態(tài)化。公開常態(tài)化的目標實際上是要將數(shù)據(jù)更好地進行共享和共用,拓爾思統(tǒng)一政務信息資源庫實際上就是為了滿足共享共用的目標。借助拓爾思的核心產(chǎn)品,將這些非結(jié)構(gòu)化數(shù)據(jù)、文本、圖片、視頻,包括打完標簽以后的結(jié)果共享給其他應用系統(tǒng)。第四,數(shù)據(jù)多樣授權(quán)能力。其實在整個信息化建設過程當中,安全一直很重要。資源庫按照用戶、資源、數(shù)據(jù)類型、業(yè)務種類一季不同來源的數(shù)據(jù)進行權(quán)限劃分,將權(quán)限進行詳細管理。第五,數(shù)據(jù)立體監(jiān)管能力。所有的數(shù)據(jù),不管是內(nèi)部應用數(shù)據(jù)還是對外服務數(shù)據(jù),都需要在整合以后對內(nèi)容進行監(jiān)管的。因為可能對方的系統(tǒng)數(shù)據(jù)沒有進行安全監(jiān)管,作為統(tǒng)一資源庫就需要承擔安全監(jiān)管的能力,這里面包括審閱、核查、智能校對等,都是基于自然語言處理技術(shù)。第六,數(shù)據(jù)智能應用能力。整個監(jiān)管過程需要進行流程軌跡追蹤,然后通過統(tǒng)一信息資源庫進行分析,才能知道這些數(shù)據(jù)的應用效果。
這些數(shù)據(jù)的目標服務人群除了政府用戶以外,還包括公眾用戶。面向公眾用戶,我們可以打造“千人千網(wǎng)”架構(gòu)。“千人千網(wǎng)”的目標是通過每一個用戶畫像去了解用戶想知道的信息,預測這個用戶要辦理的業(yè)務,實現(xiàn)后續(xù)的主動推送。未來,在政務公開透明的基礎(chǔ)上其實也可以打造這樣一個應用。
我們面向用戶,提供了數(shù)據(jù)共享能力、數(shù)據(jù)分析能力等。我們還要提高政府的理政效能,主要基于現(xiàn)有平臺的資源,通過標簽進行關(guān)聯(lián)和預警。(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)