縱覽數(shù)據(jù)全貌,由組織數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)構(gòu)成的大體量、多類型、高實(shí)時(shí)、自生長(zhǎng)的大數(shù)據(jù)作為生產(chǎn)要素,有效整合了多維海量的數(shù)據(jù)資源。
—浪潮卓數(shù)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司總經(jīng)理徐宏偉
當(dāng)前,發(fā)展新基建已成為國(guó)家戰(zhàn)略部署重點(diǎn),而大數(shù)據(jù)對(duì)新基建發(fā)展有著重要的作用,不管是在5G、大數(shù)據(jù)中心,還是人工智能、工業(yè)互聯(lián)網(wǎng)等領(lǐng)域,大數(shù)據(jù)企業(yè)都扮演著重要的角色。在大數(shù)據(jù)領(lǐng)域,我們主要圍繞三個(gè)數(shù)據(jù)要素,即企業(yè)內(nèi)部數(shù)據(jù)、消費(fèi)互聯(lián)網(wǎng)的數(shù)據(jù)、工業(yè)互聯(lián)網(wǎng)的數(shù)據(jù)進(jìn)行研究。
具體來看,浪潮卓數(shù)圍繞著數(shù)據(jù)在五個(gè)方面進(jìn)行了探索:數(shù)據(jù)資源、數(shù)據(jù)平臺(tái)建設(shè)、大數(shù)據(jù)應(yīng)用、數(shù)據(jù)交易和數(shù)據(jù)流通、數(shù)據(jù)產(chǎn)業(yè)生態(tài)。我們還推出了大數(shù)據(jù)的操作系統(tǒng),通過與合作伙伴一起學(xué)習(xí)、完善,提高數(shù)據(jù)匯聚、集成、建模、互相交換的頻率。
我們認(rèn)為大數(shù)據(jù)企業(yè)不需要與同業(yè)伙伴進(jìn)行大范圍的競(jìng)爭(zhēng),因?yàn)樵诓煌念I(lǐng)域,平臺(tái)的使用需求是不一樣的。在互聯(lián)網(wǎng)數(shù)據(jù)處理領(lǐng)域,平臺(tái)需要對(duì)大量數(shù)據(jù)進(jìn)行并發(fā)處理并采集內(nèi)容;在政務(wù)領(lǐng)域,企業(yè)的需求主要圍繞著數(shù)據(jù)目錄的管理和數(shù)據(jù)標(biāo)準(zhǔn)體系的建設(shè)。不同的內(nèi)容有不同的解釋和含義,因此,數(shù)據(jù)平臺(tái)的建設(shè)應(yīng)該是個(gè)性化、多樣化的,這樣才能滿足不同行業(yè)的需求。
為了解決數(shù)據(jù)來源的問題,我們建立了采集、使用數(shù)據(jù)的流程,即采集公開數(shù)據(jù)、服務(wù)宏觀決策、服務(wù)行業(yè)智庫、進(jìn)行經(jīng)濟(jì)分析。我們采集的數(shù)據(jù)不涉及個(gè)人、企業(yè)的隱私數(shù)據(jù)。
對(duì)于一些涉及隱私的數(shù)據(jù),我們建立隱私保障體系。在建立了這個(gè)體系后,我們開始著手開發(fā)數(shù)據(jù)應(yīng)用。由于爬蟲很難把互聯(lián)網(wǎng)的數(shù)據(jù)全部抓取,我們采用采樣的方式,抽取互聯(lián)網(wǎng)數(shù)據(jù)整體約50%~60%的樣本?;谶@個(gè)樣本,我們利用一些算法和機(jī)器學(xué)習(xí)的技術(shù)進(jìn)行全量預(yù)測(cè),將得出的結(jié)果用于行業(yè)的宏觀分析。傳統(tǒng)的統(tǒng)計(jì)模式是對(duì)每個(gè)統(tǒng)計(jì)課題做一次調(diào)查,而由于我們收集了50%~60%的互聯(lián)網(wǎng)數(shù)據(jù)樣本,這個(gè)樣本可以完成很多課題,智庫、咨詢機(jī)構(gòu)也可以直接通過分析這個(gè)樣本得出結(jié)果。
按照主管部門的委托,我們?yōu)檎块T提供數(shù)據(jù)統(tǒng)計(jì)和數(shù)據(jù)管理的支撐。我們?cè)诳箵粜鹿诜窝滓咔槠陂g幫助商務(wù)部收集全國(guó)商品價(jià)格變化數(shù)據(jù),幫助其了解供需波動(dòng)以及價(jià)格變化的趨勢(shì);采集企業(yè)和個(gè)人征信牌照數(shù)據(jù);推廣工業(yè)互聯(lián)網(wǎng),采集互聯(lián)網(wǎng)數(shù)據(jù),通過產(chǎn)業(yè)鏈協(xié)同需求,不斷完善采集內(nèi)容。針對(duì)一些具體的企業(yè)數(shù)據(jù),我們建立了兩授權(quán)一服務(wù)機(jī)制。這個(gè)機(jī)制就是將管理者數(shù)據(jù)主體的數(shù)據(jù)通過單位的服務(wù)協(xié)議進(jìn)行連接,并借助區(qū)塊鏈技術(shù),形成相關(guān)的方案,保證數(shù)據(jù)做到“無授權(quán)不用”。
在企業(yè)信息數(shù)據(jù)領(lǐng)域也有很多大數(shù)據(jù)的應(yīng)用場(chǎng)景,如查詢企業(yè)信用、企業(yè)評(píng)價(jià)等。浪潮主要聚焦于政府監(jiān)管領(lǐng)域,如國(guó)資監(jiān)管、招商部門、市場(chǎng)監(jiān)管部門、稅務(wù)監(jiān)管部門,通過分析這些數(shù)據(jù)產(chǎn)生的成果,建構(gòu)信用模型算法,形成相關(guān)的數(shù)據(jù)體系。
在技術(shù)方面,為了拓展技術(shù)體系,我們開始把聯(lián)邦學(xué)習(xí)、對(duì)偶學(xué)習(xí)等技術(shù)列入使用清單。浪潮卓數(shù)的業(yè)務(wù)核心是把算法、技術(shù)連接在一起,形成相關(guān)的產(chǎn)品,如征信報(bào)告、風(fēng)險(xiǎn)判斷的技術(shù)和指標(biāo)、銀行風(fēng)控模型的把控、準(zhǔn)入和反欺詐初期的評(píng)分和評(píng)比、精準(zhǔn)營(yíng)銷、貸后預(yù)警等。2019年我們已經(jīng)幫助12家銀行完成了這些業(yè)務(wù)內(nèi)容。2019年我們還通過算法解決了數(shù)據(jù)的可用可見問題。
浪潮卓數(shù)還提供了一些圍繞中小企業(yè)融資服務(wù)的解決方案,處理了來自政府、企業(yè)相關(guān)的數(shù)據(jù),協(xié)助96個(gè)城市小企業(yè)進(jìn)行數(shù)字金融放貸。傳統(tǒng)的貸款業(yè)務(wù)營(yíng)業(yè)額較少,但意義重大,浪潮卓數(shù)銜接的貸款產(chǎn)品大部分是這種來自銀行的普惠性產(chǎn)品,利率較低。但很多銀行需要建立一個(gè)線上化的貸款系統(tǒng),我們將這些業(yè)務(wù)銜接起來,幫助小型金融機(jī)構(gòu)實(shí)現(xiàn)線上貸款。
下面介紹一下我們?cè)跀?shù)據(jù)流通領(lǐng)域的一個(gè)案例。從2019年開始,我們圍繞行業(yè)場(chǎng)景的數(shù)據(jù)流通交易體系進(jìn)行探索,開展了基于電力數(shù)據(jù)的交易體系研究。電力行業(yè)與數(shù)據(jù)交易系統(tǒng)很像,電力是自然流動(dòng)的交易系統(tǒng)。一些企業(yè)在價(jià)格相對(duì)便宜的時(shí)候買電,在用電高峰的時(shí)候減少自己的用電量。這個(gè)交易體系能天然地和數(shù)據(jù)銜接在一起。內(nèi)蒙電力和我們?cè)谶@一領(lǐng)域進(jìn)行了合作和探索,把售電和數(shù)據(jù)交易結(jié)合起來,在多風(fēng)的內(nèi)蒙,按時(shí)段來看,由風(fēng)能產(chǎn)生的電力,用戶早上9點(diǎn)買電可能10點(diǎn)才能使用,因此氣象數(shù)據(jù)非常有價(jià)值。但是由于很多氣象數(shù)據(jù)的采集要依托于電力設(shè)備、電力網(wǎng)絡(luò),數(shù)據(jù)要沉淀到電網(wǎng)中,而電網(wǎng)又在政府監(jiān)管之下,我們不能輕易地把電網(wǎng)數(shù)據(jù)提取出來。數(shù)據(jù)安全合規(guī)和使用的問題還需要進(jìn)一步探索。目前我們建立了一個(gè)交易體系,將相關(guān)的電力系統(tǒng)、風(fēng)能設(shè)備、設(shè)備維護(hù)公司、相關(guān)的電力規(guī)劃研究院、氣象部門、氣象服務(wù)公司等一系列機(jī)構(gòu)聚集在一起,形成了一個(gè)交易體系。這個(gè)項(xiàng)目目前還處于探索階段,沒有大規(guī)模地推廣,但是基本上形成了一個(gè)工作機(jī)制,進(jìn)行數(shù)據(jù)的采集、數(shù)據(jù)的交易、相關(guān)數(shù)據(jù)的評(píng)估以及二次使用這些數(shù)據(jù)以支撐場(chǎng)景應(yīng)用。
在這一領(lǐng)域還有很多方面需要研究,電力系統(tǒng)中還存在著很多待發(fā)掘、激活的數(shù)據(jù),如挖掘設(shè)備公司的設(shè)備數(shù)據(jù),這些都需要我們不斷地研究和探索。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)