亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)視角下科技信息知識(shí)服務(wù)平臺(tái)研究應(yīng)用
        ——以能源領(lǐng)域?yàn)槔?/h1>
        2022-06-03 08:58:20許靜玲周艷麗
        科技管理研究 2022年9期
        關(guān)鍵詞:科技服務(wù)信息

        楊 銳,陳 偉,3,張 敏,許靜玲,陳 俊,周艷麗

        (1.中國(guó)科學(xué)院武漢文獻(xiàn)情報(bào)中心,湖北武漢 430071;2.科技大數(shù)據(jù)湖北省重點(diǎn)實(shí)驗(yàn)室,湖北武漢 430071;3.中國(guó)科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院,北京 100190)

        大數(shù)據(jù)時(shí)代隨著數(shù)據(jù)資源的爆炸式增長(zhǎng)和信息技術(shù)的高速發(fā)展,以數(shù)字化轉(zhuǎn)型整體驅(qū)動(dòng)生產(chǎn)方式、生活方式和治理方式變革已經(jīng)上升到國(guó)家戰(zhàn)略層面。我國(guó)在《國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035 年遠(yuǎn)景目標(biāo)綱要》中已經(jīng)明確提出加快數(shù)字化發(fā)展[1],充分發(fā)揮海量數(shù)據(jù)和豐富應(yīng)用場(chǎng)景優(yōu)勢(shì),促進(jìn)數(shù)字技術(shù)與各行各業(yè)的深度融合。在這個(gè)大背景下如何激活數(shù)據(jù)要素潛能,更好地推進(jìn)科技信息知識(shí)服務(wù)平臺(tái)建設(shè)也是需要思考的問(wèn)題。傳統(tǒng)的科技信息服務(wù)主要包含方案規(guī)劃、資源收集、信息處理、數(shù)據(jù)分析、產(chǎn)品編制以及支撐決策的成效評(píng)估與反饋等一系列工作[2]。這一系列工作如果看成是一個(gè)情報(bào)工程化的過(guò)程,這個(gè)過(guò)程又與數(shù)據(jù)科學(xué)的各個(gè)環(huán)節(jié),包括多源異構(gòu)數(shù)據(jù)獲取、ETL 預(yù)處理、融合計(jì)算、建模分析、數(shù)據(jù)可視化和數(shù)據(jù)產(chǎn)品服務(wù)等息息相關(guān)。由此在新環(huán)境下平臺(tái)建設(shè)更需要加強(qiáng)與人工智能、云計(jì)算、大數(shù)據(jù)等新興技術(shù)手段進(jìn)行有效融合,以此來(lái)推動(dòng)科技信息服務(wù)朝著信息化、數(shù)字化、智能化方向加速演進(jìn)。

        1 科技信息知識(shí)服務(wù)平臺(tái)建設(shè)現(xiàn)狀

        2007 年圖靈獎(jiǎng)獲得者James Gray 在美國(guó)加州召開(kāi)的計(jì)算機(jī)科學(xué)與電信委員會(huì)會(huì)議上首次描繪了關(guān)于科學(xué)研究第四范式的愿景,指出針對(duì)數(shù)據(jù)密集型科學(xué)正在由傳統(tǒng)假設(shè)驅(qū)動(dòng)向基于數(shù)據(jù)驅(qū)動(dòng)的科學(xué)研究方法進(jìn)行轉(zhuǎn)變[3]。由微軟副總裁Tong Hey 等[4]撰寫(xiě)的《第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)》一書(shū)中也探討了這種新范式的內(nèi)涵和內(nèi)容,包括多樣化工具不間斷采集科研數(shù)據(jù)、建立系統(tǒng)化工具和設(shè)施來(lái)管理整個(gè)數(shù)據(jù)生命周期、開(kāi)發(fā)基于科學(xué)研究問(wèn)題的數(shù)據(jù)分析及可視化工具與方法等,這些都為把握科研環(huán)境與科研方法的革命性變化以及做好科技信息知識(shí)服務(wù)提供了戰(zhàn)略視角[5-6]。

        1.1 對(duì)于數(shù)據(jù)驅(qū)動(dòng)的重要性缺乏充分認(rèn)識(shí)

        大數(shù)據(jù)的核心價(jià)值在于面對(duì)海量數(shù)據(jù)能夠有效利用技術(shù)手段來(lái)提供智能化決策服務(wù),同時(shí)通過(guò)大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)挖掘分析并發(fā)現(xiàn)數(shù)據(jù)規(guī)律,能夠提高人們對(duì)問(wèn)題的理解和處置能力[7]。因?yàn)閿?shù)據(jù)本身不產(chǎn)生價(jià)值,所以在科技信息知識(shí)服務(wù)平臺(tái)中終端用戶關(guān)注點(diǎn)主要集中在通過(guò)各種挖掘分析工具所產(chǎn)生的知識(shí)、規(guī)律和經(jīng)驗(yàn)等科學(xué)依據(jù)的解讀,而技術(shù)研發(fā)人員更多關(guān)注的是如何用傳統(tǒng)的信息技術(shù)方法來(lái)快速實(shí)現(xiàn)科技信息數(shù)據(jù)資源的揭示,不同的角度導(dǎo)致科技信息知識(shí)服務(wù)平臺(tái)難以發(fā)揮較好的效果。圍繞數(shù)據(jù)驅(qū)動(dòng)的思路則需要終端用戶和技術(shù)研發(fā)人員都充分認(rèn)識(shí)到數(shù)據(jù)驅(qū)動(dòng)的重要性,從實(shí)際應(yīng)用場(chǎng)景和需求出發(fā)開(kāi)展緊密合作,才能打通從科技數(shù)據(jù)資源獲取到數(shù)據(jù)產(chǎn)品服務(wù)全鏈條,從而充分體現(xiàn)出科技信息知識(shí)服務(wù)平臺(tái)的價(jià)值[8-9]。2020 年10 月,美國(guó)國(guó)防部發(fā)布《數(shù)據(jù)戰(zhàn)略》報(bào)告,見(jiàn)圖1,強(qiáng)調(diào)國(guó)防部將加速轉(zhuǎn)型為以數(shù)據(jù)為中心的機(jī)構(gòu),并從數(shù)據(jù)支撐決策、數(shù)據(jù)資產(chǎn)管理、大數(shù)據(jù)云技術(shù)架構(gòu)、共享標(biāo)準(zhǔn)以及數(shù)據(jù)治理方法等多個(gè)方面明確了指導(dǎo)原則和目標(biāo),將數(shù)據(jù)提升到了國(guó)家戰(zhàn)略資產(chǎn)的高度[10]。強(qiáng)化數(shù)據(jù)驅(qū)動(dòng)的重要性對(duì)于科研機(jī)構(gòu)來(lái)說(shuō)同樣具有較強(qiáng)的借鑒作用,高度重視數(shù)據(jù)驅(qū)動(dòng)帶來(lái)的價(jià)值將會(huì)有效推動(dòng)科技信息知識(shí)服務(wù)平臺(tái)的跨越式發(fā)展。

        圖1 美國(guó)《數(shù)據(jù)戰(zhàn)略》報(bào)告主要內(nèi)容

        1.2 對(duì)于新興技術(shù)方法的優(yōu)勢(shì)缺乏足夠體驗(yàn)

        對(duì)于技術(shù)研發(fā)人員來(lái)說(shuō),通常會(huì)利用各自獨(dú)特的專(zhuān)業(yè)工具、思路和方法去應(yīng)對(duì)各種服務(wù)需求和具體任務(wù),圍繞特定的信息源而設(shè)計(jì)分析場(chǎng)景,利用傳統(tǒng)的技術(shù)來(lái)收集信息并提供服務(wù)產(chǎn)品。同時(shí),隨著新環(huán)境的快速演變和出現(xiàn)以及決策周期的加快,使得技術(shù)研發(fā)人員沒(méi)有時(shí)間去考慮如何將新興技術(shù)手段整合到全源科技信息分析過(guò)程中,對(duì)于新興技術(shù)產(chǎn)生及時(shí)準(zhǔn)確的分析效果以及具備決策優(yōu)勢(shì)的能力更加缺乏體驗(yàn)。2020 年4 月美國(guó)戰(zhàn)略與國(guó)際問(wèn)題研究中心發(fā)布了題為《情報(bào)優(yōu)勢(shì):新興技術(shù)給美國(guó)情報(bào)帶來(lái)的機(jī)遇與挑戰(zhàn)》的專(zhuān)項(xiàng)報(bào)告,圍繞新興技術(shù)如何影響情報(bào)分析這一特定領(lǐng)域的核心過(guò)程,系統(tǒng)闡述了美國(guó)利用人工智能、機(jī)器學(xué)習(xí)等新興技術(shù)為情報(bào)機(jī)構(gòu)賦能的應(yīng)用場(chǎng)景,包括云計(jì)算、人工智能和機(jī)器學(xué)習(xí)等新興技術(shù)針對(duì)海量數(shù)據(jù)在信息收集過(guò)程中進(jìn)行精準(zhǔn)識(shí)別和分類(lèi)、在信息分析過(guò)程中進(jìn)行智能搜索、數(shù)據(jù)融合和數(shù)據(jù)可視化,增強(qiáng)分析結(jié)果的可信度、在信息傳遞過(guò)程中精準(zhǔn)推送定制的數(shù)據(jù)資源等。這些場(chǎng)景在數(shù)據(jù)驅(qū)動(dòng)的大環(huán)境下更需要突破傳統(tǒng)思維方式,加強(qiáng)科技信息知識(shí)服務(wù)平臺(tái)各個(gè)環(huán)節(jié)與新興技術(shù)有機(jī)融合,才能切實(shí)感受到技術(shù)手段對(duì)于不同的知識(shí)服務(wù)需求的理解和處置能力的提升。

        2 科技信息知識(shí)服務(wù)平臺(tái)建設(shè)思路

        大數(shù)據(jù)環(huán)境下的科技信息知識(shí)服務(wù)平臺(tái)建設(shè)需要以數(shù)據(jù)驅(qū)動(dòng)為導(dǎo)向,從實(shí)際情況出發(fā),規(guī)劃好服務(wù)定位目標(biāo)。在這個(gè)基礎(chǔ)上進(jìn)一步明確具體需要解決的問(wèn)題,不同的問(wèn)題需要不同的數(shù)據(jù)資源體系進(jìn)行支撐,同時(shí)選擇適合的大數(shù)據(jù)架構(gòu)進(jìn)行功能開(kāi)發(fā)。科技信息知識(shí)服務(wù)平臺(tái)建設(shè)與構(gòu)建符合大數(shù)據(jù)時(shí)代的,具有創(chuàng)新性、靈活性的“大中臺(tái)、小前臺(tái)”的思路可以保持一致,即需要大中臺(tái)集合數(shù)據(jù)治理能力、技術(shù)服務(wù)能力,對(duì)各種前臺(tái)服務(wù)形成強(qiáng)有力的支撐,同時(shí)作為小前臺(tái)的一線服務(wù)功能則需要更敏捷、更快速的適應(yīng)瞬息萬(wàn)變的需求。

        2.1 科技信息知識(shí)服務(wù)數(shù)據(jù)大中臺(tái)

        “數(shù)據(jù)中臺(tái)”的概念由阿里巴巴首次提出,它是一個(gè)承接技術(shù)、引領(lǐng)業(yè)務(wù)、構(gòu)建規(guī)范的智慧數(shù)據(jù)處理生態(tài)圈。它的最終應(yīng)用價(jià)值在于推動(dòng)各個(gè)行業(yè)大數(shù)據(jù)應(yīng)用向智能化發(fā)展,能夠保持并提升核心數(shù)據(jù)業(yè)務(wù)的服務(wù)效率和創(chuàng)新能力。近幾年繼阿里、騰訊、百度、網(wǎng)易、京東等互聯(lián)網(wǎng)公司先后調(diào)整組織架構(gòu)、實(shí)施數(shù)據(jù)中臺(tái)戰(zhàn)略后,國(guó)內(nèi)不少機(jī)構(gòu)逐步開(kāi)始建設(shè)自己的數(shù)據(jù)中臺(tái)[11]。其中福建省科學(xué)技術(shù)信息研究所在分析區(qū)域科技創(chuàng)新智庫(kù)對(duì)科技信息知識(shí)服務(wù)需求的基礎(chǔ)上,將服務(wù)中臺(tái)設(shè)計(jì)思想與面向區(qū)域科技創(chuàng)新智庫(kù)建設(shè)的科技信息服務(wù)平臺(tái)體系進(jìn)行有效融合,建立了由科技大數(shù)據(jù)中臺(tái)、情報(bào)研究與服務(wù)中臺(tái)、產(chǎn)品服務(wù)體系中臺(tái)、開(kāi)放研究與協(xié)同服務(wù)中臺(tái)組成的中臺(tái)體系架構(gòu)[12]。

        數(shù)據(jù)中臺(tái)思路應(yīng)用于科技信息知識(shí)服務(wù)平臺(tái)建設(shè),見(jiàn)圖2,從數(shù)據(jù)治理維度可以解決科研機(jī)構(gòu)內(nèi)部系統(tǒng)間的數(shù)據(jù)孤島問(wèn)題,將不同系統(tǒng)的數(shù)據(jù)進(jìn)行全面匯集,理清各類(lèi)平臺(tái)數(shù)據(jù)間的脈絡(luò)及關(guān)系,制定統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,通過(guò)元數(shù)據(jù)管理、主數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理以及數(shù)據(jù)安全管理等形成全量數(shù)據(jù)資產(chǎn)并能夠有效支撐數(shù)據(jù)服務(wù),解決科技大數(shù)據(jù)的“匯管用”的問(wèn)題[13-14]。從數(shù)據(jù)處理維度看數(shù)據(jù)中臺(tái)是一種“開(kāi)放+統(tǒng)一”的架構(gòu),這種架構(gòu)能夠讓數(shù)據(jù)流動(dòng)起來(lái)為不同的信息服務(wù)業(yè)務(wù)賦能,不斷沉淀與業(yè)務(wù)相關(guān)的各種數(shù)據(jù)處理能力。通過(guò)數(shù)據(jù)的共享融合、組織處理、建模分析、管理治理和服務(wù)應(yīng)用,實(shí)現(xiàn)創(chuàng)新服務(wù)功能的快速上線與迭代更新,從而發(fā)揮數(shù)據(jù)資產(chǎn)的最大價(jià)值。

        圖2 科技信息知識(shí)服務(wù)數(shù)據(jù)大中臺(tái)

        2.2 科技信息知識(shí)服務(wù)應(yīng)用“小前臺(tái)”

        數(shù)據(jù)小前臺(tái)的本質(zhì)是在大數(shù)據(jù)環(huán)境下的一種敏捷化應(yīng)用模式。敏捷大數(shù)據(jù)是指在敏捷理念指導(dǎo)下的大數(shù)據(jù)應(yīng)用全生命周期理論方法,包括數(shù)據(jù)科學(xué)的迭代性和高效組件化技術(shù)[15]。敏捷大數(shù)據(jù)避免復(fù)雜的集中式平臺(tái)管理,將傳統(tǒng)“一站式”服務(wù)拆分成獨(dú)立服務(wù),來(lái)支撐更輕量和更靈活的大數(shù)據(jù)應(yīng)用。全球IT 研究與顧問(wèn)咨詢公司Gartner 發(fā)布的2021 年十大數(shù)據(jù)和分析趨勢(shì)報(bào)告中談到組裝式數(shù)據(jù)架構(gòu),利用組裝式數(shù)據(jù)架構(gòu)可以將多個(gè)業(yè)務(wù)組件組合成新的應(yīng)用來(lái)促進(jìn)系統(tǒng)平臺(tái)的敏捷性和創(chuàng)新性,同時(shí)指出面對(duì)日益復(fù)雜的人工智能數(shù)據(jù)用例稀缺的挑戰(zhàn),許多機(jī)構(gòu)正在逐步通過(guò)組裝式數(shù)據(jù)架構(gòu)來(lái)使用小而寬的數(shù)據(jù),利用小而寬的數(shù)據(jù)協(xié)同效果來(lái)增強(qiáng)情境感知和決策[16]。作為敏捷大數(shù)據(jù)典型應(yīng)用場(chǎng)景的微服務(wù)開(kāi)發(fā)模式目前已經(jīng)成為大數(shù)據(jù)應(yīng)用的熱點(diǎn)方向之一,包括谷歌、亞馬遜、Facebook、百度以及京東等互聯(lián)網(wǎng)公司都在使用微服務(wù)理念進(jìn)行平臺(tái)設(shè)計(jì)、研發(fā)和部署。敏捷開(kāi)發(fā)創(chuàng)始人馬丁·福勒對(duì)微服務(wù)給出了明確描述,微服務(wù)是一種使用若干小服務(wù)來(lái)開(kāi)發(fā)單個(gè)應(yīng)用的方法,每個(gè)服務(wù)運(yùn)行在自己的進(jìn)程中,通過(guò)輕量級(jí)的通訊機(jī)制進(jìn)行信息交互,每個(gè)服務(wù)粒度基于業(yè)務(wù)能力大小構(gòu)建,最終服務(wù)能夠通過(guò)自動(dòng)化方式獨(dú)立部署[17]。

        將敏捷大數(shù)據(jù)思路應(yīng)用于科技信息知識(shí)服務(wù)平臺(tái)建設(shè)主要考慮到兩個(gè)方面的因素。一方面現(xiàn)階段各類(lèi)大數(shù)據(jù)開(kāi)源技術(shù)和組件層出不窮,涉及的生態(tài)體系復(fù)雜,技術(shù)門(mén)檻也相對(duì)較高。從科技信息知識(shí)服務(wù)平臺(tái)建設(shè)的角度要完全適應(yīng)這樣的技術(shù)變革還需要時(shí)間去沉淀,尤其需要學(xué)術(shù)研究和工程實(shí)踐的有機(jī)融合,同時(shí)需要考慮到時(shí)間和人財(cái)物等各方面的因素,因此在平臺(tái)建設(shè)方面更適合采用一種能夠持續(xù)性自適應(yīng)迭代和優(yōu)化的應(yīng)用架構(gòu)。另一方面由于科技信息知識(shí)服務(wù)中臺(tái)所處理的數(shù)據(jù)資源類(lèi)型廣泛,包括熱點(diǎn)動(dòng)態(tài)、政策規(guī)劃、項(xiàng)目經(jīng)費(fèi)、科研產(chǎn)出以及成果影響等各種類(lèi)型,而且在知識(shí)服務(wù)功能需求方面靈活多樣,包括熱點(diǎn)信息監(jiān)測(cè)、政策文本分析、成果統(tǒng)計(jì)分析、競(jìng)爭(zhēng)力分析評(píng)估以及科研態(tài)勢(shì)感知數(shù)據(jù)大屏可視化和領(lǐng)域?qū)W術(shù)知識(shí)圖譜構(gòu)建等,利用微服務(wù)的服務(wù)描述、注冊(cè)中心、服務(wù)架構(gòu)、服務(wù)監(jiān)控、服務(wù)跟蹤和服務(wù)治理等技術(shù)組件可以更好地對(duì)功能進(jìn)行分解,快速靈活地進(jìn)行業(yè)務(wù)組件化設(shè)計(jì)、模型標(biāo)準(zhǔn)化配置,達(dá)到去中心化、快速原型以及持續(xù)交付部署等效果[18-19]?;谝陨戏治觯O(shè)計(jì)科技信息知識(shí)服務(wù)應(yīng)用“小前臺(tái)”的基礎(chǔ)架構(gòu)如圖3 所示。

        圖3 科技信息知識(shí)服務(wù)應(yīng)用小前臺(tái)

        3 科技信息知識(shí)服務(wù)平臺(tái)建設(shè)實(shí)踐

        將“大中臺(tái)、小前臺(tái)”的思路應(yīng)用于能源科技知識(shí)服務(wù)平臺(tái)建設(shè),構(gòu)建面向國(guó)家和中國(guó)科學(xué)院宏觀戰(zhàn)略決策需求的能源領(lǐng)域科技大數(shù)據(jù)應(yīng)用服務(wù)新模式。作為構(gòu)建領(lǐng)域大數(shù)據(jù)基礎(chǔ)設(shè)施的重要內(nèi)容,平臺(tái)以自主建設(shè)的能源領(lǐng)域科技態(tài)勢(shì)高質(zhì)量大數(shù)據(jù)資源體系為基礎(chǔ),支撐開(kāi)展數(shù)據(jù)驅(qū)動(dòng)型信息咨詢服務(wù),發(fā)布系列化數(shù)據(jù)分析與研究報(bào)告等決策支持產(chǎn)品,為科技決策者、戰(zhàn)略科學(xué)家和科技管理人員提供高質(zhì)量的知識(shí)服務(wù)產(chǎn)品。

        3.1 總體架構(gòu)

        能源科技知識(shí)服務(wù)平臺(tái)建設(shè)總體架構(gòu)設(shè)計(jì)以科技信息數(shù)據(jù)治理大中臺(tái)和知識(shí)服務(wù)小前臺(tái)為支撐提供敏捷化應(yīng)用模式,能源科技知識(shí)服務(wù)平臺(tái)總體架構(gòu)見(jiàn)圖4。

        圖4 能源科技知識(shí)服務(wù)平臺(tái)總體架構(gòu)

        3.2 實(shí)施方案

        目前大數(shù)據(jù)環(huán)境下不管是在存儲(chǔ)管理、挖掘分析、可視化展示以及安全保障等方面,各種技術(shù)框架工具已經(jīng)趨于成熟,綜合各方面因素能源科技知識(shí)服務(wù)平臺(tái)建設(shè)采用能夠持續(xù)性自適應(yīng)迭代和優(yōu)化的敏捷大數(shù)據(jù)應(yīng)用架構(gòu),同時(shí)借鑒數(shù)據(jù)中臺(tái)的設(shè)計(jì)思路對(duì)分散在不同系統(tǒng)上的多源異構(gòu)數(shù)據(jù)資源進(jìn)行有效治理,通過(guò)微服務(wù)技術(shù)快速構(gòu)建各項(xiàng)支撐決策的知識(shí)服務(wù)功能。

        3.2.1 能源科技大數(shù)據(jù)資源體系

        能源領(lǐng)域數(shù)據(jù)資源體量大、涉及面廣,圍繞政策、經(jīng)費(fèi)、項(xiàng)目、機(jī)構(gòu)、人才、設(shè)施平臺(tái)、論文、專(zhuān)利、標(biāo)準(zhǔn)、報(bào)告、成果、獎(jiǎng)項(xiàng)、產(chǎn)業(yè)經(jīng)濟(jì)等數(shù)據(jù)資源類(lèi)型,各個(gè)環(huán)節(jié)信息龐雜、復(fù)雜度高,但同時(shí)公開(kāi)可獲得性好,數(shù)據(jù)具備強(qiáng)烈的相互關(guān)聯(lián)性,具有構(gòu)建大數(shù)據(jù)資源體系的基礎(chǔ)和可行性。前期通過(guò)對(duì)各種能源領(lǐng)域相關(guān)的異構(gòu)權(quán)威網(wǎng)站和數(shù)據(jù)庫(kù)資源梳理分析以及開(kāi)展文獻(xiàn)資料調(diào)研和專(zhuān)家咨詢等方式,發(fā)現(xiàn)、遴選和評(píng)價(jià)不同來(lái)源、不同類(lèi)型的高質(zhì)量數(shù)據(jù)源。在梳理數(shù)據(jù)資源的基礎(chǔ)上進(jìn)一步構(gòu)建標(biāo)準(zhǔn)規(guī)范體系,包括數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范、質(zhì)量管理規(guī)范、數(shù)據(jù)服務(wù)規(guī)范以及數(shù)據(jù)安全規(guī)范等,從而建立貫穿數(shù)據(jù)全生命周期的質(zhì)量控制機(jī)制。見(jiàn)圖5,目前已經(jīng)從科技投入和科技產(chǎn)出兩個(gè)維度構(gòu)建能源科技態(tài)勢(shì)大數(shù)據(jù)資源體系,共十三個(gè)一級(jí)、數(shù)十個(gè)二級(jí)和上百個(gè)三級(jí)數(shù)據(jù)集。

        圖5 能源科技大數(shù)據(jù)資源體系

        3.2.2 能源科技大數(shù)據(jù)治理框架

        能源科技知識(shí)服務(wù)平臺(tái)建設(shè)主要依托中國(guó)科學(xué)院科技云武漢區(qū)域中心大數(shù)據(jù)分布式環(huán)境,見(jiàn)圖6,在數(shù)據(jù)治理方面設(shè)計(jì)高可用流式計(jì)算框架作為數(shù)據(jù)交換、處理和服務(wù)的底層核心架構(gòu)[20-21]。

        圖6 能源科技知識(shí)服務(wù)大數(shù)據(jù)治理框架

        (1)數(shù)據(jù)交換方面包括三種情況,一是自建的各類(lèi)能源領(lǐng)域?qū)I(yè)平臺(tái)的非結(jié)構(gòu)化、半結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)集成,采用數(shù)據(jù)總線技術(shù)無(wú)侵入同步源端數(shù)據(jù),以全量和實(shí)時(shí)增量數(shù)據(jù)抽取的方式進(jìn)行數(shù)據(jù)遷移和交換;二是能源領(lǐng)域動(dòng)態(tài)科技監(jiān)測(cè)實(shí)時(shí)流數(shù)據(jù)的集成,監(jiān)測(cè)實(shí)時(shí)數(shù)據(jù)流主要包括隨時(shí)間延續(xù)而無(wú)限增長(zhǎng)的能源領(lǐng)域動(dòng)態(tài)新聞數(shù)據(jù)集合;三是能源領(lǐng)域公共數(shù)據(jù)的集成,包括能源領(lǐng)域重點(diǎn)機(jī)構(gòu)網(wǎng)站的開(kāi)放數(shù)據(jù)、開(kāi)放平臺(tái)的數(shù)據(jù)接口調(diào)用等。對(duì)以上獲取到的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、清洗和隱私脫敏等預(yù)處理工作以后,集成處理后的數(shù)據(jù)以UMS 的格式存儲(chǔ)到Kafka 中。數(shù)據(jù)交換環(huán)節(jié)在不影響原有系統(tǒng)的前提下,解決了數(shù)據(jù)的實(shí)時(shí)同步和更新問(wèn)題。

        (2)數(shù)據(jù)處理方面能源科技知識(shí)服務(wù)平臺(tái)通過(guò)Kafka 同步獲取數(shù)據(jù)資源以后,根據(jù)數(shù)據(jù)的特征和質(zhì)量利用Spark Streaming 流式計(jì)算引擎來(lái)進(jìn)行數(shù)據(jù)處理。Spark Streaming 是建立在Spark 之上的流式計(jì)算框架,通過(guò)API 和基于內(nèi)存的高速計(jì)算引擎配置流式處理邏輯,通過(guò)這種方式可以對(duì)每個(gè)時(shí)間段內(nèi)收集到的數(shù)據(jù)序列使用批處理模式進(jìn)行micro-batch流式計(jì)算[22]。能源科技知識(shí)服務(wù)平臺(tái)采用Spark Streaming 流式計(jì)算引擎進(jìn)行數(shù)據(jù)處理,更加精細(xì)靈活地利用了計(jì)算資源,可以提高多個(gè)計(jì)算任務(wù)并行處理效率,同時(shí)流式計(jì)算引擎在應(yīng)對(duì)實(shí)時(shí)性以及時(shí)效性要求較高的服務(wù)模塊時(shí)優(yōu)勢(shì)也較為明顯,能夠最大程度地發(fā)揮數(shù)據(jù)資源的價(jià)值,數(shù)據(jù)資源經(jīng)過(guò)Spark Streaming 處理完之后再寫(xiě)到不同的存儲(chǔ)中。

        (3)數(shù)據(jù)服務(wù)方面主要是對(duì)流式計(jì)算引擎處理過(guò)的數(shù)據(jù)資源進(jìn)行調(diào)用,根據(jù)能源科技知識(shí)服務(wù)平臺(tái)的不同業(yè)務(wù)需求實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)資源的融合計(jì)算,計(jì)算完成的數(shù)據(jù)經(jīng)過(guò)標(biāo)準(zhǔn)化治理以后通過(guò)接口提供給數(shù)據(jù)應(yīng)用層。其中在中臺(tái)管理和數(shù)據(jù)治理方面相關(guān)的功能重點(diǎn)集中在這部分實(shí)現(xiàn),包括中臺(tái)管理中涉及到的租戶、用戶、資產(chǎn)、安全等中臺(tái)核心數(shù)據(jù)管理功能以及數(shù)據(jù)治理中涉及到的元數(shù)據(jù)、主數(shù)據(jù)等中臺(tái)核心數(shù)據(jù)治理功能。例如元數(shù)據(jù)管理方面,在數(shù)據(jù)服務(wù)層面直接進(jìn)行各類(lèi)數(shù)據(jù)的元數(shù)據(jù)采集并進(jìn)行血緣關(guān)系分析,包括源頭數(shù)據(jù)對(duì)應(yīng)用數(shù)據(jù)的影響以及應(yīng)用數(shù)據(jù)回溯到源頭數(shù)據(jù)的診斷,通過(guò)血緣關(guān)系分析提供數(shù)據(jù)融合過(guò)程中的高質(zhì)量保障以及實(shí)現(xiàn)數(shù)據(jù)融合處理的可追溯性。

        3.2.3 能源科技知識(shí)服務(wù)支撐決策的場(chǎng)景應(yīng)用

        能源科技知識(shí)服務(wù)平臺(tái)在定位方面主要面向國(guó)家和中國(guó)科學(xué)院科技決策與管理部門(mén)不同層級(jí)的典型需求,構(gòu)建用戶情景導(dǎo)向的能源科技大數(shù)據(jù)知識(shí)服務(wù)產(chǎn)品體系[23]。通過(guò)科技信息數(shù)據(jù)中臺(tái)和微服務(wù)應(yīng)用相結(jié)合的模式對(duì)內(nèi)建立完善的能源科技數(shù)據(jù)資源與研究成果管理和共享機(jī)制;對(duì)外提供支撐決策的能源科技信息專(zhuān)項(xiàng)服務(wù)。目前能源科技知識(shí)服務(wù)平臺(tái)提供服務(wù)包括資源推薦、科技評(píng)價(jià)、政策分析、情報(bào)產(chǎn)品、專(zhuān)題服務(wù)、統(tǒng)計(jì)預(yù)測(cè)等,見(jiàn)圖7。

        圖7 能源科技知識(shí)服務(wù)平臺(tái)功能服務(wù)

        (1)資源推薦服務(wù)基于能源科技知識(shí)服務(wù)大數(shù)據(jù)資源體系對(duì)能源領(lǐng)域多源異構(gòu)科技數(shù)據(jù)資源進(jìn)行整編和匯聚,依托數(shù)據(jù)中臺(tái)形成以科技投入和科技產(chǎn)出類(lèi)數(shù)據(jù)為核心特色的高質(zhì)量能源科技態(tài)勢(shì)分布式大數(shù)據(jù)倉(cāng)儲(chǔ),涵蓋新聞動(dòng)態(tài)等十余種資源類(lèi)型并支持從技術(shù)領(lǐng)域、國(guó)家、機(jī)構(gòu)、時(shí)間、類(lèi)型等多維度進(jìn)行揭示,支持智能檢索服務(wù)。其中結(jié)合人工智能技術(shù)利用融合主題信息的卷積神經(jīng)網(wǎng)絡(luò)文本分類(lèi)方法對(duì)新聞動(dòng)態(tài)、政策法規(guī)、技術(shù)專(zhuān)利等資源類(lèi)型按技術(shù)領(lǐng)域進(jìn)行二次自動(dòng)分類(lèi),提高了用戶檢索信息資源的效率[24]。

        (2)科技評(píng)價(jià)服務(wù)構(gòu)建了原創(chuàng)性的能源科技創(chuàng)新評(píng)價(jià)指標(biāo)體系,從創(chuàng)新環(huán)境、創(chuàng)新投入、創(chuàng)新產(chǎn)出和創(chuàng)新成效四個(gè)維度揭示了世界主要國(guó)家的能源科技創(chuàng)新能力。

        (3)政策分析服務(wù)以政策法規(guī)數(shù)據(jù)資源為基礎(chǔ)借助文本預(yù)處理、命名實(shí)體識(shí)別、主題詞抽取、聚類(lèi)分析等數(shù)據(jù)挖掘技術(shù)從政策主體、政策目標(biāo)與政策工具三個(gè)維度對(duì)政策文本進(jìn)行分析。

        (4)情報(bào)產(chǎn)品服務(wù)主要包括科技監(jiān)測(cè)快報(bào)和智庫(kù)報(bào)告,發(fā)布能源科技領(lǐng)域系列化數(shù)據(jù)分析與情報(bào)研究報(bào)告等決策支持產(chǎn)品。

        (5)能源專(zhuān)題服務(wù)以碳中和行動(dòng)專(zhuān)題為示范,展示碳中和相關(guān)的新聞動(dòng)態(tài)、政策法規(guī)、輿情快報(bào)和研究報(bào)告,并以數(shù)據(jù)大屏方式進(jìn)行碳中和態(tài)勢(shì)環(huán)境可視化揭示。

        (6)統(tǒng)計(jì)預(yù)測(cè)服務(wù)主要包括科研經(jīng)費(fèi)和產(chǎn)業(yè)經(jīng)濟(jì)數(shù)據(jù)統(tǒng)計(jì)分析,科研經(jīng)費(fèi)分析,按年份、國(guó)家、技術(shù)領(lǐng)域?qū)ρ邪l(fā)與示范經(jīng)費(fèi)投入總量、研發(fā)與示范經(jīng)費(fèi)投入強(qiáng)度等指標(biāo)進(jìn)行統(tǒng)計(jì)分析和可視化展示,可選擇多個(gè)國(guó)家進(jìn)行對(duì)比分析。產(chǎn)業(yè)經(jīng)濟(jì)分析,按年份或按國(guó)家從數(shù)據(jù)來(lái)源、統(tǒng)計(jì)指標(biāo)、能源種類(lèi)等維度對(duì)能源產(chǎn)經(jīng)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析和可視化展示。

        4 結(jié)語(yǔ)

        能源科技知識(shí)服務(wù)平臺(tái)建設(shè)是大數(shù)據(jù)環(huán)境下變革科技信息知識(shí)服務(wù)模式的一次新的探索,初步形成了智能化數(shù)據(jù)驅(qū)動(dòng)方法有效嵌入科技信息知識(shí)服務(wù)平臺(tái)的新服務(wù)機(jī)制,并得到認(rèn)可。但是,能源科技信息知識(shí)服務(wù)平臺(tái)建設(shè)是一項(xiàng)長(zhǎng)期而復(fù)雜的工作,其中要素涉及多個(gè)方面,包括數(shù)據(jù)治理功能的完善、人工智能技術(shù)的應(yīng)用以及大數(shù)據(jù)應(yīng)用架構(gòu)的優(yōu)化還有待進(jìn)一步研究。

        猜你喜歡
        科技服務(wù)信息
        服務(wù)在身邊 健康每一天
        服務(wù)在身邊 健康每一天
        服務(wù)在身邊 健康每一天
        科技助我來(lái)看云
        招行30年:從“滿意服務(wù)”到“感動(dòng)服務(wù)”
        商周刊(2017年9期)2017-08-22 02:57:56
        科技在線
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        科技在線
        科技在線
        展會(huì)信息

        久久久亚洲女精品aa| 搡老熟女中国老太| 一本色道久久99一综合| 欧美巨大xxxx做受中文字幕| 亚洲乱码中文字幕三四区| 无码aⅴ精品一区二区三区| 日韩精品无码视频一区二区蜜桃 | 精品久久久久中文字幕APP| 亚洲一区二区三区av无| 国产精品一区二区三区卡| 无码福利写真片视频在线播放| 日韩国产欧美| 中文字幕久久熟女人妻av免费| 亚洲av不卡一区男人天堂| 国产精品美女久久久久久| 91伊人久久| 日韩av他人妻中文字幕| 五月激情综合婷婷六月久久| 精品国产乱码久久久久久影片| 亚洲AV永久无码精品导航| 日韩男女av中文字幕| 极品少妇xxxx精品少妇偷拍| 午夜福利92国语| 亚洲av影院一区二区三区四区| 大香蕉视频在线青青草| 国产色系视频在线观看| 国产主播一区二区三区在线观看| 亚洲国产剧情一区在线观看| 日韩精品一二三区乱码| 国产后入又长又硬| 高清国产日韩欧美| 成人激情视频一区二区三区| 伊人久久大香线蕉av不变影院| 越南女子杂交内射bbwxz| 亚洲av午夜成人片精品| av一区二区在线网站| 老太脱裤子让老头玩xxxxx| 午夜毛片午夜女人喷潮视频| 国产又湿又爽又猛的视频| 国产精品无码人妻在线| a一区二区三区乱码在线 | 欧洲|