亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大數(shù)據(jù)技術的國內(nèi)外智庫動態(tài)監(jiān)測與應用研究

        2019-04-27 01:39:02李力魏姚
        科技資訊 2019年2期
        關鍵詞:趨勢分析大數(shù)據(jù)技術

        李力 魏姚

        摘 要:近年來,智庫發(fā)展尤其迅速,基于大數(shù)據(jù)技術,對國內(nèi)外智庫進行動態(tài)監(jiān)測,在數(shù)據(jù)獲取、處理、分析挖掘、可視化等方面進行深入發(fā)掘與分析研究,可以為多種場景的應用研究提供經(jīng)驗借鑒、決策參考、趨勢分析等信息支撐服務,對加強我國智庫建設具有一定的實用價值。

        關鍵詞:大數(shù)據(jù)技術 智庫監(jiān)測 趨勢分析

        中圖分類號:G353 文獻標識碼:A 文章編號:1672-3791(2019)01(b)-00-03

        隨著社會的進程和演變,智庫作為一個地區(qū)乃至一個國家軟實力和國際話語權的重要體現(xiàn),在處理各項事務、助力決策咨詢中起到了越發(fā)重要的作用[1]。國家層面倡導的新型智庫正如火如荼的建設,地方新型智庫的建設也在蓬勃發(fā)展。在此期間,發(fā)現(xiàn)決策定位難以把握、研究方向無從估摸、成果內(nèi)容不夠深入等主要情況,這就需要對國內(nèi)外智庫進行動態(tài)監(jiān)測,從中分析出有利于我國智庫相關研究的實際應用場景,為其提供信息服務。

        1 整體概述

        針對國內(nèi)外智庫數(shù)量眾多、資源分散且無序的特點,使用大數(shù)據(jù)技術,收集來自每個智庫組織的數(shù)據(jù),匯集后的眾多不同格式的數(shù)據(jù)首先進行處理,包括數(shù)據(jù)的清洗、去重、集成、歸約、有效性檢驗;其次對數(shù)據(jù)進行挖掘,包括聚類、分類、相關性、頻繁項集、特征化;再次對數(shù)據(jù)進行可視化展示,包括折線圖、柱狀圖、餅狀圖、文字云等知識圖譜,經(jīng)過一系列的大數(shù)據(jù)處理過程,如圖1所示;最后將零亂的數(shù)據(jù)源轉化為有價值的知識,最終為實際應用提供具體服務。

        2 智庫資源內(nèi)容及采集方法

        2.1 智庫資源內(nèi)容

        智庫相關數(shù)據(jù)信息眾多,篩選出核心且精煉的指標信息,既能提升采集效率,又能為分析研究提供最有價值的服務。

        根據(jù)智庫數(shù)據(jù)的特征,將智庫資源劃分成智庫機構、智庫資訊、研究專家、研究成果四大數(shù)據(jù)體,在此基礎上,對每種數(shù)據(jù)體進行指標信息設計,如表1所示。

        對每種數(shù)據(jù)體建立起對應聯(lián)系,智庫機構以資訊進行發(fā)聲,并匯聚研究專家作為核心主體,研究專家發(fā)表其研究成果,從而形成一個完整的脈絡關系。

        2.2 數(shù)據(jù)采集方法

        按照數(shù)據(jù)體的指標信息,進行國內(nèi)外智庫資源內(nèi)容的組織。以國內(nèi)外現(xiàn)有智庫機構名錄為基礎,確立數(shù)據(jù)來源導向,可以保證動態(tài)監(jiān)測的時效性與準確性,利用Web信息采集技術對智庫資源進行獲取[2],通過該技術的應用,可以實現(xiàn)智庫資源的自動采集、編輯和標準化,數(shù)據(jù)可以就地存儲,從而脫離對人為搜索及采集數(shù)據(jù)的干預,以減少信息成本的支出,達到提升采集效率的目的。

        3 智庫數(shù)據(jù)分析處理

        通過采集開放的智庫數(shù)據(jù)具有異構性,需要對這些異構數(shù)據(jù)進行處理,包括數(shù)據(jù)清洗、集成、轉換、歸約,使其成為有用的目標數(shù)據(jù)[3]。

        (1)數(shù)據(jù)清洗:即處理缺失值,平滑降噪數(shù)據(jù),辨認或去除重復值和解決不規(guī)整的數(shù)據(jù)。如對智庫機構中的研究專家和行政人員打標區(qū)分,對有成果的專家進行保留,無成果的行政人員進行剔除,以達到數(shù)據(jù)清洗的目的。

        (2)數(shù)據(jù)集成:對不同來源的數(shù)據(jù)進行集中聚集,利用數(shù)據(jù)倉庫進行存儲。根據(jù)眾多不同智庫數(shù)據(jù)的來源,對智庫機構、研究專家、成果類型等建立統(tǒng)一的數(shù)據(jù)倉庫,每個倉庫存儲對應數(shù)據(jù),從而實現(xiàn)數(shù)據(jù)的集成。

        (3)數(shù)據(jù)轉換:目的是使數(shù)據(jù)統(tǒng)一標準化,并將數(shù)據(jù)轉換為另一種恰當?shù)男问?。由于研究成果全文的排版格式多樣,進行規(guī)范化處理,轉換成以html或PDF全文的格式進行存儲,實現(xiàn)轉換效果的提升。

        (4)數(shù)據(jù)歸約:指相同的數(shù)據(jù)在盡可能的前提下最大限度地減少數(shù)據(jù)量。從智庫機構中刪除不重要或不相關的特征,如機構的經(jīng)費情況、運作方式、審查機制等,以減少特征向量的維度。歸約后仍舊大抵保留原數(shù)據(jù)的完整性,但數(shù)據(jù)集變小。

        通過一系列的大數(shù)據(jù)處理,既提升了數(shù)據(jù)的質量,又使數(shù)據(jù)更適合挖掘技術的運用,以達到數(shù)據(jù)的快速、規(guī)范化處理。

        4 大數(shù)據(jù)挖掘技術的運用

        經(jīng)過持續(xù)的數(shù)據(jù)采集,后期的數(shù)據(jù)規(guī)模將達到海量級,從中找出隱藏的價值信息格外重要。剖析每種數(shù)據(jù)的屬性,實現(xiàn)多維分析與挖掘,將蘊含的內(nèi)在聯(lián)系揭示出來,為智庫的分析提供強有力的支撐。

        4.1 關聯(lián)挖掘

        關聯(lián)挖掘是為了找到數(shù)據(jù)項之間的關聯(lián)。通過該技術對智庫專家發(fā)布的研究成果數(shù)量來評估專家的產(chǎn)出情況,也可以通過分析專家同時署名的成果分布情況來發(fā)現(xiàn)專家之間的合作網(wǎng)絡。

        關聯(lián)挖掘選用Apriori算法。實現(xiàn)步驟:根據(jù)向下閉包性,Apriori逐層搜索,由(k-1)-項頻繁集構成k-項候選集,然后掃描數(shù)據(jù)庫找出k-項頻繁集,直到?jīng)]有新的頻繁集。此算法的優(yōu)點是在頻繁項集基礎上產(chǎn)生的,繼而能確保該算法的支持率達到合理的程度[4]。

        4.2 聚類挖掘

        聚類挖掘是按照集合內(nèi)的相似性原則將數(shù)據(jù)歸為若干個類別。通過該技術將研究成果按照國際關系、教育、經(jīng)濟、衛(wèi)生、外交等主題進行聚類,發(fā)現(xiàn)各個領域的成果信息。

        聚類挖掘采用k-means算法。實現(xiàn)步驟:K-means算法是利用樣本目標函數(shù)求從數(shù)據(jù)點到原型的距離最大值的方法,得到重復反饋運算的調整規(guī)則。K-means利用兩點間的度量距離作為相似性,以此得到某一初始聚類中心向量的最好歸類,使得評價指標最低[4]。它能簡單快速地解決聚類問題,對處理大數(shù)據(jù)該算法彈性大并且效率高,時間復雜度趨近正比例關系,比較符合大數(shù)據(jù)的挖掘需求。

        5 可視化展示

        圖像的感知速率往往大于文字內(nèi)容,經(jīng)過數(shù)據(jù)的可視化所展現(xiàn)的直觀信息將有效增加內(nèi)容的應用率。

        通過可視化技術對數(shù)據(jù)進行呈現(xiàn),實現(xiàn)年份折線圖、成果類型餅狀圖、年度柱狀圖、文字云等多種知識圖譜,提高數(shù)據(jù)本身蘊涵的價值,從而快速識別數(shù)據(jù)所呈現(xiàn)的圖譜規(guī)律。

        實現(xiàn)步驟:將數(shù)據(jù)轉化為可以觀察分析的圖像,每個圖像對應一個維度,從對應圖像上標出對應的數(shù)據(jù)情況,這樣每個維度的數(shù)據(jù)都轉換成為圖形的形式。此技術使我們能夠快速高效地簡化數(shù)據(jù)流,讓我們能夠交互地過濾大量的數(shù)據(jù),完成數(shù)據(jù)分析的任務[4]。

        6 智庫動態(tài)監(jiān)測與實際應用場景

        6.1 智庫成果趨勢分析

        通過對國內(nèi)外智庫進行動態(tài)監(jiān)測,可以對成果進行趨勢分析。以10年為一個時間跨度,如圖2所示,可以發(fā)現(xiàn)20世紀40年代至80年代,研究成果增長緩慢,但到了2000年以后,智庫成果出現(xiàn)指數(shù)級增長,特別是近20年以來,研究成果占到總數(shù)的80%以上。通過成果數(shù)量的監(jiān)測,能進行相關趨勢的研究分析。

        6.2 國際政策追蹤與預警研究

        通過對國外智庫機構的長期動態(tài)關注與監(jiān)測,國際上的對華政策通常會在國外智庫機構先行透露,對開展政策追蹤與預警研究十分必要。中國作為崛起的大國,離不開國際事務的合作參與,迫切需要借助相關研究,為我國的政策制定提供參考。

        我國2013年提出的“一帶一路”合作倡議,受到眾多國家的強烈關注,都積極加入到合作倡議中來[5]。通過動態(tài)追蹤監(jiān)測國外智庫,發(fā)現(xiàn)他們及時抓住了政策熱點,發(fā)表了自己的主張與見解,研究成果呈井噴狀態(tài),特別是在2017年達到頂峰。通過這種方式進行分析與梳理,有利于精準地把握國外政策的研究現(xiàn)狀與動向,更加科學地為我國的政策預警提供實際的應用研究。

        6.3 國際輿論監(jiān)測分析

        近代傳媒出現(xiàn)以來,國與國之間在輿論領域的戰(zhàn)爭已成為一種新的看不見的硝煙戰(zhàn)爭,輿論領域的博弈已成為國際博弈的第四種主要形式[6],在爭奪國際話語權以及引導國際輿論向有利于本國方向的發(fā)展極其重要。

        通過對國外智庫動態(tài)監(jiān)測發(fā)現(xiàn),美國亞洲協(xié)會的“中參館”對中國進行動態(tài)和深度報道,發(fā)表了比較多的言論與主張,如中國與非洲的關系;通過進一步監(jiān)測成果主題,涉及政策主題高居榜首,不難發(fā)現(xiàn)對輿論的導向有重要參照因素。通過監(jiān)測這些智庫的資訊動態(tài)及輿論焦點,展開實時分析,對研究國家與政權的博弈過程有重要價值。

        6.4 智庫評價研究服務

        智庫日益受到大眾的關注,在此形勢下,智庫評價研究具有非常重要的現(xiàn)實意義。利用大數(shù)據(jù)技術對全球智庫進行動態(tài)監(jiān)測,包括國內(nèi)外智庫的數(shù)量、輿論動態(tài)、成果影響力等進行全面綜合的跟蹤分析與評價,可以做到事實客觀、海量數(shù)據(jù)和實時監(jiān)測,能為智庫評價研究提供多樣化的數(shù)據(jù)利用,節(jié)省數(shù)據(jù)采集與清洗的時間,從而把工作重心放到趨勢分析、智庫評價等核心工作上來,大大提高研究的效率。

        7 結語

        目前,國內(nèi)外智庫數(shù)量眾多,每天都會產(chǎn)生大量的信息,利用大數(shù)據(jù)技術,對國內(nèi)外智庫進行全面監(jiān)測,形成完整的智庫基礎數(shù)據(jù),為不同的應用場景提供借鑒、分析服務。其主要體現(xiàn)在以下幾個方面。

        (1)可以全面了解全球智庫機構、專家、成果等各種智庫資源的構成與基本現(xiàn)狀,有助于拓展國際視野。

        (2)能方便、快速地對國外智庫機構的觀點、評論、研究課題進行動態(tài)監(jiān)測,開展政策追蹤與預警研究,為我國的對外政策制定和交流合作提供參考。

        (3)可以捕捉國內(nèi)外智庫的輿論焦點,對研究國家與政權的國際博弈、國際話語權的爭奪以及國際輿論的引導有重要價值。

        (4)可以直接用于智庫整體評價、主題評價、領域評價、趨勢分析等相關研究服務。

        利用大數(shù)據(jù)技術,監(jiān)測國內(nèi)外智庫的最新動態(tài),有利于加強我國新型智庫的建設,提高新型智庫的相關服務水準,制訂更加科學合理的評價指標體系,更進一步地貫徹我國對于建設特色新型智庫的指導精神,對推進現(xiàn)代咨詢體系的建設具有積極意義。

        參考文獻

        [1] 趙培陽.我國新型科技創(chuàng)新智庫的發(fā)展機制與路徑研究[J].科技創(chuàng)新與應用,2017(11):62-63.

        [2] 朱潔,羅華霖.大數(shù)據(jù)架構詳解——從數(shù)據(jù)獲取到深度學習[M].北京:電子工業(yè)出版社,2016:26-28.

        [3] 孔欽,葉長青,孫赟.大數(shù)據(jù)下數(shù)據(jù)預處理方法研究[J].計算機技術與發(fā)展,2018(5):1-4.

        [4] CODATA中國全國委員會.大數(shù)據(jù)時代的科研活動[M].北京:科學出版社,2014:159,160,172-173.

        [5] 金杭川.“一帶一路”與國際化:助力國內(nèi)企業(yè)“走出去”[J].風能,2016(11):38-39.

        [6] 夏慶宇.輿論領域的博弈已成為國際博弈的第四種主要形式[J].南方論刊,2017(4):13-15,19.

        猜你喜歡
        趨勢分析大數(shù)據(jù)技術
        化工材料科學與工程的發(fā)展現(xiàn)狀及趨勢研究
        淺談核電項目設計質量信息收集與分析
        大數(shù)據(jù)技術在電子商務中的應用
        高校微課教學現(xiàn)狀及未來發(fā)展趨勢研究
        大數(shù)據(jù)技術對新聞業(yè)務的影響研究
        論大數(shù)據(jù)技術在智能電網(wǎng)中的應用
        從《遠程教育》35年載文看遠程教育研究趨勢
        基于知識圖譜的智慧教育研究熱點與趨勢分析
        高校檔案管理信息服務中大數(shù)據(jù)技術的應用
        計算機科學與技術的發(fā)展趨勢
        亚洲国产精品婷婷久久| 一级毛片不卡在线播放免费| 国产午夜激无码AV毛片不卡| 精品日韩在线观看视频| 无遮挡激情视频国产在线观看| 欧美精品v国产精品v日韩精品| 亚洲精品中文字幕无乱码麻豆| 精品国产亚洲av成人一区| 亚洲写真成人午夜亚洲美女| 久久久久亚洲av成人无码| 丰满少妇人妻无码专区| 国产美女久久久亚洲综合| 亚洲97成人在线视频| 亚洲精品无码久久久影院相关影片 | 免费av在线 国产精品| 午夜久久久久久禁播电影| 大肉大捧一进一出好爽视频mba| 韩国一级成a人片在线观看| 偷拍视频十八岁一区二区三区| 日韩经典午夜福利发布| 中国丰满熟妇av| 国内视频一区| 日韩av天堂一区二区三区在线| 久久久久久九九99精品| 91手机视频在线| 国产精品高清亚洲精品| 欧美拍拍视频免费大全| 国产欧美日韩精品a在线观看| 国产精品色内内在线播放| 中文字幕一区二三区麻豆| av综合网男人的天堂| 99热免费精品| 国产av精品久久一区二区| 99久久精品无码一区二区毛片| 秋霞鲁丝片av无码| 国产精品香蕉网页在线播放| 国产变态av一区二区三区调教| 国产精品无码av一区二区三区 | 成人久久久久久久久久久| 无码一区东京热| 日本女优中文字幕在线播放|