廣西壯族自治區(qū)科學(xué)技術(shù)情報(bào)研究 廣西 南寧 530022
隨著通信技術(shù)的快速更迭,社會(huì)已經(jīng)全面進(jìn)入到5G時(shí)代,大數(shù)據(jù)技術(shù)的應(yīng)用越來越廣泛和普遍,為各行各業(yè)賦予發(fā)展的新動(dòng)能。對(duì)科技情報(bào)研究單位來說,充分借助新技術(shù)并發(fā)揮好科技信息大數(shù)據(jù)的優(yōu)勢(shì)是新時(shí)期內(nèi)科技情報(bào)研究服務(wù)工作的重點(diǎn)內(nèi)容。為此,針對(duì)科技信息大數(shù)據(jù)在情報(bào)研究服務(wù)中的應(yīng)用問題進(jìn)行分析和研究是十分必要的。
科技信息大數(shù)據(jù)主要是圍繞科研著作、專利、研究報(bào)告等科技信息而產(chǎn)生的數(shù)據(jù)。隨著網(wǎng)絡(luò)通訊技術(shù)和數(shù)據(jù)技術(shù)的發(fā)展,科技信息也不再局限于紙質(zhì)的方式,而是越來越多地以電子信息的方式產(chǎn)生、傳輸、呈現(xiàn)。經(jīng)過一段時(shí)間的累計(jì)后,這些電子式科技信息會(huì)形成一定規(guī)模的數(shù)據(jù)平臺(tái)或數(shù)據(jù)庫(kù)。工作人員可以通過對(duì)這些科技信息數(shù)據(jù)進(jìn)行分析研究來獲取所需要的科技情報(bào)。由于越來越多的科研人員傾向于以電子信息的方式來進(jìn)行科學(xué)技術(shù)研究工作,因此應(yīng)用科技信息大數(shù)據(jù)的方式來獲取科技情報(bào)信息更容易獲取到核心的數(shù)據(jù),并且這些數(shù)據(jù)比紙質(zhì)數(shù)據(jù)更新鮮更全面,更容易從中發(fā)現(xiàn)科技發(fā)展的趨勢(shì)。從具體的特征來看,科技信息大數(shù)據(jù)相對(duì)于傳統(tǒng)的數(shù)據(jù)具有以下特征:一是信息量大,數(shù)據(jù)平臺(tái)或數(shù)據(jù)庫(kù)規(guī)模大;二是數(shù)據(jù)增加更快,呈指數(shù)增長(zhǎng)模式;三是數(shù)據(jù)維度更全面多元,不僅包括本專業(yè)的數(shù)據(jù),還涵蓋了相關(guān)專業(yè)的數(shù)據(jù);四是數(shù)據(jù)具有多源異構(gòu)性,同一個(gè)信息有不同的來源;五是數(shù)據(jù)新鮮度高,隨著時(shí)間的推進(jìn)和科技的發(fā)展,能夠及時(shí)獲取到新鮮數(shù)據(jù),使科技情報(bào)數(shù)據(jù)具有更強(qiáng)的時(shí)效性。
以往科技情報(bào)服務(wù)工作主要通過科技論文、圖書報(bào)刊等紙質(zhì)文獻(xiàn)的方式來獲取科技信息,從中梳理出具有價(jià)值的科技情報(bào)。隨著信息技術(shù)和數(shù)據(jù)技術(shù)的應(yīng)用,科技情報(bào)工作模式發(fā)生了很大的改變。情報(bào)研究服務(wù)工作應(yīng)保持與時(shí)俱進(jìn),結(jié)合大數(shù)據(jù)技術(shù)特征積極調(diào)整工作模式,使大數(shù)據(jù)技術(shù)能夠在情報(bào)研究服務(wù)工作中發(fā)揮出積極的效用。
首先,利用大數(shù)據(jù)技術(shù)對(duì)科技信息進(jìn)行采集、處理、儲(chǔ)存和應(yīng)用。對(duì)已經(jīng)建成的科技專業(yè)平臺(tái)數(shù)據(jù)庫(kù)以及機(jī)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行采集,動(dòng)態(tài)監(jiān)測(cè)科技數(shù)據(jù)流并采集相關(guān)信息,對(duì)采集的信息進(jìn)行清洗、格式轉(zhuǎn)換以及關(guān)聯(lián)度和有效性分析。借助云計(jì)算技術(shù)建立科技大數(shù)據(jù)云存儲(chǔ)系統(tǒng),為海量增長(zhǎng)的科技數(shù)據(jù)資源提供儲(chǔ)存或擴(kuò)展的空間,隨著科技數(shù)據(jù)的不斷積累,逐步形成清洗的大數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)。利用大數(shù)據(jù)技術(shù)、機(jī)器學(xué)習(xí)技術(shù)以及各種數(shù)學(xué)模型,對(duì)多種來源不同結(jié)構(gòu)的數(shù)據(jù)進(jìn)行計(jì)算、分析、比較,從而實(shí)現(xiàn)對(duì)科技數(shù)據(jù)的深度挖掘,為科技情報(bào)研究服務(wù)工作提供技術(shù)支持。
其次,利用大數(shù)據(jù)技術(shù)完善科技情報(bào)服務(wù)體系。根據(jù)不同的用戶需求建立起各自的科技情報(bào)服務(wù)需求模型,提高科技情報(bào)服務(wù)產(chǎn)品及情報(bào)服務(wù)的精細(xì)化水平。利用大數(shù)據(jù)技術(shù)建立科技情報(bào)研究服務(wù)云平臺(tái),基于服務(wù)云平臺(tái)建立完善的科技數(shù)據(jù)和情報(bào)成果管理共享機(jī)制。通過對(duì)用戶提供科技情報(bào)研究服務(wù)產(chǎn)品,提升科技情報(bào)研究服務(wù)的便利性、規(guī)范性和權(quán)威性。為用戶提供數(shù)據(jù)的應(yīng)用程序接口,依托學(xué)生期刊、報(bào)紙報(bào)刊、網(wǎng)絡(luò)科技新媒體平臺(tái),做好科技情報(bào)數(shù)據(jù)和情報(bào)研究成果的傳播。利用大數(shù)據(jù)技術(shù)探索更多的產(chǎn)品服務(wù)模式,提高科技情報(bào)服務(wù)覆蓋的光度。
第三,利用大數(shù)據(jù)技術(shù)為科技情報(bào)服務(wù)工作提供可靠的保障支持體系。建立統(tǒng)一的數(shù)據(jù)采集、儲(chǔ)存、共享和利用標(biāo)準(zhǔn),及時(shí)針對(duì)數(shù)據(jù)問題給出反饋和響應(yīng),合理解決數(shù)據(jù)問題。通過大數(shù)據(jù)技術(shù)的支持,逐漸形成穩(wěn)定的科技情報(bào)研究服務(wù)可持續(xù)工作機(jī)制,形成日益完善的科技數(shù)據(jù)資源基礎(chǔ)服務(wù)環(huán)境,保證科技研究情報(bào)服務(wù)平臺(tái)穩(wěn)定運(yùn)行。
數(shù)據(jù)抽取技術(shù):隨著互聯(lián)網(wǎng)技術(shù)的普及應(yīng)用,網(wǎng)絡(luò)上的信息數(shù)據(jù)也越來越多,信息數(shù)據(jù)量的增多一方面使數(shù)據(jù)來源更多,另一方面也存在很多的偽信息或?qū)δ繕?biāo)無效的信息。通過數(shù)據(jù)抽取技術(shù)可以幫助情報(bào)研究人員在海量的信息中快速篩選出符合自己需要的信息,節(jié)省時(shí)間和精力,提高情報(bào)研究服務(wù)工作效率。
多源異構(gòu)數(shù)據(jù)融合技術(shù):數(shù)據(jù)的開發(fā)和共享必須打破傳統(tǒng)數(shù)據(jù)孤島的瓶頸,將工業(yè)業(yè)務(wù)數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)之間的壁壘打通。通過多源異構(gòu)數(shù)據(jù)的融合,將格式不同、開發(fā)框架不同、語義不同、關(guān)聯(lián)關(guān)系不同的數(shù)據(jù)在統(tǒng)一的框架內(nèi)進(jìn)行集成和整合。傳統(tǒng)的技術(shù)方法是通過自定義或定義標(biāo)準(zhǔn)來協(xié)同數(shù)據(jù),但在整合過程中需要開放源代碼或者數(shù)據(jù)庫(kù)支持。隨著大數(shù)據(jù)技術(shù)的發(fā)展,如今已經(jīng)出現(xiàn)了數(shù)據(jù)接口和計(jì)算分析平臺(tái),不需要底層數(shù)據(jù)庫(kù)和源代碼開放就能夠?qū)崿F(xiàn)數(shù)據(jù)接口自動(dòng)生成,并通過多種內(nèi)置算法對(duì)數(shù)據(jù)源進(jìn)行獲取和分析。
用戶畫像和用戶需求分析技術(shù):通過用戶數(shù)據(jù)來構(gòu)建用戶畫像,利用大數(shù)據(jù)技術(shù)還原用戶的旅程思維,挖掘用戶決策歷程,從中分析用戶的潛在需求,實(shí)現(xiàn)針對(duì)某種標(biāo)簽項(xiàng)下的用戶進(jìn)行精準(zhǔn)信息推送,為用戶提供更符合自身需求的服務(wù),使科研情報(bào)研究服務(wù)信息實(shí)現(xiàn)更有效的觸達(dá),提高科研情報(bào)工作的精準(zhǔn)性和用戶體驗(yàn)度。
新的時(shí)代和技術(shù)背景下,科技情報(bào)研究服務(wù)工作也面臨新的挑戰(zhàn)。積極轉(zhuǎn)變工作思路,調(diào)整和優(yōu)化工作模式,將大數(shù)據(jù)技術(shù)的優(yōu)勢(shì)充分發(fā)揮到科技情報(bào)研究服務(wù)工作中,更好地發(fā)揮出科技情報(bào)單位在科技研究和發(fā)展過程中的積極作用,釋放出科技的引擎動(dòng)力,推動(dòng)行業(yè)、國(guó)家和社會(huì)蓬勃發(fā)展。