亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于項目檔案的學術專題情報快速輔助生成系統(tǒng)設計研究

        2016-06-24 14:15:21張魯冀趙燕燕
        天津科技 2016年8期
        關鍵詞:科技情報情報信息情報

        劉 念,張魯冀,趙燕燕,陳 默

        (1. 北京電子科技學院 北京100070;2. 北京市科學技術情報研究所 北京100048;3. 大唐電信科技股份有限公司 北京100094;4. 機械工業(yè)信息研究院 北京100037)

        基于項目檔案的學術專題情報快速輔助生成系統(tǒng)設計研究

        劉 念1,張魯冀2,趙燕燕3,陳 默4

        (1. 北京電子科技學院 北京100070;2. 北京市科學技術情報研究所 北京100048;3. 大唐電信科技股份有限公司 北京100094;4. 機械工業(yè)信息研究院 北京100037)

        學術專題情報快速輔助生成系統(tǒng)是北京市情報所建設的科技情報資源網(wǎng)絡服務平臺,是科技情報信息資源網(wǎng)絡體系的重要組成部分。學術專題情報快速輔助生成系統(tǒng)其根本是為了服務于社會科技進步和科技創(chuàng)新,系統(tǒng)的設計則是充分運用信息技術、網(wǎng)絡技術等科技手段,對科技情報信息資源進行戰(zhàn)略重組和系統(tǒng)優(yōu)化,促進科技情報信息資源的高效、合理的配置,將科技情報信息資源價值得到最大化的實現(xiàn)。對系統(tǒng)設計進行了分析研究。

        檔案 情報 學術專題

        學術專題情報快速輔助生成系統(tǒng)是北京市情報所建設的科技情報資源網(wǎng)絡服務平臺,是科技情報信息資源網(wǎng)絡體系的重要組成部分。學術專題情報快速輔助生成系統(tǒng)的宗旨是服務社會科技進步和科技創(chuàng)新,系統(tǒng)設計充分運用信息技術、網(wǎng)絡技術等科技手段,對科技情報信息資源進行戰(zhàn)略重組和系統(tǒng)優(yōu)化,促進科技情報信息資源的高效、合理配置,使科技情報信息資源價值得到最大化的實現(xiàn)。

        “科技計劃項目檔案”(以下簡稱項目檔案),專指以國家或地方政府財政投入為主,并列入國家或地方科技計劃項目,在其管理和實施全過程中形成的、具有保存價值的各種類型和載體的原始記錄。

        項目檔案不僅是項目成果的重要組成部分(有時甚至是唯一成果),是項目管理的載體,是項目實施、驗收及成果推廣應用的真實記錄和可靠依據(jù),也是國家科技信息資源的重要組成部分。

        目前情報學做的大多是基于圖書期刊文獻的情報,因此好多人認為圖情檔是一家。不過近幾年,許多專家都呼吁情報學要與圖書館學區(qū)別開來,認為情報學做圖書對于學科來說是倒退,要提升情報學的地位,真正做到普通大眾所認同的情報。

        1 目標與意義

        1.1 總體目標

        本系統(tǒng)的實現(xiàn)對于促進情報工作的現(xiàn)代化將具有重要意義與作用。對于情報專業(yè)機構來說,其最大的價值就是通過建設大數(shù)據(jù)采集與篩選工具能夠實時進行檔案數(shù)據(jù)庫的采集、篩選、抽取,為各種情報服務提供數(shù)據(jù)資源。本系統(tǒng)的實施將會有效促進情報工作的現(xiàn)代化,具體表現(xiàn)在以下4個方面:①系統(tǒng)的“科技情報搜索”實現(xiàn)檔案大數(shù)據(jù)實時采集,提供全面高效數(shù)據(jù)支持;②系統(tǒng)的“大數(shù)據(jù)篩選”實現(xiàn)大數(shù)據(jù)預處理,提高數(shù)據(jù)質量;③系統(tǒng)的“動態(tài)情報跟蹤”實現(xiàn)對情報對象動態(tài)跟蹤,為預測、預警奠定數(shù)據(jù)基礎;④系統(tǒng)的“基于科技主體社會網(wǎng)絡的情報分析”能提供科技主體社會關系導航圖,解決情報流程中專家及機構的選擇問題。

        1.2 重要意義

        該項目的實施可以有效解決北京市科學技術情報研究所情報工作中數(shù)據(jù)資源不足和海量信息處理能力不足的問題,對于打造該所核心競爭力具有重要的促進作用。

        “大數(shù)據(jù)采集與篩選工具建設”項目是集科技情報搜索工具、情報處理工具、基于科技主體網(wǎng)絡的情報工具為一體的情報工具,可以有效提高情報所為情報服務的數(shù)據(jù)資源建設能力。

        通過科技情報搜索工具的設計與封裝以及大數(shù)據(jù)篩選工具的開發(fā),可以輔助解決情報所信息處理能力不足的問題,對于情報工作本身的現(xiàn)代化具有重要的推進作用。

        通過設計開發(fā)動態(tài)情報跟蹤工具可以實現(xiàn)過程情報數(shù)據(jù)庫的建立,可以為情報預測預警服務提供基礎數(shù)據(jù)支撐,為情報所從大數(shù)據(jù)中汲取“大洞察”“大智慧”提供助力工具,進而增強情報所的行業(yè)競爭力。

        2 功能性需求分析

        本課題開發(fā)并實現(xiàn)網(wǎng)絡環(huán)境下的搜索引擎技術、本體庫、SVM分類算法、聚類算法和信息篩選技術,構建面向互聯(lián)網(wǎng)大數(shù)據(jù)、人際網(wǎng)絡數(shù)據(jù)和信息篩選的大數(shù)據(jù)采集與篩選工具,為情報服務的數(shù)據(jù)資源建設提供工具。

        2.1 科技情報搜索工具的設計與封裝

        科技情報搜索工具設計與封裝將通過信息抽取技術自動構建科技情報領域本體庫,然后使用領域本體對用戶查詢需求進行語義處理去實現(xiàn)。

        本課題設計與實現(xiàn)的科技情報搜索工具能夠返回用戶多種相互關聯(lián)的信息,較好地解決目前基于關鍵詞的搜索引擎存在查全率和查準率方面的不足。

        2.2 基于科技主體社會網(wǎng)絡的情報分析

        本課題基于移動網(wǎng)絡環(huán)境下的情報采集技術,根據(jù)社會網(wǎng)絡理論,完成科技主體(單位和個人)相互關系的表達,從而確定某一主題下各個科技主體的特征,以便找到適合進行情報分析判讀的行業(yè)專家。

        2.3 動態(tài)情報跟蹤

        本課題建設的動態(tài)情報跟蹤工具是將情報搜索工具搜索的數(shù)據(jù)導入,利用以下技術進行整理:本體庫、各領域學科詞表中的詞匯距離、SVM分類算法、聚類算法,將整理出的高品質數(shù)據(jù)導入動態(tài)情報跟蹤工具中,完成數(shù)據(jù)抽取,將網(wǎng)頁中的主體、時間、地點、做什么事、數(shù)據(jù)和設定的主體一并寫入基礎數(shù)據(jù)庫,完成描述一個主體正在為了某個目的進行的活動過程的記錄。

        2.4 大數(shù)據(jù)篩選

        本課題根據(jù)研究內容設定采集數(shù)據(jù)的范圍,將采集到的數(shù)據(jù)去噪、剔除相似數(shù)據(jù)后,根據(jù)領域詞匯距離、情報點關鍵詞錄、情報報告關鍵詞錄摘錄出較具情報價值的信息,力爭把以10萬計的海量信息壓縮到600條以內,同時核心信息保存一半以上。

        3 非功能性需求分析

        3.1 性能需求

        學術專題情報快速輔助生成系統(tǒng)是大數(shù)據(jù)數(shù)字情報挖掘的綜合系統(tǒng),在遇到突發(fā)事件時峰值時間的并發(fā)用戶數(shù)較高。另外,考慮到情報業(yè)務的流動性,歷史數(shù)據(jù)的積累會非常大。因此需要較高的性能要求:

        3.1.1 系統(tǒng)可用性

        系統(tǒng) 7×24,h持續(xù)可用,可對系統(tǒng)進行維護;數(shù)據(jù)存取服務要求準確,保證數(shù)據(jù)不丟失。

        3.1.2 系統(tǒng)可擴展性

        系統(tǒng)留有擴充的接口,將來功能擴充時不影響現(xiàn)有系統(tǒng)功能和結構,能夠方便其他系統(tǒng)模塊的后續(xù)擴張。系統(tǒng)的設計和開發(fā)充分考慮了將來數(shù)據(jù)量和訪問量急劇擴張的情況,當系統(tǒng)數(shù)據(jù)量和訪問量增大而導致系統(tǒng)配置不能滿足要求時,可以通過僅增加服務器等硬件進行解決,而不用在軟件上修改響應性能。

        3.1.3 服務時效性

        一般 Web 查詢的響應時間在15,s以內,而帶有復雜的餅圖、棒圖、矩陣圖的統(tǒng)計分析,響應時間在60,s以內。服務器的 CPU 平均負荷率≤55%,。

        3.1.4 可恢復性

        在系統(tǒng)發(fā)生故障時,傳輸數(shù)據(jù)服務恢復和數(shù)據(jù)庫恢復都可在24,h內完成,并且可以保證數(shù)據(jù)不丟失。

        3.2 安全需求

        由于檔案情報信息涉及面廣泛,可能觸及敏感信息,因此提出如下安全需求:用戶信息嚴格保密;驗證手段安全可靠;搜索、訪問重要數(shù)據(jù)必須授權,拒絕匿名訪問;對重要數(shù)據(jù)的操作可以追蹤;能夠抵御常見的惡意攻擊。

        4 模塊設計

        學術專題情報快速輔助生成系統(tǒng)業(yè)務流程為:根據(jù)關鍵詞并行進行文檔庫爬取,獲取有效的文檔信息,去重、去噪后得到需要的網(wǎng)頁信息與論文信息。對數(shù)據(jù)進行特定的處理,采用特定的算法對獲取的數(shù)據(jù)進行處理分析,生成需要的圖表格式并得出結論。

        本學術專題情報快速輔助生成系統(tǒng)按照情報流程節(jié)點的不同,可以細分為幾個大模塊:搜索大模塊、控制大模塊、整理大模塊、分析大模塊及結論生成大模塊。大模塊下又可細分為幾個小模塊。學術專題情報快速輔助生成系統(tǒng)模塊劃分如下圖1所示。

        圖1 系統(tǒng)功能模塊圖Fig.1 System function module

        4.1 搜索大模塊需求分析

        搜索大模塊主要包括網(wǎng)頁搜索模塊和論文搜索模塊兩個模塊。網(wǎng)頁搜索模塊致力于在網(wǎng)絡上搜索與關鍵字相關的網(wǎng)頁集合,為后續(xù)的操作提供初始的網(wǎng)頁信息材料來源。論文搜索模塊是在我們制定好的論文庫中搜索與關鍵字相關的論文集合,得到與關鍵字有密切關系的論文集合,為之后的整理分析等工作提供初始的材料來源。

        4.2 控制大模塊需求分析

        控制大模塊主要包括兩個小模塊:內存控制模塊和線程控制模塊。無論是從網(wǎng)頁中獲取信息還是從論文中獲取信息,系統(tǒng)在獲取信息過程中獲取的信息容量比較大,所以需要內存控制模塊來高效運行此系統(tǒng)的計算機內存,以提高系統(tǒng)運行效率。由于要獲取的信息內容十分多,所以采用并行技術獲取信息。多線程操作可以保證系統(tǒng)并行開展信息的獲取。

        4.3 整理大模塊需求分析

        整理大模塊主要有網(wǎng)頁內容整理和論文內容整理模塊。網(wǎng)頁內容整理模塊主要是對獲取到的網(wǎng)頁進行去重、去噪等處理,得到干凈、整齊的網(wǎng)頁內容。論文內容整理模塊是對已經獲取到的論文集合進行去重、去噪等處理,獲取格式整齊的論文內容,以便進行下面的工作。

        4.4 分析大模塊需求分析

        分析大模塊主要包含網(wǎng)頁內容分析和論文內容分析兩個模塊。網(wǎng)頁內容分析模塊是對前面已經處理過的網(wǎng)頁信息采用分類、對比等特定分析方法進行分析,以幫助后面的模塊得到想要的結果。論文內容分析模塊是針對之前通過搜索、處理得到的整齊的論文,采用特定的分類、對比等分析方法對論文內容進行分析,得到分析的結果。

        4.5 結論生成大模塊需求分析

        結論生成大模塊主要包含網(wǎng)頁生成結論模塊和論文生成結論模塊。網(wǎng)頁生成結論模塊使用通過關鍵詞篩選出的網(wǎng)頁信息,經整理、分析得出的結果采用表格、圖表等方式展現(xiàn)給用戶,讓用戶對結論有一個直觀的了解。論文生成模塊使用通過關鍵詞篩選出的論文信息,經過整理、分析得到的結果采用與網(wǎng)頁生成結論模塊基本相同的樣式,如以表格、柱狀圖、餅圖等方式向用戶展示,便于用戶進行相關的決策等?!?/p>

        [1] 賀德方. 我國科技情報行業(yè)發(fā)展戰(zhàn)略與發(fā)展路徑的思考[J]. 情報學報,2007,26(4):54-61.

        [2] 羅欣,夏德麟. 基于詞頻差異的特征選取及改進的TF-IDF公式[J]. 計算機應用,2005,25(9):54-59.

        [3] 鄭彥寧,宋振峰. 我國科技情報行業(yè)現(xiàn)狀與發(fā)展對策分析[J]. 情報學報,2007,26(5):10-15.

        Design of Academic Research Information Rapid Generating System Based on Project Archives

        LIU Nian1,ZHANG Luji2,ZHAO Yanyan3,CHEN Mo4
        (1.Beijing Electronic Science and Technology Institute,Beijing 100070,China;2.Beijing Institute of Science and Technology Information,Beijing 100048,China;3.Datang Telecom Technology Co.,LTD,Beijing 100094,China;4.Machinery Industry Information Institute,Beijing 100037,China)

        Built by Beijing Institute of Science and Technology Information,academic research information fast generating system is a science and technology information resource network service platform and also an important part of science and technology information resources network.The fundamental academic research information fast generating system is to serve the social scientific and technological progress and scientific and technological innovation.The design of the system is based on the fully using of technology such as information technology and network technology to perform reorganization of strategy of science and technology information resources and system optimization and to promote efficient and reasonable configuration of science and technology information resources to maximize the implementation of science and technology information resources value.The system design was analyzed in the paper.

        archives;intelligence;academic topic

        G27

        A

        1006-8945(2016)08-0013-03

        本論文得到“北京市科技計劃項目”資助,項目名稱:數(shù)字科技檔案自動化與利用服務系統(tǒng)設計研發(fā)(Z151100003215042)。

        2016-08-02

        猜你喜歡
        科技情報情報信息情報
        情報
        情報
        情報
        基于數(shù)據(jù)工程的國防科技情報生態(tài)體系構建
        銅陵市科技情報工作存在的問題與發(fā)展對策
        安徽科技(2018年9期)2018-12-31 12:54:31
        加強科技情報檔案管理工作的建議
        淺談新時期科技情報信息工作的重要性
        交接情報
        我國情報信息主導警務模式應用中的問題與對策探索
        基于情報信息的空防安全威脅評估回歸模型研究
        国产免费人成视频在线观看播放| 亚洲一区二区三区厕所偷拍| 中文字幕综合一区二区| 又硬又粗进去好爽免费| 国产真实强被迫伦姧女在线观看| 日韩亚洲中字无码一区二区三区| 亚洲AV无码一区二区三区精神| av在线一区二区精品| 中文字幕人乱码中文字幕| 无码成人aaaaa毛片| 久久久精品2019免费观看| 亚洲欧美日韩中文字幕网址| 亚洲国产av午夜福利精品一区| 日韩精品成人区中文字幕| 欧美一区二区三区红桃小说| 中字无码av电影在线观看网站| 国产精品不卡免费版在线观看| 日本亚洲精品一区二区三| 国产成人aaaaa级毛片| 在线观看av手机网址| 日本一区二区国产高清在线播放| 久久一区二区三区少妇人妻| 国产精品人妻一区二区三区四| 国产精品你懂的在线播放| 一区二区无码中出| 成人激情视频一区二区三区 | 女同另类激情在线三区| 久久亚洲中文字幕精品熟| 中文字幕在线日亚洲9| 中文字幕在线亚洲日韩6页手机版 亚洲色图+国产精品 | 日本aⅴ大伊香蕉精品视频| 久久国产精品老女人| 亚洲一区二区三区四区精品| 中文字幕在线日亚州9| 美丽人妻被按摩中出中文字幕| 高清无码精品一区二区三区| 中文字幕人妻久久一区二区三区| 99久久久无码国产精品性| 欧美性xxxx狂欢老少配| 网友自拍人妻一区二区三区三州| 精品女同一区二区三区免费战|