亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

大數(shù)據(jù)時代數(shù)字資源整合方法研究：模型設計和實驗分析

2019-10-06 02:40:31王戰(zhàn)平馮揚文朱宸良

現(xiàn)代情報 2019年9期

王戰(zhàn)平馮揚文朱宸良

摘要：[目的/意義]針對目前大數(shù)據(jù)時代數(shù)字資源的非結(jié)構(gòu)化、海量、多類型等問題，設計一套數(shù)字資源整合的模型和方法，以滿足信息用戶的實際需求。[方法/過程]以物流行業(yè)中的航運信息服務產(chǎn)品集裝箱運價指數(shù)為例，提出基于大數(shù)據(jù)的指數(shù)編制思路，以數(shù)據(jù)倉庫模型為目標數(shù)據(jù)模式，構(gòu)建面向海量多源異構(gòu)信息的數(shù)字資源集成模型，設計Web類數(shù)字資源獲取和集成流程以及增量數(shù)據(jù)的處理方法，通過具體實證研究檢驗模型和流程的運行效果。[結(jié)果/結(jié)論]實證結(jié)果顯示，本文提出的數(shù)字資源整合模型和處理流程能有效地實現(xiàn)多源異構(gòu)數(shù)字資源的整合，支持基于海量數(shù)據(jù)對的指數(shù)編制模式，為全世界各類指數(shù)編制的改變提供理論和技術(shù)方面的探索，也為數(shù)字資源整合在其他領域的應用提供有益參考。

關(guān)鍵詞：數(shù)字資源整合;多源異構(gòu)信息;集裝箱運價指數(shù);數(shù)據(jù)倉庫;模型;方法;技術(shù);物流行業(yè)

DOI：10.3969/j.issn.1008-0821.2019.09.010

〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821（2019）09-0092-09

Abstract：[Purpose/Significance]Aiming at the unstructured，massive and multi-source of digital resources，a set of digital resource integration models and methods were designed to meet the actual needs of information users.[Method/Process]Taking the shipping information service product - container freight index in the logistics industry as an example，this paper proposed formulation methods of container freight index based on big data，designed a set of oriented container freight index multi-sources heterogeneous information integration model and the Web information gathering and integration process.[Result/Conclusion]The model and process supported multi-sources heterogeneous digital information integration，and index formulation based on massive data.The study presented theoretical and technological exploration on different indexes formulation，and also provided a useful reference for the application of digital resources integration in other fields.

Key words：digital resources integration;multi-sources heterogeneous digital information;containerized freight index;data warehouse;model;method;technique;the logistics industry

數(shù)字資源整合是指將原本多元異構(gòu)的、離散的、分布的數(shù)字資源通過邏輯或者物理的方式[1]，依據(jù)不同的模式、策略，對于數(shù)字資源系統(tǒng)中的數(shù)據(jù)對象、功能結(jié)構(gòu)及其互動關(guān)系進行融合、類聚和重組，重新結(jié)合為一個新的有機整體，形成一個效能更好、效率更高的新的數(shù)字資源體系[2]。

數(shù)字資源整合的起因是由數(shù)字資源的現(xiàn)狀與信息用戶的需求之間的差異造成的。從技術(shù)層面來看，不同的數(shù)字資源系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)和語義表達不一樣，不同的系統(tǒng)開發(fā)者使用不一樣的數(shù)據(jù)描述和數(shù)據(jù)組織標準，數(shù)據(jù)檢索的方式和方法也不同;從數(shù)量上來看，隨著大數(shù)據(jù)時代的到來，數(shù)據(jù)資源的種類越來越多，除了電子文檔之外，Web、報文、視頻、音頻、圖形和圖像等類型的數(shù)字資源隨著互聯(lián)網(wǎng)發(fā)展，數(shù)字資源的數(shù)量呈指數(shù)增加的趨勢;從內(nèi)容上來看，數(shù)字資源存在大量冗余信息，內(nèi)容交叉重復，數(shù)字資源之間知識關(guān)聯(lián)程度很低，真正的數(shù)字資源分布在不同的組織等問題[3]，這些數(shù)字資源的價值密度較低，需要經(jīng)過整合和處理之后，方能滿足信息用戶的使用需求。

1 數(shù)字資源整合研究現(xiàn)狀

關(guān)于數(shù)字資源整合的研究在國內(nèi)主要集中在圖書情報領域，通常認為開始于21世紀初，毛玉萃針對企業(yè)內(nèi)部信息和企業(yè)電子商務信息的信息整合揭開了數(shù)字資源整合研究的序幕[4]，此后該領域的研究持續(xù)升溫，主要集中在五大方面：一是模式研究，如跨庫檢索[5]、系統(tǒng)和數(shù)據(jù)整合模式比較[6]等;二是方案策略和方法研究，如目標研究[7]、原則研究[8]、基于本體[9]、基于知識鏈[10]等;三是影響因素研究，如政治、經(jīng)濟、技術(shù)[11]和資源本身的屬性等;四是標準和協(xié)議研究，如Web Service[12]等;五是服務研究，如數(shù)據(jù)庫、檢索平臺[13]等。

數(shù)字資源整合中的數(shù)據(jù)整合技術(shù)經(jīng)歷了30多年的發(fā)展，不同的階段，針對的數(shù)據(jù)對象不同，采用的技術(shù)方法和體系結(jié)構(gòu)也不同，一般來說分為物理整合和邏輯整合。

1.1 聯(lián)邦數(shù)據(jù)庫

20世紀80年代，數(shù)據(jù)整合的對象主要是異構(gòu)數(shù)據(jù)庫，多采用聯(lián)邦數(shù)據(jù)庫集成框架和多數(shù)據(jù)庫語言方法集成架構(gòu)等技術(shù)，聯(lián)邦數(shù)據(jù)庫管理系統(tǒng)通過執(zhí)行控制和協(xié)調(diào)來實現(xiàn)對組件數(shù)據(jù)庫中數(shù)據(jù)的集成[14]。前期采用緊密耦合的方式，但由于這種方式太脆弱，后期漸漸采用松散耦合的方式[15]。

1.2 數(shù)據(jù)倉庫

聯(lián)邦數(shù)據(jù)庫模式對于數(shù)據(jù)的集成是邏輯上的，隨著信息用戶對于決策支持的需要，物化方法（Materialized）開始出現(xiàn)，最常見的就是數(shù)據(jù)倉庫方法，數(shù)據(jù)倉庫是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合，用于支持管理決策[16]。數(shù)據(jù)倉庫的特點主要體現(xiàn)在以下3個方面：實現(xiàn)了分析數(shù)據(jù)與生產(chǎn)線數(shù)據(jù)的分離;實現(xiàn)多個異構(gòu)數(shù)據(jù)源的集成;數(shù)據(jù)處理和分析能力強。

1.3 Wrapper-Mediator方法

20世紀90年代，隨著面向?qū)ο蠛头植际骄W(wǎng)絡技術(shù)的發(fā)展，針對異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)整合研究主要集中在Wrapper-mediator體系結(jié)構(gòu)方面[17]。Wrapper-Mediator方法又被稱為中間件集成法[18]，本質(zhì)上是一種邏輯集成或者模式集成[19]。模式集成方法可以彌補物化方式在數(shù)據(jù)實時性上的一些不足，同時具備在網(wǎng)絡延時小和參與運算的數(shù)據(jù)規(guī)模小的情況下計算速度更快、支持應用系統(tǒng)的應用模式經(jīng)常變化、適用于某些特殊的數(shù)據(jù)源（如保密數(shù)據(jù)）等優(yōu)勢。該方法的弱點一是會對數(shù)據(jù)源所在的系統(tǒng)產(chǎn)生負擔;二是應用系統(tǒng)的效率和結(jié)構(gòu)在很大程度上依賴網(wǎng)絡狀況。

聯(lián)邦數(shù)據(jù)庫方法目前已很少被采用，模式集成的方法適用于數(shù)據(jù)源所在的系統(tǒng)龐大、數(shù)據(jù)更新頻率高、目標數(shù)據(jù)所服務的系統(tǒng)要求數(shù)據(jù)實時性高且數(shù)據(jù)應用模式不固定的情況，數(shù)據(jù)倉庫的方式適用于數(shù)據(jù)源分布廣且網(wǎng)絡延時較大、數(shù)據(jù)應用模式變化不多、應用對于數(shù)據(jù)的實時性要求不高但對系統(tǒng)響應時間要求短等情況，隨著大數(shù)據(jù)時代的到來、硬件成本的不斷下降以及分布式存儲和計算技術(shù)的發(fā)展，越來越多的基于大數(shù)據(jù)的應用傾向于使用數(shù)據(jù)倉庫的方式;當然也有學者提出了基于上述兩種方法的綜合方案[20]。

本文綜合比較各種方法，在分析物理整合和邏輯整合的基礎上，結(jié)合數(shù)據(jù)倉庫的運價信息提出了新的方法。

2 基于數(shù)據(jù)倉庫的運價信息集成模型

隨著世界貿(mào)易格局的變化和標準化進程的加快，集裝箱船運輸方式在國際海運中所占的比重在逐漸增加，集裝箱運價的變化也一直受到業(yè)內(nèi)人士的關(guān)注，研究國際集裝箱運價指數(shù)的科學編制體系，及時準確地反映國際集裝箱運價波動的程度和趨勢，提高集裝箱運價預測的能力，成為全球業(yè)內(nèi)人士的共識。按照目前普遍的模式，運價樣本信息的采集是按照如下準則來操作的：由指數(shù)編制機構(gòu)指定若干企業(yè)或組織作為信息源提供者，提供者根據(jù)指數(shù)編制機構(gòu)給出的信息標準和要求定期向指數(shù)編制機構(gòu)單獨報送信息，編制機構(gòu)先對信息進行預處理，然后按照既定的算法得出某周期的航運運價指數(shù)[21];現(xiàn)行編制體系在理論層面具備科學性，可操作性強，所以被世界范圍內(nèi)的航運運價指數(shù)包括集裝箱運價指數(shù)廣泛采用，但其缺陷也長期存在，主要體現(xiàn)在以下兩個方面：

1）運價信息的屬性

目前集裝箱運價指數(shù)編制所用的運價信息采集自班輪公司和代理機構(gòu)，且主要來自班輪公司的報送運價信息，該運價信息并非自由競爭市場的價格。這正是包括波羅的海交易所在內(nèi)的諸多航運運價指數(shù)編制機構(gòu)一直致力于找到實際市場價格來編制航運運價指數(shù)的原因。

2）運價信息的及時性和廣泛性

班輪公司報送的運價信息變化周期長，反映集裝箱市場變化的及時性不夠，在實際操作中容易受到人為因素而影響運價信息的準確性;而且運價信息的來源不夠廣泛[21]。

互聯(lián)網(wǎng)和電子商務的浪潮席卷全球，同樣也在深深影響著航運業(yè)，全世界范圍內(nèi)出現(xiàn)了大量航運電子商務平臺，這些平臺將航運服務資源如集裝箱船的艙位作為商品，基于互聯(lián)網(wǎng)實現(xiàn)全流程在線交易;隨著這些平臺的運營和發(fā)展，越來越多的行業(yè)用戶選擇使用在線交易方式代替?zhèn)鹘y(tǒng)的紙面交易模式。這種模式表現(xiàn)出業(yè)務信息高度集中、實時性強、準確率高以及易于存儲、傳輸和使用等優(yōu)點。本文認為，集裝箱運價指數(shù)編制的信息源完全可以從傳統(tǒng)的使用采樣數(shù)據(jù)的方法轉(zhuǎn)變到以從事國際集裝箱艙位交易電商平臺和信息化系統(tǒng)上沉淀的運價信息為基礎，運用信息集成技術(shù)整合多個平臺和系統(tǒng)的運價數(shù)據(jù)，為集裝箱運價指數(shù)的編制提供實時的、海量的、真實成交的運價信息[23]。

2.1 運價信息集成模型的基本框架

集裝箱運價指數(shù)編制的運價數(shù)據(jù)分布在處于異構(gòu)環(huán)境中的不同航運電商平臺或系統(tǒng)上，所以運價數(shù)據(jù)必然是異構(gòu)的，需要找到一種有效的方法，根據(jù)集裝箱運價指數(shù)編制的要求對運價這些數(shù)字資源進行整合，數(shù)據(jù)的整合不但要遵循完整性、針對性和動態(tài)性等原則[24]，且整合后的結(jié)果能根據(jù)指數(shù)編制的模型進行組織和序化，能夠針對指數(shù)分析的需求進一步進行多維度、多粒度融合和分析[25]。編制集裝箱運價指數(shù)所需要的運價信息是歷史數(shù)據(jù)，根據(jù)集裝箱海運業(yè)務的慣例，數(shù)據(jù)采集的最高頻率為每日1次即可;為了實現(xiàn)運價指數(shù)編制的高效，必須實現(xiàn)對異構(gòu)數(shù)字資源的物理集成，通過序化使得結(jié)果數(shù)據(jù)的結(jié)構(gòu)統(tǒng)一，同時為了保證指數(shù)結(jié)果的可回溯性，必須將運價信息與原業(yè)務系統(tǒng)分離，本文設計的基于數(shù)據(jù)倉庫方法的數(shù)字資源整合模型如圖1所示。

其基本思想是：按照指數(shù)編制的需求，定義基于數(shù)據(jù)倉庫的目標數(shù)據(jù)模式，針對3類異構(gòu)信息，通過連接或解析或提取等手段操作信息源，再依照規(guī)則庫和元數(shù)據(jù)模型對數(shù)據(jù)進行映射、抽取、清洗和轉(zhuǎn)換，然后根據(jù)目標數(shù)據(jù)模式定義的格式將數(shù)據(jù)裝載到數(shù)據(jù)倉庫中，作為指數(shù)編制和指數(shù)服務等應用程序的信息處理對象，設置中間數(shù)據(jù)作為數(shù)據(jù)裝載的寫入緩沖。

2.2 實現(xiàn)運價信息集成的關(guān)鍵技術(shù)

根據(jù)圖1，基于數(shù)據(jù)倉庫的運價數(shù)據(jù)整合模型要正常運轉(zhuǎn)，其實現(xiàn)的關(guān)鍵技術(shù)有3個方面。

1）定義數(shù)據(jù)倉庫模型

定義多維的、有冗余的數(shù)據(jù)模型，方便使用上卷、下鉆和切片等方法進行多層次多角度的分析，集裝箱運價指數(shù)編制和分析的雪花模型如圖2所示，這些信息以事實表和維表的方式存放在數(shù)據(jù)倉庫中。

2）整合異構(gòu)數(shù)字資源

異構(gòu)數(shù)字資源的整合首先要建立元數(shù)據(jù)庫和規(guī)則庫。事實表和維表確定元數(shù)據(jù)庫的屬性，根據(jù)指數(shù)編制的需求來確定屬性的值域、格式和描述等內(nèi)容。

在預處理環(huán)節(jié)，對于不同來源的數(shù)字資源采用不同的方法，在本文的研究中，運價數(shù)據(jù)的主要來源是結(jié)構(gòu)化和半結(jié)構(gòu)化信息，非結(jié)構(gòu)化信息主要用作本體庫和知識庫的完善和擴展;本體庫主要包含與集裝箱海運運價相關(guān)的概念以及這些概念之間的關(guān)系，隨著數(shù)據(jù)的不斷增加本體庫將不斷被完善，為了提高準確率，本體庫的更新過程需要行業(yè)專家的人工介入，本體庫為知識庫的建立和完善提供概念和關(guān)系方面的支持。

在本文的研究中，知識庫采用產(chǎn)生式知識表示方法，采用三元組或四元組的形式表示，根據(jù)概念、關(guān)系的不同分別采用（關(guān)系、概念1、概念2…）或（對象、屬性、值）等表示形式，如（相等、起運港、裝貨港、POL）、（出錯、20GP運價、小于0），知識庫中存放的一條一條的規(guī)則，且規(guī)則之間不能相互調(diào)用[26]，在本體庫和知識庫的基礎上，建設和維護規(guī)則庫，以形成計算機可執(zhí)行的指令。

本文討論的結(jié)構(gòu)化數(shù)據(jù)主要針對關(guān)系型數(shù)據(jù)庫。通過ODBC與原運價數(shù)據(jù)庫建立數(shù)據(jù)連接，基于運價表或其他相關(guān)數(shù)據(jù)表創(chuàng)建本地數(shù)據(jù)副本;也可采用數(shù)據(jù)庫工具或編寫腳本將運價數(shù)據(jù)轉(zhuǎn)換為易于識別的數(shù)據(jù)模式（如報文等），同時針對屬性設計校驗，對存在明顯錯誤的運價數(shù)據(jù)記錄實施過濾，以提高運價數(shù)據(jù)的使用效率。

本文討論的半結(jié)構(gòu)化數(shù)據(jù)特指Web信息。因運價信息分布在互聯(lián)網(wǎng)的各個平臺和系統(tǒng)上，先確定這些數(shù)字資源的獲取范圍，獲取后將Web信息存儲在臨時存儲區(qū)，然后進行解析[27]。對于以Html、XML、Json等格式存儲在臨時存儲區(qū)的運價數(shù)據(jù)，可采用兩種方式。第一種方式是將文件視為字符流，讀取運價文件的同時讀取知識庫，若文件中有字符內(nèi)容與知識庫相符，采用堆棧技術(shù)，根據(jù)特殊字符判斷屬性和內(nèi)容，并抽取運價內(nèi)容，讀取規(guī)則庫對屬性的數(shù)據(jù)實施轉(zhuǎn)換并插入目標數(shù)據(jù)倉庫，若不相符，則根據(jù)特殊字符結(jié)合屬性和內(nèi)容推測，并向用戶提示人工介入，判斷抽取或舍棄該部分數(shù)據(jù)，同時更新知識庫;第二種方式是采用文檔對象模型（DOM），將XML文件中的運價信息內(nèi)容解析為文檔樹，讀取文檔樹中的子結(jié)點信息即可抽取出運價相關(guān)的屬性和值。這兩種方法在實際運用中都可調(diào)用開源的API。前者解析速度快，占用內(nèi)存少，但開發(fā)較復雜，后者易于實現(xiàn)，但不適合大型文件的操作，也可以采用JDOM方法實現(xiàn)二者的結(jié)合。

Web信息獲取和集成流程如圖3所示。

流程簡要描述如下：

①根據(jù)配置好的任務定向獲取運價Web信息，策略為先廣度再深度，直到指定的Web信息源獲取完成;

②以文件形式存儲運價Web信息至臨時存儲區(qū);

③讀取元數(shù)據(jù)庫、轉(zhuǎn)換規(guī)則庫和知識庫;

④采用相應的方法解析Web信息并抽取需要的運價相關(guān)信息以數(shù)據(jù)倉庫的方式存儲;

⑤錯誤日志在行業(yè)專家的介入下更新知識庫和規(guī)則庫。

3）處理增量信息

必須設置周期性觸發(fā)的定時任務以獲取增量運價信息。對于結(jié)構(gòu)化數(shù)據(jù)，定時任務自動掃描預定的所有數(shù)據(jù)庫，若運價數(shù)據(jù)庫中有Creattime屬性，則直接采用時間戳判斷增量數(shù)據(jù)，若無時間戳或無法獲取到時間戳字段，則利用數(shù)據(jù)庫主鍵值判斷新增運價信息，對于分布式數(shù)據(jù)庫（如RAC），數(shù)據(jù)庫主鍵可能產(chǎn)生順序混亂而導致增量運價數(shù)據(jù)無法完整采集的情況，則采取數(shù)據(jù)對比判斷的方法，根據(jù)數(shù)據(jù)對比后的結(jié)果調(diào)用任務（Job），實施增量更新。

運價采集程序讀取目標URL，對比URL模式表，如可變化參數(shù)部分的內(nèi)容與目標庫中已有的URL完全一致，則判斷該Web為已存在信息，則放棄，反之則判斷其為增量運價信息;若URL是靜態(tài)的，但運價信息持續(xù)更新，則提取Homepage或者Startpage中輸入下拉菜單列表中的內(nèi)容，針對這些內(nèi)容進行深度和廣度遍歷，獲取所有運價Web，將獲取的信息輸入已定義好的Hash表達式計算得新獲取Web信息的Hash值，將結(jié)果與目標庫中已有的URL的Hash值對比，值相同，則舍棄，反之則判斷其為增量運價信息。

非結(jié)構(gòu)化信息通常以文件形式存儲在既定的目錄中，定時任務掃描文件根目錄，按照文件系統(tǒng)的規(guī)則確定新文件，只讀取和發(fā)送新文件。

3 實證研究

3.1 數(shù)據(jù)來源與處理

使用某市集裝箱艙位訂艙平臺的后臺運價數(shù)據(jù)庫信息與某幾個集裝箱艙位訂艙網(wǎng)站的Web運價信息對本文提出的數(shù)字資源整合模型進行檢驗。其中該訂艙平臺運價數(shù)據(jù)庫（如圖4所示）共包含379 314條運價信息，包括起運港、中轉(zhuǎn)港、目的港、船公司、貨代公司、發(fā)布日期、有效日期（有效期起和有效期止）和各箱型運價（4種箱型：20GP、40GP、40HC和45HQ）等13個屬性字段;配置Web信息獲取任務，從多個網(wǎng)站獲取運價信息，各個網(wǎng)站運價數(shù)據(jù)的屬性都不盡相同，樣例見圖2;在行業(yè)專家的協(xié)助下建立知識庫和轉(zhuǎn)換規(guī)則庫，經(jīng)過數(shù)據(jù)預處理之后，利用數(shù)字資源整合模型對這些數(shù)據(jù)實施抽取、轉(zhuǎn)換，最后將數(shù)據(jù)存儲在數(shù)據(jù)倉庫中，整合后的數(shù)據(jù)倉庫樣例見圖6。

3.2 數(shù)字資源整合的效果

將結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)按照上述模型進行整合，作為集裝箱運價指數(shù)編制的基礎信息，指數(shù)編制系統(tǒng)根據(jù)實際業(yè)務情況執(zhí)行數(shù)據(jù)清洗和運算之后，得出運價指數(shù)結(jié)果，如圖7所示;指數(shù)分析系統(tǒng)從不同的維度和粒度進行數(shù)據(jù)挖掘，以支撐指數(shù)報告等其他服務。

4 結(jié) 語

在我國，數(shù)字資源整合研究較為關(guān)注醫(yī)學、圖書館、檔案和博物館等領域[28]，在物流領域，國外有學者探討了在供應鏈中生產(chǎn)信息整合對企業(yè)發(fā)展的作用[29]，而在針對航運運價指數(shù)領域中，大多數(shù)學者進行的是航運運價指數(shù)編制模型和應用層面的研究，很少涉及用于編制航運運價指數(shù)的基礎信息來源和信息集成的研究。本文從大數(shù)據(jù)背景出發(fā)，面向集裝箱運價指數(shù)編制的需要，設計數(shù)字資源整合模型，探討其原理和實現(xiàn)技術(shù)，并進行了實證研究，結(jié)果說明將分散在各航運電商平臺和系統(tǒng)上的運價通過數(shù)字資源整合作為集裝箱運價指數(shù)編制的可行性，今后研究的重點在于進一步完善針對半結(jié)構(gòu)和非結(jié)構(gòu)化數(shù)據(jù)的集成模型和算法，以提高其準確度、自動化程度和集成效率。

參考文獻

[1]邢榮華，朱玉珍，韓依辰，等.面向高校利用者的數(shù)字資源整合系統(tǒng)設計[J].現(xiàn)代情報，2017，37（2）：68-74.

[2]馬文峰.數(shù)字資源整合研究[J].中國圖書館學報，2002，28（4）：63-66.

[3]趙建平.數(shù)字信息資源整合方式比較研究[J].情報科學，2008，26（12）：1787-1791.

[4]毛玉萃.試論企業(yè)電子商務與企業(yè)內(nèi)信息系統(tǒng)的整合[J].管理信息系統(tǒng)，2001，（5）：43-45.

[5]謝寶義.高校圖書館數(shù)字資源整合模式研究與實踐——以石家莊鐵道大學圖書館為例[J].圖書館建設，2011，（2）：33-35.

[6]張巧娜.海峽兩岸高校圖書館數(shù)字資源整合的比較研究[J].圖書情報工作，2012，56（19）：43-47.

[7]李紅霞.圖書館館藏數(shù)字資源整合方案研究[J].現(xiàn)代情報，2006，26（8）：144-145.

[8]趙榮.淺談圖書館服務工作如何應對數(shù)字化閱讀的挑戰(zhàn)[J].圖書館工作與研究，2011，（7）：99-101.

[9]郝欣，劉英濤.基于本體集成的數(shù)字資源整合研究[J].圖書館學研究，2011，（20）：55-59.

[10]崔偉，徐愷英，王寧.基于知識鏈的數(shù)字資源整合研究[J].圖書館學研究，2010，（15）：32-35.

[11]袁村平.圖書館與出版企業(yè)數(shù)字資源共享影響因素分析[D].湘潭：湘潭大學，2013.

[12]楊晨.基于Web Services的高職院校教務平臺的設計與實現(xiàn)[D].成都：電子科技大學，2014.

[13]邱均平，王菲菲.基于共現(xiàn)與耦合的館藏文獻資源深度聚合研究探析[J].中國圖書館學報，2013，39（3）：25-33.

[14]陳海敏.異構(gòu)信息集成系統(tǒng)研究[J].情報科學，2008，（12）：1902-1907.

[15]JM Smith，PA Bernstein，U Dayal.Multibase：Integrating Heterogeneous Distributed Database Systems…-American Federation of Information Processing Societies：National Computer Conference，1981：487-499.

[16]W H Inmon.Building the Data Warehouse.Boston：QED Technical Publishing Group，1992

[17]谷巖，馮華.利用數(shù)據(jù)倉庫技術(shù)解決異構(gòu)數(shù)據(jù)庫的集成問題[J].計算機應用與軟件，2005，（6）：24-26.

[18]Wiederhold G.Mediators in the Architecture of Future Information Systems[J].IEEE Computer，1992，25（3）：38-49.

[19]D Florescu，A Levy，A Mendelzon.Database Techniques for the World Wide Web：A Survey[J].SIGMOD，1998.

[20]陳躍國，王京春.數(shù)據(jù)集成綜述[J].計算機科學，2004，（5）：48-51.

[21]周甫賓.基于EDI的集裝箱運價指數(shù)生成與技術(shù)分析[J].中國航海，2006，（3）：82-86.

[22]Zhao Yifei，Zhang Dali，Tatsuo Yanagita.World Conference on Transport Research WCTR 2016：Container Liner Freight Index Based on Data from E-booking Platforms：Shanghai，2016：10-15.

[23]付東方，趙一飛.集裝箱運價指數(shù)數(shù)據(jù)源及算法分析[J].大連海事大學學報，2015，（3）：87-92.

[24]馬大川，楊紅平.信息資源的集成整合研究[J].中國圖書館學報，2004，（3）：36-40.

[25]劉平峰，章佩璐，張軍，等.面向主題的Web信息融合模型[J].圖書情報工作，2011，（8）：40-43.

[26]徐寶祥，葉培華.知識表示的方法研究[J].情報科學，2007，（5）：690-694.

[27]孟小峰.Web信息集成技術(shù)研究[J].計算機應用與軟件，2003，（11）：32-36，63.

[28]羅書練，鄭萍，陳志強.加強數(shù)字資源的整合提供良好信息服務[J].醫(yī)學信息：上旬刊，2005，18（8）：940-941.

[29]Devaraj S，Krajewski L，Wei J C.Impact of eBusiness Technologies on Operational Performance：The Role of Production Information Integration in the Supply Chain[J].Journal of Operations Management，2007，25（6）：1199-1216.

（責任編輯：孫國雷）