王瑾
摘要:研究物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)存儲(chǔ)以及共享策略,能夠有效提高數(shù)據(jù)存儲(chǔ)以及數(shù)據(jù)共享的質(zhì)量?;诖?,文章首先簡(jiǎn)單介紹物聯(lián)網(wǎng)信息服務(wù)系統(tǒng)的結(jié)構(gòu)組成。其次,分析物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)存儲(chǔ)的方法,其中主要包括知識(shí)密度的應(yīng)用、預(yù)處理技術(shù)以及數(shù)據(jù)分布3方面內(nèi)容。最后,研究物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)共享策略,其中主要包括基于設(shè)計(jì)準(zhǔn)則的數(shù)據(jù)共享策略、基于物聯(lián)網(wǎng)標(biāo)識(shí)平臺(tái)的數(shù)據(jù)共享策略?xún)煞矫鎯?nèi)容。
關(guān)鍵詞:物聯(lián)網(wǎng);異構(gòu)數(shù)據(jù);共享策略
隨著時(shí)代的不斷發(fā)展,我國(guó)物聯(lián)網(wǎng)行業(yè)也得到了一定的發(fā)展,雖然目前該行業(yè)涉及的范圍較廣,但是整體上仍然處于發(fā)展的初期階段,在此過(guò)程中需要重點(diǎn)解決物聯(lián)網(wǎng)中信息存儲(chǔ)發(fā)展的智能化問(wèn)題。目前物聯(lián)網(wǎng)在異構(gòu)數(shù)據(jù)存儲(chǔ)共享的過(guò)程中仍然存在較多需要完善的地方,為了保證物聯(lián)網(wǎng)整體的發(fā)展質(zhì)量,需要根據(jù)實(shí)際物聯(lián)網(wǎng)在發(fā)展過(guò)程中存在的問(wèn)題制定解決方案,這種方式能夠保證物聯(lián)網(wǎng)信息存儲(chǔ)以及信息共享的質(zhì)量。
1 物聯(lián)網(wǎng)信息服務(wù)系統(tǒng)的結(jié)構(gòu)組成
在實(shí)際運(yùn)行中主要可以將物聯(lián)網(wǎng)系統(tǒng)分為以下幾方面內(nèi)容,分別為感知層、網(wǎng)絡(luò)層、數(shù)據(jù)層以及應(yīng)用層。其中信息服務(wù)系統(tǒng)在數(shù)據(jù)層中,主要負(fù)責(zé)存儲(chǔ)大量的異構(gòu)數(shù)據(jù),并將其應(yīng)用在各種服務(wù)中,最終達(dá)到提供多樣化服務(wù)的目的,同時(shí)也是物聯(lián)網(wǎng)正常運(yùn)行的前提條件。在信息服務(wù)系統(tǒng)中,物聯(lián)網(wǎng)能夠?qū)崿F(xiàn)信息采樣功能、智能追蹤功能、監(jiān)控功能以及管理功能幾方面內(nèi)容,由此可以看出新信息服務(wù)系統(tǒng)對(duì)物聯(lián)網(wǎng)正常運(yùn)行的重要性。物聯(lián)網(wǎng)信息服務(wù)系統(tǒng)主要由安全控制系統(tǒng)、共享空間系統(tǒng)、數(shù)據(jù)接收系統(tǒng)以及數(shù)據(jù)存儲(chǔ)系統(tǒng)構(gòu)成,其中感知設(shè)備以及網(wǎng)絡(luò)通過(guò)其中的數(shù)據(jù)接口進(jìn)入到原始數(shù)據(jù)層中,原始數(shù)據(jù)、加工數(shù)據(jù)以及元數(shù)據(jù)共同組成系統(tǒng)中的共享空間。另外,本地應(yīng)用、外部應(yīng)用以及外部信息服務(wù)系統(tǒng)通過(guò)系統(tǒng)中的數(shù)據(jù)應(yīng)用接口進(jìn)入到持久數(shù)據(jù)存儲(chǔ)系統(tǒng)中,將其中包含的數(shù)據(jù)進(jìn)行存儲(chǔ)。數(shù)據(jù)正是通過(guò)這種方式在信息服務(wù)系統(tǒng)中進(jìn)行相互傳輸,不同系統(tǒng)板塊中對(duì)應(yīng)的系統(tǒng)功能也不同,因此,能夠?qū)崿F(xiàn)多樣化的信息服務(wù)。
物聯(lián)網(wǎng)在實(shí)際應(yīng)用過(guò)程中具有多源異構(gòu)、規(guī)模大、時(shí)空關(guān)聯(lián)性強(qiáng)、冗余度高等特點(diǎn),目前研究的重點(diǎn)在物聯(lián)網(wǎng)信息服務(wù)系統(tǒng)中的時(shí)空關(guān)聯(lián)以及事件查詢(xún)等方面內(nèi)容,已經(jīng)取得了一定的研究成果。但是在海量異構(gòu)存儲(chǔ)方面,仍然存在存儲(chǔ)性能低以及數(shù)據(jù)共享難度高等問(wèn)題,不能達(dá)到物聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)的要求,在實(shí)際應(yīng)用過(guò)程中非常容易出現(xiàn)信息孤島等現(xiàn)象,嚴(yán)重影響物聯(lián)網(wǎng)的整體運(yùn)行質(zhì)量[1]。
2 物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)的存儲(chǔ)方法
2.1 知識(shí)密度的應(yīng)用
文件系統(tǒng)存儲(chǔ)技術(shù)在實(shí)際應(yīng)用過(guò)程中經(jīng)常采用分布式文件系統(tǒng)存儲(chǔ)的方式,在此過(guò)程中,需要在本地文件系統(tǒng)的基礎(chǔ)之上建立物聯(lián)網(wǎng)文件系統(tǒng),這種建立方式能夠?qū)⑽?/p>
聯(lián)網(wǎng)的存儲(chǔ)點(diǎn)相互連接。也就是說(shuō),將系統(tǒng)中獨(dú)立運(yùn)行的節(jié)點(diǎn)相互組合,最終形成一個(gè)整體,并對(duì)其中的資源進(jìn)行統(tǒng)一管理,這種方式能夠在統(tǒng)一時(shí)間為多個(gè)用戶(hù)提供數(shù)據(jù)文件,大大提高了數(shù)據(jù)傳輸?shù)男剩瑫r(shí)還能夠有效控制物聯(lián)網(wǎng)中的空間動(dòng)態(tài)拓展問(wèn)題。但是為了保證數(shù)據(jù)的存儲(chǔ)質(zhì)量,還需要對(duì)其中的知識(shí)密度展開(kāi)分析,知識(shí)密度指的是完整表達(dá)特定信息的過(guò)程中,需要的數(shù)據(jù)量和原始數(shù)據(jù)量之間的比值,通常情況下用小數(shù)的形式表示。物聯(lián)網(wǎng)中知識(shí)密度的大小通常由知識(shí)對(duì)象決定。以網(wǎng)絡(luò)中的音頻傳輸為例,要想得到不同時(shí)間段音頻的大小,則需要確定音頻中的聲音序列。假如音頻的大小為1 kB,共占14個(gè)字節(jié),則其中的知識(shí)密度就是0.0137。
2.2 數(shù)據(jù)預(yù)處理技術(shù)
數(shù)據(jù)預(yù)處理技術(shù)主要包括以下幾方面內(nèi)容。
2.2.1 數(shù)據(jù)的分類(lèi)處理
在此過(guò)程中的分類(lèi)對(duì)象為系統(tǒng)中的原始采樣數(shù)據(jù),主要被分為兩類(lèi),其中第一類(lèi)為輕量級(jí)的數(shù)據(jù),主要包括數(shù)據(jù)的數(shù)值型和字符型,這類(lèi)數(shù)據(jù)在實(shí)際使用中的特點(diǎn)就是傳輸成本低、使用的空間小。另一類(lèi)是多媒體數(shù)據(jù),主要包括視頻數(shù)據(jù)、圖像數(shù)據(jù)、音頻數(shù)據(jù)以及信號(hào)數(shù)據(jù)等,這種類(lèi)型的數(shù)據(jù)在實(shí)際應(yīng)用過(guò)程中主要具有需要的存儲(chǔ)空間大等特點(diǎn),在數(shù)據(jù)預(yù)處理的過(guò)程中,針對(duì)不同種類(lèi)型的數(shù)據(jù),需要采用不同的數(shù)據(jù)處理方式。
2.2.2 增加知識(shí)密度
這種方式是提高存儲(chǔ)質(zhì)量的主要方式,該種手段經(jīng)常使用在多媒體數(shù)據(jù)中,由于多媒體數(shù)據(jù)在存儲(chǔ)的過(guò)程中需要大量的空間,其中的知識(shí)密度較低,因此為了在保證存儲(chǔ)質(zhì)量的同時(shí),縮小存儲(chǔ)空間,必須對(duì)其實(shí)施量化處理,將其中有價(jià)值的部分提取出來(lái),對(duì)其中的關(guān)鍵詞和關(guān)鍵信息進(jìn)行處理,這種方式能夠大大提高數(shù)據(jù)的使用效率。
在此過(guò)程中需要將多媒體數(shù)據(jù)分為兩類(lèi),其中第一類(lèi)為興趣值,該類(lèi)數(shù)據(jù)指的用戶(hù)在一定范圍內(nèi)最關(guān)心的數(shù)據(jù)值,例如在交通系統(tǒng)中,所對(duì)應(yīng)的數(shù)據(jù)值為車(chē)輛的違規(guī)數(shù)量以及車(chē)牌號(hào)等,縮小有效數(shù)據(jù)的范圍。第二類(lèi)為摘要值,這種類(lèi)型的數(shù)據(jù)指的是多媒體數(shù)據(jù)的簡(jiǎn)略描述,這種數(shù)據(jù)中的知識(shí)密度為0,通常情況下起到輔助作用。在實(shí)際生活中,要想判斷兩個(gè)圖片的相似程度,可以通過(guò)數(shù)據(jù)中的摘要值進(jìn)行判斷。
2.3 數(shù)據(jù)分布
數(shù)據(jù)分布主要包括以下幾方面內(nèi)容。
2.3.1 數(shù)據(jù)類(lèi)型的劃分
數(shù)據(jù)存儲(chǔ)類(lèi)型可以分為高集能存儲(chǔ)以及分離存儲(chǔ),其中分離存儲(chǔ)需要設(shè)置一個(gè)主集群和一個(gè)副集群,這兩個(gè)集群在實(shí)際運(yùn)行中具有較強(qiáng)的獨(dú)立性,各自包含一個(gè)數(shù)據(jù)庫(kù)。在此過(guò)程中,需要將多媒體數(shù)據(jù)存在其中的副集群中,采用這種存儲(chǔ)方式的主要原因是外界用戶(hù)對(duì)副集群的感知程度較低,在此過(guò)程中,這兩個(gè)集群可以實(shí)施數(shù)據(jù)傳輸。多媒體數(shù)據(jù)與輕量化數(shù)據(jù)表面上存在于兩個(gè)集群之中,但是在邏輯中仍然屬于一個(gè)集群。
2.3.2 數(shù)據(jù)庫(kù)
系統(tǒng)中采用的存儲(chǔ)方式主要為分布式,在此過(guò)程中存儲(chǔ)的數(shù)據(jù)達(dá)到一定數(shù)量時(shí),必須實(shí)施數(shù)據(jù)分片,將其中的數(shù)據(jù)分布到不同的機(jī)器中,在這種方式中,集群的獨(dú)立運(yùn)行能力較強(qiáng),可以不依靠服務(wù)器進(jìn)行數(shù)據(jù)存儲(chǔ)。另外,采用數(shù)據(jù)分片的方式能夠提升自身的數(shù)據(jù)存儲(chǔ)能力以及系統(tǒng)應(yīng)用性能,但是在此過(guò)程中需要注意,需要根據(jù)實(shí)際情況制定科學(xué)的應(yīng)用方案,否則會(huì)出現(xiàn)降低系統(tǒng)使用性能的現(xiàn)象。如果數(shù)據(jù)的規(guī)模較小,則不需要數(shù)據(jù)分片處理,避免出現(xiàn)時(shí)間浪費(fèi)的現(xiàn)象[2]。
3 物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)共享策略
3.1 基于設(shè)計(jì)準(zhǔn)則的數(shù)據(jù)共享策略
在該種設(shè)計(jì)準(zhǔn)則中,所有能夠被命名的數(shù)據(jù)都可以叫作抽象資源,其中主要包括網(wǎng)絡(luò)中的數(shù)據(jù)信息、連接信息、計(jì)算信息以及存儲(chǔ)信息、物聯(lián)網(wǎng)中的網(wǎng)關(guān)以及感知網(wǎng)絡(luò)等,涉及的范圍較廣。為了提高資源管理的質(zhì)量,需要采用層次化管理的方式,其中主要包括實(shí)體級(jí)、應(yīng)用級(jí)以及系統(tǒng)級(jí)3方面內(nèi)容,實(shí)體級(jí)指的是其中的資源都是獨(dú)立的實(shí)體資源,其中主要包括對(duì)象資源、索引資源以及知識(shí)資源等。應(yīng)用級(jí)指的是一些資源的結(jié)合體,在此過(guò)程中存在多個(gè)感知對(duì)象,其中一個(gè)集合體中的資源等級(jí)也相同。系統(tǒng)級(jí)主要指的是物聯(lián)網(wǎng)系統(tǒng)層中的數(shù)據(jù)資源。
在這種數(shù)據(jù)共享策略中,主要包括資源層級(jí)關(guān)系和資源類(lèi)型關(guān)系兩種,資源層級(jí)關(guān)系中主要包括系統(tǒng)級(jí)、應(yīng)用級(jí)以及實(shí)體級(jí),其中信息服務(wù)系統(tǒng)數(shù)據(jù)屬于系統(tǒng)級(jí),各個(gè)應(yīng)用系統(tǒng)屬于應(yīng)用級(jí),各個(gè)數(shù)據(jù)實(shí)體屬于實(shí)體級(jí)。資源類(lèi)型管關(guān)系中主要包括索引資源、對(duì)象資源、知識(shí)資源等,其中索引資源將數(shù)據(jù)信息共享到對(duì)象資源中,對(duì)象資源再將數(shù)據(jù)信息分別傳輸給感知數(shù)據(jù)以及知識(shí)資源,再由知識(shí)資源生成最終的數(shù)據(jù)。除了這種數(shù)據(jù)生成方式之外,索引資源可以直接將數(shù)據(jù)信息共享到知識(shí)資源中,由知識(shí)資源直接生成數(shù)據(jù),以上兩種方式都能夠?qū)崿F(xiàn)數(shù)據(jù)生成。
3.2 基于物聯(lián)網(wǎng)標(biāo)識(shí)平臺(tái)的數(shù)據(jù)共享策略
利用這種方式能對(duì)物聯(lián)網(wǎng)中大量的數(shù)據(jù)資源進(jìn)行標(biāo)識(shí)管理,首先需要發(fā)現(xiàn)資源和定位資源,在此過(guò)程中需要確定系統(tǒng)中數(shù)據(jù)存在的位置,找出該資源生命周期中存在的所有資源,從而建立一個(gè)獨(dú)立的信息服務(wù)系統(tǒng)。在商品生命周期生產(chǎn)以及物流銷(xiāo)售環(huán)節(jié)中可以利用這種方式。利用物聯(lián)網(wǎng)中的異構(gòu)標(biāo)識(shí),能夠?qū)?shù)據(jù)進(jìn)行編碼,主要組成結(jié)構(gòu)為標(biāo)準(zhǔn)碼加上物品碼,標(biāo)準(zhǔn)碼主要負(fù)責(zé)編碼格式的識(shí)別。其次,協(xié)調(diào)工作流程,在此過(guò)程中,主要的工作流程包括注冊(cè)信息、映射處理以及資源檢索,其中注冊(cè)信息主要包括資源得標(biāo)識(shí)信息、物品中的標(biāo)準(zhǔn)碼以及數(shù)據(jù)的描述信息等。映射處理指的是在資源收集完成之后,采用統(tǒng)一資源標(biāo)識(shí)符(Uniform Resource Identifier, URI)的方式對(duì)數(shù)據(jù)進(jìn)行映射處理,保證信息注冊(cè)的完整度。最終,資源檢索指的是利用檢索系統(tǒng)對(duì)系統(tǒng)中的資源進(jìn)行檢索,保證最終數(shù)據(jù)共享的質(zhì)量。由此可以看出,在制定數(shù)據(jù)共享策略的過(guò)程中,需要根據(jù)實(shí)際情況制定不同的數(shù)據(jù)共享方案,采用這種方式制定的數(shù)據(jù)共享策略具有較強(qiáng)的針對(duì)性以及應(yīng)用價(jià)值。除此之外,還要充分考慮其中的影響因素,降低其對(duì)系統(tǒng)正常運(yùn)行的影響[3]。
4 結(jié)語(yǔ)
隨著人們對(duì)物聯(lián)網(wǎng)的關(guān)注程度越來(lái)越局,如何提高物聯(lián)網(wǎng)中數(shù)據(jù)存儲(chǔ)以及數(shù)據(jù)共享的質(zhì)量,成為有關(guān)人員關(guān)注的重點(diǎn)問(wèn)題。本文通過(guò)研究物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)存儲(chǔ)以及共享策略發(fā)現(xiàn),對(duì)其進(jìn)行研究,不僅能夠提高物聯(lián)信息存儲(chǔ)的質(zhì)量,同時(shí)還能夠?qū)崿F(xiàn)實(shí)時(shí)信息共享。由此可以看出,研究物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)存儲(chǔ)以及共享策略,能夠?yàn)榻窈笪锫?lián)網(wǎng)異構(gòu)數(shù)據(jù)存儲(chǔ)以及數(shù)據(jù)共享的發(fā)展奠定基礎(chǔ)。
[參考文獻(xiàn)]
[1]趙立波,李凌霞,王旭.物聯(lián)網(wǎng)海量異構(gòu)傳感器采樣數(shù)據(jù)存儲(chǔ)與查詢(xún)處理[J].軟件導(dǎo)刊,2017(12):182-183, 187.
[2]王順.面向農(nóng)業(yè)物聯(lián)網(wǎng)的異構(gòu)數(shù)據(jù)存儲(chǔ)方法研究[D].鄭州:河南農(nóng)業(yè)大學(xué),2016.
[3]何鳳成.Hestus:—種海量異構(gòu)物聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)模型及其實(shí)現(xiàn)[C].合肥:第29屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議,2012.