王鵬濤
摘? 要:隨著國(guó)民經(jīng)濟(jì)的不斷增長(zhǎng),科學(xué)技術(shù)的不斷創(chuàng)新,我國(guó)電子商務(wù)行業(yè)發(fā)展得到了質(zhì)的飛躍。海量數(shù)據(jù)安全存儲(chǔ)作為現(xiàn)代電子商務(wù)建設(shè)運(yùn)營(yíng)管理過(guò)程的重中之重,是一項(xiàng)必不可缺的關(guān)鍵內(nèi)容,直接關(guān)系到電子商務(wù)系統(tǒng)運(yùn)行的穩(wěn)定性,能否保障每個(gè)用戶切身利益。因此現(xiàn)代電子商務(wù)企業(yè)必須高度重視數(shù)據(jù)安全存儲(chǔ)工作,面對(duì)持續(xù)增長(zhǎng)的電子商務(wù)數(shù)據(jù)要科學(xué)采用分布式存儲(chǔ)系統(tǒng),優(yōu)化改善不同類型數(shù)據(jù)存儲(chǔ)組織方式,全面提高電子商務(wù)數(shù)據(jù)安全儲(chǔ)存質(zhì)量。該文將進(jìn)一步對(duì)電子商務(wù)數(shù)據(jù)存儲(chǔ)展開(kāi)分析與探討。
關(guān)鍵詞:電子商務(wù)? 數(shù)據(jù)? 存儲(chǔ)
中圖分類號(hào):TP333 ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2020)01(b)-0020-02
當(dāng)前是一個(gè)互聯(lián)網(wǎng)時(shí)代,電子商務(wù)發(fā)展極大地方便了人們的日常生活,同時(shí)也給商家?guī)?lái)了更多創(chuàng)造利益的機(jī)會(huì)。數(shù)據(jù)儲(chǔ)存作為電子商務(wù)運(yùn)營(yíng)管理工作的重要內(nèi)容,受到了社會(huì)各界人士的高度關(guān)注,能否將處理好的各項(xiàng)數(shù)據(jù)安全儲(chǔ)存在系統(tǒng)數(shù)據(jù)庫(kù)中,會(huì)直接影響到系統(tǒng)日常運(yùn)行的穩(wěn)定性,并為用市場(chǎng)用戶提供更加良好的UE體驗(yàn)服務(wù)。為了保障我國(guó)電子商務(wù)和諧健康的持續(xù)發(fā)展,就必須加強(qiáng)對(duì)電子商務(wù)數(shù)據(jù)信息的安全存儲(chǔ)保護(hù)工作,全面提高電子商務(wù)網(wǎng)絡(luò)數(shù)據(jù)安全儲(chǔ)存管理水平。
1? 數(shù)據(jù)存儲(chǔ)概述
數(shù)據(jù)存儲(chǔ)實(shí)質(zhì)是指數(shù)據(jù)流在加工處理過(guò)程中產(chǎn)生的臨時(shí)文件或者加工處理過(guò)程中需要檢索獲取的相關(guān)信息。數(shù)據(jù)存儲(chǔ)方式與數(shù)據(jù)文件組織存在著密不可分的聯(lián)系,其核心在于建立記錄的邏輯與物理順序間對(duì)應(yīng)的關(guān)系,明確數(shù)據(jù)存儲(chǔ)地位,以此來(lái)充分提升數(shù)據(jù)存儲(chǔ)效率。在當(dāng)前計(jì)算機(jī)市場(chǎng)上常見(jiàn)的數(shù)據(jù)存儲(chǔ)方式主要包括了3種,它們分別是DAS、NAS以及SAN,數(shù)據(jù)存儲(chǔ)應(yīng)用最為顯著的特征就是不存在統(tǒng)一標(biāo)準(zhǔn)的體系結(jié)構(gòu)[1],這3種數(shù)據(jù)存儲(chǔ)方式是相輔相成、相互共存的,能夠最大程度地滿足市場(chǎng)企業(yè)信息化的應(yīng)用發(fā)展,現(xiàn)代電子商務(wù)企業(yè)在優(yōu)化設(shè)計(jì)數(shù)據(jù)庫(kù)時(shí),要結(jié)合自身系統(tǒng)應(yīng)用環(huán)境特點(diǎn),合理構(gòu)建出最佳的數(shù)據(jù)庫(kù)運(yùn)行管理模式,同時(shí)科學(xué)完善系統(tǒng)數(shù)據(jù)庫(kù),確保其能夠符合海量數(shù)據(jù)的安全儲(chǔ)存和高效檢索需求。
2? 電子商務(wù)環(huán)境數(shù)據(jù)存儲(chǔ)分析
在現(xiàn)代電子商務(wù)行業(yè)中阿里巴巴作為龍頭企業(yè),其底下的淘寶網(wǎng)每天都會(huì)產(chǎn)生海量的信息數(shù)據(jù),這些數(shù)據(jù)除了包括各種線上產(chǎn)品交易數(shù)據(jù)信息、用戶信息、門(mén)戶網(wǎng)站等,還涉及到淘江湖、社區(qū)等信息交流內(nèi)容,需要為個(gè)性化用戶提供其他數(shù)據(jù)功能作用。而在這些海量數(shù)據(jù)當(dāng)中,絕大多數(shù)都是以圖片和文字描述的小文件為主,大文件的視頻數(shù)據(jù)、索引較少。因此,當(dāng)淘寶網(wǎng)在構(gòu)建電子商務(wù)海量數(shù)據(jù)存儲(chǔ)模型時(shí),相關(guān)技術(shù)人員要充分考慮到解決不同大小文件的高效存儲(chǔ)問(wèn)題,并且還需解決對(duì)大量小文件的讀取問(wèn)題[2],確保整個(gè)電子商務(wù)系統(tǒng)能夠穩(wěn)定持續(xù)的運(yùn)行。伴隨著時(shí)間的不斷推移,電子商務(wù)用戶的不斷增加,電子商務(wù)企業(yè)將會(huì)面臨著更多數(shù)據(jù)的儲(chǔ)存管理問(wèn)題,企業(yè)需要根據(jù)實(shí)際情況合理采取數(shù)據(jù)存儲(chǔ)方式,打造出科學(xué)完善的系統(tǒng)數(shù)據(jù)儲(chǔ)存庫(kù)。
3? 電子商務(wù)數(shù)據(jù)存儲(chǔ)模型設(shè)計(jì)
3.1 Hadoop存儲(chǔ)系統(tǒng)
在我國(guó)電子商務(wù)數(shù)據(jù)儲(chǔ)存管理工作中,Hadoop分布式系統(tǒng)是一種常用的從數(shù)據(jù)儲(chǔ)存系統(tǒng),像電商市場(chǎng)上的淘寶網(wǎng)、京東以及百度等都在用這種儲(chǔ)存系統(tǒng)。雖然說(shuō)Hadoop存儲(chǔ)系統(tǒng)最早是為了搜索引擎中的大文件開(kāi)發(fā)的,更加針對(duì)于大文件的處理和儲(chǔ)存,不適宜用在大量小文件的處理存儲(chǔ)工作中,但是只要通過(guò)對(duì)其進(jìn)行一定的優(yōu)化設(shè)計(jì),就可以最大程度地發(fā)揮出該種數(shù)據(jù)存儲(chǔ)系統(tǒng)的價(jià)值作用,促使其能夠?yàn)楦鞣N大小海量數(shù)據(jù)提供安全可靠的存儲(chǔ)服務(wù)知識(shí)。Hadoop存儲(chǔ)系統(tǒng)設(shè)計(jì)主要包括了兩個(gè)部分,它們分別是HDFS(Hadoop分布式文件系統(tǒng))、Hbase(Hadoop分布式數(shù)據(jù)庫(kù))。
3.2 海量數(shù)據(jù)存儲(chǔ)模型設(shè)計(jì)
海量數(shù)據(jù)存儲(chǔ)模型的設(shè)計(jì)主要包括了3個(gè)部分內(nèi)容,分別是主服務(wù)器、次服務(wù)器以及客戶端。如海量數(shù)據(jù)存儲(chǔ)模型中主服務(wù)器的構(gòu)成有兩個(gè)部分:一部分是主服務(wù)器部分,另一部分是查詢主服務(wù)器,在優(yōu)化設(shè)計(jì)數(shù)據(jù)存儲(chǔ)模型主服務(wù)器時(shí),技術(shù)人員要確保主服務(wù)器能夠通過(guò)主動(dòng)發(fā)送修改信息與查詢主服務(wù)器保持一致性[3],這樣能夠保障系統(tǒng)內(nèi)數(shù)據(jù)被修改后,查詢主服務(wù)器能夠有效獲取到對(duì)應(yīng)的映射數(shù)據(jù)修改信息;次服務(wù)器是由眾多獨(dú)立服務(wù)器基于網(wǎng)絡(luò)連接構(gòu)成的,其能夠幫助電子商務(wù)企業(yè)實(shí)現(xiàn)對(duì)海量數(shù)據(jù)存儲(chǔ)功能,任何一個(gè)次服務(wù)器都是由系統(tǒng)主服務(wù)器分配決定客戶提交的數(shù)據(jù)表和文件存儲(chǔ),當(dāng)客戶從主服務(wù)器上獲取到數(shù)據(jù)位置信息后,就能夠有效從對(duì)應(yīng)次服務(wù)器上獲取到信息數(shù)據(jù);客戶端作為海量數(shù)據(jù)存儲(chǔ)系統(tǒng)中的各種命令發(fā)起端,它的主要功能作用是讀取、更新以及創(chuàng)建數(shù)據(jù)等。客戶端會(huì)自動(dòng)按照用戶的不同命令將其科學(xué)有效地分配到對(duì)應(yīng)的服務(wù)器當(dāng)中,倘若是讀取命令就會(huì)自動(dòng)分配到查詢主服務(wù)器,倘若是其他邏輯命令就會(huì)自動(dòng)分配到主服務(wù)器端?,F(xiàn)代電子商務(wù)企業(yè)要想實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的快速檢索讀取,除了要安排專業(yè)技術(shù)人員設(shè)置專門(mén)數(shù)據(jù)查詢部門(mén)外,還必須在存儲(chǔ)模型當(dāng)中優(yōu)化設(shè)計(jì)一個(gè)全局的兩層次分布式緩存系統(tǒng),該分布式緩存系統(tǒng)設(shè)計(jì)可以采用市場(chǎng)上應(yīng)用較為廣泛的開(kāi)源Memcached系統(tǒng)來(lái)完成。電子商務(wù)系統(tǒng)內(nèi)的主服務(wù)器之間、次服務(wù)器之間的通信協(xié)議都是基于TCP/IP協(xié)議的。相關(guān)工作人員可以在Hadoop存儲(chǔ)系統(tǒng)中合理設(shè)計(jì)RPC以此實(shí)現(xiàn)兩個(gè)協(xié)議。
3.3 電子商務(wù)數(shù)據(jù)組織方式
基于現(xiàn)代電子商務(wù)發(fā)展環(huán)境下,海量數(shù)據(jù)有著多種形式,比如結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)、超媒體數(shù)據(jù)等。其中結(jié)構(gòu)化數(shù)據(jù)主要指的是文本數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)指的是圖片視頻、超媒體數(shù)據(jù)指的是文本信息和多媒體信息的結(jié)合產(chǎn)物。在Hbase分布式數(shù)據(jù)庫(kù)搭建過(guò)程中,所有存儲(chǔ)數(shù)據(jù)都會(huì)被默認(rèn)成字符串類型,針對(duì)于此,工作人員在處理結(jié)構(gòu)化文本數(shù)據(jù)時(shí)需要采用Hbase分布式數(shù)據(jù)庫(kù)科學(xué)存儲(chǔ)對(duì)應(yīng)的字符串[4];對(duì)于非結(jié)構(gòu)化數(shù)據(jù)圖片和視頻數(shù)據(jù)時(shí),工作人員需要將其以文件形式高效存儲(chǔ)在對(duì)應(yīng)的HDFS中,同時(shí)還需在Hbase有效設(shè)置對(duì)應(yīng)的描述和地址信息表;而對(duì)于以HTML表示的超媒體數(shù)據(jù),工作人員需要將HTML數(shù)據(jù)有效轉(zhuǎn)換成相對(duì)應(yīng)的XML數(shù)據(jù),這樣就能夠?qū)⑵溆行Т鎯?chǔ)在Hbase分布式數(shù)據(jù)庫(kù)中,轉(zhuǎn)換后的XML數(shù)據(jù)更加有助于描述信息內(nèi)容的方便檢索查詢。電子商務(wù)企業(yè)在數(shù)據(jù)存儲(chǔ)管理工作中,還可以根據(jù)不同類型數(shù)據(jù)信息,采取不同次服務(wù)器存儲(chǔ)的方式。比如,工作人員通過(guò)建立專門(mén)的文本次服務(wù)器、圖片視頻次服務(wù)器等。
4? 結(jié)語(yǔ)
綜上所述,現(xiàn)代電子商務(wù)企業(yè)要高度重視海量數(shù)據(jù)安全高效存儲(chǔ)管理工作,通過(guò)優(yōu)化設(shè)計(jì)海量數(shù)據(jù)存儲(chǔ)模型,有效實(shí)現(xiàn)對(duì)海量電子商務(wù)數(shù)據(jù)的處理。基于電子商務(wù)發(fā)展環(huán)境下,企業(yè)可以通過(guò)設(shè)計(jì)應(yīng)用Hadoop系統(tǒng)的存儲(chǔ)架構(gòu)Hbase和HDFS,同時(shí)還需注重解決存儲(chǔ)系統(tǒng)中的小文件處理問(wèn)題,合理增加基于Memcached的分布式緩存系統(tǒng),根據(jù)不同類型數(shù)據(jù)合理采取對(duì)應(yīng)的存儲(chǔ)組織方式。
參考文獻(xiàn)
[1] 李克然,劉東蘇,鄧媛.電子商務(wù)環(huán)境下海量數(shù)據(jù)存儲(chǔ)模型[J].情報(bào)雜志,2016(2):54-57.
[2] 袁建軍.電子商務(wù)海量數(shù)據(jù)的獲取、存儲(chǔ)及檢索[J].計(jì)算機(jī)研究,2017(1):142-143.
[3] 徐國(guó)華.數(shù)據(jù)管理:電子商務(wù)數(shù)據(jù)的存儲(chǔ)問(wèn)題[J].金融信息化論壇,2018(11):35-37.
[4] 章麗芳.云計(jì)算環(huán)境下的電子商務(wù)數(shù)據(jù)管理模式研究[J].電腦知識(shí)與技術(shù),2017(3):81-83.