韓 雪
(山東省聊城市人民醫(yī)院)
隨著信息技術(shù)的不斷發(fā)展,大數(shù)據(jù)時代下,網(wǎng)絡(luò)應(yīng)用更加頻繁,在網(wǎng)絡(luò)信息影響下,檔案文件逐漸向數(shù)字化方向發(fā)展,同時檔案資源也在不斷增加。為使檔案管理的效率得到提升,應(yīng)結(jié)合實際情況,可以通過分布式文件儲存技術(shù)對檔案進行系統(tǒng)的分析和管理,提升檔案篩選和儲存效果,不斷提高檔案文件保存質(zhì)量,從而優(yōu)化檔案管理工作效果。
大數(shù)據(jù)時代的到來為檔案管理帶來了較為明顯的影響,一方面,大數(shù)據(jù)技術(shù)和信息技術(shù)等的應(yīng)用,使檔案管理的質(zhì)量得到提升,進一步推動檔案管理工作的開展和提升。在網(wǎng)絡(luò)的影響下,檔案數(shù)據(jù)不斷增加,在進行檔案管理時,需要對海量數(shù)據(jù)文件進行分類管理和儲存,因此需要檔案管理工作者不斷對管理技術(shù)進行升級,創(chuàng)建高效的檔案管理模式,提高檔案管理效果。檔案管理中文件逐漸向數(shù)字化方向發(fā)展,人們可以直接利用計算機技術(shù)進行檔案管理,簡化檔案管理流程,提高檔案管理的便捷性。
另一方面,受到網(wǎng)絡(luò)信息的影響,同樣為檔案管理帶來一定的挑戰(zhàn)。在大數(shù)據(jù)環(huán)境下,需要逐漸從傳統(tǒng)檔案管理向數(shù)字化管理方向發(fā)展,但整體數(shù)據(jù)量較大,為數(shù)據(jù)的處理和儲存均帶來了一定的難度[1]。同時,受到網(wǎng)絡(luò)安全的影響,使用網(wǎng)絡(luò)進行檔案管理時,受到病毒木馬等方式的攻擊下,可能會發(fā)生檔案信息泄露或檔案被惡意篡改等安全問題,影響檔案管理效果。相關(guān)檔案管理人員應(yīng)加強對檔案管理技術(shù)的研究,不斷對檔案管理技術(shù)進行優(yōu)化處理,進一步提高檔案管理質(zhì)量。
分布式檔案文件儲存技術(shù)是利用相應(yīng)的管理系統(tǒng),將檔案文件分散到不同節(jié)點上進行儲存管理的技術(shù),在運行過程中,節(jié)點的故障對整體數(shù)據(jù)儲存質(zhì)量不產(chǎn)生影響,從而避免出現(xiàn)信息大量丟失的情況,保障數(shù)據(jù)的安全性。分布式檔案文件儲存技術(shù)在運行過程中,能夠根據(jù)實際需求進行擴展,實現(xiàn)計算機集群效果,構(gòu)建較大的計算機網(wǎng)絡(luò),實現(xiàn)文件的共享,同時提高檔案管理的質(zhì)量。在分布式檔案文件儲存管理系統(tǒng)構(gòu)建的過程中,需要選擇相應(yīng)的主控服務(wù)器,在服務(wù)器中配置備用設(shè)備,避免主控設(shè)備故障,影響系統(tǒng)的運行效果。同時應(yīng)設(shè)置多個數(shù)據(jù)服務(wù)器和客戶端,在其中構(gòu)建相應(yīng)的數(shù)據(jù)節(jié)點,便于進行相應(yīng)的數(shù)據(jù)儲存管理。分布式儲存技術(shù)在運行中,主要的方案是將大文件進行分類,劃分為小文件后進行分類儲存,不同服務(wù)器和節(jié)點中的總數(shù)據(jù)量較少,降低服務(wù)器的工作量和工作難度,從而提高整體數(shù)據(jù)服務(wù)器的運行效率。大數(shù)據(jù)背景下,不斷提升設(shè)備對信息的處理效率。
分布式檔案文件儲存技術(shù)在使用過程中具有較為明顯的特征,其一,可拓展性。分布式系統(tǒng)是將若干個節(jié)點集合構(gòu)建成為統(tǒng)一的系統(tǒng),因此在使用時能夠根據(jù)實際需求進行拓展[2]。在企業(yè)檔案管理過程中,能夠與企業(yè)中所有的計算機設(shè)備進行連接,并構(gòu)建相應(yīng)的數(shù)據(jù)儲存空間,便于將檔案文件進行分類儲存,提高整體的文件保存效果。想要對儲存節(jié)點進行擴展時,可以對相關(guān)的服務(wù)器和電子設(shè)備等進行調(diào)整,并按照相應(yīng)方式將新設(shè)備與總體網(wǎng)絡(luò)進行結(jié)合,對分布式系統(tǒng)進行拓展,使整體的儲存效果效率得到提升。
其二,性能較強。分布式儲存技術(shù)在系統(tǒng)構(gòu)建和實際應(yīng)用過程中,具有非常好的使用效果,其性能較為優(yōu)越,能夠?qū)Υ罅康馁Y源進行快速識別和處理,利用多個層次節(jié)點實現(xiàn)與不同結(jié)構(gòu)的結(jié)合,便于為用戶提供更加簡便的接口,使系統(tǒng)集成監(jiān)控、檔案文件儲存以及系統(tǒng)運行維護效果得到提升。
其三,成本低廉。在分布式節(jié)點中,對于設(shè)備和服務(wù)器的質(zhì)量要求不高,常規(guī)型號既能夠滿足功能需求,完成相應(yīng)的數(shù)據(jù)儲存管理。因此系統(tǒng)的構(gòu)建成本相對較低,便于進行推廣應(yīng)用。
其四,容錯性不足,在使用分布式檔案文件儲存技術(shù)的過程中,不同節(jié)點之間進行數(shù)據(jù)的互聯(lián),在進行檢測時,能夠通過網(wǎng)絡(luò)進行快速掃描和分析,準(zhǔn)確對故障位置進行定位,從而便于上報處理和故障節(jié)點數(shù)據(jù)的遷移,同時不影響其他位置的正常運行。但受到分布式結(jié)構(gòu)的影響,系統(tǒng)故障的概率也相對較大,為降低故障概率,需要提升系統(tǒng)的容錯性,使服務(wù)器和分布式結(jié)構(gòu)能夠保持較高的一致性,進而提高檔案的管理效果。
大數(shù)據(jù)時代下,檔案向數(shù)字化方向發(fā)展的過程中,需要合理構(gòu)建相應(yīng)的數(shù)據(jù)庫架構(gòu),為數(shù)字化檔案的管理起到良好的作用。數(shù)據(jù)庫架構(gòu)的構(gòu)建過程中,需要按照相應(yīng)的方式將數(shù)據(jù)庫和數(shù)據(jù)表以及過濾器等程序進行統(tǒng)一集合。檔案管理系統(tǒng)運行過程中,出現(xiàn)故障概率最大的部分為數(shù)據(jù)庫,數(shù)據(jù)庫架構(gòu)的功能直接影響數(shù)據(jù)的檢索能力和檔案的儲存管理能力。因此,在進行分布式檔案文件儲存系統(tǒng)構(gòu)建的過程中,需要對相應(yīng)的數(shù)據(jù)庫進行全面管理和控制,從而提高數(shù)據(jù)檔案的安全性和管理效果。
分布式數(shù)據(jù)庫構(gòu)建過程中,需要使用單獨的計算機構(gòu)建系統(tǒng),并拷貝相關(guān)的資料副本,在副本的基礎(chǔ)上構(gòu)建該節(jié)點的數(shù)據(jù)庫,將不同節(jié)點中的數(shù)據(jù)庫進行連接,組合成為集成狀態(tài)下的分布式數(shù)據(jù)庫。在整體結(jié)構(gòu)中,不同計算機數(shù)據(jù)庫的邏輯相同,并根據(jù)權(quán)限級別構(gòu)建不同的數(shù)據(jù)邏輯層次。根據(jù)不同層次的功能特點對局部數(shù)據(jù)庫提供相應(yīng)的數(shù)據(jù)和工作模式。
想要提升數(shù)據(jù)庫容量,優(yōu)化分布式數(shù)據(jù)庫儲存效果,可利用水平分片的方式將數(shù)據(jù)庫中的節(jié)點進行劃分,將原本的數(shù)據(jù)庫進行分割,成為若干個物理數(shù)據(jù)庫子集,將相關(guān)的檔案文件等數(shù)據(jù)分別記錄在不同的子集中,使分片數(shù)據(jù)庫能夠按照相應(yīng)的方式運行。在進行方案文件儲存時,不需要關(guān)注其儲存位置,在使用時直接提取,進一步優(yōu)化數(shù)據(jù)庫的使用效果,并提高數(shù)據(jù)的容量。對數(shù)據(jù)庫進行分片處理的過程中,需要根據(jù)一定的計算規(guī)則對數(shù)據(jù)階段進行調(diào)整和分片,在進行系統(tǒng)控制的過程中,應(yīng)保持整體一致性原則,避免出現(xiàn)連接故障,無法實現(xiàn)數(shù)據(jù)的正常應(yīng)用。
通過分布式儲存結(jié)構(gòu)的設(shè)計,能夠使檔案文件管理的安全性得到提升,由于數(shù)據(jù)儲存在不同的節(jié)點上,整體的數(shù)據(jù)保護效果得到明顯提升。在進行分片后,使數(shù)據(jù)容量得到有效擴展,便于提高整體系統(tǒng)的識別和讀取能力,進一步提升文件管理效率。
負(fù)載均衡是增強網(wǎng)絡(luò)服務(wù)器等相關(guān)設(shè)備對數(shù)據(jù)吞吐能力和處理能力的方式,通過將數(shù)據(jù)壓力分散到不同處理單元中,同時對數(shù)據(jù)進行處理和控制,縮短任務(wù)完成時間,實現(xiàn)負(fù)載均衡。在構(gòu)建過程中,需要在原有網(wǎng)絡(luò)基礎(chǔ)上進行設(shè)置,有效提升負(fù)載文件的處理效果。負(fù)載均衡分為軟件和硬件負(fù)載均衡以及本地和局域負(fù)載均衡。在軟件和硬件負(fù)載均衡中,軟件負(fù)載均衡過程中,與不同服務(wù)器進行連接,利用軟件實現(xiàn)安裝和連接。該方式的操作控制難度較低,并且在不同區(qū)域中能夠得到更好的使用,但存在數(shù)據(jù)庫管理較為困難的情況。在對硬件進行平衡管理過程中,需要依靠相應(yīng)的負(fù)載均衡設(shè)備,提高設(shè)備的使用效果。本地和全局負(fù)載均衡主要針對地理位置進行控制和調(diào)整,需要結(jié)合需求選擇恰當(dāng)?shù)姆?wù)器,為檔案文件管理提供恰當(dāng)?shù)墓芾硇省?/p>
負(fù)載均衡算法運行過程中,將數(shù)據(jù)處理任務(wù)分散到不同的節(jié)點中,各個節(jié)點在程序控制下按照要求進行任務(wù)處理。受到任務(wù)分配的影響,可能導(dǎo)致部分節(jié)點中任務(wù)量較大,無法及時處理,部分階段中的任務(wù)量較小,運行效率較低。為減低影響,可以嘗試使用加權(quán)輪轉(zhuǎn)調(diào)度算法,對負(fù)載均衡運行中的節(jié)點權(quán)重進行調(diào)整,按照不同節(jié)點的檔案文件處理效率進行劃分,并設(shè)置不同的權(quán)重,以便在進行任務(wù)分配的過程中,對處理能力強的節(jié)點進行優(yōu)先分配,從而減少負(fù)載不均的情況,提高對檔案文件的處理效率。
此外,針對負(fù)載均衡技術(shù)的實際執(zhí)行情況,在不同算法的基礎(chǔ)上總結(jié)出具有自適應(yīng)能力的動態(tài)反饋負(fù)載均衡算法。使用該算法能夠減輕網(wǎng)絡(luò)節(jié)點內(nèi)存壓力,同時提高檔案信息的吞吐量,使整體的檔案處理效率得到優(yōu)化。在算法中,針對節(jié)點儲存能力,設(shè)置相應(yīng)的閾值,并按照節(jié)點中信息變化情況對管理系統(tǒng)進行反饋,利用自適應(yīng)系統(tǒng)進行分析,給出相應(yīng)的調(diào)節(jié)方案,從而使節(jié)點中負(fù)載信息處理效果更加高效。此外,在計算過程中,需要考慮節(jié)點中不同動態(tài)因素的影響,根據(jù)不同網(wǎng)絡(luò)節(jié)點的結(jié)構(gòu)和能力,提高系統(tǒng)自使用效果,從而使整體的節(jié)點負(fù)載量更加精準(zhǔn)。
對自適應(yīng)動態(tài)反饋負(fù)載均衡算法的應(yīng)用情況進行分析,在使用該算法進行檔案文件處理時,客戶端給出相應(yīng)的任務(wù)信息,在任務(wù)信息中包含文件的需求情況和空間占用情況,用F1代表上傳文件數(shù)量,F(xiàn)2代表儲存空間占用量。在調(diào)度節(jié)點中,由該信息組成組合(F1,F(xiàn)2),并進行任務(wù)請求。儲存節(jié)點識別該信息情況,并將其中的儲存空間與自身的空余空間等條件進行對比。使用連接數(shù)和可用空間構(gòu)建元組(Ci,ASi),并利用元組進行評價和反饋,利用元組分析節(jié)點對檔案文件的分析處理能力以及節(jié)點的儲存空間大小,以便后續(xù)進行反饋調(diào)整,給出恰當(dāng)?shù)墓ぷ髁?,提高儲存?jié)點的實際任務(wù)效果。
在對該算法中可連接度進行分析時,可以使用公式表示:
其中i為n個節(jié)點中隨機的一個節(jié)點,其左最大值為CMAXi,在計算過程中Ci為可用連續(xù)數(shù),通過公式得到相應(yīng)的閾值,根據(jù)閾值情況對可連接性進行分析,不同閾值下儲存節(jié)點的實際工作質(zhì)量不同,因此通過閾值來對節(jié)點的性能進行分析調(diào)整,進而保障整體的分析效果。
大數(shù)據(jù)影響下,為提高檔案儲存管理質(zhì)量,使系統(tǒng)能夠更好地處理大量數(shù)據(jù),提高功能實施效果,應(yīng)結(jié)合實際的檔案儲存情況,對需求情況進行分析。在網(wǎng)絡(luò)化的影響下,檔案數(shù)據(jù)向小文件形式發(fā)展,在儲存過程中,應(yīng)制定恰當(dāng)?shù)膬Υ娣绞?,減少文件對空間的占用,降低節(jié)點的儲存壓力。在對系統(tǒng)功能進行分析時,用戶對檔案文件上傳功能較為重視,文件上傳直接影響整體結(jié)構(gòu)的任務(wù)情況,因此應(yīng)提高上傳的準(zhǔn)確性和高效性。為使文件上傳后的標(biāo)志更加明顯,應(yīng)對功能進行設(shè)置,構(gòu)建過濾結(jié)構(gòu),對文件的屬性和重點內(nèi)容進行標(biāo)記,并結(jié)合文件實際情況制定相應(yīng)的屬性和檢索關(guān)鍵字,便于后續(xù)進行提取和檢索,如圖1所示。在文件上傳的過程中,用戶創(chuàng)建上傳請求文件,并將其作為待辦事項,進行管理,結(jié)合文件的信息情況,設(shè)置相應(yīng)的算法,對文件進行識別和屬性提取,對文件的類型進行判斷,并設(shè)置相應(yīng)的檢索標(biāo)志,最后完成索引設(shè)置,確保后續(xù)能夠進行搜索應(yīng)用。在完成設(shè)置后進行數(shù)據(jù)文件儲存。
圖1 文件上傳結(jié)構(gòu)設(shè)置
在檔案數(shù)據(jù)儲存過程中,為提高對空間的利用效率,針對文件的儲存功能,對分布式結(jié)構(gòu)進行調(diào)整,設(shè)置針對小文件的儲存節(jié)點。檔案文件儲存過程中,設(shè)置小文件的儲存方式,降低數(shù)據(jù)量小的檔案文件的空間占用。使用FastDFS對儲存模塊進行調(diào)整,提高對小數(shù)據(jù)的儲存效果,并對相關(guān)節(jié)點進行擴容,提高小文件數(shù)據(jù)的儲存效果。
在對文件檢索功能進行設(shè)計的過程中,應(yīng)提高檢索的質(zhì)量和效率,同時簡化搜索流程,實現(xiàn)快速的文件搜索。在系統(tǒng)節(jié)點中儲存了較多的文件,通過屬性的識別,將不同類型文件進行區(qū)分,再按照文件的關(guān)鍵字進行檢索,或?qū)⒛繕?biāo)文件中的關(guān)鍵字作為檢索信息,使用戶在進行信息查詢的過程中,能夠在最快的情況下準(zhǔn)確得到目標(biāo)文件,如圖2。
圖2 文件屬性設(shè)置
文件檢索后,需要對檔案文件進行下載使用,在下載過程中,為保障檔案文件的安全性,應(yīng)對下載功能進行優(yōu)化。一方面,應(yīng)提高下載過程的安全性,另一方面需要強化下載的效率,使檔案文件的使用效率得到提升。
在大數(shù)據(jù)時代影響下,用戶使用分布式檔案文件管理系統(tǒng)的過程中,需要保障系統(tǒng)具有較高的響應(yīng)速度,有效縮短系統(tǒng)的識別和處理時間,同時提高文件處理的精準(zhǔn)度,從而進一步滿足用戶需求。同時由于檔案文件對于用戶具有重要作用,在使用管理系統(tǒng)時,應(yīng)確保系統(tǒng)具有較強的可靠性,從而提升系統(tǒng)的服務(wù)效果。
在構(gòu)建檔案管理的分布式文件儲存系統(tǒng)時,應(yīng)結(jié)合用戶對系統(tǒng)功能的需求進行設(shè)計,滿足用戶的相關(guān)需求。在進行結(jié)構(gòu)設(shè)計的過程中,整體系統(tǒng)中主要包括文件儲存、文件屬性設(shè)置、文件檢索以及文件管理模塊,結(jié)合該系統(tǒng)需求情況,對系統(tǒng)結(jié)構(gòu)進行合理設(shè)計,構(gòu)建效果良好的文件儲存系統(tǒng)。
在對儲存結(jié)構(gòu)進行設(shè)計時,由于儲存結(jié)構(gòu)是系統(tǒng)的中心模塊,對系統(tǒng)的功能產(chǎn)生決定性影響,應(yīng)結(jié)合儲存模塊的特點,實施負(fù)載均衡措施,對任務(wù)進行調(diào)低,從而保障儲存模塊保持正常的使用性能。此外,結(jié)構(gòu)中的節(jié)點數(shù)量較多,為保障儲存的可靠性,應(yīng)對不同節(jié)點之間的關(guān)系進行調(diào)整,保持節(jié)點之間的對等且獨立的關(guān)系,避免在某一節(jié)點故障后,對其他節(jié)點產(chǎn)生影響,提高節(jié)點數(shù)據(jù)儲存的質(zhì)量和安全性。
在儲存圖片或文字等不同屬性檔案文件時,應(yīng)在文件管理過程中,對文件的內(nèi)容和屬性進行識別,并按照文件基本信息和重點信息設(shè)置相應(yīng)的檢索關(guān)鍵字,在設(shè)置完文件屬性后,可以對文件進行儲存,以提高文件的識別效果,便于后期進行檢索提取。在設(shè)置文件儲存屬性時,可以引入智能識別技術(shù),對文件內(nèi)容進行識別,并智能推薦相應(yīng)的檢索關(guān)鍵字,人工對其進行判斷后完成文件的處理和儲存。
檔案文件的儲存管理過程中,需要確保整體儲存質(zhì)量和安全性,管理人員應(yīng)構(gòu)建相應(yīng)監(jiān)控模塊,對系統(tǒng)儲存管理過程進行監(jiān)控,并對檔案文件的實際管理和儲存情況進行信息整理并上傳,提高管理人員對檔案信息的掌握效果。在對系統(tǒng)進行監(jiān)控管理時,主要對不同節(jié)點的文件處理狀態(tài)、文件上傳和下載速度以及節(jié)點儲存等情況進行監(jiān)控,通過對系統(tǒng)運行情況的監(jiān)控管理,識別系統(tǒng)狀態(tài)和運行情況,便于進行優(yōu)化和管理。在監(jiān)控系統(tǒng)中設(shè)置子模塊,分別對不同的節(jié)點進行監(jiān)管,對監(jiān)管信息進行實時回傳,由監(jiān)控管理系統(tǒng)進行識別和整理,用戶在前端請求時提供監(jiān)控數(shù)據(jù)。對于整理后的監(jiān)管信息,上傳到數(shù)據(jù)庫中,等待提取和使用。通過對監(jiān)控信息的調(diào)整,使監(jiān)控數(shù)據(jù)的使用效率更高。
綜上所述,在大數(shù)據(jù)背景下,為提升檔案管理儲存質(zhì)量,應(yīng)加速檔案管理的數(shù)字化發(fā)展。通過構(gòu)建分布式文件儲存系統(tǒng),利用不同節(jié)點對用戶的大量數(shù)據(jù)進行分類儲存,使檔案數(shù)據(jù)的儲存效率更高,進一步提高檔案管理工作的實際效果。