祝旭
DOI:10.16660/j.cnki.1674-098X.2016.22.094
摘 要:在龐大數(shù)據(jù)信息充斥的網(wǎng)絡(luò)環(huán)境下,對(duì)數(shù)據(jù)處理分析及數(shù)據(jù)挖掘服務(wù)都提出了更高的標(biāo)準(zhǔn)及要求。傳統(tǒng)的數(shù)據(jù)挖掘服務(wù)模式已經(jīng)無(wú)法滿足當(dāng)前網(wǎng)絡(luò)發(fā)展需求,在此形勢(shì)下,云計(jì)算背景下的數(shù)據(jù)挖掘服務(wù)被提出。該服務(wù)旨在提升挖掘網(wǎng)絡(luò)數(shù)據(jù)的效率,并使其成為一項(xiàng)具有商業(yè)化性質(zhì)的應(yīng)用服務(wù)。該文針對(duì)云計(jì)算背景下數(shù)據(jù)挖掘服務(wù)的結(jié)構(gòu)類型、建模流程、服務(wù)體系以及服務(wù)流程,探討了云計(jì)算背景下完整的數(shù)據(jù)挖掘服務(wù)模式。
關(guān)鍵詞:云計(jì)算 數(shù)據(jù)挖掘 服務(wù)模式 結(jié)構(gòu) 服務(wù)體系
中圖分類號(hào):TP274 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2016)08(a)-0094-02
目前,有關(guān)云計(jì)算的研究已經(jīng)成為了全球性的熱點(diǎn)研究項(xiàng)目,國(guó)內(nèi)外絕大部分的信息技術(shù)企業(yè)將云計(jì)算列為了未來(lái)企業(yè)發(fā)展和提升核心競(jìng)爭(zhēng)力的關(guān)鍵性技術(shù)支持。云計(jì)算的實(shí)現(xiàn)是以虛擬化技術(shù)與高速寬帶技術(shù)為基礎(chǔ),以各類運(yùn)算法作為支撐,從而形成云計(jì)算環(huán)境?,F(xiàn)階段而言,云計(jì)算研究尚處于起步階段,在學(xué)術(shù)界對(duì)云計(jì)算沒(méi)有統(tǒng)一的定義,但根據(jù)研究成果,其特點(diǎn)可歸納為:具有計(jì)算和存儲(chǔ)大規(guī)模數(shù)據(jù)的能力、具備動(dòng)態(tài)收縮性的結(jié)構(gòu)和資源、提供的服務(wù)根據(jù)具體資源需求而定。這些特點(diǎn)為云計(jì)算背景下的數(shù)據(jù)挖掘服務(wù)模式的商業(yè)化提供了更多的可能性。
1 云計(jì)算背景下數(shù)據(jù)挖掘的服務(wù)模式分析
1.1 服務(wù)結(jié)構(gòu)
數(shù)據(jù)挖掘中所包括的行為與功能的集合即為數(shù)據(jù)挖掘服務(wù),服務(wù)內(nèi)容涵蓋選擇數(shù)據(jù)、預(yù)處理數(shù)據(jù)、分析、集成、挖掘數(shù)據(jù)、顯示結(jié)果及評(píng)價(jià)等,再采用混合搭配的方式,使這些功能形成新的應(yīng)用服務(wù)。云計(jì)算背景下,計(jì)算機(jī)設(shè)備集成開(kāi)發(fā)環(huán)境、存儲(chǔ)設(shè)備、應(yīng)用軟件、服務(wù)器集群等實(shí)現(xiàn)了網(wǎng)絡(luò)環(huán)境的共享。以此為基礎(chǔ),結(jié)合虛擬化技術(shù)與高速寬帶,封裝打包軟硬件,進(jìn)而形成用戶的服務(wù)請(qǐng)求。用戶的服務(wù)請(qǐng)求又被分為了三個(gè)不同層次:IssS(Infrastructure as a Service,基礎(chǔ)設(shè)施即服務(wù))、PaaS(Platform as a Service,平臺(tái)即服務(wù))和SssS(Software as a Service,軟件即服務(wù))。三個(gè)不同層次的用戶服務(wù)請(qǐng)求共同組成了完整的云計(jì)算背景下的數(shù)據(jù)挖掘服務(wù)模式。
在數(shù)據(jù)挖掘服務(wù)整體結(jié)構(gòu)下涵蓋多種服務(wù)類型,如數(shù)據(jù)資源、流程、基礎(chǔ)設(shè)施、測(cè)試、應(yīng)用、集成、平臺(tái)、安全等。基礎(chǔ)設(shè)施服務(wù)以數(shù)據(jù)中心服務(wù)為基礎(chǔ),負(fù)責(zé)在數(shù)據(jù)挖掘中為客戶提供計(jì)算資源,并可對(duì)其進(jìn)行遠(yuǎn)程訪問(wèn)。數(shù)據(jù)資源服務(wù)主要為目標(biāo)客戶提供快捷、方便的遠(yuǎn)程數(shù)據(jù)訪問(wèn)及數(shù)據(jù)下載。流程服務(wù)負(fù)責(zé)業(yè)務(wù)流程的梳理,其運(yùn)行可多個(gè)操作系統(tǒng)下完成,并可對(duì)關(guān)鍵信息數(shù)據(jù)和模塊進(jìn)行綁定。應(yīng)用服務(wù)可將所有的應(yīng)用程序作為一個(gè)整體進(jìn)行打包,終端客戶可以直接通過(guò)網(wǎng)絡(luò)平臺(tái)獲取。測(cè)試服務(wù)是利用遠(yuǎn)程測(cè)試工具,測(cè)試平臺(tái)或是本地?cái)?shù)據(jù)的挖掘狀態(tài),以此判斷應(yīng)用是否處于正常情況。平臺(tái)服務(wù)可為數(shù)據(jù)挖掘系統(tǒng)提供開(kāi)發(fā)服務(wù),用戶利用平臺(tái)中的各項(xiàng)功能可自行創(chuàng)建企業(yè)級(jí)應(yīng)用。集成服務(wù)可實(shí)現(xiàn)異構(gòu)數(shù)據(jù)與異質(zhì)系統(tǒng)的集成,并可將其交予客戶。安全服務(wù)在現(xiàn)有的云計(jì)算技術(shù)下,還存在較大的缺陷,但可以優(yōu)化系統(tǒng)的身份管理、加密等安全服務(wù),能夠?yàn)橄到y(tǒng)提供一定程度上的安全防護(hù)。
1.2 建模流程
實(shí)現(xiàn)云計(jì)算背景下的數(shù)據(jù)挖掘服務(wù)的關(guān)鍵在于結(jié)合上文所述的服務(wù)結(jié)構(gòu),建立服務(wù)組件模型與每一個(gè)數(shù)據(jù)挖掘服務(wù)形成一一對(duì)應(yīng)的關(guān)系。通過(guò)數(shù)據(jù)之間的關(guān)聯(lián)性描述和識(shí)別服務(wù),可以構(gòu)建出一個(gè)完整的服務(wù)組件。其具體創(chuàng)建流程如下。
1.2.1 定義服務(wù)
通過(guò)對(duì)問(wèn)題域中數(shù)據(jù)挖掘服務(wù)相關(guān)信息的收集,實(shí)現(xiàn)對(duì)該服務(wù)核心功能的定義以及服務(wù)及數(shù)據(jù)支撐所需的產(chǎn)出。通過(guò)定義服務(wù),獲取相關(guān)數(shù)據(jù)挖掘業(yè)務(wù)的服務(wù)描述,最終使候選服務(wù)在數(shù)據(jù)挖掘服務(wù)目錄下形成。
1.2.2 綁定服務(wù)和數(shù)據(jù)
數(shù)據(jù)和功能共同構(gòu)成了完整的數(shù)據(jù)挖掘服務(wù),結(jié)合服務(wù)的定義,建立關(guān)聯(lián)數(shù)據(jù)與候選服務(wù)之間的聯(lián)系。在此過(guò)程中,可提供服務(wù)行為所需信息,通過(guò)調(diào)用規(guī)定服務(wù)信息,獲取關(guān)聯(lián)信息服務(wù)。
1.2.3 構(gòu)建服務(wù)組件
將服務(wù)綁定的數(shù)據(jù)和服務(wù)描述中的方法進(jìn)行整合后,可以讓服務(wù)定義的功能實(shí)現(xiàn),并封裝打包服務(wù),使其成為獨(dú)立的組件。對(duì)調(diào)用服務(wù)的接口進(jìn)行統(tǒng)一定義,最后得到完整獨(dú)立的服務(wù)組件。
1.3 體系結(jié)構(gòu)
云計(jì)算背景下,數(shù)據(jù)挖掘服務(wù)結(jié)構(gòu)的實(shí)現(xiàn)還需要構(gòu)建體系結(jié)構(gòu),通常情況下體系結(jié)構(gòu)可被分為以下四個(gè)層次。
1.3.1 基礎(chǔ)設(shè)施層
基礎(chǔ)設(shè)施層為數(shù)據(jù)挖掘服務(wù)提供所需的儲(chǔ)存與計(jì)算資源。基礎(chǔ)設(shè)施層利用終端接口,將網(wǎng)絡(luò)與各種物理資源相連接,共享和互聯(lián)網(wǎng)絡(luò)資源的同時(shí),提供接口給數(shù)據(jù)挖掘服務(wù)中虛擬化過(guò)程。
1.3.2 虛擬化層
虛擬化層將云計(jì)算背景下各種分布式資源通過(guò)虛擬化工具進(jìn)行匯聚,并將其封裝為透明統(tǒng)一、集中邏輯的服務(wù)資源、通過(guò)管理這些資源,實(shí)現(xiàn)資源在數(shù)據(jù)挖掘過(guò)程中調(diào)度與分配的合理性。封裝的資源,也可被用于平臺(tái)層的開(kāi)發(fā)及應(yīng)用。
1.3.3 平臺(tái)層
作為云計(jì)算背景下數(shù)據(jù)挖掘服務(wù)的核心服務(wù)層,平臺(tái)層提供各種核心功能與服務(wù),實(shí)現(xiàn)數(shù)據(jù)挖掘服務(wù)的綜合管理與實(shí)施。其中主要包括服務(wù)目錄的管理及組合功能、實(shí)施服務(wù)的描述任務(wù)功能、管理數(shù)據(jù)功能、調(diào)度計(jì)算資源功能等。
1.3.4 應(yīng)用層
終端層和接口層共同組成了應(yīng)用層。應(yīng)用層的接口層為用戶提供認(rèn)證、管理、處理請(qǐng)求、表達(dá)請(qǐng)求與評(píng)價(jià)結(jié)果的管理服務(wù)。終端層根據(jù)訪問(wèn)介質(zhì)的不同,提供相應(yīng)的訪問(wèn)接入,通過(guò)計(jì)算機(jī)、用戶界面、專用終端、移動(dòng)終端等,各種云計(jì)算背景下的數(shù)據(jù)挖掘服務(wù)均可被用戶使用與訪問(wèn)。
1.4 服務(wù)過(guò)程
云計(jì)算背景下的數(shù)據(jù)挖掘服務(wù)從技術(shù)層面上看是一種軟件產(chǎn)品,從管理層面上看是服務(wù)的過(guò)程。根據(jù)軟件的生命周期理論,在開(kāi)發(fā)云計(jì)算分布式技術(shù)過(guò)程中,需充分考慮其服務(wù)過(guò)程。云計(jì)算背景下的數(shù)據(jù)挖掘服務(wù)過(guò)程包含以下三個(gè)階段。
1.4.1 分析階段
在這一階段下,主要是根據(jù)結(jié)合需求對(duì)服務(wù)進(jìn)行識(shí)別和發(fā)現(xiàn),對(duì)相應(yīng)的服務(wù)描述進(jìn)行定義。該階段標(biāo)志著服務(wù)的開(kāi)始。
1.4.2 設(shè)計(jì)階段
在這一階段,生成服務(wù)相關(guān)說(shuō)明書,說(shuō)明書的生成需根據(jù)對(duì)服務(wù)的描述及定義,同時(shí)對(duì)服務(wù)的契約和接口進(jìn)行設(shè)計(jì),設(shè)計(jì)內(nèi)容包括服務(wù)的非功能性特性和語(yǔ)義,以及服務(wù)代理、提供商與消費(fèi)者三者之間的契約關(guān)系。
1.4.3 開(kāi)發(fā)階段
在開(kāi)發(fā)階段,需要將服務(wù)功能特性進(jìn)行具體實(shí)現(xiàn),并在服務(wù)的定義區(qū)間內(nèi),完成功能集合。集合需根據(jù)高內(nèi)聚、低耦合原則,進(jìn)而形成服務(wù)組件。服務(wù)組件必須具備獨(dú)立性,功能的調(diào)用與溝通可利用服務(wù)接口實(shí)現(xiàn)。
2 結(jié)語(yǔ)
現(xiàn)階段而言,由于云計(jì)算背景下數(shù)據(jù)挖掘服務(wù)模式相關(guān)研究起步時(shí)間晚、發(fā)展時(shí)間尚短,因而不可避免地存在著一些缺陷和問(wèn)題。針對(duì)這些問(wèn)題,通過(guò)優(yōu)化云計(jì)算背景下數(shù)據(jù)挖掘服務(wù)模式的服務(wù)結(jié)構(gòu)、建模流程、體系結(jié)構(gòu)以及服務(wù)過(guò)程,能夠進(jìn)一步實(shí)現(xiàn)云計(jì)算背景下數(shù)據(jù)挖掘服務(wù)。同時(shí),云計(jì)算背景下的數(shù)據(jù)挖掘服務(wù)模式需要與時(shí)俱進(jìn),順應(yīng)社會(huì)經(jīng)濟(jì)和科技的發(fā)展,不斷改進(jìn)和創(chuàng)新。
參考文獻(xiàn)
[1] 曹小春,曾安,潘丹.云計(jì)算環(huán)境下面向領(lǐng)域的數(shù)據(jù)挖掘服務(wù)平臺(tái)研究[J].自動(dòng)化儀表,2014(9):9-13.
[2] 吳麗娜.基于云計(jì)算環(huán)境下的數(shù)據(jù)挖掘服務(wù)模式[J].電子技術(shù)與軟件工程,2015(15):195.
[3] 潘鈞.云計(jì)算服務(wù)模式的數(shù)據(jù)挖掘應(yīng)用平臺(tái)的構(gòu)建對(duì)策[J].數(shù)字技術(shù)與應(yīng)用,2015(10):90.