劉向銳 西安郵電大學(xué)計(jì)算機(jī)系
隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,人類社會(huì)已經(jīng)進(jìn)入了大數(shù)據(jù)信息時(shí)代。在這一新的信息劃時(shí)代,人工智能技術(shù)正在向社會(huì)提供著高效的智能化服務(wù)。其中智能信息推送就是這種智能化信息服務(wù)的重要組成部分。因此技術(shù)研究者以大數(shù)據(jù)技術(shù)核心數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),對(duì)智能推送系統(tǒng)技術(shù)開展了技術(shù)發(fā)展研究,為智能推送系統(tǒng)發(fā)展提供有效支持。
在大數(shù)據(jù)技術(shù)理論研究中,數(shù)據(jù)挖掘技術(shù)是指數(shù)據(jù)系統(tǒng)通過(guò)網(wǎng)絡(luò)平臺(tái),從大量的網(wǎng)絡(luò)信息數(shù)據(jù)中通過(guò)模型與算法搜索出隱藏在數(shù)據(jù)中的有用信息的挖掘過(guò)程。在這一過(guò)程中,數(shù)據(jù)挖掘的主要方法包括了以下幾種類型:一是網(wǎng)絡(luò)中的相關(guān)數(shù)據(jù)統(tǒng)計(jì);二是網(wǎng)絡(luò)信息的在線分析處理;三是網(wǎng)絡(luò)中數(shù)據(jù)情報(bào)的檢索;四是智能化的機(jī)器學(xué)習(xí);五是依靠經(jīng)驗(yàn)法則形成的專家系統(tǒng);六是預(yù)定好的模式識(shí)別等。需要需要注意的大數(shù)據(jù)技術(shù)的中的數(shù)據(jù)挖掘過(guò)程也是一種系統(tǒng)的“學(xué)習(xí)”過(guò)程,隨著挖掘的開展,系統(tǒng)自身的挖掘能力也會(huì)不斷提升。
隨著信息時(shí)代的發(fā)展,人工智能技術(shù)已經(jīng)成為了人類社會(huì)中的重要組成部分。而在人工智能應(yīng)用中,系統(tǒng)的學(xué)習(xí)階段(既海量數(shù)據(jù)存儲(chǔ)與處理階段),是人工智能的基礎(chǔ)。在這一過(guò)程中,如何獲取到的海量數(shù)據(jù)為人工智能提供基礎(chǔ)數(shù)據(jù),也就成為了人工智能技術(shù)的重要內(nèi)容。如人工智能化教育中,如何獲得教育內(nèi)容的知識(shí)要點(diǎn),以及被教育者學(xué)習(xí)特征,進(jìn)而人工智能教育的針對(duì)性,就成為了智能化教育的重要研究?jī)?nèi)容。而在這種情況下數(shù)據(jù)挖掘技術(shù)可以通過(guò)網(wǎng)絡(luò)學(xué)習(xí)要點(diǎn)檢索分析,以及學(xué)生以往成績(jī)與作業(yè)數(shù)據(jù)分析,為學(xué)生制定出針對(duì)性的教育方案,進(jìn)而為教育者制定出有效的學(xué)習(xí)計(jì)劃,確保人工智能教育的有效開展。因此我們認(rèn)為數(shù)據(jù)挖掘是人工智能技術(shù)的發(fā)展與應(yīng)用的基礎(chǔ)技術(shù),其對(duì)人工智能技術(shù)未來(lái)發(fā)展可以起到不可忽視的作用。
智能推送技術(shù)在實(shí)際的運(yùn)行中綜合化的應(yīng)用了人工智能、因特網(wǎng)知識(shí)工程以及數(shù)據(jù)庫(kù)技術(shù)的相關(guān)內(nèi)容,利用系統(tǒng)數(shù)據(jù)儲(chǔ)存與分析技術(shù),根據(jù)客戶興趣與偏好選擇其所需要信息開展推送工作的一種人工智能化的信息推送模式。在這一模式的建設(shè)中,數(shù)據(jù)挖掘技術(shù)的應(yīng)用包括了以下兩個(gè)內(nèi)容。
在智能信息推送過(guò)程中,如何更好地了解客戶興趣與偏好,進(jìn)而為其提供針對(duì)性的信息服務(wù)就成為了確保信息推送質(zhì)量的基礎(chǔ)。在數(shù)據(jù)挖掘技術(shù)支持下,信息推送系統(tǒng)主要是通過(guò)系統(tǒng)內(nèi)容的機(jī)器學(xué)習(xí)方法,對(duì)客戶以往搜索與使用的信息進(jìn)行統(tǒng)計(jì)與概率分析,進(jìn)而識(shí)別與預(yù)測(cè)該用戶關(guān)注的信息要點(diǎn),進(jìn)而分析出其對(duì)信息內(nèi)容的興趣或偏好,再通過(guò)信息系統(tǒng)內(nèi)部數(shù)據(jù)庫(kù)主動(dòng)及時(shí)推送具有針對(duì)性地信息,進(jìn)而滿足客戶自身個(gè)性化需求。在這一過(guò)程中,客戶數(shù)據(jù)挖掘的內(nèi)容包括了以下幾個(gè)內(nèi)容:一是挖掘客戶信息中包含的性別、年齡、職業(yè)等特征數(shù)據(jù),再通過(guò)數(shù)據(jù)分析尋找其興趣共同點(diǎn);二是對(duì)客戶以往搜索與使用的信息進(jìn)行挖掘,進(jìn)而獲知其中包含的數(shù)據(jù)信息特征。之后系統(tǒng)即可通過(guò)以上數(shù)據(jù)信息特征,自動(dòng)在數(shù)據(jù)庫(kù)中獲得相應(yīng)數(shù)據(jù)信息,完成信息推送工作。
隨著云數(shù)據(jù)信息平臺(tái)的不斷發(fā)展,在檔案、新聞、數(shù)據(jù)應(yīng)用等各信息領(lǐng)域中,與可實(shí)現(xiàn)信息云共享的云數(shù)據(jù)庫(kù)已經(jīng)代替了傳統(tǒng)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù),實(shí)現(xiàn)了云平臺(tái)下的網(wǎng)絡(luò)信息共享。而這種共享模式,也是大數(shù)據(jù)技術(shù)發(fā)展的基礎(chǔ)。單就智能信息推送系統(tǒng)發(fā)展應(yīng)用而言,云共享技術(shù)的應(yīng)用就是為推送信息內(nèi)容提供了接近無(wú)限的信息數(shù)據(jù)庫(kù),進(jìn)而確保了信息數(shù)據(jù)內(nèi)容與種類的提升。而在這一過(guò)程中,數(shù)據(jù)挖掘技術(shù)的應(yīng)用發(fā)揮著以下兩個(gè)作用。(1)云平臺(tái)數(shù)據(jù)海量挖掘。云平臺(tái)中的信息數(shù)據(jù)內(nèi)容與種類較為復(fù)雜,傳統(tǒng)的搜索技術(shù)效率較低。而數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)信息搜索中可以極大的提升信息獲取效率與質(zhì)量,進(jìn)而再滿足了客戶針對(duì)性信息需求的同時(shí),增加了客戶信息獲取數(shù)量,提高了信息推送的整體質(zhì)量。(2)云平臺(tái)的信息共享。在智能信息推送系統(tǒng)發(fā)展中,其服務(wù)對(duì)象不是一個(gè)單一客戶,而是云平臺(tái)中的所有客戶群體。因此系統(tǒng)在推送過(guò)程中可以通過(guò)智能學(xué)習(xí)與數(shù)據(jù)系統(tǒng)將推送相關(guān)信息進(jìn)行記錄。之后在運(yùn)到類似客戶的同時(shí),數(shù)據(jù)挖掘系統(tǒng)可以通過(guò)數(shù)據(jù)挖掘模式,開展類似的信息推送工作。這一過(guò)程類似與智能學(xué)習(xí)與推理的過(guò)程,隨著系統(tǒng)智能推送工作的不斷開展,系統(tǒng)自身推送效率就會(huì)不斷提升。
總之,數(shù)據(jù)挖掘技術(shù)是大數(shù)據(jù)技術(shù)應(yīng)用的基礎(chǔ),也是人工智能技術(shù)應(yīng)用的基礎(chǔ)。因此研究者從數(shù)據(jù)挖掘在智能在信息推送系統(tǒng)應(yīng)用角度,開展了客戶信息與云平臺(tái)數(shù)據(jù)挖掘使用研究,為我國(guó)未來(lái)信息實(shí)用技術(shù)發(fā)展提供理論研究支持。
[1]周二虎,張水平,謝必昌.信息過(guò)濾技術(shù)在智能信息推送系統(tǒng)中的應(yīng)用[J]. 軟件導(dǎo)刊. 2010(01)
[2]馬波.大數(shù)據(jù)背景下精準(zhǔn)信息推送在移動(dòng)圖書館中的應(yīng)用研究[J].圖書館工作與研究. 2017(02)