薛曉璇
(西安職業(yè)技術(shù)學(xué)院經(jīng)濟管理學(xué)院,陜西西安 710077)
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)信息數(shù)量在迅速增長,以前,網(wǎng)絡(luò)用戶從互聯(lián)網(wǎng)上搜索與內(nèi)容相關(guān)的信息,而現(xiàn)在網(wǎng)絡(luò)用戶根據(jù)自己的實際需求搜索自己需要的信息,但是從互聯(lián)網(wǎng)的海量信息中獲取最新的、滿足網(wǎng)絡(luò)用戶需求的信息較為困難,是目前需要解決的問題之一[1-2]。用戶畫像是指網(wǎng)絡(luò)用戶在瀏覽網(wǎng)站時會留下多種網(wǎng)絡(luò)數(shù)據(jù),被互聯(lián)網(wǎng)自動識別并收集,例如網(wǎng)絡(luò)用戶的喜好、生活習(xí)慣、工作職業(yè)、消費水平等信息,網(wǎng)絡(luò)平臺會針對網(wǎng)絡(luò)用戶個人的信息選擇有效的信息數(shù)據(jù)作為標簽,然后根據(jù)做成的標簽信息構(gòu)建屬于網(wǎng)絡(luò)用戶個人的抽象模型[3]。各大公司可以根據(jù)網(wǎng)絡(luò)用戶的需求、生活習(xí)慣等對用戶進行有針對性的推薦,如何有效地利用用戶畫像向用戶進行推送,是目前研究的方向。
該文根據(jù)以上有關(guān)用戶畫像推薦系統(tǒng)出現(xiàn)的問題,設(shè)計了基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng),該系統(tǒng)采用了大數(shù)據(jù)聚類的技術(shù),合理構(gòu)建用戶畫像,構(gòu)建自動推送模型,從而根據(jù)網(wǎng)絡(luò)用戶個人的喜好、需求,進行有針對性的智能推送,提高推送信息的效率。
基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)的電源電路,必須能快速、有效地調(diào)整單片機的轉(zhuǎn)速,進而使智能推送系統(tǒng)更具有可靠性與實時性,在具體設(shè)計時需要采用單極性可逆脈沖調(diào)制來控制推送系統(tǒng)的電源電路,該電路的優(yōu)點是電路運行可靠性高,不用添加其他電路,開關(guān)頻率高[4-5]。該電源電路的芯片選用TD 公司生產(chǎn)的ST264,該芯片是一種驅(qū)動芯片,具有較強的智能控制能力,驅(qū)動芯片最大輸出電流為40 A,工作電壓最高達到60 V,芯片內(nèi)部設(shè)有特殊裝置,能夠高效地保護電路,例如欠壓、欠流、線損等,對電源電路控制較簡單、靈敏。為了使電源電路更加穩(wěn)定,需要降低電流的損耗,提高電源的輸出電壓,所以采用0.1 Ω的電阻,用驅(qū)動芯片放大電阻兩端的輸入電壓,共模輸出電壓為1.8~3.3 V,驅(qū)動輸出電流為10 mA,工作電壓為20~40 V,電路需要具有良好的開關(guān)特性,電路中的功率管在工作時功耗較小,工作電壓最高為60 V,輸出的直流電流最高為150 A,為了使電源電路更快地實現(xiàn)串口通信,需要在電源電路中加入電平轉(zhuǎn)換芯片[6-7]。
該文設(shè)計的電源電路如圖1 所示。
基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)的單片機芯片選用三星公司推出的SFI16F3365,該芯片專門針對智能推送控制,具有良好的控制能力與A/D 電平轉(zhuǎn)換能力,該文設(shè)計的單片機與市場同類單片機相比,具有較多的優(yōu)勢:具有6 對互補輸出的功率控制模塊、采樣速度最高達到305 次每秒、12 位A/D 轉(zhuǎn)換器、輸出電流最高達40 mA,其次還具有較好的功耗管理方式、高效的振蕩器構(gòu)造[8-10]。單片機結(jié)構(gòu)如圖2 所示。
圖2 單片機結(jié)構(gòu)
單片機整個構(gòu)造由蓄電池供電,由推送系統(tǒng)的電源電路轉(zhuǎn)換后,傳感器的采樣信號被送到單片機的輸出端口,單片機根據(jù)驅(qū)動特性以及大數(shù)據(jù)聚類算法對傳感器采集的數(shù)據(jù)進行分析處理,進而確定單片機工作電流的方向與大小,單片機通過采集器傳輸?shù)碾娫纯刂泼钌刹蓸有盘?,信號通過單片機的外圍電路控制單片機的正常工作,在單片機的外圍電路上設(shè)置電壓傳感器,傳感器將單片機的輸出電流傳輸?shù)街悄芡扑拖到y(tǒng)的采集器,采集器對電源電路實行開關(guān)閉環(huán)管理,如果智能推送系統(tǒng)在工作時出現(xiàn)異常,單片機的警示燈將進行報警提示[11-12]。
基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)的采集器主要由信號轉(zhuǎn)換器、采集器外圍電路兩部分組成,信號轉(zhuǎn)換器主要完成采樣信號的輸入、放大,將轉(zhuǎn)換完成的采樣信號處理后輸入到采集器的驅(qū)動芯片中,該種信號轉(zhuǎn)換器包括兩路采集通道,1路低頻通道與3 路高頻通道相連,2 路高頻通道與4 路低頻通道相連,3 路高頻通道可以傳輸40~60 kHz 頻段的采樣信號,4 路低頻通道主要傳輸100~400 kHz頻段的采樣信號,各個通道具有相位一致性的特點。信號轉(zhuǎn)換器的低頻通道傳輸完成差分過的差分信號,2 路高頻通道不需要為信號轉(zhuǎn)換器傳輸差分信號,A/D 轉(zhuǎn)換器與采集器的外圍電路底板相連[13-15]。采集器結(jié)構(gòu)如圖3 所示。
圖3 采集器結(jié)構(gòu)
采集器的外圍電路選用的核心芯片為SIMENSA公司生產(chǎn)的最新系列芯片SIC1286,該芯片可以處理采集器采集的信號數(shù)據(jù),對其進行控制、傳輸并保存,外圍電路的電路板主要提供外圍電路所需要的電源,把信號轉(zhuǎn)換器以及采樣數(shù)據(jù)進行并列保存、連接,為轉(zhuǎn)換器的串口通信提供輸入接口。采集器的外圍電路也可以完成采樣信號的轉(zhuǎn)換,外圍電路芯片可支持的最高采樣頻率為256 kHz,支持的最低采樣頻率為64 kHz,中心頻率為2~30 kHz,采集器整體接收輸入信號的方式設(shè)計為差分方式,方便對采樣數(shù)據(jù)的采集與處理。
微處理器主要完成數(shù)據(jù)的處理、存儲和控制,微處理器的芯片選用ST 公司生產(chǎn)的最新芯片SD6528,微處理器設(shè)有網(wǎng)口、USB 以及通信串口接口,通過與無線電設(shè)備的連接,實現(xiàn)對采集器采集數(shù)據(jù)的預(yù)處理,此外,微處理器處理數(shù)據(jù)的速度由芯片管腳的數(shù)量決定,該文設(shè)計的微處理器電路如圖4 所 示[16]。
圖4 微處理器電路圖
該文設(shè)計的基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)采用了大數(shù)據(jù)聚類技術(shù),聚類在信息數(shù)據(jù)挖掘中應(yīng)用較為廣泛,大數(shù)據(jù)聚類可以有效細分網(wǎng)絡(luò)用戶,發(fā)現(xiàn)網(wǎng)絡(luò)中的可靠信息,搜索網(wǎng)絡(luò)信息中的重要數(shù)據(jù)。在傳統(tǒng)聚類方法中,聚類提出的假設(shè)可以一次性嵌入網(wǎng)絡(luò)數(shù)據(jù)信息中,現(xiàn)在的聚類算法通常屬于迭代型算法,下一步驟的計算需要使用上一步驟計算出來的數(shù)據(jù)結(jié)果。隨著互聯(lián)網(wǎng)數(shù)據(jù)信息迅速增長,計算機的容量與計算能力無法滿足網(wǎng)絡(luò)用戶對海量數(shù)據(jù)的計算需求,需要網(wǎng)絡(luò)平臺采用分布式算法對用戶需要的網(wǎng)絡(luò)數(shù)據(jù)進行并行處理。該文采用大數(shù)據(jù)聚類技術(shù)主要因為大數(shù)據(jù)可以包含網(wǎng)絡(luò)海量信息的結(jié)構(gòu)化數(shù)據(jù),對用戶的信息需求,可以有針對性地進行分析預(yù)處理,根據(jù)用戶的消費行為、瀏覽喜好、生活習(xí)慣等進行有效的智能推送,對用戶需要的網(wǎng)絡(luò)非結(jié)構(gòu)化數(shù)據(jù)以及無結(jié)構(gòu)化數(shù)據(jù)能夠較快處理,且存儲網(wǎng)絡(luò)信息數(shù)據(jù)的容量非常巨大。
按照用戶喜歡的類型給用戶推送內(nèi)容,是基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)運行的主要目的,智能推送的流程如圖5 所示。
圖5 智能推送流程
首先對用戶喜好的數(shù)據(jù)進行采集與處理。采集用戶的消費行為、瀏覽網(wǎng)站或者生活習(xí)慣等行為數(shù)據(jù),將這些行為數(shù)據(jù)作為系統(tǒng)軟件分析的數(shù)據(jù),用戶通過自己安裝的瀏覽器軟件瀏覽網(wǎng)站的相關(guān)內(nèi)容,企業(yè)根據(jù)網(wǎng)絡(luò)平臺上傳輸?shù)挠脩粜袨閿?shù)據(jù),按照推送的方式反映給用戶,用戶根據(jù)系統(tǒng)軟件提供的相關(guān)信息,進行選擇性地瀏覽以及購買。用戶被網(wǎng)絡(luò)平臺采集的數(shù)據(jù)信息多種多樣,包括用戶的性別、職業(yè)、生活習(xí)慣、地理位置、年齡等,網(wǎng)絡(luò)將這些信息數(shù)據(jù)統(tǒng)一封包整理,匯總到系統(tǒng)軟件的服務(wù)器,通過數(shù)據(jù)集成、清洗、變換、簡化4 種預(yù)處理數(shù)據(jù)的方式對這些用戶數(shù)據(jù)進行處理。
然后整理用戶數(shù)據(jù)做成標簽。標簽類似一種特殊符號,整理用戶畫像,用戶的行為數(shù)據(jù)被采集完成后,匯總到對應(yīng)的標簽中,用戶標簽包含用戶位置標簽、習(xí)慣標簽、興趣愛好標簽等。
最后系統(tǒng)軟件對用戶實現(xiàn)個性化推送。對用戶個人數(shù)據(jù)采集并處理完后,做成標簽,根據(jù)用戶標簽準確預(yù)測用戶的個人需求,在數(shù)據(jù)庫中為用戶推送感興趣的內(nèi)容,實現(xiàn)個性化用戶推送。
為了驗證該文提出的基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)的有效性,與傳統(tǒng)系統(tǒng)進行實驗對比。得到的提取時間實驗結(jié)果如表1 所示。
表1 提取時間實驗結(jié)果
推送準確率如圖6 所示。
圖6 推送準確率實驗結(jié)果
該文設(shè)計的基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng),采用了大數(shù)據(jù)聚類技術(shù),有效地將用戶行為數(shù)據(jù)統(tǒng)一地整理并進行處理,提高了整理用戶行為數(shù)據(jù)的速度,時效性較強。智能推送系統(tǒng)的硬件包括電源電路、采集器、微處理器與單片機,各種硬件分工合作,使智能推送系統(tǒng)較容易地實現(xiàn),提高了基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)的安全性與可靠性,對用戶畫像進行有針對性的采集、分析與處理,并做成對應(yīng)的標簽信息,標簽信息可以包括用戶的位置、性別、年齡等數(shù)據(jù),使推送給用戶的個性化信息內(nèi)容更具有針對性與準確性,能更準確地預(yù)測用戶的行為愛好與生活習(xí)慣,為用戶提供更滿意的個性化服務(wù),采用軟硬件的環(huán)境,突出了個性化服務(wù)對用戶的重要性,使基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)更具特色[17]。
該文基于大數(shù)據(jù)聚類設(shè)計了用戶畫像提取與智能推送系統(tǒng),通過互聯(lián)網(wǎng)建立用戶畫像與標簽體系,通過采集用戶行為數(shù)據(jù),利用大數(shù)據(jù)聚類將行為數(shù)據(jù)進行分類并做成對應(yīng)的標簽,提高了用戶行為數(shù)據(jù)的整合性。根據(jù)用戶的習(xí)慣愛好,預(yù)測用戶可能喜好的網(wǎng)絡(luò)信息內(nèi)容,提高了智能推送系統(tǒng)的工作效率,使系統(tǒng)更具有準確性與可靠性。軟硬件的設(shè)計環(huán)境,使推送系統(tǒng)更具安全性,根據(jù)用戶已經(jīng)安裝的系統(tǒng)軟件,建立可以實現(xiàn)網(wǎng)絡(luò)信息提取與智能發(fā)送的模型,使系統(tǒng)的個性化推送內(nèi)容更周到、全面、細致,用戶對智能發(fā)送的滿意度最高,進而可以更好地為有需求的用戶進行畫像。