亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于卷積神經(jīng)網(wǎng)絡(luò)的頂崗實習管理系統(tǒng)數(shù)據(jù)挖掘研究

        2023-09-15 11:47:38蔡傳軍童緒軍
        關(guān)鍵詞:數(shù)據(jù)倉庫頂崗分類器

        蔡傳軍,童緒軍

        (安徽醫(yī)學高等專科學校 公共基礎(chǔ)學院,安徽 合肥 230601)

        頂崗實習是高等教育不可或缺的組成部分,為有效監(jiān)控學生的頂崗實習情況,大多數(shù)學校都開發(fā)了頂崗實習管理系統(tǒng),通過學生上傳的實習報告和實習評價結(jié)果記錄頂崗實習情況,確保校內(nèi)指導(dǎo)教師了解學生的整體工作狀況[1-3]。但是,隨著校內(nèi)頂崗實習管理系統(tǒng)使用年數(shù)的增加,系統(tǒng)內(nèi)會積累大量數(shù)據(jù),會降低數(shù)據(jù)的利用效率[4]?,F(xiàn)代數(shù)據(jù)挖掘技術(shù)的進步,使數(shù)據(jù)的查找和分析效率有了明顯提升。針對頂崗實習管理系統(tǒng),設(shè)計合理的數(shù)據(jù)挖掘方法成為當前的研究重點,但是現(xiàn)有的數(shù)據(jù)挖掘方法難以滿足院校的頂崗實習數(shù)據(jù)管理需求[5]。為解決這一問題,本研究提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法,可精準提取所需的頂崗實習數(shù)據(jù),為頂崗實習管理工作打下基礎(chǔ)。

        1 設(shè)計方法

        1.1 建立實習管理系統(tǒng)數(shù)據(jù)倉庫

        頂崗實習管理系統(tǒng)內(nèi)包含的數(shù)據(jù)多種多樣,需要建立面向主題的數(shù)據(jù)倉庫,作為后續(xù)數(shù)據(jù)挖掘的基礎(chǔ)。以數(shù)據(jù)主題作為宏觀分析條件[6],對實習管理系統(tǒng)內(nèi)包含的數(shù)據(jù)進行聚類分析,形成多個數(shù)據(jù)單元,再通過數(shù)據(jù)加工和集成處理,以滿足數(shù)據(jù)倉庫集成特性的要求。因此,在數(shù)據(jù)倉庫的創(chuàng)建過程中,將數(shù)據(jù)加工和數(shù)據(jù)集成歸納為一個復(fù)雜的環(huán)節(jié),先提取原始數(shù)據(jù)的矛盾點,再以此為核心將應(yīng)用數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為面向主題的數(shù)據(jù)結(jié)構(gòu)[7]。本研究提出的數(shù)據(jù)挖掘方法以數(shù)據(jù)倉庫為基礎(chǔ)組織結(jié)構(gòu),首先對頂崗實習管理系統(tǒng)中提取出的各類數(shù)據(jù)進行處理,形成基礎(chǔ)數(shù)據(jù)集,然后分析基礎(chǔ)數(shù)據(jù)所呈現(xiàn)出的時間變化趨勢,對基礎(chǔ)數(shù)據(jù)進行分類、歸納和加工,結(jié)合時間控制機制形成歷史數(shù)據(jù)集,再與基礎(chǔ)數(shù)據(jù)集相結(jié)合形成綜合數(shù)據(jù)。

        由于學生頂崗實習工作所涉及的外部部門較多,即外部數(shù)據(jù)較多,所以在建立數(shù)據(jù)倉庫時,還需要將這些外部數(shù)據(jù)單獨劃分出來,與外部數(shù)據(jù)源進行對比驗證,確保外部數(shù)據(jù)的真實性[8]。同時,需要設(shè)計一個集成數(shù)據(jù)處理器,連接數(shù)據(jù)倉庫與外部數(shù)據(jù)源,后者所包含的數(shù)據(jù)發(fā)生改變后,可同步更新數(shù)據(jù)倉庫信息。本研究所構(gòu)建的數(shù)據(jù)倉庫,采用如圖1所示的基本邏輯結(jié)構(gòu)。

        從圖1可以看出,一個數(shù)據(jù)倉庫的組成包括倉庫設(shè)計、數(shù)據(jù)獲取、數(shù)據(jù)管理和數(shù)據(jù)訪問4個環(huán)節(jié),分別負責定義倉庫環(huán)境、解析外部數(shù)據(jù)源、數(shù)據(jù)分布管理與更新維護,以及向管理人員提供數(shù)據(jù)報告。

        1.2 設(shè)計數(shù)據(jù)特征提取機制

        針對建立的數(shù)據(jù)倉庫設(shè)計一種分布式數(shù)據(jù)結(jié)構(gòu),以實現(xiàn)目標數(shù)據(jù)的模糊分布式存儲。由于頂崗實習管理系統(tǒng)內(nèi)包含的部分數(shù)據(jù)存在交互性[9],數(shù)據(jù)挖掘過程中又存在較多擾動影響因素,且這些影響因素具有時變性特點,因此本研究提出運用模糊聚類技術(shù),融合不同特征維度的數(shù)據(jù),形成包含關(guān)聯(lián)規(guī)則項約束條件的數(shù)據(jù)信息流模型[10],具體表達式為

        xn=x(t0+nΔt)=h(t0+nΔt)+θn,

        (1)

        式中:x表示頂崗實習管理系統(tǒng)數(shù)據(jù)信息流模型;n表示關(guān)聯(lián)規(guī)則項數(shù)量;t0表示初始時刻;Δt表示變化時刻;h(·)表示多維數(shù)據(jù)結(jié)構(gòu)模型函數(shù);θ表示數(shù)據(jù)測量誤差。在此基礎(chǔ)上,采用分布式結(jié)構(gòu)模型,將頂崗實習管理系統(tǒng)的數(shù)據(jù)表述為以下分布函數(shù):

        (2)

        式中:u表示目標數(shù)據(jù);z表示數(shù)據(jù)存儲結(jié)構(gòu)的階數(shù);α表示數(shù)據(jù)采集時間窗口寬度。

        按照頂崗實習管理系統(tǒng)數(shù)據(jù)采集時間,結(jié)合式(2)構(gòu)建具有分布式特點的時態(tài)結(jié)構(gòu)模型,將四元組條件下提取的關(guān)聯(lián)規(guī)則項特征轉(zhuǎn)換為五元組關(guān)聯(lián)規(guī)則項,得到數(shù)據(jù)挖掘所需要的關(guān)聯(lián)規(guī)則知識[11],并給出特征標志函數(shù)。引入統(tǒng)計回歸分析思想,針對頂崗實習管理系統(tǒng)數(shù)據(jù),形成非線性時間序列數(shù)據(jù)組合模型。

        針對具有連續(xù)性特點的頂崗實習管理系統(tǒng)數(shù)據(jù),本研究應(yīng)用連續(xù)模板匹配技術(shù),深入分析分布式數(shù)據(jù)結(jié)構(gòu),對子結(jié)構(gòu)數(shù)據(jù)進行融合處理。在實際操作過程中,需要針對非線性時間序列數(shù)據(jù)組合模型,提取其中包含的大數(shù)據(jù)節(jié)點,并針對每個節(jié)點提取閉頻繁項集特征。通過極限學習方法,對上述提取出的特征項進一步分析得到全局最優(yōu)解,結(jié)合待挖掘數(shù)據(jù)所屬鏈路的負載情況,獲取數(shù)據(jù)特征估計值。針對線性規(guī)劃模型所涉及的數(shù)據(jù)進行特征提取,經(jīng)過小波熵分解算法處理后,與數(shù)據(jù)特征估計值相結(jié)合,建立數(shù)據(jù)特征提取機制,得到數(shù)據(jù)關(guān)聯(lián)規(guī)則特征提取結(jié)果。

        1.3 構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)挖掘模型

        可以將數(shù)據(jù)挖掘當成一個簡單的分類問題,根據(jù)上述數(shù)據(jù)關(guān)聯(lián)規(guī)則特征提取結(jié)果,將給定的數(shù)據(jù)集劃分為多個子集,每個數(shù)據(jù)子集具有不同的主題和屬性。根據(jù)數(shù)據(jù)挖掘要求,將數(shù)據(jù)倉庫內(nèi)的數(shù)據(jù)分為目標數(shù)據(jù)和非目標數(shù)據(jù),其中目標數(shù)據(jù)即數(shù)據(jù)挖掘結(jié)果。采用神經(jīng)網(wǎng)絡(luò)訓練的方式,描述數(shù)據(jù)屬性與數(shù)據(jù)分類結(jié)果之間的聯(lián)系,并構(gòu)造一個分類決策樹。

        依托關(guān)聯(lián)規(guī)則特征,提出一種以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的數(shù)據(jù)挖掘模型,將每個數(shù)據(jù)關(guān)聯(lián)規(guī)則特征看作模型輸入值,通過卷積層、池化層和全連接層進行傳遞[12],并通過神經(jīng)元運算輸出最終結(jié)果,具體模型如圖2所示。

        圖2 卷積神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘模型Fig.2 Convolutional neural network data mining model

        在圖2所示的卷積神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘模型計算過程中,輸入數(shù)據(jù)和輸出數(shù)據(jù)之間存在直接對應(yīng)關(guān)系,但二者的實際關(guān)系是間接性的,造成這種現(xiàn)象的原因是輸出誤差。為提高卷積神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘結(jié)果的準確性,并提高模型運算效率,以網(wǎng)絡(luò)訓練誤差最小化為目標,建立相應(yīng)的關(guān)系強化約束條件。這部分強化約束條件的主要功能是提升網(wǎng)絡(luò)訓練模型的學習能力,可以將其描述為誘導(dǎo)型約束模式,采用以下的約束引入方式:

        (3)

        依托卷積神經(jīng)網(wǎng)絡(luò)構(gòu)造的決策樹,設(shè)置約束條件,包括權(quán)值約束和導(dǎo)數(shù)關(guān)系約束。權(quán)值約束的計算需要從偏導(dǎo)數(shù)入手,對卷積神經(jīng)網(wǎng)絡(luò)中乘積項的權(quán)值進行限制,保持權(quán)值固定不變,以保證數(shù)據(jù)挖掘的準確性。權(quán)值約束所對應(yīng)的模型為

        (4)

        式中:S表示權(quán)值約束誤差;D表示卷積神經(jīng)網(wǎng)絡(luò)內(nèi)所有結(jié)構(gòu)的連接權(quán)重。

        導(dǎo)數(shù)關(guān)系約束的存在是為了降低各屬性導(dǎo)數(shù)值的變化頻率,最大限度降低數(shù)值變化對數(shù)據(jù)挖掘結(jié)果的影響,同時有利于每個有用屬性的導(dǎo)數(shù)值呈現(xiàn)出均勻單調(diào)變化特點,便于判斷數(shù)據(jù)分類結(jié)果的誤差。導(dǎo)數(shù)關(guān)系約束模型的建立,需要先求解偏導(dǎo)數(shù)與輸入數(shù)據(jù)所對應(yīng)的線性回歸曲線,并對比回歸曲線上每個樣本點的預(yù)測值和偏導(dǎo)數(shù),得出約束誤差計算結(jié)果:

        (5)

        式中:c表示樣本點;φ表示輸入層內(nèi)神經(jīng)元;F表示輸入值;K表示樣本點總數(shù)量;A、B表示偏導(dǎo)數(shù)與輸入值組成的線性回歸常數(shù)。將上述兩個約束條件融入卷積神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘模型中,得到符合要求的數(shù)據(jù)挖掘結(jié)果。

        1.4 獲取數(shù)據(jù)挖掘聚類結(jié)果

        在上述卷積神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,融合模糊分類器,結(jié)合特征壓縮方法實現(xiàn)頂崗實習管理系統(tǒng)數(shù)據(jù)的降維處理,再融入模糊聚類方法,以低開銷為原則獲取數(shù)據(jù)挖掘聚類結(jié)果。

        分類器融合方法中,單個分類器為第0層,多分類器融合為第1層分類器,第1層分類器是模糊系統(tǒng)μ1。假設(shè)得到符合要求的數(shù)據(jù)挖掘結(jié)果具有λ個模式類,λ={λ1,λ2,…,λn},在融合模糊分類器中,需要將第0層分類器的輸入樣本εi轉(zhuǎn)換為第1層分類器模糊系統(tǒng)μ1的輸入樣本,因此第0層的樣本和模式類λ各個分類器的輸出樣本可表示為

        (6)

        (7)

        獲取訓練集后,采用冗余數(shù)據(jù)的高階累積量特征壓縮處理方法對數(shù)據(jù)聚類中心進行計算:

        V={vij|i=1,2,…,I,j=1,2,…,J|},

        (8)

        式中:vij為冗余數(shù)據(jù)中第i個干擾向量;j為加權(quán)權(quán)重,可定義冗余數(shù)據(jù)的降維目標函數(shù)ρ。

        設(shè)ri為第i類冗余信息特征狀態(tài),那么數(shù)據(jù)挖掘聚類結(jié)果

        (9)

        從頂崗實習管理系統(tǒng)中提取部分數(shù)據(jù),分別構(gòu)建測試樣本集和訓練樣本集,并提取數(shù)據(jù)特征分布集和數(shù)據(jù)關(guān)聯(lián)規(guī)則特征數(shù)量作為數(shù)據(jù)挖掘模型的輸入數(shù)據(jù)。經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)的運算,可得出數(shù)據(jù)分類挖掘結(jié)果,步驟如下:①針對待識別的頂崗實習管理系統(tǒng)數(shù)據(jù)進行分析,獲取規(guī)則項特征點;②針對卷積神經(jīng)網(wǎng)絡(luò)分類構(gòu)造樹,設(shè)置合理的加權(quán)值;③運用特征壓縮方法進行降維處理,實現(xiàn)特征的分離、壓縮處理;④設(shè)置合理的收斂條件,當數(shù)據(jù)分類挖掘結(jié)果滿足條件時停止網(wǎng)絡(luò)模型迭代計算,輸出當前挖掘數(shù)據(jù),若不滿足收斂條件,則需要重復(fù)迭代計算步驟,直到滿足收斂要求。

        2 實驗

        2.1 實驗數(shù)據(jù)

        為驗證本研究提出的基于卷積神經(jīng)網(wǎng)絡(luò)的頂崗實習管理系統(tǒng)數(shù)據(jù)挖掘方法的有效性,以某學院內(nèi)的頂崗實習管理系統(tǒng)為研究對象,對系統(tǒng)內(nèi)的數(shù)據(jù)進行挖掘。本實驗所采用的頂崗實習管理系統(tǒng)內(nèi)包含多種數(shù)據(jù),具體功能結(jié)構(gòu)如圖3所示。

        圖3 頂崗實習管理系統(tǒng)功能結(jié)構(gòu)Fig.3 Functional structure of post practice management system

        為保證數(shù)據(jù)挖掘?qū)嶒烅樌M行,采用網(wǎng)絡(luò)爬蟲對頂崗實習管理系統(tǒng)內(nèi)業(yè)務(wù)子系統(tǒng)和統(tǒng)計子系統(tǒng)的數(shù)據(jù)進行采集,獲取實驗數(shù)據(jù)集。采集數(shù)據(jù)是從該管理系統(tǒng)內(nèi)直接導(dǎo)出的,保存為csv格式。

        考慮到對原始導(dǎo)出數(shù)據(jù)直接進行實驗分析會出現(xiàn)個人隱私泄露和數(shù)據(jù)不完整的問題,因此在實驗準備階段,需要對這些數(shù)據(jù)進行脫敏處理。將頂崗實習管理系統(tǒng)導(dǎo)出數(shù)據(jù)中的身份證號、通信地址等信息標注為隱私數(shù)據(jù),從實驗數(shù)據(jù)集內(nèi)剔除,最終得到有效實驗數(shù)據(jù)2 745條,從中隨機選擇1 000條數(shù)據(jù)作為測試數(shù)據(jù)集,再選擇1 000條數(shù)據(jù)作為驗證數(shù)據(jù)集,整理剩余數(shù)據(jù)形成訓練數(shù)據(jù)集,作為后續(xù)實驗的基礎(chǔ)。

        2.2 參數(shù)設(shè)置

        本實驗環(huán)境設(shè)置為Linux Ubuntu 18.04,依托TensorFlow框架,建立以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的數(shù)據(jù)挖掘模型,模型相關(guān)參數(shù)如表1所示。

        表1 模型參數(shù)Tab.1 Model parameters

        運用卷積神經(jīng)網(wǎng)絡(luò)進行數(shù)據(jù)挖掘時,實驗數(shù)據(jù)會劃分為多個批次,按照批次來更新模型參數(shù)。批大小會對數(shù)據(jù)挖掘結(jié)果產(chǎn)生直接影響,批設(shè)置得過大會造成運行時內(nèi)存不足,太小又會導(dǎo)致模型收斂性較差。因此,除了表1設(shè)置的模型參數(shù),還需要在固定參數(shù)條件下,分析不同批大小對模型損失的影響,確定最合理的批大小。分別設(shè)置批大小為8、16、32、64、129、256,不同條件下模型損失影響情況如表2所示。

        表2 批大小對模型損失的影響Tab.2 Impact of batch size on model loss

        從表2可以看出,同樣的批大小下,驗證損失和測試損失極為相似,但是訓練損失最初極小,隨著批大小的增大而不斷提升。這是因為模型在訓練的過程中,會主動擬合訓練數(shù)據(jù)集。本實驗定義批大小時,著重觀察驗證損失和測試損失變化情況,可以看出當批大小為64時,二者達到最小值,分別為0.36和0.35,故設(shè)置批大小為64。

        2.3 數(shù)據(jù)挖掘性能對比

        模型參數(shù)設(shè)置完成后,運用卷積神經(jīng)網(wǎng)絡(luò)模型展開數(shù)據(jù)挖掘測試。在2 000條測試數(shù)據(jù)中,對頂崗實習管理系統(tǒng)中學生綜合能力評價數(shù)據(jù)進行挖掘,同時采用基于決策樹和基于一維卷積網(wǎng)絡(luò)的方法進行數(shù)據(jù)挖掘。在相同的實驗環(huán)境下,獲取3種方法的數(shù)據(jù)挖掘結(jié)果(表3)。

        表3 數(shù)據(jù)挖掘結(jié)果對比Tab.3 Comparison of data mining results

        以表3數(shù)據(jù)為基礎(chǔ),將數(shù)據(jù)挖掘的泛化誤差作為衡量數(shù)據(jù)挖掘方法性能的指標,具體計算公式如下:

        (10)

        以不同方法得到的數(shù)據(jù)挖掘結(jié)果為基礎(chǔ),采用公式(6)進行計算,得到如圖4所示的泛化誤差對比結(jié)果。

        圖4 不同數(shù)據(jù)挖掘方法的泛化誤差對比Fig.4 Comparison of generalization errors of different data mining methods

        根據(jù)圖4可知,基于卷積神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法在實際應(yīng)用過程中泛化誤差控制在[-0.05,0.05],基于決策樹方法的數(shù)據(jù)挖掘結(jié)果泛化誤差為[-0.14,0.13],基于一維卷積網(wǎng)絡(luò)方法的數(shù)據(jù)挖掘結(jié)果泛化誤差為[-0.27,0.25]。本研究所提方法與其他兩種方法相比泛化誤差較小,能夠保持在[-0.05,0.05],這說明以卷積神經(jīng)網(wǎng)絡(luò)為核心的數(shù)據(jù)挖掘方法挖掘精度較高,可以獲取更加準確的數(shù)據(jù)挖掘結(jié)果。

        3 結(jié)語

        為從頂崗實習管理系統(tǒng)中準確提取所需要的數(shù)據(jù),設(shè)計了一種以卷積神經(jīng)網(wǎng)絡(luò)為核心的數(shù)據(jù)挖掘模型。經(jīng)實驗驗證,采用所提方法的泛化誤差比傳統(tǒng)方法有了大幅度降低,達到了預(yù)期目標。

        猜你喜歡
        數(shù)據(jù)倉庫頂崗分類器
        基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
        BP-GA光照分類器在車道線識別中的應(yīng)用
        電子測試(2018年1期)2018-04-18 11:52:35
        分布式存儲系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計
        電子制作(2016年15期)2017-01-15 13:39:15
        探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
        基于現(xiàn)代學徒制下高職學校頂崗實習的安排與策劃
        基于數(shù)據(jù)倉庫的數(shù)據(jù)分析探索與實踐
        現(xiàn)代學徒制管理模式及其頂崗實習環(huán)節(jié)
        學習月刊(2015年10期)2015-07-09 03:35:18
        基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
        美女脱掉内裤扒开下面让人插| 日日av拍夜夜添久久免费| 日本a级特黄特黄刺激大片| 日韩精人妻无码一区二区三区| 日本岛国视频在线观看一区二区| 久久亚洲中文字幕伊人久久大| 狠狠色狠狠色综合网| 大肉大捧一进一出好爽视频| 国产精品乱码在线观看| 久久人妻av无码中文专区| 少妇被躁到高潮和人狍大战| 日本亚洲精品一区二区三| 中文字幕人妻熟在线影院| 97精品伊人久久大香线蕉| 91精品国产闺蜜国产在线| 中文字幕亚洲中文第一| 亚洲男人天堂黄色av| 免费久久人人爽人人爽av| 天美麻花果冻视频大全英文版| 亚洲精品午夜精品国产| 丝袜美腿精品福利在线视频| а天堂中文在线官网在线| 国产高潮刺激叫喊视频| 国产精品国产三级在线高清观看| 亚洲国产精品色婷婷久久| 亚洲写真成人午夜亚洲美女| 97碰碰碰人妻无码视频| 4444亚洲人成无码网在线观看| 亚洲日韩AV无码美腿丝袜| 精品麻豆一区二区三区乱码| 久久成人成狠狠爱综合网| 国产一卡2卡3卡四卡国色天香| 日韩精品网| 少妇一区二区三区精选| 熟女一区二区三区在线观看| 人妻av鲁丝一区二区三区| 美女一级毛片免费观看97| 久久五月精品中文字幕| 草逼动态图视频免费观看网站| 免费久久人人爽人人爽av| 国产短视频精品区第一页|