亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于KPCA的教育特征群集挖掘與分析

        2024-01-24 10:03:50吳宇航陳鳳鳳
        無線互聯(lián)科技 2023年23期
        關(guān)鍵詞:分級(jí)矩陣特征

        吳宇航,陳鳳鳳,江 玲,萬 磊

        (南昌大學(xué) 共青學(xué)院,江西 九江 332020)

        0 引言

        混合教學(xué)是指將傳統(tǒng)課堂教學(xué)與在線教育相結(jié)合,形成一種新型的教學(xué)模式。混合教學(xué)充分利用了傳統(tǒng)課堂教學(xué)和在線教育各自的優(yōu)勢,既保留了師生之間的面對(duì)面交流,又拓展了時(shí)間和空間上的靈活性;既增加了課程內(nèi)容的豐富性和多樣性,又提高了學(xué)習(xí)效率和效果?;旌辖虒W(xué)已經(jīng)成為當(dāng)前國內(nèi)外教育領(lǐng)域的熱點(diǎn)話題和發(fā)展趨勢。

        混合教學(xué)產(chǎn)生了大量的多源、異構(gòu)、復(fù)雜的數(shù)據(jù),包括傳統(tǒng)課堂的監(jiān)管輔助數(shù)據(jù)(如點(diǎn)名、作業(yè)、實(shí)驗(yàn)、測試等)和在線教育平臺(tái)上的學(xué)習(xí)數(shù)據(jù)(如學(xué)習(xí)進(jìn)度、時(shí)長、測試成績等)[1]。這些數(shù)據(jù)包含了豐富的信息,反映了學(xué)生的學(xué)習(xí)行為、能力、水平、興趣等方面的特征。如何有效地分析和利用這些數(shù)據(jù),提取出有價(jià)值的知識(shí),評(píng)估和改進(jìn)教育質(zhì)量,是當(dāng)前混合教學(xué)面臨的重要問題。

        為了解決這個(gè)問題,本文提出了一種基于核主成分分析(KPCA)的方法。核主成分分析是一種非線性降維技術(shù),可以將高維非線性數(shù)據(jù)映射到低維線性空間,提取出數(shù)據(jù)的主要特征[2]。本文利用核主成分分析對(duì)混合教學(xué)數(shù)據(jù)進(jìn)行特征提取和降維,然后采用支持向量機(jī)(Support Vector Machine,SVM)對(duì)數(shù)據(jù)進(jìn)行分類和分級(jí),從而實(shí)現(xiàn)對(duì)教育質(zhì)量和學(xué)生級(jí)別的綜合評(píng)價(jià)。

        1 核主成分分析

        1.1 原理

        主成分分析(Principal Component Analysis, PCA)是一種經(jīng)典的線性降維技術(shù),可以將高維數(shù)據(jù)投影到低維空間,保留數(shù)據(jù)的最大方差,去除數(shù)據(jù)的冗余信息。PCA的基本思想是找到一組正交基,使得原始數(shù)據(jù)在這組基上的投影具有最大的方差,并且投影之間互不相關(guān)。這組正交基就是原始數(shù)據(jù)協(xié)方差矩陣的特征向量,對(duì)應(yīng)的特征值表示投影方差的大小。從這些特征值中選擇前k個(gè)最大的特征值,將對(duì)應(yīng)的特征向量作為投影矩陣,就可以將原始數(shù)據(jù)從n維降到k維。

        PCA是一種線性降維技術(shù),它假設(shè)數(shù)據(jù)在低維空間中是線性可分的。然而,在實(shí)際應(yīng)用中,許多數(shù)據(jù)具有非線性結(jié)構(gòu),例如流形結(jié)構(gòu)、曲面結(jié)構(gòu)等。這些數(shù)據(jù)在低維空間中是線性不可分的,因此直接使用PCA會(huì)導(dǎo)致信息丟失或失真。為了解決這個(gè)問題,核主成分分析(K PCA)被提出。核主成分分析是一種非線性降維技術(shù),可以將高維非線性數(shù)據(jù)映射到低維線性空間,保留數(shù)據(jù)的非線性特征。

        核主成分分析的基本思想是利用核函數(shù)(Kernel Function,KF)將原始數(shù)據(jù)從輸入空間映射到一個(gè)高維特征空間(Feature Space,FS),在這個(gè)空間中進(jìn)行PCA[3]。核函數(shù)是一種隱式地定義高維映射的函數(shù),可以直接計(jì)算出2個(gè)輸入向量在特征空間中的內(nèi)積,而不需要顯式地知道映射函數(shù)。核函數(shù)必須滿足Mercer條件,即對(duì)任意給定的輸入向量集合,在核函數(shù)定義下形成的Gram矩陣必須是半正定的。常用的核函數(shù)有線性核、多項(xiàng)式核、高斯核、拉普拉斯核、Sigmoid核等。

        假設(shè)原始數(shù)據(jù)集為X={x1,x2,…,xm},其中xi∈Rn,則核主成分分析的步驟如下。

        (1)選擇一個(gè)合適的核函數(shù)K(x,y),并計(jì)算Gram矩陣G=[K(xi,xj)]m×m。

        (3)求解中心化后的Gram矩陣的特征值問題,即Gcαi=λiαi,其中λi是特征值,αi是特征向量。由于Gram矩陣是半正定的,所以特征值都是非負(fù)的。將特征值從大到小排序,選擇前k個(gè)最大的特征值對(duì)應(yīng)的特征向量作為投影矩陣,即α1,α2,…,αk。

        1.2 算法

        根據(jù)上述原理,可以將核主成分分析的算法作如下描述。

        輸入:原始數(shù)據(jù)集X={x1,x2,…,xm},核函數(shù)K(x,y),目標(biāo)維數(shù)k。

        輸出:降維后的數(shù)據(jù)集Y={y1,y2,…,ym}。

        步驟:

        (1)計(jì)算Gram矩陣G=[K(xi,xj)]m×m。

        (3)求解中心化后的Gram矩陣的特征值問題,即Gcαi=λiαi。選擇前k個(gè)最大的特征值對(duì)應(yīng)的特征向量作為投影矩陣,即α1,α2,…,αk。

        (5)返回降維后的數(shù)據(jù)集Y={y1,y2,…,ym}。

        2 基于核主成分分析的混合教學(xué)數(shù)據(jù)特征分析與分級(jí)方法

        本文針對(duì)混合教學(xué)數(shù)據(jù)的特征分析與分級(jí)問題,提出了一種基于核主成分分析的方法,包括以下幾個(gè)步驟。

        2.1 數(shù)據(jù)預(yù)處理

        混合教學(xué)數(shù)據(jù)包括傳統(tǒng)教學(xué)數(shù)據(jù)和在線教育數(shù)據(jù)2部分。傳統(tǒng)教學(xué)數(shù)據(jù)主要來源于課堂監(jiān)管輔助系統(tǒng)(Classroom Management System,CMS),該系統(tǒng)可以記錄學(xué)生在課堂上的出勤、作業(yè)、實(shí)驗(yàn)、測試等情況。在線教育數(shù)據(jù)主要來源于互聯(lián)網(wǎng)教育平臺(tái)(Internet Education Platform,IEP),該平臺(tái)可以記錄學(xué)生在網(wǎng)上的學(xué)習(xí)進(jìn)度、時(shí)長、測試成績等情況。這2部分?jǐn)?shù)據(jù)的格式和結(jié)構(gòu)可能不一致,因此需要進(jìn)行數(shù)據(jù)融合和標(biāo)準(zhǔn)化處理。

        數(shù)據(jù)融合是指將不同來源的數(shù)據(jù)進(jìn)行整合,形成一個(gè)統(tǒng)一的數(shù)據(jù)集。本文采用基于屬性的數(shù)據(jù)融合方法,即根據(jù)數(shù)據(jù)的屬性進(jìn)行匹配和合并[4]。首先,對(duì)傳統(tǒng)教學(xué)數(shù)據(jù)和在線教育數(shù)據(jù)進(jìn)行屬性分析,確定共有屬性和特有屬性。共有屬性是指2部分?jǐn)?shù)據(jù)都具有的屬性,如學(xué)號(hào)、姓名、班級(jí)等;特有屬性是指只屬于一部分?jǐn)?shù)據(jù)的屬性,如出勤率、作業(yè)完成率、學(xué)習(xí)時(shí)長等。其次,根據(jù)共有屬性將2部分?jǐn)?shù)據(jù)進(jìn)行對(duì)齊,即將相同學(xué)生的數(shù)據(jù)放在一起。最后,將2部分?jǐn)?shù)據(jù)的特有屬性進(jìn)行合并,形成一個(gè)完整的教育特征數(shù)據(jù)鏈。

        數(shù)據(jù)標(biāo)準(zhǔn)化是指將不同范圍和單位的數(shù)據(jù)轉(zhuǎn)換為相同或相近的范圍和單位,以消除數(shù)據(jù)之間的量綱差異。本文采用最大最小歸一化方法,即將每個(gè)屬性的值映射到[0,1]區(qū)間,公式如下:

        其中,x是原始值,是歸一化后的值,xmin和xmax是該屬性的最小值和最大值[5]。經(jīng)過歸一化處理后,每個(gè)屬性的值都在[0,1]區(qū)間內(nèi),便于進(jìn)行后續(xù)的計(jì)算和分析。

        2.2 教育特征數(shù)據(jù)網(wǎng)絡(luò)模型

        為了利用復(fù)雜網(wǎng)絡(luò)的研究方法和理論模型,本文將教育特征數(shù)據(jù)抽象為一個(gè)復(fù)雜網(wǎng)絡(luò)模型。復(fù)雜網(wǎng)絡(luò)是一種由大量節(jié)點(diǎn)和節(jié)點(diǎn)之間的連接構(gòu)成的復(fù)雜系統(tǒng),它可以描述各種復(fù)雜現(xiàn)象和規(guī)律。本文將每個(gè)學(xué)生作為一個(gè)節(jié)點(diǎn),將學(xué)生之間的相似度作為連接的權(quán)重,構(gòu)建一個(gè)加權(quán)無向網(wǎng)絡(luò)。

        其中,xi和xj是2個(gè)學(xué)生的教育特征向量,σ是高斯核函數(shù)的參數(shù),控制了相似度衰減的速度。高斯核函數(shù)可以有效地捕捉非線性特征之間的相似度,并且具有良好的數(shù)學(xué)性質(zhì)。

        根據(jù)上述方法,本文可以得到一個(gè)m×m的相似度矩陣S=[S(xi,xj)]m×m,其中m是學(xué)生的數(shù)量。相似度矩陣可以看作是一個(gè)加權(quán)無向網(wǎng)絡(luò)的鄰接矩陣,其中每個(gè)節(jié)點(diǎn)代表一個(gè)學(xué)生,每條邊的權(quán)重代表2個(gè)學(xué)生之間的相似度。

        2.3 群集特征提取

        在教育特征數(shù)據(jù)網(wǎng)絡(luò)模型中,不同的節(jié)點(diǎn)可能具有不同的特征和影響力,對(duì)教育質(zhì)量有不同的貢獻(xiàn)。為了找出這些重要的節(jié)點(diǎn)和特征,本文采用核主成分分析對(duì)網(wǎng)絡(luò)進(jìn)行特征提取和降維。核主成分分析可以將高維非線性數(shù)據(jù)映射到低維線性空間,保留數(shù)據(jù)的主要特征。本文利用核主成分分析對(duì)相似度矩陣進(jìn)行處理,得到每個(gè)節(jié)點(diǎn)在低維空間中的坐標(biāo),即群集特征向量。

        2.4 綜合評(píng)價(jià)模型

        在提取影響教育質(zhì)量的群集特征后,本文建立了一個(gè)針對(duì)教育質(zhì)量和學(xué)生級(jí)別進(jìn)行綜合評(píng)價(jià)的評(píng)價(jià)模型。該模型基于層次分析法(Analytic Hierarchy Process,AHP)和綜合評(píng)價(jià)法(Comprehensive Evaluation Method,CEM),將教育質(zhì)量評(píng)價(jià)分為3個(gè)層次:目標(biāo)層、準(zhǔn)則層和方案層[6]。目標(biāo)層是評(píng)價(jià)的總目標(biāo),即教育質(zhì)量;準(zhǔn)則層是評(píng)價(jià)的指標(biāo),即群集特征;方案層是評(píng)價(jià)的對(duì)象,即學(xué)生。

        該模型的具體步驟如下。

        (2)計(jì)算評(píng)價(jià)值。根據(jù)權(quán)重矩陣和各個(gè)學(xué)生在原始數(shù)據(jù)中的屬性值,計(jì)算每個(gè)學(xué)生的教育質(zhì)量評(píng)價(jià)值Ei,公式如下:

        其中,xxj表示第i個(gè)學(xué)生在第j個(gè)特征上的屬性值。

        (3)確定分級(jí)標(biāo)準(zhǔn)。根據(jù)評(píng)價(jià)值的分布情況,確定不同級(jí)別的學(xué)生的評(píng)價(jià)值區(qū)間,作為分級(jí)標(biāo)準(zhǔn)。本文采用5級(jí)分級(jí)法,即將評(píng)價(jià)值分為5個(gè)等級(jí),分別對(duì)應(yīng)優(yōu)秀、良好、中等、及格和不及格。

        (5)對(duì)學(xué)生進(jìn)行分級(jí)。根據(jù)分級(jí)標(biāo)準(zhǔn),將每個(gè)學(xué)生劃分到相應(yīng)的級(jí)別,從而完成對(duì)學(xué)生的綜合評(píng)價(jià)和分級(jí)。

        3 實(shí)驗(yàn)結(jié)果與分析

        3.1 實(shí)驗(yàn)數(shù)據(jù)

        為了驗(yàn)證本文提出的方法的有效性和優(yōu)越性,使用了一個(gè)真實(shí)的混合教學(xué)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。該數(shù)據(jù)集來源于某高校的一門“BIM結(jié)構(gòu)建模軟件”課程,包括傳統(tǒng)教學(xué)數(shù)據(jù)和在線教育數(shù)據(jù)2部分。傳統(tǒng)教學(xué)數(shù)據(jù)包括39名學(xué)生在課堂上的出勤、作業(yè)、實(shí)驗(yàn)、測試等情況;在線教育數(shù)據(jù)包括39名學(xué)生在互聯(lián)網(wǎng)教育平臺(tái)上的學(xué)習(xí)進(jìn)度、時(shí)長、測試成績等情況。這些數(shù)據(jù)經(jīng)過數(shù)據(jù)融合和標(biāo)準(zhǔn)化處理后,形成了一個(gè)完整的教育特征數(shù)據(jù)鏈。

        3.2 實(shí)驗(yàn)結(jié)果

        本文使用相關(guān)語言編寫了核主成分分析和綜合評(píng)價(jià)模型的程序,并在上述數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)。將高斯核函數(shù)的參數(shù)σ設(shè)為1,目標(biāo)維數(shù)k設(shè)為2,如圖1所示。

        圖1 核主成分分析后的教育特征數(shù)據(jù)網(wǎng)絡(luò)模型

        從圖1可以看出,核主成分分析后的教育特征數(shù)據(jù)在低維空間中呈現(xiàn)出一定的聚類效果,即不同級(jí)別的學(xué)生在平面上有一定的區(qū)分度。同時(shí),可以看出一些點(diǎn)比其他點(diǎn)更密,這些點(diǎn)表示其在低維空間中具有較大的方差,即其具有較強(qiáng)的群集特征。這些點(diǎn)對(duì)應(yīng)于原始網(wǎng)絡(luò)中具有較高相似度和影響力的節(jié)點(diǎn),即對(duì)教育質(zhì)量有較大貢獻(xiàn)的學(xué)生。本文將這些點(diǎn)選取出來,并根據(jù)其在原始數(shù)據(jù)中的屬性值進(jìn)行標(biāo)注,得到重要的學(xué)習(xí)特征,如表1所示。

        表1 教育特征數(shù)據(jù)鏈及群集特征

        從表1可以看出,本文發(fā)現(xiàn)以下幾個(gè)重要的學(xué)習(xí)特征:

        (1)出勤率。出勤率反映了學(xué)生對(duì)課堂的重視程度和參與度,是衡量學(xué)生學(xué)習(xí)態(tài)度和效果的重要指標(biāo)。本文發(fā)現(xiàn)出勤率高的學(xué)生在低維空間中具有較大的方差,即其對(duì)教育質(zhì)量有較大的影響。

        (2)作業(yè)完成率。作業(yè)完成率反映了學(xué)生對(duì)課程內(nèi)容的掌握程度和鞏固程度,是衡量學(xué)生學(xué)習(xí)能力和效果的重要指標(biāo)。本文發(fā)現(xiàn)作業(yè)完成率高的學(xué)生在低維空間中具有較大的方差,即其對(duì)教育質(zhì)量有較大的影響。

        (3)學(xué)習(xí)進(jìn)度。學(xué)習(xí)進(jìn)度反映了學(xué)生在在線教育平臺(tái)上的學(xué)習(xí)活躍度和自主性,是衡量學(xué)生學(xué)習(xí)興趣和動(dòng)力的重要指標(biāo)。本文發(fā)現(xiàn)學(xué)習(xí)進(jìn)度高的學(xué)生在低維空間中具有較大的方差,即其對(duì)教育質(zhì)量有較大的影響。

        (4)測試成績。測試成績反映了學(xué)生在課堂和網(wǎng)上的綜合表現(xiàn)和水平,是衡量學(xué)生學(xué)習(xí)效果和質(zhì)量的重要指標(biāo)。本文發(fā)現(xiàn)測試成績高的學(xué)生在低維空間中具有較大的方差,即其對(duì)教育質(zhì)量有較大的影響。

        本文根據(jù)權(quán)重矩陣和各個(gè)學(xué)生在原始數(shù)據(jù)中的屬性值,計(jì)算了每個(gè)學(xué)生的教育質(zhì)量評(píng)價(jià)值,并根據(jù)分級(jí)標(biāo)準(zhǔn),將每個(gè)學(xué)生劃分到相應(yīng)的級(jí)別,從而完成了對(duì)學(xué)生的綜合評(píng)價(jià)和分級(jí),如表2所示。

        表2 學(xué)生的綜合評(píng)價(jià)和分級(jí)

        從表2可以看出,本文的方法可以對(duì)學(xué)生的教育質(zhì)量進(jìn)行綜合評(píng)價(jià)和分級(jí),從而為混合教學(xué)的個(gè)性化教育干預(yù)提供依據(jù)和參考。

        4 結(jié)語

        本文基于核主成分分析的方法,設(shè)計(jì)特征抽取算法,處理混合教學(xué)數(shù)據(jù),構(gòu)建教育特征數(shù)據(jù)網(wǎng)絡(luò)模型,挖掘出影響教育質(zhì)量不同程度上的群集特征?;旌辖虒W(xué)數(shù)據(jù)反映出學(xué)生的學(xué)習(xí)行為、能力、水平等方面的特征,上述實(shí)驗(yàn)表明基于核主成分分析的方法能夠?qū)旌辖虒W(xué)數(shù)據(jù)進(jìn)行分級(jí),有效地提取出了重要的教育特征群集,通過建立教育質(zhì)量和學(xué)生級(jí)別的綜合評(píng)價(jià)模型,實(shí)現(xiàn)學(xué)生分級(jí),為提高教學(xué)質(zhì)量提供了更好的個(gè)性化教育干預(yù),對(duì)教育質(zhì)量的評(píng)估和改進(jìn)起到重要的參考作用。

        猜你喜歡
        分級(jí)矩陣特征
        如何表達(dá)“特征”
        不忠誠的四個(gè)特征
        抓住特征巧觀察
        分級(jí)診療路難行?
        分級(jí)診療的“分”與“整”
        初等行變換與初等列變換并用求逆矩陣
        分級(jí)診療的強(qiáng)、引、合
        “水到渠成”的分級(jí)診療
        矩陣
        南都周刊(2015年4期)2015-09-10 07:22:44
        矩陣
        南都周刊(2015年3期)2015-09-10 07:22:44
        无码欧美毛片一区二区三| 亚洲图文一区二区三区四区| 日韩不卡一区二区三区色图| 97se色综合一区二区二区| 国产乱人视频在线播放| 女高中生自慰污免费网站| 亚洲一区二区三区综合网| 国产自拍成人免费视频| 日本熟妇免费一区二区三区| 白白白在线视频免费播放| 亚洲日韩一区二区三区| 亚洲天堂中文| 国产麻豆成人精品av| 亚洲中文字幕人妻av在线| 粉嫩虎白女毛片人体| 久久久精品国产亚洲AV蜜| 亚洲av成人无网码天堂| 色综合天天综合欧美综合| 中国a级毛片免费观看| 国产成人cao在线| 亚洲a级视频在线播放| 久久久久人妻精品一区三寸| 蜜桃视频无码区在线观看| 99国产免费热播视频| 久久精品网站免费观看| 亚洲精品1区2区在线观看| 久久久午夜精品福利内容| 无码一区二区三区不卡AV| 在线视频免费自拍亚洲| 国产成人av在线免播放观看新 | 国产一品二品三品精品在线| 亚洲成av人片一区二区| 日韩人妻无码精品久久伊人| 少妇被猛烈进入中文字幕| 免费国产成人肉肉视频大全| 少妇高潮喷水久久久影院| 中文字幕无线精品亚洲乱码一区| 国产自拍视频在线观看网站| 国产福利酱国产一区二区| 男人天堂AV在线麻豆| 国产av一级片在线观看|