亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于三部圖的學(xué)習(xí)資源個性化推薦算法研究

        2022-10-13 06:15:02閔磊
        科技資訊 2022年20期
        關(guān)鍵詞:資源信息

        閔磊

        (江漢大學(xué)圖書館 湖北武漢 430056)

        隨著文獻資源數(shù)字化以及互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,各類學(xué)習(xí)資源也逐漸從紙質(zhì)走向電子,且規(guī)模也在以前所未有的速度增長。這些海量的數(shù)字化資源為廣大師生在學(xué)習(xí)材料的獲取方面提供便利,但過大的規(guī)模也容易使其陷入“信息爆炸”的迷惘之中[1]。

        超大的資源規(guī)模,往往會使人們真正感興趣的內(nèi)容被淹沒在數(shù)字的海洋中。那么如何采用一種智能的方法,準確且便捷地挖掘出用戶真正感興趣的資源,就成為了一項亟待解決的問題。這種根據(jù)用戶的興趣向其推薦資源的方法,就是個性化推薦技術(shù)。

        目前,關(guān)于個性化推薦技術(shù),學(xué)者已經(jīng)提出了一些實用的算法。比較典型的算法包括基于內(nèi)容的推薦算法、基于協(xié)同過濾機制的推薦算法[2],以及近年來受到較多關(guān)注的基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦算法[3-4]等。其中,基于內(nèi)容的推薦算法對資源的文本描述進行自然語言分析,提取特征屬性,然后向用戶推薦特征屬性相近的資源[5],這類算法可以克服“冷啟動”,但對資源要求較高,需要有足夠的屬性描述;基于協(xié)同過濾機制的算法,則利用不同用戶對資源的歷史選擇信息,以協(xié)同的方式共同過濾出相近偏好的資源進行推薦,這類算法無需資源的描述信息,僅需要用戶的歷史選擇數(shù)據(jù),但存在“冷啟動”問題[6]。基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦算法,則將用戶和資源視為二部圖的兩類節(jié)點,然后以物質(zhì)或熱量擴散的方式將信息進行擴散,最后以節(jié)點上信息的多少來確定推薦列表。

        相較于其他算法,基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦算法思想簡潔有效性較強,是一類較有發(fā)展前景的技術(shù)。該文結(jié)合學(xué)習(xí)資源的標簽信息,對基于二部圖的網(wǎng)絡(luò)推薦算法進行擴展,探討了一種基于標簽的三部圖學(xué)習(xí)資源個性化推薦算法。

        1 二部圖個性化推薦機制

        1.1 基于學(xué)習(xí)資源選擇關(guān)系的二部圖

        對線上的學(xué)習(xí)活動而言,學(xué)習(xí)資源與學(xué)習(xí)者可以被抽象為兩類性質(zhì)不同的節(jié)點。學(xué)習(xí)者的學(xué)習(xí)過程,相應(yīng)地可以被視為學(xué)習(xí)者所代表的節(jié)點與學(xué)習(xí)資源所代表節(jié)點的一次選擇關(guān)系。這種眾多成對出現(xiàn)的交互關(guān)系組合在一起,就構(gòu)成了二部圖網(wǎng)絡(luò)。在二部圖網(wǎng)絡(luò)中,同類節(jié)點之間彼此互不相連,連邊僅出現(xiàn)在不同類別的節(jié)點之間,連邊的密集程度就蘊含了學(xué)習(xí)者對于學(xué)習(xí)資源的偏好程度。在二部圖網(wǎng)絡(luò)中,對學(xué)習(xí)者推薦其可能感興趣的學(xué)習(xí)資源,就是依據(jù)已有的網(wǎng)絡(luò)結(jié)構(gòu)信息,對未相連的兩類節(jié)點之間的可能連邊進行預(yù)測。

        如圖1所示,左側(cè)節(jié)點A、B、C代表學(xué)習(xí)者,他們處于學(xué)習(xí)者層;右側(cè)節(jié)點D、E、F、G 代表學(xué)習(xí)資源,他們處于學(xué)習(xí)資源層;連邊體現(xiàn)了學(xué)習(xí)者對于學(xué)習(xí)資源的偏好性即選擇關(guān)系,也就體現(xiàn)著兩層之間的關(guān)系。在圖中,節(jié)點A和節(jié)點G之間原本不相連,也就是學(xué)習(xí)者A 尚未選擇過學(xué)習(xí)資源G。如果能夠通過已有的歷史選擇信息,預(yù)測出A節(jié)點和G節(jié)點之間可能存在連邊,那么就可以向節(jié)點A(學(xué)習(xí)者A)推薦G節(jié)點(學(xué)習(xí)資源G),從而實現(xiàn)個性化推薦的目的。

        1.2 基于二部圖的信息擴散推薦機制

        在由學(xué)習(xí)者與學(xué)習(xí)資源構(gòu)成的二部圖網(wǎng)絡(luò)中,可以假設(shè)存在這樣的事實:即某個學(xué)習(xí)資源之所以會被學(xué)習(xí)者選擇,是因為其內(nèi)在所蘊含的知識與這類學(xué)習(xí)者的興趣特征相匹配,而學(xué)習(xí)者通常比較傾向于接受具有相似興趣學(xué)習(xí)者的推薦。因此,具有相似興趣學(xué)習(xí)者的歷史選擇,就可以根據(jù)一定的評估規(guī)則作為備選項推薦給相應(yīng)的學(xué)習(xí)者。

        基于上述假設(shè),可以結(jié)合圖1 對基于二部圖的信息擴散推薦機制進行描述。假設(shè)圖中的A 節(jié)點,代表我們希望向其推薦資源的學(xué)習(xí)者。初始時,對于與節(jié)點A相連接的所有節(jié)點(右側(cè)的學(xué)習(xí)資源)都賦予一個單元的信息量,即D、E 節(jié)點上的信息量為1。然后這兩個節(jié)點以連邊為傳播路徑,向相鄰節(jié)點(左側(cè)代表學(xué)習(xí)者的節(jié)點)傳播信息,這一過程為第一階段傳播,此階段過后學(xué)習(xí)者節(jié)點上會累積一定量的信息。而這些學(xué)習(xí)者節(jié)點(排除A 節(jié)點)上信息量的多少,反映出了他們與A 學(xué)習(xí)者曾經(jīng)選擇過相同學(xué)習(xí)資源的度量,這在一定程度上可以體現(xiàn)他們與A 學(xué)習(xí)者興趣的相似性。

        圖1 二部圖網(wǎng)絡(luò)示意圖

        通常情況下,人們更傾向于接受與自己興趣相似者的建議。因此,如果某些學(xué)習(xí)資源是其他相似興趣學(xué)習(xí)者選擇過但A 學(xué)習(xí)者尚未選擇過的,那么將適合將其推薦給A。而這些學(xué)習(xí)者與A學(xué)習(xí)者的興趣相似性,可以由第一傳播階段結(jié)束時他們所代表節(jié)點上的信息量多少來體現(xiàn)。因此,直接將這些節(jié)點上的信息,以相應(yīng)的量額傳播到代表學(xué)習(xí)資源的另一側(cè),就等效于將他們曾經(jīng)選擇過的學(xué)習(xí)資源賦予相應(yīng)的推薦可性度。最后對右側(cè)的學(xué)習(xí)資源節(jié)點,根據(jù)其所獲取信息量的多少進行排序,然后排除掉學(xué)習(xí)者原本已選擇過的節(jié)點,排序靠前的節(jié)點就可以作為可性度高的節(jié)點推薦給學(xué)習(xí)者A。

        以圖1為例,在整個二部圖的信息擴散過程中,各階段的數(shù)據(jù)描述如下。

        在初始階段:因為D和E節(jié)點與A節(jié)點相連接,所以D、E節(jié)點上的信息量被置為單位1。而F、G節(jié)點并未直接與A相連接,因此他們上的信息量為0。

        在第一傳播階段:該階段中,信息從右側(cè)代表學(xué)習(xí)資源的節(jié)點傳播到左側(cè)代表學(xué)習(xí)者的節(jié)點,該過程結(jié)束時,A、B、C 這3 個節(jié)點上的信息量分別為4/3、1/3、1/3。

        在第二傳播階段:該階段中,信息從左側(cè)代表學(xué)習(xí)者的節(jié)點傳播到右側(cè)代表學(xué)習(xí)資源的節(jié)點,該過程結(jié)束時,D、E、F、G 節(jié)點上信息量分別為2/3、17/18、1/9、5/18。排除掉學(xué)習(xí)者A 原本就已經(jīng)選擇過的資源D 和E,G 節(jié)點上的信息量最大,因此如果需要為學(xué)習(xí)者A推薦一個最合適的資源,那么就是G資源節(jié)點。

        2 基于標簽的三部圖學(xué)習(xí)資源個性化推薦算法

        2.1 融合學(xué)習(xí)資源標簽的三部圖

        前述基于二部圖網(wǎng)絡(luò)的信息擴散推薦算法,可以較為有效地為學(xué)習(xí)者進行個性化學(xué)習(xí)資源推薦,并且思路簡潔、過程簡單、適合于高數(shù)據(jù)量并行計算。但與協(xié)同過濾算法類似,該算法在一定程度上存在“冷啟動”問題。對于希望接收推薦的學(xué)習(xí)者,如果其選擇過的資源沒有或者較少地被其他學(xué)習(xí)者選擇,則二部圖推薦算法中的第二傳播過程將會受到影響。特別是當(dāng)被推薦者的歷史選擇資源為冷門資源時,這種情況更為突出。也就是說,如果二部圖網(wǎng)絡(luò)的連邊較為稀疏,將可能會影響到推薦項目的有效性。

        通過對二部圖網(wǎng)絡(luò)的推薦過程進行分析可知,為了能在一定程度上緩解網(wǎng)絡(luò)稀疏所帶來的問題,一種可行的方法是增加初始傳播階段結(jié)束時具備信息節(jié)點的數(shù)量,也就是增加被推薦者歷史選擇資源的影響面。假如該類節(jié)點數(shù)量較為豐富,那么通過第一階段的信息傳播,能夠找到具有相似興趣學(xué)習(xí)者的概率就較大,從而使最終涵蓋的備選推薦資源就更為豐富。對該假設(shè),最為關(guān)鍵的就是增加初始信息傳播節(jié)點的數(shù)量。很明顯,通過已有的選擇關(guān)系(即連邊)無法解決,因為缺少的就是這種連邊信息。不過結(jié)合目前互聯(lián)網(wǎng)上的數(shù)據(jù)特點,可以從“標簽”信息著手。

        與互聯(lián)網(wǎng)上的其他資源類似,相當(dāng)多的在線學(xué)習(xí)資源通常也具有一定的標簽信息。例如:對某個關(guān)于勾股定理的學(xué)習(xí)材料,可能的標簽就會有“勾股定理””或“幾何”;對有關(guān)慣性的物理學(xué)科資源,可能的標簽就會有“牛頓定理”或“慣性”。這些為資源打上的標簽,可以理解為以一種簡潔的方式對資源的類別或者屬性進行的描述。而具有相似類別或?qū)傩缘馁Y源,也更可能會被標注上相似或者相同的標簽。如果從標簽信息進行擴展,那么即便對某個僅被選擇過一次的學(xué)習(xí)資源,也能夠通過其對應(yīng)的標簽擴展到其他資源。而這種擴展過程并不需要通過其他學(xué)習(xí)者的“選擇過程”來協(xié)同地實現(xiàn),這也就緩解了連邊稀疏所帶來的問題。

        根據(jù)以上思想,可以將傳統(tǒng)的二部圖網(wǎng)絡(luò)進行擴展,加入一個標簽層形成一個三部圖網(wǎng)絡(luò)結(jié)構(gòu)。如圖2所示,從左向右分別是三部圖網(wǎng)絡(luò)的學(xué)習(xí)者層、學(xué)習(xí)資源層以及標簽層。如果一個學(xué)習(xí)資源具備某個標簽,則該資源節(jié)點就與標簽層中對應(yīng)的節(jié)點產(chǎn)生連邊關(guān)系。由于標簽是對學(xué)習(xí)資源地一種標注,因此標簽節(jié)點僅與學(xué)習(xí)資源節(jié)點產(chǎn)生連接關(guān)系。在該網(wǎng)絡(luò)中,標簽層及其與學(xué)習(xí)資源層連邊的作用,主要是對學(xué)習(xí)者選擇過節(jié)點的覆蓋面進行擴充。從本質(zhì)上而言,這種通過“標簽”對節(jié)點覆蓋面的擴展,是一種間接的擴展,它雖然不能直接體現(xiàn)被推薦者的歷史選擇情況,但是卻可以從側(cè)面依據(jù)被推薦者的興趣增大初始關(guān)注資源的范圍。

        圖2 三部圖網(wǎng)絡(luò)示意圖

        2.2 基于標簽的三部圖推薦算法

        融合標簽信息構(gòu)建出三部圖網(wǎng)絡(luò)后,可以對二部圖信息擴散推薦算法進行改進,形成基于標簽的三部圖推薦算法。對于該算法而言,左側(cè)學(xué)習(xí)者節(jié)點與學(xué)習(xí)資源節(jié)點之間的信息傳播過程與二部圖推薦算法相同。其改進之處主要在于,在正式進行信息擴散前,加入了一個初始信息預(yù)分配過程。

        在圖2 的示例中,依然假設(shè)A 節(jié)點為希望向其推薦資源的學(xué)習(xí)者節(jié)點。并且,為了體現(xiàn)標簽對資源的擴展作用,示例圖中刪除了E節(jié)點(代表學(xué)習(xí)者A曾經(jīng)選擇過的學(xué)習(xí)資源節(jié)點)與其他節(jié)點的連邊,使網(wǎng)絡(luò)變得更為稀疏(圖2中刪除的邊用虛線表示)。

        對改進后的算法,由于其對學(xué)習(xí)者節(jié)點與學(xué)習(xí)資源節(jié)點之間的信息傳播過程未做本質(zhì)改變,因此該文主要對初始信息預(yù)分配過程進行描述。

        初始信息預(yù)分配過程包含兩部分,具體敘述如下。

        第一,為學(xué)習(xí)者A 節(jié)點所選擇過的學(xué)習(xí)資源分配初始信息,也就是對于與A 節(jié)點相連的資源節(jié)點均賦予單位信息量1。在圖示中即對D、E 節(jié)點賦予信息量1。

        第二,通過標簽信息對學(xué)習(xí)資源層中節(jié)點的信息量進行擴展,該過程本質(zhì)上是在學(xué)習(xí)資源層與標簽層之間加入了一個局部的信息擴散過程。對于第一部分中獲得信息的節(jié)點,使其承載的信息,能夠通過標簽節(jié)點(該過程中標簽節(jié)點作為中間過渡)傳播到其他資源節(jié)點上去。

        圖2中,假設(shè)E 節(jié)點和G節(jié)點的標簽相同(即他們都與標簽層中的H節(jié)點相連接)、D節(jié)點和F節(jié)點的標簽相同(即他們都與標簽層中的I節(jié)點相連接)。以資源節(jié)點E上的單位信息量為初始信息,沿著標簽連邊進行擴散。此階段結(jié)束后,節(jié)點G上的的信息量為1/2;同理,節(jié)點F上的信息量也為1/2。然后標簽節(jié)點上的信息反向傳播到學(xué)習(xí)資源節(jié)點上,此階段中信息將會傳播到其他相關(guān)節(jié)點上,即起到了初始信息擴展的目的。

        完成初始信息預(yù)分配過程后,后續(xù)的信息傳播過程就僅限定在學(xué)習(xí)者節(jié)點層與學(xué)習(xí)資源節(jié)點層之間,也就是與經(jīng)典的二部圖信息傳播算法相同。完成整個傳播過程后,學(xué)習(xí)資源節(jié)點上的信息量構(gòu)成的向量為[3/2,3/2,3/8,5/8],排除掉A學(xué)習(xí)者已經(jīng)選擇的節(jié)點,剩余節(jié)點中信息量最大的是G 節(jié)點,即G 可以作為需要推薦的資源節(jié)點。

        從示例中可以看出,D、E 節(jié)點并未與除A 節(jié)點之外的其他學(xué)習(xí)者節(jié)點相連。那么如果不加入標簽層進行信息擴展,那么D、E 節(jié)點上的信息量將不可能傳播到其他節(jié)點上去,也就無法實現(xiàn)推薦其他資源的目的。但通過“標簽”三部圖改進后的算法可以對信息傳播的過程進行強化,進而增加最終可推薦資源節(jié)點的數(shù)量,這也體現(xiàn)了本算法在緩解稀疏網(wǎng)絡(luò)所存在問題方面所起的作用。

        2.3 影響算法有效性的因素及應(yīng)對策略

        上述基于三部圖的個性化推薦算法,通過引入“標簽”信息,將經(jīng)典的二部圖信息擴散推薦算法進行了改進。該算法的一個特點是對獲得初始信息節(jié)點的廣度進行了擴展,可以緩解常規(guī)推薦算法在稀疏網(wǎng)絡(luò)上所存在的問題。因此,所擴展信息的合理性,在很大程度上決定了算法的有效性。

        由算法的原理可知,標簽信息是否準確直接決定了初始信息節(jié)點的選擇是否準確。由于互聯(lián)網(wǎng)的開放性,網(wǎng)絡(luò)上學(xué)習(xí)資源的標簽也一般由用戶或資源瀏覽者自行標注,因此存在多樣性以及標準不唯一的特點,這在很大程度上會影響該文算法的有效性。

        為了盡可能地保障算法的有效性,可以構(gòu)建一個標簽數(shù)據(jù)庫,該數(shù)據(jù)庫提前收集整理好常見標簽,并預(yù)設(shè)好各種標簽可能的同義詞或近義詞等關(guān)系。基于該標簽數(shù)據(jù)庫,對學(xué)習(xí)資源上的標簽數(shù)據(jù)進行預(yù)處理,剔除錯誤標簽、規(guī)范不合理標簽以及融合同義詞標簽。在進行融合同義詞標簽操作時,可以根據(jù)同義詞進行歸并性融合。如果是近義詞標簽,則可以在標簽之間構(gòu)建連邊,連邊的權(quán)值可參考近義詞的相似度值來設(shè)定。

        3 學(xué)習(xí)資源個性化推薦算法的應(yīng)用場景分析

        學(xué)習(xí)資源是在線學(xué)習(xí)的基礎(chǔ)性物質(zhì)條件,基于個性化的學(xué)習(xí)資源推薦技術(shù)則可以衍生出豐富的教育學(xué)應(yīng)用。

        目前,自主學(xué)習(xí)和終生學(xué)習(xí)成為一種必然趨勢,這種學(xué)習(xí)形式與傳統(tǒng)學(xué)歷教育的區(qū)別在于它不適合采用統(tǒng)一的課堂教學(xué)形式,更多的是應(yīng)用在線學(xué)習(xí)的方式,并且每個學(xué)習(xí)者的基礎(chǔ)和需求都不盡相同。對每個學(xué)習(xí)者而言,網(wǎng)絡(luò)上海量的學(xué)習(xí)資源大概率包含他們所需要的內(nèi)容,真正困難的不是缺乏資源而是如何準確地找到合適的資源,而這正是學(xué)習(xí)資源個性化推薦算法適合解決的問題。利用學(xué)習(xí)資源個性化推薦技術(shù),學(xué)習(xí)者就能獲取到自己感興趣的資料。

        另外,隨著學(xué)習(xí)過程的深入,學(xué)習(xí)者的興趣會逐漸發(fā)生改變,相應(yīng)的所推薦的資源也會發(fā)生變化。如果在學(xué)習(xí)系統(tǒng)中對這種所推薦資源的變遷進行跟蹤,就可以勾勒出學(xué)習(xí)者的學(xué)習(xí)路徑。如果結(jié)合學(xué)習(xí)效果,就可以抽取出成功學(xué)習(xí)者的學(xué)習(xí)路徑。很明顯,成功者的學(xué)習(xí)路徑是一種珍貴的資源,可以將其作為參考指導(dǎo)處于迷茫狀態(tài)的其他學(xué)習(xí)者,使其更快地進入正確的學(xué)習(xí)路徑中來,不至于陷入學(xué)習(xí)誤區(qū)。

        4 結(jié)語

        面對互聯(lián)網(wǎng)上海量的學(xué)習(xí)資源,如何為學(xué)習(xí)者提供一種個性化推薦方法,使其能準確、快速地找到符合其興趣的內(nèi)容,是開展個性化學(xué)習(xí)的基礎(chǔ)性條件。該文對數(shù)字化學(xué)習(xí)資源上的標簽信息加以利用,結(jié)合二部圖網(wǎng)絡(luò)信息擴散推薦算法特點,探討了一種融合標簽信息的三部圖個性化推薦算法。該算法通過標簽信息,將被推薦者的歷史選擇信息進行擴展,為緩解推薦算法中的數(shù)據(jù)稀疏問題提供了一種思路?;谶@種個性化推薦技術(shù),既可以為學(xué)習(xí)者檢索資源提供便利,也可以在學(xué)習(xí)路徑規(guī)劃、自主學(xué)習(xí)引導(dǎo)等上層個性化學(xué)習(xí)應(yīng)用提供基礎(chǔ)性技術(shù)支持。

        猜你喜歡
        資源信息
        讓有限的“資源”更有效
        基礎(chǔ)教育資源展示
        一樣的資源,不一樣的收獲
        資源回收
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        資源再生 歡迎訂閱
        資源再生(2017年3期)2017-06-01 12:20:59
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        對你有用的“錢”在資源
        職場(2009年4期)2009-01-01 00:00:00
        信息
        健康信息
        祝您健康(1987年3期)1987-12-30 09:52:32
        亚洲精品一区二区视频| 国产主播在线 | 中文| 久九九久视频精品网站| 久久久大少妇免费高潮特黄| 中文区中文字幕免费看| 国产精品自在线拍国产| 精品国产高清一区二区广区| 男女男生精精品视频网站| 国产一区二区精品亚洲| 欧美一区二区三区视频在线观看| 欧美黑人疯狂性受xxxxx喷水| 午夜爽毛片| 国产免费人成视频在线观看| 久人人爽人人爽人人片av| 玩两个丰满老熟女| 黄 色 成 年 人 网 站免费| av在线免费观看麻豆| 人妻少妇乱子伦无码视频专区| 76少妇精品导航| 最新永久免费AV网站| 日韩高清不卡一区二区三区| 欧洲美女黑人粗性暴交| 热99re久久精品这里都是精品免费 | 免费一级a毛片在线播出| 熟女少妇精品一区二区三区| 超碰97人人射妻| 久久婷婷色综合一区二区| 绿帽人妻被插出白浆免费观看| 男女啪啪视频高清视频| 日本乱偷人妻中文字幕在线| 久久无码高潮喷水免费看| 99亚洲女人私处高清视频| 国产精品99精品久久免费| 久久久久亚洲av无码网站| 色综合久久五月天久久久| 国产亚洲精品av久久| 一本一道久久综合狠狠老| 国产精品激情综合久久| 夜夜高潮夜夜爽免费观看| 国产人妻久久精品二区三区老狼| 中文字幕亚洲综合久久菠萝蜜|