李悅+孫健+邱志祺
摘 要: 通過對目前我國信息化的發(fā)展現(xiàn)狀及問題進行詳細分析,找到基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘技術與我國各單位信息管理中的契合點,提出了基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘技術系統(tǒng)的設計方案。該方案有助于我國各單位優(yōu)化資源配置,促進領導的決策合理性,進而對于提高我國各單位的綜合實力,推動全面發(fā)展具有很強的現(xiàn)實意義。
關鍵詞: 數(shù)據(jù)挖掘; 信息管理系統(tǒng); 關聯(lián)規(guī)則; 分類挖掘
中圖分類號: TN911?34 文獻標識碼: A 文章編號: 1004?373X(2016)23?0121?03
Application and research on data mining technology based on association rules
LI Yue1, SUN Jian2, QIU Zhiqi3
(1. Modern Technology and Education Center, North China University of Science and Technology, Tangshan 063000, China;
2. Dean′s Office, North China University of Science and Technology, Tangshan 063000, China;
3. College of Information Engineering, North China University of Science and Technology, Tangshan 063000, China)
Abstract: The information development situation in our country and its problems are analyzed in detail. The integrating point of data mining technology based on association rules and information management in China′s each unit is found out. The design scheme of data mining technology system based on association rules is proposed. This scheme is helpful to optimize the resource allocation of all units in China, promote the decision?making rationality of the leader, and has great practical significance to improve the comprehensive strength of all units in China and promote the comprehensive development.
Keywords: data mining; information management system; association rule; classification mining
0 引 言
隨著信息技術在各單位信息管理中應用的逐漸普及,信息管理系統(tǒng)中積累了海量的數(shù)據(jù),本文以我國高校為例,深刻研究了高校信息管理系統(tǒng),在管理信息化的條件下,對這些長期積累的海量數(shù)據(jù)進行分析和挖掘,挖掘出其中隱藏的、未知的規(guī)則和信息,將分析結果用于高校管理的分析與決策上,輔助管理者的決策,還可以為我國高校優(yōu)化資源配置提供可靠的數(shù)據(jù),節(jié)約成本,為我國高校的發(fā)展發(fā)揮著重要的作用。
1 數(shù)據(jù)挖掘的定義及技術分析
1.1 數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘技術是一門新興學科,集眾多學科交叉融合而成的工具和技術,其中包含了數(shù)據(jù)庫技術、統(tǒng)計學、人工智能、信息檢索、模式識別等多種技術。數(shù)據(jù)挖掘(Data Mining)是指從海量的數(shù)據(jù)或數(shù)據(jù)庫中分析和提取出人們感興趣的知識的過程。這些數(shù)據(jù)知識是隱含的、事先未知的,將數(shù)據(jù)挖掘技術應用到高校信息管理上是非常有益的,可以全面地分析課程設置,教學過程等各方面因素的內在聯(lián)系,是一種決策支持的過程。
1.2 關聯(lián)規(guī)則分析
數(shù)據(jù)挖掘的技術方法有很多種,其中關聯(lián)規(guī)則挖掘是目前使用頻率最多,應用范圍最廣的數(shù)據(jù)挖掘技術之一。關聯(lián)規(guī)則反應了事物與其他事物之間的相互依存性和關聯(lián)性,可以通過研究分析海量數(shù)據(jù),捕捉其中的相互關聯(lián)和重要關系,反應數(shù)據(jù)的不同規(guī)律,預測時間的發(fā)展趨勢。關聯(lián)規(guī)則是易于理解和解釋的一種技術,應用分析廣泛,是許多其他數(shù)據(jù)挖掘方法的基礎。
其中,Apriori算法是關聯(lián)規(guī)則挖掘方面很有影響力的算法,通過項目集元素數(shù)目的不斷增長來逐步完成頻繁項目集的發(fā)現(xiàn),是挖掘產生布爾關聯(lián)規(guī)則所需頻繁項集的基本算法。利用Apriori算法迭代識別所有的頻繁項目集,發(fā)現(xiàn)計算量最大的部分,從頻繁項目集中構造置信度不低于用戶設定的最小置信度的規(guī)則。具體算法流程如圖1所示。
2 數(shù)據(jù)挖掘技術在高校管理中的應用
數(shù)據(jù)挖掘技術應用到高校管理工作中,可以通過對信息系統(tǒng)中的海量數(shù)據(jù)的相互之間的關系進行分析,發(fā)現(xiàn)其中一些潛在的聯(lián)系和客觀規(guī)律,可以對高校管理的決策支持等工作提供極大的幫助,為改進高校管理提出了指導性的建議,使得高校管理系統(tǒng)在高校信息化的建設中發(fā)揮更大的作用。
2.1 數(shù)據(jù)挖掘技術在教學評估中的應用
高校員工的評價結果是日常工作情況的重要表現(xiàn),是高校信息管理工作的一個重要組成部分,也是目前高校進行職稱評定,績效評定的有效標準。但是影響高校員工的評價因素有很多,包括員工年齡、工作時間、政治面貌、學歷、職稱等很多方面。如何通過這些現(xiàn)有數(shù)據(jù)判斷哪些或者哪個因素對于高校員工考評的影響最大,可以通過關聯(lián)規(guī)則數(shù)據(jù)挖掘的Apriori算法進行數(shù)據(jù)分析,對各方面的數(shù)據(jù)進行充分挖掘,得到有價值的信息作為高校員工考評的評價依據(jù),以達到對高校員工管理的改進的有效支持,極大地提高了高校人事管理的效率,使高校實現(xiàn)科學化、正規(guī)化管理。
摘 要: 通過對目前我國信息化的發(fā)展現(xiàn)狀及問題進行詳細分析,找到基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘技術與我國各單位信息管理中的契合點,提出了基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘技術系統(tǒng)的設計方案。該方案有助于我國各單位優(yōu)化資源配置,促進領導的決策合理性,進而對于提高我國各單位的綜合實力,推動全面發(fā)展具有很強的現(xiàn)實意義。
關鍵詞: 數(shù)據(jù)挖掘; 信息管理系統(tǒng); 關聯(lián)規(guī)則; 分類挖掘
中圖分類號: TN911?34 文獻標識碼: A 文章編號: 1004?373X(2016)23?0121?03
Application and research on data mining technology based on association rules
LI Yue1, SUN Jian2, QIU Zhiqi3
(1. Modern Technology and Education Center, North China University of Science and Technology, Tangshan 063000, China;
2. Dean′s Office, North China University of Science and Technology, Tangshan 063000, China;
3. College of Information Engineering, North China University of Science and Technology, Tangshan 063000, China)
Abstract: The information development situation in our country and its problems are analyzed in detail. The integrating point of data mining technology based on association rules and information management in China′s each unit is found out. The design scheme of data mining technology system based on association rules is proposed. This scheme is helpful to optimize the resource allocation of all units in China, promote the decision?making rationality of the leader, and has great practical significance to improve the comprehensive strength of all units in China and promote the comprehensive development.
Keywords: data mining; information management system; association rule; classification mining
0 引 言
隨著信息技術在各單位信息管理中應用的逐漸普及,信息管理系統(tǒng)中積累了海量的數(shù)據(jù),本文以我國高校為例,深刻研究了高校信息管理系統(tǒng),在管理信息化的條件下,對這些長期積累的海量數(shù)據(jù)進行分析和挖掘,挖掘出其中隱藏的、未知的規(guī)則和信息,將分析結果用于高校管理的分析與決策上,輔助管理者的決策,還可以為我國高校優(yōu)化資源配置提供可靠的數(shù)據(jù),節(jié)約成本,為我國高校的發(fā)展發(fā)揮著重要的作用。
1 數(shù)據(jù)挖掘的定義及技術分析
1.1 數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘技術是一門新興學科,集眾多學科交叉融合而成的工具和技術,其中包含了數(shù)據(jù)庫技術、統(tǒng)計學、人工智能、信息檢索、模式識別等多種技術。數(shù)據(jù)挖掘(Data Mining)是指從海量的數(shù)據(jù)或數(shù)據(jù)庫中分析和提取出人們感興趣的知識的過程。這些數(shù)據(jù)知識是隱含的、事先未知的,將數(shù)據(jù)挖掘技術應用到高校信息管理上是非常有益的,可以全面地分析課程設置,教學過程等各方面因素的內在聯(lián)系,是一種決策支持的過程。
1.2 關聯(lián)規(guī)則分析
數(shù)據(jù)挖掘的技術方法有很多種,其中關聯(lián)規(guī)則挖掘是目前使用頻率最多,應用范圍最廣的數(shù)據(jù)挖掘技術之一。關聯(lián)規(guī)則反應了事物與其他事物之間的相互依存性和關聯(lián)性,可以通過研究分析海量數(shù)據(jù),捕捉其中的相互關聯(lián)和重要關系,反應數(shù)據(jù)的不同規(guī)律,預測時間的發(fā)展趨勢。關聯(lián)規(guī)則是易于理解和解釋的一種技術,應用分析廣泛,是許多其他數(shù)據(jù)挖掘方法的基礎。
其中,Apriori算法是關聯(lián)規(guī)則挖掘方面很有影響力的算法,通過項目集元素數(shù)目的不斷增長來逐步完成頻繁項目集的發(fā)現(xiàn),是挖掘產生布爾關聯(lián)規(guī)則所需頻繁項集的基本算法。利用Apriori算法迭代識別所有的頻繁項目集,發(fā)現(xiàn)計算量最大的部分,從頻繁項目集中構造置信度不低于用戶設定的最小置信度的規(guī)則。具體算法流程如圖1所示。
2 數(shù)據(jù)挖掘技術在高校管理中的應用
數(shù)據(jù)挖掘技術應用到高校管理工作中,可以通過對信息系統(tǒng)中的海量數(shù)據(jù)的相互之間的關系進行分析,發(fā)現(xiàn)其中一些潛在的聯(lián)系和客觀規(guī)律,可以對高校管理的決策支持等工作提供極大的幫助,為改進高校管理提出了指導性的建議,使得高校管理系統(tǒng)在高校信息化的建設中發(fā)揮更大的作用。
2.1 數(shù)據(jù)挖掘技術在教學評估中的應用
高校員工的評價結果是日常工作情況的重要表現(xiàn),是高校信息管理工作的一個重要組成部分,也是目前高校進行職稱評定,績效評定的有效標準。但是影響高校員工的評價因素有很多,包括員工年齡、工作時間、政治面貌、學歷、職稱等很多方面。如何通過這些現(xiàn)有數(shù)據(jù)判斷哪些或者哪個因素對于高校員工考評的影響最大,可以通過關聯(lián)規(guī)則數(shù)據(jù)挖掘的Apriori算法進行數(shù)據(jù)分析,對各方面的數(shù)據(jù)進行充分挖掘,得到有價值的信息作為高校員工考評的評價依據(jù),以達到對高校員工管理的改進的有效支持,極大地提高了高校人事管理的效率,使高校實現(xiàn)科學化、正規(guī)化管理。
IF期末成績等級=B,AND平時成績等級=C,THEN是否優(yōu)秀=N;
從上面的生成規(guī)則可以看出:期末考試成績等級為A,且平時成績等級為B以上者,成績?yōu)閮?yōu)秀。
(4) 生成分類規(guī)則
通過對學生成績進行數(shù)據(jù)挖掘,找出影響學生成績的主要因素以及之間的關系,為教學管理部門提供高校教學中學生的知識、技能、能力之間的關系,以明確今后學生學習的重點和難點。
2.3 數(shù)據(jù)挖掘技術在高校課程設置中的應用
目前,高校學生的課程安排是相互聯(lián)系的,是循序漸進的。在學習專業(yè)課前,要將先開設的課程學好,才能繼續(xù)下面課程的學習。如果先開設的課程沒有學好,就會影響后面課程的學習。另外,由于授課教師,班級學生的總體成績等因素,學生的成績有時會相差很大。教務管理人員和任課教師可以利用關聯(lián)規(guī)則對課程數(shù)據(jù)進行挖掘分析,發(fā)現(xiàn)數(shù)據(jù)中隱藏的前期課程和后期課程的相互關聯(lián),為今后課程進程的開展提供重要的決策和理論支持。
可以通過查找存在于項目集合或者對象集合之間的頻繁模式,查到相關性或者因果結構,是當前數(shù)據(jù)挖掘研究的主要模式之一,確定數(shù)據(jù)中不同領域之間的聯(lián)系,利用關聯(lián)規(guī)則分析課程安排的不同順序與學生最終取得考試成績之間的關聯(lián)關系,從而得出教學計劃中的課程安排的順序與學生的考試成績之間的關系,得出教學計劃中課程之間的關系,進而合理設置專業(yè)課程。
3 結 語
如今,數(shù)據(jù)挖掘技術在高校信息管理領域中的應用日益廣泛,也已經(jīng)取得了一定的成績。但是,還存在著一些不足,需要進一步的完善。主要包括以下方面的研究:首先,挖掘工具要更標準,使用更便捷。目前,挖掘工具都是針對某一具體的高校信息系統(tǒng),而沒有統(tǒng)一規(guī)范化的適用于所有系統(tǒng)的工具。這種情況不便于使用者更好更快地掌握,給推廣挖掘工具的工作帶來了困難。其次,挖掘工具操作復雜,只有從事信息工作方面的人員才能使用自如,對于廣大普通管理者和從事信息管理的管理者來說掌握起來需要花費很長的時間。所以,研究一種簡單、友好、方便快捷,并且通用的挖掘工具是目前高校信息處理工作的研究重點。
參考文獻
[1] 朱鐵櫻,駱爽.數(shù)據(jù)挖掘技術在高校管理決策中的應用[J].計算機時代,2015(3):39?43.
[2] 朱麗麗.基于數(shù)據(jù)挖掘技術的高校教務管理的應用與研究[J].數(shù)字技術與應用,2014(31):239?240.
[3] 江敏,徐艷.數(shù)據(jù)挖掘技術在高校教學管理中的應用[J].電腦知識與技術,2012(24):541?545.
[4] 呂慎敏.基于數(shù)據(jù)挖掘的高校教學管理決策支持系統(tǒng)研究[D].濟南:山東師范大學,2012.
[5] 楊恩震.淺論計算機技術在教學管理中的運用[J].湖北函授大學學報,2012,25(2):28?29.
[6] 高曉佳.數(shù)據(jù)挖掘在教育信息化中的應用研究[J].電腦知識與技術,2012,8(5):1199?1200.
[7] 孫中祥,彭湘君,楊玉平,等.數(shù)據(jù)挖掘在教育教學中的應用綜述[J].智能計算機與應用,2012,2(1):78?81.
[8] 張海燕,李娟.B/S 架構的高校教學管理系統(tǒng)研究與開發(fā)[J].農業(yè)網(wǎng)絡信息,2012(1):109?111.