亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘技術(shù)在高校教學實踐中的應用

        2015-03-09 11:02:26
        物理實驗 2015年3期
        關鍵詞:決策樹數(shù)據(jù)挖掘

        姜 蕓

        (西安交通大學 理學院,陜西 西安 710049)

        數(shù)據(jù)挖掘技術(shù)在高校教學實踐中的應用

        姜蕓

        (西安交通大學 理學院,陜西 西安 710049)

        摘要:闡述了經(jīng)典的決策樹ID3算法,并利用該算法對高校大學物理實驗課程學生成績進行數(shù)據(jù)挖掘,從中提取有價值的信息,并對得到的結(jié)果進行分析,得出了影響學生成績的原因,為提高高校教學管理水平提供了依據(jù).

        關鍵詞:數(shù)據(jù)挖掘;決策樹;ID3算法

        1引言

        當今社會,人們利用高速發(fā)展的信息技術(shù)得到了大量數(shù)據(jù),在給生活提供方便的同時,也帶來了一些問題,由于積累的數(shù)據(jù)不斷增多,對所隱藏的數(shù)據(jù)知識挖掘方法知道的又比較少,使得數(shù)據(jù)囤積量大爆炸,盡管數(shù)據(jù)庫在技術(shù)上不斷成熟,可是卻沒有充分地發(fā)揮與利用數(shù)據(jù)庫里蘊含的豐富的知識和信息. 由于現(xiàn)代社會數(shù)據(jù)庫的量以幾何狀態(tài)不斷地增長[1],要在數(shù)據(jù)的汪洋中對信息去粗存精、去偽存真,靠傳統(tǒng)方法是不行的,要想高效地管理、組織這些數(shù)據(jù)并對其進行分析和應用并非是一件易事,這就要求計算機系統(tǒng)能夠提供更高層次的數(shù)據(jù)分析,而數(shù)據(jù)挖掘是最有效的方法. 數(shù)據(jù)挖掘(Data mining)則是知識發(fā)現(xiàn)(KDD)的核心部分,它指的是從數(shù)據(jù)集合中自動抽取隱藏在數(shù)據(jù)中的有用信息的非平凡過程,這些信息的表現(xiàn)形式為:規(guī)則、概念、規(guī)律及模式等. 數(shù)據(jù)挖掘融合了數(shù)據(jù)庫、人工智能、機器學習、統(tǒng)計學、高性能計算、模式識別、神經(jīng)網(wǎng)絡、數(shù)據(jù)可視化、信息檢索和空間數(shù)據(jù)分析等多個領域的理論和技術(shù). 進入21世紀,數(shù)據(jù)挖掘已經(jīng)成為一門比較成熟的交叉學科,并且數(shù)據(jù)挖掘技術(shù)也伴隨著信息技術(shù)的發(fā)展日益成熟起來.

        2數(shù)據(jù)挖掘在高校教學實踐中的初步應用

        在高等學校教學實踐中,學生是主體,存在著學生學籍管理、教學儀器管理,以及教師對學生課程管理、成績管理等各種數(shù)據(jù)系統(tǒng). 在這些數(shù)據(jù)庫中存儲了大量的數(shù)據(jù),然而隱藏在這些數(shù)據(jù)背后的信息一直未得到開發(fā)應用. 學生是學校的核心,學生的學習成績作為一種總結(jié)性評價,能反映出他們的知識掌握情況和相應知識技能的獲得情況,學習成績是加權(quán)綜合值,它不僅包括書面考試成績,而且還包括人文的考核項目,比如出勤率、課堂表現(xiàn)、各種活動等. 學生成績不僅對學生的學習效果和教師的教學效果具有檢測作用,而且還能反饋教學活動,反作用于教師的教和學生的學. 在高校的教務數(shù)據(jù)庫中學生成績記錄非常龐大,對學生成績的評定分2種:一種是定量評價,一種是定性評價. 定量評價也就是平時所說的某門課程考了多少分,而定性評價一般分優(yōu)、良、中、差等4個級別. 僅僅從單獨一門課進行分析,很少關注到學生取得這些成績背后的影響因素和原因. 數(shù)據(jù)庫是從定性的角度分析學生成績,缺點是得到的結(jié)果不精確;而數(shù)據(jù)倉庫是從定量的角度對學生成績進行分析,能精確地得到各個方面的數(shù)據(jù). 因此使用數(shù)據(jù)庫和數(shù)據(jù)挖掘技術(shù)對學生成績進行深層的分析,挖掘出隱藏在數(shù)據(jù)背后的規(guī)律或模式,根據(jù)挖掘結(jié)構(gòu)提出指導性建議,從而更好地指導教師教學,提高教學效率,進而有效地提高學生成績.

        3決策樹法中的ID3算法

        數(shù)據(jù)挖掘技術(shù)主要有集合論法、決策樹法、遺傳算法、神經(jīng)網(wǎng)絡方法等. 決策樹法又分為ID3算法、CLS算法、IBLE算法等. ID3算法(Iterative Dichotomiser 3)是由Ross Quinlan首先提出的[2],該算法是以信息論為基礎,以信息熵和信息增益度為衡量標準[3],實現(xiàn)對數(shù)據(jù)的歸納分類.

        已知有C個結(jié)果的訓練集S:

        Entropy(S)=∑-p(I)log2p(I).

        (1)

        這里p(I)是屬于類I的S的比例. ∑是對C求和. log2以2為底的對數(shù).

        如果所有S屬于相同的類,熵為 0(數(shù)據(jù)分類完畢),熵的范圍是 0(分類完畢)到 1(完全隨機). 注意:S不但是屬性而且也是整個樣本集.

        (2)

        Gain(S,A) 是屬性A在集S上的信息增益,定義為:

        Gain(S,A) = Entropy(S)-Entropy(S,A) .

        (3)

        Gain(S,A)是指已知屬性A的值后導致熵的減少. Gain(S,A)越大,說明選擇測試屬性A對分類提供的信息越多.

        4實例分析

        通過對大學物理實驗課程學生成績評定的典型實例,說明數(shù)據(jù)挖掘的步驟及決策樹方法在高校教學實踐中的應用.

        4.1 分析對象

        大學物理實驗課程基本每學年考核1次,考評由3部分組成:課內(nèi)教學、課后實驗報告及每學年期末考核. 整個實驗課程成績主要依據(jù)在規(guī)定時間內(nèi)完成的課后實驗報告的內(nèi)容和質(zhì)量來決定,實驗課和期末考核作為較次要的考核內(nèi)容. 由上述物理實驗教學內(nèi)容之間的關系,可以建立數(shù)據(jù)模型:學生情況數(shù)據(jù)庫,含學號、性別、實驗報告、實驗課、期末考核、平均成績、名次等項目.

        4.2 已知條件

        選擇2個班,每班25人,對學生情況數(shù)據(jù)庫進行如下的量化、轉(zhuǎn)換、清理、集成等處理工作,得到了相應的數(shù)據(jù)庫(如表1所示).

        表1 學生情況數(shù)據(jù)庫

        學號字段定義為:1~50. 性別字段定義為:男或女. 實驗報告加分定義為:0表示沒有通過,0.5表示通過,1表示較好. 實驗課加分定義為: 0表示基本不上實驗課,0.2表示適當上實驗課,0.5表示按期上實驗課. 期末考核加分定義為: 0表示基本不參加期末考核,0.5表示參加期末考核并取得了較好的成績. 平均成績定義為:學習成績總體情況,字段值為0~100. 名次定義為1~50,且記錄按名次從高到低排列.

        4.3 數(shù)據(jù)挖掘

        應用ID3算法建立相應的決策樹,先確定正例個數(shù)p和反例個數(shù)n. 將名次排在前15名成績好的學生定義為正例,后35名成績不好的學生定義為反例,即p=15,n=35.

        為及時了解滑坡體的演化過程,準確捕捉特征信息,需對滑坡進行監(jiān)測,內(nèi)容包括地表變形、地下變形、地聲、應變、水文以及降水量、地溫等其他環(huán)境因素。眾多可測量的數(shù)據(jù)中,位移是滑坡的最直接狀態(tài)量,且施測簡單,文章介紹了位移監(jiān)測的常用方法,簡述它們的基本原理和優(yōu)缺點。

        gain(實驗報告加分)=I(p,n)-E(實加)=

        0.881-0.616=0.265,

        gain(實驗課加分)=I(p,n)-E(課加)=

        0.881-0.801=0.08,

        gain(期末考核加分)=I(p,n)-E(測加)=

        0.881-0.879=0.002.

        通過計算可知,實驗報告加分具有最大的信息增益,故將實驗報告加分選為根節(jié)點并向下擴展,最終生成的決策樹,如圖1所示.

        圖1 成績分析決策樹

        4.4 結(jié)論分析

        通過分析圖1的決策樹,可以得到以下結(jié)論:

        1)學生上完實驗課后,如按期且獨立保質(zhì)保量完成實驗報告,成績均較好.

        2)學生實驗報告完成得較好,也就是在實驗課上動手能力較強,善于思考和分析,可以看出他們在實驗的基礎上較為重視歸納和總結(jié),均沒有過重的課內(nèi)實驗壓力,其中課內(nèi)實驗課安排適度的學生學習成績也好.

        3)對于剛通過實驗報告測評的學生,情況就顯得較為復雜,要視具體情況而定,一方面學生的大作業(yè)、課內(nèi)實驗、期末考核安排合理時學習成績也好,另一方面,如果學生經(jīng)常不參加課內(nèi)實驗或不參加期末考核時,也會影響到他們的學習成績,造成學習成績不好.

        根據(jù)表1和圖1,對學生情況數(shù)據(jù)庫所建決策樹進行分析,可以初步判別:實驗報告、實驗課、期末考核是相輔相成的,互相影響和制約的,一般而言,學習成績較好的學生,其實驗課和期末考核也是積極參加者.

        這樣,教師就可以針對不同的學生進行事先輔導,使教學內(nèi)容在時間上得到延伸,學生能夠提前預習和掌握實驗教學內(nèi)容,這樣,就可以減輕學生在實驗課上的壓力,既緊張又輕松地完成預期實驗. 同時,也要看到,如果僅重視上實驗課和參加期末考核而不重視實驗報告同樣也會影響到自身的學習成績. 對于大學物理實驗這門課程,學習成績好的學生,他們的上進心、責任心也都相對較強,能夠很好地處理上述三者之間的關系;反之,對自己約束力較差、經(jīng)常不上課或不認真完成作業(yè)的學生,學習成績自然就較差.

        5數(shù)據(jù)挖掘技術(shù)在高校教學實踐中的改進與探索

        雖然數(shù)據(jù)挖掘技術(shù)在商業(yè)、醫(yī)學、科學研究等領域已有比較成功的應用,但在高校教學實踐中仍處于初級階段,其主要原因一是數(shù)據(jù)量有限,二是各學科、各院系之間缺少廣泛的數(shù)據(jù)交流. 要想更好地將數(shù)據(jù)挖掘技術(shù)應用于高校教學,筆者認為有以下幾方面需要改進與探索.

        1)在有限的數(shù)據(jù)庫中要經(jīng)常挖掘、搜集和整理有價值的數(shù)據(jù). 由于高校除了大面積教學以外,剩余主要是科研,教學環(huán)境中數(shù)據(jù)量較少,無法與商業(yè)環(huán)境中的大量數(shù)據(jù)相比,因此,要在相對有限的環(huán)境中做數(shù)據(jù)挖掘的基礎工作.

        2)各學科、各院系之間相對獨立,教師和科研人員手中的數(shù)據(jù)有的集中在學校、有的則在家里,彼此間缺少廣泛的數(shù)據(jù)交流,無法形成有效的數(shù)據(jù)鏈,這也是亟待改進的任務之一.

        3)重視人才培養(yǎng)和開發(fā). 數(shù)據(jù)挖掘技術(shù)對于人員素質(zhì)要求較高,不僅要求了解和初步掌握該技術(shù),而且還要求懂得數(shù)據(jù)定義和挖掘算法等技能,只有這樣,才能夠應用好這個工具,進而對結(jié)果做出科學的分析和評價.

        4)加強和優(yōu)化硬件環(huán)境. 數(shù)據(jù)挖掘技術(shù)的所有基礎性工作都是建立在可靠的硬件設施上的,數(shù)據(jù)挖掘需要有一定存儲量和運算能力的計算機,要有能夠提供信息傳遞和信息共享的暢通網(wǎng)絡. 目前,有些高校硬件建設尚不能滿足數(shù)據(jù)挖掘技術(shù)的進一步提升,同時內(nèi)部也未建立MIS系統(tǒng),使得信息的收集、傳遞、存貯等受到一定的影響. 相信隨著信息的不斷擴大和需求,最終一定會形成適合于數(shù)據(jù)挖掘技術(shù)的信息鏈.

        6結(jié)束語

        數(shù)據(jù)挖掘技術(shù)經(jīng)過了十幾年的充實和發(fā)展,到目前為止已經(jīng)成功地運用在各個不同的領域. 伴隨著科學技術(shù)的不斷發(fā)展和信息量的海量增加,如依靠傳統(tǒng)的方法要在龐大的數(shù)據(jù)庫中找到具有科學決策的信息是非常困難的,數(shù)據(jù)挖掘技術(shù)從大量的數(shù)據(jù)中發(fā)現(xiàn)有用的知識和線索,借助于數(shù)據(jù)挖掘本身的技術(shù)去挖掘蘊藏在數(shù)據(jù)庫中的客觀規(guī)律,從而為科學合理的決策提供有力的支持. 將數(shù)據(jù)挖掘技術(shù)引入到高校教學實踐中,一是發(fā)展的必然,二是有助于在日常教學管理中不斷獲得有規(guī)律的信息,為學校管理層提供決策依據(jù),從而不斷提高教學質(zhì)量. 本文通過對大學物理實驗課程學生成績評定的實例分析,簡述了數(shù)據(jù)挖掘技術(shù)在分析影響學生

        參考文獻:

        [1]路延. 數(shù)據(jù)挖掘技術(shù)在高等學校教學中的應用研究[J]. 科技資訊,2013(13):201.

        [2]王惠中,彭安群. 數(shù)據(jù)挖掘研究現(xiàn)狀及發(fā)展趨勢[J]. 工礦自動化,2011(2):29-32.

        [3]王小巍,蔣玉明. 決策樹ID3算法的分析與改進[J]. 計算機工程與設計,2011,32(9):3069-3072,3076.

        [責任編輯:尹冬梅]

        Application of data mining in university teaching practices

        JIANG Yun

        (School of Science, Xi’an Jiaotong University, Xi’an 710049, China)

        Abstract:A classical method-decision tree ID3 was expounded. Using this method, the work of data mining on students’ achievement in college physical experiments was carried out. A lot of useful information was retrieved and analyzed. Some reasons that influenced students’ achievement were obtained. It would provide a scientific basis for college teaching management.

        Key words:data mining; decision tree; ID3 algorithm

        中圖分類號:G642.423

        文獻標識碼:A

        文章編號:1005-4642(2015)03-0015-03

        作者簡介:姜蕓(1963-),女,陜西西安人,西安交通大學理學院物理實驗中心工程師,學士,主要從事物理實驗教學研究及管理工作.

        收稿日期:2014-08-19;修改日期:2014-09-11

        猜你喜歡
        決策樹數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機森林方法在管理決策中的應用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于改進決策樹的故障診斷方法研究
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應用
        基于決策樹的出租車乘客出行目的識別
        基于決策樹的復雜電網(wǎng)多諧波源監(jiān)管
        電測與儀表(2016年2期)2016-04-12 00:24:40
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        基于肺癌CT的決策樹模型在肺癌診斷中的應用
        9999精品视频| 亚洲精品第四页中文字幕 | 超清无码AV丝袜片在线观看| 国产久久久自拍视频在线观看| 在线免费观看亚洲毛片| 中文字幕乱码亚洲三区| 久久亚洲精品中文字幕| 国产成人aaaaa级毛片| 天天综合天天色| 杨幂国产精品一区二区| 国产亚洲精品一区二区在线播放| 亚洲乱码av一区二区蜜桃av | 99久久久国产精品丝袜| 69搡老女人老妇女老熟妇| 日本熟妇裸体视频在线| 男奸女永久免费视频网站| 精品视频无码一区二区三区| 中国凸偷窥xxxx自由视频妇科| 亚洲av日韩av高潮潮喷无码| 久久久久这里只有精品网| 在线视频一区二区在线观看| 国产三级韩三级日产三级| 不卡一区二区视频日本| 亚洲av综合av一区| 国产伦精品一区二区三区| 国产农村三片免费网站| 国产在线精品亚洲视频在线| 丁香婷婷六月综合缴清| 大肉大捧一进一出好爽视频动漫 | 日韩人妻无码一区二区三区久久| 三级全黄的视频在线观看| 少妇极品熟妇人妻无码| 亚洲一区二区三区av链接| 青青手机在线视频观看| 成人久久精品人妻一区二区三区| 久久婷婷五月综合色奶水99啪| 亚洲精品夜夜夜妓女网| 日韩中文网| 老熟妇高潮av一区二区三区啪啪| 麻豆国产精品伦理视频| 亚洲av中文无码乱人伦在线咪咕 |