亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)時代數(shù)據(jù)挖掘與分析課程教學改革探究

        2021-10-08 16:44:17楊秀璋武帥夏換周既松于小民范郁鋒
        計算機時代 2021年9期
        關鍵詞:知識圖譜數(shù)據(jù)分析數(shù)據(jù)挖掘

        楊秀璋 武帥 夏換 周既松 于小民 范郁鋒

        摘? 要: 從理論知識、編程實踐、工程實戰(zhàn)三個方面對數(shù)據(jù)挖掘與分析課程進行教學改革。課程采用Python編程語言,圍繞貴州省經濟文化特色及大數(shù)據(jù)發(fā)展戰(zhàn)略,充分運用大數(shù)據(jù)、數(shù)據(jù)挖掘、知識圖譜等新興技術來分析貴州省各領域現(xiàn)狀,挖掘其內在價值。近三年的教學實踐證明了該教學改革的創(chuàng)新性和有效性,培養(yǎng)了學生的大數(shù)據(jù)思維,為貴州省聚焦大數(shù)據(jù)戰(zhàn)略行動貢獻力量。

        關鍵詞: 數(shù)據(jù)挖掘; 數(shù)據(jù)分析; 教學改革; 大數(shù)據(jù); 知識圖譜

        中圖分類號:G420? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2021)09-107-05

        Abstract: The teaching reform for data mining and analysis course is carried out on the theoretical knowledge, programming practice and engineering practice. Adopting Python programming language, focusing on the economic and cultural characteristics and big data development strategy of Guizhou Province, the emerging technologies such as big data, data mining and knowledge graph are made full use of to analyze the current situation of various fields in Guizhou Province and tap their internal value. The teaching practice in recent three years has proved the innovation and effectiveness of the teaching reform, and cultivated students' big data thinking, which makes contributions to the strategic action of focusing on big data in Guizhou Province.

        Key words: data mining; data analysis; teaching reform; big data; knowledge graph

        0 引言

        如今大數(shù)據(jù)和人工智能技術飛速發(fā)展,人們在利用互聯(lián)網快速自由地獲取信息的同時,也面臨著如何利用大數(shù)據(jù)技術解決實際問題,以及從海量數(shù)據(jù)中快速精準地獲取用戶所需信息的難題。因此,培養(yǎng)具有數(shù)據(jù)科學思維、實戰(zhàn)能力較強的人才變得尤為重要。數(shù)據(jù)挖掘與分析、大數(shù)據(jù)技術及應用相關課程需要進一步改革,改革應更加注重理論知識、編程實踐、工程實戰(zhàn)三方面的結合,圍繞地方經濟文化特色及大數(shù)據(jù)發(fā)展戰(zhàn)略展開。

        當前,國內外高校對于大數(shù)據(jù)相關課程的改革有很多。張世杰[1]等針對園林專業(yè)研究改革的措施。高星[2]等運用行動導向教學方法對現(xiàn)有的高校計算機專業(yè)人才培養(yǎng)進行探討。陳虹[3]、朱路紅[4]、李永軍[5]、林德麗[6]、劉群群[7]、蔣衛(wèi)祥[8]、吳瓊[9]、楊洋[10]分別從教學方法、教學理念、教學格局、創(chuàng)新思維等方面分析研究了相關課程改革。

        現(xiàn)階段大數(shù)據(jù)分析課程及數(shù)據(jù)挖掘依舊以理論傳授方法為主,在校學生在完成數(shù)據(jù)挖掘理論課程之后,未能有效進行完整、系統(tǒng)的數(shù)據(jù)挖掘實戰(zhàn)。針對這些問題,本次課程的教學改革提出了一種融合理論知識、編程實踐、工程實戰(zhàn)三塊知識點的方法,結合貴州省大數(shù)據(jù)戰(zhàn)略行動,圍繞高校辦學定位、本科人才培養(yǎng)模式,充分利用Python大數(shù)據(jù)分析、數(shù)據(jù)挖掘、可視化分析等技術,研究全國特別是貴州省各行各業(yè)實際需求,挖掘其數(shù)據(jù)的內在價值,從而提升學生的編程實戰(zhàn)及大數(shù)據(jù)分析能力。

        1 數(shù)據(jù)挖掘與分析教學改革框架

        本次教學改革的課程為數(shù)據(jù)挖掘與分析、大數(shù)據(jù)技術及應用等相關課程,本課程的定位是大數(shù)據(jù)技術和數(shù)據(jù)挖掘入門課程,為學生搭建通向“大數(shù)據(jù)知識空間”的橋梁和紐帶。整個實驗教學框架如圖1所示,包括四大模塊。

        ⑴ 前期調研及分析。圍繞理論知識、編程實踐、工程實戰(zhàn)三方面展開,結合貴州省地方經濟、文化特色開展各領域、各行業(yè)的調研,結合數(shù)據(jù)挖掘算法知識和實際應用場景設計相關的分析方案。

        ⑵ 數(shù)據(jù)爬取和預處理。針對某領域或某行業(yè)的數(shù)據(jù)進行采集,調用Python爬蟲模塊采集相關數(shù)據(jù)信息。接著對存儲的數(shù)值數(shù)據(jù)和文本數(shù)據(jù)進行數(shù)據(jù)預處理,主要包括數(shù)據(jù)清洗、異常值處理、中分分詞、殘缺值填補以及數(shù)值統(tǒng)計等。

        ⑶ 數(shù)據(jù)挖掘與分析。作為該類課程的重點部分,運用合理的數(shù)據(jù)挖掘或機器學習算法對行業(yè)數(shù)據(jù)進行有效的大數(shù)據(jù)分析。

        ⑷ 可視化分析及總結。為了更直觀地體現(xiàn)數(shù)據(jù)挖掘和數(shù)據(jù)分析結果,通過調用Python語言的可視化模塊或利用可視化工具進行分析。通過對各領域、各行業(yè)的實際分析結果的可視化呈現(xiàn),進行對比實驗和圖表展示,最終給出相關的改進建議。

        2 課程教學改革思路及創(chuàng)新

        本課程主要基于數(shù)據(jù)挖掘與分析、大數(shù)據(jù)技術及應用講解,其教學目的和任務是讓學生掌握基本的數(shù)據(jù)挖掘方法,培養(yǎng)學生數(shù)據(jù)科學思維,并能應用數(shù)據(jù)挖掘與數(shù)據(jù)分析技術獨立研究某個領域或行業(yè)的問題。整個課程圍繞理論知識、編程實踐和工程實戰(zhàn)三方面展開,緊跟貴州省大數(shù)據(jù)戰(zhàn)略行動,其教學改革思路及創(chuàng)新如圖2所示。

        2.1 理論知識與編程實踐融合

        通過理論知識與編程實踐相融合來促進學生的編程興趣,同時兼顧數(shù)據(jù)挖掘理論知識和編程實踐能力。教學中強調以書本知識及實踐案例操作為主,引導學生發(fā)散思維。一方面增強了學生的編碼能力和大數(shù)據(jù)分析能力,另一方面課程通過設計大量有趣的案例實驗。

        本課程的教學內容如表1所示,共計16周的教學內容和大量的課后實驗。包括大數(shù)據(jù)及數(shù)據(jù)挖掘基礎普及、Python大數(shù)據(jù)分析簡介及案例、Python基礎語法及編程實踐、Python可視化分析及編程實踐、分類分析基礎及編程實踐等。綜上,理論知識與編程實踐的融合具有良好的創(chuàng)新性和實踐性。

        2.2 理論知識與工程實戰(zhàn)促進

        通過理論知識和工程實戰(zhàn)(實驗)相促進來培養(yǎng)學生的數(shù)據(jù)科學思維。整個實驗考核圍繞貴州省大數(shù)據(jù)戰(zhàn)略行動,以分析全國或貴州省某領域或某行業(yè)數(shù)據(jù)為主,課程包括五次課程實驗(學生獨立完成)和一次期末大數(shù)據(jù)分析實戰(zhàn)訓練(小組協(xié)作完成)。

        2.2.1 實驗的基本目的

        ⑴ 緊扣大數(shù)據(jù)戰(zhàn)略行動。讓學生理解并掌握大數(shù)據(jù)分析方法的基本流程,涉及數(shù)據(jù)爬取、數(shù)據(jù)預處理、數(shù)據(jù)挖掘與分析、可視化分析等。

        ⑵ 搭建大數(shù)據(jù)橋梁紐帶。應用“Python+數(shù)據(jù)挖掘+大數(shù)據(jù)+可視化技術”實現(xiàn)貴州省某領域的大數(shù)據(jù)分析實驗,挖掘相關價值。

        ⑶ 創(chuàng)新大數(shù)據(jù)思維模式。結合“產、學、研”布置大數(shù)據(jù)分析實驗,提高學生“四高四強”能力,為學生在大數(shù)據(jù)領域發(fā)展奠定基礎及指明方向。

        整個實驗內容緊跟數(shù)據(jù)挖掘與分析理論知識,一方面提升學生的編程能力,另一方面讓學生真正學會如何完成一個數(shù)據(jù)分析的產品,并應用到畢業(yè)設計、工作實踐中,同時培養(yǎng)團隊協(xié)作能力,獲得屬于計算機科學或數(shù)據(jù)挖掘領域的自豪。

        2.2.2 核心知識

        ⑴ 數(shù)據(jù)挖掘知識。涉及聚類數(shù)據(jù)分析(K-Means、BIRCH)、分類數(shù)據(jù)分析(決策樹、SVM、KNN、隨機森林)、回歸數(shù)據(jù)分析(邏輯回歸、多線性回歸)、LDA主題挖掘等知識。

        ⑵ 可視化技術。涉及WordCloud詞云分析、PyEcharts可視化分析、Matplotlib繪圖分析、Seaborn繪圖分析、知識圖譜及Gephi工具分析等。

        ⑶ 網絡爬蟲知識。通過調用Python網絡爬蟲包(Urllib、 BeautifulSoup、Selenium)抓取指定數(shù)據(jù),并進行后續(xù)大數(shù)據(jù)分析實驗,涉及數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)存儲等知識。

        2.3 工程實戰(zhàn)與編程實踐提升

        通過工程實戰(zhàn)與編程實踐相互融合來提升學生獨立運用大數(shù)據(jù)技術解決實際問題和深入領域知識挖掘的能力。整個實驗包括5次課程實驗和1次期末大數(shù)據(jù)分析實戰(zhàn)訓練。其中,大數(shù)據(jù)分析實戰(zhàn)要求各小組結合Python數(shù)據(jù)挖掘與分析課程知識,立足全國或貴州省某行業(yè)的問題進行大數(shù)據(jù)分析與預測,內容包括需求分析、數(shù)據(jù)爬取、數(shù)據(jù)挖掘、大數(shù)據(jù)分析、實驗對比和總結建議等,并且需要完成一次PPT分享和詳細的課程報告。

        整個分析的主題需學生自擬,近三年優(yōu)秀的主題和實驗包括:“貴州省大學生招聘就業(yè)信息分析與推薦”“貴州省農產品價格預測及特色產品推薦”“貴州省社交論壇數(shù)據(jù)實時抓取及輿情預警分析”“貴州省各市縣區(qū)知識圖譜構建及復雜網絡分析”“貴州省黃果樹瀑布景區(qū)數(shù)據(jù)分析”“貴州省少數(shù)民族文獻知識挖掘與探究”“我國網絡小說市場數(shù)據(jù)分析及可視化展示”“中國流行歌曲音樂數(shù)據(jù)分析及市場建議”等。

        3 教學改革效果展示

        該教學改革已執(zhí)行于貴州財經大學信息學院計算機科學與技術、信息管理與信息系統(tǒng)、電子商務、軟件工程等專業(yè),涉及數(shù)據(jù)挖掘與分析、大數(shù)據(jù)技術及應用、Python數(shù)據(jù)挖掘等課程,并參加學校的教學范式改革和精品實驗教學獲優(yōu)秀。教學改革大大調動學生的學習興趣,同時與學生興趣愛好相結合,進一步調動學生積極性。整體的教學和實驗改革效果良好,一方面學生了解到貴州省大數(shù)據(jù)相關的技術及前沿動態(tài),另一方面結合Python大數(shù)據(jù)分析編程實現(xiàn)了貴州省某領域或某行業(yè)的知識挖掘,有效推動了貴州財經大學本科教學聚焦大數(shù)據(jù)戰(zhàn)略行動。

        近三年來,同學們圍繞數(shù)據(jù)挖掘和分析課程教學改革,采用Python和大數(shù)據(jù)分析技術對全國或貴州省某領域、某行進行了不同主題的挖掘,下面簡敘其中三組學生實驗成果。

        3.1 貴州省校園招聘數(shù)據(jù)分析

        該小組實驗概述了大數(shù)據(jù)對大學生就業(yè)形勢的作用,通過調用Urllib庫爬取了貴州省校園招聘信息,設計并實現(xiàn)了詞云技術、K-Means聚類、時間序列和回歸算法對所爬取的信息進行分析,預測貴州省目前的就業(yè)形勢,并通過可視化技術展現(xiàn)。圖3展示了貴州省校園招聘的熱門主題,可以直觀地反映出貴州省校園招聘的熱點主題詞為“銷售經理”“五險一金”“銷售主管”等。

        接著針對貴州省各地區(qū)的校園招聘分布情況,發(fā)現(xiàn)貴陽市招聘信息最多,約占據(jù)69.2%,其次是遵義市,約占據(jù)7.03%。針對采集的薪資數(shù)據(jù)進行時間序列和線性回歸分析,并對最終結果進行了預測,繪制出圖4所示時間和薪資分析圖。

        3.2 貴州省農產品主題挖掘與價格預測

        該小組針對貴州省農產品價格和主題進行Python大數(shù)據(jù)分析,并實現(xiàn)農產品價格的可視化,簡要分析其內在特點。首先對爬取的數(shù)據(jù)調用WordCloud繪制圖5所示貴州農產品詞云圖。

        詞云圖可以清晰看出貴州農產品中“南瓜”“大白菜”“香菇”為該段時間內的特色產品,并對采集的“白蘿卜”價格數(shù)據(jù)進行可視化分析繪制出圖6所示結果。大致看出,2018年近三個月最價格為1.6元,均價為1.22元。接著,針對三、四、五這三個月的“白蘿卜”價格預測“白蘿卜”價格平均增長率為58.73%。通過進一步分析預測貴州省最便宜的農貿市場及購買時間,并給出相關推薦。

        3.3 全國民謠歌曲大數(shù)據(jù)分析實驗

        在新媒體的涌現(xiàn)下,歌曲傳播方式發(fā)生變化,當下音樂曲種多種多樣,民謠歌曲雖作為小眾歌曲,卻同樣得到廣大聽眾的喜愛。該小組針對這一現(xiàn)象采用Python數(shù)據(jù)挖掘方法對網易云音樂的民謠歌單進行分析,挖掘現(xiàn)階段我國民謠發(fā)展現(xiàn)狀、主流民謠情感趨向以及主題特征。

        首先對民謠創(chuàng)作歌手的創(chuàng)作歌曲進行統(tǒng)計分析,繪制出圖7所示民謠歌手Top20統(tǒng)計圖。其中,評論數(shù)最多的三位作者是趙雷、陳粒和李志,并且趙雷的評論數(shù)量最多,占13.59%,共計1435701條,可大致看作最熱門歌手,喜歡民謠的聽眾可優(yōu)先選擇他的歌曲進行試聽。接著調用PyEcharts模塊繪制民謠歌曲地區(qū)GIS熱點地圖,可直觀看出民謠歌曲所描述的城市主要為北京、上海、麗江以及成都等??纱笾峦茰y民謠歌曲創(chuàng)作者熱衷于以經濟發(fā)展中心以及旅游城市進行相關歌曲創(chuàng)作。

        再對采集的評論文本數(shù)據(jù)進行Jiebe分詞,并結合LDA主題模型對出現(xiàn)的詞語進行有關時光主題詞進行統(tǒng)計分析,繪制圖8所示漏斗圖。可直觀看出,民謠在創(chuàng)作過程中熱衷于“明天”的描述,共計占據(jù)48.24%,可以大致看出民謠創(chuàng)作歌手對未來還是充滿希望的,寄托著創(chuàng)作者對未來的情感,同時也表達了對未來的期待,是一種積極的訊號。該小組通過可視化技術和文本挖掘算法詳細分析中國民謠歌曲,具有一定的應用價值和創(chuàng)新意義。

        4 結論

        本次面向理論知識、編程實踐、工程實戰(zhàn)的數(shù)據(jù)挖掘與分析課程教學改革探索,通過采用多種教學方式融合,讓學生能夠深入了解數(shù)據(jù)挖掘、大數(shù)據(jù)分析、Python編程知識,并完成相關實驗案例,讓同學們深入體會到使用機器學習算法進行數(shù)據(jù)分析的現(xiàn)實意義,從而提高學生實際動手操作能力,培養(yǎng)數(shù)據(jù)科學思維。通過展示三組學生作品,可以看出課程教學改革效果顯著,學生能夠應用課程知識對某領域或某行業(yè)進行系統(tǒng)的數(shù)據(jù)挖掘與分析實踐,從而挖掘出數(shù)據(jù)潛在的聯(lián)系和價值。

        本次實驗教學改革,緊扣貴州大數(shù)據(jù)戰(zhàn)略行動,讓學生理解并掌握大數(shù)據(jù)分析方法的基本流程。同時應用“Python+數(shù)據(jù)挖掘+大數(shù)據(jù)+可視化”技術實現(xiàn)貴州省某領域或行業(yè)的大數(shù)據(jù)分析實驗,挖掘相關價值,進一步搭建大數(shù)據(jù)橋梁紐帶。通過結合“產、學、研”大數(shù)據(jù)分析實驗,提高學生的“四高四強”能力,為學生在大數(shù)據(jù)領域“深耕細作”奠定基礎和指明方向??偠灾?,這是一種創(chuàng)新大數(shù)據(jù)思維的培養(yǎng)模式。

        然而,由于本次實驗教學改革主要以青年教師為主,可能會存在一定程度上的經驗不足。該課程教學改革成員在后期需要多跟教學經驗豐富的教師進行學習交流,從而提升教師自身的教學能力。

        參考文獻(References):

        [1] 張世杰,劉沛.基于3D打印、VR虛擬現(xiàn)實技術應用的《園林計算機輔助設計》教改探討[J].教育教學論壇,2019.49:92-94

        [2] 高星,曹麗君,耿清甲.高校計算機教改中行動導向教學法的運用探析[J].創(chuàng)新創(chuàng)業(yè)理論研究與實踐,2020.3(3):67-68

        [3] 陳虹.混合式教學法在計算機教改中的具體應用[J].計算機產品與流通,2020.9:249

        [4] 朱路紅.信息化背景下的高校計算機教改初探[J].中阿科技論壇,2020.5:194-195

        [5] 李永軍.大數(shù)據(jù)背景下計算機應用基礎教改思考[J].湖北開放職業(yè)學院學報,2019.32(13):141-142

        [6] 林德麗,白二凈.計算機科學與技術專業(yè)教改的研究[J].智庫時代,2019.37:277,280

        [7] 劉群群.基于應用能力的高職計算機網絡技術教改分析[J].南國博覽,2019.3:91

        [8] 蔣衛(wèi)祥.基于創(chuàng)新能力培養(yǎng)的計算機網絡課程教改研究[J].青年與社會,2018.36:111

        [9] 吳瓊.基于編程能力提高的計算機教改實踐[J].電腦知識與技術,2018.14(29):137-138

        [10] 楊洋.信息化背景下的高校計算機教改探究[J].科技資訊,2018.16(20):190-191

        猜你喜歡
        知識圖譜數(shù)據(jù)分析數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        近十五年我國小學英語教學研究的熱點、問題及對策
        基于知識圖譜的產業(yè)集群創(chuàng)新績效可視化分析
        智富時代(2016年12期)2016-12-01 16:28:41
        基于知識圖譜的智慧教育研究熱點與趨勢分析
        Excel電子表格在財務日常工作中的應用
        淺析大數(shù)據(jù)時代背景下的市場營銷策略
        新常態(tài)下集團公司內部審計工作研究
        中國市場(2016年36期)2016-10-19 04:31:23
        淺析大數(shù)據(jù)時代對企業(yè)營銷模式的影響
        從《ET&S》與《電化教育研究》對比分析中管窺教育技術發(fā)展
        欧美俄罗斯乱妇| 日本少妇一区二区三区四区| 精品亚洲国产成人蜜臀av| 天美传媒一区二区| 日韩欧美国产丝袜视频| 亚洲中文字幕无线乱码va| 一区二区在线观看精品在线观看| 国产欧美亚洲精品第一页| 免费无码国产v片在线观看| 国产精品无码久久久久下载| 99伊人久久精品亚洲午夜| 性无码一区二区三区在线观看| 欧美丰满熟妇aaaaa片| 亚洲午夜看片无码| 国产又黄又湿又爽的免费视频| 永久天堂网av手机版| 久久久精品2019免费观看| 欧美日韩亚洲国产无线码| 成h视频在线观看免费| 午夜裸体性播放| 四月婷婷丁香七月色综合高清国产裸聊在线 | 啦啦啦www在线观看免费视频| 久久精品国产日本波多麻结衣| 青青草一级视频在线观看| 国产一区二区av免费在线观看| 亚洲日产精品一二三四区| 精品久久久久久无码不卡| 日本在线一区二区在线| 琪琪色原网站在线观看| 国产高潮国产高潮久久久| 国产成人综合亚洲av| 免费播放成人大片视频| 精品国产一二三产品区别在哪| 精品国产18禁久久久久久久| 一级黄片草逼免费视频| 夜夜高潮夜夜爽夜夜爱爱一区 | 亚洲在线视频一区二区| 一区二区三区精品少妇| 国产大陆亚洲精品国产| 亚洲综合一| 91精品国自产拍老熟女露脸|