亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向本科生商務思維能力培養(yǎng)的數(shù)據(jù)分析課程建設

        2019-03-18 05:11:02孔令波
        計算機教育 2019年2期
        關鍵詞:商務機器優(yōu)化

        孔令波

        (北京交通大學 軟件學院,北京 100044)

        0 引 言

        以2007年斯坦福大學Andrew Ng教授的機器學習公開課[1]的推出為代表,大眾對于人工智能和機器學習技術有了更多的了解和期待,大量以機器學習為核心的創(chuàng)業(yè)公司涌現(xiàn)[2]。2015年政府報告[3]提出了“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”(首次概括是在2014年9月10日的夏季達沃斯論壇),作為年輕俊杰群體的大學生,創(chuàng)業(yè)成了熱門的話題(北京交通大學軟件學院每年都有學生進行創(chuàng)業(yè)的嘗試)。2017年政府報告將人工智能(機器學習是其中的核心部分之一,也是數(shù)據(jù)分析的一部分)首次寫入了全國政府工作報告[4],這更加激發(fā)了人們創(chuàng)業(yè)的熱情。

        另一方面,文獻[5]調查發(fā)現(xiàn),從大的層面看,創(chuàng)業(yè)失敗率統(tǒng)計下來是非常高的——95%以上,缺乏商業(yè)思維是最主要的原因。早在2005年Gartner 咨詢公司出具的IT 行業(yè)調查報告就指出,未來計算機從業(yè)人員真正有價值的不再是IT技術本身,而更多地體現(xiàn)為對商務運作的理解和把握[6]。

        有鑒于此,對于本科生而言,幫助他們提升商務思維和數(shù)據(jù)分析能力,是非常有必要的。數(shù)據(jù)分析可以使學生掌握洞察現(xiàn)象背后的能力;商務思維能夠有助于學生了解評估創(chuàng)業(yè)盈利性的套路,使學生能更理性地創(chuàng)業(yè),對安于就業(yè)的學生也是有益的:只有了解所在企業(yè)的盈利模式,才能有針對性地為企業(yè)創(chuàng)造更大的價值,這對學生畢業(yè)后的職位晉升也就更有利。

        因此,對于當下本科生教育而言,商務思維和數(shù)據(jù)分析能力應該作為基本素質來培養(yǎng)。然而,如何設置相關的課程呢?是另外開設商務課程,還是在數(shù)據(jù)分析課程中涵蓋商務的同容呢?筆者以為,在一門課程中以商務思維串講數(shù)據(jù)分析相關技術,是一個值得嘗試的方式。

        1 貫通與綜合:串講商務思維和數(shù)據(jù)分析的挑戰(zhàn)

        在實踐過程中梳理出支持前述整合的課程建設思路,即“貫通與綜合”?!柏炌ā本褪且軌蛘业揭粭l線將相關的概念和算法從理論上落實到實際應用的案例;“綜合”就是為了支持貫通所需要不同學科的知識的整合——這也是近期新工科學科和課程建設的主旨之一[7]。

        為此,就不能延續(xù)傳統(tǒng)的教學:一本教材(或一組相似教材)講一門課,或在講課中大量采用數(shù)學公式,似乎離了數(shù)學就講不清楚一樣。

        如果延續(xù)一本教材講一門課的方式,那么,針對商務思維似乎就只能至少再增設一門課程??墒?,對于學分固定、課程緊張的教學課程設計而言,增設一門課程的方式并不經濟。此外,考察現(xiàn)有MBA和經濟管理的課程同容,仍然是在商務的圈子里講解,無法與工科數(shù)據(jù)分析的相關概念和技術結合起來。

        對于以數(shù)學推導為主要形式的教學而言,大多沒有貼合學生掌握數(shù)學的實際情況——他們對數(shù)學的感覺(見到公式,就知道怎么計算和寫程序)往往并不好。自然,如果在教學中能夠幫助學生建立這種感覺,對于學生的后續(xù)發(fā)展是非常有益的:人工智能的背后,其實就是數(shù)學在支撐。但是,挑戰(zhàn)也很明顯:①同容太多,不僅包括MBA的商務知識,也包括機器學習的眾多算法,如何將它們有機地整合在一起是課程建設的主要挑戰(zhàn);②不能默認學生對數(shù)學都有感覺,而應幫助學生能對數(shù)學進一步有感悟。

        2 課程建設思路

        1)以分析和保障商務盈利性為線索整合相關的專題。

        本課程想將商務思維和數(shù)據(jù)分析整合在一起,是因為商務決策是數(shù)據(jù)分析的一個重要應用。眾所周知,商務決策關心的基本問題就是盈利性,有了創(chuàng)業(yè)的思路,如果不能分析清楚可行的盈利模式,那創(chuàng)業(yè)失敗的可能性就屬于95%的范圍。

        如何分析和保障盈利性,需要關心兩個基本問題:一是目標客戶的篩選,二是產品質量和生產效率/成本。所有相關的決策都需要數(shù)據(jù)分析的支持,包括統(tǒng)計推斷的同容、數(shù)據(jù)挖掘/機器學習的諸多算法。這也就意味著可以利用商務來串接相關的數(shù)據(jù)分析方法。

        2)相關數(shù)據(jù)分析算法的選擇。

        有了商務這一串接的線索,另外一個挑戰(zhàn)就是篩選相關的算法,算法有很多,涉及MBA、統(tǒng)計學、數(shù)據(jù)挖掘/機器學習等,面面俱到肯定是不可行的。為此,采取基本的、具有代表性的算法為授課的主要同容,而將復雜的、需要深入學習的算法作為文獻綜述來講授,引導學生按照自己的興趣去自學。

        需要說明的是,為講解相關的數(shù)據(jù)分析算法,優(yōu)化論(尤其是凸優(yōu)化)的同容是必不可少的,是另外一條串接相關算法的線索。

        3)以示例來熏陶學生對數(shù)學的感覺。

        不再以嚴格的數(shù)學推導為主要授課方式,而是在必要的數(shù)學儲備(比如優(yōu)化論的簡要介紹)基礎之上,通過展示簡單的例子來幫助學生理解計算的思路,然后進一步從數(shù)學形式上來探討改進的可能性。這既有助于學生直觀理解,又能反過來熏陶學生對數(shù)學形式化背后直觀性的感悟。

        4)以歷史的角度展示相關技術的演化,體會掌握核心技術的重要性。

        課程涉及的算法很多,算法的歷史也是非常有趣的同容,包括人工智能的發(fā)展(機器學習是人工智能發(fā)展的第三個階段[8])、優(yōu)化論的發(fā)展[9-10]、神經網(wǎng)絡的發(fā)展(從早期的感知器模型到現(xiàn)在大熱的深度學習諸多框架)[11-12],以及數(shù)據(jù)管理系統(tǒng)的發(fā)展(從文件到數(shù)據(jù)庫管理系統(tǒng),再到數(shù)據(jù)倉庫和大數(shù)據(jù))[13-15]等。在講解過程中可以幫助學生更深入地體會核心技術的變與不變,如SQL(Structured Query Language,結構化查詢語言)的解釋與執(zhí)行在DBMS(Database Management System,數(shù)據(jù)庫管理系統(tǒng))、數(shù)據(jù)倉庫和大數(shù)據(jù)中都起著重要的作用。

        目前,已經過兩輪的本科教學實踐,學生的認同度是很高的,也引起部分學生有針對性地繼續(xù)自學深入研討的興趣。

        3 授課內容概述

        章節(jié)安排上,本課程組織了5部分專題,分別是商務思維概述、基于統(tǒng)計推斷的商務決策、優(yōu)化論摘要、機器學習算法概覽,以及相關數(shù)據(jù)管理技術(包括數(shù)據(jù)倉庫和大數(shù)據(jù))串講。需要說明的是:①商務的同容自然是第一個出現(xiàn),從中提煉出來的問題是后續(xù)數(shù)據(jù)分析算法的應用背景;②優(yōu)化論是另一個串講數(shù)據(jù)分析方法的線索——主要的數(shù)據(jù)分析算法(尤其是機器學習算法)都可以歸結為某類優(yōu)化問題(凸優(yōu)化)。 此外,雖然線性規(guī)劃是凸優(yōu)化的子集,但其獨特的特性和求解方法與非線性凸優(yōu)化有很大的不同,所以,不在本課程中闡述線性規(guī)劃的同容,僅略作介紹以幫助學生了解;③統(tǒng)計推斷部分主要專注于基于置信度區(qū)間進行推斷的同容,包括ANOVA(Analysis of Variance,方差分析)和列聯(lián)表等同容,部分可轉換為優(yōu)化問題形式的同容(如回歸、PCA(Principle Component Analysis,主成分分析)等),剩余同容則歸入后面數(shù)據(jù)分析部分(降維)。

        較為詳細的專題同容概述如下。

        1)商務思維概述。

        商務活動的主旨就是賺取更大的利潤(盈利性),基于簡單的利潤公式“毛利潤 = 銷售額-已售產品成本”可以直觀地推斷出,為保證利潤就必須以高于成本的價格將滿足顧客需要的產品賣給顧客。

        為此,除了產品的質量和成本(會介紹基于活動的成本分析ABC(Activity Based Costing)),分析客戶的購物習慣和模式也是保障盈利性的重要因素,并由此引出許多依賴數(shù)據(jù)分析的問題。比如,某產品不同設計對銷售的影響(ANOVA)、顧客可以接受的價格的預估(抽樣后計算置信區(qū)間)、顧客同時購買物品的組合(關聯(lián)規(guī)則)、廣告投入與銷售額的關系(列聯(lián)表)、預測銷售量(回歸,甚至是時間序列分析)、基于顧客習慣的商品推薦(分類算法),以及顧客的行為是否存在欺詐(異常檢測)等。

        這些數(shù)據(jù)分析方法分散在后續(xù)統(tǒng)計和機器學習部分。

        2)基于統(tǒng)計推斷的商務決策。

        由于數(shù)理統(tǒng)計是工科學生必修的數(shù)學課程,所以主要采取串講的方式展示將相關的統(tǒng)計方法用于商務決策的問題,包括如何推斷顧客可接受的價格、產品質量控制檢測(基于置信區(qū)間和小概率事件的推斷)的原理是什么、投資收益評估(BEP:Break Even Points,保本點;Pay-back period,投資回收期;凈收益以及回報率等),以及產品設計對銷售的影響(ANOVA)等。

        數(shù)理統(tǒng)計的其他部分方法劃歸到機器學習部分,包括線性回歸和主成分分析等。多元統(tǒng)計和時間序列則作簡要的應用介紹,鼓勵感興趣的同學自己探索。

        3)優(yōu)化論摘要。

        如前所述,優(yōu)化論是另外一個串接數(shù)據(jù)分析方法的線索:雖然不是直接用于數(shù)據(jù)分析,但優(yōu)化論的知識是理解相關算法的基礎??上У氖?,在學院的課程規(guī)劃中并沒有設置此課程。網(wǎng)絡上可見的優(yōu)化論課程,大多延續(xù)了斯坦福大學Boyd教授的凸優(yōu)化課程風格——用嚴格的數(shù)學推導來闡釋凸優(yōu)化求解的思想(極值和最優(yōu)化條件),這是一般學生難以直觀理解的。

        筆者在授課過程中對此作了簡化(不含線性規(guī)劃的同容):按照優(yōu)化問題的3個層次(無約束問題、等式約束問題和包含不等式約束問題)來介紹對應的求解方法。

        (1)無約束和等式約束的凸優(yōu)化問題求解的基本思路就是借助一階和二階(偏)導數(shù)相結合來確定極值性質的方式(多元變量時對應一階偏導數(shù)和Hessian 矩陣的性質):令一階(偏)導數(shù)等于零,然后基于二階(偏)導數(shù)來判定是極大還是極小。

        此外,對求解的算法也做了講解,涉及梯度下降和牛頓法。諸如擬牛頓法、DFP(Davidon Fletcher Powell)、BFGS(Broyden Fletcher Goldfarb Shanno)等其他算法,只做了簡要的介紹。

        (2)針對包含不等約束的凸優(yōu)化問題,最優(yōu)化條件是目前解決此類問題最可靠的理論支撐(無約束和等式約束的情況可看作最優(yōu)化條件的特例),但因其理論的難度以及實際求解算法的困難,這部分同容只是做了示例,幫助學生了解而已。想要深入淺出地講通這部分同容只能留待后續(xù)自己能力的提升了。

        在講解過程中,嚴格的凸優(yōu)化函數(shù)界定等同容是予以回避的,但留出了參考文獻和書目,甚至列出部分視頻供學生進一步學習。

        比較欣慰的是,有一些學生嘗試著去閱讀和鉆研凸優(yōu)化??上?,他們的反饋都是說那些數(shù)學推導是巨大的障礙。這一方面印證了前面關于學生對數(shù)學感覺并不好的現(xiàn)象,另一方面也從側面說明基于示例幫助學生學習算法進而感悟數(shù)學的方式是有意義的。

        4)機器學習算法概覽。

        有了優(yōu)化論的視角,講解相關的機器學習算法就顯得從容許多,因為大部分機器學習算法的計算步驟要依賴優(yōu)化的思想來理解。

        這些算法很多可用于回答商務分析中的關于顧客購物模式的問題,比如所購物品的關聯(lián)性(關聯(lián)規(guī)則)、購買某類產品的顧客具有什么相似的特征(聚類)、如何評估客戶的可能類別(分類)、如何精準推薦顧客可能感興趣的商品(分類)、客戶是否存在欺詐(異常檢測)等。

        本課程大致覆蓋了如下的機器學習算法:①回歸,將原屬統(tǒng)計學的回歸問題放在這一部分,主要介紹了線性回歸,著重從優(yōu)化的角度來理解,以期讓同學體會優(yōu)化的視角。②降維,數(shù)據(jù)分析的一個關鍵步驟其實是特征的篩選,降維也就有著獨特的作用。講解了PCA和FA(Factor Analysis,因子分析),對其他降維算法僅僅作了介紹,如ICA(Independent Component Analysis,獨立成分分析)和LDA(Linear Discriminant Analysis,線性判別分析)。③關聯(lián)規(guī)則,Apriori 算法是必須要講的,以保證在此課程中顧全機器學習算法的完整性。④聚類,主要講解了 K-means和 DBScan(Density-Based Spatial Clustering of Applications with Noise,具有噪聲的基于密度的聚類方法),其他算法僅予以介紹,如CURE(Clustering Using Representatives)、BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies,利用層次方法的平衡迭代規(guī)約和聚類)和DENCLUE等。⑤分類,講授Logistic Regression、 決 策 樹、GMM(Gaussian Mixture Model,高斯混合模型)和SVM(Support Vector Machine,支持向量機)等。實際講授時,SVM是作為專門一節(jié)來介紹的,主要講解SVM建模的由來和嚴格線性可分情況下SVM的求解。SVM可轉換為凸優(yōu)化中的QP (Quadratic Programming,二次規(guī)劃)問題,有現(xiàn)成的QP求解方法。僅僅如此是不足以領會到SVM理論的嚴謹之美,必須延伸到SMO(Sequential minimal optimization,序列最小優(yōu)化算法)的同容??墒牵@一套下來,就不太能兼顧淺顯和直白了,所以學生的反饋還是很難。不過,值得欣慰的是,學生的反饋也表明他們對SVM的基本概念和計算步驟還是有了直觀的了解。⑥神經網(wǎng)絡專列一章,在介紹了感知器模型和Logistic Regression后,進一步講解了BP網(wǎng)絡(Back Propagation,反向傳播)、Hopf i eld 網(wǎng)絡等Recurrent 網(wǎng)絡,最后對深度學習中CNN(Convolution Neural Network,卷積神經網(wǎng)絡)做了原理展示。一般介紹神經網(wǎng)絡,除了感知機外,也就是介紹BP網(wǎng)絡。但是,想要理解現(xiàn)在深度學習中的網(wǎng)絡架構,Hopf i eld網(wǎng)絡和Boltzmann機等是必要的。其他諸如LSTM(Long-Short Term Memory,長短期記憶模型)的深度學習網(wǎng)絡架構只是做了概述,留作學生自學的同容。深度學習現(xiàn)在是很受關注的,對它們的掌握絕對是相關從業(yè)或研究人員繞不過去的方法,但放在這門課中較為詳盡地闡述在時間上就有些捉襟見肘,所以,只是在那些早期神經網(wǎng)絡模型的基礎上介紹了CNN,其他的深度學習模型沒有展開。建議留有專門的后續(xù)課程對此做深入探討。

        5)相關數(shù)據(jù)管理技術串講。

        在較為完整地統(tǒng)攬了數(shù)據(jù)分析的方法后,了解一下對應的數(shù)據(jù)管理技術的發(fā)展,尤其是體會數(shù)據(jù)管理和數(shù)據(jù)分析集成的趨勢,所占時間不多,但對于學生宏觀了解IT技術發(fā)展是有益的。

        相關技術概括為,早期基于文件的數(shù)據(jù)管理,曾經數(shù)據(jù)管理的霸主RBDMS(Relational Database Management System,關系數(shù)據(jù)庫管理系統(tǒng)),數(shù)據(jù)分析和數(shù)據(jù)管理首次融合的數(shù)據(jù)倉庫(數(shù)據(jù)挖掘可以看做其中的一個處理環(huán)節(jié)),以及當下仍備受關注的大數(shù)據(jù)系統(tǒng)。

        專題同容的概述見表1,直觀展示專題的同容以及它們之間的相互關系。

        4 課程考核

        學院是鼓勵所謂的過程考核的,以往采取的方式主要是布置課后作業(yè)或項目作為平時成績的依據(jù),但平時成績往往與最后的紙面考試成績有巨大的差異。原因很清楚,那就是讓學生帶回去完成,很難保證學生的自覺性。因此,在實踐中嚴格要求在課堂上布置測試并收集學生的答案。這樣,不僅如實反映學生平時對所授同容的理解程度,還可以幫助教師有針對性地就學生困惑的地方予以重點講解。

        此外,原本設想鼓勵學生自主使用Python等開發(fā)工具練習算法,但因為這部分沒有計入課程的分數(shù)系統(tǒng),所以,實際情況就是很少有學生去主動完成。這是一個有趣的也是值得分析的現(xiàn)象:現(xiàn)在的大學生是怎樣確定他們的學習興趣?除了分數(shù),如何調動他們學習艱深知識的興趣?

        表1 授課內容概覽表

        5 結 語

        商務思維的重要性,對于現(xiàn)今身處鼓勵創(chuàng)業(yè)和創(chuàng)新的社會變革中的大學生而言,是愈加突出的。如何在不增加額外課程的情況下,讓學生能夠通過一門課程對商務思維有所領會,是改革這門課的初心——數(shù)據(jù)分析課程自然是最好的選擇。

        雖然看上去同容很多,但經過深思熟慮,專注于為本科生提供對商務思維和數(shù)據(jù)分析以宏觀的、歷史的和廣而博的理解,那么課程的建設是可行的。并且,這種方式也得到了學生的認可——出勤率都很高,有一些學生按照給出的線索去學習相關的知識。

        實踐中也意識到有不足,總結了一些經驗:①本課程現(xiàn)在是安排大三春季學期,筆者以為有些晚。比較好的選擇是調到線性代數(shù)完成后的學期——大二階段;②缺乏配套的實踐課程,不管是常用軟件的使用(Excel和SPSS等),還是編程的訓練(如Python);③一些有趣的專題沒有涉及,比如情感分析、過程挖掘、MDP(Markov Decision Process,馬爾科夫決策過程)和強化學習等;④后續(xù)應該有深度學習和大數(shù)據(jù)分析的課程,這樣才能保證本院的學生能具有更強的競爭力,現(xiàn)在的情況是,很少有本科生能上手大數(shù)據(jù)相關同容。

        機器學習課程建設的思路已經有很多[16-19],與他們不同,本課程的思路是將商務思維與數(shù)據(jù)分析融合在一起。雖然實踐表明效果還不錯,但對于建設好一門課程而言,這僅僅是開始,今后還需要更為深入的探討和實踐。

        猜你喜歡
        商務機器優(yōu)化
        機器狗
        超限高層建筑結構設計與優(yōu)化思考
        房地產導刊(2022年5期)2022-06-01 06:20:14
        機器狗
        民用建筑防煙排煙設計優(yōu)化探討
        關于優(yōu)化消防安全告知承諾的一些思考
        一道優(yōu)化題的幾何解法
        完美的商務時光——詩樂全新商務風格MOMENTUM系列
        未來機器城
        電影(2018年8期)2018-09-21 08:00:06
        國外商務英語演講研究進展考察及啟示(2004—2014)
        無敵機器蛛
        国产一区二区视频在线看| 精品无码国产一区二区三区av| 99精品国产一区二区| 蜜桃精品免费久久久久影院| 亚洲成在人线av| 人妻无码aⅴ中文系列久久免费| 一本无码人妻在中文字幕| 在线观看亚洲精品国产| 国产chinese在线视频| 麻豆AV无码久久精品蜜桃久久| 亚洲天堂av在线一区| 成人国产高清av一区二区三区| 日本一区二区三区光视频| 亚洲国产精品一区二区久久恐怖片| av大全亚洲一区二区三区| 日日摸夜夜添夜夜添高潮喷水| av色欲无码人妻中文字幕| 欧美性开放bbw| 免费在线观看一区二区| 日韩精品一区二区亚洲av性色| 国产av一区二区内射| 人妻制服丝袜中文字幕| 国产成人a级毛片| 日韩人妻ol丝袜av一二区| 国产免费av片无码永久免费| 无码任你躁久久久久久| 一区二区久久不射av| 中文字幕丰满人妻被公强| 精品久久人妻av中文字幕| 隔壁老王国产在线精品| 人妻体体内射精一区二区| 一本一本久久a久久精品综合| 中文字幕五月久久婷热| 骚货人妻视频中文字幕| 亚洲女人毛茸茸粉红大阴户传播 | 欧美成人中文字幕| 久久青青草原国产精品最新片| 亚洲啊啊啊一区二区三区| 最近更新中文字幕一区二区 | 性感熟妇被我玩弄到高潮| 国产成人自拍视频播放|