亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        《機器學習》課程教學案例
        ——手寫數(shù)字識別系統(tǒng)開發(fā)

        2018-05-18 05:52:02米吉提阿不里米提吾米提尤努斯艾斯卡爾艾木都拉
        現(xiàn)代計算機 2018年11期
        關鍵詞:錯誤率手寫機器學習

        米吉提·阿不里米提,吾米提·尤努斯,艾斯卡爾·艾木都拉

        (新疆大學信息科學與工程學院,烏魯木齊 830046)

        0 引言

        人工智能、機器人、大數(shù)據(jù)等已經(jīng)離不開我們的生活。教育部發(fā)文,機器人與編程被列入2018高中必修課。機器人素質(zhì)教育進入校園,其核心概念是機器學習。機器學習在諸多領域成功的應用與發(fā)展,己成為信息處理領域的基礎和熱點[1-2]。機器學習的相關的課程從研究生教育逐漸進入高中教育階段。作為一門實踐性極強的課程,其內(nèi)容自然聯(lián)系到諸多抽象概念和基礎課程。雖然,機器學習相關的教學課程及網(wǎng)上課堂很多[3],內(nèi)容也豐富多樣,但缺乏簡單易懂的案例教學。將復雜的內(nèi)容有效教授給學生、以及讓學生掌握其精粹、理解其內(nèi)涵是件艱巨的任務。通過案例場景引出相關概念、技術,以此為主線增強學生的學習信心可能是機器學習課程最有效的教學方法。一個具體案例能有效掌握主題、消除疑惑、理解抽象概念等方面取到舉一反三的目標[4]。

        從多年的教學工作當中發(fā)現(xiàn),大部分教材及參考書,注重抽象概念及普遍理論的講解。對于具體簡單的例子的講解案例嚴重缺乏。導致學習過程只是現(xiàn)成工具的套用,最終對抽象概念一知半解,越學越覺得吃力、脫離實踐、死記硬背。學習效率差,直接導致厭學。甚至有的學生直接提出“既然有很好的現(xiàn)成工具就不需要學習,直接應用即可”。

        機器學習方法之多,如 HMM、GMM、K-means、SVM、DNN等,內(nèi)容之抽象,很容易導致理論脫離實踐。本文采用比較直觀的例子“手寫數(shù)字的識別”作為例子講解一個以線性分類器為核心的機器學習方法。多維線性函數(shù)是SVM、DNN等效果比較好的機器學方法的基礎,直觀并易于理解、容易實現(xiàn)。對于初學者是個理想的實踐過程。

        1 模型的建立

        機器學習的目標可以是各種信息,包括視覺信號及聽覺信號等。比較典型的是語音及文字信息。其中文字圖像比較直觀,用于機器學習教學效果更好。但是手寫數(shù)字包含隨機變化成分,因為我們知道每個人書寫方式、習慣、大小、角度等不會完全一樣,相同的數(shù)字一個人寫兩次也不會完全一樣。但是每個文字或數(shù)字都有固定的模版。我們可以用模版的匹配度量來區(qū)分不同數(shù)字或進行分類。因此,即需要很好的機器學習模型,有需要大量樣本的訓練過程。

        可以用較復雜的概率統(tǒng)計概念來設計一個模型[3],也可以用簡單的線性函數(shù)來實現(xiàn)分類過程。機器學習模型需要在訓練樣本中訓練。類似于,一個小孩開始學習認知數(shù)字。先讓孩子學習各個數(shù)字,然后讓其辨認一些數(shù)字。剛開始,孩子雖然能正確辨認出比較規(guī)整的手寫數(shù)字,也會誤判一些寫的較潦草的數(shù)字。慢慢通過學習(學習各種手寫樣本)就能不斷提高準確率。

        機器學習過程需要模型和樣本兩部分,首先設計一個數(shù)學模型,其次在大量樣本上學習后調(diào)整模型的參數(shù),并用該模型去判斷新的手寫數(shù)字。公式(1)一個線性模型,是另外兩個重要機器學習模型的基礎,深度神經(jīng)網(wǎng)絡(DNN)和支持向量機(SVM)。

        設x0=1

        公式(2)計算結果是對某個樣本數(shù)字的特征向量X的預測值。機器學習的目的是提高該預測的正確率。這里要訓練的模型參數(shù)是W=[ ]w0,w1,…,wN。

        圖1 單個線性分類器模型

        輸入一系列樣本數(shù)據(jù)X(1),X(2),X(3),…我們的訓練目標是找到合適的參數(shù)W使得若(2)大于零則正確,小于零則錯誤。這是一個簡單的2類分類技術,即只能用于一個數(shù)字的辨認。

        訓練過程是一個循序漸進過程。先W給指定一個初始值,然后根據(jù)對樣本的識別結果進行調(diào)整。若有10個訓練樣本X(1),X(2),X(3),…,X(10)對應于0到9十個數(shù)字。模型的訓練目標是[…y(k)…] =[-1,…,-1,1,-1..],對應數(shù)字“3”時y(k)=1,其他都等于-1。假設,我們通過公式(2)計算出來的結果是“全部大于零”,則錯誤率是90%,若“全部小于零”,則錯誤率是10%。因為我們的目標是正確識別數(shù)字“3”。只有測試“3”時f(X)結果大于零,其他樣本時小于零才是正確的結果。即,正確識別結果應該是sign(f(X))=[-1,-1,-1,1,-1,…,-1]。

        循序漸進的方法是先設置多次循環(huán),每次循環(huán)給所有參數(shù)[w0,w1,…,wN]進行調(diào)整,最終獲得最佳參數(shù)W。每次對參數(shù)的微調(diào)方式是公式(3)

        其中,(y(k)-sign(f()X)決定調(diào)整的方向。若預測值和實際值相同則沒必要調(diào)整,否則向y(k)的方向進行調(diào)整。X(k)是調(diào)整的幅度,是線性函數(shù)的偏微分。

        雖然該例子很簡單,但是任何復雜的機器學習模型都是通過對公式(1)~(3)的改變或優(yōu)化獲得的,機器學習的核心思路沒變。若將公式(2)換成公式(4),模型就變成了標準的感知器(perceptron)模型。圖1顯示的是一個數(shù)據(jù)(如:數(shù)據(jù)“3”)的預測模型,10個這樣的模型并聯(lián)成起來就成了識別10個數(shù)據(jù)的單層原始神經(jīng)網(wǎng)絡模型。

        2 試驗數(shù)據(jù)準備

        圖像在計算機中的簡單(單色)表示方法是矩陣形式,如圖2。這些信號輸入機器學習模型時,需要轉換成一系列特征向量。特征向量可能是一維的,也可能是二維的。相應的特征數(shù)據(jù)有有統(tǒng)計特征、鉅、方向特征等等,也可能是圖像矩陣本身。

        在監(jiān)督機制建設中要重點強化企業(yè)的成本監(jiān)督和相關管理工作,要以成本作為監(jiān)督的目標,理順企業(yè)生產(chǎn)、管理的經(jīng)濟關系,從成本控制的角度構建起有針對性、可執(zhí)行的監(jiān)督平臺和監(jiān)督制度,真正將監(jiān)督工作的重點放在對企業(yè)各項成本的控制工作上,提升企業(yè)成本管理、運營管理的效率,打造企業(yè)在生產(chǎn)、管理和經(jīng)營上的經(jīng)濟、組織與成本優(yōu)勢。

        圖2 手寫數(shù)字矩陣實例

        數(shù)據(jù)準備過程需要圖像的采集、二值化、規(guī)范化、細化等過程。最終獲得大小規(guī)整的數(shù)字矩陣。圖2顯示一個數(shù)字矩陣,白色用0表示,黑色用1表示,就能獲得2維矩陣。

        大家可以自己找?guī)讉€人進行手寫數(shù)字的采樣和預處理過程。也可以直接用免費數(shù)據(jù)MNIST[5],MNIST提供了6萬個訓練樣本,和1萬個測試樣本,每個樣本是一個28×28矩陣。收集樣本時要注意,訓練樣本和測試樣本是不同人提供的。

        由于我們用的線性模型是一維向量模型,所以需要對二維向量進行降維、或直接將矩陣逐行拼接成一維向量。所有樣本X(1),X(2),X(3),…,X(N)和對應的正確數(shù)字標注[y(1),y(2),y(3),…,y(N)]交給模型。X(i)是個一定長度(28×28)的向量,y(i)是對應的標注信息,-1或 1,例如模型的目的是識別數(shù)字“3”則對應“3”的標注是1,其他都是-1。訓練結束后,在獨立的測試樣本上進行測試并獲得試驗結果。

        3 實現(xiàn)過程

        模型實現(xiàn)方法比較簡單,大家可以用任何編程語言,如:Python,C,MATLAB等,實現(xiàn)。如下我們提供的偽代碼。其中X是所有訓練數(shù)據(jù),每行是一個樣本,總行數(shù)M是總樣本數(shù),列數(shù)是一維特征向量,長度為N,注意x0=1,即將矩陣X的第一列全設置成1,對應的參數(shù)w0成為偏移量。實際信號的特征值長度是N-1。Function Linear_model(X,Y) {

        [M,N]=size(X) #獲得樣本數(shù)M,和向量長度N

        W=ones(N) #參數(shù)初始化成全1的向量

        err=0 #錯誤率,初始化

        while(err>0.1) #err是錯誤率?;蛘呖梢匝h(huán)100次

        {

        for i=1:M #循環(huán)計算每個樣本的預測值,并對參數(shù)更新

        {

        Fx=sign(W*X[i,:]) # 注意矢量相乘,X[i,:]需要轉值

        W=W+X[i,:]·(Y[i]-Fx)# 更新參數(shù)

        err=err+(Y[i]-Fx)/2 #錯誤累加

        }

        err=err/M #錯誤率

        }

        return W }

        我們?nèi)×?0個人的200個樣本數(shù)據(jù)進行訓練,并在少量測試數(shù)據(jù)上進行測試,錯誤率為22%。這只是一個數(shù)字的識別過程,要實現(xiàn)10個手寫數(shù)字的識別模型,簡單的并聯(lián)即可。

        4 結語

        《機器學習》作為一門實踐性極強的課程,其內(nèi)容自然和諸多抽象概念和基礎課程有關。將這些內(nèi)容有效教授給學生,以及讓學生掌握其精粹、理解其內(nèi)涵是件艱巨的任務。本文以教學為目的介紹了一個簡單且典型的機器學習模型機器設計和訓練過程。雖然關于機器學習的書籍及參考資料很多,對于初學者的簡單案例教學形式的材料嚴重缺乏。因此,盡量用通俗易懂的方式講解了機器學習完整過程,避免了概念的抽象化,注重具體細節(jié)和實現(xiàn)過程。難免有不足之處,希望大家批評指正。

        參考文獻:

        [1]余明華,馮翔,祝智庭.人工智能視域下機器學習的教育應用與創(chuàng)新探索.遠程教育雜志,2017-05-20.

        [2]鄧志鴻,謝昆青.機器學習課程的教學實踐——以北京大學“智能科學與技術”本科專業(yè)為例.計算機教育,2016-10-10.

        [3]Christopher Bishop.“Pattern Recognition and Machine Learning”.Springer press,2007.

        [4]李勇.本科機器學習課程教改實踐與探索.計算機教育,2015-07-10.

        [5]http://yann.lecun.com/exdb/mnist/.

        猜你喜歡
        錯誤率手寫機器學習
        手寫比敲鍵盤更有助于學習和記憶
        限制性隨機試驗中選擇偏倚導致的一類錯誤率膨脹*
        我手寫我心
        抓住身邊事吾手寫吾心
        基于集成學習的MINIST手寫數(shù)字識別
        電子制作(2018年18期)2018-11-14 01:48:08
        正視錯誤,尋求策略
        教師·中(2017年3期)2017-04-20 21:49:49
        基于機器學習的圖像特征提取技術在圖像版權保護中的應用
        基于網(wǎng)絡搜索數(shù)據(jù)的平遙旅游客流量預測分析
        時代金融(2016年27期)2016-11-25 17:51:36
        前綴字母為特征在維吾爾語文本情感分類中的研究
        科教導刊(2016年26期)2016-11-15 20:19:33
        基于支持向量機的金融數(shù)據(jù)分析研究
        亚洲妇女无套内射精| 亚洲粉嫩视频在线观看| 国产精品国三级国产a| 久久97久久97精品免视看 | 国产精品免费大片| 一本大道久久东京热无码av| 国产精品黄页免费高清在线观看| 华人免费网站在线观看| 人妻有码中文字幕| 欧美a视频在线观看| 男女午夜视频一区二区三区 | 大胆欧美熟妇xxbbwwbw高潮了| 少妇熟女淫荡丰满| 精品亚洲av乱码一区二区三区| 中文字幕乱码高清完整版| 黄又色又污又爽又高潮动态图| 久久洲Av无码西西人体| 亚洲av日韩专区在线观看| 樱桃视频影院在线播放| 久久久精品免费观看国产| 日韩少妇人妻一区二区| 中文字幕在线看精品乱码 | 天天爽夜夜爽人人爽一区二区 | 91白浆在线视频| 亚洲一级天堂作爱av| 亚洲 日本 欧美 中文幕| 国产在线观看免费观看| 亚洲精品99久久久久久| 国产精品国产自产拍高清| 久久综合九色综合97欧美| 日韩在线看片| 热综合一本伊人久久精品| 无码人妻精品一区二区三区蜜桃| 成人国产精品免费视频| 亚洲免费无毛av一区二区三区| 亚洲av熟女一区二区三区站| 40岁大乳的熟妇在线观看| 色伊人国产高清在线| 日本大片一区二区三区| 精品偷拍被偷拍在线观看| 国产精品密播放国产免费看 |