亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于決策樹(shù)雪花牛肉大理石花紋分級(jí)模型

        2015-01-03 01:14:44彭增起沈明霞林盛業(yè)
        食品科學(xué) 2015年17期
        關(guān)鍵詞:大理石花紋決策樹(shù)

        梁 琨,丁 冬,彭增起,沈明霞,*,林盛業(yè),曹 輝

        (1.南京農(nóng)業(yè)大學(xué)工學(xué)院,江蘇 南京 210031;2.江蘇省現(xiàn)代設(shè)施農(nóng)業(yè)技術(shù)與裝備工程實(shí)驗(yàn)室,江蘇 南京 210031;3.南京農(nóng)業(yè)大學(xué)食品科技學(xué)院,江蘇 南京 210095;4.陜西秦寶牧業(yè)股份有限公司,陜西 寶雞 721000)

        基于決策樹(shù)雪花牛肉大理石花紋分級(jí)模型

        梁 琨1,2,丁 冬1,彭增起3,沈明霞1,*,林盛業(yè)1,曹 輝4

        (1.南京農(nóng)業(yè)大學(xué)工學(xué)院,江蘇 南京 210031;2.江蘇省現(xiàn)代設(shè)施農(nóng)業(yè)技術(shù)與裝備工程實(shí)驗(yàn)室,江蘇 南京 210031;3.南京農(nóng)業(yè)大學(xué)食品科技學(xué)院,江蘇 南京 210095;4.陜西秦寶牧業(yè)股份有限公司,陜西 寶雞 721000)

        為建立雪花牛肉大理石花紋等級(jí)評(píng)價(jià)方法,根據(jù)不同等級(jí)雪花牛肉大理石花紋圖像特征及人工評(píng)級(jí)的標(biāo)準(zhǔn),確定了影響大理石花紋的等級(jí)主要因素。本研究提出影響大理石花紋等級(jí)的幾何參數(shù)特征、幾何分布參數(shù)特征和統(tǒng)計(jì)參數(shù)特征。其中幾何參數(shù)特征主要反映大理石花紋面積、周長(zhǎng)等;幾何分布特征主要反映大理石花紋圖像中脂肪顆粒沉積的密度,根據(jù)脂肪顆粒沉積情況可分為大顆粒脂肪、中顆粒脂肪、小顆粒脂肪等;統(tǒng)計(jì)參數(shù)特征主要反映大理石花紋豐富程度以及大理石花紋分布均勻性。利用相關(guān)性分析提取影響雪花牛肉大理石花紋等級(jí)的特征參數(shù)。建立基于C4.5和CART算法的決策樹(shù)模型,結(jié)果表明:對(duì)于C4.5算法建立的決策樹(shù)分級(jí)模型,三級(jí)和五級(jí)大理石花紋分級(jí)預(yù)測(cè)精度分別為91.80%、92.31%,而該模型針對(duì)四級(jí)樣本建立的模型無(wú)效,其結(jié)果多數(shù)誤判為三級(jí);對(duì)于CART算法建立的決策樹(shù)模型同樣存在這樣的問(wèn)題,即三級(jí)和五級(jí)大理石花紋分級(jí)預(yù)測(cè)精度高,而對(duì)四級(jí)樣本分級(jí)無(wú)效。

        雪花牛肉;大理石花紋;分級(jí)模型;決策樹(shù)

        雪花牛肉作為我國(guó)高檔牛肉,富含高濃度亞油酸以及鈣磷鐵等礦物質(zhì),牛的背最長(zhǎng)肌中沉積了雪花狀的豐富脂肪,這種分布形成了類(lèi)似大理石花紋圖案[1-2]。脂肪分布量不同,其大理石花紋等級(jí)亦不相同,脂肪分布越多,等級(jí)越高[3-4],因此大理石花紋可以作為評(píng)定雪花牛肉品質(zhì)主要指標(biāo)。近年來(lái)隨著人們生活水平的不斷提高,對(duì)雪花牛肉的需求量也不斷增大,而雪花牛肉等級(jí)不同其經(jīng)濟(jì)價(jià)值差別亦較大[5]。目前雪花牛肉分級(jí)主要采用人工分級(jí),存在主觀性強(qiáng)、易產(chǎn)生視覺(jué)疲勞等缺點(diǎn)[6],因此研究雪花牛肉大理石花紋等級(jí)識(shí)別方法對(duì)規(guī)范雪花牛肉市場(chǎng)、提高生產(chǎn)效率有重要意義。

        機(jī)器視覺(jué)技術(shù)被廣泛應(yīng)用于牛肉自動(dòng)分級(jí)檢測(cè)領(lǐng)域。Shiranita等[7]提取了牛肉大理石花紋圖像中肌內(nèi)脂肪面積比、脂肪顆??倲?shù)、大脂肪顆粒數(shù)、小脂肪顆粒數(shù)以及脂肪分布系數(shù),作為圖像特征分析結(jié)構(gòu)表明牛肉大理石花紋等級(jí)與肌內(nèi)脂肪面積比、大脂肪顆粒數(shù)和脂肪分布系數(shù)之間顯著相關(guān)。Jeyamkondan等[8]將牛胴體眼肌肌內(nèi)脂肪的面積、周長(zhǎng)以及脂肪顆粒數(shù)作為判定牛肉大理石花紋等級(jí)的特征參量,并且通過(guò)多元回歸分析得到數(shù)學(xué)模型與由專(zhuān)業(yè)牛肉質(zhì)量評(píng)定師判定的結(jié)果是等價(jià)的。孟祥艷[9]提取牛肉大理石花紋圖像的幾何、粒度及形狀參數(shù)來(lái)表征花紋幾何、形狀及分布特點(diǎn),利用主成分分析法對(duì)影響大理石花紋等級(jí)的參數(shù)進(jìn)行線性組合,建立大理石花紋的等級(jí)預(yù)測(cè)模型。周彤等[10]為評(píng)價(jià)大理石花紋的豐富程度,提取大理石花紋面積比值、大脂肪顆粒個(gè)數(shù)和密度、中等脂肪顆粒個(gè)數(shù)和密度、小脂肪顆粒個(gè)數(shù)和密度、總脂肪顆粒個(gè)數(shù)和密度、脂肪分布均勻度10個(gè)指標(biāo)為特征參數(shù)對(duì)牛肉大理石花紋進(jìn)行評(píng)。陳坤杰等[11-12]利用牛肉大理石花紋的面積比率、總脂肪顆粒數(shù)、大小脂肪顆粒數(shù)以及每個(gè)牛肉大理石花紋樣本圖像的計(jì)盒維數(shù)和信息維數(shù)這些參數(shù)為基礎(chǔ),分別建立了牛肉大理石花紋等級(jí)判定的多元線性模型和多元多項(xiàng)式模型。

        針對(duì)我國(guó)雪花牛肉大理石花紋的分級(jí)研究,研究學(xué)者取得了一定成果。劉超超[13]、李小林[6]等研制的基于嵌入式機(jī)器視覺(jué)技術(shù)雪花牛肉等級(jí)分級(jí)系統(tǒng),研究了屠宰車(chē)間生產(chǎn)環(huán)境中的胴體雪花牛肉圖像采集系統(tǒng),并利用圖像處理方法進(jìn)行了預(yù)處理、提取了大理石花紋圖像的花紋面積、周長(zhǎng)等特征。馬鵬鵬[14]研究了基于凹點(diǎn)檢測(cè)方法的雪花牛肉大理石花紋圖像分割。劉瓔瑛等[15]提出用粗糙度和細(xì)密度來(lái)定量描述脂肪的分布特征,并研究了兩個(gè)指標(biāo)能夠隨雪花牛肉大理石花紋脂肪含量的變化情況。但是針對(duì)雪花牛肉大理石花紋分級(jí)模型的研究相對(duì)較少。

        本實(shí)驗(yàn)在前人研究基礎(chǔ)上,提出了影響雪花牛肉大理石花紋等級(jí)的幾何參數(shù)、幾何分布參數(shù)和統(tǒng)計(jì)參數(shù)特征,分析每個(gè)特征大理石花紋等級(jí)之間的相關(guān)性,從而選擇建模有效的特征變量。研究利用決策樹(shù)方法建立雪花牛肉大理石花紋分級(jí)模型,分別建立基于C4.5算法和CART算法模型,比較兩種算法的預(yù)測(cè)精度,從而建立分級(jí)效果較好的決策樹(shù)模型。

        1 材料與方法

        1.1數(shù)據(jù)采集

        本研究實(shí)驗(yàn)數(shù)據(jù)采集于2012年5月—2013年7月期間在陜西秦寶牧業(yè)進(jìn)行,所選用雪花牛肉樣本來(lái)自陜西本地秦川牛與日本和牛、澳大利亞安格斯牛三元雜交肉牛,樣本屠宰后在冷庫(kù)車(chē)間排酸72 h后分割二分體。雪花牛肉眼肌橫切面圖像的獲取采用南京農(nóng)業(yè)大學(xué)自主研發(fā)的基于機(jī)器視覺(jué)雪花牛肉采集系統(tǒng),實(shí)驗(yàn)時(shí)采集牛胴體二分體第6至7根肋骨眼肌橫切面圖像,為保證圖像樣本的有效性和一致性,實(shí)驗(yàn)保持眼肌表面切割平整,無(wú)明顯刀痕、碎肉沫、水分等干擾,盡量保證不要有外界光線進(jìn)入采集密閉裝置,并使整個(gè)眼肌區(qū)域完整的處于采集圖像中心位置。實(shí)驗(yàn)共采集有效樣本222幅,其中一級(jí)至五級(jí)圖像樣本數(shù)量分別為15、75、88、25、19;樣本總量成正態(tài)分布,這與企業(yè)實(shí)際雪花牛肉生產(chǎn)數(shù)量相吻合。每一幅圖像人工等級(jí)根據(jù)日本雪花牛肉評(píng)級(jí)標(biāo)準(zhǔn)圖版進(jìn)行5個(gè)等級(jí)評(píng)定,最終結(jié)果為兩個(gè)或兩個(gè)以上評(píng)級(jí)員所評(píng)等級(jí)。利用圖像處理算法,將采集樣本圖像經(jīng)過(guò)灰度化、濾波、圖像增強(qiáng)、眼肌區(qū)域提取,大理石花紋提取等預(yù)處理[6]。

        1.2圖像特征提取與選擇

        1.2.1特征提取

        通過(guò)比較不同等級(jí)雪花牛肉大理石花紋圖像特征及人工評(píng)級(jí)的標(biāo)準(zhǔn),確定影響大理石花紋的等級(jí)主要因素。本研究提出影響大理石花紋等級(jí)的幾何參數(shù)特征、幾何分布參數(shù)特征和統(tǒng)計(jì)參數(shù)特征。其中幾何參數(shù)特征主要反映大理石花紋面積、周長(zhǎng)等[6];幾何分布特征主要反映大理石花紋圖像中脂肪顆粒沉積的密度,根據(jù)脂肪顆粒沉積情況可分為大顆粒脂肪、中顆粒脂肪、小顆粒脂肪等[10,12,16];統(tǒng)計(jì)參數(shù)特征主要反映大理石花紋豐富程度以及大理石花紋分布均勻性[15,17]。表1為提取的雪花牛肉大理石花紋圖像18個(gè)特征。

        表1 雪花牛肉大理石花紋圖像特征變量Table1 Image features of snowflake beef marbling

        雪花牛肉大理石花紋圖像的幾何參數(shù)特征是根據(jù)眼肌區(qū)域的大理石花紋的幾何特征進(jìn)行描述。眼肌總像素定義為圖像二值化算法處理后眼肌區(qū)域內(nèi)包括所有像素總和;眼肌面積為單位像素所對(duì)應(yīng)實(shí)際樣本的面積(cm2)與眼肌區(qū)域總像素乘積;大理石花紋含量為眼肌區(qū)域代表脂肪顆粒所有黑色聯(lián)通區(qū)域像素總和與眼肌區(qū)域總像素比;大理石花紋周長(zhǎng)定義眼肌面積內(nèi)所有代表脂肪顆粒所有黑色聯(lián)通區(qū)域周長(zhǎng)總和;輪廓面積比定義為大理石花紋周長(zhǎng)比眼肌面積;輪廓周長(zhǎng)比定義為大理石花紋周長(zhǎng)比眼肌周長(zhǎng)。

        根據(jù)采用硬件相機(jī)的放大倍數(shù)下所拍攝的眼肌圖片與人眼觀測(cè)下的眼肌花紋辨析度,確定本研究中顆粒脂肪定義。其中,小顆粒脂肪數(shù)量為孤立的連通區(qū)域像素個(gè)數(shù)在20~50個(gè)像素之間的連通區(qū)域個(gè)數(shù);中顆粒脂肪數(shù)量為孤立的連通區(qū)域像素個(gè)數(shù)在50~450個(gè)像素之間的連通區(qū)域個(gè)數(shù);大顆粒脂肪數(shù)量為孤立的連通區(qū)域的像素個(gè)數(shù)在450個(gè)像素以上的連通區(qū)域個(gè)數(shù)。小顆粒數(shù)量密度為小顆粒的總像素/眼肌總像素,小顆粒分布密度為小顆粒的總個(gè)數(shù)比眼肌區(qū)域面積(cm2);中顆粒與大顆粒數(shù)量密度和分布密度定義與之類(lèi)似。

        統(tǒng)計(jì)參數(shù)特征定義根據(jù)脂肪面積差異均勻性和脂肪數(shù)量及位置分布均勻性。粗糙度主要指大理石花紋中各個(gè)脂肪面積之間的差異性,大理花紋脂肪顆粒面積分布越不均勻,其粗糙度越大。細(xì)密度主要表示大理石花紋中脂肪數(shù)量的分布,大理石花紋面積相同的樣本中,脂肪顆粒數(shù)量越多,其大理石花紋細(xì)密度越大。大理石花紋粗糙度及細(xì)密度測(cè)量參照文獻(xiàn)中方法計(jì)算[15],公式(1)為粗糙度(C)計(jì)算公式,公式(2)為細(xì)密度(F)計(jì)算公式,脂肪顆粒相對(duì)標(biāo)準(zhǔn)差表示脂肪分布均勻度,也即脂肪顆粒分布變異系數(shù)(α),計(jì)算方法如公式(3)所示。

        式中:n為大理石花紋中提取的脂肪數(shù)量;[M1, M2,…, Mn]為各個(gè)脂肪的面積;為脂肪平均面積;Sr為有效切面的面積。

        1.2.2特征選擇

        為了保證利用高效的特征變量建立模型,本實(shí)驗(yàn)研究提取的雪花牛肉圖像特征變量與人工評(píng)定等級(jí)之間的相關(guān)性分析,根據(jù)相關(guān)系數(shù)選擇針對(duì)有效模型的特征變量,相關(guān)系數(shù)(r)計(jì)算如公式(4)所示。

        式中:n為樣本總數(shù);xi為特征變量中第i個(gè)樣本;為特征變量樣本平均值;yi為等級(jí)變量第i個(gè)樣本;為等級(jí)樣本平均值。

        1.3決策樹(shù)模型建立

        在建立決策樹(shù)模型時(shí),根據(jù)分裂準(zhǔn)則的不同,可采用基于信息論(information theory)和最小GINI指示(lowest GINI index)兩種方法[18]。本實(shí)驗(yàn)分別采用基于信息論方法構(gòu)建C4.5算法和基于最小GINI指示方法構(gòu)建CART算法建立雪花牛肉大理石花紋分級(jí)模型,比較兩種算法的訓(xùn)練集樣本和驗(yàn)證集樣本的分級(jí)準(zhǔn)確率,選擇較好的決策樹(shù)模型。為保證模型的準(zhǔn)確性而不出現(xiàn)過(guò)擬合的現(xiàn)象,選擇10折交叉驗(yàn)證(10-fold cross validation)估算訓(xùn)練集建立模型的準(zhǔn)確率。

        1.3.1基于C4.5算法決策樹(shù)模型

        C4.5算法計(jì)算信息增益比來(lái)確定每個(gè)節(jié)點(diǎn)的分類(lèi)屬性,每個(gè)節(jié)點(diǎn)軍訓(xùn)則具有最高信息增益比的屬性作為前節(jié)點(diǎn)的分裂屬性。這種屬性選擇方法使之后生成決策樹(shù)對(duì)訓(xùn)練樣本進(jìn)行分類(lèi)時(shí)所需信息最小。C4.5算法流程如下[19-20]:1)創(chuàng)建節(jié)點(diǎn)N;2)如果訓(xùn)練樣本T都屬于同一類(lèi)C,則N為葉節(jié)點(diǎn),標(biāo)記為類(lèi)C;3)如果訓(xùn)練樣本的屬性數(shù)為空,即沒(méi)有屬性進(jìn)行分裂,則T為葉節(jié)點(diǎn),標(biāo)記該節(jié)點(diǎn)為T(mén)中出現(xiàn)最多的類(lèi);4)如果不滿(mǎn)足2)、3),則計(jì)算訓(xùn)練樣本T各屬性信息增益率:假設(shè)T是一個(gè)訓(xùn)練樣本,樣本總量n屬于m各類(lèi)別,其中第i個(gè)類(lèi)在T中出現(xiàn)的比例為Pi,則T的信息熵(I(T))計(jì)算公式如下。

        若屬性A將T劃分為v個(gè)子集{T1,T2,…, Tv},其中Ti包含樣本數(shù)ni,則劃分后熵(E(A))計(jì)算公式如下。

        分裂后的信息增益(Gain(T,A))計(jì)算公式如下。

        訓(xùn)練樣本T關(guān)于屬性A的各取值的熵計(jì)算公式如下。

        式中:Ti為訓(xùn)練樣本T中A屬性第i各取值對(duì)應(yīng)的子集,屬性A劃分v個(gè)子集。則信息增益比計(jì)算公式如下。

        5)選擇各屬性中具有最高信息增益率的屬性作為分裂屬性,將訓(xùn)練樣本分割;該屬性的各個(gè)取值對(duì)應(yīng)生成心的子節(jié)點(diǎn);6)對(duì)每個(gè)從節(jié)點(diǎn)N長(zhǎng)出的新子節(jié)點(diǎn)進(jìn)行判斷。如果葉節(jié)點(diǎn)對(duì)應(yīng)的子集為空,則分裂該葉節(jié)點(diǎn)生成一個(gè)新葉節(jié)點(diǎn),否則在該子節(jié)點(diǎn)上重復(fù)步驟2)、6)繼續(xù)分裂;7)計(jì)算每個(gè)節(jié)點(diǎn)分類(lèi)錯(cuò)誤,進(jìn)行剪枝;8)建立最終決策樹(shù)模型。

        1.3.2 基于CART算法決策樹(shù)模型

        CART算法最早由Breiman等[21]提出,是一種有監(jiān)督學(xué)習(xí)算法,可以處理高度傾斜或多態(tài)的數(shù)值型數(shù)據(jù)。CART使用二叉樹(shù)將預(yù)測(cè)空間遞歸地劃分為若干子集,樹(shù)中的葉節(jié)點(diǎn)對(duì)應(yīng)于不同的劃分區(qū)域,劃分是由與每個(gè)內(nèi)部節(jié)點(diǎn)相關(guān)的分支規(guī)則確定的。通過(guò)從根節(jié)點(diǎn)到葉竹點(diǎn)的路徑,一個(gè)預(yù)測(cè)樣本就被賦予一個(gè)唯一的葉節(jié)點(diǎn),類(lèi)別也就得到確定[22]。在此算法中[23-24],對(duì)于每個(gè)屬性,執(zhí)行該屬性上的一個(gè)劃分,計(jì)算劃分GINI系數(shù)。

        式中:pj為訓(xùn)練樣本集T包含j的概率,若N屬性中具有最小GINI系數(shù)的屬性,劃分T為T(mén)1、T2子集,此時(shí)劃分的GINI系數(shù)為:

        式中:S為T(mén)樣本個(gè)數(shù),S1、S2分別為T(mén)1、T2的樣本個(gè)數(shù)。

        1.4數(shù)據(jù)處理

        圖像處理及特征提取程序采用VC++6.0編寫(xiě)。利用SPSS 16.0軟件進(jìn)行數(shù)據(jù)統(tǒng)計(jì)及相關(guān)性分析選擇決策樹(shù)建模有效的特征變量;決策樹(shù)模型C4.5和CART算法利用MATLAB 2012a軟件編寫(xiě)。

        2 結(jié)果與分析

        2.1圖像特征提取及選擇

        提取的雪花牛肉大理石花紋圖像特征能否如實(shí)反映花紋等級(jí)取決于特征與等級(jí)之間的契合度。為了衡量提取的圖像特征的評(píng)級(jí)有效性,利用SPSS 16.0軟件對(duì)提取的18 個(gè)圖像特征與大理石花紋等級(jí)進(jìn)行相關(guān)性分析,其分析結(jié)果如表2所示。眼肌總像素(V1)、眼肌面積(V2)、小顆粒脂肪個(gè)數(shù)(V7)、小顆粒脂肪數(shù)量密度(V8)、小顆粒脂肪分布密度(V9)這5 個(gè)特征變量與大理石花紋等級(jí)在α=0.05顯著水平下沒(méi)有顯著相關(guān)性。大理石花紋含量(V3)和大顆粒脂肪數(shù)量密度(V14)與等級(jí)之間相關(guān)性較高,相關(guān)系數(shù)分別為0.906、0.879。因此本研究利用除去眼肌總像素(V1)、眼肌面積(V2)、小顆粒脂肪個(gè)數(shù)(V7)、小顆粒脂肪數(shù)量密度(V8)、小顆粒脂肪分布密度(V9)這5 個(gè)特征剩下的13 個(gè)特征建立決策樹(shù)分級(jí)模型。

        表2 雪花牛肉大理石花紋圖像特征與等級(jí)相關(guān)性分析Table2 Correlation analysis of snowflake beef marbling image features with graddeess

        2.2決策樹(shù)模型建立

        實(shí)驗(yàn)共采集有效樣本222幅,其中一級(jí)至五級(jí)圖像樣本數(shù)量分別為15、75、88、25、19;本研究為了建立模型的有效性、準(zhǔn)確性,分別從每個(gè)等級(jí)取70%樣本作為訓(xùn)練集樣本,取每個(gè)等級(jí)樣本的30%作為驗(yàn)證集樣本。直接用連續(xù)屬性對(duì)決策樹(shù)節(jié)點(diǎn)進(jìn)行分支,會(huì)產(chǎn)生大量的子節(jié)點(diǎn),而且這些子節(jié)點(diǎn)基本多是純節(jié)點(diǎn),即每個(gè)新產(chǎn)生的節(jié)點(diǎn)中的數(shù)據(jù)都屬于同一類(lèi)無(wú)法再分。這將導(dǎo)致決策樹(shù)過(guò)度細(xì)化,直接影響分類(lèi)器的分類(lèi)性能[25]。因此本研究采用無(wú)監(jiān)督等寬方法對(duì)提取的13個(gè)有效特征進(jìn)行離散化,即將每個(gè)特征取值按照最小到最大值的值域等分10份,然后將每個(gè)特征取值按照不同區(qū)間映射到不同的離散值。利用10折交叉驗(yàn)證方法建立決策樹(shù)C4.5和CART算法模型。

        基于C4.5算法建立的決策樹(shù)模型枝葉節(jié)點(diǎn)個(gè)數(shù)為28,其模型算法描述如下:

        基于CART算法建立的決策樹(shù)模型枝葉節(jié)點(diǎn)個(gè)數(shù)為4,其模型算法描述如下:

        表3和表4分別為基于C4.5和CART算法建立決策樹(shù)模型分級(jí)結(jié)果,由表3、4可知,基于C4.5算法建立的決策樹(shù)識(shí)別模型訓(xùn)練樣本分級(jí)準(zhǔn)確率為76.92%,驗(yàn)證樣本分級(jí)準(zhǔn)確率為71.21%;其結(jié)果分別低于基于CART算法建立的模型準(zhǔn)確率(訓(xùn)練樣本77.56%,驗(yàn)證樣本74.24%)。因此,基于CART算法的決策樹(shù)模型優(yōu)于C4.5算法的模型。

        對(duì)于C4.5算法建立的決策樹(shù)分級(jí)模型,三級(jí)和五級(jí)大理石花紋分級(jí)預(yù)測(cè)精度高(分別為91.80%、92.31%),而該模型針對(duì)四級(jí)樣本建立的模型無(wú)效,其結(jié)果多數(shù)誤判為三級(jí);對(duì)于CART算法建立的決策樹(shù)模型同樣存在這樣的問(wèn)題,即三級(jí)和五級(jí)大理石花紋分級(jí)預(yù)測(cè)精度高,四級(jí)樣本分級(jí)無(wú)效。主要原因:其一,雪花牛肉大理石花紋高端等級(jí)樣本比較少,因此在樣本采集時(shí)限制了樣本數(shù)量;其二,決策樹(shù)模型在三級(jí)、四級(jí)樣本預(yù)測(cè)時(shí)存在缺陷,因此在今后的工作中需要進(jìn)一步研究更適合雪花牛肉大理石花紋分級(jí)的模型。

        表3 基于C4.5算法的決策樹(shù)模型分級(jí)結(jié)果混淆矩陣Table3 Confusion matrix of decision tree classification results based on C4.5 algorithhmm

        表4 基于CART算法的決策樹(shù)模型分級(jí)結(jié)果混淆矩陣Table4 Confusion matrix of decision tree classification results based on CART algoritthhmm

        3 結(jié) 論

        根據(jù)雪花牛肉大理石花紋圖像特征及人工評(píng)級(jí)的標(biāo)準(zhǔn),提取影響大理石花紋的等級(jí)主要特征因素,包括幾何參數(shù)特征、幾何分布參數(shù)特征和統(tǒng)計(jì)參數(shù)特征的18個(gè)特征變量。分析大理石花紋圖像特征與等級(jí)之間的相關(guān)性,確定表征雪花牛肉大理石花紋等級(jí)的有效特征變量,分析結(jié)果表明除去眼肌總像素(V1)、眼肌面積(V2)、小顆粒脂肪個(gè)數(shù)(V7)、小顆粒脂肪數(shù)量密度(V8)、小顆粒脂肪分布密度(V9)這5個(gè)特征剩下的13個(gè)特征為分級(jí)有效特征。

        為提高模型的精確度,對(duì)13個(gè)特征進(jìn)行離散化預(yù)處理后建立10折交叉訓(xùn)練模型。分別利用C4.5算法和CART算法建立決策樹(shù)分級(jí)模型,兩種算法對(duì)應(yīng)的訓(xùn)練模型預(yù)測(cè)精度分別為76.92%、77.56%;驗(yàn)證樣本的預(yù)測(cè)精度分別為71.21%、74.23%。因此由此可知CART算法建立的決策樹(shù)模型精度比C4.5算法建立模型精度高。但是決策樹(shù)模型預(yù)測(cè)三級(jí)和五級(jí)大理石花紋分級(jí)預(yù)測(cè)精度高(均高于90%以上),而對(duì)四級(jí)樣本分級(jí)無(wú)效。

        [1] 桑國(guó)俊, 程強(qiáng). 我國(guó)雪花牛肉生產(chǎn)現(xiàn)狀與分析[J]. 中國(guó)牛業(yè)科學(xué), 2013, 39(2)∶ 1-5.

        [2] 丁君輝, 周萍芳, 楊眉. 我國(guó)肉牛產(chǎn)業(yè)的發(fā)展現(xiàn)狀[J]. 江西畜牧獸醫(yī)雜志, 2012(2)∶ 6-8.

        [3] CRAIGIE C R, NAVAJAS E A, PURCHAS R W, et al. A review of the development and use video image analysis for beef carcass evaluation as an alternative to the current ETROP system and other subjective systems[J]. Meat Science, 2012, 92(4)∶ 307-318.

        [4] 徐玉玲. 日本和?!燎卮ㄅ!涟哺袼古Hs交雪花牛胴體質(zhì)量及肉質(zhì)分析[D]. 蘭州∶ 甘肅農(nóng)業(yè)大學(xué), 2013.

        [5] 張路培, 袁崢嶸. 中國(guó)高檔牛肉市場(chǎng)現(xiàn)狀及發(fā)展趨勢(shì)展望[J]. 中國(guó)畜牧雜志, 2012, 48(4)∶ 34-40.

        [6] 李小林. 嵌入式機(jī)器視覺(jué)技術(shù)在雪花牛肉品質(zhì)檢測(cè)中的應(yīng)用研究[D].南京∶ 南京農(nóng)業(yè)大學(xué), 2013.

        [7] SHIRANITA K, HAYASHI K, OTSUBO A, et al. Gradingmeat quality by image processing[J]. Patten Recognition, 2000, 33∶ 97-104.

        [8] JEYAMKONDAN S, RAY N, KRANZLER G A, et al. Beef quality grading using machine vision[C]//Conference on Biological Quality and Precision Agriculture Ⅱ, Boston, USA∶ IEEE, 2000∶ 91-101.

        [9] 孟祥艷. 牛眼肌區(qū)域大理石花紋評(píng)級(jí)特征的研究[J]. 肉類(lèi)研究, 2011, 25(10)∶ 6-11.

        [10] 周彤, 彭彥昆. 牛肉大理石花紋圖像特征信息提取及自動(dòng)分級(jí)方法[J].農(nóng)業(yè)工程學(xué)報(bào), 2013, 29(15)∶ 286-293.

        [11] 陳坤杰, 姬長(zhǎng)英. 基于圖像運(yùn)算的牛肉大理石花紋分割方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2007, 38(5)∶ 195-196.

        [12] 陳坤杰, 吳貴茹, 於海明, 等. 基于分形維和圖像特征的牛肉大理石花紋等級(jí)判定模型[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2012, 43(5)∶ 147-151.

        [13] 劉超超, 彭增起, 沈明霞, 等. 牛胴體品質(zhì)檢測(cè)系統(tǒng)中基于嵌入式Linux的終端設(shè)計(jì)[J]. 食品工業(yè)科技, 2012, 33(7)∶ 336-339.

        [14] 馬鵬鵬. 雪花牛肉眼肌切面圖像處理與檢測(cè)算法研究[D]. 南京∶ 南京農(nóng)業(yè)大學(xué), 2014.

        [15] 劉瓔瑛, 沈明霞, 彭增起, 等. 雪花牛肉大理石花紋粗糙度和細(xì)密度的測(cè)定[J]. 食品科學(xué), 2013, 34(18)∶ 170-174. doi∶10.7506/spkx1002-6630-201318034.

        [16] 李瑋姿, 朱近, 楊德吉. 基于圖像的牛肉大理石紋理自動(dòng)評(píng)級(jí)方法研究[J]. 食品科學(xué), 2011, 32(9)∶ 40-45.

        [17] KUCHIDA K. Objective measurement of beef meat quality bycomputer image analysis method[C]//2011 International Conference on Beef Castle Improvement and Industrialization in China. Beijing, 2011.

        [18] 元昌安. 數(shù)據(jù)挖掘原理與SPSS Clementine應(yīng)用[M]. 北京∶ 電子工業(yè)出版社, 2009∶ 147-149.

        [19] 丁勝祥. 基于決策樹(shù)算法的洪水預(yù)報(bào)模型[J]. 水利發(fā)電, 2011, 37(7)∶ 8-12.

        [20] SUN Weixiang, CHEN Jin, LI Jiaqing. Decision tree and PCA-based fault diagnosis of rotating machinery[J]. Mechanical Systems and Signal Processing, 2007, 21(3)∶ 1300-1317.

        [21] BREIMAN L, FRIEDMAN J, OLSHEN R A, et al. Classification and regression trees[M]. Belmont∶ Wadsworth, 1984∶ 1-358.

        [22] 李琳. 基于決策樹(shù)的數(shù)據(jù)挖掘方法在化學(xué)模式分類(lèi)中的應(yīng)用[D]. 杭州∶ 浙江大學(xué), 2005.

        [23] 程鐵信, 郭濤, 祁昕. 決策樹(shù)分類(lèi)模型在工程項(xiàng)目評(píng)標(biāo)風(fēng)險(xiǎn)預(yù)警中的應(yīng)用[J]. 數(shù)理統(tǒng)計(jì)與管理, 2010, 29(1)∶ 122-128.

        [24] TURE M, TOKATLI F, KURT I. Using Kaplan-Meier analysis together with decision tree methods (CART, CHAID, QUEST, C4.5 and ID3) in determining recurrence-free survival of breast cancer patients[J]. Expert Systems with Applications, 2009, 36∶ 2017-2026.

        [25] 李春貴, 王萌, 孫自廣, 等. 屬性頻率劃分和信息熵離散化的決策樹(shù)算法[J]. 計(jì)算機(jī)工程與應(yīng)用, 2009, 45(12)∶ 153-156.

        Classification of Snowflake Beef Marbling Grades Based on Decision Tree

        LIANG Kun1,2, DING Dong1, PENG Zengqi3, SHEN Mingxia1,*, LIN Shengye1, CAO Hui4(1. College of Engineering, Nanjing Agricultural University, Nanjing 210031, China; 2. Jiangsu Province Engineering Laboratory for Modern Facility Agriculture Technology and Equipment, Nanjing 210031, China; 3. College of Food Science and Technology, Nanjing Agricultural University, Nanjing 210095, China; 4. Limited Liability Company of Qin Bao Animal Husbandry in Shaanxi Province, Baoji 721000, China)

        In order to establish a method to evaluate snowflakes beef marbling grades, the main factors affecting grading marbling were identified by comparing the image features with artificial rating criteria of different snowflakes beef marbling grades. This study presented the geometric feature parameters, geometric distribution feature parameters and statistical feature parameters affecting marbling grade. The geometric feature parameters mainly reflected the marbling area, perimeter and so on. The geometric distribution feature parameters mainly reflected the different deposition densities of large, medium and small fat particles in the marbling image. The statistical feature parameters mainly reflected the marbling abundance and marbling distribution uniformity. Correlation analysis between the features parameters extracted and snowflake beef marbling grades was conducted. Decision tree models were established based on C4.5 and CART algorithm, and the results showed that the prediction accuracy of three-level and five-level grades were 91.80%and 92.31%, respectively, however, the model for the four-level sample model was invalid and the misjudgment results were mostly three-level. The same problem existed in the prediction accuracy of models based on CART algorithm.

        snowflake beef; marbling; classification model; decision tree

        TS251.3

        1002-6630(2015)17-0065-06

        10.7506/spkx1002-6630-201517013

        2015-02-03

        國(guó)家現(xiàn)代農(nóng)業(yè)(肉牛)產(chǎn)業(yè)技術(shù)體系建設(shè)專(zhuān)項(xiàng)(CARS-38);中央高?;究蒲袠I(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金項(xiàng)目(KJQN201557);農(nóng)業(yè)科技成果轉(zhuǎn)化資金項(xiàng)目(SQ2011ECC100043);南京農(nóng)業(yè)大學(xué)科研啟動(dòng)基金項(xiàng)目(RCQD13-15)

        梁琨(1983—),女,講師,博士,主要從事農(nóng)產(chǎn)品檢測(cè)技術(shù)研究。E-mail:lkbb2006@126.com

        *通信作者:沈明霞(1964—),女,教授,博士,主要從事檢測(cè)技術(shù)自動(dòng)化裝置研究。E-mail:mingxia@njau.edu.cn

        猜你喜歡
        大理石花紋決策樹(shù)
        大理石
        遼河(2021年12期)2021-12-24 00:39:04
        如何讓大理石呈現(xiàn)更好的裝飾效果
        石材(2020年6期)2020-08-24 08:26:58
        一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
        涂顏色
        啟蒙(3-7歲)(2019年1期)2019-01-03 02:11:56
        天然大理石教堂
        決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        冰雪路面轎車(chē)輪胎
        橡膠科技(2018年7期)2018-02-16 23:46:02
        大理石畫(huà)賞玩的傳承與創(chuàng)新
        寶藏(2017年11期)2018-01-03 06:45:46
        輪胎花紋的秘密
        基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別
        久久久久国产一区二区三区 | 亚洲一区二区日韩在线| 久久精品亚洲国产av网站| 亚洲一区中文字幕视频| 男人天堂插插综合搜索| 国产精品国产三级国产av中文| 午夜人妻久久久久久久久| 亚洲欧美v国产一区二区| 看av免费毛片手机播放| 亚洲av无码日韩精品影片| 暖暖免费 高清 日本社区在线观看| 国产在线观看黄| 一区二区三区精品偷拍av| 亚洲精品岛国av一区二区| 中文字幕日韩人妻在线视频| 欧美真人性野外做爰| 久久av无码精品人妻出轨| 久久精品中文字幕第一页| 亚洲素人日韩av中文字幕| 亚洲精品一区二区在线免费观看| 蜜桃视频国产一区二区| 亚洲开心婷婷中文字幕| 激情综合色综合啪啪五月丁香| 黑人玩弄人妻中文在线| 国产高潮精品久久AV无码 | 色噜噜狠狠狠综合曰曰曰| 无码人妻丰满熟妇区毛片| 欧美成人中文字幕| 欧美zozo另类人禽交| 在线观看中文字幕不卡二区 | 亚洲综合一区中文字幕| 日本丰满少妇裸体自慰| 骚小妹影院| 在线无码精品秘 在线观看| 少妇高潮免费在线观看| 伊人情人色综合网站 | 亚洲av无码之日韩精品| 亚洲午夜精品久久久久久抢| 久久国产精品av在线观看| 在线a亚洲视频播放在线播放| 亚洲熟妇无码一区二区三区导航 |