郭承湘?劉姝 王思宇
摘 要:近年來(lái),網(wǎng)絡(luò)餐飲的快速發(fā)展給人們的用餐提供了更豐富的選擇和極大的便利。但同時(shí),對(duì)網(wǎng)絡(luò)餐飲商家的監(jiān)管也面臨著全新的挑戰(zhàn)。本文提出一種用于評(píng)估網(wǎng)絡(luò)餐飲商家風(fēng)險(xiǎn)的方法。首先通過(guò)爬蟲(chóng)從三大點(diǎn)餐平臺(tái)(餓了么、美團(tuán)和百度)爬取商家基本信息、證照信息和評(píng)論信息。然后通過(guò)基于深度學(xué)習(xí)的圖像和文本識(shí)別技術(shù),判斷商家是否存在違規(guī)行為。最后使用層次分析構(gòu)建商家違規(guī)風(fēng)險(xiǎn)的整體評(píng)價(jià)模型。
關(guān)鍵詞:網(wǎng)絡(luò)餐飲監(jiān)管;風(fēng)險(xiǎn)評(píng)估模型;食品安全;深度學(xué)習(xí)
1 網(wǎng)絡(luò)餐飲服務(wù)概述
近年來(lái),“互聯(lián)網(wǎng)+餐飲服務(wù)”等新興業(yè)態(tài)快速發(fā)展,網(wǎng)絡(luò)餐飲服務(wù)在促進(jìn)了餐飲業(yè)發(fā)展的同時(shí),也對(duì)食品安全監(jiān)管提出了重大挑戰(zhàn)。黨的第十九次全國(guó)代表大會(huì)報(bào)告中明確指出“實(shí)施食品安全戰(zhàn)略,讓人民吃得放心”。國(guó)家十三五食品安全規(guī)劃也明確指出“嚴(yán)格互聯(lián)網(wǎng)食品經(jīng)營(yíng)、網(wǎng)絡(luò)訂餐等新業(yè)態(tài)監(jiān)管。加強(qiáng)互聯(lián)網(wǎng)食品經(jīng)營(yíng)網(wǎng)上監(jiān)測(cè)能力建設(shè),實(shí)施‘ 互聯(lián)網(wǎng)+食品安全監(jiān)管項(xiàng)目,推進(jìn)食品安全監(jiān)管大數(shù)據(jù)資源共享和應(yīng)用,提高監(jiān)管效能?!贬槍?duì)網(wǎng)絡(luò)餐飲的快速發(fā)展所帶來(lái)的諸多問(wèn)題,國(guó)家食品藥品監(jiān)督管理局相繼出臺(tái)了《網(wǎng)絡(luò)食品安全違法行為查處辦法》《網(wǎng)絡(luò)餐飲服務(wù)監(jiān)督管理辦法》征求意見(jiàn),并于2017年11月10日正式頒布《網(wǎng)絡(luò)餐飲服務(wù)食品安全監(jiān)督管理辦法》。各項(xiàng)政策均明確指出要加強(qiáng)網(wǎng)絡(luò)餐飲服務(wù)食品安全監(jiān)督管理、規(guī)范網(wǎng)絡(luò)餐飲服務(wù)經(jīng)營(yíng)行為、保證餐飲食品安全。
CNNIC第41次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,2017年中國(guó)網(wǎng)上外賣(mài)增長(zhǎng)明顯,用戶年增長(zhǎng)率達(dá)到64.6%,中國(guó)餐飲O2O行業(yè)市場(chǎng)規(guī)模已達(dá)7 799.6億元,較去年同期增長(zhǎng)87%[1],網(wǎng)絡(luò)餐飲市場(chǎng)規(guī)模快速擴(kuò)張帶動(dòng)行業(yè)發(fā)展的同時(shí)也埋下了不少食品安全隱患。2016年央視“3.15晚會(huì)”上對(duì)無(wú)證商戶利用第三方平臺(tái)從事網(wǎng)絡(luò)訂餐服務(wù),且餐飲實(shí)體店在制售過(guò)程中的食品安全隱患進(jìn)行了“大揭底”,在全社會(huì)引起了不小轟動(dòng)。由于網(wǎng)絡(luò)餐飲服務(wù)第三方平臺(tái)責(zé)任落實(shí)不到位、入網(wǎng)餐飲服務(wù)提供者良莠不齊、網(wǎng)絡(luò)餐飲虛擬性和跨地域特點(diǎn)等原因,網(wǎng)絡(luò)餐飲的監(jiān)管難度較大,傳統(tǒng)監(jiān)管模式難以應(yīng)對(duì)海量、復(fù)雜的監(jiān)管需求。
針對(duì)我國(guó)現(xiàn)在網(wǎng)絡(luò)餐飲商家存在的種種問(wèn)題,研究者們更多地從責(zé)任主體、政策應(yīng)對(duì)措施和防范方法等方面進(jìn)行討論和研究[2-5],卻鮮有研究針對(duì)如何及時(shí)發(fā)現(xiàn)商家違規(guī)問(wèn)題。綜上所述,文本提出一種用于對(duì)網(wǎng)絡(luò)餐飲商家違規(guī)風(fēng)險(xiǎn)的評(píng)估模型,旨在幫助監(jiān)管單位及時(shí)發(fā)現(xiàn)存在違規(guī)可能性的高風(fēng)險(xiǎn)商家。本文提出的商家違規(guī)風(fēng)險(xiǎn)評(píng)估模型從證照是否公示、評(píng)論情感、是否超范圍經(jīng)營(yíng)和平臺(tái)店鋪評(píng)分四方面進(jìn)行評(píng)價(jià)。首先使用網(wǎng)絡(luò)爬蟲(chóng)從“美團(tuán)”“百度外賣(mài)”(已更名為“星選”)“餓了么”三大外賣(mài)平臺(tái)爬取餐飲商家的基本信息(包含店鋪評(píng)分、售賣(mài)商品名稱、店鋪名等)、證照信息和評(píng)論信息。使用ResNet深度神經(jīng)網(wǎng)絡(luò)構(gòu)建證照分類(lèi)模型,判斷商家是否上傳了相關(guān)證照;使用TextCNN算法對(duì)評(píng)論進(jìn)行情感分析,計(jì)算評(píng)論差評(píng)率;使用改進(jìn)的RNN算法判斷是否存在超范圍經(jīng)營(yíng)。最后使用層次分析法來(lái)綜合上述四方面得到商家違規(guī)風(fēng)險(xiǎn)。
2 證照未公示檢測(cè)算法
按照我國(guó)相關(guān)法律法規(guī)要求,網(wǎng)絡(luò)餐飲商家需要公示“食品經(jīng)營(yíng)許可證”或“餐飲服務(wù)許可證”。檢測(cè)網(wǎng)絡(luò)餐飲商家證照是否公示的基本方法是:通過(guò)使用構(gòu)建的證照分類(lèi)模型,識(shí)別網(wǎng)絡(luò)餐飲商家公示的所有證照的類(lèi)型,再判斷其中是否包含“食品經(jīng)營(yíng)許可證”或“餐飲服務(wù)許可證”。為此,采用ResNet網(wǎng)絡(luò)進(jìn)行證照分類(lèi)。
與通常的DCNN(Deep Convolu-
tional Neural Network,深度卷積神經(jīng)網(wǎng)絡(luò))相比,ResNet將網(wǎng)絡(luò)的基本構(gòu)成模塊替換為殘差模塊,其示意圖如圖1所示。
殘差模塊中的跳躍連接能夠大大降低因?yàn)榫W(wǎng)絡(luò)層數(shù)增加而導(dǎo)致的梯度消失問(wèn)題。因此通常ResNet網(wǎng)絡(luò)的層數(shù)很深,且效果也較一般卷積網(wǎng)絡(luò)要好。本文使用ResNet34模型。模型訓(xùn)練采用20 000張經(jīng)人工標(biāo)注的證照數(shù)據(jù),標(biāo)注類(lèi)型包括六大類(lèi):營(yíng)業(yè)執(zhí)照、食品經(jīng)營(yíng)許可證、網(wǎng)絡(luò)餐飲許可證、三小備案證、食品流通許可證和其他(如藥品經(jīng)營(yíng)許可證)。在模型訓(xùn)練完成后,使用另外7 388張經(jīng)人工標(biāo)注的證照進(jìn)行模型測(cè)試,其準(zhǔn)確率達(dá)99.419%。
為了判斷商家是否存在證照未公示情況,對(duì)商家的所有證照使用模型進(jìn)行類(lèi)別判斷,只要其中包含“食品經(jīng)營(yíng)許可證”或“網(wǎng)絡(luò)餐飲許可證”,則判斷為“證照已公示”;否則將商家判斷為“證照未公示”。
3 超范圍經(jīng)營(yíng)檢測(cè)算法
超范圍經(jīng)營(yíng)檢測(cè)算法用于檢測(cè)網(wǎng)絡(luò)餐飲商家售賣(mài)的商品是否超出了其許可證規(guī)定的范圍。根據(jù)國(guó)家相關(guān)法律法規(guī)規(guī)定,網(wǎng)絡(luò)餐飲商家售賣(mài)的商品分為以下幾類(lèi):預(yù)包裝食品、散裝食品、熱食類(lèi)食品、冷食類(lèi)食品、生食類(lèi)食品、糕點(diǎn)類(lèi)食品和自制飲品。超范圍經(jīng)營(yíng)檢測(cè)算法的基本原理為:通過(guò)使用店鋪名和其售賣(mài)的商品名稱來(lái)確定商品所屬類(lèi)別,進(jìn)而判斷店鋪的經(jīng)營(yíng)范圍,然后與其許可證允許范圍進(jìn)行比較,判斷是否存在超范圍經(jīng)營(yíng)情況。
因?yàn)榈赇伱褪圪u(mài)商品名通常僅包含數(shù)個(gè)中文字符,因此直接以單個(gè)字符對(duì)店鋪名和商品名進(jìn)行分割。在此基礎(chǔ)上,使用word2vec算法對(duì)數(shù)據(jù)集中的每個(gè)中文字計(jì)算其字表示向量。word2vec使用語(yǔ)言學(xué)中的分布式假設(shè),即認(rèn)為文字的語(yǔ)義信息能夠從其上下文中推斷出來(lái)。為此,將每一個(gè)中文字表示為一個(gè)固定維度大小的向量,并用公式(1)表示兩個(gè)詞的條件概率。
其中vw表示詞w的詞向量,V表示整個(gè)詞表。Word2vec的優(yōu)化目標(biāo)為給定一個(gè)詞w,使得其上下文context(w)出現(xiàn)的聯(lián)合概率最大化,即(如圖2所示)。
max p(context(w)|w)(2)
在假設(shè)任意兩個(gè)條件概率相互獨(dú)立的情況下,上式可改寫(xiě)為:
優(yōu)化式(3)等價(jià)于優(yōu)化其對(duì)數(shù)函
使用梯度下降優(yōu)化上述目標(biāo)函數(shù),即可得到每個(gè)中文字的向量。為了判斷商家p售賣(mài)的商品q所屬的類(lèi)別,首先使用訓(xùn)練好的字向量使用連續(xù)詞袋模型來(lái)對(duì)其進(jìn)行表征,然后使用店鋪p的表征向量與商品q的表征向量進(jìn)行拼接,得到最終表征。
最后使用一個(gè)包含兩層隱層的多層感知器來(lái)訓(xùn)練商品名類(lèi)型識(shí)別模型。對(duì)于每個(gè)店鋪,使用訓(xùn)練好的模型來(lái)判斷其每個(gè)商品所屬的類(lèi)別,最后與其許可證的經(jīng)營(yíng)范圍進(jìn)行比較,若存在超出許可證范圍的商品,則判斷商家存在超范圍經(jīng)營(yíng)行為。
4 評(píng)論情感分析算法
本文采用TextCNN來(lái)實(shí)現(xiàn)評(píng)論情感分析。TextCNN的網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
在TextCNN中,一條評(píng)論被表示為一個(gè)M×N的矩陣,其中M為該評(píng)論中單詞的數(shù)量;N為單詞的詞向量維度。詞向量的計(jì)算方法與第3節(jié)中介紹的字向量的計(jì)算方式一致。評(píng)論矩陣經(jīng)過(guò)卷積核后得到多個(gè)特征圖,通過(guò)對(duì)特征圖中的元素進(jìn)行最大池化操作得到具有較強(qiáng)表征能力的特征。最后通過(guò)全連接softmax實(shí)現(xiàn)分類(lèi)。
TextCNN對(duì)于處理評(píng)論情感分析有效的主要原因在于評(píng)論的情感通常僅僅由句子中的幾個(gè)關(guān)鍵詞來(lái)表征,因此只要能夠讓算法自動(dòng)捕獲住這些表征情感的關(guān)鍵詞,就能得到較好的效果。而TextCNN使用較小的卷積核,這能讓算法更加容易發(fā)現(xiàn)短詞語(yǔ)與評(píng)論情感之間的關(guān)系。TextCNN與經(jīng)典的N-Gram模型具有相似的效果,但無(wú)需事先建立所有詞的Gram詞組,因此更加高效。為了訓(xùn)練TextCNN模型,首先挑選出3萬(wàn)條評(píng)論數(shù)據(jù),將其標(biāo)注為好評(píng)、中評(píng)和差評(píng)中的一類(lèi)。然后通過(guò)TextCNN算法進(jìn)行學(xué)習(xí),得到評(píng)論情感分析模型。
5 網(wǎng)絡(luò)餐飲商家風(fēng)險(xiǎn)評(píng)估
對(duì)網(wǎng)絡(luò)餐飲商家進(jìn)行風(fēng)險(xiǎn)評(píng)估需要用到四個(gè)因素:證照是否公示、是否超范圍經(jīng)營(yíng)、負(fù)面評(píng)論占比和店鋪評(píng)分。其中證照是否公示為取值0或1的布爾量,記為f1,其取值為0表示商家已將所需證照進(jìn)行了公示;反之則未公示。同理,是否超范圍經(jīng)營(yíng)也為取值0或1的布爾量,記為f2,其取值為0表示商家沒(méi)有超范圍經(jīng)營(yíng)的情況;反之商家存在超范圍經(jīng)營(yíng)。負(fù)面評(píng)論占比為取值0到1的比值,記為f3,店鋪評(píng)分的原始值為1到5,將其采用如下公式轉(zhuǎn)換至0到1的區(qū)間。
其中s為商家原始的平臺(tái)打分值。風(fēng)險(xiǎn)評(píng)估算法采用上述4個(gè)因素的線性加權(quán)求和來(lái)表示網(wǎng)絡(luò)餐飲商家的整體風(fēng)險(xiǎn)。
risk=α1 f1+α2 f2+α3 f3+α4 f4(6)
其中權(quán)重和滿足:
α1+α2+α3+α4=1(7)
采用層次分析法來(lái)計(jì)算上述權(quán)重。層次分析法的一個(gè)核心思想是:如果直接賦予多個(gè)因素權(quán)重比較困難,那么在不同因素之間兩兩比較則是相對(duì)容易的。因此首先構(gòu)建比較矩陣,采用表1所示的比較標(biāo)度。比較矩陣如表2所示。通常,比較矩陣可由多個(gè)行業(yè)專家一起討論得到。
為了求解每個(gè)因素的權(quán)重,采用方根法計(jì)算。其具體計(jì)算步驟如下。
(1)首先對(duì)比較矩陣的每行元素計(jì)算它們的乘積,得到行元素乘積。以比較矩陣第一行為例,可得其行元素乘積為1×3×9×5=135。
(2)然后對(duì)計(jì)算得到的每個(gè)行元素乘積計(jì)算n次方根,n為因素?cái)?shù)量,這里為4。
(3)最后對(duì)所有因素的四次方根進(jìn)行歸一化得到其對(duì)應(yīng)的權(quán)重值。
對(duì)表2中的比較矩陣按照上述計(jì)算得到的結(jié)果見(jiàn)表3所示。
那么,式(6)即為:
risk=0.568f1+0.223f2
+0.042f3+0.167f4(8)
這樣計(jì)算得到的風(fēng)險(xiǎn)指數(shù)取值為0到1,其值越大,表示風(fēng)險(xiǎn)越高。針對(duì)不同情況,可以通過(guò)對(duì)該區(qū)間進(jìn)行縮放來(lái)達(dá)到限定風(fēng)險(xiǎn)指數(shù)取值在任意區(qū)間的目的。
6 結(jié)語(yǔ)
本文提出了一種對(duì)網(wǎng)絡(luò)餐飲商家風(fēng)險(xiǎn)進(jìn)行評(píng)估的方法。該方法使用機(jī)器學(xué)習(xí)、人工智能技術(shù),通過(guò)對(duì)網(wǎng)絡(luò)餐飲商家證照進(jìn)行智能識(shí)別、評(píng)論情感分析、超范圍經(jīng)營(yíng)發(fā)現(xiàn),并使用層次分析法來(lái)確定各因素的權(quán)重占比,從而評(píng)估商家風(fēng)險(xiǎn)。本文提出的方法能夠輔助網(wǎng)絡(luò)餐飲大數(shù)據(jù)靶向監(jiān)管平臺(tái)的建立,提升網(wǎng)絡(luò)餐飲監(jiān)管效能,降低監(jiān)管部門(mén)、網(wǎng)絡(luò)餐飲主體、消費(fèi)者間的信息不對(duì)稱,提升食品安全精細(xì)化管理和社會(huì)共治水平。
參考文獻(xiàn)
[1]姜素芳,茅鴦對(duì),盧子木.基于PEST的網(wǎng)絡(luò)餐飲食品安全現(xiàn)狀及監(jiān)管對(duì)策[J].中國(guó)食物與營(yíng)養(yǎng),2018,24(7):29-33.
[2]國(guó)家食品藥品監(jiān)督總局.食品經(jīng)營(yíng)許可管理辦法(國(guó)家食品藥品監(jiān)督管理總局令第17號(hào))[Z].2015.
[3]李雨桐,杜海玲.我國(guó)網(wǎng)絡(luò)餐飲服務(wù)平臺(tái)存在的問(wèn)題與對(duì)策[J].對(duì)外經(jīng)貿(mào), 2017(3):92-94.
[4]王三虎,賈婭玲.網(wǎng)絡(luò)餐飲平臺(tái)食品安全管理的責(zé)任、挑戰(zhàn)和對(duì)策[J].食品科學(xué)技術(shù)學(xué)報(bào),2018,36(5):17-22.
[5]呂永衛(wèi),霍麗娜.網(wǎng)絡(luò)餐飲業(yè)食品安全社會(huì)共治的演化博弈分析[J].系統(tǒng)科學(xué)學(xué)報(bào),2018(1).
作者簡(jiǎn)介:郭承湘(1978—),男,湖南常德人,碩士研究生,高級(jí)工程師。研究方向:計(jì)算機(jī)應(yīng)用技術(shù)。