亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于面向渠道促銷場景多維分析的方法研究

        2021-12-12 01:12:36曾劍明
        科技信息·學(xué)術(shù)版 2021年32期
        關(guān)鍵詞:模型

        摘要:現(xiàn)場促銷是促進業(yè)務(wù)發(fā)展的重要方式之一。但是基于促銷的圖片進行酬金結(jié)算涉及到很多問題,例如促銷經(jīng)緯度、促銷圖片、促銷時長是否符合要求等,基于人工稽核將是非常繁瑣的過程?;诖?,提出了基于面向渠道促銷場景多維分析的方法研究,大幅提升稽核效率,促進業(yè)務(wù)健康發(fā)展。

        一、引言

        每個流通企業(yè)都有自己渠道促銷的手段,其核心點也大同小異。在產(chǎn)品嚴重同質(zhì)化、促銷手段也大體類同的情況下,有效的促銷策略顯得非常重要,畢竟,從產(chǎn)品的本質(zhì)和市場上來看,還有季節(jié)性、地域性等等之分。目前家寬發(fā)展已經(jīng)到了同質(zhì)化競爭的階段,用戶對資費的敏感度下降了,如何打造優(yōu)質(zhì)的售后服務(wù),才是保持競爭力的有力手段。公司通過下達任務(wù),讓渠道點完成一定數(shù)量場次的促銷活動,同時也會結(jié)算相應(yīng)的酬金,但是如何避免渠道虛假促銷,這就是本項目研究的重點工作了。

        二、現(xiàn)有稽核技術(shù)的缺點

        目前的圖片稽核技術(shù)方案采用的是直方圖算法。直方圖能夠描述一幅圖像中顏色的全局分布,而且容易理解和實現(xiàn),所以入門級的圖像相似度計算都是使用它的。

        直方圖算法是對源圖像與要篩選的圖像進行直方圖數(shù)據(jù)采集,對采集的各自圖像直方圖進行歸一化再使用巴氏系數(shù)算法對直方圖數(shù)據(jù)進行計算,最終得出圖像相似度值,其值范圍在[0,1]之間0表示極其不同,1表示極其相似(相同)。

        算法步驟大致可以分為兩步,根據(jù)源圖像與候選圖像的像素數(shù)據(jù),生成各自直方圖數(shù)據(jù)。第二步:使用第一步輸出的直方圖結(jié)果,運用巴氏系數(shù)(Bhattacharyya coefficient)算法,計算出相似程度值。

        現(xiàn)有的技術(shù)方案是根據(jù)兩個圖像的直方圖數(shù)據(jù)來計算相似度值,直方圖反應(yīng)的是圖像灰度值得概率分布,并沒有圖像的空間位置信息在里面,因此,會出現(xiàn)誤判;比如紋理結(jié)構(gòu)相同,但明暗不同的圖像,應(yīng)該相似度很高,但實際結(jié)果是相似度很低,而紋理結(jié)構(gòu)不同,但明暗相近的圖像,相似度卻很高。

        為了解決這一問題,本技術(shù)方案采用的是孿生神經(jīng)網(wǎng)絡(luò)模型,可以提取圖像的局部特征變量,從全局的角度進行綜合比較,Siamese Network有兩個結(jié)構(gòu)相同,且共享權(quán)值的子網(wǎng)絡(luò)。分別接收兩個輸入X1與X2,將其轉(zhuǎn)換為向量Gw(X1)與Gw(X2),再通過某種距離度量的方式計算兩個輸出向量的距離Ew。這種方式可以克服圖像明暗度不同造成的誤判,提高了相似度計算的準確性。

        同時構(gòu)建全方位、多層次的稽核方式,能夠更好的識別渠道是否虛假促銷。具體如下:

        三、構(gòu)建多層次立體化審核體系

        1、構(gòu)建圖像識別模塊

        孿生神經(jīng)網(wǎng)絡(luò)(Siamese Network)是一種特殊類型的神經(jīng)網(wǎng)絡(luò)架構(gòu),是一種相似性度量的方法。與一個學(xué)習(xí)對其輸入進行分類的模型不同,孿生神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)在兩個輸入中進行區(qū)分,從數(shù)據(jù)中去學(xué)習(xí)一個相似性的度量。孿生網(wǎng)絡(luò)由兩個完全相同的神經(jīng)網(wǎng)絡(luò)組成,每個都輸入一個圖像,然后依次饋送到卷積層、池化層和全連接層,最后輸出一個特征向量到對比損失函數(shù)中,來計算兩個圖像之間的相似度。孿生神經(jīng)網(wǎng)絡(luò)可廣泛用于簽名驗證、人臉識別等領(lǐng)域。網(wǎng)絡(luò)結(jié)構(gòu)如下:

        caffe的孿生神經(jīng)網(wǎng)絡(luò)采用的損失函數(shù)(Contrastive Loss function)是

        其中:

        ① Ew被定義為姐妹孿生網(wǎng)絡(luò)輸出之間的歐氏距離(euclidean distance),Gw是其中一個姐妹網(wǎng)絡(luò)的輸出,X1和X2是輸入數(shù)據(jù)對。

        ② Y值為1或0:如果模型預(yù)測輸入是相似的,那么Y的值為0,否則Y為1。

        ③ m是閾值。

        我們通過以下方式來理解一下?lián)p失函數(shù):①當輸入圖像相似時,歐式距離越大,損失值越大;②當輸入圖像不同時,歐式距離越小,損失值越大,而歐式距離大于某個閾值m后將不再產(chǎn)生損失。

        1.1、制作數(shù)據(jù)集

        1.1.1、我們從系統(tǒng)上的促銷工單中批量導(dǎo)出圖像,然后對這些圖片進行分類,將相似的圖片分成一組,不相似的歸為另一組,共制作100對樣本。

        1.1.2、讀取數(shù)據(jù),劃分輸入數(shù)據(jù)集(圖片信息列)和輸出數(shù)據(jù)集(label列),同時劃分訓(xùn)練集和測試集

        1.2、搭建孿生神經(jīng)網(wǎng)絡(luò)模型

        1.2.1、對圖像進行灰度化處理

        1.2.2、調(diào)整輸入圖像為100*100,同時接受2張圖片作為輸入。

        1.2.3、子網(wǎng)絡(luò)包括3個卷積層和3個全連接層,卷積層的卷積核大小分別為3,3,3,每一個卷積層后均添加一個批量歸一化層。歸一化的引入是為了減少internal covariatie shift現(xiàn)象,其具體表現(xiàn)是在訓(xùn) 練深層網(wǎng)絡(luò)的過程中,前面層參數(shù)的變化會影響后面每層的參數(shù)分布,導(dǎo)致了訓(xùn)練時只能選用較低的學(xué)習(xí)速率以及小心謹慎的參數(shù)初始化。而Batch Normalization層(BN)的引入允許我們使用更高的學(xué)習(xí)率以及不用太擔(dān)心參數(shù)初始化的問題。

        1.3、自定義損失函數(shù)

        在孿生神經(jīng)網(wǎng)絡(luò)(siamese network)中,其采用的損失函數(shù)是contrastive loss,這種損失函數(shù)可以有效的處理孿生神經(jīng)網(wǎng)絡(luò)中的paired data的關(guān)系。

        W代表兩個樣本特征X1和X2的歐氏距離(二范數(shù)),P 表示樣本的特征維數(shù),Y 為兩個樣本是否匹配的標簽,Y=0 代表兩個樣本相似或者匹配,Y=1 則代表不匹配,m 為設(shè)定的閾值,N 為樣本個數(shù)。

        1.4、模型訓(xùn)練

        1.4.1、讀取訓(xùn)練集的數(shù)據(jù),定義圖像dataset,生成8維的圖像數(shù)據(jù)。

        1.4.2、實例化模型,設(shè)置學(xué)習(xí)率,定義優(yōu)化器,lr設(shè)置為0.0005,訓(xùn)練100輪。

        1.4.3、保存訓(xùn)練好的模型,下次加載模型即可直接使用,不需要再次訓(xùn)練。

        1.5、圖片預(yù)測

        1.5.1、輸入2張測試集的圖片,進行實際的預(yù)測。

        2、構(gòu)建經(jīng)緯度距離審核模塊。

        2.1 在距離計算方面,采取了原始數(shù)據(jù)分離抽取的技術(shù),單獨將每一個促銷地點的經(jīng)度和緯度分離出來,然后再利用距離計算函數(shù)(利用sin和cos函數(shù)進行球面弧長的計算)進行經(jīng)緯度的計算,根據(jù)業(yè)務(wù)規(guī)則進行下一步的判斷,輸出不符合要求的促銷工單號,進行退單處理。

        2.2 提單密集度檢測:

        (1)根據(jù)執(zhí)行人所屬單位名稱、日期輸出分組數(shù)據(jù)

        (2)根據(jù)分組后的結(jié)果,對于統(tǒng)計數(shù)據(jù)大于等于6的進行二次分析,先對每一組按照時間進行升序排序,然后

        判斷第一個時間與第六個時間是否在10分鐘以內(nèi),如果是的話就判斷第一個與第七個是否在10分鐘以內(nèi),以此類推,

        直到將第一個10分鐘以內(nèi)提交的單搜索出來。然后繼續(xù)下一輪判斷

        (3)遍歷所有的分組后,將不合規(guī)的工單編號輸出,進行進一步的審核。

        3、構(gòu)建軌跡分析模塊

        根據(jù)渠道進行聚類分析,抽取出對應(yīng)的渠道名稱、經(jīng)度、緯度等信息,設(shè)置定位的中心點,然后將該渠道對應(yīng)的所有經(jīng)緯度可視化在地圖上,并繪制軌跡圖。

        通過距離判斷,可以對可疑的渠道進行深入分析,探索是否出現(xiàn)不合理的促銷地點,如活動距離遠遠超過促銷的平均距離,則可判斷該促銷異常,需做進一步的核實處理。

        4、構(gòu)建數(shù)據(jù)可視化模塊。

        根據(jù)統(tǒng)計出來的數(shù)據(jù),經(jīng)過進一步的處理,通過可視化技術(shù)顯示在數(shù)據(jù)大屏上,方便進一步做分析處理。主要包括以下幾個子模塊。

        4.1 每日執(zhí)行單量統(tǒng)計圖,根據(jù)執(zhí)行日期和發(fā)布日期,統(tǒng)計單日的工單量,通過散點圖的方式繪制圖形,并輔助以氣泡圖的形式形象的表示單量的多少。

        4.2 各縣促銷場次分布圖,從全量列表中分析出各縣的促銷場次,并用地圖的方式來展現(xiàn)數(shù)據(jù),輔助以顏色區(qū)間對數(shù)量做映射。

        4.3 各類網(wǎng)點促銷情況圖,各類網(wǎng)點的等級和規(guī)模大小不一,因此開展的促銷場次也有較大的差異,通過餅圖的方式來展現(xiàn)各類網(wǎng)點的分布情況。

        4.4 網(wǎng)格促銷情況圖,通過直方圖的方式可以很直觀地看到各個網(wǎng)格的促銷情況,以便根據(jù)實際需要做進一步調(diào)整。

        4.5 現(xiàn)場促銷反饋詞云圖,每場促銷都會將當次的促銷情況用文字的方式進行反饋,但是這種方式不太直觀,不能很好的了解整體的促銷情況。根據(jù)文字生成詞云圖,可以大體的了解促銷中反饋的問題情況,反饋問題越多的詞語將會突出顯示,便于管理員抓住重點問題進行整改。

        4.6 個人促銷數(shù)量排行榜,以上都是針對一個群體進行統(tǒng)計分析的,該模塊是針對個人的一個統(tǒng)計情況,根據(jù)個人促銷場次的統(tǒng)計數(shù)量,并排序輸出,可以明顯的看到促銷較為積極的人員。

        5、視圖探索

        根據(jù)圖片審核結(jié)果,依照文件路徑進行可視化展示,將對應(yīng)的兩張圖片顯示在軟件上,避免了手工查找圖片和比對的繁瑣流程。

        操作步驟:5.1、點擊初始化,將所有不符合的組合重新編排,錄入到系統(tǒng)中。

        5.2、通過查看圖片,或者點擊上一組、下一組快速比對圖片。

        5.3、對于人工審核確實不符合條件的工單編號錄入系統(tǒng),導(dǎo)出到本地電腦,便于后續(xù)退單處理。

        6、數(shù)據(jù)和圖像處理模塊。

        6.1通過pandas來進行excel數(shù)據(jù)的處理,包括從excel數(shù)據(jù)加載到系統(tǒng)中,并且對日期、經(jīng)緯度等字段進行切片處理,提取出有用的信息,同時對缺失值、異常值進行檢測和處理,同時根據(jù)渠道點進行匯總統(tǒng)計,排序和篩選,進一步清洗數(shù)據(jù),保證 系統(tǒng)接收到的是可以正常使用的數(shù)據(jù)。

        6.2、圖像URL下載模塊。

        首先從系統(tǒng)中批量獲取圖片的URL地址,然后放入循環(huán)體中進行逐一解析,獲取響應(yīng)數(shù)據(jù)并將數(shù)據(jù)存儲在本地。由于下載的數(shù)據(jù)是一個壓縮包,因此還需要進行解壓操作,便于系統(tǒng)讀取數(shù)據(jù),節(jié)約了人工解壓的時間。

        四、總結(jié)

        該項目采用孿生神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)模型,孿生神經(jīng)網(wǎng)絡(luò)(Siamese network)就是“連體的神經(jīng)網(wǎng)絡(luò)”,神經(jīng)網(wǎng)絡(luò)的“連體”是通過共享權(quán)值來實現(xiàn)的。所謂權(quán)值共享就是當神經(jīng)網(wǎng)絡(luò)有兩個輸入的時候,這兩個輸入使用的神經(jīng)網(wǎng)絡(luò)的權(quán)值是共享的(可以理解為使用了同一個神經(jīng)網(wǎng)絡(luò))。

        創(chuàng)新點總結(jié)如下:

        一、首次將孿生神經(jīng)網(wǎng)絡(luò)應(yīng)用于圖像識別,解決了樣本量少的模型訓(xùn)練問題

        二、改進排列組合算法,采用渠道點為核心的新算法,減少90%的計算量

        三、開發(fā)了熱力圖和軌跡圖展示模塊,相比傳統(tǒng)的圖表展示方式,更加直觀地查看促銷點的分布和異常促銷情況

        通過對模型的數(shù)據(jù)采集、建模分析等,建立了一整套完整的體系,能夠?qū)η捞摷俅黉N場景進行精準識別,有力規(guī)避了渠道虛假套利現(xiàn)象,為公司的業(yè)務(wù)健康發(fā)展提供了有力保障。

        作者簡介:曾劍明,籍貫:廣東省梅州市,廣東移動梅州分公司,系統(tǒng)維護管理,高級工程師,大學(xué)本科,人工智能與軟件開發(fā)。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機模型
        提煉模型 突破難點
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        精品国产乱码久久免费看| 精品丝袜人妻久久久久久| 胸大美女又黄的网站| 久久天堂综合亚洲伊人hd妓女| 国产在线观看无码免费视频| 亚洲国产精品久久久久婷婷老年 | 精品国产品欧美日产在线| 国产女人18一级毛片视频 | 国产最新进精品视频| 欧美老妇人与禽交| 一本久道久久综合五月丁香| 尤物yw午夜国产精品视频| 扒开双腿操女人逼的免费视频| 日韩av一区二区无卡| 国产自拍91精品视频| 亚洲综合网国产精品一区| 亚洲av永久无码精品古装片| 精东天美麻豆果冻传媒mv| 国产成人av 综合 亚洲| 中文字幕第一页亚洲| 春色成人在线一区av| 亚洲素人日韩av中文字幕| 男女主共患难日久生情的古言| 国产freesexvideos中国麻豆| 久久精品国产亚洲av电影网 | 亚洲а∨精品天堂在线| av无码久久久久久不卡网站| 2021国产最新在线视频一区| 欧美综合区自拍亚洲综合| av免费在线观看在线观看| 不卡视频在线观看网站| 精品卡一卡二乱码新区| 无码va在线观看| 亚洲国产人在线播放首页 | 久久精品国产亚洲av成人文字| 久久久久亚洲精品无码系列| 欧美人与动人物牲交免费观看久久| 一本大道久久香蕉成人网| 无码AV无码免费一区二区| 白色月光免费观看完整版| 视频一区二区三区黄色|