郭開衛(wèi) 王穎卓 王亞雄
摘? 要:本文設(shè)計了大數(shù)據(jù)技術(shù)領(lǐng)域一種商戶歸屬地的判定方法和裝置,包括:接收查詢請求,所述查詢請求中包括商戶標(biāo)識信息;根據(jù)所述商戶標(biāo)識信息查詢商戶歸屬庫,確定所述商戶標(biāo)識信息所對應(yīng)商戶的歸屬地,其中,所述商戶歸屬庫包括一一對應(yīng)的商戶標(biāo)識信息及歸屬地,且所述商戶歸屬庫是基于歷史交易數(shù)據(jù)建立的,能夠提高判定商戶歸屬地的準(zhǔn)確率,為業(yè)務(wù)運營提供更有力的數(shù)據(jù)支撐。
關(guān)鍵詞:線下商戶;歸屬地;銀行卡
中圖分類號:TP311.13? ? ? 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2019)10-0080-03
Abstract:This paper designs a method and device for determining the attribution of merchants in the field of big data technology,including:receiving a query request,the query request including merchant identification information;querying a merchant home library according to the merchant identification information,and determining the merchant identification information The attribution of the corresponding merchant,wherein the merchant home library includes one-to-one corresponding merchant identification information and a place of attribution,and the merchant home library is established based on historical transaction data,which can improve the accuracy of determining the attribution of the merchant,able to provide more powerful data support for business operations.
Keywords:offline merchant;attribution;bank card
0? 引? 言
受價格差利益驅(qū)動,商戶的“套冒繞”行為頻有發(fā)生,若簡單地從商戶收單機(jī)構(gòu)歸屬地上判定商戶歸屬地區(qū),會造成數(shù)據(jù)失真。同時,商戶注冊登記時,歸屬地區(qū)的信息不做準(zhǔn)確性校驗,因此注冊信息也不可信。如何從海量銀行卡交易信息中,通過用戶消費行為獲取精準(zhǔn)的商戶屬地信息,成為技術(shù)實現(xiàn)上要解決的難題。
1? 技術(shù)背景
目前,對商戶的歸屬地的判定有如下兩種方式:
方式一:根據(jù)交易數(shù)據(jù)中收單機(jī)構(gòu)所對應(yīng)的地區(qū)確定商戶的歸屬地。
方式二:根據(jù)商戶注冊時填寫的注冊地確定商戶的歸屬地。
針對上述方式一由于受價格利益驅(qū)動,商戶的“套冒繞”行為頻有發(fā)生,若簡單地從收單機(jī)構(gòu)所對應(yīng)的地區(qū)判定商戶的歸屬地區(qū),會造成數(shù)據(jù)失真。
針對上述方式二,由于商戶注冊登記時,商戶歸屬地區(qū)不是關(guān)鍵屬性,其信息不做準(zhǔn)確性校驗,會造成數(shù)據(jù)失真,因此注冊信息也不可信。
2? 實現(xiàn)方式
2.1? 商戶歸屬判定流程
圖1為商戶歸屬地的判定新方法流程圖,該方法可包括:
S101:接收查詢請求,該查詢請求中包括商戶標(biāo)識信息。
S102:根據(jù)商戶標(biāo)識信息查詢商戶歸屬庫,確定商戶標(biāo)識信息所對應(yīng)商戶的歸屬地。其中,商戶歸屬庫中包括一一對應(yīng)的商戶標(biāo)識信息及歸屬地,并且商戶歸屬庫是基于歷史交易數(shù)據(jù)所建立的。
2.2? 商戶歸屬庫建立
圖2為建立商戶歸屬庫的方法流程圖,該方法可包括:
S201:從歷史交易數(shù)據(jù)中獲取交易渠道為固定位置交易終端的第一交易數(shù)據(jù),第一交易數(shù)據(jù)中至少包括:第一賬戶信息、第一交易時間、固定位置交易終端歸屬地。
S202:從歷史交易數(shù)據(jù)中獲取交易渠道為移動交易終端的第二交易數(shù)據(jù),第二交易數(shù)據(jù)中至少包括:第二賬戶信息、商戶標(biāo)識信息、第二交易時間。
S203:在第一賬戶信息與第二賬戶信息相同,且第一交易時間與第二交易時間之間的時間差在預(yù)設(shè)時間段內(nèi)時,將固定位置交易終端歸屬地作為商戶歸屬庫中商戶標(biāo)識信息所對應(yīng)的歸屬地。
其中,預(yù)設(shè)時間段可根據(jù)實際情況自行設(shè)定,例如,在一種應(yīng)用場景中,若固定位置交易終端離商戶較近,則可將預(yù)設(shè)時間段設(shè)置為30分鐘或其他的較短的時間段,若固定位置交易終端離商戶較遠(yuǎn),則可將預(yù)設(shè)時間段設(shè)置為1小時或其他較長的時間段。
在上述步驟S201中,從歷史交易數(shù)據(jù)中獲取交易渠道為固定位置交易終端的第一交易數(shù)據(jù)時,可從歷史交易數(shù)據(jù)中獲取交易渠道為ATM(Automatic Teller Machine,自動柜員機(jī))的交易數(shù)據(jù),固定位置交易終端的歸屬地為ATM機(jī)器的歸屬地;也可從歷史交易數(shù)據(jù)中獲取交易渠道為“柜臺”的交易數(shù)據(jù),固定位置交易終端的歸屬地為該“柜臺”的歸屬地。
在上述步驟S202中,在從歷史交易數(shù)據(jù)中獲取交易渠道為移動交易終端的第二交易數(shù)據(jù)時,可從歷史交易數(shù)據(jù)中獲取交易渠道為POS(point of sale,銷售終端)的交易數(shù)據(jù),也可從歷史交易數(shù)據(jù)中獲取交易渠道為其他類型的交易數(shù)據(jù)。
在第一賬戶信息與第二賬戶信息相同,且第一交易時間與第二交易時間之間的時間差在預(yù)設(shè)時間段內(nèi)時,若存在同一個商戶標(biāo)識信息對應(yīng)多個固定位置交易終端歸屬地,則將出現(xiàn)次數(shù)最多的固定位置交易終端歸屬地作為商戶歸屬庫中該商戶標(biāo)識信息所對應(yīng)的歸屬地。為了提高判定商戶歸屬地的準(zhǔn)確率,還可周期性地更新商戶歸屬庫。
下面通過一個具體的例子對圖2所示的方法流程進(jìn)行詳細(xì)的解釋說明。
在該例子中,首先假設(shè)預(yù)設(shè)的時間段為30分鐘,進(jìn)一步假設(shè)用戶1使用賬戶信息為“001”的銀行卡于2016年11月28日09:00在ATM1機(jī)器上取了1000元,并假設(shè)ATM1的歸屬地為“上海市浦東新區(qū)”,然后用戶1于2016年11月28日09:10又使用賬戶信息為“001”銀行卡在商戶標(biāo)識為“A”的線下商戶進(jìn)行消費,此之間的時間差在預(yù)設(shè)的時間段“30分鐘”內(nèi),因此,可生成如表1所示的對應(yīng)關(guān)系。
進(jìn)一步假設(shè)用戶2使用賬戶信息為“002”的銀行卡于2016年11月28日09:05在ATM1機(jī)器上取了2000元,并假設(shè)ATM1的歸屬地為“上海市浦東新區(qū)”,然后用戶2于2016年11月28日09:15又使用賬戶信息為“002”銀行卡在商戶標(biāo)識為“A”的商戶進(jìn)行消費,此之間的時間差在預(yù)設(shè)的時間段“30分鐘”內(nèi),因此,可生成如下述表2所示的對應(yīng)關(guān)系。
進(jìn)一步假設(shè)用戶3使用賬戶信息為“003”的銀行卡于2016年11月28日09:10在ATM2機(jī)器上取了3000元,并假設(shè)ATM2的歸屬地為“上海市靜安區(qū)”,然后用戶3于2016年11月28日09:20又使用賬戶信息為“003”銀行卡在商戶標(biāo)識為“A”的商戶進(jìn)行消費,此之間的時間差在預(yù)設(shè)的時間段“30分鐘”內(nèi),因此,可生成如下述表3所示的對應(yīng)關(guān)系。
對上述表1、表2和表3中記錄的信息進(jìn)行統(tǒng)計,可得到如表4所示的數(shù)據(jù)。
從表4中可以看出,商戶標(biāo)識“A”對應(yīng)的歸屬地分別為“上海市浦東新區(qū)”和“上海市靜安區(qū)”,并且商戶標(biāo)識“A”對應(yīng)的歸屬地為“上海市浦東新區(qū)”出現(xiàn)的次數(shù)為2次,商戶標(biāo)識“A”對應(yīng)的歸屬地為“上海市靜安區(qū)”出現(xiàn)的次數(shù)為1次,因此,可將“上海市浦東新區(qū)”作為商戶標(biāo)識“A”對應(yīng)的歸屬地。
2.3? 商戶歸屬庫補(bǔ)充
上述建立好商戶歸屬庫以后,為了使得商戶歸屬庫中的商戶更加全面,提高商戶歸屬地判定的準(zhǔn)確率,還可通過圖3所示的方法流程,對商戶歸屬庫進(jìn)行補(bǔ)充。
如圖3所示,該方法流程可包括:
S301:從歷史交易數(shù)據(jù)中獲取交易渠道為移動交易終端的第三交易數(shù)據(jù),第三交易數(shù)據(jù)中至少包括:第三賬戶信息、商戶標(biāo)識信息。
S302:根據(jù)第三交易數(shù)據(jù)中的第三賬戶信息,從預(yù)先設(shè)置的賬戶歸屬庫中獲取第三賬戶信息所對應(yīng)的賬戶歸屬地。
S303:將第三賬戶信息所對應(yīng)的賬戶歸屬地作為該商戶標(biāo)識信息所對應(yīng)的歸屬地。
S304:判斷商戶歸屬庫中是否存在該商戶標(biāo)識信息,若是,則結(jié)束流程,否則,轉(zhuǎn)至步驟S305。
S305:將該商戶標(biāo)識信息以及該商戶標(biāo)識信息所對應(yīng)的歸屬地添加至商戶歸屬庫中。
在上述步驟S301中,在從歷史交易數(shù)據(jù)中獲取交易渠道為移動交易終端的第三交易數(shù)據(jù)時,可從歷史交易數(shù)據(jù)中獲取交易渠道為POS的交易數(shù)據(jù),也可從歷史交易數(shù)據(jù)中獲取交易渠道為其他類型的交易數(shù)據(jù)。
上述步驟S302中的賬戶歸屬庫,可基于一定時間段內(nèi)的歷史交易數(shù)據(jù),建立賬戶與賬戶的常用地區(qū)之間的對應(yīng)關(guān)系,并根據(jù)賬戶與賬戶的常用地區(qū)之間的對應(yīng)關(guān)系,建立賬戶歸屬庫。例如,針對任一賬戶,可基于該賬戶在過去36個月內(nèi)的交易明細(xì)數(shù)據(jù),將36個月內(nèi)交易量最大的地區(qū)作為該賬戶的常用地區(qū),從而建立賬戶歸屬庫。
若賬戶歸屬庫中存在同一賬戶信息對應(yīng)多個賬戶歸屬地時,可將出現(xiàn)次數(shù)最多的賬戶歸屬地作為該商戶標(biāo)識信息所對應(yīng)的歸屬地添加至商戶歸屬庫中。
2.4? 商戶歸屬判定
基于相同的技術(shù)構(gòu)思,本文提供一種商戶歸屬地的判定裝置,如圖4所示。
接收模塊401,用于接收查詢請求,所述查詢請求中包括商戶標(biāo)識信息。
確定模塊402,用于根據(jù)所述商戶標(biāo)識信息查詢商戶歸屬庫,確定所述商戶標(biāo)識信息所對應(yīng)商戶的歸屬地。其中,所述商戶歸屬庫包括一一對應(yīng)的商戶標(biāo)識信息及歸屬地,且所述商戶歸屬庫是基于歷史交易數(shù)據(jù)所建立的。
模塊403,具體用于:
從歷史交易數(shù)據(jù)中獲取交易渠道為固定位置交易終端的第一交易數(shù)據(jù),所述第一交易數(shù)據(jù)中至少包括:第一賬戶信息、第一交易時間、固定位置交易終端歸屬地;
從歷史交易數(shù)據(jù)中獲取交易渠道為移動交易終端的第二交易數(shù)據(jù),所述第二交易數(shù)據(jù)中至少包括:第二賬戶信息、商戶標(biāo)識信息、第二交易時間;
若所述第一賬戶信息與所述第二賬戶信息相同,且所述第一交易時間與所述第二交易時間之間的時間差在預(yù)設(shè)時間段內(nèi),則將所述固定位置交易終端歸屬地作為所述商戶歸屬庫中所述商戶標(biāo)識信息所對應(yīng)的歸屬地。
所述第一賬戶信息與所述第二賬戶信息相同,且所述第一交易時間與所述第二交易時間之間的時間差在預(yù)設(shè)時間段內(nèi)時,若存在同一個商戶標(biāo)識信息對應(yīng)多個固定位置交易終端歸屬地,則將出現(xiàn)次數(shù)最多的固定位置交易終端歸屬地作為所述商戶歸屬庫中該商戶標(biāo)識信息所對應(yīng)的歸屬地。
模塊403還用于:
從歷史交易數(shù)據(jù)中獲取交易渠道為移動交易終端的第三交易數(shù)據(jù),所述第三交易數(shù)據(jù)中至少包括:第三賬戶信息、商戶標(biāo)識信息;
根據(jù)所述第三賬戶信息,從預(yù)先設(shè)置的賬戶歸屬庫中獲取所述第三賬戶信息所對應(yīng)的賬戶歸屬地;
將所述第三賬戶信息所對應(yīng)的賬戶歸屬地作為該商戶標(biāo)識信息所對應(yīng)的歸屬地;
判斷所述商戶歸屬庫中是否存在該商戶標(biāo)識信息,若不存在,則將該商戶標(biāo)識信息以及該商戶標(biāo)識信息所對應(yīng)的歸屬地添加至所述商戶歸屬庫中。
綜上,本文提供的一種商戶歸屬地的判定方法和裝置,包括:接收查詢請求,所述查詢請求中包括商戶標(biāo)識信息;根據(jù)所述商戶標(biāo)識信息查詢商戶歸屬庫,確定所述商戶標(biāo)識信息所對應(yīng)商戶的歸屬地,其中,所述商戶歸屬庫包括一一對應(yīng)的商戶標(biāo)識信息及歸屬地,且由于所述商戶歸屬庫是基于歷史交易數(shù)據(jù)所建立的,因此能夠提高判定商戶的歸屬地的準(zhǔn)確率。
3? 結(jié)? 論
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本文可提供為方法、或計算機(jī)程序產(chǎn)品。因此,本文可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機(jī)程序產(chǎn)品的形式。
參考文獻(xiàn):
[1] 刁瑩.用數(shù)學(xué)建模方法評價存儲系統(tǒng)性能 [D].哈爾濱:哈爾濱工程大學(xué),2013.
[2] 任崇廣.面向海量數(shù)據(jù)處理領(lǐng)域的云計算及其關(guān)鍵技術(shù)研究 [D].南京:南京理工大學(xué),2013.
[3] 趙振.一種自適應(yīng)海量存儲系統(tǒng)組織策略及關(guān)鍵技術(shù)研究 [D].武漢:華中科技大學(xué),2006.
[4] 姚杰.分布式存儲系統(tǒng)文件級連續(xù)數(shù)據(jù)保護(hù)技術(shù)研究 [D].武漢:華中科技大學(xué),2009.
[5] 田敬.對等存儲系統(tǒng)中的數(shù)據(jù)可用性與安全性研究 [D].北京:北京大學(xué),2007.
作者簡介:郭開衛(wèi)(1981.09-),男,漢族,江西吉安人,高級工程師,本科,研究方向:大數(shù)據(jù)開發(fā)。