亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于屬性聚類的傳銷網(wǎng)站賬戶去重方法研究

        2019-07-01 03:40:34趙廣曄
        科技創(chuàng)新與應(yīng)用 2019年18期

        趙廣曄

        摘 ?要:在網(wǎng)絡(luò)傳銷案件取證過程中,需要分析傳銷活動的實際參與人數(shù),但是由于網(wǎng)絡(luò)身份的虛擬性,經(jīng)常存在一人使用多個賬戶的情況,因此需要對傳銷網(wǎng)站中的賬戶進行去重分析。目前常用的方法是將姓名、身份證號等信息一致的賬戶做去重處理,但是該方法無法對使用虛假身份注冊的賬戶進行去重。文章提出了一種基于屬性聚類的賬戶去重方法,通過對與使用者身份關(guān)聯(lián)的屬性進行聚類分析,從而實現(xiàn)對傳銷網(wǎng)站中的賬戶進行去重。

        關(guān)鍵詞:電子數(shù)據(jù)取證;網(wǎng)絡(luò)傳銷;并查集;去重統(tǒng)計

        中圖分類號:D631.1 ? ? ? ?文獻標志碼:A ? ? ? ? 文章編號:2095-2945(2019)18-0139-02

        Abstract: In the process of collecting evidence in network marketing cases, it is necessary to analyze the actual number of participants in these pyramid marketing activities, but due to the virtual nature of network identity, there is often a situation in which one person uses multiple accounts. Therefore, it is necessary to reanalyze the accounts in the network marketing website. At present, the commonly used method is to reprocess the account with the same information such as name and ID number, but this method cannot reprocess the account registered with false identity. In this paper, an account de-duplication method based on attribute clustering is proposed. Through the cluster analysis of the attributes associated with the user's identity, the account in the pyramid selling website can be deduplicated.

        Keywords: electronic data forensics; network marketing; union-find sets; deduplicated statistics

        1 概述

        在辦理網(wǎng)絡(luò)傳銷案件時,根據(jù)法律規(guī)定和相關(guān)的司法解釋,犯罪嫌疑人直接或間接發(fā)展下線的人數(shù)是對其定罪量刑的重要依據(jù)。但是網(wǎng)絡(luò)傳銷案件的參與人是以虛擬賬戶的方式加入傳銷組織的,存在大量一人多賬戶的情況。然而在司法解釋中的人數(shù)指的是參與傳銷活動的自然人。

        本文首先介紹目前司法實踐中常用的簡單去重法,并對該種方法在司法實踐中遇到的問題進行分析。然后針對這些問題,提出一種基于屬性聚類的傳銷網(wǎng)站賬戶去重分析方法。

        2 簡單去重法及其在司法實踐中存在的問題

        2.1 簡單去重法

        目前網(wǎng)絡(luò)傳銷組織者往往會要求參與者提供姓名、身份證等個人身份信息,以及手機、郵箱、微信、QQ等聯(lián)系方式,同時還會要求參與者提供銀行卡、支付寶等用來提取返利資金的賬戶信息。

        簡單去重法指的是依據(jù)姓名和身份證號等個人身份信息組合進行查重、去重的方法。表1是某傳銷網(wǎng)站中五個賬戶的部分注冊信息。因為一人使用多部手機的情況十分常見,在應(yīng)用簡單去重法時通常采用“姓名+身份證號”的組合進行分析。表1中只有“ZZKL0083”與“ZZKL0096”兩個賬戶注冊時使用的姓名和身份證號完全一致,為同一人注冊,即這5個賬戶實際上應(yīng)為4個人注冊的。雖然簡單去重法可以快速的得出分析結(jié)果,但是該方法在庭審過程中也遭到了嫌疑人及其辯護律師的質(zhì)疑。

        2.2 存在的問題

        (1)網(wǎng)站對注冊信息缺乏嚴格驗證。目前,網(wǎng)絡(luò)傳銷的網(wǎng)站并不會進行實名驗證,甚至對信息格式都不進行校驗。例如,表1中“ZZKL0096”和“ZZKL1983”兩個賬戶的姓名和手機號完全一致,但是身份證的最后兩位不同,如果使用簡單去重法,這兩個賬戶將會被作為2個人進行統(tǒng)計。但兩個賬戶實際上是同一人的,只是其中一個身份證號輸入錯誤。(2)網(wǎng)站對冒用身份無法鑒別。簡單去重法通過注冊賬戶信息屬性的組合進行去重,無法鑒別冒用他人身份信息注冊的賬戶。例如,表1中“ZZKL0099”這個賬戶注冊時使用的手機號是“188****1234”,與賬戶“ZZKL0083”一致,但是兩個賬戶其他信息并不一致。在該傳銷網(wǎng)站中需要使用手機接收重要信息,即兩個賬戶實際上是同一人的。按上述邏輯分析,表1中“ZZKL0083”、“ZZKL0096”、“ZZKL099”和“ZZKL1983”等4個賬戶應(yīng)該是由同一人注冊并操作的,即表1中賬戶的去重結(jié)果應(yīng)為2個。

        3 基于屬性聚類的去重分析方法

        3.1 分析思路

        為了避免前文提到的情況影響去重分析結(jié)果的準確性,在進行去重分析時,不能簡單的使用身份屬性信息組合來進行去重。因此,本文提出一種基于屬性聚類的傳銷網(wǎng)站賬戶去重分析方法。該方法的分析思路是對會員賬戶依據(jù)其屬性進行聚類,如果兩個賬戶的某一屬性值相同則聚為一類,不斷將聚類進行擴張,最后統(tǒng)計聚類數(shù)作為結(jié)果。根據(jù)會員賬戶的特點主要提取以下幾類屬性進行聚類分析:會員身份基本信息、會員操作痕跡信息、收付款賬戶信息等。

        3.2 分析方法

        本文提出的基于屬性聚類的分析方法主要包括三個步驟:提取數(shù)據(jù)、建立關(guān)聯(lián)、聚類計數(shù)。

        3.2.1 提取數(shù)據(jù)

        根據(jù)去重分析的需求,首先要從后臺數(shù)據(jù)中提取出三類數(shù)據(jù):(1)會員身份基本信息:主要包括姓名、身份證號、手機號等。(2)會員操作痕跡信息:主要是指會員登錄時的IP地址。(3)收付款賬戶信息:主要包括微信賬戶、銀行卡號、支付寶賬戶等。

        3.2.2 建立關(guān)聯(lián)

        將提取到的所有賬戶作為圖中的結(jié)點,記為Naccount,結(jié)點的屬性包括上述提取出的所有屬性。如果兩個賬戶有某個屬性值相同,則在兩個結(jié)點間建立一條邊,記為Erelation。對所有賬戶的所有屬性進行遍歷,構(gòu)建所有提取到的屬性信息的聚類關(guān)聯(lián),從而形成一個所有賬戶的關(guān)聯(lián)圖,記為Gar。

        3.2.3 聚類計數(shù)

        在本文提出的基于屬性聚類的賬戶去重分析方法中,所有連接在一起的結(jié)點就作為一個結(jié)點進行統(tǒng)計。要統(tǒng)計最終的去重結(jié)果即是計算圖Gar中的連通分量個數(shù)Ccomponent。

        4 去重方法的實現(xiàn)及驗證

        4.1 去重方法的實現(xiàn)

        首先,將會員賬戶及相關(guān)數(shù)據(jù)從傳銷網(wǎng)站后臺數(shù)據(jù)庫中導(dǎo)出。為了便于后期的數(shù)據(jù)處理和分析,將相關(guān)數(shù)據(jù)整合為一張二維表Tinfo,以CSV格式進行存儲,根據(jù)傳銷網(wǎng)站存儲的數(shù)據(jù)不同,相關(guān)屬性字段包括賬戶ID、姓名、身份證號、手機號碼、銀行賬戶、登錄IP地址等。

        其次,定義圖的數(shù)據(jù)結(jié)構(gòu)Gar,使用導(dǎo)出的CSV數(shù)據(jù)建立圖中的結(jié)點Naccount實例,記錄結(jié)點的ID和相關(guān)屬性。

        然后,對于會員賬戶信息中的每一個屬性字段A[i],按照如下步驟生成關(guān)聯(lián)邊Erelation集合:

        Tinfo.sort_by(A[i]);

        CurValue = Tinfo[0][i];

        CurId = Tinfo[0][‘Id];

        for j in range(1,len(Tinfo)):

        if Tinfo[j][i] == CurValue:

        Erelation.append(CurId,Tinfo[j][‘Id]);

        Else:

        CurValue = Tinfo[j][i];

        CurId = Tinfo[j][‘Id];

        最后,統(tǒng)計圖Gar中的連通分量個數(shù)作為去重結(jié)果。傳銷網(wǎng)站中會員賬戶數(shù)量和最終去重結(jié)果數(shù)都很大,所以本文采用并查集的方法進行統(tǒng)計。并查集主要有以下三種操作:初始化,創(chuàng)建一個新的并查集,并把每個元素所在的集合初始化為這個元素本身;查找,查找該元素所在的集合,即根結(jié)點;合并,將兩個元素所在的不同集合合并為一個集合,在合并之前使用“查找”操作判斷兩個集合是否屬于同一個集合。[1]

        4.2 去重結(jié)果的分析

        本文從某傳銷網(wǎng)站后臺數(shù)據(jù)中提取了某一分支中1970個會員賬戶的相關(guān)信息,分別使用簡單去重法和基于屬性聚類的方法進行賬戶去重分析,去重結(jié)果如圖1所示。圖1(a)為使用簡單重法去重的結(jié)果,即使用“姓名+身份證號”組合進行關(guān)聯(lián)的結(jié)果,在1970個賬戶中,僅有兩個賬戶的“姓名+身份證號”組合信息完全相同,即去重結(jié)果為1969。圖1(b)為分別使用“姓名”、“身份證號”、“手機號”三個屬性進行關(guān)聯(lián)后的去重結(jié)果,1970個賬戶共形成關(guān)聯(lián)邊280條,最終形成的連通分量數(shù)為1787個,即去重結(jié)果為1787。

        使用本文方法形成的關(guān)聯(lián)集合中的賬戶信息進行分析,發(fā)現(xiàn)可以有效實現(xiàn)對使用不同身份信息注冊但是使用同一手機號碼的賬戶進行去重,但是對于姓名相同的賬戶可能會發(fā)生過度去重的情況,即去重結(jié)果可能會小于實際參與人數(shù)。

        5 結(jié)束語

        綜上,本文提出的基于屬性聚類的傳銷網(wǎng)站賬戶去重方法可以有效實現(xiàn)對傳銷網(wǎng)站后臺人員的去重統(tǒng)計,特別是可以將輸入數(shù)據(jù)不規(guī)范和冒用他人身份注冊的賬戶進行去重,雖然該方法存在過度去重的問題,即去重結(jié)果可能小于實際人數(shù),但是相較于簡單去重法,該方法的去重結(jié)果更接近真實情況,也更加合理和符合相關(guān)司法解釋,具有實際應(yīng)用價值。

        參考文獻:

        [1]羅志磊,馮波,葉鵬.基于并查集的圖像連通域標記算法[J].黑龍江科技信息,2017(11):41.

        文字幕精品一区二区三区老狼| 日本色偷偷| 综合人妻久久一区二区精品 | 亚洲精品无码高潮喷水a片软| 亚洲爆乳少妇无码激情| 国产在线看不卡一区二区| 日本淫片一区二区三区| 亚洲日韩精品一区二区三区无码| 亚洲乱码日产精品bd| 成人午夜免费福利| 亚洲熟女av在线观看| 国产美女精品视频线免费播放软件| 成人亚洲性情网站www在线观看| 91精品国产91久久综合桃花| 日日噜噜噜夜夜狠狠久久蜜桃| 国产精品无码无卡无需播放器| 无码一区二区三区老色鬼| 久久久精品国产亚洲麻色欲| 少妇又紧又爽丰满在线视频| 免费视频成人片在线观看| 久久久窝窝午夜精品| 午夜国产小视频在线观看黄| 日本精品视频免费观看| 亚洲第一无码xxxxxx| 三级国产女主播在线观看| 国产视频在线观看一区二区三区| 亚洲av日韩综合一区久热| 精品国产a∨无码一区二区三区| 精品久久久亚洲中文字幕| 国产毛片av一区二区| 亚洲国产精品第一区二区| 国产成人8x视频网站入口| 人妻少妇中文字幕久久hd高清| 亚洲av无码一区二区三区网址| 男女边吃奶边做边爱视频| 成人免费视频自偷自拍| 精品一区三区视频在线观看| 欧美精品中文字幕亚洲专区| 99久久精品国产自在首页| 手机在线免费观看av不卡网站| 国产成人精品白浆久久69|