亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        垂直型人員親屬關(guān)系數(shù)據(jù)結(jié)構(gòu)研究與大數(shù)據(jù)建模實踐

        2022-02-28 06:53:12肖嘯廣東省惠州市公安局
        警察技術(shù) 2022年1期
        關(guān)鍵詞:數(shù)據(jù)結(jié)構(gòu)指向鏈路

        肖嘯 廣東省惠州市公安局

        引言

        2020年10月,央視報道了某地的陳先生在國務(wù)院“互聯(lián)網(wǎng)+督導(dǎo)”平臺上反映自己歷時7個多月證明“我爸是我爸”未果的問題。近年來,此類問題屢見不鮮,事情曝光后,群眾在不了解事情真相前,往往首先是質(zhì)疑政府的執(zhí)行力,而公安機關(guān)又首當(dāng)其沖。雖然最后通過各方面努力問題都得到了解決,但不難看出,各地的做法實為特事特辦,全國并沒有形成一套有效的、制度化的證明體系。

        親屬關(guān)系主要產(chǎn)生于生育和婚嫁。傳統(tǒng)的紙質(zhì)族譜較好的體現(xiàn)了本族內(nèi)的親屬關(guān)系,近幾年互聯(lián)網(wǎng)上也興起了一些編撰電子族譜的網(wǎng)站,用于幫助人們尋根認祖,但無論是哪種,其建立的方法和標準并不統(tǒng)一[1],關(guān)系人也有極大的局限性。可以想見,如果由政府職能部門統(tǒng)一建立全國性的人口親屬關(guān)系大數(shù)據(jù)平臺,將具有廣泛的應(yīng)用場景和社會意義。

        一、需求分析

        根據(jù)民政部等六部門《關(guān)于改進和規(guī)范基層群眾性自治組織出具證明工作的指導(dǎo)意見》,親屬關(guān)系的證明不再屬于基層群眾性組織工作職責(zé)。因此,一些最基礎(chǔ)的證據(jù)材料全壓在公安機關(guān)肩上,這也是近年來公安工作的難點和痛點。我國基層公安組織一般始建于上世紀五十年代后期,然后逐步開始建立人事戶籍檔案,且至今仍主要采用紙質(zhì)檔案方式保存,原始的戶籍檔案缺失、模糊、遺漏情況也無法避免。隨著我國信息化水平的普遍提升,各類業(yè)務(wù)系統(tǒng)已逐步實現(xiàn)了數(shù)據(jù)的電子化,但如何利用現(xiàn)有的業(yè)務(wù)數(shù)據(jù)構(gòu)建出全面、高效的人員親屬關(guān)系網(wǎng)絡(luò),仍是一大難題。

        當(dāng)前,對人員親屬關(guān)系的研究主要集中在三個方面,一是“族譜”或“家譜”的展示,如劉軍丹提出的家譜關(guān)系的元圖表示[2];二是關(guān)系網(wǎng)絡(luò)的查詢算法,如閆紹惠的關(guān)系追溯算法[3]和 張霞的特定家庭結(jié)構(gòu)匹配方法[4];三是數(shù)據(jù)存儲的優(yōu)化,如采用Neo4j圖數(shù)據(jù)庫和HDFS列式數(shù)據(jù)庫[5]等。但一直以來對其數(shù)據(jù)結(jié)構(gòu)的研究并沒有較大進展,主要原因是各類法律活動產(chǎn)生的親屬關(guān)系極大復(fù)雜了關(guān)系網(wǎng)絡(luò)。要涵蓋所有親屬關(guān)系且結(jié)構(gòu)簡潔易檢索,亟需在親屬關(guān)系的數(shù)據(jù)結(jié)構(gòu)上破冰。

        二、數(shù)據(jù)結(jié)構(gòu)詳細設(shè)計

        本部分說明了垂直型親屬關(guān)系數(shù)據(jù)結(jié)構(gòu)的產(chǎn)生、優(yōu)化過程及驗證結(jié)論,介紹了建設(shè)全國性的人口親屬關(guān)系大數(shù)據(jù)步驟。

        (一)垂直型關(guān)系及其數(shù)據(jù)結(jié)構(gòu)的產(chǎn)生

        1. 傳統(tǒng)型關(guān)系及其數(shù)據(jù)結(jié)構(gòu)

        以一家四代人關(guān)系為例,傳統(tǒng)的親屬關(guān)系結(jié)構(gòu)如圖1所示。

        圖1中,實心圓代表男性,空心圓代表女性,平輩如夫妻或兄弟姐妹間用實心箭頭連接,上、下輩間用空心箭頭連接(下同)。在不考慮死亡、離婚等情況下,一家四代人關(guān)系網(wǎng)絡(luò)已較為復(fù)雜。現(xiàn)在隨機選擇關(guān)系較遠的二人建立最短鏈接,如圖2所示。

        圖2中,以兩個紅色圓建立關(guān)系鏈為例,從紅色線路所示可以看出,起、止之間最少有3個關(guān)系人,最小正確鏈路為4級,最大正確鏈路為10級。傳統(tǒng)型關(guān)系結(jié)構(gòu)存在以下問題:(1)由于每個人的關(guān)系設(shè)定是多維的,即父母、子女、兄弟姐妹等,每多一名子女或兄弟姐妹就多一維,可能的鏈路數(shù)呈幾何級增長;(2)從左右下角四個人的關(guān)系可以發(fā)現(xiàn),關(guān)系鏈存在大量無限循環(huán)情況,這對于機器遍歷算法設(shè)計是極大的挑戰(zhàn)。

        在實際建模時,傳統(tǒng)型關(guān)系的數(shù)據(jù)結(jié)構(gòu)如表1所示。

        ?

        從表1中可以發(fā)現(xiàn),傳統(tǒng)型關(guān)系的數(shù)據(jù)結(jié)構(gòu)存在以下問題:(1)如考慮離婚,將會出現(xiàn)張三父母、妻子數(shù)量不可控情況或者出現(xiàn)新數(shù)據(jù)覆蓋舊數(shù)據(jù)從而斷裂舊關(guān)系指向情況;(2)數(shù)據(jù)冗余極大,每個兄弟姐妹之間均會形成相互指向。

        2. 垂直型關(guān)系及其數(shù)據(jù)結(jié)構(gòu)(原型)

        針對傳統(tǒng)型關(guān)系結(jié)構(gòu)和其數(shù)據(jù)結(jié)構(gòu)存在的問題,設(shè)計新的關(guān)系結(jié)構(gòu)和其數(shù)據(jù)結(jié)構(gòu)至少需要滿足以下三點:(1)原關(guān)系人和關(guān)系不可缺少;(2)減少鏈路數(shù),消除無限循環(huán)風(fēng)險;(3)盡量減少無法預(yù)知的數(shù)據(jù),減少數(shù)據(jù)冗余。新關(guān)系結(jié)構(gòu)如圖3所示。

        在圖3中,新結(jié)構(gòu)刪除了所有橫向關(guān)系指向,每個人只有上、下(父母和子女)關(guān)系指向,因此命名為:垂直型關(guān)系結(jié)構(gòu)。圖3中第四代中間有一個虛線的圓,這是垂直型關(guān)系結(jié)構(gòu)中提出的一個關(guān)鍵名詞——虛擬子女,即對任何一個人,只要結(jié)婚,即在其下輩中產(chǎn)生一個虛擬子女,虛擬子女由且僅由實際子女替代,否則一直存續(xù),其主要作用是標注每次產(chǎn)生的夫妻關(guān)系。

        下面分四種典型情況描述垂直型關(guān)系的數(shù)據(jù)結(jié)構(gòu)(原型),如表2~表5所示。

        (1)情況1:未婚。

        ?

        (2)情況2:已婚(或離異),未生育。

        ?

        (3)情況3:已婚(或離異),有生育。

        ?

        (4)情況4:無生育再婚。

        ?

        3. 合法性檢測及結(jié)構(gòu)改進

        原型的數(shù)據(jù)結(jié)構(gòu)僅能機械的登記每條數(shù)據(jù),無法對數(shù)據(jù)的合法性進行檢測?,F(xiàn)假設(shè)某人有多條婚育記錄,如圖4所示。

        在圖4中,張三有兩條婚姻關(guān)系李三和王三,并分別有子女張四-1和張四-2。若直接將兩條數(shù)據(jù)進行合并,張三子女指向張四-1和張四-2,數(shù)據(jù)符合標注格式,但數(shù)據(jù)是否合法卻需通過分析張三的婚姻狀態(tài)和產(chǎn)生當(dāng)前狀態(tài)的時間來確定,數(shù)據(jù)格式趨向復(fù)雜,因此須對數(shù)據(jù)結(jié)構(gòu)原型進行適當(dāng)改進。

        因垂直型關(guān)系結(jié)構(gòu)中取消了夫妻關(guān)系指向,雙方通過子女進行關(guān)聯(lián),則在數(shù)據(jù)結(jié)構(gòu)中用子女標注父母狀態(tài),分為:已婚、離異、喪父、喪母、雙喪五個狀態(tài)(如果虛擬子女不可被實際子女替代,可直接由虛擬子女標注父母狀態(tài)和產(chǎn)生狀態(tài)的時間,結(jié)構(gòu)更簡潔,但考慮到現(xiàn)有婚姻登記數(shù)遠小于實際夫妻關(guān)系數(shù),筆者認為當(dāng)前保留父母狀態(tài)屬性更為恰當(dāng))。

        張三和李三的婚姻狀態(tài)由其子女張四-1來標注,如表6所示。

        ?

        張三和王三的婚姻狀態(tài)由其子女張四-2來標注,如表7所示。

        ?

        在改進后的數(shù)據(jù)結(jié)構(gòu)下進行數(shù)據(jù)合并時,通過檢測張三兩個子女對應(yīng)的父母狀態(tài)即可判斷數(shù)據(jù)的合法性。

        改進后完整的數(shù)據(jù)結(jié)構(gòu)如表8所示。

        ?

        (二)垂直型關(guān)系及其數(shù)據(jù)結(jié)構(gòu)的驗證

        1. 關(guān)系人和關(guān)系網(wǎng)驗證

        圖5中,仍選擇之前示例的兩個關(guān)系人,如紅色圓所示,現(xiàn)在最短路徑增加為6級,中間關(guān)系人增加到5個,但兩人之間仍然可以建立鏈接。

        2. 減少鏈路條數(shù)驗證

        圖6分別截取了傳統(tǒng)關(guān)系結(jié)構(gòu)和垂直關(guān)系結(jié)構(gòu)左下角四個關(guān)系人的關(guān)系網(wǎng),從左圖中可以看出,如果建立從第二行紅色圓到第一行綠色圓的鏈接,可以有:1級鏈路1條、2級鏈路2條、3級鏈路2條;而右圖中建立同樣的鏈接,則為:1級鏈路1條、3級鏈路1條。相比較,新的關(guān)系網(wǎng)極大減少了可能鏈路的產(chǎn)生,并消除了無限循環(huán)風(fēng)險。

        3. 減少數(shù)據(jù)冗余驗證

        傳統(tǒng)型數(shù)據(jù)結(jié)構(gòu)中,數(shù)據(jù)的冗余主要來自兩個部分:(1)兄弟姐妹之間的互相指向;(2)夫妻雙方及其主要親屬關(guān)系間的重復(fù)指向。

        垂直型數(shù)據(jù)結(jié)構(gòu)中,每個人只需要指向父母和子女,不需要考慮家庭中其他成員,從而有效消除了數(shù)據(jù)冗余。

        4. 其他優(yōu)勢驗證

        垂直型關(guān)系結(jié)構(gòu)最大的優(yōu)勢是引入了虛擬子女概念。傳統(tǒng)結(jié)構(gòu)中,關(guān)系鏈建立在真實的人物和關(guān)系上,現(xiàn)假設(shè)有兩人結(jié)婚后未生育離婚,兩人夫妻關(guān)系鏈隨即斷裂,而即使有生育,此時雖仍可通過子女建立關(guān)系,但如果一方再婚,無論子女指向親生父母還是繼父母均會存在關(guān)系缺失。引入虛擬子女后,實際子女和虛擬子女永遠指向其真實父母,確保了父母數(shù)量唯一,且父母與子女間的指向不會產(chǎn)生數(shù)據(jù)沖突,同時無論父母再經(jīng)歷多少次離婚和再婚,子女均可以通過父(母)一方的新子女(或新虛擬子女)轉(zhuǎn)而指向繼母(父),關(guān)系結(jié)構(gòu)保持完整。

        (三)全國人口親屬關(guān)系大數(shù)據(jù)建設(shè)

        本部分將從建設(shè)粒度和建設(shè)步驟兩個方面闡述全國人口親屬關(guān)系大數(shù)據(jù)建設(shè)。

        1. 建設(shè)粒度

        建設(shè)粒度是指建立關(guān)系網(wǎng)的最小范圍,在此基礎(chǔ)上對每個顆粒進行互聯(lián)以形成全國的關(guān)系網(wǎng)絡(luò),粒度的選擇應(yīng)當(dāng)遵循易建設(shè)、便管理、高實用的原則。分析建立粒度大小的利弊,筆者認為以省級行政單位為主體,選擇若干中心城市、中心地區(qū)采取獨立建設(shè)、優(yōu)先建設(shè)的策略較為合適。搭建全國關(guān)系網(wǎng)絡(luò)時各數(shù)據(jù)中心采用區(qū)塊鏈技術(shù)實現(xiàn)實時更新和備份。

        2. 建設(shè)步驟

        (1)建立中心庫

        在各省級行政單位和部分中心城市政府的大數(shù)據(jù)中心建立數(shù)據(jù)庫,并導(dǎo)入轄區(qū)人口戶籍?dāng)?shù)據(jù)、出生和死亡數(shù)據(jù)、婚姻登記數(shù)據(jù)、人口普查數(shù)據(jù)等作為原始庫。

        (2)初始標注

        初始標注分為兩個部分,第一部分是戶籍標注,第二部分是其他數(shù)據(jù)補正。

        戶籍標注:從人口數(shù)據(jù)中按年齡進行排序(無論是否已身故),以年齡從大到小進行標注,根據(jù)戶籍信息和人口普查數(shù)據(jù)分別標注其父母、子女信息形成關(guān)系庫Ⅰ。

        其他數(shù)據(jù)補正:①死亡數(shù)據(jù)補充關(guān)系庫Ⅰ,對已死亡的人員修改其子女對應(yīng)的父母狀態(tài)為“死亡”;②婚姻登記數(shù)據(jù)查找結(jié)婚雙方名下是否有共同的子女指向,如無則修改雙方子女指向“虛擬子女”;③出生數(shù)據(jù)補充關(guān)系庫Ⅰ,將已進行戶籍登記的出生人員加入關(guān)系庫Ⅰ,設(shè)定其父母指向,并修改其父母的子女指向。經(jīng)過數(shù)據(jù)糾正后,形成關(guān)系庫Ⅱ。

        (3)自主標注

        完成系統(tǒng)標注后,對社會開放自助填報接口,由群眾自主申報,結(jié)合本次人口普查數(shù)據(jù)進行人工核對校驗,查漏補缺,形成關(guān)系庫Ⅲ。

        (4)數(shù)據(jù)合法性驗證

        對同一人涉及多條婚育關(guān)系的數(shù)據(jù)進行合法性驗證,合并合法數(shù)據(jù),不合法數(shù)據(jù)則發(fā)送核查報警給數(shù)據(jù)源單位。

        (5)數(shù)據(jù)更新與區(qū)域互聯(lián)

        傳統(tǒng)的數(shù)據(jù)更新與數(shù)據(jù)共享機制一般是設(shè)定一個固定頻率由單個中心庫向其他庫發(fā)送更新數(shù)據(jù),根據(jù)本數(shù)據(jù)的應(yīng)用場景,采用每日更新一次即可。隨著區(qū)塊鏈技術(shù)的成熟和發(fā)展,如采用區(qū)塊鏈將原有各中心庫進行鏈接,則更能保證數(shù)據(jù)的鮮活和可靠,也是數(shù)據(jù)的更可信備份。

        三、建模實踐

        本部分將介紹筆者在某地市級公安大數(shù)據(jù)平臺的建模過程,考慮保密原則,只展示了主要步驟的處理邏輯,對列舉的數(shù)據(jù)也進行了處理。

        (一)建模過程

        1. 數(shù)據(jù)清理

        將原常住人口信息表中“與戶主關(guān)系”欄的“長子”“次子”等及“長女”“次女”等修改為“子女”;將原常住人口信息表數(shù)據(jù)按出生日期由小到大排列(年齡由大到?。G謇砗蟮谋砻麨椤斑^程表”。

        2. 創(chuàng)建新表,并命名為“結(jié)果表”

        數(shù)據(jù)格式如表9所示。

        ?

        3. 逐一抽取過程表中數(shù)據(jù),并按以下規(guī)則填入表9中

        (1)將當(dāng)前數(shù)據(jù)的身份證號碼填入表9;

        (2)如數(shù)據(jù)中父親或母親身份證號碼不為空,則將父親或母親身份證號碼分別填入表9的對應(yīng)欄;

        (3)分別檢測父母數(shù)據(jù)是否已在表9,如不在則新增數(shù)據(jù),修改其子女欄數(shù)據(jù);

        (4)檢測當(dāng)前數(shù)據(jù)中“與戶主關(guān)系”字段:如為“父親”或“母親”,則在“過程表”找到當(dāng)前數(shù)據(jù)同戶號的戶主身份信息,并將信息加入當(dāng)前數(shù)據(jù)的子女欄;如為“子女”,則與上同樣操作并根據(jù)戶主性別分別將信息加入當(dāng)前數(shù)據(jù)的父親或母親欄;如為“戶主”,則與上同樣操作并將關(guān)系為“父親”“母親”“子女”身份信息加入對應(yīng)欄。

        4. 逐一抽取結(jié)婚登記信息表中數(shù)據(jù),并按以下規(guī)則填入表9中

        (1)分別檢查“男公民身份證號”和“女公民身份證號”是否已在表9的數(shù)據(jù)中,如不在則新增數(shù)據(jù),新增其子女欄一條虛擬子女?dāng)?shù)據(jù),虛擬子女格式為:&男身份證號&女身份證號&結(jié)婚日期;

        (2)判斷男公民子女和女公民子女除虛擬子女外是否有交集,如有則刪除虛擬子女。

        5. 逐一抽取出生登記信息表中有身份證號碼的數(shù)據(jù),并按以下規(guī)則填入表9中

        (1)檢查本身份證號碼是否已在表9的數(shù)據(jù)中,如不在則新增數(shù)據(jù),并填入其父親、母親信息;

        (2)檢查其父親、母親的子女欄數(shù)據(jù)中是否已包含本身份證號碼,如未包含則修改其子女欄數(shù)據(jù)。

        6. 導(dǎo)入人口普查數(shù)據(jù)、離婚登記數(shù)據(jù)、死亡注銷數(shù)據(jù)等,完善表9

        完成上述步驟后,表9中數(shù)據(jù)情況如表10(示例)所示。

        ?

        (二)實踐情況

        目前,模型已基本完成筆者所在地市中2個區(qū)的數(shù)據(jù)處理。以惠*區(qū)為例,共標注人口數(shù)據(jù)473717條,其中年齡最大的為1901年出生的葉某,年齡最小的為2021年10月7日出生的黃某(此數(shù)據(jù)截至投稿時為止),模型結(jié)果已共享給多個部門直接使用或其他模型調(diào)用。

        建模過程中,最大難點是現(xiàn)有業(yè)務(wù)數(shù)據(jù)的不完整和不規(guī)范。以惠*區(qū)的常住人口信息表為例,有登記父親或母親信息的數(shù)據(jù)僅為134175條和136592條。另外,同一戶號存在多個戶主、與戶主關(guān)系統(tǒng)一表述為“侄女”“侄子”等情況也較為常見,這類數(shù)據(jù)需要編寫大量的判斷邏輯處理。可喜的是,筆者發(fā)現(xiàn)數(shù)據(jù)越新業(yè)務(wù)庫數(shù)據(jù)也越規(guī)范,同時,業(yè)務(wù)庫中一些舊數(shù)據(jù)也在不斷趨于完善。

        四、結(jié)語與展望

        人口親屬關(guān)系網(wǎng)的建立具有廣泛的民事和執(zhí)法活動應(yīng)用場景,其數(shù)據(jù)也是我國姓氏、家庭關(guān)系變遷的數(shù)字體現(xiàn)。從政府層面來看可以為制定人口及衍生的經(jīng)濟、教育、醫(yī)療等相關(guān)政策提供參考依據(jù),從社會層面來看,數(shù)據(jù)也是一個全國版的“族譜”,不僅為各姓氏、家族提供了科學(xué)規(guī)范的族譜登記,也契合中國人傳統(tǒng)的“認祖歸宗”思想。

        雖然,目前實現(xiàn)的兩個區(qū)人員親屬關(guān)系模型只進行了部分業(yè)務(wù)系統(tǒng)數(shù)據(jù)的標注,但已初顯成效,工作中發(fā)現(xiàn)的諸多“疑點”數(shù)據(jù),如空掛戶、非法定投靠、頻繁結(jié)離婚等,均已納入當(dāng)?shù)刂攸c管控對象管理。筆者相信,隨著本次人口普查的進行和人口登記的不斷規(guī)范,特別是政府職能部門間數(shù)據(jù)共享機制的進一步完善,從各地分散建設(shè)人員親屬關(guān)系模型到建成全國性的人口親屬關(guān)系大數(shù)據(jù)網(wǎng)將指日可待,其價值也更能得以體現(xiàn)。

        猜你喜歡
        數(shù)據(jù)結(jié)構(gòu)指向鏈路
        家紡“全鏈路”升級
        天空地一體化網(wǎng)絡(luò)多中繼鏈路自適應(yīng)調(diào)度技術(shù)
        移動通信(2021年5期)2021-10-25 11:41:48
        科學(xué)備考新指向——不等式選講篇
        把準方向盤 握緊指向燈 走好創(chuàng)新路
        傳媒評論(2017年8期)2017-11-08 01:47:36
        “翻轉(zhuǎn)課堂”教學(xué)模式的探討——以《數(shù)據(jù)結(jié)構(gòu)》課程教學(xué)為例
        高職高專數(shù)據(jù)結(jié)構(gòu)教學(xué)改革探討
        中國市場(2016年45期)2016-05-17 05:15:48
        基于3G的VPDN技術(shù)在高速公路備份鏈路中的應(yīng)用
        TRIZ理論在“數(shù)據(jù)結(jié)構(gòu)”多媒體教學(xué)中的應(yīng)用
        《數(shù)據(jù)結(jié)構(gòu)》教學(xué)方法創(chuàng)新探討
        河南科技(2014年5期)2014-02-27 14:08:57
        高速光纖鏈路通信HSSL的設(shè)計與實現(xiàn)
        男女啪啪永久免费观看网站| 国产一级黄色录像大片| 欧美亚洲精品suv| 欧美日韩色另类综合| 亚洲国产夜色在线观看| 久久99精品免费国产| 五月天中文字幕日韩在线| 蜜桃av一区二区三区| 三级国产精品久久久99| 国产精品一区二区在线观看| 无码国产精品一区二区免| 日本一区二区久久精品亚洲中文无| 亚洲av一区二区三区蜜桃| 久久久久久久波多野结衣高潮| 日韩AV不卡一区二区三区无码| 69搡老女人老妇女老熟妇| 国产在线91精品观看| 欧美日韩国产精品自在自线| 精品88久久久久88久久久| 黄色网页在线观看一区二区三区 | 精品久久亚洲中文字幕| 亚洲精品成人网线在线播放va| 国产一级毛片AV不卡尤物| 久久综合这里只有精品| 国产精品美女久久久免费| 中文字幕无码不卡一区二区三区 | 麻豆AⅤ精品无码一区二区| 女同另类专区精品女同| 国产成人午夜高潮毛片| 久久亚洲中文字幕无码| 国产91网| 国产精品亚洲av一区二区三区| 亚洲av不卡无码国产| 亚洲欧洲中文日韩久久av乱码| AV在线毛片| 一本之道久久一区二区三区| 日本公与熄乱理在线播放 | 久久久久亚洲av无码专区导航| 国产精品久久久久久久y| 亚洲sm另类一区二区三区| 色噜噜av亚洲色一区二区|