亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于法律快車網(wǎng)的智能推薦與分析系統(tǒng)

        2022-05-06 07:39:16王高佳晨林國鳳陳婷婷
        中國新技術(shù)新產(chǎn)品 2022年3期
        關(guān)鍵詞:離婚率快車詞條

        王高佳晨 林國鳳 陳婷婷

        (廈門華廈學(xué)院,福建 廈門 361024)

        0 引言

        隨著法制社會(huì)的推進(jìn),人民已經(jīng)學(xué)會(huì)拿起法律武器捍衛(wèi)自己的利益。由于法律行業(yè)具有專業(yè)性和區(qū)域性的特點(diǎn),因此人們?cè)趯ふ衣蓭煏r(shí)缺少可以參考的依據(jù),通常通過行業(yè)的口碑、熟人推薦等渠道尋求律師的幫助。雖然國內(nèi)有類似法律快車網(wǎng)在線的法律咨詢平臺(tái),但是由于互聯(lián)網(wǎng)規(guī)模和覆蓋面的迅速增長會(huì)帶來信息超載的問題,因此用戶很難在法律快車網(wǎng)找到感興趣的內(nèi)容,傳統(tǒng)的搜索算法只能為用戶呈現(xiàn)一樣的排序結(jié)果,無法針對(duì)不同用戶的需求提供個(gè)性化。

        1 相關(guān)工作

        該文針對(duì)用戶需求設(shè)計(jì)了一套智能推薦與分析系統(tǒng),該系統(tǒng)具備可視化大屏展示的功能。如圖1所示,該系統(tǒng)主要包括4個(gè)模塊:數(shù)據(jù)處理模塊、智能推薦模塊、數(shù)據(jù)分析模塊和數(shù)據(jù)可視化模塊。該文涉及的工作主要包括以下4個(gè)方面:1) 數(shù)據(jù)處理模塊。包括數(shù)據(jù)采集、數(shù)據(jù)清洗以及數(shù)據(jù)存儲(chǔ)。2) 智能推薦模塊。采用基于協(xié)同過濾的推薦算法實(shí)現(xiàn)推薦法律知識(shí)和律師服務(wù)的功能,根據(jù)當(dāng)事人對(duì)法律快車網(wǎng)的瀏覽記錄為用戶推薦相關(guān)的法律知識(shí)和律師服務(wù),從而實(shí)現(xiàn)提供個(gè)性化服務(wù)的目標(biāo)。3) 數(shù)據(jù)分析模塊。基于加權(quán)TFIDF算法和聚類分析算法研究某一段時(shí)間內(nèi)某地域的熱點(diǎn)事件,實(shí)現(xiàn)對(duì)地域熱點(diǎn)事件的追蹤,進(jìn)而實(shí)時(shí)把握、追蹤社會(huì)熱點(diǎn)。采用統(tǒng)計(jì)算法分析離婚案件與地域的關(guān)聯(lián)性,適當(dāng)?shù)貫橛脩籼峁┖侠淼膮⒖及咐瑸橛脩敉咨铺幚黼x婚事件提供法律支持。4)數(shù)據(jù)可視化模塊。對(duì)基于法律快車網(wǎng)的智能推薦結(jié)果與分析結(jié)果進(jìn)行前端大屏可視化展示。

        圖1 基于法律快車網(wǎng)的智能推薦與分析系統(tǒng)架構(gòu)

        2 數(shù)據(jù)處理模塊

        使用網(wǎng)絡(luò)爬蟲技術(shù)訪問法律快車網(wǎng)站并采集數(shù)據(jù),通過網(wǎng)絡(luò)爬蟲相關(guān)的頁面解析技術(shù),從訪問頁面中提取價(jià)值數(shù)據(jù),數(shù)據(jù)字段包括用戶ID、用戶所在省市、來源關(guān)鍵詞、來源網(wǎng)站、訪問時(shí)間、訪問頁面、頁面標(biāo)題、標(biāo)簽、網(wǎng)頁類別、關(guān)鍵詞、律師ID、律師姓名、擅長領(lǐng)域以及律師所在省市等。

        對(duì)采集的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與存儲(chǔ),清除關(guān)鍵詞段為空的數(shù)據(jù)以及律師和用戶不可用的數(shù)據(jù)。將清洗規(guī)整的數(shù)據(jù)拆分為5個(gè)表(開展不同的分析工作),分別是律師表、用戶表、提問信息表、法律知識(shí)表以及綜合信息表。

        3 智能推薦模塊

        用戶進(jìn)入法律快車網(wǎng)網(wǎng)站主頁查找資源,自行尋找位于不同欄目下的目標(biāo)資源相對(duì)困難,此時(shí)需要網(wǎng)站提供推薦功能,推薦用戶感興趣的頁面(例如讓有法律援助需求的公眾快速找到合適的律師)。該文通過數(shù)據(jù)建模分析用戶事件行為,設(shè)計(jì)了基于協(xié)同過濾的法律快車網(wǎng)推薦模型,該模型是基于計(jì)算用戶相似度的思想,根據(jù)用戶對(duì)信息類別的偏好找到相似用戶,再將相似用戶喜歡的推薦給當(dāng)前用戶。該系統(tǒng)所推薦的內(nèi)容分為2個(gè)部分,第一部分是為用戶推薦律師,第二部分是為用戶推薦法律知識(shí)。

        首先,對(duì)常用用戶的瀏覽數(shù)據(jù)進(jìn)行分類,根據(jù)法律類別的不同來反映用戶的偏好,并對(duì)偏好程度進(jìn)行加權(quán),得到用戶對(duì)不同類別信息的總體喜好程度。其次,對(duì)目前登陸用戶的歷史瀏覽數(shù)據(jù)進(jìn)行分析,得到滿足當(dāng)前用戶需求的律師和法律知識(shí),根據(jù)用戶的需求程度計(jì)算相似用戶,從而基于相似用戶進(jìn)行推薦。相似度的基礎(chǔ)計(jì)算方法是基于向量的,也是計(jì)算2個(gè)向量之間的距離,距離越小表示相似度越高。在推薦場景中,可以將用戶瀏覽信息類別偏好看作二維矩陣,將1個(gè)用戶對(duì)所有物品的偏好作為1個(gè)向量,也可以將所有用戶對(duì)某個(gè)物品的偏好作為1個(gè)向量,從而計(jì)算物品的之間的相似度。

        2個(gè)用戶的相似度如公式(1)所示。

        式中:和分別為2個(gè)不同用戶的維向量,= [,,,...,X](X為向量),=[,,,...,Y](Y為向量);為用戶與用戶的夾角,=0°,其余弦值為1。

        當(dāng)2個(gè)向量之間的夾角越?。ㄔ节吔?0° ),2個(gè)用戶(和)越相似。

        完成相似度的計(jì)算后,根據(jù)相似度找到用戶-瀏覽信息類別的鄰居。該文采用的算法是挑選固定數(shù)量鄰居的方法。根據(jù)鄰居的相似度權(quán)重以及他們對(duì)信息類別的需求,預(yù)測(cè)當(dāng)前用戶沒有瀏覽過的律師信息與法律知識(shí),計(jì)算網(wǎng)站的訪問次數(shù)的權(quán)重。經(jīng)過加權(quán)計(jì)算得到1個(gè)排序的物品列表作為推薦,試驗(yàn)設(shè)置為5,表示將排名前五的律師或類別法律知識(shí)推薦給訪問用戶。

        4 數(shù)據(jù)分析模塊

        4.1 熱點(diǎn)事件

        需要嚴(yán)密地對(duì)網(wǎng)上的突發(fā)輿情信息進(jìn)行監(jiān)控,希望可以把握和跟蹤最新的社會(huì)熱點(diǎn),并分析其對(duì)人們生活造成的影響。發(fā)現(xiàn)熱點(diǎn)事件是要發(fā)現(xiàn)某個(gè)以前未知的熱點(diǎn)話題,可以通過不同的聚類算法來發(fā)現(xiàn)話題。但是單純通過聚類算法無法處理文本信息,該文提出的基于聚類分析和TF-IDF加權(quán)的算法能夠很好地解決區(qū)域熱點(diǎn)分析問題。該方法比傳統(tǒng)的單一基于聚類的熱點(diǎn)事件分析方法擁有更高的準(zhǔn)確性。

        熱點(diǎn)事件模塊設(shè)計(jì)分為以下4個(gè)步驟:1) 使用結(jié)巴分詞將數(shù)據(jù)集中提出問題切成詞組。2)TF-IDF找出關(guān)鍵詞。TF詞頻(Term Frequency)和IDF反文檔頻率(Inverse Document Frequency)。TF表示詞條在文檔d中出現(xiàn)的頻率。IDF表示如果包括詞條t的文檔越少,也就是越小且IDF越大,則說明詞條t具有很好的類別區(qū)分能力。反之,詞條t不具有區(qū)分能力。詞頻如公式(2)所示。反文檔頻率如公式(3)所示。為詞條對(duì)文檔的重要程度,如公式(4)所示。3)K-means聚類。通過從數(shù)據(jù)中隨機(jī)選取個(gè)詞條作為初始點(diǎn)質(zhì)心,計(jì)算質(zhì)心與數(shù)據(jù)點(diǎn)距離不斷迭代,當(dāng)質(zhì)心的距離小于設(shè)定的閾值,算法終止。4) 合并同類。將同一類別的文件合并,對(duì)每個(gè)同類文件進(jìn)行加權(quán)詞頻統(tǒng)計(jì)與排序,篩選出排名前位的詞條作為這段時(shí)間內(nèi)該區(qū)域的熱門事件。

        式中:n為該詞在文件d中出現(xiàn)的次數(shù);∑n為在文件中所有詞出現(xiàn)次數(shù)的和;為文件d中所有詞的數(shù)量。

        式中:||為語料庫中的文件總數(shù);|{︰td}|為包括詞語t的文件數(shù)目(即n的文件數(shù)目),如果該詞語不在語料庫中,就會(huì)導(dǎo)致被除數(shù)為0。

        4.2 離婚案件

        工業(yè)化與現(xiàn)代化的深入推進(jìn)給現(xiàn)代社會(huì)婚姻家庭關(guān)系所帶來的重大變化之一就是離婚問題日益突出,離婚率趨向上升。該文使用大數(shù)據(jù)分析技術(shù)分析了中國省級(jí)與市級(jí)之間離婚水平的差別和離婚水平與用戶所在地區(qū)的關(guān)聯(lián)性。

        離婚案件分析模塊設(shè)計(jì)如下:一個(gè)地區(qū)的離婚水平與該地區(qū)所有用戶訪問法律快車網(wǎng)中有關(guān)離婚信息的次數(shù)和所有用戶訪問網(wǎng)站所有信息的次數(shù)的比率與該地區(qū)訪問離婚案件的用戶人數(shù)和總用戶數(shù)的比率有關(guān),地域離婚率,如公式(5)所示。

        式中:N為統(tǒng)計(jì)離婚咨詢次數(shù);N為該地區(qū)咨詢總數(shù);N為咨詢離婚案件的用戶數(shù);N為總用戶數(shù);與為2個(gè)比率的權(quán)重系數(shù)。

        在該試驗(yàn)中,初始化與,表示咨詢次數(shù)比率對(duì)地域離婚率的影響占比,用戶人數(shù)的比率對(duì)地域離婚率的影響占比,在試驗(yàn)中分別設(shè)為0.3與0.7。地域離婚率越大,該地區(qū)的離婚案件越多;地域離婚率越小,該地區(qū)的離婚案件越少。

        5 數(shù)據(jù)可視化模塊

        數(shù)據(jù)可視化將數(shù)據(jù)分析模塊進(jìn)行精美又直接的展示,該文采用可視化大屏的方式對(duì)分析與推薦結(jié)果進(jìn)行展示。在數(shù)據(jù)可視化模塊中展示熱門事件詞云圖、福建省各地區(qū)咨詢離婚次數(shù)、全國各省離婚率占比、用戶地區(qū)分布、相關(guān)律師和法律推薦。

        從可視化大屏中直觀獲得用戶總?cè)藬?shù)為36 040人,其中律師總?cè)藬?shù)為6 206人。為了直觀地觀測(cè)用戶群體所在的地區(qū),繪制圓環(huán)圖與中國地圖,在地圖中則能夠觀測(cè)到各省份用戶的訪問次數(shù)。

        對(duì)用戶在法律快車網(wǎng)上提出問題的數(shù)據(jù)進(jìn)行分析,得到時(shí)間段內(nèi)出現(xiàn)頻率較高的詞匯數(shù)據(jù),以廈門地區(qū)為例,分析近一個(gè)月內(nèi)的高搜索頻率詞條,將其作為熱點(diǎn)事件并通過詞云圖直觀地呈現(xiàn)出來,如圖2所示。

        圖2 熱門事件的詞條

        圖3用柱狀圖形象地展示了福建省各地區(qū)離婚率的差異,可以直觀地了解離婚案件與地域的關(guān)聯(lián)性。以福建省為例,橫坐標(biāo)為福建省的部分城市,縱坐標(biāo)為訪問離婚案件的次數(shù)(單位:次),福州市的離婚咨詢次數(shù)最高,其次為廈門市和泉州市。其中,三明市的離婚咨詢次數(shù)最低。

        圖3 福建省各地區(qū)咨詢離婚次數(shù)

        系統(tǒng)智能地為用戶推薦合適的律師與法律知識(shí),試驗(yàn)結(jié)果如圖4所示。當(dāng)用戶進(jìn)入網(wǎng)站時(shí),系統(tǒng)會(huì)識(shí)別用戶ID,匹配與該用戶ID最相似的其他用戶,將相似用戶曾經(jīng)多次訪問過的律師信息推薦給給該用戶。方便用戶快速地查找自己符合自己需求的律師和答案。

        圖4 推薦律師與法律知識(shí)

        該文設(shè)計(jì)了基于協(xié)同過濾的法律快車網(wǎng)推薦模型,該模型基于計(jì)算用戶相似度的思想,分別對(duì)用戶-律師和用戶-法律知識(shí)數(shù)據(jù)進(jìn)行分析,從試驗(yàn)結(jié)果可知,該模型的推薦結(jié)果能夠滿足用戶的需求。

        6 結(jié)語

        該文提出基于法律快車網(wǎng)的智能推薦與分析系統(tǒng),該系統(tǒng)能夠幫助用戶簡單快速地在法律快車網(wǎng)中找到感興趣的法律知識(shí)和專業(yè)律師。該系統(tǒng)使不同地域的用戶進(jìn)入系統(tǒng)之后都可以直觀地瀏覽近期該地域的熱點(diǎn)事件,發(fā)揮對(duì)社會(huì)事件的監(jiān)督作用,具有很大的應(yīng)用價(jià)值,還可以為其他網(wǎng)絡(luò)平臺(tái)的建設(shè)提供參考。

        猜你喜歡
        離婚率快車詞條
        健康快車
        健康快車
        健康快車
        單親家庭,風(fēng)雨前行
        東方女性(2018年7期)2018-07-25 17:55:56
        2016年4月中國直銷網(wǎng)絡(luò)熱門詞條榜
        2016年3月中國直銷網(wǎng)絡(luò)熱門詞條榜
        離婚率與房價(jià)
        ——基于面板數(shù)據(jù)模型的實(shí)證分析
        人間(2016年23期)2016-09-15 06:39:46
        離婚率逐年攀升 是什么讓婚姻變得脆弱
        2016年9月中國直銷網(wǎng)絡(luò)熱門詞條榜
        大數(shù)據(jù)相關(guān)詞條
        一进一出一爽又粗又大| 热综合一本伊人久久精品| 性生大片免费观看性少妇| 国产美女精品视频线免费播放软件| 在线观看午夜亚洲一区| 午夜精品久久久久久| 精品一级毛片| 亚洲一区二区三区乱码在线| 亚洲精品视频中文字幕| 久久精品人妻无码一区二区三区| 免费无码肉片在线观看| 亚洲 国产 韩国 欧美 在线| 美女与黑人巨大进入免费观看 | 最新国产美女一区二区三区| 中文字幕亚洲五月综合婷久狠狠 | 亚洲精品久久激情国产片| 1000部夫妻午夜免费| 欧洲日韩视频二区在线| 在线观看一区二区三区视频| av无码国产精品色午夜| 性色av无码一区二区三区人妻| 东京热加勒比在线观看| av国产自拍在线观看| 日本一二三区视频在线| 欧美日韩精品一区二区在线视频| 无遮挡很爽视频在线观看| 亚洲国产成人久久精品一区| 国产av无码专区亚洲av毛网站| 日韩欧美中文字幕不卡| 蜜桃视频网站在线免费观看| 中文字幕一区二区三区日日骚| 人妻饥渴偷公乱中文字幕| 激情另类小说区图片区视频区| 风流少妇一区二区三区| 美腿丝袜诱惑一区二区| 欧美猛男军警gay自慰| 久久亚洲国产精品123区| 女同恋性吃奶舌吻完整版| 久久99国产精一区二区三区 | 亚洲熟妇av日韩熟妇av| 亚洲中文字幕久久精品色老板|