胥曉莎,潘理,楊勃
(湖南理工學(xué)院信息與通信工程學(xué)院,岳陽(yáng) 414006)
法律咨詢網(wǎng)站用戶行為分析與服務(wù)優(yōu)化
胥曉莎,潘理,楊勃
(湖南理工學(xué)院信息與通信工程學(xué)院,岳陽(yáng) 414006)
針對(duì)某法律咨詢網(wǎng)站交互能力不足、查詢效率不高等問(wèn)題,通過(guò)用戶行為分析,提出網(wǎng)站服務(wù)優(yōu)化方案。首先對(duì)網(wǎng)站訪問(wèn)數(shù)據(jù)進(jìn)行數(shù)值化預(yù)處理,然后進(jìn)行用戶行為特征分析,找到影響服務(wù)效率的因素;然后,提出網(wǎng)站服務(wù)性能評(píng)價(jià)模型,從訪問(wèn)成功率和訪問(wèn)效率兩方面評(píng)估網(wǎng)站服務(wù)性能;最后,通過(guò)優(yōu)化常用關(guān)鍵字列表、組合條件查詢、內(nèi)容頁(yè)面鏈接等方案,使網(wǎng)站訪問(wèn)成功率和訪問(wèn)效率得到較大提高。所提網(wǎng)站服務(wù)性能評(píng)估模型具有較強(qiáng)的普適性,可為其他專業(yè)網(wǎng)站性能評(píng)估和優(yōu)化設(shè)計(jì)提供參考。
法律咨詢網(wǎng)站;用戶行為分析;訪問(wèn)成功率;訪問(wèn)效率
隨著我國(guó)社會(huì)經(jīng)濟(jì)發(fā)展,法律服務(wù)需求不斷增長(zhǎng),但法律資源總體稀缺,且地區(qū)分布不均衡。法律咨詢網(wǎng)站應(yīng)運(yùn)而生。但由于法律事務(wù)的復(fù)雜性、多樣性、專業(yè)性,與當(dāng)面咨詢相比,現(xiàn)有法律網(wǎng)站交互存在功能不足,無(wú)法與用戶形成有效互動(dòng)。并且絕大多數(shù)用戶缺乏專業(yè)法律知識(shí),難以通過(guò)網(wǎng)站導(dǎo)航、關(guān)鍵詞搜索等傳統(tǒng)方式準(zhǔn)確搜索,影響用戶體驗(yàn),限制網(wǎng)站發(fā)揮作用。因此,為了提高服務(wù)效率,高效、快捷地找到針對(duì)性的法律知識(shí)、相關(guān)案例或?qū)I(yè)律師至關(guān)重要。
隨著移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)搜索的用戶規(guī)模不斷增多,理解用戶行為模式和對(duì)網(wǎng)絡(luò)用戶行為分析對(duì)系統(tǒng)優(yōu)化至關(guān)重要。萬(wàn)飛、趙溪等通過(guò)對(duì)查詢?cè)~分析,會(huì)話分析和用戶點(diǎn)擊分析并與互聯(lián)網(wǎng)搜索引擎指標(biāo)進(jìn)行對(duì)比,分析得出移動(dòng)搜索引擎算法改進(jìn)與系統(tǒng)優(yōu)化具有一定的參考意義[1]。岑榮偉,劉奕群等基于7.56億條真實(shí)網(wǎng)絡(luò)用戶行為日志,對(duì)用戶行為進(jìn)行分析和研究。主要考察了用戶搜索行為中的查詢長(zhǎng)度,修改率,相關(guān)搜索點(diǎn)擊率,并考察了用戶在不同查詢需求下的行為差異[2]。榮國(guó)婷、王建冬等基于日志挖掘?qū)D書館主頁(yè)網(wǎng)站用戶行為[3]和用戶期刊數(shù)據(jù)庫(kù)檢索行為進(jìn)行分析[4]。上述研究對(duì)網(wǎng)站服務(wù)性能評(píng)估具有一定參考意義,但未對(duì)訪問(wèn)成功率和訪問(wèn)效率等服務(wù)性能指標(biāo)進(jìn)行深入探討,而這兩個(gè)指標(biāo)對(duì)于法律咨詢網(wǎng)站服務(wù)效率評(píng)估非常重要。
本文某法律網(wǎng)站提供的用戶訪問(wèn)日志數(shù)據(jù)的基礎(chǔ)上,通過(guò)分析用戶行為特征,找到影響網(wǎng)站訪問(wèn)效率的主要因素,然后從訪問(wèn)成功率和訪問(wèn)效率兩個(gè)方面,提出網(wǎng)站服務(wù)性能模型,評(píng)估網(wǎng)站目前的服務(wù)性能。最后,從關(guān)鍵詞、組合查詢、頁(yè)面鏈接等方面提出服務(wù)優(yōu)化改進(jìn)方案,通過(guò)實(shí)驗(yàn)數(shù)據(jù)對(duì)比發(fā)現(xiàn),新提出的改進(jìn)方案在訪問(wèn)成功率和訪問(wèn)效率方面均有明顯提高。
由于原始數(shù)據(jù)存在多源性、多樣性特點(diǎn),不利于數(shù)據(jù)的統(tǒng)一運(yùn)算和處理,需要通過(guò)對(duì)網(wǎng)站訪問(wèn)數(shù)據(jù)進(jìn)行規(guī)整和預(yù)處理,找出反映網(wǎng)站服務(wù)效率和用戶體驗(yàn)的特征和規(guī)律,形成一種計(jì)算網(wǎng)站服務(wù)效率的評(píng)估方法,從而分析得到影響訪問(wèn)成功率等性能指標(biāo)的主要因素。
1.1 數(shù)據(jù)預(yù)處理
本文分析的數(shù)據(jù)對(duì)象來(lái)源于某法律快車網(wǎng)站的用戶訪問(wèn)數(shù)據(jù)記錄,時(shí)間范圍從2015年3月1日~2015年3月25日。提供的主要數(shù)據(jù)文件包括:經(jīng)過(guò)整理的網(wǎng)站訪問(wèn)記錄文件:包含所有類別的網(wǎng)站訪問(wèn)記錄文件4個(gè),共189938條訪問(wèn)記錄,每條記錄包含13項(xiàng)屬性。另外,還提供離婚類別的記錄文件5個(gè),共293999條訪問(wèn)記錄,列屬性項(xiàng)與所有類別的記錄文件相同。原始訪問(wèn)日志文件:包含65535條原始訪問(wèn)日志記錄,每條記錄包含20項(xiàng)屬性。常見(jiàn)關(guān)鍵詞列表文件:包含4850項(xiàng)常見(jiàn)法律專業(yè)關(guān)鍵詞。頁(yè)面分類信息文件:包含30條頁(yè)面分類信息,每條信息包括3項(xiàng)內(nèi)容:頁(yè)面分類編號(hào)、網(wǎng)址、頁(yè)面標(biāo)題。此外,還提供了部分律師信息文件和部分網(wǎng)站頁(yè)面文件。
數(shù)據(jù)預(yù)處理過(guò)程包含對(duì)網(wǎng)站提供的數(shù)據(jù)進(jìn)行合并、轉(zhuǎn)換等預(yù)處理操作。綜合主體數(shù)據(jù)文件中的各項(xiàng)數(shù)據(jù)采用數(shù)值類型。通過(guò)對(duì)各個(gè)不同來(lái)源的原始數(shù)據(jù)進(jìn)行轉(zhuǎn)換和重塑,統(tǒng)一規(guī)整為數(shù)值類型,以方便數(shù)據(jù)的統(tǒng)計(jì)和分析。
1.2 用戶行為特征分析
主要從用戶關(guān)注領(lǐng)域,訪問(wèn)時(shí)段分布,用戶會(huì)話次數(shù),前導(dǎo)鏈接使用,用戶地域分布,用戶訪問(wèn)來(lái)源等幾個(gè)方面對(duì)用戶行為特征進(jìn)行分析。
通過(guò)數(shù)據(jù),可得用戶行為特征如下:(1)訪問(wèn)量靠前的18類關(guān)注領(lǐng)域(占領(lǐng)域總數(shù)的23%)的訪問(wèn)記錄數(shù)達(dá)到143994次,占用戶總訪問(wèn)量的76%,而訪問(wèn)量排名靠后的61類關(guān)注領(lǐng)域占總訪問(wèn)量的24%。(2)工作日上升,休息日回落,周期性分布明顯。(3)對(duì)用戶會(huì)話次數(shù)統(tǒng)計(jì)分析發(fā)現(xiàn):該網(wǎng)站用戶更偏向于使用1次會(huì)話,說(shuō)明網(wǎng)站并沒(méi)有引導(dǎo)好用戶進(jìn)行多次會(huì)話,反映該網(wǎng)站的交互功能不足。(4)對(duì)用戶前導(dǎo)鏈接使用統(tǒng)計(jì)分析發(fā)現(xiàn):絕大多數(shù)用戶沒(méi)有在日志中留下無(wú)前導(dǎo)鏈接,說(shuō)明并沒(méi)有在網(wǎng)站中進(jìn)行多次路徑跳轉(zhuǎn),反映網(wǎng)站頁(yè)面導(dǎo)航或交互功能還有待進(jìn)一步改進(jìn)。(5)對(duì)用戶地域分布統(tǒng)計(jì)分析發(fā)現(xiàn):用戶地區(qū)分布明顯不均衡。(6)通過(guò)對(duì)用戶訪問(wèn)來(lái)源可知:搜索引擎是用戶訪問(wèn)該法律網(wǎng)站最常用的方式。
法律咨詢網(wǎng)站是為用戶提供法律信息服務(wù)的,用戶能否成功訪問(wèn)到感興趣的頁(yè)面,用戶經(jīng)過(guò)多少次跳轉(zhuǎn)才訪問(wèn)到感興趣的頁(yè)面是衡量網(wǎng)站服務(wù)質(zhì)量的兩個(gè)重要指標(biāo)。所以我們采取訪問(wèn)成功率和訪問(wèn)效率對(duì)網(wǎng)站服務(wù)進(jìn)行評(píng)價(jià)。
圖1 網(wǎng)站用戶行為特征分析
2.1訪問(wèn)成功率
(1)內(nèi)容頁(yè)面訪問(wèn)率
我們定義以下三類方式為成功訪問(wèn)條件:①通過(guò)直接訪問(wèn)到內(nèi)容頁(yè)面。②通過(guò)有關(guān)鍵詞記錄的搜索引擎訪問(wèn)到內(nèi)容頁(yè)面并且內(nèi)容頁(yè)面與用戶的提問(wèn)匹配。③通過(guò)無(wú)關(guān)鍵詞記錄的搜索引擎訪問(wèn)到內(nèi)容頁(yè)面,我們假設(shè)匹配性符合隨機(jī)分布。
根據(jù)網(wǎng)頁(yè)分類信息文件,可以將該法律網(wǎng)站的頁(yè)面分為以下三種類型:法律咨詢相關(guān)頁(yè)面Nq,律師查詢相關(guān)頁(yè)面;其他法律知識(shí)頁(yè)面。類似地,該法律網(wǎng)站的內(nèi)容頁(yè)面也分為以下三種類型:咨詢內(nèi)容頁(yè)面;律師內(nèi)容頁(yè)面;其他知識(shí)內(nèi)容頁(yè)面。
特定頁(yè)面訪問(wèn)率:
N為網(wǎng)站頁(yè)面訪問(wèn)總量,NX為特定頁(yè)面訪問(wèn)量,x∈{q,l,k},Nq為咨詢頁(yè)面訪問(wèn)量,Nl為律師頁(yè)面訪問(wèn)量,Nk為其他知識(shí)頁(yè)面訪問(wèn)量。Rx為特定頁(yè)面訪問(wèn)率。
內(nèi)容頁(yè)面訪問(wèn)率:
特定內(nèi)容頁(yè)面訪問(wèn)率:
Nc為內(nèi)容頁(yè)面訪問(wèn)總量,Ncx為特定內(nèi)容頁(yè)面訪問(wèn)量,Rcx為特定內(nèi)容頁(yè)面訪問(wèn)率。
(2)搜索提問(wèn)與內(nèi)容頁(yè)面的匹配率
該法律網(wǎng)站提供了常見(jiàn)法律專業(yè)關(guān)鍵詞。根據(jù)關(guān)鍵詞列表,定義問(wèn)題和頁(yè)面的專業(yè)關(guān)聯(lián)性。我們將頁(yè)面與問(wèn)題的匹配率定義為頁(yè)面與問(wèn)題有匹配的訪問(wèn)數(shù)與該頁(yè)面的訪問(wèn)量的比值。
搜索提問(wèn)與內(nèi)容頁(yè)面的關(guān)鍵詞匹配數(shù):
Mq表示搜索提問(wèn)包含的關(guān)鍵詞的集合,Kq=|Mq|表示提問(wèn)包含關(guān)鍵詞的數(shù)目,Mp和Kp表示頁(yè)面包含的關(guān)鍵詞的集合和關(guān)鍵詞的個(gè)數(shù)。Kq(或Kp)越大,表示該提問(wèn)(或頁(yè)面)與法律專業(yè)的關(guān)聯(lián)程度越高。Kq(或Kp)大于0,表示提問(wèn)(或頁(yè)面)與法律專業(yè)的關(guān)聯(lián)。Mqp表示提問(wèn)與頁(yè)面共同包含的關(guān)鍵詞集合,用Kqp表示提問(wèn)與頁(yè)面共同包含的關(guān)鍵詞個(gè)數(shù)。Kqp大于0,表示提問(wèn)與頁(yè)面的有匹配。Kqp越大,表示提問(wèn)與頁(yè)面的專業(yè)匹配度越高。
訪問(wèn)特定內(nèi)容頁(yè)面條件下的匹配率:
Ncx為特定內(nèi)容頁(yè)面訪問(wèn)數(shù),NX|cx是訪問(wèn)特定內(nèi)容頁(yè)面條件下包含搜索提問(wèn)的訪問(wèn)記錄數(shù),則RN|cx是訪問(wèn)特定內(nèi)容頁(yè)面條件下搜索提問(wèn)與頁(yè)面內(nèi)容的匹配率。
(3)內(nèi)容頁(yè)面訪問(wèn)成功率
特定內(nèi)容頁(yè)面的訪問(wèn)成功率:
用SX|cx特定內(nèi)容頁(yè)面的成功率。特定內(nèi)容頁(yè)面訪問(wèn)成功率SX|cx等于特定內(nèi)容頁(yè)面的訪問(wèn)率Rcx和訪問(wèn)特定內(nèi)容頁(yè)面條件下的匹配率RX|qx的乘積。
內(nèi)容頁(yè)面的平均訪問(wèn)成功率:由式(7)計(jì)算可得:該網(wǎng)站內(nèi)容頁(yè)面平均訪問(wèn)成功率Sc=36.97%。
表1 內(nèi)容頁(yè)面的訪問(wèn)成功率
由此我們可推斷出:由于用戶缺乏專業(yè)法律知識(shí),不能準(zhǔn)確使用恰當(dāng)?shù)年P(guān)鍵詞進(jìn)行搜索,導(dǎo)致搜索效率降低,無(wú)法有針對(duì)性地高效找到相關(guān)頁(yè)面,影響用戶體驗(yàn)。
2.2訪問(wèn)效率
用戶進(jìn)入一個(gè)網(wǎng)站瀏覽網(wǎng)頁(yè)時(shí),也會(huì)有一個(gè)“參觀順序”,這個(gè)順序就是用戶瀏覽網(wǎng)頁(yè)的路徑。訪客先瀏覽哪個(gè)頁(yè)面,后瀏覽哪個(gè)頁(yè)面,這些都包括在訪問(wèn)路徑里。定義訪問(wèn)路徑長(zhǎng)度Lu為用戶u在網(wǎng)站中跳轉(zhuǎn)的頁(yè)面數(shù)。用戶u訪問(wèn)路徑長(zhǎng)度越大,說(shuō)明用戶需要經(jīng)過(guò)更多次跳轉(zhuǎn)才能到達(dá)最終頁(yè)面,用戶訪問(wèn)效率就越低。因此我們使用路徑長(zhǎng)度的倒數(shù)定義為用戶這次訪問(wèn)的效率。即訪問(wèn)效率=1/路徑長(zhǎng)度。
用Eave表示網(wǎng)站的平均訪問(wèn)效率,則:
網(wǎng)站的平均訪問(wèn)效率:
拓?fù)浣Y(jié)構(gòu),我們進(jìn)一步改善了網(wǎng)站訪問(wèn)效率。根據(jù)式(8)計(jì)算可得:改進(jìn)后用戶成功時(shí)的平均路徑長(zhǎng)度為1.5035,改進(jìn)后失敗訪問(wèn)時(shí)的平均路徑長(zhǎng)度為2.0894,改進(jìn)前平均訪問(wèn)效率55.17%,改進(jìn)后平均訪問(wèn)效率65.06%,優(yōu)化了約10個(gè)百分點(diǎn)。
表2 網(wǎng)站訪問(wèn)效率
表3 訪問(wèn)成功率改進(jìn)對(duì)比
根據(jù)(式8)計(jì)算可得:網(wǎng)站的平均訪問(wèn)效率為55.17%。由于網(wǎng)站內(nèi)容頁(yè)面缺乏相關(guān)性鏈接,導(dǎo)致一些訪問(wèn)需要經(jīng)過(guò)多次跳轉(zhuǎn)才能找到目標(biāo)頁(yè)面,增大了平均路徑長(zhǎng)度,減低了訪問(wèn)效率。
表4 改進(jìn)前后訪問(wèn)效率對(duì)比
通過(guò)分析用戶在關(guān)注領(lǐng)域、用戶體驗(yàn)等方面的特征和規(guī)律,發(fā)現(xiàn)該網(wǎng)站在查找相關(guān)頁(yè)面或?qū)I(yè)律師的成功率和效率等方面還存在問(wèn)題。
訪問(wèn)成功率的改進(jìn)方案包括:(1)增加常用非法律關(guān)鍵詞列表,提升問(wèn)題與頁(yè)面的匹配率。(2)增加關(guān)鍵詞的領(lǐng)域關(guān)聯(lián),提高關(guān)鍵詞之間的關(guān)聯(lián)性。
訪問(wèn)效率的優(yōu)化方案為:(1)增設(shè)組合條件查詢功能,減少用戶查找的頁(yè)面跳轉(zhuǎn)數(shù),提高查詢效率,改善用戶體驗(yàn)。(2)優(yōu)化網(wǎng)頁(yè)鏈接結(jié)構(gòu),減少用戶回退次數(shù)。
通過(guò)增加非專業(yè)關(guān)鍵詞和增加關(guān)鍵詞的領(lǐng)域關(guān)聯(lián),明顯提高了對(duì)通過(guò)關(guān)鍵詞搜索進(jìn)入頁(yè)面的匹配度,從而改進(jìn)內(nèi)容頁(yè)面的訪問(wèn)成功率。根據(jù)式(7)計(jì)算可得改進(jìn)前的內(nèi)容頁(yè)面平均訪問(wèn)成功率Sc=36.97%,改進(jìn)后內(nèi)容頁(yè)面平均訪問(wèn)成功率Sc=49.15%,提高了約12個(gè)百分點(diǎn)。通過(guò)增加組合條件查詢功能和優(yōu)化網(wǎng)頁(yè)鏈接
本文針對(duì)法律咨詢網(wǎng)站服務(wù)效率偏低的問(wèn)題,提出網(wǎng)站服務(wù)性能評(píng)估模型,通過(guò)用戶行為分析和性能評(píng)估,給出相應(yīng)優(yōu)化改進(jìn)方案,使網(wǎng)站服務(wù)效率得到明顯提高。論文從訪問(wèn)成功率和訪問(wèn)效率兩個(gè)方面定義網(wǎng)站服務(wù)性能。訪問(wèn)成功率反映用戶成功訪問(wèn)到感興趣的內(nèi)容頁(yè)面的概率;訪問(wèn)效率反映用戶需要經(jīng)過(guò)多少次跳轉(zhuǎn)才訪問(wèn)到感興趣的頁(yè)面。通過(guò)對(duì)訪問(wèn)數(shù)據(jù)進(jìn)行評(píng)估計(jì)算,找到現(xiàn)有網(wǎng)站服務(wù)效率偏低的主要原因,并通過(guò)增加常用關(guān)鍵詞列表、增設(shè)組合條件查詢等方式提高網(wǎng)站服務(wù)質(zhì)量。實(shí)驗(yàn)對(duì)比發(fā)現(xiàn),改進(jìn)后網(wǎng)站服務(wù)性能得到較大提升。
[1]萬(wàn)飛,趙溪,梁循,等.基于移動(dòng)互聯(lián)網(wǎng)日志的搜索引擎用戶行為研究[J].中文信息學(xué)報(bào),2014,28(2):144-150.
[2]岑榮偉,劉奕群,張敏,等.基于日志挖掘的搜索引擎用戶行為分析[J].中文信息學(xué)報(bào),2010,24(3):49-54.
[3]榮國(guó)婷,羅勇,孫建軍.基于日志分析的圖書館主頁(yè)網(wǎng)站用戶行為研究[J].圖書館雜志,2015(7):59-63.
[4]王建冬,王繼民.基于日志挖掘的高校用戶期刊數(shù)據(jù)庫(kù)檢索行為研究[J].北京大學(xué)學(xué)報(bào):自然科學(xué)版,2012,48(1):29-36.
User Behavior Analysis and Service Optimization for Legal Advice Website
XU Xiao-sha,PAN Li,YANG Bo
(Department of Information and Communication Engineering,Hunan Institute of Science and Technology,Yueyang 414006)
Puts forward a service optimization solution for legal advice websites to make up the lack of interaction capacity and low query efficiency by the analysis of user behaviors.At first,makes the preprocessing of numerical normalization for the raw website data.Then,analyzes the user behaviors to find the factors influencing the efficiency of services,and defines the performance model of the website.Service performances include the success rate of accessing content page and the access efficiency.Finally,proposes an optimization solution to improve the two performance indexes by adding the common non-professional keywords and providing combination query.The proposed performance model has good suitability,and is applied to performance evaluation for other professional websites.
Legal Advice Website;User Behavior Analysis;Success Rate of Access;Access Efficiency
0 引言
1007-1423(2016)33-0018-05
10.3969/j.issn.1007-1423.2016.33.004
胥曉莎(1991-),女,湖南汨羅人,碩士研究生,研究方向?yàn)閺?fù)雜系統(tǒng)建模與分析
潘理(1975-),男,湖南平江人,博士,副教授,研究方向?yàn)橄到y(tǒng)建模與優(yōu)化、Petri網(wǎng)
楊勃(1974-),男,湖南岳陽(yáng)人,博士,副教授,研究方向?yàn)槟J阶R(shí)別
2016-10-14
2016-11-20