亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于主題動(dòng)態(tài)模型的法律因果關(guān)系研究

        2017-02-20 02:20:00張瑞祥王東波
        政法論叢 2017年1期
        關(guān)鍵詞:流行性因果關(guān)系動(dòng)態(tài)

        張瑞祥 王東波

        (1.江蘇省司法廳研究室,江蘇 南京 210024;2.南京農(nóng)業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院,江蘇 南京 210095)

        基于主題動(dòng)態(tài)模型的法律因果關(guān)系研究

        張瑞祥1王東波2

        (1.江蘇省司法廳研究室,江蘇 南京 210024;2.南京農(nóng)業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院,江蘇 南京 210095)

        主題動(dòng)態(tài)模型為探究學(xué)科研究趨勢(shì)和主題演化形式提供了新的思路,使用該模型對(duì)法律因果關(guān)系進(jìn)行分析可有效驗(yàn)證模型的有效性并為推廣模型提供經(jīng)驗(yàn),并且針對(duì)學(xué)科研究?jī)?nèi)容的分析也為學(xué)科整體發(fā)展提供了有益的支持。通過(guò)對(duì)2009-2013年的5494篇因果關(guān)系相關(guān)文獻(xiàn)的主題動(dòng)態(tài)分析,所取得的結(jié)果驗(yàn)證了主題動(dòng)態(tài)模型在應(yīng)用于因果關(guān)系學(xué)科上的有效性,同時(shí)基于主題動(dòng)態(tài)模型的分析結(jié)論,對(duì)學(xué)科研究歷史的變遷進(jìn)行了總結(jié)和評(píng)述。由于主題動(dòng)態(tài)模型是一種新提出的研究方法,并且缺乏在人文社會(huì)科學(xué)上的應(yīng)用,從而導(dǎo)致本研究缺乏對(duì)其他學(xué)科進(jìn)行橫向性能的比較。

        主題動(dòng)態(tài)模型 因果關(guān)系 流行性 連續(xù)性

        一、導(dǎo)論

        學(xué)科研究主題的變遷、研究群體規(guī)模的變動(dòng)、研究興趣的轉(zhuǎn)移以及知識(shí)擴(kuò)散和流動(dòng)的方向一直是情報(bào)科學(xué)關(guān)注的主題。以共詞網(wǎng)絡(luò)[1]P599-605、主題網(wǎng)絡(luò)[2]P79-82、作者合作網(wǎng)絡(luò)[3]P121-126、共引網(wǎng)絡(luò)[4]P93-98和共被引網(wǎng)絡(luò)[5] P80-8為主的科學(xué)知識(shí)網(wǎng)絡(luò)是認(rèn)知科學(xué)領(lǐng)域結(jié)構(gòu)的主要手段(Yan等,2012)[6]P140-153。這些基于網(wǎng)絡(luò)的思想被應(yīng)用到論文、作者、期刊、主題、機(jī)構(gòu)等不同的學(xué)術(shù)實(shí)體層次,輔之以知識(shí)挖掘技術(shù)和復(fù)雜網(wǎng)絡(luò)技術(shù),取得了豐碩的研究成果[7]P98-110。最初的基于網(wǎng)絡(luò)的方法集中于討論給定時(shí)間區(qū)間的科學(xué)知識(shí)網(wǎng)絡(luò),難以反映學(xué)科主題的動(dòng)態(tài)變化和知識(shí)的流動(dòng)。隨著靜態(tài)方法的逐漸成熟,基于時(shí)間窗口的動(dòng)態(tài)方法的研究逐漸成為研究的熱點(diǎn)。Radicchi(2009)以相同數(shù)量的引文為間隔,對(duì)科技論文的作者順序和成果分配進(jìn)行了分析[8]P56-64。Sugimoto(2011)使用LDA方法對(duì)北美圖情論文進(jìn)行了主題分析,按照相同數(shù)量的發(fā)文為間隔,研究了學(xué)科發(fā)展的主題變遷[9]P185-204。Barabási(2002)以作者共發(fā)文情況構(gòu)建的復(fù)雜網(wǎng)絡(luò)為基礎(chǔ),使用累積間隔法對(duì)作者合作情況進(jìn)行了描述[10]P590-614。對(duì)研究主題的探究不僅有助于研究者從宏觀的角度上把握某一個(gè)學(xué)科或者某一研究領(lǐng)域的整體演化情況而且有益于揭示該學(xué)科或該領(lǐng)域的研究熱點(diǎn)和研究趨勢(shì)。

        基于主題內(nèi)容的動(dòng)態(tài)演進(jìn)的描述方法、時(shí)間間隔的選取和相關(guān)理論已經(jīng)得到應(yīng)用,但對(duì)于主題本身的動(dòng)態(tài)性質(zhì)的研究還較為缺乏。Erjia(2014)[11]P70-86提出了一種測(cè)量研究主題連續(xù)性和流行性的范式,并以10年的圖情領(lǐng)域文獻(xiàn)為測(cè)試數(shù)據(jù),驗(yàn)證了該范式的合理性和統(tǒng)計(jì)特征。但該文同時(shí)也指出,圖情領(lǐng)域的文獻(xiàn)上驗(yàn)證的規(guī)律并不能必然推斷整個(gè)科學(xué)領(lǐng)域的規(guī)律。本文以Erjia的研究范式為基礎(chǔ),以法律中重要的“因果關(guān)系”為數(shù)據(jù)對(duì)象,對(duì)該研究領(lǐng)域中主要主題的流行性、研究趨勢(shì)進(jìn)行了分析和判斷。

        因果關(guān)系是一個(gè)歸屬概念,意在使已然存在的特定結(jié)果被認(rèn)可為作為問(wèn)題的特定行為的具體實(shí)現(xiàn)。因果關(guān)系因其對(duì)行為主客觀面性質(zhì)的影響而成為法學(xué)理論幾百年來(lái)不可回避的話題[12]P44-56。近年來(lái),醫(yī)療、食品安全和交通等領(lǐng)域的現(xiàn)實(shí)問(wèn)題對(duì)因果關(guān)系的研究提出了新的機(jī)遇和挑戰(zhàn)[13]P1423-1434,研究分支擴(kuò)散和融合的趨勢(shì)漸現(xiàn)。同時(shí),傳統(tǒng)的自然科學(xué)式的研究方式雖然在應(yīng)對(duì)日益復(fù)雜的社會(huì)需求獨(dú)木難支,但仍然占據(jù)著主要地位。因此,本文選擇法律因果關(guān)系作為學(xué)科動(dòng)態(tài)的研究對(duì)象,其復(fù)雜并處于快速演進(jìn)階段的學(xué)科特質(zhì)有助于驗(yàn)證主題動(dòng)態(tài)模型的性能和效果,同時(shí),主題動(dòng)態(tài)模型對(duì)于主題連續(xù)性和流行性的描繪也有利于厘清因果關(guān)系在不同的社會(huì)領(lǐng)域的研究熱點(diǎn)、學(xué)科發(fā)展趨勢(shì)和脈絡(luò)。

        二、數(shù)據(jù)來(lái)源

        本文以中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)近5年收錄的涉及法律因果關(guān)系的全部文獻(xiàn)為數(shù)據(jù)來(lái)源。檢索時(shí)設(shè)定期刊所屬學(xué)科為“社會(huì)科學(xué)Ⅰ輯”中的“法理、法史”、“憲法”、“行政法及地方法制”、“民商法”、“刑法”、“經(jīng)濟(jì)法”、“訴訟法與司法制度”和“國(guó)際法”。檢索式為“SU='因果關(guān)系'”,時(shí)間窗口為2009至2013年(含),所獲取論文信息經(jīng)人工校對(duì)后,共保留5494篇。統(tǒng)計(jì)數(shù)據(jù)如表1所示。

        從表1可以看出,近五年來(lái)法律因果關(guān)系的論文從整體上呈現(xiàn)出上升的趨勢(shì),從2011年起年均總量達(dá)到了千篇以上,其中2012年的增幅最大,比2009年增加了524篇。法律因果關(guān)系目前論文的總量為通過(guò)主題動(dòng)態(tài)模型分析因果關(guān)系確保了數(shù)據(jù)的充分性和有效性。

        表1 法律因果關(guān)系論文數(shù)量表(2009-2013)

        論文數(shù)據(jù)包括論文標(biāo)題、發(fā)表年份、文章摘要和關(guān)鍵詞信息,部分?jǐn)?shù)據(jù)示例如表2。5494篇法律因果關(guān)系的論文全部進(jìn)行了數(shù)據(jù)清洗,在清洗的過(guò)程中,對(duì)于標(biāo)題和摘要當(dāng)中出現(xiàn)的亂碼、不規(guī)則的字符、缺失的文字均逐一進(jìn)行了刪除、更改和補(bǔ)充。從主題動(dòng)態(tài)模型對(duì)信息多維度處理能力的角度考慮,在分析因果關(guān)系的過(guò)程中不僅使用了標(biāo)題和關(guān)鍵詞單一維度的特征知識(shí)而且使用了摘要當(dāng)中多維度的特征知識(shí)。

        表2 論文數(shù)據(jù)示例表

        三、研究方法

        (一)主題提取

        從自然語(yǔ)言處理的角度來(lái)看,主題可以被表示成詞項(xiàng)概率分布的空間向量模型[14]P65-72。在主體模型中,核心問(wèn)題在于求得兩個(gè)分布:各主題下的詞項(xiàng)分布和各文檔的主題概率分布。例如,在本文的論文語(yǔ)料基礎(chǔ)上得出的流行性最高的主題為“因果關(guān)系的行為客觀面”,該主題由345個(gè)詞項(xiàng)組成,其中273個(gè)詞項(xiàng)的概率小于0.01%。該主題的空間向量模型可以表示為{因果關(guān)系:0.32;犯罪構(gòu)成:0.25;交通事故:0.13;死亡:0.08道路交通事故:0.05;刑法:0.02 ……}。文檔中的詞項(xiàng)根據(jù)這兩個(gè)概率分布可以變換為主題概率分布,從而大大縮減文檔向量表示的維度。

        LDA(latent dirichlet allocation)及其擴(kuò)展模型被廣泛應(yīng)用于主題提取領(lǐng)域。本文使用LDA模型進(jìn)行主題提取。Blei等人于2003年提出了LDA模型,該模型在識(shí)別大規(guī)模文檔集中潛藏的主題信息效果良好,可較好的識(shí)別出語(yǔ)義上存在隱含分布傾向的非高頻詞匯,數(shù)據(jù)結(jié)構(gòu)為一個(gè)生成性的3層貝葉斯網(wǎng)絡(luò)[15]p993-1022。LDA利用Dirichlet分布的共軛性質(zhì),后驗(yàn)函數(shù)可以輕易轉(zhuǎn)換為先驗(yàn)函數(shù),加強(qiáng)了算法的實(shí)時(shí)性和運(yùn)算速度。LDA的算法如下:

        設(shè)文獻(xiàn)集合共有m個(gè)文檔,共包含v項(xiàng)詞匯,k個(gè)可能生成的隱含主題,則每個(gè)主題在詞匯集合上服從多項(xiàng)式分布θz,每個(gè)主題在文檔集合上服從多項(xiàng)式分布φd。主題模型通過(guò)定義α和β模型的超參數(shù),使得k個(gè)主題中詞項(xiàng)分布概率θz服從基于超參數(shù)α的Dirichlet分布,文檔d的概率分布φd服從基于超參數(shù)β的Dirichlet分布。在實(shí)際計(jì)算中,常用Gibbs Sampling采樣方法基于公式(1)(2),利用超參數(shù)反向求解主題在詞匯m上的先驗(yàn)分布φm和主題在文檔d上的先驗(yàn)分布θd,并用主題-詞匯分布矩陣V和主題-文檔分布矩陣D表示對(duì)應(yīng)計(jì)算結(jié)果。迭代計(jì)算中參數(shù)含義詳見(jiàn)表3。

        (公式1)

        (公式2)

        在公式(1)和(2)的基礎(chǔ)上,對(duì)于公式當(dāng)中所涉及的不同的參數(shù),結(jié)合法律因果關(guān)系,本文進(jìn)行了逐一的對(duì)應(yīng)和解釋,具體見(jiàn)表3。

        表3 LDA模型的Gibbs Sampling方法變量及其含義

        (二)主要算法

        1.主題差異度計(jì)算

        法學(xué)的因果關(guān)系是一個(gè)正處于快速演進(jìn)中的話題,因此使用主題差異度計(jì)算是跟蹤因果關(guān)系的主題在不同時(shí)間區(qū)間內(nèi)演進(jìn)的必要手段,本文使用Jensen-Shannon divergence(JSD)方法作為測(cè)定主題差異度的算法指標(biāo)。JSD可以評(píng)價(jià)不同概率分布下的信息熵差異,被廣泛應(yīng)用于文本挖掘領(lǐng)域。作為信息增益算法(Kullback-Leibler divergence)的改進(jìn)版本,JSD彌補(bǔ)了KL距離的非對(duì)稱性問(wèn)題,并且參數(shù)更為平滑。Lee(2001)指出,JSD方法比基于幾何距離的度量方法更有效[14]。主題P和Q的JSD值如下:

        JSD(P‖Q)=1/2D(P‖M)+1/2D(Q‖M)

        (公式3)

        其中M=1/2D(P+Q),D(P‖M)是P和M的KL距離,當(dāng)P和M是離散變量時(shí),D(P‖M)=∑iP(i)lnp(i)/M(i),當(dāng)P和M是連續(xù)變量時(shí),D(P‖M)=∫P(x)lnp(x)/M(x)dx。JSD值越大,表示兩個(gè)主題之間的相似度越小。

        2.主題流行系數(shù)

        主題流行系數(shù)指在一定的時(shí)間區(qū)間內(nèi),所有的文檔中對(duì)指定主題的總支持量,可以用來(lái)測(cè)度主題在時(shí)間區(qū)間內(nèi)的熱度。對(duì)于具有一定歷時(shí)時(shí)間跨度的法律因果文獻(xiàn)來(lái)說(shuō),基于這一指標(biāo)對(duì)法律因果關(guān)系進(jìn)行主題流行系數(shù)的探究具有特定的意義和價(jià)值。θm,k表示m文檔生成k主題的概率,主題k的流行系數(shù)為:popularity(k)=∑mθm,k。

        3.動(dòng)態(tài)主題識(shí)別算法

        主題識(shí)別算法是面向每一個(gè)時(shí)間區(qū)間內(nèi)的所有文獻(xiàn)分別進(jìn)行的,因此不同時(shí)間區(qū)間提取出的主題必然有所區(qū)別,動(dòng)態(tài)主題識(shí)別算法將相鄰的兩個(gè)時(shí)間段的主題進(jìn)行按其JSD值進(jìn)行連接。設(shè)i是前時(shí)間段中一個(gè)主題,N是后時(shí)間段的主題集合,ε是預(yù)設(shè)的JSD差異度閾值,大于該值表示不接受主題相似假設(shè),求N中與i對(duì)應(yīng)的主題算法如下所示。本文設(shè)定的閾值ε為0.3。具體計(jì)算由如下三步組成:1.對(duì)于N中的每一個(gè)主題j,求得主題j和i的差異度JSD(i,j);2.搜索與主題i差異度最小的主題k,k=αrgmaxjJSD(i,j)3.如果JSD(i,k)小于預(yù)設(shè)閾值ε,則k為i的對(duì)應(yīng)主題,否則N中不存在i的對(duì)應(yīng)主題。

        (三)主題流行性和連續(xù)性

        1.主題流行性

        Erjia指出,當(dāng)某個(gè)主題連續(xù)5個(gè)時(shí)間段中均能被連續(xù)識(shí)別,則可以根據(jù)其流行系數(shù)擬合的一元線性方程的斜率變化確定其流行性狀態(tài)。而本文選取的文獻(xiàn)發(fā)表時(shí)間范圍為5年,因此設(shè)定連續(xù)的3個(gè)時(shí)間段為篩選標(biāo)準(zhǔn)。主題流行性狀態(tài)分為三種:穩(wěn)定態(tài),上升態(tài)和下降態(tài)。波動(dòng)態(tài):-0.5<=slope<=0.5,表示主題的流行系數(shù)在一定范圍內(nèi)波動(dòng),從具體研究主題上看,波動(dòng)態(tài)主要體現(xiàn)出該領(lǐng)域在研究?jī)?nèi)容、研究方法和理論探究上主題的多樣性和變化性。上升態(tài):slope>0.5,表示主題的流行系數(shù)隨時(shí)間段上升,根據(jù)學(xué)科具體的研究,上升態(tài)的研究主要表明相應(yīng)的主題在一定的時(shí)間區(qū)間內(nèi)受到了持續(xù)和高強(qiáng)度的關(guān)注。下降態(tài):slope <-0.5,表示主題的流行系數(shù)逐時(shí)間段下降,表明某一時(shí)間區(qū)間內(nèi)的研究主題隨著社會(huì)的變化、時(shí)代的變遷,受關(guān)注的程度逐步在下降。其中,slope表示流行性系數(shù)的斜率,是衡量主題穩(wěn)定態(tài)、上升態(tài)和下降態(tài)的核心指標(biāo)。

        2.主題連續(xù)性

        依據(jù)主題在連續(xù)時(shí)間段中JSD變化的趨勢(shì),主題的連續(xù)性狀態(tài)分為以下幾種。突現(xiàn)主題:在之前的時(shí)間段內(nèi)未出現(xiàn)過(guò),但在某一個(gè)時(shí)間段突然出現(xiàn)并持續(xù)兩個(gè)或兩個(gè)以上時(shí)間段,在學(xué)術(shù)主題上則表現(xiàn)出相應(yīng)的研究受到了廣泛而高度的關(guān)注。轉(zhuǎn)換主題:兩個(gè)或兩個(gè)以上主題在下一個(gè)時(shí)間段合并轉(zhuǎn)換至一個(gè)主題之內(nèi),在具體的研究上表現(xiàn)出已有的研究在研究方法、研究策略或理論探究模式上融入了其他的研究主題當(dāng)中。穩(wěn)定主題:主題在至少三個(gè)連續(xù)的時(shí)間區(qū)間內(nèi)均表現(xiàn)出較小的差異度,從研究上表現(xiàn)出這一類的研究受到了持久性的關(guān)注,并且是某一研究當(dāng)中的基本和核心的探究問(wèn)題。消亡主題:在某一個(gè)時(shí)間段內(nèi)出現(xiàn),但在之后的時(shí)間段內(nèi)不再出現(xiàn),主要表現(xiàn)出所研究和關(guān)注的問(wèn)題,無(wú)論在研究方法還是在研究問(wèn)題上基本上淡出了研究的序列。

        四、實(shí)驗(yàn)結(jié)果和分析

        (一)提取主題概覽

        本研究對(duì)2009-2013年法律因果關(guān)系相關(guān)的5494篇論文首先進(jìn)行了總體的主題提取,共獲取主題127個(gè),表4給出了流行系數(shù)排名前10的主題。由于篇幅關(guān)系,本文所有的主題詞示例均只列出貢獻(xiàn)最大的前幾個(gè)主題詞,在選取的時(shí)候,根據(jù)具體的代表性,選取了每一個(gè)主題下的六個(gè)主題詞。

        從所選取的從流行系數(shù)看,排名前十的總流行系數(shù)總和為0.395,表示覆蓋的總體文章內(nèi)容接近總數(shù)的40%,表明因果關(guān)系的主要研究范疇相對(duì)集中,從一定程度上說(shuō)明便于從這些研究范疇當(dāng)中對(duì)法律因果關(guān)系進(jìn)行探究。流行系數(shù)降序排列時(shí),降幅逐漸變緩,這表示研究越分散的主題規(guī)模相差越小,體現(xiàn)了研究主題的關(guān)聯(lián)性。

        表4 流行系數(shù)排名前10的主題表

        從主題內(nèi)容來(lái)看,流行性較高的主題確實(shí)反映了因果關(guān)系研究的熱點(diǎn)和主要話題。在流行性最高的,流行系數(shù)大于0.05的主題中,最高的流行系數(shù)為0.113,通過(guò)所獲取到的“犯罪構(gòu)成,交通事故,死亡”等主題詞,表述了因果關(guān)系在行為的客觀面認(rèn)定中的核心意義,這正是部門法學(xué)研究的基礎(chǔ)問(wèn)題。次高的流行系數(shù)為0.073,具體通過(guò)“受害人、當(dāng)事人、舉證責(zé)任”等主題詞體現(xiàn)了因果關(guān)系內(nèi)涵由單純的事實(shí)判斷向事實(shí)與規(guī)范雙重判斷的發(fā)展趨勢(shì),是最近幾年各部門法學(xué)的發(fā)展方向。在流行性系數(shù)為0.02至0.05的一般流行主題中,主要描述了社會(huì)熱點(diǎn)話題,比如醫(yī)療糾紛和侵權(quán)責(zé)任等。在流行性較低的主題中,因果關(guān)系的基礎(chǔ)理論和范式研究占據(jù)了主要地位。從總體上看,熱門主題體現(xiàn)了單純的事實(shí)判斷已經(jīng)不能滿足復(fù)雜的社會(huì)現(xiàn)實(shí)需要,可以認(rèn)為,傳統(tǒng)的因果關(guān)系理論藉由現(xiàn)實(shí)完成了自我價(jià)值的升華,而歸責(zé)思想下的因果關(guān)系理論方興未艾、大有可為,因此,本文對(duì)主題的提取不僅回應(yīng)了規(guī)范治理范式的需要,而且與理論研究的現(xiàn)狀完美融合。根據(jù)所獲取到的主題的分布,從流行系數(shù)的角度說(shuō)明了基于主題動(dòng)態(tài)模型對(duì)法律因果分析的可行性及針對(duì)性。

        (二)主題流行性分析

        對(duì)于每一年的研究論文分別進(jìn)行主題提取,并根據(jù)動(dòng)態(tài)主題識(shí)別算法匹配相鄰時(shí)間段的主題,得到的統(tǒng)計(jì)結(jié)果如表5所示。和表1對(duì)比可以發(fā)現(xiàn),主題的數(shù)量和該年的發(fā)文總數(shù)量成正比,在設(shè)定差異度閾值ε為0.3時(shí),與下一年可以匹配到的主題占比比較穩(wěn)定,大約在60%至75%之間,而在Eirc的研究中,取得同樣的匹配主題率時(shí)差異度閾值ε為0.2。

        表5 主題匹配統(tǒng)計(jì)表

        從表5可以看出,主題數(shù)目最多的是2012年,相應(yīng)的這一年的論文數(shù)量也是最多,達(dá)到了1390篇,平均16篇文獻(xiàn)一個(gè)主題。而從下一年主題匹配的數(shù)量的角度看,也呈現(xiàn)出了隨著論文數(shù)量的增長(zhǎng)匹配數(shù)量逐步增加的態(tài)勢(shì),最多的58個(gè)仍然與論文總數(shù)量最多的2012年的年份密切關(guān)聯(lián)在一起。對(duì)于連續(xù)三年和三年以上得到匹配的主題的流行系數(shù)為因變量,以時(shí)間為自變量進(jìn)行一元線性回歸,本研究共獲取到波動(dòng)態(tài)主題23個(gè),上升態(tài)主題17個(gè),下降態(tài)主題12個(gè)。表6列出了三種狀態(tài)中系數(shù)特征相對(duì)明顯的前三位主題,主題詞是對(duì)該主題所有時(shí)間段匹配主題的合并和篩選。

        表6 主題前三位流行性表

        法學(xué)是極具實(shí)踐性的學(xué)科之一,與整個(gè)社會(huì)所關(guān)注的內(nèi)容是密切關(guān)聯(lián)在一起的。法學(xué)的實(shí)踐性體現(xiàn)為理論演繹結(jié)果的普遍可接受性。因此,法學(xué)理論在特定領(lǐng)域的研究往往呈現(xiàn)出體系性,這一體系又是與社會(huì)的熱點(diǎn)問(wèn)題緊密關(guān)聯(lián)在一起的。上升態(tài)的主要主題集中于不同的因果關(guān)系的具體判斷,醫(yī)患關(guān)系、網(wǎng)絡(luò)輿情和環(huán)境治理都是社會(huì)關(guān)注的熱點(diǎn)問(wèn)題,也是法學(xué)因果關(guān)系探討的前沿,充分體現(xiàn)了法學(xué)的實(shí)踐性。從具體上升態(tài)的主題上看,醫(yī)患關(guān)系是當(dāng)前社會(huì)最為關(guān)注的話題之一,其在社會(huì)上的影響之大、波及之廣是非常具有代表性的,從上升態(tài)所選取的三個(gè)主題上看,其所得到的斜率最大,達(dá)到了0.82也充分說(shuō)明了這一主題所被關(guān)注的程度。同時(shí),這一主題所獲取到的主題詞充分說(shuō)明了其斜率之所以大的原因,比如:患者、醫(yī)院、非法行醫(yī)、醫(yī)患關(guān)系等。在上升態(tài)這一大的主題中,斜率為0.75的是與互聯(lián)網(wǎng)相關(guān)的子主題,在21世紀(jì)對(duì)社會(huì)各個(gè)層面影響最大的莫過(guò)于互聯(lián)網(wǎng),而在法律因果關(guān)系中這一主題也得到了充分的體現(xiàn),在這一子主題當(dāng)中所涉及到的主題詞“網(wǎng)絡(luò)實(shí)名、網(wǎng)絡(luò)犯罪、隱私權(quán)保護(hù)、網(wǎng)絡(luò)世界”也充分說(shuō)明了這一點(diǎn)。波動(dòng)態(tài)集中于普通民事行為、故意傷害和過(guò)失犯罪,這些盡管是一些老生常談的問(wèn)題,但是在風(fēng)險(xiǎn)遍布各個(gè)角落的當(dāng)下,這些話題被賦予了新的生命力,這一點(diǎn)從波動(dòng)態(tài)這一主題當(dāng)中所涉及到的主題詞就可以有所觀察,比如“運(yùn)輸合同、信賴原則和監(jiān)督過(guò)失”。從所選取的波動(dòng)態(tài)這一大的主題可以看出,構(gòu)成這一主題的小的主題之間在斜率的值上上下浮動(dòng)就非常的大,絕對(duì)值相差0.41,這一具體的值也說(shuō)明了這一類主題的特點(diǎn)。下降態(tài)集中于危害結(jié)果、經(jīng)驗(yàn)法則、刑罰基礎(chǔ)理論,這些主題對(duì)于法學(xué)基礎(chǔ)研究不可謂不重要,但在國(guó)內(nèi)外法學(xué)研究界已基本取得共識(shí),構(gòu)成了研究基礎(chǔ),處于下降狀態(tài)也就在意料之中了,從斜率值上也可以看出下降類這一大的主題之間的小主題之間斜率值差距較小。

        (三)主題連續(xù)性分析

        主題連續(xù)性可以分為突現(xiàn)主題、穩(wěn)定主題、轉(zhuǎn)換主題和消亡主題四種。對(duì)主題連續(xù)性的整體狀況進(jìn)行分析可以看出法律因果關(guān)系在研究主題上的整體變化狀況,有助于該領(lǐng)域的研究者把握新興的研究主題、跟蹤轉(zhuǎn)換的研究主題、熟知穩(wěn)定的主題和了解消亡的主題。在概念界定的基礎(chǔ)上,根據(jù)相應(yīng)主題詞的分布,本研究對(duì)這四種主題進(jìn)行了提取。獲取到突現(xiàn)主題134個(gè),穩(wěn)定主題32個(gè),轉(zhuǎn)換主題52個(gè),消亡主題120個(gè)。根據(jù)定義,突現(xiàn)主題、轉(zhuǎn)換主題和消亡主題在第一年不存在,消亡主題在最后一年也不存在?;?494篇學(xué)術(shù)文獻(xiàn)所獲取到的主題連續(xù)性分布情況可以看出,在法律因果關(guān)系的探究上,突現(xiàn)出題和消亡主題的數(shù)量最多,一個(gè)為134,另一個(gè)為120,這從一定角度上說(shuō)明了所獲取到的連續(xù)研究主題充分體現(xiàn)了這五年內(nèi)法律因果關(guān)系的研究演化情況,從一定程度說(shuō)明了該領(lǐng)域的研究是非?;钴S的。從主題數(shù)量上可以發(fā)現(xiàn),突現(xiàn)主題和消亡主題的數(shù)量遠(yuǎn)高于其他兩種,這說(shuō)明因果關(guān)系是一個(gè)非常活躍的研究領(lǐng)域,新主題的誕生和舊主題的消亡頻繁發(fā)生。轉(zhuǎn)換主題的數(shù)量為52個(gè),這彰顯出法學(xué)理論對(duì)因果關(guān)系研究的趨同性與整合性。穩(wěn)定主題的數(shù)量最少,經(jīng)過(guò)對(duì)數(shù)據(jù)的觀察,發(fā)現(xiàn)穩(wěn)定主題主要是流行系數(shù)排行前20的主題,這說(shuō)明在因果關(guān)系研究領(lǐng)域,近五年來(lái)的主體話題變化不大。表7給出了四個(gè)主題中特征最為明顯的數(shù)據(jù)樣例。

        表7 主題前三位連續(xù)性表

        四個(gè)主題的代表性樣例大致符合法學(xué)研究的基本規(guī)律。法學(xué)理論對(duì)特定領(lǐng)域的研究與現(xiàn)實(shí)社會(huì)中出現(xiàn)的案例有關(guān),因此,穩(wěn)定主題中的醫(yī)療、環(huán)境、交通領(lǐng)域的因果關(guān)系就恒常的成為研究的重中之重,因?yàn)檫@些領(lǐng)域在近五年內(nèi)受到了持續(xù)和廣泛的關(guān)注,在可預(yù)見(jiàn)的將來(lái)幾個(gè)領(lǐng)域的主題研究仍然是穩(wěn)定的。對(duì)于某一特定領(lǐng)域的研究必須以既定的理論體系為主導(dǎo),在掃清研究對(duì)象關(guān)聯(lián)領(lǐng)域之后,再完成對(duì)核心問(wèn)題點(diǎn)的研究,因此,消亡主題中作為法律責(zé)任構(gòu)成要件的行為人、危害結(jié)果等等因素逐漸被冷落也是可以被理解的。法學(xué)理論對(duì)特定范疇的研究一開始無(wú)法擺脫哲學(xué)思想的控制,在研究深入后,則發(fā)展出體現(xiàn)自身學(xué)科特色的內(nèi)容,因此,必然因果關(guān)系、偶然因果關(guān)系等理論的合并與整合成為因果關(guān)系研究過(guò)程中不可避免的趨勢(shì),轉(zhuǎn)化主題的趨勢(shì)也正驗(yàn)證了這一點(diǎn)。此外,瀆職犯罪因果關(guān)系的研究成為突現(xiàn)主題既合理又有些疑問(wèn)。如所周知,瀆職犯罪中的職關(guān)聯(lián)到所有的社會(huì)管理領(lǐng)域,故而,出現(xiàn)某一特定領(lǐng)域研究結(jié)論與瀆職犯罪因果關(guān)系的勾連并不令人詫異,然而,現(xiàn)實(shí)情況則是多學(xué)科領(lǐng)域內(nèi)的因果關(guān)系研究已然與瀆職犯罪因果關(guān)系密不可分,而且這種研究呈現(xiàn)出建基本學(xué)科并超脫本學(xué)科進(jìn)而在宏觀上解讀瀆職因果關(guān)系的趨勢(shì)。這一趨勢(shì)是否能夠成為新的研究范式值得觀察。

        五、總結(jié)和展望

        隨著靜態(tài)方法的逐漸成熟,研究學(xué)科內(nèi)知識(shí)主題的動(dòng)態(tài)分布和演變范式逐漸吸引了研究者的關(guān)注,然而,主題動(dòng)態(tài)模型的理論還沒(méi)有在多個(gè)學(xué)科、廣泛的學(xué)術(shù)文獻(xiàn)庫(kù)和復(fù)雜多變的知識(shí)結(jié)構(gòu)中得到廣泛的驗(yàn)證。本文基于Erjia的主題動(dòng)態(tài)模型,搜集了CNKI收錄的近五年法學(xué)“因果關(guān)系”研究相關(guān)的5494篇文獻(xiàn)并進(jìn)行了主題提取,對(duì)得到的127個(gè)主題進(jìn)行了流行性和連續(xù)性動(dòng)態(tài)分析。

        從研究方法來(lái)看,主題動(dòng)態(tài)模型基本可以適應(yīng)“因果關(guān)系”這類處于快速演進(jìn)階段的人文社科研究的動(dòng)態(tài)分析需要,但部分參數(shù)和結(jié)果仍然值得推敲和深入研究。LDA方法對(duì)于主題的提取具有較強(qiáng)的可理解性,主題動(dòng)態(tài)模型對(duì)于主題流行性和主題連續(xù)性的研究結(jié)果也基本符合法學(xué)研究者對(duì)于學(xué)科的一般認(rèn)知。但也有一部分?jǐn)?shù)據(jù)的結(jié)果值得推敲,例如,突現(xiàn)主題中的“瀆職犯罪”并不能解讀瀆職因果關(guān)系的研究趨勢(shì)。同時(shí),模型的部分參數(shù)也和Erjia的研究略有不同,這是由于不同學(xué)科主題性質(zhì)的影響。

        從因果關(guān)系的研究?jī)?nèi)容來(lái)看,法學(xué)是一門極具實(shí)踐性的學(xué)科,醫(yī)患關(guān)系、網(wǎng)絡(luò)輿情和環(huán)境治理都是社會(huì)關(guān)注的熱點(diǎn)問(wèn)題,其主題流行性正逐年上升。既定的理論體系的研究逐漸完善,法律責(zé)任構(gòu)成要件的行為人、危害結(jié)果等等因素逐漸被冷落,必然因果關(guān)系、偶然因果關(guān)系等理論的合并與整合成為因果關(guān)系研究過(guò)程中不可避免的趨勢(shì)。

        在下一步研究過(guò)程中,研究者將探索主題動(dòng)態(tài)模型在不同類型的學(xué)科中的應(yīng)用,統(tǒng)計(jì)其參數(shù)設(shè)置和分析效果的經(jīng)驗(yàn)性因素。同時(shí),通過(guò)對(duì)不同學(xué)科主題動(dòng)態(tài)的變化分析這些學(xué)科的研究現(xiàn)狀和發(fā)展方向,為學(xué)科發(fā)展提供有益的支持。

        [1] 王曉光.科學(xué)知識(shí)網(wǎng)絡(luò)的形成與演化(Ⅰ):共詞網(wǎng)絡(luò)方法的提出[J].情報(bào)學(xué)報(bào),2009,4.

        [2] 葉春蕾,冷伏海.基于共詞分析的學(xué)科主題演化方法改進(jìn)研究[J].情報(bào)理論與實(shí)踐,2012,3.

        [3] 皇甫青紅,劉艷華,丁軍艷.國(guó)際社會(huì)網(wǎng)絡(luò)分析領(lǐng)域作者共被引網(wǎng)絡(luò)結(jié)構(gòu)研究[J].情報(bào)雜志,2013,5.

        [4] 王超,呂俊生,吳新年.學(xué)術(shù)網(wǎng)絡(luò)研究進(jìn)展[J].情報(bào)雜志,2013,10.

        [5] 苑彬成,方曙,劉合艷. 作者共被引分析方法進(jìn)展研究[J].圖書情報(bào)工作,2009,22.

        [6] Yan, E., Ding, Y., Milojevic, S., & Sugimoto, C. R. Topics in dynamic research communities: An exploratory study for the field of information retrieval. Journal of Informetrics, 2012,6(1):140-153.

        [7] ErjiaYan. Research dynamics: Measuring the continuity and popularity of research topics[J].Journal ofInformetrics, 2014(8):98-110.

        [8] Radicchi, F., Fortunato, S., Markines, B., &Vespignani, A. Diffusion of scientificcredits and the ranking of scientists[J]. Physical Review E, 2009,80(5),56-64.

        [9] Sugimoto, C. R., Li, D., Russell, T. G., Finlay, C., & Ding, Y.The shifting sands of disciplinary development: Analyzing North American Library and Information Science (LIS) dissertations using Latent Dirichlet Allocation (LDA)[J]. Journal of the American Society for Information Science & Technology,2011,62(1):185-204.

        [10] Barabási, A. L., Jeong, H.,Neda, Z., Ravasz, E., Schubert, A., &Vicsek, T. Evolution of the social network of scientific collaborations[J]. Physica A: Statistical Mechanics and its Applications, 2002,311(3-4),590-614.

        [11] 陳興良. 從歸因到歸責(zé):客觀歸責(zé)理論研究[J].法學(xué)研究,2006,2.

        [12] 肖本山.食品監(jiān)管瀆職罪的若干疑難問(wèn)題解析[J].法律科學(xué)(西北政法大學(xué)學(xué)報(bào)),2012,3.

        [13] 徐戈,王厚峰.自然語(yǔ)言處理中主體模型的發(fā)展[J].計(jì)算機(jī)學(xué)報(bào),2011,8.

        [14] Lee, L. On the effectiveness of the skew divergence for statistical language analysis. Artificial Intelligence and Statistics, 2001,53(2):65-72.

        [15] Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3:993-1022.

        (責(zé)任編輯:黃春燕)

        Dynamic Analysis of Law Causality Based on Dynamic Topic Model

        ZhangRui-xiang1WangDong-bo2

        (1.Policy Research Office of Jiangsu Judicial Department, Nanjing Jiangsu 210024;2.College of Information Science and Technology, Nanjing Agricultural University, Nanjing Jiangsu 210095)

        Dynamic topic model (DTC) provides new solutions for tracing topic transformation history and predicting research trends. Analyzing the research content of law causality with DTC will verify the availability and generalization performance of the model. Also, the analysis of research content will offer a quantitate view for further subject development. This research implements DTC on 5494 papers published within 2009-2013 related to law causality, and the papers are selected from CNKI. By analyzing the dynamic topic model of 5494 papers published within 2009-2013 related to law causality, the result of the research verifies the availability of DCT on law causality. Meanwhile, and the analysis provides a landscape of subject history. DTC is a new paradigm with less empirical study on different research area and the application in humanistic and social science is lacking. As a result, this paper fails to make comparison with other subjects.DTC is to the point for dynamic analysis on the Chinese social subject under quick development.

        dynamic topic model; causality; popularity; continuity

        1002—6274(2017)01—155—07

        張瑞祥( 1980-),男,山東臨沂人,江蘇省司法廳研究室研究員,研究方向?yàn)榉尚畔W(xué)、司法矯正;王東波(1981-),男,山東菏澤人,信息資源管理博士,南京農(nóng)業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院副教授,研究方向?yàn)榉尚畔W(xué)。

        DF0-05

        A

        猜你喜歡
        流行性因果關(guān)系動(dòng)態(tài)
        國(guó)內(nèi)動(dòng)態(tài)
        國(guó)內(nèi)動(dòng)態(tài)
        國(guó)內(nèi)動(dòng)態(tài)
        小青龍湯在流行性感冒中的應(yīng)用
        豬流行性腹瀉研究進(jìn)展
        玩忽職守型瀆職罪中嚴(yán)重不負(fù)責(zé)任與重大損害后果的因果關(guān)系
        流行性感冒
        動(dòng)態(tài)
        做完形填空題,需考慮的邏輯關(guān)系
        豬流行性腹瀉2011-2017年
        领导边摸边吃奶边做爽在线观看 | 狠狠躁夜夜躁AV网站中文字幕| 国产丝袜精品丝袜一区二区| 国产精品日本中文在线| 日本护士口爆吞精视频| 国产放荡对白视频在线观看| 人禽伦免费交视频播放| 欧美日韩国产成人综合在线影院| 女人一级特黄大片国产精品| 视频女同久久久一区二区| 九九在线中文字幕无码| 欧美肥胖老妇做爰videos| 日韩一区二区超清视频| 女同av免费在线播放| 国模91九色精品二三四| 久久久中日ab精品综合| 吃奶摸下的激烈视频| 亚洲Av无码专区尤物| 国产在线a免费观看不卡| 国产欧美高清在线观看| 欧美最大胆的西西人体44| 久久久亚洲欧洲日产国产成人无码| 少妇特殊按摩高潮不断| 亚洲一区二区三区偷拍视频| 天堂а在线中文在线新版| 理论片87福利理论电影| 国产成人综合亚洲av| av在线一区二区精品| 亚洲av中文无码乱人伦在线视色| 中文字幕一区二区三区乱码| 娇柔白嫩呻吟人妻尤物| 国产91成人自拍视频| 精品国产sm最大网站| 国产免费av片在线观看| 精品91亚洲高清在线观看| 国产视频一区二区三区在线看 | 亚洲精品亚洲人成在线下载| 97自拍视频国产在线观看| 蜜桃尤物在线视频免费看| 99久久国产综合精品女图图等你| av无码av在线a∨天堂app|