亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中醫(yī)藥數(shù)據(jù)隱結(jié)構(gòu)分析平臺—孔明燈網(wǎng)絡(luò)版*

        2020-04-19 07:12:18許玉龍王忠義呂雅麗王林景朱紅磊
        關(guān)鍵詞:規(guī)則用戶分析

        許玉龍,王忠義,呂雅麗,王林景,王 昂,朱紅磊,宋 婷

        (1. 河南中醫(yī)藥大學(xué)信息技術(shù)學(xué)院 鄭州 450046;2. 香港科技大學(xué)計算機科學(xué)與工程學(xué)系 香港西貢清水灣)

        1 前言

        隱結(jié)構(gòu)分析是香港科技大學(xué)張連文教授為研究中醫(yī)藥提出的專用方法[1,2],屬于無監(jiān)督學(xué)習(xí)的一種,底層原理是貝葉斯網(wǎng)絡(luò)及概率圖模型。隱結(jié)構(gòu)在分析中醫(yī)藥數(shù)據(jù)時,是基于癥狀等顯式數(shù)據(jù)的概率同現(xiàn),從一組癥狀顯變量出發(fā),推導(dǎo)分析出隱藏知識,對隱含的知識進行中醫(yī)詮釋,得到相應(yīng)的隱變量(證候),整個學(xué)習(xí)過程契合于中醫(yī)大夫的診病過程,較適宜研究中醫(yī)證候問題[3-6,14]?,F(xiàn)有研究成果表明[7,8,12,13,15,16],該方法已成功用于分析多種疾病的證候數(shù)據(jù),并取得較好效果。

        在提出隱結(jié)構(gòu)方法的同時,張教授團隊開發(fā)了用于隱結(jié)構(gòu)模型學(xué)習(xí)的單機版軟件Lantern,即孔明燈[9]。該軟件實現(xiàn)了隱結(jié)構(gòu)模型的學(xué)習(xí)過程,包含了多種模型學(xué)習(xí)的方法,被國內(nèi)外相關(guān)研究者廣泛使用。該方法在學(xué)習(xí)模型時,底層維護的是一個特殊貝葉斯網(wǎng)絡(luò),使用期望最大(EM, Expectation-Maximization)等算法學(xué)習(xí)出整個網(wǎng)絡(luò)結(jié)構(gòu),以及網(wǎng)絡(luò)中所有癥狀顯變量節(jié)點和隱變量節(jié)點的條件概率表,并利用貝葉斯評分規(guī)則進行選擇最優(yōu)模型及參數(shù),這些計算過程都屬于NP(Non-deterministic Polynomial)難問題。所以,單機版孔明燈軟件在模型學(xué)習(xí)時,存在計算時間長、獨占電腦資源等不足,特別是當(dāng)分析的數(shù)據(jù)較大時,需要幾十天的時間才能學(xué)習(xí)出模型。

        因此,為解決單機版孔明燈軟件在計算能力上存在的不足,在張教授及其團隊的指導(dǎo)下,我們基于單機版設(shè)計開發(fā)了生成隱結(jié)構(gòu)模型的中醫(yī)藥數(shù)據(jù)分析網(wǎng)絡(luò)平臺,即孔明燈網(wǎng)絡(luò)版。該網(wǎng)絡(luò)版不需要下載客戶端程序,采用分布式云服務(wù)器方式,三個計算節(jié)點能夠并發(fā)支持200 個用戶同時使用,并實現(xiàn)7×24 h 全天候計算,在模型學(xué)習(xí)的效率上較單機版提升5 倍以上。同時網(wǎng)絡(luò)平臺還具有業(yè)務(wù)日志、登錄日志、監(jiān)控管理等多個附加功能,較大地方便了用戶和管理人員。

        2 孔明燈最新單機版(V5.0)功能變化

        孔明燈單機版軟件是專用的隱結(jié)構(gòu)模型學(xué)習(xí)軟件[9],被國內(nèi)外隱結(jié)構(gòu)及中醫(yī)藥研究者們廣泛使用,自發(fā)布以來,軟件經(jīng)歷了多次更新,最新版本是2018 年發(fā)布的5.0 版,我們有幸與香港科技大學(xué)張教授團隊合作,參與了5.0 版本的更新及研究工作[10,11]。下面簡要介紹5.0版本的主要功能變化。

        2.1 調(diào)整的算法

        1)雙步隱樹分析,包含 BI 算法(Bridge Island)和LTM-EAST 算 法(Latent Tree Model - Extension Adjustment Simplification until Termination algorithm)。BI 算法適合初步分析,由于采用貪心算法計算求出局部最優(yōu)解,所以運行時間較短,得到的隱樹質(zhì)量一般;LTM-EAST 算法適合正式分析,它對所有的可能解進行遍歷求出全局最優(yōu),運行時間較長,得到隱樹質(zhì)量較高。需要說明的是,上述BI和LTM-EAST算法運算時,一般接收的是所有癥狀(屬性)數(shù)據(jù),得到模型反映整體所有屬性,這是第一步。然后,第二步再根據(jù)醫(yī)學(xué)知識,挑選反映某側(cè)面的癥狀進行綜合聚類,得到最終三層模型,進行后續(xù)的模型詮釋、建立辨證規(guī)則等操作。

        2)隱類模型分析(LCM,Latent Class Model)。隱類分析得到的是一個隱變量的兩層隱樹模型,該方法已被廣泛應(yīng)用于西醫(yī)疾病的診斷,并取得了較好的成果[7,8]。

        3)單 步 隱 樹 分 析(UC-LTM,Unidimensional clustering-Latent Tree Model)。稱為單維聚類的隱樹分析,該方法接收的是根據(jù)醫(yī)學(xué)知識挑選好的某些特定癥狀(屬性)數(shù)據(jù),分析之后不需再綜合聚類,直接得到最終的三層隱樹模型。依據(jù)得到模型可進行后續(xù)的模型詮釋、建立辨證規(guī)則等操作。

        2.2 新增的功能

        1)建立辯證規(guī)則功能。對于得到的模型,選擇隱變量節(jié)點,點擊右鍵選擇“建立辨證規(guī)則”,讀入模型對應(yīng)的數(shù)據(jù)文件。然后輸入規(guī)則名稱,最后點擊“導(dǎo)出規(guī)則”,將自動把準確度高的規(guī)則導(dǎo)出為csv 文件在數(shù)據(jù)的同一目錄下。假設(shè)規(guī)則名為氣虛證,點擊“導(dǎo)出規(guī)則”后,導(dǎo)出規(guī)則文件如表1 所示,規(guī)則為多行2列數(shù)據(jù),第一行第一列元素為規(guī)則名,第一行第二列元素為規(guī)則閾值。從第二行開始,為癥狀名和分值。

        表1 導(dǎo)出的辯證規(guī)則表

        2)使用規(guī)則進行辨證功能。導(dǎo)出某證候規(guī)則后,依據(jù)該規(guī)則文件,可對數(shù)據(jù)進行辨證。辨證過程:依據(jù)規(guī)則的閾值和癥狀分值,對原始數(shù)據(jù)癥狀進行計算分值總和,根據(jù)該總分值與閾值的比較來判斷是否屬于該證候。

        圖1 氣虛證辯證結(jié)果

        首先,點擊菜單欄中“分析”--->“使用規(guī)則進行辨證…”,讀入csv 格式數(shù)據(jù)文件,然后讀入對應(yīng)csv 格式規(guī)則文件。最后進行辨證,辨證結(jié)果文件導(dǎo)出在數(shù)據(jù)文件相同的文件夾下。圖1 為辨證結(jié)果,文件名為“氣虛證_辨證結(jié)果.csv”,文件中將辨證結(jié)果添加到原始數(shù)據(jù)的最后一列,列名為“氣虛證”,數(shù)值1表示有氣虛證,0表示無氣虛證。

        3)證候與西醫(yī)指標對應(yīng)分析功能。為分析中醫(yī)證候與西醫(yī)指標之間的關(guān)系,孔明燈5.0 提供了證候與西醫(yī)指標對應(yīng)分析的功能,對比是否存在某證候的兩類人群,發(fā)掘哪些西醫(yī)指標對證候的存在有較大影響。采用T檢驗原理,得到p和t兩個值,p值表示有無統(tǒng)計學(xué)意義,t值表示正負相關(guān)性。根據(jù)p值最小的幾個指標,發(fā)掘西醫(yī)指標對判斷是否屬于氣虛證(以氣虛證為例)的影響。以某數(shù)據(jù)集為例,得到結(jié)果如圖2所示,共包含四部分:西醫(yī)指標在原始數(shù)據(jù)中列的序號、西醫(yī)指標名稱、t值、p值。

        3 孔明燈網(wǎng)絡(luò)版平臺構(gòu)建

        雖然孔明燈單機版包含多種模型學(xué)習(xí)方法,也被國內(nèi)外相關(guān)研究者廣泛使用,但在學(xué)習(xí)模型時,算法底層維護的是一個特殊貝葉斯網(wǎng)絡(luò),需要學(xué)習(xí)出整個網(wǎng)絡(luò)結(jié)構(gòu),以及網(wǎng)絡(luò)中所有癥狀顯變量節(jié)點和隱變量節(jié)點的條件概率表,并利用貝葉斯評分規(guī)則選擇最優(yōu)的模型及參數(shù),這些計算過程都屬于NP 難問題。所以,單機版孔明燈在模型學(xué)習(xí)時,存在計算時間長、獨占電腦資源等不足,特別在處理的數(shù)據(jù)量較大時,需幾十天時間才能學(xué)習(xí)出模型。

        因此,為解決單機版孔明燈在計算能力上存在的不足,我們基于該軟件最新版(V5.0),設(shè)計開發(fā)了學(xué)習(xí)隱結(jié)構(gòu)模型的中醫(yī)藥數(shù)據(jù)分析平臺,即孔明燈網(wǎng)絡(luò)版。網(wǎng)絡(luò)版平臺有三個節(jié)點組成,一臺web節(jié)點部署web服務(wù)、一臺數(shù)據(jù)庫節(jié)點部署數(shù)據(jù)庫、一臺計算節(jié)點負責(zé)任務(wù)的計算,能夠最多支持200 個用戶同時進行7*24 小時的計算,模型學(xué)習(xí)時間縮短至單機版軟件的五分之一,較大地方便了用戶。目前網(wǎng)絡(luò)版平臺正在開放測試中,網(wǎng)址為http://ai.hactcm.edu.cn,其主要功能模塊子系統(tǒng)如下。

        3.1 用戶中心子系統(tǒng)

        該模塊負責(zé)對用戶的管理,包括新增用戶、刪除用戶;權(quán)限分配、修改密碼;修改個人資料、重置密碼;凍結(jié)用戶、解凍用戶等功能。平均響應(yīng)時間小于1 s,系統(tǒng)最大響應(yīng)時間小于3 s。如下圖3所示。

        3.2 綜合管理子系統(tǒng)

        綜合管理主要負責(zé)對用戶的權(quán)限管理,包括:1)機構(gòu)管理:負責(zé)科研所、會員單位等的管理;2)字典管理:負責(zé)系統(tǒng)字典庫的管理;3)業(yè)務(wù)日志管理:負責(zé)記錄用戶操作的所有日志;4)登錄日志管理:負責(zé)記錄用戶登錄操作的日志;5)監(jiān)控管理:負責(zé)記錄數(shù)據(jù)庫、鏈接池、SQL、Session、Spring 以及API 的監(jiān)控;6)通知管理:負責(zé)發(fā)布一些系統(tǒng)公告。如下圖4所示。

        圖2 氣虛證與部分西醫(yī)指標對應(yīng)關(guān)系

        圖3 用戶中心模塊

        圖4 綜合管理模塊

        3.3 調(diào)度中心子系統(tǒng)

        調(diào)度中心為核心模塊之一,是一個輕量級分布式任務(wù)調(diào)度框架,負責(zé)對任務(wù)進行資源的分配,實現(xiàn)負載均衡和更大的負載量。它有三種角色:1)JobClient(任務(wù)調(diào)度):主要負責(zé)提交任務(wù), 并接收任務(wù)執(zhí)行后的反饋結(jié)果;2)JobTracker(任務(wù)分配):負責(zé)接收并分配任務(wù),完成任務(wù)調(diào)度;3)TaskTracker(任務(wù)執(zhí)行):負責(zé)執(zhí)行任務(wù),執(zhí)行完反饋給JobTracker。

        各個節(jié)點都是無狀態(tài)的,通過部署多個節(jié)點來實現(xiàn)負載均衡和承擔(dān)更大的負載量,框架具有很好的容錯能力。采用多種注冊中心(Zookeeper)進行節(jié)點信息暴露和主(master)選舉;部署了(Mongo or Mysql)存儲任務(wù)的隊列和執(zhí)行日志,采用netty 實現(xiàn)底層通信,支持實時任務(wù)和定時任務(wù)(如:3天之后執(zhí)行)。

        具體執(zhí)行步驟:首先,JobClient 提交任務(wù)給JobTracker。對提交的任務(wù),有兩種不同的客戶端做出處理。 一種是當(dāng)JobTracker 不存在或者提交失敗,直接返回提交失敗。另一種稱為重試客戶端,如果提交失敗,先存儲到本地FailStore(失敗存儲,多線程訪問,做文件鎖處理),返回給客戶端提交成功的信息,待JobTracker可用時,再將任務(wù)提交。接著,JobTracker收到JobClient 提交的任務(wù),將任務(wù)存入任務(wù)隊列。JobTracker 等待 TaskTracker 的 Pull 請求,然后將任務(wù)Push 給 TaskTracker 去 執(zhí) 行 。 TaskTracker 收 到JobTracker分發(fā)來的任務(wù)后,從線程池中拿到一個線程去執(zhí)行。執(zhí)行完畢之后,再反饋任務(wù)執(zhí)行結(jié)果給JobTracker(成功or 失敗[失敗有失敗錯誤信息])。此時,如果發(fā)現(xiàn)JobTacker不可用,那么存儲本地FailStore,等待TaskTracker可用的時候再反饋。反饋結(jié)果同時,詢問JobTacker 是否有新的任務(wù)要執(zhí)行。JobTacker 收到TaskTracker 節(jié)點的任務(wù)結(jié)果信息后,根據(jù)任務(wù)信息決定是否反饋給客戶端。若不需要反饋就直接刪除,否則,直接反饋,反饋失敗則等待重新反饋。最后,JobClient收到任務(wù)執(zhí)行結(jié)果,進行后續(xù)的邏輯處理。

        3.4 分布式計算子系統(tǒng)

        分布式計算是系統(tǒng)核心模塊,主要包括算法執(zhí)行程序。具體負責(zé)處理數(shù)據(jù)、生產(chǎn)數(shù)據(jù),讀入用戶提供的數(shù)據(jù)。采用隱結(jié)構(gòu)BI、EAST 等算法進行分析數(shù)據(jù),然后學(xué)習(xí)得到隱樹模型圖,并展示給用戶。算法執(zhí)行模塊執(zhí)行封裝好的算法,調(diào)用算法API,并把算法的執(zhí)行的結(jié)果保存到數(shù)據(jù)庫。此模塊為具體計算模塊,當(dāng)數(shù)據(jù)量大時,運行時間較長,幾天至幾十天。在運算過程中,與其他模塊相互通信,保證多個用戶能夠同時運行使用系統(tǒng),并計算和監(jiān)控系統(tǒng)使用資源情況。具體如圖5所示。

        主要包括:1)在TaskTracker 端提供業(yè)務(wù)日志記錄器,供應(yīng)用程序使用,通過業(yè)務(wù)日志器,將日志提交到JobTracker。這些業(yè)務(wù)日志通過任務(wù)ID 串聯(lián),在Admin 中實時查看任務(wù)的執(zhí)行進度。2)SPI(service provider interface)擴展支持。SPI 擴展可以達到零侵入,只需要實現(xiàn)相應(yīng)的接口,并實現(xiàn)即可被LTS(lighttask-scheduler)使用。3)任務(wù)隊列的擴展,主要支持console,mysql,mongo,用戶也可以通過擴展選擇輸送日志。4)故障轉(zhuǎn)移,若正在執(zhí)行任務(wù)的TaskTracker 宕機后,JobTracker 立即將在宕機TaskTracker 的所有任務(wù)再分配給其他正常的TaskTracker 節(jié)點執(zhí)行。5)節(jié)點監(jiān)控,對JobTracker、TaskTracker 節(jié)點進行資源監(jiān)控、任務(wù)監(jiān)控等,實時在管理員后臺查看,進而進行合理的資源調(diào)配。 6)多樣化任務(wù)執(zhí)行結(jié)果支持。LTS框架提供四種執(zhí)行結(jié)果支持,EXECUTE_SUCCESS,EXECUTE_FAILED,EXECUTE_LATER,EXECUTE_EXCEPTION,并對每種結(jié)果采取相應(yīng)的處理機制,例如重試。7)FailStore 容錯,采用 FailStore 機制來進行節(jié)點容錯,不會因為遠程通信的不穩(wěn)定性而影響當(dāng)前應(yīng)用的運行。

        4 孔明燈網(wǎng)絡(luò)版使用簡介

        前文介紹了網(wǎng)絡(luò)版系統(tǒng)的各個功能,本節(jié)從用戶角度介紹使用系統(tǒng)來分析數(shù)據(jù)得到隱樹模型的過程。

        圖5 分布式計算子系統(tǒng)

        圖6 網(wǎng)絡(luò)版系統(tǒng)登錄界面

        4.1 讀入數(shù)據(jù)。

        按照孔明燈軟件規(guī)定的格式整理好待分析數(shù)據(jù),打開系統(tǒng)網(wǎng)址http://ai.hactcm.edu.cn,輸入賬號密碼和驗證碼(聯(lián)系作者即可開通賬號),點擊登錄,如圖6所示。

        然后點擊分析任務(wù)管理→新增任務(wù),彈出如下圖7 對話框,在對話框中輸入任務(wù)名稱和讀入數(shù)據(jù)文件,然后點擊解析,加載數(shù)據(jù)完成。

        4.2 設(shè)定參數(shù)和算法

        加載完數(shù)據(jù)后,在分析任務(wù)管理中,選擇查看設(shè)置任務(wù)參數(shù),進行修改參數(shù)和算法,如圖8 和圖9 所示。在圖9 中設(shè)置好參數(shù)和算法后,點擊保存按鈕。然后在圖8中點擊運行任務(wù),即可開始模型學(xué)習(xí),根據(jù)數(shù)據(jù)量大小其學(xué)習(xí)所需時間不同。

        4.3 查看結(jié)果及導(dǎo)出文件

        學(xué)習(xí)得到模型以后,在系統(tǒng)中可查看模型結(jié)果、模型詮釋、模型評分、建立規(guī)則,同時可以導(dǎo)出模型文件,方便在客戶端程序中進行模型排版。在分析任務(wù)監(jiān)控中,點擊已完成,查看已完成的數(shù)據(jù)分析結(jié)果,如圖10所示。

        圖7 添加待分析的數(shù)據(jù)

        圖8 分析任務(wù)管理

        圖9 設(shè)置參數(shù)和算法

        圖10 中可導(dǎo)出模型BIF 文件,若需要在網(wǎng)絡(luò)平臺中查看結(jié)果樹,選擇其中某個結(jié)果,點擊查看結(jié)果樹,觀察該模型樹狀結(jié)構(gòu),如圖11 所示。在圖11 中,可以對該模型進行詮釋、評價模型、建立辯證規(guī)則等操作。

        表2 網(wǎng)絡(luò)版與單機版運行時間對比表 分鐘

        圖10 查看運行結(jié)果列表

        圖11 孔明燈網(wǎng)絡(luò)版得到某模型結(jié)構(gòu)展示

        5 計算效率對比及總結(jié)

        為測試網(wǎng)絡(luò)版的計算效力,采用三種不同規(guī)模的數(shù)據(jù)集與單機版進行測試對比。數(shù)據(jù)集一規(guī)模為117行119列、數(shù)據(jù)集二規(guī)模為1087行124列、數(shù)據(jù)集三規(guī)模為8000 行100 列,分別在網(wǎng)絡(luò)版和單機版上進行測試,調(diào)用算法為LTM-EAST,單機版運行在主流配置的電腦上,運行時間結(jié)果如下表2所示。

        通過表2 可以明顯看出,網(wǎng)絡(luò)版系統(tǒng)的計算效力明顯提高,計算效力較單機版提升5 倍以上。特別是運行數(shù)據(jù)集三時,由單機版的30 天降低到5 天左右,明顯節(jié)省了模型學(xué)習(xí)時間。

        本文為解決隱結(jié)構(gòu)分析軟件孔明燈單機版在計算能力和單點計算的不足,基于單機版的底層算法搭建了隱結(jié)構(gòu)分析的網(wǎng)絡(luò)版,該網(wǎng)絡(luò)版利用私有云計算資源,動態(tài)調(diào)整所需計算資源,能夠并發(fā)支持200 個用戶同時使用,并實現(xiàn)7*24 h 全天候計算,在實際的數(shù)據(jù)集測試中,其計算效率較單機版平均提升5倍以上。

        同時網(wǎng)絡(luò)版還具有業(yè)務(wù)日志、登錄日志、監(jiān)控管理等多個附加功能,較大地方便了用戶和管理人員,為推廣和使用隱結(jié)構(gòu)研究中醫(yī)藥起到積極的作用,也為中醫(yī)藥的傳承和發(fā)展做出一定的貢獻。

        猜你喜歡
        規(guī)則用戶分析
        撐竿跳規(guī)則的制定
        數(shù)獨的規(guī)則和演變
        隱蔽失效適航要求符合性驗證分析
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        TPP反腐敗規(guī)則對我國的啟示
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        国产在线天堂av| 国产一区二区三区的区| 中文字幕亚洲乱码熟女1区2区 | 无码AV高潮喷水无码专区线| 国产精品白浆视频一区| 日本一区二区高清视频| 国产乱人伦偷精品视频免观看| 亚洲无av在线中文字幕| 精品人妻少妇一区二区三区不卡| 99国产精品久久久蜜芽| 一本大道加勒比东京热| 亚洲综合网国产精品一区| 色综合久久无码五十路人妻| 嫖妓丰满肥熟妇在线精品| 国产毛片视频网站| 久久精品国产精品亚洲婷婷| 午夜一区二区三区av| 国产不卡视频在线观看| 日本高清视频永久网站www| 久久综合国产乱子伦精品免费| 无码精品黑人一区二区三区| 激情 一区二区| 成人国产一区二区三区av| 一本久久a久久免费综合| 中文字幕久久精品一二三区| 美女一级毛片免费观看97| 国产偷国产偷亚洲高清| 精品露脸国产偷人在视频| 丰满的少妇xxxxx青青青| 亚州毛色毛片免费观看| 精品久久人妻av中文字幕| 天天摸夜夜摸夜夜狠狠摸| 免费国产裸体美女视频全黄| 亚洲h电影| 国产三级国产精品国产专区| 国产精品一二三区亚洲| 日本又色又爽又黄的a片18禁| 99精品电影一区二区免费看| 一区二区三区内射视频在线观看 | 亚洲av一区二区在线| 777精品出轨人妻国产|