亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        循證醫(yī)學(xué)RCT文獻(xiàn)自動(dòng)識(shí)別研究

        2020-03-15 10:15:08姚攀
        現(xiàn)代計(jì)算機(jī) 2020年4期
        關(guān)鍵詞:超平面自動(dòng)識(shí)別生物醫(yī)學(xué)

        姚攀

        (四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)

        0 引言

        隨著醫(yī)學(xué)的不斷發(fā)展,當(dāng)前的醫(yī)療模式逐步從傳統(tǒng)的經(jīng)驗(yàn)醫(yī)學(xué)向循證醫(yī)學(xué)(EBM)轉(zhuǎn)變[1],循證醫(yī)學(xué)將醫(yī)生的臨床經(jīng)驗(yàn)、患者自身的實(shí)際情況、當(dāng)前最佳臨床證據(jù)三者相結(jié)合,綜合考慮為患者制定最佳的科學(xué)診療方案。循證醫(yī)學(xué)的目標(biāo)是在現(xiàn)有高質(zhì)量證據(jù)的基礎(chǔ)上改善醫(yī)療結(jié)果,最佳證據(jù)來(lái)源于現(xiàn)存的醫(yī)學(xué)文獻(xiàn),以證據(jù)為基礎(chǔ)的指導(dǎo)方針和政策才不會(huì)輕易地被以經(jīng)驗(yàn)為導(dǎo)向的臨床判斷所干擾,而隨機(jī)對(duì)照試驗(yàn)類文獻(xiàn)被認(rèn)為是高質(zhì)量的證據(jù)文獻(xiàn)[2]。隨機(jī)對(duì)照試驗(yàn)是驗(yàn)證醫(yī)療干預(yù)效果的金標(biāo)準(zhǔn),對(duì)干預(yù)以及對(duì)照進(jìn)行了實(shí)驗(yàn)記錄,它描述了試驗(yàn)結(jié)果及結(jié)論等,為臨床醫(yī)學(xué)提供了有力的證據(jù)支持和科學(xué)的臨床科研設(shè)計(jì)。醫(yī)學(xué)工作者通過(guò)隨機(jī)對(duì)照試驗(yàn)類文獻(xiàn)不僅能有針對(duì)性的制定相關(guān)治療方案、做出相關(guān)指導(dǎo)方針,而且有助于醫(yī)學(xué)系統(tǒng)評(píng)價(jià)(systematic review)、meta分析、臨床決策等相關(guān)研究的完善。

        現(xiàn)有的隨機(jī)對(duì)照試驗(yàn)類文獻(xiàn)主要由生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)(如:MEDLINE數(shù)據(jù)庫(kù),中國(guó)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù))的工作人員手工標(biāo)注,將其打上RCT類標(biāo)簽。當(dāng)醫(yī)學(xué)工作者查閱相關(guān)問(wèn)題的隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)的時(shí)候,可通過(guò)RCT標(biāo)簽過(guò)濾這類文獻(xiàn)。但相關(guān)研究發(fā)現(xiàn),由于文獻(xiàn)數(shù)量快速增長(zhǎng)及標(biāo)注難度大等不確定性因素,使得MEDLINE數(shù)據(jù)中隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)的標(biāo)注質(zhì)量存在一定問(wèn)題,其遺漏掉了15%的隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)[3]。由于隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)篩選的過(guò)程嚴(yán)格,且需要極高靈敏度,使得醫(yī)學(xué)人員耗費(fèi)大量的時(shí)間與精力對(duì)相關(guān)問(wèn)題的文獻(xiàn)進(jìn)行閱讀篩選。因此,通過(guò)自然語(yǔ)言處理技術(shù)與機(jī)器學(xué)習(xí)算法對(duì)隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)自動(dòng)識(shí)別,不僅有助于循證醫(yī)學(xué)發(fā)展,而且促進(jìn)了醫(yī)學(xué)信息檢索的發(fā)展。

        1 研究?jī)?nèi)容及現(xiàn)狀

        循證醫(yī)學(xué)作為一種新的醫(yī)療模式,利用最佳的臨床證據(jù)為基礎(chǔ)進(jìn)行醫(yī)療決策,需要醫(yī)學(xué)工作者帶著臨床問(wèn)題進(jìn)行文獻(xiàn)檢索,對(duì)檢索結(jié)果進(jìn)行進(jìn)一步篩選,尋找有價(jià)值的文獻(xiàn)證據(jù)。隨機(jī)對(duì)照試驗(yàn)類文獻(xiàn)作為高質(zhì)量的主要證據(jù)載體,在海量的生物醫(yī)學(xué)文獻(xiàn)中僅占很小的比例[4],想要查詢相關(guān)醫(yī)學(xué)證據(jù)絕非易事。現(xiàn)有生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)對(duì)文獻(xiàn)標(biāo)注RCT類別的標(biāo)簽,如:MEDLINE、中國(guó)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù),但有相關(guān)研究發(fā)現(xiàn)MEDLINE中標(biāo)注的隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)存在7%的錯(cuò)誤,而且漏掉了15%的隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)[3]。循證醫(yī)學(xué)相關(guān)的Cochrane網(wǎng)站發(fā)起了隨機(jī)對(duì)照試驗(yàn)人工篩選項(xiàng)目,由志愿者篩選出主要來(lái)自MEDLINE與EMBASE醫(yī)學(xué)數(shù)據(jù)庫(kù)及臨床研究注冊(cè)平臺(tái)CT的隨機(jī)對(duì)照臨床試驗(yàn)[5],篩選出的隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)具有高質(zhì)量,但是需要耗費(fèi)極大的人力成本。

        現(xiàn)有對(duì)文獻(xiàn)人工標(biāo)注RCT類標(biāo)簽的做法耗時(shí)費(fèi)力,因此,有研究者們通過(guò)機(jī)器學(xué)習(xí)與自然語(yǔ)言處理技術(shù)自動(dòng)識(shí)別隨機(jī)對(duì)照試驗(yàn)類文獻(xiàn),并且已經(jīng)取得一定成果。目前,在Cochrane合作組織所積累的工作基礎(chǔ)上,Wallace等人總共選用了Cochrane Library數(shù)據(jù)庫(kù)中的標(biāo)注數(shù)據(jù)(包含RCT陽(yáng)性實(shí)例,以及非RCT陰性實(shí)例),對(duì)其使用的線性內(nèi)核支持向量機(jī)(Support Vector Machine,SVM)不斷進(jìn)行訓(xùn)練、調(diào)試和測(cè)試,最終得到了能夠減少60%-80%無(wú)關(guān)文獻(xiàn)、檢出98%的隨機(jī)對(duì)照試驗(yàn)?zāi)P蚚6]。近年來(lái)也有相關(guān)研究嘗試將文獻(xiàn)分為RCT與非RCT兩類,如Cohen等人利用MEDLINE數(shù)據(jù)庫(kù)中標(biāo)注RCT標(biāo)簽的文獻(xiàn)作為正例,其他作為負(fù)例,利用N-gram表示標(biāo)題摘要的信息,通過(guò)支持向量機(jī)(SVM)模型對(duì)RCT類文獻(xiàn)進(jìn)行識(shí)別,最后根據(jù)其與超平面距離轉(zhuǎn)化所得置信度高低排序[3]。隨著深度學(xué)習(xí)在自然語(yǔ)言處理應(yīng)用上的興起,Marshall等人利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)對(duì)隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)進(jìn)行識(shí)別,最后按照RCT類別置信度進(jìn)行排序篩選[4]。相比SVM方法利用專業(yè)背景知識(shí)構(gòu)造特征主觀性較強(qiáng)且工作量大,深度學(xué)習(xí)方法不僅具有自動(dòng)捕獲特征的優(yōu)勢(shì),而且神經(jīng)網(wǎng)絡(luò)詞向量的引入有助于模型編碼更好語(yǔ)義信息,好的文本語(yǔ)義表達(dá)促進(jìn)模型更好地識(shí)別隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)。隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)的篩選要求高的靈敏度,目前的算法用于隨機(jī)對(duì)照試驗(yàn)篩選普遍能夠達(dá)到靈敏度95%以上,特異度在30%~70%之間,算法自動(dòng)篩選的不同評(píng)估方法相繼出現(xiàn),使得RCT文獻(xiàn)自動(dòng)識(shí)別任務(wù)也日趨完善。

        2 RCT文獻(xiàn)自動(dòng)識(shí)別方法

        為了進(jìn)行RCT文獻(xiàn)的自動(dòng)識(shí)別,首先需要對(duì)已有的文獻(xiàn)信息進(jìn)行預(yù)處理,獲取文獻(xiàn)的特征信息,最后利用這些特征表達(dá)進(jìn)行RCT類的預(yù)測(cè),如從圖1所示?,F(xiàn)有RCT文獻(xiàn)自動(dòng)識(shí)別方法采用的文獻(xiàn)數(shù)據(jù),主要來(lái)自生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)(如:MEDLINE)或其他人工標(biāo)注有RCT類標(biāo)簽標(biāo)區(qū)分的數(shù)據(jù),所導(dǎo)出的文獻(xiàn)數(shù)據(jù)保留了標(biāo)題、摘要、作者、Mesh等信息。現(xiàn)有方法通過(guò)預(yù)測(cè)文獻(xiàn)是隨機(jī)對(duì)照試驗(yàn)的可能性,并基于置信度進(jìn)行排序篩選。目前,針對(duì)隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)的自動(dòng)識(shí)別主要有支持向量機(jī)(SVM)與卷積神經(jīng)網(wǎng)絡(luò)(CNN)兩種做法。

        圖1 RCT文獻(xiàn)識(shí)別流程

        2.1 支持向量機(jī)自動(dòng)識(shí)別RCT

        支持向量機(jī)(SVM)已被證明在許多機(jī)器學(xué)習(xí)任務(wù)均能取得很好效果,可應(yīng)用于自然語(yǔ)言處理等相關(guān)應(yīng)用。支持向量機(jī)方法的目標(biāo)是構(gòu)建一個(gè)超平面,該平面將在特征空間中的樣例的相應(yīng)類分開,而支持向量機(jī)僅利用部分樣例來(lái)確定超平面即可。

        使用線性支持向量機(jī)模型可進(jìn)行文本分類[7],通常通過(guò)BOW編碼文本信息(標(biāo)題、摘要等信息)進(jìn)行表示。這種方法抽象表示文獻(xiàn)為一個(gè)高維稀疏的向量,其中向量的每個(gè)索引位置對(duì)應(yīng)一個(gè)特定詞(unigram)或一組相鄰詞(bigram)或其他條件特征,并且僅當(dāng)文獻(xiàn)中出現(xiàn)了對(duì)應(yīng)維度的特征,其表達(dá)才為非零。線性核支持向量機(jī)進(jìn)行RCT識(shí)別的目標(biāo)是在這個(gè)高維空間中識(shí)別一個(gè)超平面,該超平面最后用于將RCT與非RCT類別的文本分開。

        研究者利用SVM確定的最佳超平面,進(jìn)一步將樣本到超平面的有符號(hào)距離轉(zhuǎn)換為RCT類別概率的置信度做預(yù)測(cè)分析,設(shè)定閾值篩選RCT文獻(xiàn)[3]。

        2.2 卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)識(shí)別RCT

        隨著深度學(xué)習(xí)的興起,許多深度學(xué)習(xí)模型被證明在自然語(yǔ)言處理應(yīng)用中優(yōu)于其他的統(tǒng)計(jì)模型。卷積神經(jīng)網(wǎng)絡(luò)(CNN)[8],在文本分類[9,10]和生物醫(yī)學(xué)文本分類(特別是生物醫(yī)學(xué)文本分類)任務(wù)中取得了很好的結(jié)果。CNN方法通過(guò)自動(dòng)捕獲文本特征,代替了BOW編碼,用相對(duì)低維連續(xù)向量來(lái)表示詞(詞嵌入)。對(duì)于詞的向量形式表達(dá)學(xué)習(xí),可使用大量未標(biāo)記的數(shù)據(jù)進(jìn)行詞嵌入預(yù)訓(xùn)練。

        對(duì)于一篇隨機(jī)對(duì)照試驗(yàn)類文獻(xiàn),在標(biāo)題摘要部分會(huì)對(duì)試驗(yàn)進(jìn)行簡(jiǎn)述,對(duì)于判斷文獻(xiàn)類型也是最為重要

        的。有研究者通過(guò)TextCNN方法進(jìn)行隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)識(shí)別,利用文獻(xiàn)的標(biāo)題和摘要信息作詞嵌入,形成一個(gè)詞矩陣,其維數(shù)分別為詞的個(gè)數(shù)以及詞嵌入大小[4]。卷積神經(jīng)網(wǎng)絡(luò)模型通過(guò)不同大小的filter進(jìn)行卷積操作,滑動(dòng)窗口從文本開頭向下移動(dòng),在相鄰詞嵌入上傳遞由相應(yīng)權(quán)重向量參數(shù)化的過(guò)濾器filter。每個(gè)filter將產(chǎn)生與輸入文本長(zhǎng)度成比例的大小的標(biāo)量輸出向量。然后在每個(gè)輸出向量上進(jìn)行最大池化合并來(lái)提取特征。然后,每個(gè)濾波器最終將生成單個(gè)標(biāo)量輸出,將它們連接起來(lái)形成整個(gè)摘要的向量表示,與預(yù)測(cè)的輸出層做全連接。最后,通過(guò)輸出層的RCT類別置信度預(yù)測(cè)文獻(xiàn)是否為RCT文獻(xiàn)。

        2.3 評(píng)價(jià)指標(biāo)

        為了評(píng)價(jià)模型對(duì)隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)的識(shí)別性能,采用了多種指標(biāo)結(jié)合評(píng)價(jià)。針對(duì)模型預(yù)測(cè)結(jié)果,常用的評(píng)價(jià)指標(biāo)有準(zhǔn)確率(ACC)、精確率(P)、召回率(R)、F1值,靈敏度(Sensitivity)、特異度(Specificity)。如下所示表格及公式:

        表1 混淆矩陣

        鑒于隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)自動(dòng)識(shí)別要求盡量不要漏掉相關(guān)高質(zhì)量文獻(xiàn),可按RCT類別閾值對(duì)置信度劃分,進(jìn)一步確定其類別并評(píng)估模型性能。

        3 結(jié)語(yǔ)

        綜上所述,隨著生物醫(yī)學(xué)文獻(xiàn)的不斷增加,醫(yī)學(xué)工作者快速全面地獲取感興趣的高質(zhì)量文獻(xiàn)證據(jù)變得愈加困難,隨機(jī)對(duì)照試驗(yàn)文獻(xiàn)的自動(dòng)識(shí)別將能彌補(bǔ)醫(yī)學(xué)信息檢索的一些不足,更好地輔助醫(yī)務(wù)工作者的業(yè)務(wù)開展。針對(duì)此識(shí)別任務(wù)的模型從傳統(tǒng)機(jī)器學(xué)習(xí)向深度學(xué)習(xí)不斷發(fā)展,也使得面向循證醫(yī)學(xué)的RCT文獻(xiàn)自動(dòng)識(shí)別成為自然語(yǔ)言處理領(lǐng)域中的重要研究方向。隨著RCT文獻(xiàn)自動(dòng)識(shí)別的進(jìn)一步發(fā)展,將對(duì)醫(yī)學(xué)相關(guān)的系統(tǒng)評(píng)價(jià)、META分析、醫(yī)學(xué)QA、醫(yī)學(xué)信息學(xué)等子領(lǐng)域有深遠(yuǎn)影響。

        猜你喜歡
        超平面自動(dòng)識(shí)別生物醫(yī)學(xué)
        芻議“生物醫(yī)學(xué)作為文化”的研究進(jìn)路——兼論《作為文化的生物醫(yī)學(xué)》
        靈長(zhǎng)類生物醫(yī)學(xué)前沿探索中的倫理思考
        全純曲線的例外超平面
        涉及分擔(dān)超平面的正規(guī)定則
        以較低截?cái)嘀財(cái)?shù)分擔(dān)超平面的亞純映射的唯一性問(wèn)題
        國(guó)外生物醫(yī)學(xué)文獻(xiàn)獲取的技術(shù)工具:述評(píng)與啟示
        自動(dòng)識(shí)別系統(tǒng)
        特別健康(2018年3期)2018-07-04 00:40:18
        金屬垃圾自動(dòng)識(shí)別回收箱
        LED光源在生物醫(yī)學(xué)中的應(yīng)用分析
        基于IEC61850的配網(wǎng)終端自動(dòng)識(shí)別技術(shù)
        免费在线国产不卡视频| 亚洲精品不卡电影| 久久亚洲国产欧洲精品一| 亚洲精品av一区二区日韩| 午夜视频在线观看视频在线播放| 亚洲va中文字幕无码毛片| 亚欧AV无码乱码在线观看性色| 99在线无码精品秘 入口九色| 亚洲婷婷久久播66性av| 日韩网红少妇无码视频香港| 国内老熟妇对白xxxxhd| 国产乱人伦真实精品视频| 国产精品人成在线观看不卡| 亚洲国产精品无码久久一区二区 | 夜夜嗨av一区二区三区| 中文字幕有码一区二区三区| 亚洲av综合日韩精品久久| 日本精品少妇一区二区三区| 一本大道久久香蕉成人网| WWW拍拍拍| 高清在线有码日韩中文字幕 | 久久福利资源国产精品999| 国产91成人自拍视频| 国产精品成人无码久久久久久| 特级婬片国产高清视频| 免费观看久久精品日本视频| 人妻少妇偷人精品一区二区三区| 欧美最猛黑人xxxx| 中国精学生妹品射精久久| 蜜桃av观看亚洲一区二区| 视频一区二区三区黄色| 最新精品国偷自产在线| 久久se精品一区精品二区国产| 久久夜色精品国产三级| 国产精品久久久久久人妻无 | 国产精品一久久香蕉国产线看观看| 亚洲大片一区二区三区四区| 插鸡网站在线播放免费观看| 色悠久久久久综合欧美99| 国产精品国产三级国产an| 亚洲婷婷久悠悠色悠在线播放|