亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        文本相似度計算方法提高診斷名稱數(shù)據(jù)標準化過程中人工判斷效率的影響

        2022-07-21 07:12:28鄭景文
        中國衛(wèi)生產(chǎn)業(yè) 2022年9期
        關(guān)鍵詞:標準化文本

        鄭景文

        廣東省農(nóng)墾中心醫(yī)院病案室,廣東湛江 524002

        國家衛(wèi)健委曾指出,各醫(yī)療單位應(yīng)設(shè)置統(tǒng)一的疾病與手術(shù)編碼, 其中疾病診斷名稱屬于主要的醫(yī)療數(shù)據(jù),保證疾病與手術(shù)編碼相對應(yīng),能夠為后續(xù)科研工作提供更多準確的信息[1-2]。以往,診斷名稱數(shù)據(jù)標準化期間,主要是對數(shù)據(jù)進行糾正, 若未能按照標準化進行書寫,將成為人工搜索的問題診斷名稱,從而難以在名稱庫內(nèi)尋找到對應(yīng)的名稱,進一步增加消耗時長[3-4]。 若能夠通過相關(guān)措施予以幫助,能明顯減少人工搜索的時長,達到提升工作效率的目的[5]。隨著研究持續(xù)深入,臨床發(fā)現(xiàn)文本相似度計算方法效果顯著,在增強診斷名稱數(shù)據(jù)標準化期間的人工判斷效率上效果突出。 但相關(guān)文獻較少,該研究選擇2020 年3 月—2021 年8 月使用的23 681條診斷名稱文本數(shù)據(jù),探討文本相似度計算方法在提高診斷名稱數(shù)據(jù)標準化過程中人工判斷效率的價值,現(xiàn)報道如下。

        1 資料與方法

        1.1 一般資料

        按照國家標準的疾病分類與代碼上存在編碼的診斷名稱,按疾病名稱進行排序,并對其ID 進行標記,選擇使用的23 681 條診斷名稱文本數(shù)據(jù)。 將其中標點符號及英文字母均定義成漢字等同的字符,但應(yīng)區(qū)分全半角及大小寫,獲得診斷名稱特點,字符長度均值(8.58±2.36)個,統(tǒng)計與診斷名稱字符長度相同的字符個數(shù),針對少于6 個字符長度者計算其最大值。

        1.2 方法

        (1)余弦相似度:計算向量夾角的余弦值,可評價個體之間的差別,若余弦值越鄰近1,夾角度數(shù)越趨于0,提示向量相似。 在標準化工作上,通過編輯距離預(yù)測文本的相似程度,利用ICD 的三位及四位碼實施診斷類別的文本分類計算,應(yīng)采用余弦相似度計算,診斷類別分類計算時可繼續(xù)使用,從而降低編程工程量。

        (2)文本向量生成:①漢語短文本的文本向量以單字與單字組合、詞嵌入、分詞等,該次試驗挑選單字與單字組合的方式;②逆文本頻率指數(shù)加權(quán):逆文本頻率指數(shù)在數(shù)據(jù)搜索期間,文本向量通過該方式表達,計算名稱拆分后的單字與字組的逆文本頻率指數(shù),最后將逆文本頻率指數(shù)乘頻數(shù),成為第二類文本向量的計算值。

        1.3 觀察指標

        觀察診斷名稱的字組長度與數(shù)量,并分析文本相似度計算結(jié)果,最后計算字組組合模式的文本向量的相似度及字組組合模式下文本向量的相似度。

        2 結(jié)果

        2.1 診斷名稱的字組長度與數(shù)量

        診斷名稱長度為8.58 個字符,獲得9 字組長度,經(jīng)觀察發(fā)現(xiàn)3 字組后,字組暫停增長,但5 字組逐漸減低,從而得知9 字組長度未達50 萬維, 選擇計算機進行處理,見表1。

        表1 診斷名稱的字組長度與數(shù)量

        2.2 文本相似度計算結(jié)果分析

        通過余弦相似度的計算,選擇頻數(shù)向量成為非標準數(shù)據(jù), 而標準數(shù)據(jù)選擇頻數(shù)逆文本頻率指數(shù)加權(quán)的向量,最終將數(shù)據(jù)標準化。利用疾病診斷名稱相似的文本,發(fā)現(xiàn)文本向量存在較大差別, 其自身即為相似度最大值。通過字組組合的方式,測定不同文本向量,選擇高血壓進行舉例,見表2。

        表2 文本相似度計算結(jié)果分析

        2.3 字組組合模式的文本向量的相似度

        字組組合模式的文本向量相似度最大值,見表3。

        表3 字組組合模式的文本向量的相似度

        2.4 字組組合模式下文本向量的相似度

        各類字組組合模式下存在356 條名稱,其中390 次相似度最大值并不是其本身。 對于不同的情況實施分析,字組組合模式Ⅰ不一致,Ⅱ~Ⅸ模式一致,記成0、1、1、1、1、1、1、1、1,見表4。

        表4 字組組合模式下文本向量的相似度

        3 討論

        針對規(guī)范診斷名稱而言,多采取文本相似度方式進行計算,同時對比臨床診斷與數(shù)據(jù)庫中名稱,最后得到標準化的診斷名稱,有助于減少人工搜索時長,明顯改善工作效率[6-8]。 對此該文進行分析,利用余弦相似度計算文本相似度,并通過單字與單字組合的窮舉分詞及頻數(shù)、逆文本頻率指數(shù)加權(quán)形成文本向量,模仿數(shù)據(jù)標準化過程, 選擇余弦相似度測定多個文本向量的計算結(jié)果,結(jié)果發(fā)現(xiàn)相似診斷名稱文本的向量相似度的一致率呈現(xiàn)升高趨勢。 其中2、3 字組的標準化工作需引起重視, 經(jīng)過標準庫與待校對數(shù)據(jù)將其轉(zhuǎn)換為羅馬數(shù)字;而4 字組的診斷名稱出現(xiàn)差異的次數(shù)較少,可能與診斷名稱上字符空格有關(guān),使得計算期間非標準診斷名稱無法與標準名稱相匹配, 針對此可在Excel 中采取TRIM 函數(shù)清除[9-11]。 最后選入5~9 長度字組表征文本向量的效果與1~4 字組差別明顯。

        由于相似度計算作為常見的統(tǒng)計方式,其結(jié)果的準確性存在一定上限, 修改規(guī)則的方式具有重要意義,特別是關(guān)于伴與不伴文字,其實際診斷名稱還存在前后左右上下等問題,因此,精準表達可明顯提升效率[12-15]。 此前關(guān)于醫(yī)療數(shù)據(jù)的標準化對專業(yè)知識的要求極高,對此應(yīng)積極開展培訓(xùn),并鼓勵專業(yè)人員參與,另外高效率的數(shù)據(jù)計算需要文本計算的幫助,尤其是特殊場合中修改算法也應(yīng)得到醫(yī)護人員的積極配合。 由此可見,為醫(yī)護人員選擇操作簡便的計算方式至關(guān)重要,此時選擇以字組拆分頻數(shù)逆文本頻率指數(shù)加權(quán)的計算方式[16-17]。 另外醫(yī)療數(shù)據(jù)的信息質(zhì)量對科研成果質(zhì)量可能存在一定干擾,但診斷名稱數(shù)據(jù)的標準化較為復(fù)雜,同時作為人機交互,并表現(xiàn)成螺旋上升的過程,因此,將醫(yī)療專業(yè)知識與計算機算法相融合,并不斷調(diào)整,才可保證科研質(zhì)量的準確性[18-19]。

        綜上所述,文本相似度計算方法能夠提升診斷名稱數(shù)據(jù)標準化,并促進人工判斷效率改善。

        猜你喜歡
        標準化文本
        標準化簡述
        初中群文閱讀的文本選擇及組織
        甘肅教育(2020年8期)2020-06-11 06:10:02
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        企業(yè)標準化管理信息系統(tǒng)
        標準化是綜合交通運輸?shù)谋U稀庾x《交通運輸標準化體系》
        中國公路(2017年9期)2017-07-25 13:26:38
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        論《柳毅傳》對前代文本的繼承與轉(zhuǎn)化
        人間(2015年20期)2016-01-04 12:47:10
        以標準化引領(lǐng)科技創(chuàng)新
        論汽車維修診斷標準化(上)
        男人和女人做爽爽免费视频| av二区三区在线观看| 久久99精品久久只有精品| 久久不见久久见免费视频6| 在线观看亚洲AV日韩A∨| 日韩视频在线观看| 中文字幕高清一区二区| 国产免费精品一品二区三| 亚洲黄片av在线免费观看| 99久久99久久久精品蜜桃| 亚洲成在人线av品善网好看| 亚洲国产成人精品女人久久久 | 大陆极品少妇内射aaaaa| 不卡国产视频| 精品黑人一区二区三区久久hd | 日韩一级精品视频免费在线看| 精品人妻大屁股白浆无码| 欧美成年黄网站色视频| 亚洲色欲色欲大片WWW无码| 国产免费成人自拍视频| 一本精品99久久精品77| 日本大片免费观看完整视频 | 亚洲三级视频一区二区三区| 最近在线更新8中文字幕免费| 亚洲日韩图片专区小说专区| 日韩av综合色区人妻| www夜插内射视频网站| 欧美疯狂做受xxxx高潮小说| 亚洲国产福利成人一区二区| 女优av一区二区在线观看| 国产成人亚洲精品无码av大片| 在线综合网| 亚洲全国最大的人成网站| 免费a级毛片高清在钱| 国产精品麻豆成人av电影艾秋 | 欧美亚洲日本国产综合在线| 久久精品成人亚洲另类欧美| 亚洲av少妇一区二区在线观看| 一本色道久久88亚洲精品综合| 国产视频导航| 亚洲av国产精品色a变脸|