亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人工智能與中醫(yī)診斷技術*

        2021-12-05 07:54:15徐佳君雷黃偉高新皓羅志明李紹滋翁慧李燦東
        天津中醫(yī)藥 2021年5期
        關鍵詞:醫(yī)案術語算法

        徐佳君 ,雷黃偉 ,高新皓 ,羅志明 ,李紹滋 ,翁慧 ,李燦東 ,4

        (1.福建中醫(yī)藥大學中醫(yī)學院,福州 350122;2.福建省中醫(yī)健康狀態(tài)辨識重點實驗室,福州 350122;3.廈門大學信息學院人工智能系,廈門 361005;4.福建中醫(yī)藥大學李燦東岐黃學者工作室,福州 350122)

        中醫(yī)診斷學是中醫(yī)學的基礎學科,它的發(fā)展影響著中醫(yī)各臨床學科的診療,尤受臨床及科研學者的重視,因此也是現(xiàn)代中醫(yī)學發(fā)展的前沿學科。目前,制約中醫(yī)診斷學發(fā)展的瓶頸主要有四診信息規(guī)范化客觀化采集、中醫(yī)診斷術語規(guī)范化等方面[1]。中醫(yī)四診信息采集過程具相對主觀性的問題由來已久,在許多中醫(yī)學者堅持不懈的努力下,取得了一定進展,但仍存在采集過程不規(guī)范、標準不統(tǒng)一等問題。中醫(yī)診斷術語規(guī)范化工作近幾十年來亦受到高度重視,制定了相應的標準,但所制定標準與歷版教材又有一定出入;中醫(yī)工作者受教育時養(yǎng)成的既定習慣更改不易,推廣較難;且在歷代中醫(yī)典籍醫(yī)案中,術語普遍存在一詞多義、多詞一義等情況,以上種種情況造成了中醫(yī)診斷術語仍較難統(tǒng)一,不利于傳承和發(fā)展。

        人工智能(AI)是當前全球研究熱點,AI不僅能替代有邏輯性、規(guī)律性的人工,提高工作效率,還能在某些極精細領域中完成人類無法完成的任務,中國已將AI與醫(yī)學的結合上升到國家戰(zhàn)略的高度。而早在20世紀六七十年代,許多學者已經(jīng)開始了中醫(yī)診斷的AI化研究,主要方法是建立基于專家知識庫的邏輯推理系統(tǒng),取得了一定成績,在特定的條件下有較好的應用效果。但基于象思維的中醫(yī)診斷學強調整體性與運動性,因而,單純的邏輯規(guī)則并不完全適用中醫(yī)診斷的推理過程[2]。2016年,Google公司的AlphaGo橫空出世,擊敗了多名圍棋世界冠軍,這一歷史性事件標記著以大數(shù)據(jù)與深度學習算法為代表的新一代AI的興起。與傳統(tǒng)相比,新一代AI基于大數(shù)據(jù)的特性顯然更適合中醫(yī)學的整體性,其經(jīng)深度學習而產(chǎn)生的預判也更適合中醫(yī)學的運動性。因此,將新一代AI技術運用于中醫(yī)診斷學,應有助于其突破前述發(fā)展瓶頸。

        1 AI與四診信息規(guī)范化客觀化采集

        1.1 AI與望診 AI望診,目前研究較多地集中在望面及望舌兩個領域,其主要數(shù)據(jù)來源為圖像,需要通過圖像分割、圖像識別兩個步驟進行。近年來AI望診的研究取得了一定的突破,如基于力場的輪廓變形算法,使舌象分割不易受初始輪廓影響,提升分割準度[3];再如偏最小二乘法在Lab顏色空間對面部光澤的判別準確率可達89.06%[4];又如聯(lián)合運用最大類間方差算法及分水嶺算法能夠實現(xiàn)對舌紫斑的自動識別[5]。然而,AI望診離真正的臨床要求尚存在較大差距,目前亟待解決的是光源問題,AI望診的圖像數(shù)據(jù)幾乎均基于固定角度、固定強度光源,真實世界光源多變,如何使AI算法適應復雜的光源環(huán)境仍需進一步探索。

        1.2 AI與聞診 在聽聲音的研究中,目前主要研究方法有空氣動力學法、頻譜分析法等。AI聲診不但能夠分辨出諸如咳嗽、聲嘶、聲低等病理性聲音[6],研究者們還運用樣本熵、小波包變換的近似熵等算法,通過聲音得出病位、病性證素等診斷信息[7]。然則,目前中醫(yī)AI聲診研究仍存在采集儀器規(guī)格不統(tǒng)一、采樣環(huán)境要求較高等問題,從科研到落地仍有一段距離。

        氣味是氣體所含分子作用于受體所產(chǎn)生的刺激過程,氣味特征可以通過紅外光譜、直接頂空分析、氣相-液相色譜分析等方法直接判別氣體所含的刺激性分子。目前中醫(yī)電子鼻技術已具有較高的穩(wěn)定性和靈敏度,不僅能較準確地識別2型糖尿病患者口腔氣味判斷其虛實病性[8],在胃病及外感疾病中也得到較好的應用[9-10],未來有望參與各個系統(tǒng)疾病的診斷。但相較于聲診,嗅診更難以量化,暫無太多臨床運用的研究報導,尚存在氣味特征圖譜知識庫不夠全面等問題,有待進一步研究[11]。

        1.3 AI與問診 問診AI化的研究起步較早,早期多是基于專家經(jīng)驗、文獻梳理的量表研究,隨著新一代AI的發(fā)展,越來越多學者開始關注問診模型的研究。如基于極值隨機森林算法、極限學習機算法的慢性胃炎中醫(yī)問診模型[12];基于隱結構法的啟發(fā)式雙重爬山算法中醫(yī)脾系病問診模型[13]等。然而筆者認為,制約AI問診的瓶頸或許不在于算法模型,傳統(tǒng)的貝葉斯網(wǎng)絡已能較好地揭示證候之間復雜的聯(lián)系[14],中醫(yī)診斷術語不能統(tǒng)一規(guī)范應才是當前AI問診的研究難點[15]。

        1.4 AI與切診 切診的AI化研究主要集中在脈診,研究方向有脈象波形采集(傳感器)、特征提取分類(脈象識別)兩方面。傳感器有壓力脈搏型、多普勒超聲脈搏型、光電脈搏型等類型[16];在脈象識別模塊,采用線性插值算法對三維脈沖圖進行處理,可辨別出平脈、滑脈及弦脈[17];基于BP神經(jīng)網(wǎng)絡的脈診則可直接得出體質等診斷信息[18]。而目前各類傳感器研究雖然取得一定突破,但仍未成熟,尚不能真實、完整、客觀地提前脈搏信息[19];此外,由于脈象信息量巨大的特性,如何有效篩選有用信息的降噪處理,也是研究的難點之一。

        在中醫(yī)四診AI化的研究中,除了各診存在上述問題外,也存在“通病”,主要是:1)原始資料采集人員中醫(yī)臨床水平參差不齊,歸納、標注不統(tǒng)一、不規(guī)范,信息數(shù)據(jù)可信度未能達到最佳。2)除問診外的其余三診,其信息采集皆需檢測設備,然而,基于不同工作原理設計的設備,其采集的信息參數(shù)和表達方法均不相同,沒有統(tǒng)一的規(guī)范標準,測量結果表達也不同。3)雖然四診AI化研究在各自領域取得了一定進展,但呈現(xiàn)“各自為戰(zhàn)”的特點,未發(fā)揮中醫(yī)“四診合參”的特色和優(yōu)勢。

        1.5 AI與四診合參 目前關于四診合參AI化的文獻報導較為少見,說明該研究仍處于初步階段[20]。AI四診合參可通過兩個途徑實現(xiàn):1)規(guī)范統(tǒng)一四診采集標準,分別辨識四診所采集信息后再進行歸納分析,但如前所述,目前各家研究原理和采集標準不同,因此較難實現(xiàn)。2)直接采用多格式、多來源(文字、數(shù)字、圖片、聲音等)的原始數(shù)據(jù)直接進行分析,其優(yōu)點是數(shù)據(jù)丟失率低,因而相應準確率高,缺點是對深度學習的算法要求更高,目前尚處于探索狀態(tài)。由于各診設備尚未成熟,故而直接分析具有異構性的原始四診信息是現(xiàn)階段較為可行的辦法,這就需要多模態(tài)的機器學習。值得一提的是多核學習方法,各子特征空間組合成多個核函數(shù)的高維空間,因此高維組合空間也具備各子空間的映射能力,異構數(shù)據(jù)中不同的特征分量也由此得以分別經(jīng)最優(yōu)單函數(shù)映射到知識層,使之更準確地表達。在此基礎上,采用協(xié)同訓練方法迭代出最佳分類器,對訓練數(shù)據(jù)進行預測,設計基于知識層和決策層的最優(yōu)化算法[20-21]。

        2 AI與中醫(yī)診斷術語規(guī)范化

        對于AI而言,規(guī)范化的中醫(yī)診斷術語是極為重要的,其意義在于“使中醫(yī)數(shù)據(jù)說普通話”,統(tǒng)一的術語才便于結構化中醫(yī)數(shù)據(jù),從而轉化為計算機能夠理解的語言。進入21世紀以來,中醫(yī)術語規(guī)范化取得了令人矚目的成果,但仍存在諸如標準不統(tǒng)一、各科研組織機構未協(xié)調統(tǒng)一等問題。因此,有學者提出在協(xié)調各機構的基礎上,采用術語學方法并構建同義詞庫是針對目前問題的解決對策[22]。中國中醫(yī)科學院信息所從2002年開始,借鑒統(tǒng)一醫(yī)學語言系統(tǒng)(UMLS)的結構應用于中醫(yī)藥領域,構建了基于本體論的、建立了多層次語義關聯(lián)的中醫(yī)藥學語言系統(tǒng)(TCMLS),即包含了大型同義詞庫,然而即使是如此耗時十數(shù)年、人力物力投入巨大的工程,仍不能說已完全涵蓋歷史長河中浩瀚如煙的中醫(yī)典籍中出現(xiàn)的術語[23]。因此,進行基于基準術語庫的AI自然語言處理(NLP),以便實現(xiàn)對各時代的醫(yī)案、文獻進行智能讀取,是目前中醫(yī)診斷術語范疇內(nèi)較為可行的方法之一。

        目前中醫(yī)診斷進行NLP的對象主要是醫(yī)案及文獻,其中包含了許多臨床診斷基礎數(shù)據(jù)。為通過NLP實現(xiàn)中醫(yī)診斷術語規(guī)范化,那么對信息的充分利用是非常必要的,故而要對醫(yī)案進行信息抽取和中文分詞。目前對中醫(yī)文本數(shù)據(jù)進行智能分析的NLP方法主要有隱馬爾科夫模型(HMM)、條件隨機場模型(CRF)等,然而經(jīng)常面臨數(shù)據(jù)標注缺失、訓練數(shù)據(jù)集少造成的準確率不足的情況[24]。

        如今人工神經(jīng)網(wǎng)絡已經(jīng)被廣泛使用,其中循環(huán)神經(jīng)網(wǎng)絡(RNN)在處理自然語言任務上有著極大的優(yōu)勢,RNN是一種特殊的神經(jīng)網(wǎng)絡結構,它是根據(jù)“人的認知是基于過往的經(jīng)驗和記憶”這一觀點提出的。不僅考慮前一時刻的輸入,同時具有對前面的內(nèi)容的一種“記憶”功能。長短期記憶(LSTM)[25]是一種特殊的RNN,更是解決了長期依賴問題。LSTM主要設置了門結構來實現(xiàn)重要“記憶”的保留與取舍,內(nèi)部主要有3個門,遺忘門即忘記階段,這個階段主要是對上一個節(jié)點傳進來的輸入進行選擇性忘記,簡單來說就是會“忘記不重要的,記住重要的”。輸入門即選擇記憶階段,這個階段將這個階段的輸入有選擇性地進行“記憶”。輸出門即輸出階段,這個階段將決定哪些將會被當成當前狀態(tài)的輸出。而為了對語句的分析更加準確,使用兩個LSTM模型,其語句的輸入方向相反,由此可結合成為雙向長短期記憶(BI-LSTM)[26]。基于此再使用CRF則可以用于構造在給定一組輸入隨機變量的條件下,另一組輸出隨機變量的條件概率分布模型。例如在詞性標注任務中,輸入序列為一串單詞,輸出序列就是相應的詞性。

        因此,本團隊也利用BI-LSTM-CRF模型對中醫(yī)醫(yī)案進行自然語言處理。初期的訓練數(shù)據(jù)集是由團隊帶頭人李燦東教授十余年的臨床醫(yī)案構成,并由中醫(yī)專家博士團隊進行了醫(yī)案分詞標注。通過訓練相應的分詞模型,得到分詞準確率可達到97%以上,遠高于例如Jieba、PKUseg等開源分詞工具,為后續(xù)的醫(yī)案信息的自動抽取與理解奠定堅實基礎。

        分詞后可得到包括部位、性質、程度等最小粒度的中醫(yī)診斷術語,基于此的同義詞匹配可使計算機更好地理解醫(yī)案信息,以此完成中醫(yī)診斷術語的NLP工作,而非陷入近似無窮盡的同義詞庫構建。該部分可以通過中文相似度計算來實現(xiàn),中文相似度技術是自然語言處理中的一個重要研究方向,其技術有基于統(tǒng)計的相似度計算方法、基于詞向量的相似度計算方法等?;诮y(tǒng)計的相似度計算方法最常用的方法為詞頻-逆文件頻率(TF-IDF)計算方法,將文本轉化為向量。TF(Term Frequency)是詞頻,即一個詞在文中出現(xiàn)的次數(shù)。IDF(Inverse Document Frequency)是逆向文件頻率,可以由總文件數(shù)目除以包含該詞語的文件的數(shù)目,再將得到的商取對數(shù)得到?;谠~向量的相似度計算方法最常見的就是使用Word2Vec詞向量,通過網(wǎng)絡模型獲得詞向量。由此將文本向量化后,再通過余弦相似度測量兩個向量之間的夾角的余弦值,度量兩詞語之間的相似度。基于統(tǒng)計的相似度計算方法是字淺層面的方法,而基于詞向量的相似度計算方法考慮詞語語義的深層面方法。因此對兩種方法進行加權,結合起來進行對詞語進行相似度計算,綜合考慮詞語的深淺層面,由此完成相似度計算,實現(xiàn)同義詞匹配。

        3 小結

        綜上所述,基于大數(shù)據(jù)的新一代AI技術很好地契合了中醫(yī)的整體性與動態(tài)性,運用于中醫(yī)診斷領域,將有望助推中醫(yī)診斷技術實現(xiàn)新的跨越與發(fā)展。雖然諸多研究者從不同角度進行了許多研究,并取得進展與成就,但仍存在種種問題。首先,原始信息客觀、準確、全面、規(guī)范的采集標準缺失,造成臨床數(shù)據(jù)雖大,但卻不能發(fā)揮大數(shù)據(jù)應該有的作用,形不成數(shù)據(jù)驅動的效力。其次,中醫(yī)四診信息采集過分依靠醫(yī)者,或者采集設備不成熟,試圖建立采集設備標準,反而造成了新的標準不統(tǒng)一,制造了新的瓶頸問題。最后,AI重點在于算法的優(yōu)勢上,四診的AI化雖然取得了進展,但仍處于“各自為戰(zhàn)”階段,真正體現(xiàn)中醫(yī)思維的四診合參算法仍需要很長時間進行優(yōu)化與完善。

        猜你喜歡
        醫(yī)案術語算法
        基于MapReduce的改進Eclat算法
        Travellng thg World Full—time for Rree
        進位加法的兩種算法
        醫(yī)案聊齋續(xù)篇 吐瀉案
        醫(yī)案聊齋續(xù)篇 晨泄案
        一種改進的整周模糊度去相關算法
        新加香薷飲醫(yī)案6則
        古醫(yī)籍中刺絡放血醫(yī)案淺析
        有感于幾個術語的定名與應用
        從術語學基本模型的演變看術語學的發(fā)展趨勢
        国产在线网址| 国产精品99久久久久久宅男| 国产精品视频亚洲二区| 欧美疯狂性受xxxxx喷水| 香港aa三级久久三级| 欧美大成色www永久网站婷| 夜夜嗨av一区二区三区| 亚洲日韩专区在线视频| 国产成人永久在线播放| 亚洲中文字幕高清视频| 国产午夜精品久久精品| 人妻久久一区二区三区蜜桃| 成人免费看aa片| 亚洲成人色区| 亚洲一区二区三区偷拍女厕| 2021国产精品一区二区在线| av网页在线免费观看| 亚洲成人av大片在线观看| 久久综合噜噜激激的五月天| 免费网站看av片| 国产一区二区三区在线观看免费 | 久久精品国产亚洲AV成人公司| 国产精品毛片av一区二区三区| 国产一区二区三区最新地址| 亚洲精品无码不卡在线播he| 亚洲精品无人区| 国产黄a三级三级三级av在线看| 亚洲国模一区二区三区视频| 亚洲av永久综合网站美女| 少妇人妻无奈的跪趴翘起| 欧洲美熟女乱av亚洲一区| 在教室伦流澡到高潮hgl视频| 国产精品一区二区韩国AV | 手机在线国产福利av| 免费在线观看视频播放| 亚洲精品无码久久久久av老牛| www插插插无码免费视频网站| 亚洲国产日韩在线人成蜜芽| 中文字幕人乱码中文字幕乱码在线| 无码国产精品久久一区免费| 一本大道久久东京热无码av|