摘要:臨床決策支持系統(tǒng)是輔助醫(yī)護人員進行醫(yī)療決策的系統(tǒng),其目的是減少出錯、提高效率。自然語言處理是計算機對自然文本進行分析、識別、理解的技術(shù)。醫(yī)療文書是較為規(guī)范嚴謹?shù)恼Z言文本,從詞匯、語法上分析較適合于進行自然語言處理。采用自然語言處理的臨床決策支持系統(tǒng)與人工干預輸入的臨床決策支持系統(tǒng)比較,不會額外增加醫(yī)護人員的工作量,更易于被臨床接受,是今后臨床決策支持系統(tǒng)發(fā)展的方向。
關(guān)鍵詞:自然語言處理;臨床決策支持;醫(yī)學詞匯
中圖分類號:TP302 文獻標識碼:A
醫(yī)學實踐是關(guān)乎人體生命健康的行為,不容疏忽。但是,對于醫(yī)務人員來說,作為一個理智、情感共存的個體,失誤是必然的,人總會犯錯,這導致了醫(yī)患雙方關(guān)系的緊張、甚至生命健康的負面影響。為了降低出錯的概率,臨床決策支持系統(tǒng)應運而生,它可以對醫(yī)務人員進行診療方面的指導。
臨床決策支持系統(tǒng)是信息(數(shù)據(jù))處理系統(tǒng)。它包括:數(shù)據(jù)輸入、數(shù)據(jù)分析、結(jié)果輸出三部分。其數(shù)據(jù)的準確獲取是至關(guān)重要的、是需要首先解決的問題,只有準確全面的數(shù)據(jù),才會有正確的結(jié)果輸出。臨床上,數(shù)據(jù)是患者在診治過程中的各種數(shù)據(jù),包括癥狀、體征、輔助檢查結(jié)果、檢驗結(jié)果、治療情況等等,其載體分別是:醫(yī)生護士書寫的病歷記錄、檢查檢驗報告、醫(yī)囑記錄等。
目前臨床決策支持系統(tǒng)的數(shù)據(jù)獲取主要是格式化的數(shù)據(jù)(如結(jié)構(gòu)化文檔)、或者人工干預輸入。這導致了臨床決策支持系統(tǒng)的應用主要是自覺式的運用,即醫(yī)生在存在疑問的情況下主動進行決策支持,當然主動使用這并不是壞事。然而,作為一個有經(jīng)驗的醫(yī)生,即使沒有決策支持系統(tǒng),在發(fā)現(xiàn)問題的時候總會通過查閱資料等各種方法找到問題的答案,此時臨床決策支持系統(tǒng)僅僅充當了便攜式的臨床診療指南。醫(yī)療事故、差錯,往往是在不知道存在問題、或者忽略了某些情況后發(fā)生的。所以臨床上迫切需要的是能夠自動發(fā)現(xiàn)問題、分析問題、給出提示的臨床決策支持系統(tǒng)。
自動收集數(shù)據(jù)是首先需要解決的問題。雖然結(jié)構(gòu)化文檔能夠獲取重要數(shù)據(jù),但是在醫(yī)護人員每天的工作中,表現(xiàn)為自由文本的書寫的大量病程記錄、護理記錄也客觀反映了患者病情的發(fā)展變化。能夠在自由文本中自動收集數(shù)據(jù),才談得上自動發(fā)現(xiàn)問題、分析問題、結(jié)果提示。所以自然語言處理對于臨床決策支持系統(tǒng)來說是必要的。
1臨床文本特征
臨床文本是在臨床實踐過程中醫(yī)護人員記錄在一定介質(zhì)上的語言,它符合一般語言特征,還同時必須符合醫(yī)學專業(yè)用語表達規(guī)范,可稱之為醫(yī)學語言。醫(yī)學語言是一般自然語言的子集。作為專業(yè)語言,臨床語言有一定的特征:
1.1詞匯特征 從描述目的可以分為幾個方面:描述患者病情的關(guān)于癥狀、體征、檢驗檢查結(jié)果等詞匯,如發(fā)熱、腹痛、頸部包塊、白細胞升高、肺部腫塊影等;描述治療方面的關(guān)于藥品、手術(shù)、操作等詞匯,如青霉素、闌尾切除術(shù)、導尿等;一般修飾性詞匯,如升高、降低、加快、減慢等。其中,前兩種詞匯是核心,它把問題約束到較為狹窄的范圍,修飾性詞匯把約束了問題的性質(zhì)。
從詞匯的來源可以分為:解剖學、組織胚胎學、生理學、病理學、病理生理、診斷學、治療學名詞,如頸部、左下肢、右上腹、皮膚、血液等,它約束了問題的部位,雖然詞匯量不少,但基本上是較為固定而且規(guī)范的,詞意的理解上一定不會出現(xiàn)歧意;藥理學、治療學等詞匯,其中變化較大的是藥品名稱,藥品化學名相對穩(wěn)定,但商品名卻是五花八門,這就需要及時更新詞庫,可以參照衛(wèi)生部頒布的藥典、醫(yī)保目錄等相關(guān)資料;感覺、感受方面的詞匯,它描述了患者的癥狀,雖然是一般性詞匯,但根據(jù)病歷書寫規(guī)范,患者癥狀的描述不是任意的,也必須規(guī)范表達,如頭昏,不應該表達為頭發(fā)昏,乏力,不應該表達為沒有力氣等,可見這類詞匯也是有規(guī)律可循的,一般不會存在歧意;一般修飾限定性詞匯、謂詞,如數(shù)量名詞、形容詞等,這類詞匯一般與前面幾種詞匯關(guān)聯(lián),不會獨立存在,而且謂詞相對較少,含義明確。
總體來說,醫(yī)學語言所用到的詞匯量較少,其詞庫規(guī)模較一般語言小得多。并且詞意明確,有規(guī)律可循。
1.2語法特征 醫(yī)學語言是嚴謹?shù)模獙颊叩牟∏榧霸\療情況進行清晰的表述。多采用陳述句,偶爾使用祈使句,幾乎不用疑問句和感嘆句。比如一個典型的病程記錄:
今日查房,患者訴頭昏乏力減輕,腹瀉停止,進軟食。查體:體溫38.5℃、心率90次/min、血壓120/75mmHg,中下腹輕微壓痛,無反跳痛及肌緊張。血常規(guī)提示W(wǎng)BC10.5×109/L。XXX教授指示:患者腸道感染減輕,抗感染治療有效,繼續(xù)輸注氨芐青霉素治療。
在該病程記錄中,陳述了患者的病情及治療情況,結(jié)構(gòu)簡單,均是臨床高頻詞匯的組合。名詞為醫(yī)學常用名詞,其中謂詞:訴、停止、輕微、無、提示、指示、減輕、有效等也是出現(xiàn)頻率極高的詞匯。任何人都不會對該病程記錄出現(xiàn)理解差異,這是由醫(yī)學本身的嚴謹性決定的。也就是說,醫(yī)學語言本身是一種對事物陳述、描述性質(zhì)的語言,幾乎拋棄了情感、語氣等需要復雜語言處理的、不確定性較大的部分,這對語言處理的實現(xiàn)提供給了方便。
2自然語言處理
2.1知識庫的建立 詞庫是自然語言處理的基礎(chǔ),首先應建立詞庫。據(jù)上所述,應該包括醫(yī)學專業(yè)詞匯:解剖學、組織胚胎學、生理學、病理學、病理生理、診斷學、治療學、藥理學、藥典等。還包括使用頻率極高的謂詞、量詞等詞匯。在此基礎(chǔ)上,再收集醫(yī)療文書詞匯的常用組合,甚至常用語句等,加上基本的語法庫,形成用于醫(yī)學語言處理的知識庫。
另外,作為臨床支持系統(tǒng),還需要建立作為比較條件的知識庫,使患者的各種診療要素形成一定傾向性的結(jié)果輸出。而權(quán)威機構(gòu)頒布的各??婆R床操作規(guī)范、診療指南等是醫(yī)護進行診療活動的依據(jù),是醫(yī)患糾紛中判斷診療活動合理性的重要參考材料。所以,可以據(jù)此建立判斷條件的知識庫。
2.2語言處理 按照中文自然語言處理的一般步驟,進行分句、分詞、語義分析、形成文本摘要。
2.2.1分句 根據(jù)漢語對語句、句群和篇章的定義,主要以基本的標點符號:句號、問號、感嘆號、分號、逗號等作為子句的分隔符。通過使用這些標點符號對語言進行計算機子句分割,完成分句處理。分為基本單句的分割,和句群的分割,基本單句表達了一個基本概念,而句群才表達了一個完整意思。中文主要以句號、問號、省略號等為句群結(jié)束符,而醫(yī)療文書基本上都是陳述句,故多以句號為句群結(jié)束符。
2.2.2分詞 目前主流的分詞算法主要有三種,分別為基于字符串匹配的分詞算法、基于理解的分詞算法和基于統(tǒng)計的分詞算法。從詞庫中詞條或習慣搭配短語的最大長度開始,逐漸縮短,對基本分句進行匹配詞庫中的詞條。最后把醫(yī)療文書分割為一個個詞匯或短語。
在分詞過程中,預期相當重要,比如遇到關(guān)鍵詞:體溫,從大概率事件來說,其后可能的組合是升高、降低、不升、高熱、中熱(中度發(fā)熱)、低熱、或者數(shù)字加上℃等。
2.2.3語義分析、文本摘要 根據(jù)漢語基本語法,對詞匯進行重組,剔除意義不大的部分,形成摘要。實際上,醫(yī)療文書本身就是文本摘要,話句話說,在繁忙的臨床工作中,醫(yī)護人員不會書寫一些意義不大的廢話,只想盡量精簡扼要。所以,基本上只需分割出詞匯或短語,再與知識庫進行比對就可以了。以上述病程記錄進行分句、分詞為例:
第一步、分句:句群:今日查房,患者訴頭昏乏力減輕,腹瀉停止,進軟食。
3臨床決策支持系統(tǒng)
在分析模型中,比照的是臨床診療指南、操作規(guī)范,所以在建立知識庫時,所用的詞匯、短語應該與語言處理所用的知識庫相對應,否則會增加建立分析模型的難度和復雜性。
4結(jié)論
臨床決策支持系統(tǒng)是防止醫(yī)護人員犯錯、提高工作效率的系統(tǒng)。分析醫(yī)療文書詞匯、語法特征,醫(yī)護人員書寫的醫(yī)療文書具有簡明扼要的特點,與一般語言比較,其詞庫規(guī)模較小、語法相對簡單,更適合于進行自然語言處理。通過自然語言處理的臨床決策支持系統(tǒng),是自動后臺處理的系統(tǒng),與人工干預的系統(tǒng)比較,不會額外增加醫(yī)護人員的工作量,更易于被臨床所接受。當然,其中醫(yī)療文本的語言處理依然是難點。理想狀態(tài)是:醫(yī)療文書是嚴格按照病歷書寫規(guī)范書寫的。然而,實際臨床工作中,并非總是非常規(guī)范的文本。這一方面通過加大醫(yī)護書寫病歷的教育,另一方面加強系統(tǒng)語言處理的功能來解決。
總之,對醫(yī)療文書進行自然語言處理在一定程度上是可行的。相對于人工干預的系統(tǒng),在自然語言處理基礎(chǔ)上建立的臨床決策支持系統(tǒng)具有無可替代的優(yōu)勢,是真正適用于臨床的系統(tǒng),具有廣闊的發(fā)展前景。
參考文獻:
[1]吳巧玲.中文分詞算法在自然語言處理技術(shù)中的研究及應用[J].計算機工程應用技術(shù),2011,12:36-37.
[2]劉小冬.自然語言理解綜述[J].統(tǒng)計與性息論壇,2007,2:9-10.
[3]王德斌,丁宏.臨床決策支持系統(tǒng)開發(fā)與應用中的問題與對策[J].管理信息系統(tǒng),1998,12:6-8.編輯/申磊