摘要:隨著社會的不斷發(fā)展,面對日益增長的數(shù)據(jù)量和日趨復(fù)雜的公共衛(wèi)生問題,傳統(tǒng)的信息系統(tǒng)已難以滿足快速準(zhǔn)確處理信息的需求,從而影響了公共衛(wèi)生處理的效率。因此,該文通過整合最先進(jìn)的深度學(xué)習(xí)模型,對疾控中心電子信息系統(tǒng)智能化的優(yōu)化策略進(jìn)行分析研究。研究結(jié)果表明,與現(xiàn)有系統(tǒng)相比,所提出的優(yōu)化方案顯著提升了信息處理的準(zhǔn)確性和時效性,為健康風(fēng)險評估和資源分配提供了更加可靠的科學(xué)依據(jù)。
關(guān)鍵詞:深度學(xué)習(xí);疾控中心;電子信息系統(tǒng);智能化
doi:10.3969/J.ISSN.1672-7274.2024.09.012
中圖分類號:G 270.7;TP 315 文獻(xiàn)標(biāo)志碼:A 文章編碼:1672-7274(2024)09-00-03
Research on Intelligent Optimization of Electronic Information Systems
in Centers for Disease Control and Prevention Based on Deep Learning
TAN Shuxiang
(Yuncheng County Center for Disease Prevention and Control, Heze 274700, China)
Abstract: With the continuous development of society, facing the increasing amount of data and increasingly complex public health problems, traditional information systems are no longer able to meet the needs of fast and accurate information processing, thereby affecting the efficiency of public health processing. Therefore, this article analyzes and studies the optimization strategies for the intelligence of electronic information systems in disease control centers by integrating the most advanced deep learning models. The research results indicate that the proposed optimization scheme significantly improves the accuracy and timeliness of information processing compared to existing systems, providing a more reliable scientific basis for health risk assessment and resource allocation.
Keywords: deep learning; center for disease control and prevention; electronic information systems; intelligence
當(dāng)前,雖然疾控中心已廣泛采用電子信息系統(tǒng)進(jìn)行日常運作,但仍存在數(shù)據(jù)孤島、處理效率低下和預(yù)警準(zhǔn)確性不高等問題。因此,需要重視對深度學(xué)習(xí)技術(shù)的應(yīng)用,建立基于深度學(xué)習(xí)的電子信息系統(tǒng)框架,通過整合多源數(shù)據(jù)、增強數(shù)據(jù)處理能力及自動化決策支持,提升疾控中心針對傳染病的監(jiān)控和干預(yù)效率。
1 疾控中心電子信息系統(tǒng)現(xiàn)狀分析
疾控中心電子信息系統(tǒng)是集數(shù)據(jù)收集、處理、分析和報告功能為一體的綜合性平臺,對現(xiàn)代疾病防控有著巨大影響。隨著全球化和城市化進(jìn)程的加快,疾病傳播的風(fēng)險日益增加,疾控中心需要迅速做出反應(yīng),并及時預(yù)警發(fā)布相關(guān)信息。值得注意的是,雖然現(xiàn)有的電子信息系統(tǒng)在數(shù)據(jù)管理和流行病學(xué)調(diào)查等方面發(fā)揮了重要作用,但是其發(fā)展現(xiàn)狀仍不容樂觀。
就數(shù)據(jù)采集和更新方面而言,系統(tǒng)多依賴于手動輸入,不僅效率低下,而且容易出錯,同時系統(tǒng)的數(shù)據(jù)整合能力有限,特別是在多來源和異構(gòu)數(shù)據(jù)環(huán)境下的信息融合效率較低,對于大規(guī)模和復(fù)雜數(shù)據(jù)的處理與分析能力不足,無法有效支持實時、準(zhǔn)實時的數(shù)據(jù)處理需求[1]。
在智能化方面,當(dāng)前系統(tǒng)的功能性相對較弱,如利用人工智能和機器學(xué)習(xí)技術(shù)進(jìn)行模式識別、趨勢預(yù)測和決策支持等功能還較為初級,且用戶體驗效果存在明顯不足,界面直觀性和交互設(shè)計仍有提升空間。
2 基于深度學(xué)習(xí)的疾控中心電子信息系
統(tǒng)智能化優(yōu)化策略
2.1 系統(tǒng)架構(gòu)設(shè)計
系統(tǒng)架構(gòu)設(shè)計包括三個層面,分別為數(shù)據(jù)層、模型層以及應(yīng)用層。數(shù)據(jù)層是整個系統(tǒng)的基礎(chǔ),負(fù)責(zé)收集、存儲和管理來自疾控中心的各類數(shù)據(jù),例如,收集各種流行病學(xué)調(diào)查數(shù)據(jù)、患者臨床數(shù)據(jù)、公共衛(wèi)生監(jiān)測數(shù)據(jù)以及相關(guān)的社會經(jīng)濟(jì)數(shù)據(jù)等,該層架構(gòu)采用先進(jìn)的數(shù)據(jù)庫管理系統(tǒng),結(jié)合數(shù)據(jù)庫理念實現(xiàn)數(shù)據(jù)的高效存取和動態(tài)擴展。為了保證數(shù)據(jù)質(zhì)量,技術(shù)人員引入數(shù)據(jù)清洗和預(yù)處理模塊,并通過特征工程抽取有效信息以供模型層使用[2]。模型層是系統(tǒng)的核心,主要以多種深度學(xué)習(xí)模型為主,例如,卷積神經(jīng)網(wǎng)絡(luò)(CNN)用于圖像數(shù)據(jù)分析,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和變換器(Transformer)模型用于時序數(shù)據(jù)預(yù)測。在模型的選擇和訓(xùn)練中,技術(shù)人員需要了解和掌握疾控中心的業(yè)務(wù)需求和數(shù)據(jù)特性。模型層設(shè)有模型評估和優(yōu)化組件,可以對負(fù)責(zé)模型參數(shù)展開調(diào)整,以此來確保預(yù)測和分析的準(zhǔn)確性。應(yīng)用層直接面向疾控中心的工作人員和決策者,能夠提供良好的人機交互界面(UI),允許用戶輕松地訪問系統(tǒng)功能,如數(shù)據(jù)可視化、報告生成、預(yù)警機制等。
2.2 數(shù)據(jù)收集處理
在數(shù)據(jù)收集過程中,需要明確數(shù)據(jù)收集的來源,確保數(shù)據(jù)來源的合法性和可靠性,從而為后續(xù)工作奠定良好的數(shù)據(jù)基礎(chǔ)。在收集數(shù)據(jù)時需遵循相關(guān)隱私保護(hù)條款,如HIPAA(健康保險便攜性和責(zé)任法案)等,從而確保個人信息安全,在數(shù)據(jù)預(yù)處理的過程中,需要對數(shù)據(jù)進(jìn)行清洗,完成歸一化處理。完成編碼轉(zhuǎn)換后,方可對缺失值進(jìn)行處理。在進(jìn)行異常值檢測的過程中,可以使用插值方法填充缺失值,通過Z-score標(biāo)準(zhǔn)化方法來處理異常值,或者采用獨熱編碼將分類變量轉(zhuǎn)換為數(shù)值型變量。特征選擇也是預(yù)處理的關(guān)鍵環(huán)節(jié),目的是剔除冗余特征,保留對建模有實際意義的特征,以減少過擬合風(fēng)險并提高模型性能??紤]到深度學(xué)習(xí)模型對數(shù)據(jù)量的依賴性,需要進(jìn)行數(shù)據(jù)增強。尤其是在醫(yī)療數(shù)據(jù)不足的情況下,利用數(shù)據(jù)增強技術(shù),如圖像旋轉(zhuǎn)、平移、裁剪、顏色調(diào)整等,增加數(shù)據(jù)多樣性,進(jìn)而提高模型泛化能力。最后,經(jīng)過預(yù)處理的數(shù)據(jù)將被劃分為訓(xùn)練集和測試集,通常會采取隨機抽樣或分層抽樣的方式進(jìn)行劃分,以確保數(shù)據(jù)集之間分布的一致性,訓(xùn)練集用于模型的學(xué)習(xí),而測試集則用來評估模型的泛化能力[3]。
2.3 深度學(xué)習(xí)模型選擇
考慮到公共衛(wèi)生監(jiān)測數(shù)據(jù)往往具有時間性特征,傳統(tǒng)的全連接神經(jīng)網(wǎng)絡(luò)(FCNN)對于捕捉這種時序關(guān)系不夠高效。因此,在深度學(xué)習(xí)模型選擇中應(yīng)側(cè)重考慮卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及其變體。
CNN在圖像識別和處理領(lǐng)域表現(xiàn)出色,強大的空間特征提取能力可用于挖掘時間序列數(shù)據(jù)中的局部特征,該能力的運行機理為借助卷積層功能,從原始數(shù)據(jù)層中提取出具有價值的核心數(shù)據(jù)。并通過卷積層降低這些表示的空間尺寸,增強了模型對位置偏差的預(yù)測性。RNN設(shè)計則可以對序列數(shù)據(jù)進(jìn)行處理,能夠在當(dāng)前輸入和先前狀態(tài)之間建立連接,但標(biāo)準(zhǔn)RNN容易出現(xiàn)梯度消失或者爆炸的問題,因此需要進(jìn)行有效改進(jìn)。其中長短期記憶網(wǎng)絡(luò)(LSTM)作為RNN的一個改進(jìn)型,能夠?qū)Χ鄠€們控制機制進(jìn)行引進(jìn),使得模型可以在更長的序列中維持信息并捕獲遠(yuǎn)距離依賴關(guān)系。在利用LSTM網(wǎng)絡(luò)來捕捉和預(yù)測流行病數(shù)據(jù)中的長期依賴關(guān)系過程中,將數(shù)據(jù)集分為若干時間窗口,然后每個時間窗口的數(shù)據(jù)被輸入到LSTM網(wǎng)絡(luò),最后LSTM的輸出將被用來預(yù)測未來的趨勢或進(jìn)行分類任務(wù)。
2.4 模型訓(xùn)練與驗證
模型訓(xùn)練和驗證結(jié)果能夠直接影響所構(gòu)建的深度學(xué)習(xí)系統(tǒng)的性能和可靠性,在驗證的過程中,需要從疾控中心收集大量健康記錄,并將流行病數(shù)據(jù)中分割出一部分作為訓(xùn)練集,該訓(xùn)練集將用于模型的初始學(xué)習(xí)過程,剩余的數(shù)據(jù)會被用作測試集,以評估模型在未知數(shù)據(jù)上的表現(xiàn)。為減少過擬合的風(fēng)險并提高模型的泛化能力,可實施交叉驗證策略。特別是K折交叉驗證,其可以將整個訓(xùn)練集會分為K個小組(folds),模型將輪流使用其中的K-1組進(jìn)行訓(xùn)練,并用剩下的一組進(jìn)行驗證,這一過程將重復(fù)K次,每次都換一個不同的驗證組,以此來保證評估結(jié)果的穩(wěn)定性和可靠性。
在模型訓(xùn)練過程中,可將準(zhǔn)確率、召回率、F1分?jǐn)?shù)等作為評估指標(biāo),這些指標(biāo)可以幫助技術(shù)人員對模型在正確分類和檢測疾病爆發(fā)方面的表現(xiàn)進(jìn)行評估,同時技術(shù)人員也需要對模型的學(xué)習(xí)曲線是否平衡給予關(guān)注,即沒有過擬合(在訓(xùn)練數(shù)據(jù)上表現(xiàn)很好但在測試數(shù)據(jù)上表現(xiàn)不佳)或欠擬合(在訓(xùn)練和測試數(shù)據(jù)上都表現(xiàn)不佳)的情況。通過反復(fù)的實驗調(diào)整和參數(shù)優(yōu)化確定最終的模型配置,并且在全量的測試集上進(jìn)行最終的評估。
2.5 數(shù)據(jù)庫設(shè)計
數(shù)據(jù)庫設(shè)計是確保數(shù)據(jù)結(jié)構(gòu)得到合理組織、存儲和高效檢索的關(guān)鍵。數(shù)據(jù)庫不僅需要存儲患者數(shù)據(jù)、流行病學(xué)調(diào)查數(shù)據(jù)、實驗室檢測結(jié)果等,還需存儲基因組數(shù)據(jù)、地理信息系統(tǒng)(GIS)數(shù)據(jù)以及實時監(jiān)控數(shù)據(jù)。鑒于系統(tǒng)涉及的數(shù)據(jù)多樣性和復(fù)雜查詢需求??梢圆捎肗oSQL數(shù)據(jù)庫如MongoDB提供靈活的文檔結(jié)構(gòu),以此來適應(yīng)不同類型數(shù)據(jù)的存儲與快速變化的查詢需求,對于高度事務(wù)性的數(shù)據(jù),如患者的基本信息和診斷結(jié)果,采用SQL數(shù)據(jù)庫如PostgreSQL將更加適合[4]。
2.6 用戶界面設(shè)計
為了確保采用深度學(xué)習(xí)優(yōu)化后的電子信息系統(tǒng)用戶界面既實用又高效,技術(shù)人員可以采用多步驟的設(shè)計方法,首先利用用戶研究方法,包括訪談、問卷調(diào)查及現(xiàn)場觀察,收集疾控中心工作人員的操作習(xí)慣和任務(wù)流程,從而揭示關(guān)鍵的用戶需求和界面設(shè)計的核心功能點,然后依據(jù)收集的數(shù)據(jù),運用用戶體驗(UX)設(shè)計原則創(chuàng)建初步的線框圖,確定信息架構(gòu)和界面布局,通過快速迭代設(shè)計方法進(jìn)行多個設(shè)計周期,不斷地測試和修改線框圖,以達(dá)到最佳的用戶體驗。
在設(shè)計界面時,要求確保所有的信息顯示清晰,并保證按鈕和圖標(biāo)標(biāo)記直觀,工作人員能夠一目了然地找到他們需要的功能。保持顏色配色、字體大小、按鈕風(fēng)格等界面元素的一致性,以減少用戶的學(xué)習(xí)成本。界面可以適配不同尺寸的屏幕,確保從臺式機到平板電腦,再到智能手機等各種設(shè)備都能夠良好展現(xiàn)。此外,需要提供明確的反饋機制,當(dāng)用戶完成某項操作時,系統(tǒng)能夠通過視覺或聲音提示給予反饋,提升用戶的操作信心。
2.7 安全性與隱私性保護(hù)策略
可以借助身份驗證和訪問控制機制,如多因素認(rèn)證(MFA),以確保只有授權(quán)用戶才能訪問系統(tǒng)資源,或者應(yīng)用基于角色的訪問控制(RBAC),可以限定不同級別的用戶對敏感數(shù)據(jù)的操作權(quán)限,進(jìn)一步降低非法訪問的風(fēng)險。
此外,可以廣泛應(yīng)用加密技術(shù),以保護(hù)存儲和傳輸過程中的數(shù)據(jù),對于靜態(tài)數(shù)據(jù)而言,技術(shù)人員可以借助AES等標(biāo)準(zhǔn)加密算法進(jìn)行磁盤加密。在數(shù)據(jù)傳輸過程中則可以利用TLS/SSL協(xié)議,確保數(shù)據(jù)在網(wǎng)絡(luò)中的安全,針對數(shù)據(jù)庫中的PHI,可實施字段級加密或令牌化處理,在數(shù)據(jù)泄露時最大限度地減少信息暴露。
3 優(yōu)化效果評估
3.1 系統(tǒng)性能評估
系統(tǒng)性能評估指標(biāo)包括準(zhǔn)確度、響應(yīng)時間和可靠性。準(zhǔn)確度是對系統(tǒng)執(zhí)行任務(wù)的準(zhǔn)確率進(jìn)行評估,需要通過比較系統(tǒng)輸出與事先驗證過的真實值來計算準(zhǔn)確度指標(biāo)。響應(yīng)時間指系統(tǒng)接收輸入到產(chǎn)生輸出所需的時間,該指標(biāo)通常采用時間測試來衡量,包括數(shù)據(jù)處理、模型推理以及結(jié)果展示的總時間??煽啃灾饕u價系統(tǒng)在各種條件下持續(xù)正常運行的能力。以某電子信息系統(tǒng)為例,對系統(tǒng)優(yōu)化前與優(yōu)化后的性能指標(biāo)改善情況進(jìn)行對比,詳細(xì)內(nèi)容如表1所示。
從表1可看出,優(yōu)化后系統(tǒng)準(zhǔn)確度提升到93%,系統(tǒng)響應(yīng)時間縮短到750ms,顯著快于系統(tǒng)優(yōu)化前的1200ms,可看出系統(tǒng)經(jīng)過優(yōu)化后能夠更快地處理信息,此外優(yōu)化后系統(tǒng)B的故障率降低至0.5%,說明優(yōu)化后系統(tǒng)利用更健壯的模型設(shè)計和更好的錯誤處理機制使系統(tǒng)變得更加穩(wěn)定。
3.2 用戶體驗評估
用戶體驗評估涵蓋便捷性、信息呈現(xiàn)方式以及用戶滿意度調(diào)查三個方面,某疾控中心在優(yōu)化電子信息系統(tǒng)上線運行一個月后,對50名用戶進(jìn)行了滿意度調(diào)查,以衡量使用便捷性、信息呈現(xiàn)方式及總體滿意度,評估采用了1到5的評分標(biāo)準(zhǔn),其中,1表示非常不滿意,5表示非常滿意,詳細(xì)內(nèi)容如表2所示:
從表2中可以看出,在使用便捷性方面,通過優(yōu)化界面設(shè)計和用戶交互流程,實現(xiàn)了從2.8到4.2的提升,信息呈現(xiàn)方式經(jīng)過優(yōu)化,以更直觀的圖表和清晰的導(dǎo)航功能提高了用戶體驗,得分從3.0提升至4.5,同時總體的用戶滿意度也顯著提高,從3.1增長到4.4,以上數(shù)據(jù)表明優(yōu)化后系統(tǒng)用戶體驗整體幅度提升,表明優(yōu)化措施的有效性。
4 結(jié)束語
綜上所述,利用深度學(xué)習(xí)技術(shù)對疾控中心電子信息系統(tǒng)進(jìn)行優(yōu)化,能夠進(jìn)一步強化對數(shù)據(jù)處理的效率,優(yōu)化系統(tǒng)性能,提高準(zhǔn)確度,減少系統(tǒng)故障出現(xiàn)概率,同時也能夠進(jìn)一步增強用戶的體驗程度。為此需要進(jìn)一步提高其重視,將深度學(xué)習(xí)技術(shù)理論應(yīng)用于實際操作環(huán)境中,以此建立更加安全高效的智能化信息系統(tǒng),最終促進(jìn)我國公共服務(wù)質(zhì)量的提升。
參考文獻(xiàn)
[1] 張軍凱,李欣,韓俊先,等.深度學(xué)習(xí)算法下的采摘機器人系統(tǒng)優(yōu)化研究[J].農(nóng)機化研究,2024,46(4):58-62.
[2] 梁沁雯.基于深度強化學(xué)習(xí)的綜合能源系統(tǒng)優(yōu)化方法研究[D].北京:華北電力大學(xué)(北京),2023.
[3] 吳玉寒.基于深度學(xué)習(xí)場景生成的含電氫轉(zhuǎn)換綜合能源系統(tǒng)優(yōu)化調(diào)度研究[D].濟(jì)南:山東大學(xué),2023.
[4] 卜凡金.基于深度強化學(xué)習(xí)的海島綜合能源系統(tǒng)優(yōu)化調(diào)度研究[D].吉林:東北電力大學(xué),2023.