亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向醫(yī)院電子檔案用戶的畫像技術(shù)及精準(zhǔn)服務(wù)應(yīng)用策略

        2021-11-28 03:52:52吳蔚
        中國衛(wèi)生產(chǎn)業(yè) 2021年21期
        關(guān)鍵詞:畫像特征用戶

        吳蔚

        福建醫(yī)科大學(xué)附屬第一醫(yī)院黨委宣傳部,福建福州 350000

        醫(yī)院電子檔案是寶貴資源,我國在該類資源建設(shè)方面仍存在諸多不足:①重保存,輕服務(wù);②檔案資源分散,信息孤島;③數(shù)據(jù)格式不統(tǒng)一;④缺乏與用戶粘合度的個(gè)性服務(wù)[1-5]。

        對于醫(yī)院電子檔案用戶畫像,在國內(nèi)外的相關(guān)研究有:趙建建[6]分析了檔案用戶畫像行為特征,給出運(yùn)用群體用戶畫像指導(dǎo)資源融合和共享的實(shí)現(xiàn)方法,提升了檔案資源的整合效果,但是該方法存在設(shè)計(jì)簡單、智能化程度低等不足。周林興等[7]從用戶畫像角度,剖析智能化檔案信息服務(wù)價(jià)值、運(yùn)行邏輯等,為實(shí)現(xiàn)高質(zhì)量、智能化檔案服務(wù)建設(shè)提供思路,但是其未給出具體的技術(shù)路線。張亞兵[8]闡述了用戶畫像的數(shù)據(jù)獲取方法以及畫像模型的框架構(gòu)建,這對于畫像模型的構(gòu)建具有指導(dǎo)意義,但是其未給出具體的技術(shù)實(shí)現(xiàn)路線。此外,基于用戶畫像的個(gè)人隱私安全研究、基于知識圖譜的知識挖掘等成果相繼出現(xiàn)。在國外,醫(yī)院電子檔案信息化建設(shè)水平較高,近幾年來,先后出現(xiàn)了檔案服務(wù)機(jī)器人、智能服務(wù)推薦等一批先進(jìn)的研究成果。

        該文從研究方案角度,對用戶畫像及其應(yīng)用進(jìn)行詳細(xì)闡述,旨在為新一代信息背景下的我國電子檔案信息化建設(shè)提供參考。

        1 檔案用戶畫像概念

        用戶畫像的概念最早是由Alan Copper[9]提出,其實(shí)質(zhì)是綜合用戶特征、行為和偏好,對真實(shí)用戶或用戶群體的虛擬刻畫。近些年,用戶畫像受到了人們的極大關(guān)注,目前關(guān)于用戶畫像的概念界定、構(gòu)成要素和構(gòu)建技術(shù)基本成熟,它被廣泛應(yīng)用于電子商務(wù)、廣告推薦、銀行客戶管理、學(xué)校師生管理等活動。我國檔案智能信息管理中的難題是如何準(zhǔn)確地捕獲用戶的需求,而對檔案用戶實(shí)施精準(zhǔn)的畫像能夠?yàn)榻鉀Q這一難題提供有效的技術(shù)手段。圖1 是醫(yī)生用戶群體的畫像的可視化展示實(shí)例,畫像中特征關(guān)鍵字的大小體現(xiàn)了用戶關(guān)注的重要程度,即字體越大越能體現(xiàn)該用戶群表現(xiàn)出的特征或行為。

        圖1 醫(yī)生用戶群體的畫像可視化示例

        2 畫像技術(shù)原理

        檔案用戶畫像目標(biāo)是為了描述人、理解人,這是畫像最大的目標(biāo),在為目標(biāo)對象畫像時(shí),常用的描述方式可以分為兩種:①非形式化的手段,例如醫(yī)院管理活動中形成的大數(shù)據(jù)中的語音、文本,都是非形式化的;②形式化的手段,例如醫(yī)院患者就醫(yī)卡、患者的病案、醫(yī)務(wù)人員的信息等,當(dāng)面對這些海量復(fù)雜的信息時(shí),需要對它們進(jìn)行一系列的信息抽取、數(shù)據(jù)標(biāo)準(zhǔn)化和規(guī)則化、邏輯關(guān)系表達(dá)和抽象、知識挖掘等處理及科學(xué)計(jì)算,建立一套標(biāo)準(zhǔn)的知識體系。與此同時(shí),需要一套數(shù)據(jù)化、符號化、形式化的方式來描述知識體系。因此,在進(jìn)行用戶畫像研究時(shí),需要使用到大數(shù)據(jù)的統(tǒng)一表示及數(shù)據(jù)標(biāo)準(zhǔn)處理技術(shù)、信息抽取與多分類技術(shù)、數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)技術(shù)以及評估預(yù)測模型建立技術(shù)等[10]。在使用和發(fā)展這些技術(shù)時(shí),目前已有圖模型表示與建模方法、基于注意力的數(shù)據(jù)分類方法、支持向量機(jī)、深度學(xué)習(xí)算法等都為畫像的研究提供了良好的條件,也有著豐富的理論依據(jù)。深度融合大數(shù)據(jù)與機(jī)器學(xué)習(xí)算法,形成新型人工智能應(yīng)用,從而在對海量教育數(shù)據(jù)分析的基礎(chǔ)上,快速地實(shí)現(xiàn)數(shù)據(jù)間的知識挖掘和預(yù)測。針對教育原始大數(shù)據(jù),對奇異值分解、主成分分析經(jīng)典方法進(jìn)行集成和創(chuàng)新研究,以此提高算法對剪裁教育海量數(shù)據(jù)的無效特征、降低數(shù)據(jù)維度的計(jì)算能力;選擇適用于多模態(tài)檔案大數(shù)據(jù)的分類和方法,適時(shí)運(yùn)用深度學(xué)習(xí)算法,以迭代演化的形式,最終形成完整的大數(shù)據(jù)智能處理體系。以此不斷地提高多模態(tài)數(shù)據(jù)統(tǒng)一表示模型的質(zhì)量,進(jìn)而提升面向檔案大數(shù)據(jù)的分析與知識挖掘能力。項(xiàng)目技術(shù)原理的直觀描述見圖2。

        圖2 用戶畫像技術(shù)原理

        針對醫(yī)院電子檔案用戶畫像技術(shù)及其應(yīng)用研究,重點(diǎn)需要解決面向大數(shù)據(jù)的異構(gòu)多源大數(shù)據(jù)統(tǒng)一表示及數(shù)據(jù)標(biāo)準(zhǔn)化處理技術(shù)、檔案用戶畫像信息抽取與多分類關(guān)鍵技術(shù)以及用戶的綜合評估預(yù)測模型構(gòu)建技術(shù)的問題,其中采用圖模型表示多元關(guān)系及建立適用于檔案用戶畫像的知識圖譜將是檔案信息智能化建設(shè)任務(wù)中非常有特色的一項(xiàng)工作[11]。

        3 畫像技術(shù)及其應(yīng)用研究策略

        為構(gòu)建基于醫(yī)院電子檔案用戶的畫像模型及其應(yīng)用系統(tǒng),需要著重開展的研究內(nèi)容為:①多源異構(gòu)多模態(tài)數(shù)據(jù)的統(tǒng)一表示及數(shù)據(jù)標(biāo)準(zhǔn)化技術(shù)研究;②基于醫(yī)院大數(shù)據(jù)的用戶畫像信息抽取與多分類算法研究;③數(shù)據(jù)可視化技術(shù)研究;④用戶綜合評估預(yù)測技術(shù)研究[12]。

        按照數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范建立、數(shù)據(jù)采集、科學(xué)建模過程、用戶像及應(yīng)用的研究思路,下面對4 個(gè)研究階段所采取的總體技術(shù)路線作簡要介紹。

        ①構(gòu)建檔案大數(shù)據(jù)應(yīng)用標(biāo)準(zhǔn)。根據(jù)我國大數(shù)據(jù)特點(diǎn),依據(jù)大數(shù)據(jù)應(yīng)用要求,建立完整的數(shù)據(jù)存儲、交互、傳輸?shù)纫幌盗袛?shù)據(jù)處理的規(guī)范體系。

        ②數(shù)據(jù)采集處理。構(gòu)建多種類型數(shù)據(jù)的采集接口,然后利用SFFT、插值補(bǔ)償法等技術(shù),對原始數(shù)據(jù)做清洗、過濾、校正、補(bǔ)全等數(shù)據(jù)質(zhì)量檢測和優(yōu)化操作。接著嚴(yán)格按照檔案大數(shù)據(jù)的規(guī)范標(biāo)準(zhǔn),對數(shù)據(jù)進(jìn)一步的格式規(guī)范、脫敏處理、安全保護(hù)處理。最后形成多種主題的數(shù)據(jù)集,為上層的模型構(gòu)建與應(yīng)用提供服務(wù)。

        ③科學(xué)建模過程。通過系統(tǒng)化數(shù)據(jù)采集,采用科學(xué)方法建立數(shù)據(jù)模型,包括語義分析、詞匯判斷、實(shí)體抽取、關(guān)聯(lián)挖掘、實(shí)體連接等操作,最終建立用戶畫像知識圖譜和多主題數(shù)據(jù)模型。

        ④用戶畫像模型與應(yīng)用。在第2 步基礎(chǔ)上,進(jìn)一步對提取低層次數(shù)據(jù)特征,選擇高層次特征,進(jìn)而構(gòu)建多維結(jié)構(gòu)模型,據(jù)此研構(gòu)用戶畫像。同時(shí),根據(jù)病例分析、醫(yī)生技能評估、個(gè)性化服務(wù)推薦等功能需求,構(gòu)建多個(gè)主題應(yīng)用模型,并把模型遷移至實(shí)際應(yīng)用中。具體的研究總體策略見圖3。

        圖3 用戶畫像技術(shù)及精準(zhǔn)服務(wù)應(yīng)用研究策略

        4 關(guān)鍵問題分析

        (1)用戶畫像分類體系的細(xì)分。給誰畫像,畫什么像,為什么畫這個(gè)像,畫像的分類和預(yù)期結(jié)果是怎么樣的,這些問題都不是系統(tǒng)完全自動產(chǎn)生的。當(dāng)然,在大數(shù)據(jù)足夠多的程度下,可形成客戶的關(guān)鍵信息畫像,但是現(xiàn)在應(yīng)用更為廣泛的是人工+系統(tǒng)結(jié)合的用戶畫像,即人工設(shè)計(jì)畫像的方向和體系。這樣的優(yōu)勢是體系化和結(jié)構(gòu)化,應(yīng)用性更強(qiáng),比如要進(jìn)行檔案內(nèi)容敏感畫像、借閱時(shí)間敏感畫像等。即應(yīng)當(dāng)對分類體系進(jìn)一步細(xì)分,獲取用戶敏感的主要對象,基于這些分析后,可以把細(xì)分后的敏感類別單獨(dú)分析,這在一定程度上能夠幫助建立完整的檔案敏感體系[13]。

        (2)畫像特征的重要性區(qū)分。當(dāng)確立了畫像的方向,即確定了需要的數(shù)據(jù)信息和力度??蛻舢嬒竦臄?shù)據(jù)要做到真實(shí)、可關(guān)聯(lián)應(yīng)用、存在一定的周期可供偏好類模型構(gòu)建。在眾多屬性中,各個(gè)屬性的重要性必然有差別,應(yīng)充分使用數(shù)據(jù)挖掘方法,發(fā)掘電子檔案中的屬性。從用戶的角度出發(fā),有多個(gè)角度需要綜合考慮[14]。

        (3)特征處理與特征選擇。在特征處理階段,需要篩選部分主要特征數(shù)據(jù),對于單表數(shù)據(jù),重點(diǎn)工作是數(shù)據(jù)缺失處理、冗余剔除、特征數(shù)據(jù)編號等;對于多表數(shù)據(jù),主要工作是求和合并計(jì)數(shù)特征、最大值合并定性特征、生成新的特征屬性、多表連接等[15]。當(dāng)數(shù)據(jù)預(yù)處理完成后,需要選擇有意義的特征輸入機(jī)器學(xué)習(xí)的算法和模型進(jìn)行訓(xùn)練。根據(jù)特征選擇的形式又可以將特征選擇方法主要分為Filter 和Wrapper 兩種,但該文重點(diǎn)推薦使用以分類錯(cuò)誤率為評價(jià)函數(shù)的前向浮動選擇SFFS 算法來進(jìn)行特征選擇。在此基礎(chǔ)上,可選用SFFS 選出來的avg_score 得分最高的特征集,此特征集可被作為檔案用戶畫像的最終特征源[16]。

        (4)用戶標(biāo)簽及其關(guān)系挖掘。檔案用戶標(biāo)簽是指用戶對于檔案的注意力,例如病檔診斷報(bào)告敏感用戶是指醫(yī)生用戶對于診斷結(jié)果關(guān)注度較高的人群,因此,對于該類用戶敏感度研究,是通過分析用戶多種多樣的查詢行為,如查詢次數(shù)、醫(yī)生用戶職稱情況等,反映該類用戶對病案診斷結(jié)果的敏感程度的差別,并使用數(shù)據(jù)挖掘技術(shù)的量化手段,構(gòu)建預(yù)測模型,對診斷結(jié)果敏感特性進(jìn)行刻畫[17]。在具體研究過程中,對此可以通過構(gòu)建模型來分析,可從如下3 個(gè)方面進(jìn)行考慮:①選擇適當(dāng)?shù)哪P?。在得到好的屬性后,針對?shù)據(jù)的特征,如離散值眾多等特點(diǎn),選用適當(dāng)?shù)哪P瓦M(jìn)行預(yù)測;在比較各個(gè)模型的優(yōu)劣后,選擇較為合適的模型進(jìn)行細(xì)致的調(diào)參,這是有效辨別敏感用戶的另一種方式[18]。②多個(gè)維度分析建模。可以從多個(gè)角度入手來分析,并建立模型,例如抽取用戶檔案使用時(shí)間進(jìn)行研究,構(gòu)建閱讀時(shí)間分析模型,從中分析用戶的行為。③不同模型的集成。不同模型具有不同的偏好,當(dāng)從多個(gè)角度用不同的模型對問題進(jìn)行預(yù)測,由此就可以得到多個(gè)具有不同偏好、對結(jié)果具有不同偏差的模型,利用這些模型,并讓各模型互相糾正,這可以大幅提升用戶標(biāo)簽及其關(guān)系的挖掘精度,從而有利于提高用戶畫像模型的質(zhì)量[19]。

        5 結(jié)論

        該文從當(dāng)代信息技術(shù)視野下,以我國醫(yī)院電子檔案管理和用戶需求為出發(fā)點(diǎn),面向未來,重點(diǎn)闡述了醫(yī)院電子檔案用戶畫像的重要性和必要性,進(jìn)而簡要概述了用戶畫像的基本概念和相關(guān)的構(gòu)建技術(shù),接著詳細(xì)論述用戶畫像技術(shù)及其精準(zhǔn)服務(wù)的建設(shè)路線,并給出各個(gè)階段需要完成的技術(shù)工作內(nèi)容,最后重點(diǎn)闡述了檔案畫像技術(shù)及應(yīng)用中的關(guān)鍵問題。

        綜上所述,在該文提出的用戶像技術(shù)及其應(yīng)用研究策略中,使用的技術(shù)新穎,采用信息類項(xiàng)目的工程化建設(shè)流程和框架,可操作性強(qiáng)。文中提出的方法可為當(dāng)代醫(yī)院電子檔案智能化信息管理系統(tǒng)的構(gòu)建提供借鑒。

        猜你喜歡
        畫像特征用戶
        威猛的畫像
        “00后”畫像
        畫像
        如何表達(dá)“特征”
        不忠誠的四個(gè)特征
        抓住特征巧觀察
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        手机免费日韩中文字幕| 精品国产乱码久久久久久1区2区| 国产精品9999久久久久| 中日韩欧美在线观看| 国产亚洲午夜高清国产拍精品不卡 | 日产国产精品亚洲系列| 亚洲欧美一区二区三区国产精| 放荡人妻一区二区三区| 久久中文字幕一区二区| 国产成人无码a在线观看不卡| 日本一卡2卡3卡4卡无卡免费网站| 国产露脸精品产三级国产av| av草草久久久久久久久久久| 白白白色视频在线观看播放| 亚洲精品一区三区三区在线| 国产超碰人人爽人人做人人添| 99精品国产兔费观看久久99| 综合无码综合网站| 中文字幕一区二区网址| 久久99精品久久久久久清纯| 国产精品亚洲二区在线观看| 中文AV怡红院| 亚洲av综合日韩精品久久| 亚洲av无码乱码国产精品久久| 又粗又硬又黄又爽的免费视频| 精品第一页| 日本激情一区二区三区| 亚洲国产精品久久精品 | 久久久精品国产免费看| 免费a级毛片无码免费视频120软件| 国产自国产在线观看免费观看| 欧美 亚洲 国产 日韩 综AⅤ| av免费一区在线播放| 亚洲美女自拍偷拍视频| 国产精品乱码一区二区三区| 欧美色色视频| 国产精品一区二区三区三| 国产卡一卡二卡3卡4乱码| 国产精品国语对白露脸在线播放| 久久se精品一区二区国产| 黄片免费观看视频播放|