田悍
摘 要隨著醫(yī)療技術(shù)的不斷發(fā)展和更新,新的技術(shù)和成果不斷涌現(xiàn),醫(yī)護(hù)工作者發(fā)表和參閱醫(yī)學(xué)論文已然成為展示科研成果和獲取最新技術(shù)的重要途徑。對于醫(yī)院,論文可以從一個側(cè)面反映出醫(yī)院的綜合實力,同時也是評價醫(yī)院科研能力和學(xué)術(shù)水平的重要指標(biāo)。作為醫(yī)院科教管理部門,科教科在職工考核、職稱晉升等工作中都需要考察論文的發(fā)表情況,并且還需要時刻掌握全院發(fā)表論文的數(shù)據(jù),并以此作出統(tǒng)計和分析,把結(jié)果作為證明醫(yī)院科研能力和發(fā)展現(xiàn)狀的依據(jù)。
【關(guān)鍵詞】網(wǎng)絡(luò)數(shù)據(jù) 系統(tǒng)
1 醫(yī)院學(xué)術(shù)論文管理情況現(xiàn)狀
隨著計算機的廣泛應(yīng)用,絕大多數(shù)醫(yī)院管理論文的方法已經(jīng)從手工登記轉(zhuǎn)變?yōu)槭褂糜嬎銠C軟件管理,其中最為普及的是使用Excel軟件制作電子表格登記論文資料。這種方法可以較好地幫助工作人員解決查找和數(shù)據(jù)統(tǒng)計的問題。但是,數(shù)據(jù)的收集需要做大量的前期工作,由論文作者上報至科教科,再由科教科工作人員進(jìn)行手工錄入制成Excel表格,需要生成報表和統(tǒng)計數(shù)據(jù)的時候也必須手動操作。
大量繁瑣枯燥的手工錄入工作制成的Excel的本地文件,卻并不能較好的實現(xiàn)數(shù)據(jù)共享。因此,隨著網(wǎng)絡(luò)的普及,部分醫(yī)院建立了基于Web的論文管理系統(tǒng)。依靠B/S架構(gòu)的Web論文管理系統(tǒng),可以很好的解決數(shù)據(jù)共享的問題。相比于使用Excel文件記錄論文數(shù)據(jù),網(wǎng)絡(luò)論文管理系統(tǒng)的優(yōu)點在于只要有可用的網(wǎng)絡(luò),無論何時何地都可以通過手機或個人計算機進(jìn)入系統(tǒng),進(jìn)行論文上報、登記、查詢操作,使論文管理工作不僅限于辦公室。并且依靠計算機技術(shù)也可以一定程度的簡化手工工作,以鼠標(biāo)點選、自動生成等方式優(yōu)化錄入、統(tǒng)計分析的過程。
2 基于網(wǎng)絡(luò)數(shù)據(jù)抓取的醫(yī)院論文管理系統(tǒng)
基于網(wǎng)絡(luò)數(shù)據(jù)抓取的醫(yī)院論文管理系統(tǒng)保留了普通網(wǎng)絡(luò)論文管理系統(tǒng)的優(yōu)點,著力優(yōu)化和完善最為繁瑣的數(shù)據(jù)錄入過程,從國內(nèi)權(quán)威的論文數(shù)據(jù)庫中直接抓取需要的數(shù)據(jù)存入自己的數(shù)據(jù)庫。
據(jù)了解,國內(nèi)絕大部分正規(guī)期刊上發(fā)表的文獻(xiàn)在見刊1-2個月后就會被知網(wǎng)、萬方、維普等專業(yè)的文獻(xiàn)數(shù)據(jù)庫收錄。普通用戶通過檢索,可以獲取到論文的題目、發(fā)表刊物、見刊時間、作者姓名、單位、關(guān)鍵詞、摘要等數(shù)據(jù),足以滿足醫(yī)院論文管理系統(tǒng)的需求。只要實現(xiàn)并使用抓取功能獲得需要的數(shù)據(jù),就能大大簡化手工錄入的工作,同時能有效的避免論文漏報、錯報。
2.1 系統(tǒng)的體系結(jié)構(gòu)
目前基于網(wǎng)絡(luò)的系統(tǒng)體系結(jié)構(gòu)主要是C/S(客戶端/服務(wù)器)架構(gòu)與B/S(瀏覽器/服務(wù)器)架構(gòu)。C/S架構(gòu)將大部分的運算放在客戶端處理,要求進(jìn)入系統(tǒng)的計算機安裝相應(yīng)的客戶端程序,對計算機操作系統(tǒng)等條件有特定的要求,限制了用戶群,具有較高的安全性,但是靈活性不強,不便于后期維護(hù)和系統(tǒng)升級。B/S架構(gòu)基于HTTP和TCP/IP協(xié)議,運用服務(wù)器完成大量的運算,將運算結(jié)果傳輸給瀏覽器顯示,用戶只需要使用瀏覽器就可以在個人計算機或智能手機上進(jìn)行操作,不受局域網(wǎng)、軟件和運行平臺的限制,可以實現(xiàn)跨平臺的使用,并且后期維護(hù)成本低,更新方便。
為了系統(tǒng)后期的維護(hù)及功能完善,本系統(tǒng)采用B/S架構(gòu),也更能適應(yīng)目前信息系統(tǒng)的發(fā)展趨勢。
2.2 系統(tǒng)的功能模塊
如圖1所示,本系統(tǒng)分為五個功能模塊,分別為:部門管理模塊、職工管理模塊、論文抓取模塊、論文錄入模塊、查詢統(tǒng)計模塊。
2.2.1 部門管理模塊
部門管理模塊的主要功能是通過添加、修改、刪除操作設(shè)置醫(yī)院部門信息,構(gòu)建一個完整的部門樹形結(jié)構(gòu),以便在查詢統(tǒng)計時可以實現(xiàn)按照部門查詢統(tǒng)計,有助于分析和比較各科室部門論文發(fā)表的情況。
2.2.2 職工管理模塊
職工管理模塊同樣通過數(shù)據(jù)庫的操作建立職工的花名冊,并且將每個職工按照實際情況分配到科室和部門,如此便建立了論文、作者、部門的關(guān)系。
2.2.3 論文數(shù)據(jù)抓取模塊
論文數(shù)據(jù)抓取模塊使用網(wǎng)絡(luò)數(shù)據(jù)抓取的方法,通過請求URL、對返回數(shù)據(jù)進(jìn)行分析、提取論文相關(guān)數(shù)據(jù),將其存入論文信息表,并與醫(yī)院職工進(jìn)行關(guān)聯(lián)。
2.2.4 論文數(shù)據(jù)錄入模塊
本模塊的主要功能是手工維護(hù)論文數(shù)據(jù),以對論文數(shù)據(jù)的添加、修改、刪除操作,提供是一個查缺補漏渠道,對數(shù)據(jù)抓取過程中出現(xiàn)的不完善數(shù)據(jù)進(jìn)行人工修改。
2.2.5 統(tǒng)計查詢模塊
模塊提供作者姓名查詢、關(guān)鍵詞查詢、期刊查詢、發(fā)表時間查詢、科室查詢等豐富的查詢方法。統(tǒng)計各科室發(fā)表論文數(shù)量、各種期刊上發(fā)表論文的數(shù)量、關(guān)鍵詞相關(guān)論文數(shù)量、任意時間段發(fā)表論文數(shù)量等以供比較分析。
2.3 網(wǎng)絡(luò)數(shù)據(jù)抓取模塊設(shè)計
數(shù)據(jù)抓取功能是本系統(tǒng)的特色和亮點,其設(shè)計原理類似于簡化的網(wǎng)絡(luò)爬蟲,抓取數(shù)據(jù)更具針對性,抓取范圍僅限于較權(quán)威的論文期刊數(shù)據(jù)庫。以下介紹設(shè)計思路。
2.3.1 抓取模塊涉及的數(shù)據(jù)庫設(shè)計
為了能在網(wǎng)絡(luò)上抓取數(shù)據(jù),需要一個表存放URL信息,其中包括的主要字段有URL、URL的MD5編碼、訪問狀態(tài)、請求的頁面類型等。
另外需要一個存放論文信息的表存放抓取到的數(shù)據(jù),包含題目、刊名、發(fā)表時間、作者、關(guān)鍵詞、摘要等字段。
2.3.2 抓取數(shù)據(jù)的主要步驟
首先程序從URL表中取出一條訪問狀態(tài)為未訪問的數(shù)據(jù),請求此URL并接收返回數(shù)據(jù),根據(jù)URL請求的頁面類型做提取論數(shù)據(jù)或者提取URL數(shù)據(jù)的操作。
對于返回的是論文頁面,需要提取論文詳細(xì)信息,然后到論文信息表中查找,判斷是否為已經(jīng)抓取過的論文數(shù)據(jù),若已抓取,則標(biāo)記請求的URL為已訪問,然后進(jìn)行下一個URL的請求。否則將論文數(shù)據(jù)整理并入庫,將作者與職工關(guān)聯(lián),之后請求下一個URL。
若非論文詳情頁面,則需分離提取頁面中的URL,將提取到的URL逐個進(jìn)行MD5編碼后到URL表中查重,將非重數(shù)據(jù)標(biāo)記為未訪問然后入庫。
3 實現(xiàn)本系統(tǒng)的意義
基于網(wǎng)絡(luò)數(shù)據(jù)抓取的醫(yī)院論文管理系統(tǒng)可以有效地減少論文管理過程中的繁瑣工作,簡化管理流程,為管理人員減負(fù)。同時,得益于系統(tǒng)采用B/S架構(gòu),可以實現(xiàn)跨平臺、跨區(qū)域的管理。抓取來自論文數(shù)據(jù)庫的數(shù)據(jù)相對全面,以此數(shù)據(jù)做出的分析統(tǒng)計能夠更加有效的指導(dǎo)醫(yī)院科研的發(fā)展方向和重心。設(shè)計并實現(xiàn)本系統(tǒng),有效地提高了科教管理工作效率。
作者單位
貴州省骨科醫(yī)院 貴州省貴陽市 550007