馬 利
(中國鐵路北京局集團(tuán)有限公司 貨運(yùn)部,北京 100860)
鐵路保價(jià)和貨物損失處理工作是貨運(yùn)服務(wù)的窗口,事關(guān)運(yùn)輸合同覆行、企業(yè)權(quán)益,以及鐵路貨運(yùn)服務(wù)形象。鐵路保價(jià)運(yùn)輸信息化是適應(yīng)鐵路現(xiàn)代化企業(yè)轉(zhuǎn)型發(fā)展、強(qiáng)化保價(jià)專業(yè)化管理、加強(qiáng)決策分析支持的重要手段。在鐵路運(yùn)輸逐步向市場化管理轉(zhuǎn)型中,提升鐵路保價(jià)運(yùn)輸管理水平,為客戶提供包括互聯(lián)網(wǎng)在內(nèi)的多種服務(wù)方式的貨運(yùn)全流程服務(wù),是鐵路貨運(yùn)信息化的一項(xiàng)重要任務(wù)。鐵路保價(jià)運(yùn)輸管理系統(tǒng)(以下簡稱“鐵路保價(jià)系統(tǒng)”)作為鐵路保價(jià)運(yùn)輸工作的重要組成部分,在保價(jià)運(yùn)輸精細(xì)化管理,提高鐵路貨損辦賠效率,為客戶提供高效便捷的快速理賠服務(wù)等方面,發(fā)揮著日益重要的作用。
鐵路保價(jià)系統(tǒng)是集成管理保價(jià)運(yùn)輸各業(yè)務(wù)功能的信息系統(tǒng),實(shí)現(xiàn)了自承運(yùn)保價(jià)時(shí)起至支付賠款時(shí)止的全業(yè)務(wù)過程的管控。作為鐵路保價(jià)運(yùn)輸工作的重要組成部分,鐵路保價(jià)系統(tǒng)歷經(jīng)多年建設(shè)及升級改造,目前已在全路所有開展貨運(yùn)業(yè)務(wù)的車站、營業(yè)網(wǎng)點(diǎn)實(shí)現(xiàn)全覆蓋應(yīng)用。
自2018年以來,根據(jù)鐵路向現(xiàn)代物流轉(zhuǎn)型發(fā)展的新要求,中國國家鐵路集團(tuán)有限公司(以下簡稱“國鐵集團(tuán)”)重新修訂了《鐵路保價(jià)運(yùn)輸管理辦法》《鐵路貨物損失處理規(guī)則》《鐵路貨物損失處理作業(yè)標(biāo)準(zhǔn)》等規(guī)章制度[1-3],推廣電子施封鎖等新設(shè)備研發(fā)應(yīng)用,持續(xù)提升鐵路保價(jià)運(yùn)輸管理水平。由于鐵路保價(jià)系統(tǒng)開發(fā)時(shí)間較早,數(shù)據(jù)采集功能局限于當(dāng)時(shí)的技術(shù)水平,基本是基于紙質(zhì)文字電子化、結(jié)構(gòu)化保存的思路設(shè)計(jì)開發(fā),對于需要多人簽字的合同、協(xié)議等資料,尚不支持以圖像、文件等非結(jié)構(gòu)化形式保存。因此,從強(qiáng)化內(nèi)部貨運(yùn)管理和適應(yīng)外部市場需求的角度,推進(jìn)鐵路保價(jià)系統(tǒng)對非結(jié)構(gòu)化數(shù)據(jù)存儲的建設(shè)升級,完善保價(jià)綜合服務(wù)平臺,加快形成優(yōu)質(zhì)、高效的鐵路保價(jià)運(yùn)輸服務(wù)體系,具有重要的現(xiàn)實(shí)意義。
近年來,隨著信息技術(shù)的飛速發(fā)展,在實(shí)際使用中,鐵路保價(jià)系統(tǒng)在對非結(jié)構(gòu)化數(shù)據(jù)采集及存儲等功能設(shè)計(jì)方面存在與現(xiàn)場作業(yè)需求不匹配,與鐵路保價(jià)高質(zhì)量發(fā)展的要求不適應(yīng)[4]等問題,具體表現(xiàn)如下。
(1)對多樣化的非結(jié)構(gòu)化數(shù)據(jù)采集功能設(shè)計(jì)不足。鐵路保價(jià)系統(tǒng)建設(shè)初期,受制于業(yè)務(wù)需求及信息資源條件,系統(tǒng)主要以實(shí)現(xiàn)紙質(zhì)業(yè)務(wù)數(shù)據(jù)結(jié)構(gòu)化存儲為目的,因而對于非結(jié)構(gòu)化數(shù)據(jù)采集存儲的功能設(shè)計(jì)有限。如鐵路保價(jià)系統(tǒng)在貨物損失案卷處理功能[5-6]僅提供上傳照片功能,在合資地方鐵路收入分成、委托代辦、代理保險(xiǎn)等協(xié)議登記功能中,只提供了結(jié)構(gòu)化的摘要數(shù)據(jù)錄入功能,沒有提供上傳實(shí)際文件存儲的功能,造成系統(tǒng)不能完全保存查看協(xié)議文件內(nèi)容的情況。鐵路保價(jià)系統(tǒng)在現(xiàn)場實(shí)際使用中,對于這些協(xié)議的登記功能使用率不高,也從另一方面反映了這部分功能上的設(shè)計(jì)不足。
(2)現(xiàn)有貨損案卷圖像采集功能繁瑣欠規(guī)范。鐵路保價(jià)系統(tǒng)目前只在貨物損失案卷處理功能中提供上傳照片功能,但在實(shí)際使用過程中,圖片從拍攝到上傳保存要經(jīng)過下面一系列操作才能完成:數(shù)碼相機(jī)(手機(jī))拍照—從相機(jī)中取出存儲卡—將存儲卡插入讀卡器—將讀卡器接入計(jì)算機(jī)—進(jìn)入系統(tǒng)調(diào)取相關(guān)案卷—在此案卷上選擇并加載存儲卡中照片—照片歸入案卷并存入計(jì)算機(jī)中。其操作過程十分繁瑣,并且在使用數(shù)碼相機(jī)(手機(jī))拍照的過程中,由于受拍攝設(shè)備硬件參數(shù)、拍攝光線、拍攝角度及拍攝質(zhì)量等方面影響,拍攝的照片在分辨率、清晰度方面不規(guī)范,也影響貨物損失調(diào)查的準(zhǔn)確性與實(shí)效性。
(3)現(xiàn)有貨損案卷圖像采集后缺少智能化處理。鐵路保價(jià)系統(tǒng)在貨物損失案卷處理功能中,僅能查看上傳照片,不能提取關(guān)鍵信息輔助結(jié)構(gòu)化文字信息錄入,智能化不足。例如,在受理理賠時(shí),系統(tǒng)需要對提賠人的身份證號、銀行卡號等信息進(jìn)行錄入,同時(shí)需對身份證、銀行卡拍照上傳保存。在現(xiàn)有鐵路保價(jià)系統(tǒng)使用中,就要對結(jié)構(gòu)化文字信息數(shù)據(jù)和非結(jié)構(gòu)化圖像信息數(shù)據(jù)進(jìn)行二次錄入操作,步驟繁瑣、容易出錯(cuò),影響作業(yè)效率。
結(jié)合業(yè)務(wù)需求及鐵路保價(jià)系統(tǒng)現(xiàn)場使用情況,針對實(shí)際應(yīng)用中存在的問題,鐵路保價(jià)系統(tǒng)在非結(jié)構(gòu)化數(shù)據(jù)處理中,亟需完善設(shè)計(jì)以下需求。
現(xiàn)有鐵路保價(jià)系統(tǒng)存儲的是結(jié)構(gòu)化數(shù)據(jù),是傳統(tǒng)的“程序+結(jié)構(gòu)化”數(shù)據(jù)庫應(yīng)用模式,很難適應(yīng)大規(guī)模的非結(jié)構(gòu)化數(shù)據(jù)存儲需要。從目前保價(jià)業(yè)務(wù)的需求來看,需要處理的非結(jié)構(gòu)化數(shù)據(jù)應(yīng)包括圖片、影像、文件三大類,圖片、影像類數(shù)據(jù)主要包括貨損處理現(xiàn)場勘察內(nèi)容、提賠單位(人)的身份及企業(yè)資質(zhì)材料、貨物價(jià)值證明等,文件類數(shù)據(jù)主要包括各種協(xié)議合同模板、正式簽署協(xié)議電子文件等。因此,鐵路保價(jià)系統(tǒng)應(yīng)在現(xiàn)有結(jié)構(gòu)化數(shù)據(jù)庫基礎(chǔ)上,引入非結(jié)構(gòu)化數(shù)據(jù)存儲系統(tǒng)用于保存非結(jié)構(gòu)化數(shù)據(jù),同時(shí)將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)建立關(guān)聯(lián),從而使鐵路保價(jià)系統(tǒng)支持的數(shù)據(jù)更完整,功能更完善。擴(kuò)充非結(jié)構(gòu)化數(shù)據(jù)后的數(shù)據(jù)架構(gòu)圖如圖1所示。
目前對貨損采集是通過現(xiàn)場使用各種規(guī)格的數(shù)碼相機(jī)、手機(jī)進(jìn)行拍攝,再將已拍攝好的照片上傳至鐵路保價(jià)系統(tǒng),并不能直接通過系統(tǒng)進(jìn)行拍照,導(dǎo)致拍攝的照片在分辨率、尺寸大小、清晰度等質(zhì)量方面難以保證,亟需規(guī)范鐵路保價(jià)系統(tǒng)中的圖片采集,提高圖片采集的規(guī)范程度和質(zhì)量。目前針對鐵路保價(jià)系統(tǒng)圖片采集,可在對應(yīng)用設(shè)備進(jìn)行二次開發(fā)的基礎(chǔ)上,無縫接入移動(dòng)終端、高拍儀2種設(shè)備。
(1)高拍儀。隨著計(jì)算機(jī)圖像處理、圖像傳感器(CMOS)等技術(shù)的發(fā)展,高拍儀作為穩(wěn)定、高效的辦公設(shè)備應(yīng)運(yùn)而生。高拍儀集傳統(tǒng)辦公設(shè)備功能于一身,能代替普通掃描儀、相機(jī)、攝像頭等諸多設(shè)備,可以實(shí)現(xiàn)拍照、錄像、復(fù)印、網(wǎng)絡(luò)無紙傳真等操作。在現(xiàn)有鐵路保價(jià)系統(tǒng)的基礎(chǔ)上擴(kuò)展功能,集成參數(shù)型號一致的高拍儀,開發(fā)鐵路保價(jià)系統(tǒng)對高拍儀設(shè)備的接口,將高拍儀作為標(biāo)準(zhǔn)辦公設(shè)備接入鐵路保價(jià)系統(tǒng),實(shí)現(xiàn)在鐵路保價(jià)系統(tǒng)中能夠自動(dòng)獲取高拍儀所拍圖像信息,通過高拍儀將被拍物證拍攝成照片直接存入系統(tǒng)并實(shí)現(xiàn)自動(dòng)與結(jié)構(gòu)化數(shù)據(jù)信息關(guān)聯(lián),從而直接完成拍照、存儲、歸檔全部操作過程,減少操作步驟,也保證了圖像的規(guī)范及高質(zhì)量。
(2)移動(dòng)終端。保價(jià)運(yùn)輸工作是一項(xiàng)綜合性管理工作,包括貨損處理與理賠、保價(jià)業(yè)務(wù)管理、投資管理、資金管理等多項(xiàng)內(nèi)容。由于貨損處理與理賠工作需要經(jīng)常到貨損現(xiàn)場進(jìn)行貨損勘驗(yàn),理賠時(shí)也會(huì)上門為客戶辦理服務(wù)手續(xù),這些現(xiàn)場數(shù)據(jù)采集工作對于基于固定PC設(shè)備設(shè)計(jì)的鐵路保價(jià)系統(tǒng)來說十分不便,達(dá)不到及時(shí)處理數(shù)據(jù)的要求。近年來移動(dòng)終端在快遞業(yè)、零售業(yè)等已得到廣泛應(yīng)用,有效提高了企業(yè)的工作效率及數(shù)據(jù)的準(zhǔn)確性。鐵路保價(jià)運(yùn)輸工作中現(xiàn)場數(shù)據(jù)的采集一直以來都是通過手工方式完成,再回到辦公場所錄入系統(tǒng),工作效率不高。因此,針對鐵路保價(jià)運(yùn)輸工作專門研制移動(dòng)終端應(yīng)用,可以極大提高數(shù)據(jù)采集的工作效率及準(zhǔn)確性。
鐵路保價(jià)系統(tǒng)現(xiàn)場數(shù)據(jù)的采集,主要內(nèi)容就是貨物損失現(xiàn)場的情況及貨主的身份、資質(zhì)材料,需要拍攝成照片和影像,通過開發(fā)基于移動(dòng)終端的鐵路保價(jià)系統(tǒng)APP,用以實(shí)現(xiàn)鐵路保價(jià)系統(tǒng)的移動(dòng)辦公。利用APP調(diào)取移動(dòng)終端的拍照功能,可實(shí)現(xiàn)這些非結(jié)構(gòu)化數(shù)據(jù)的采集與關(guān)聯(lián),也可充分利用移動(dòng)終端的后臺數(shù)據(jù)信息,加強(qiáng)作為保價(jià)業(yè)務(wù)處理過程中圖像資料的證據(jù)嚴(yán)謹(jǐn)性。
目前鐵路保價(jià)系統(tǒng)在沒有引入高拍儀的情況下,對于身份證信息和銀行卡賬號信息仍需要手工輸入到計(jì)算機(jī)系統(tǒng)中,因此需要錄入人員在錄入后反復(fù)核對信息,保證信息正確。引入高拍儀后,由于高拍儀規(guī)范了統(tǒng)一分辨率、拍攝角度拍照,使照片的質(zhì)量得到了保證,為圖像智能識別提供了可靠的信息來源,可以自動(dòng)識別身份證號碼信息和銀行卡賬號數(shù)據(jù),最終達(dá)到簡便操作,減少人為誤差的目的,便于進(jìn)一步做好理賠工作。
需要識別的身份證和銀行卡兩類證件都具有防偽背景復(fù)雜、漢字?jǐn)?shù)字混排的特點(diǎn),而銀行卡賬號信息也分為印刷體和凸印字兩種,識別難度較大。因此,利用光學(xué)字符識別技術(shù)(OCR)實(shí)現(xiàn)的工作主要包括3個(gè)方面,即:圖像預(yù)處理、識別文字區(qū)域提取、文字識別。其中文字識別可以采用AI深度學(xué)習(xí)的方法,對相關(guān)文字進(jìn)行標(biāo)記訓(xùn)練,使識別效率及精度大大提高,滿足現(xiàn)場的實(shí)際需要。同時(shí)將識別出的文字自動(dòng)填入到結(jié)構(gòu)化的數(shù)據(jù)輸入項(xiàng)中,簡化錄入過程。
技術(shù)實(shí)現(xiàn)方案本著易用性、統(tǒng)一性、先進(jìn)性原則,在全路統(tǒng)一的鐵路保價(jià)系統(tǒng)上擴(kuò)充、完善軟件功能模塊,無縫接入經(jīng)過二次開發(fā)的專用移動(dòng)終端、高拍儀設(shè)備,用以采集圖像、影像數(shù)據(jù),保證功能的實(shí)現(xiàn)既體現(xiàn)貨運(yùn)理賠對信息系統(tǒng)的統(tǒng)一操作要求,又體現(xiàn)貨運(yùn)信息化對采用新技術(shù)新設(shè)備實(shí)現(xiàn)自動(dòng)化、智能化的要求。
鐵路保價(jià)系統(tǒng)部署在鐵路內(nèi)部服務(wù)網(wǎng)上,移動(dòng)終端APP部署在運(yùn)營商外網(wǎng)上,因而,在符合網(wǎng)絡(luò)安全規(guī)定的前提下,與信息部門共同研究,確定使用國鐵集團(tuán)信息交換平臺進(jìn)行內(nèi)外網(wǎng)數(shù)據(jù)交換的方案。實(shí)現(xiàn)數(shù)據(jù)交換,首先需要鐵路保價(jià)系統(tǒng)在內(nèi)網(wǎng)應(yīng)用服務(wù)上開放一個(gè)WebService接口,用于接收APP的調(diào)用消息,接口參數(shù)為1個(gè),多參數(shù)使用Map集合后JSON化處理,并根據(jù)類型標(biāo)識區(qū)分功能。其次,在信息平臺上將鐵路保價(jià)系統(tǒng)在內(nèi)網(wǎng)開放的WebService接口url地址及參數(shù)進(jìn)行注冊,注冊后會(huì)生成1個(gè)新WebService接口url地址和1個(gè)安全認(rèn)證Key。最后,鐵路保價(jià)系統(tǒng)在外網(wǎng)上開發(fā)、部署APP接入服務(wù),接入服務(wù)調(diào)用安全平臺生成的新WebService接口url地址,同時(shí)將Key傳入,實(shí)現(xiàn)內(nèi)外網(wǎng)數(shù)據(jù)交換[7]。內(nèi)外網(wǎng)數(shù)據(jù)交換應(yīng)用結(jié)構(gòu)圖如圖2所示。
圖2 內(nèi)外網(wǎng)數(shù)據(jù)交換應(yīng)用結(jié)構(gòu)圖Fig.2 Application structure of data exchange between internal and external networks
實(shí)現(xiàn)方案需要在全路統(tǒng)一的鐵路保價(jià)系統(tǒng)上做功能模塊的擴(kuò)充。對于移動(dòng)終端,一方面要在基于安卓的專用移動(dòng)終端上開發(fā)保價(jià)移動(dòng)端APP,實(shí)現(xiàn)保價(jià)數(shù)據(jù)錄入功能;另一方面在現(xiàn)有鐵路保價(jià)系統(tǒng)的后臺業(yè)務(wù)應(yīng)用服務(wù)上,針對保價(jià)移動(dòng)端APP數(shù)據(jù)交互內(nèi)外網(wǎng)數(shù)據(jù)交換接口及APP接口,完成鐵路保價(jià)系統(tǒng)與保價(jià)移動(dòng)端APP數(shù)據(jù)的同步。對于高拍儀,則需要在鐵路保價(jià)系統(tǒng)的保價(jià)瀏覽器端應(yīng)用中,對定制的高拍儀裝備開發(fā)高拍儀接口,以便將高拍儀作為標(biāo)準(zhǔn)辦公設(shè)備接入鐵路保價(jià)系統(tǒng),實(shí)現(xiàn)在鐵路保價(jià)系統(tǒng)中能夠自動(dòng)獲取高拍儀所拍圖像數(shù)據(jù)[8]。接入移動(dòng)終端、高拍儀應(yīng)用結(jié)構(gòu)圖如圖3所示。
圖3 接入移動(dòng)終端、高拍儀應(yīng)用結(jié)構(gòu)圖Fig.3 Application structure with mobile terminal and high-speed camera involved
結(jié)合辦理業(yè)務(wù)的實(shí)際,目前需要識別的信息主要是身份證和銀行卡兩類證件。由于前臺瀏覽器、安卓等多端應(yīng)用都要使用識別功能,因而需要放在后臺業(yè)務(wù)應(yīng)用中實(shí)現(xiàn),具體實(shí)現(xiàn)的工作包括圖像預(yù)處理、圖像文字區(qū)域提取和文字OCR識別3個(gè)方面。OCR文字識別流程如圖4所示。
圖4 OCR文字識別流程Fig.4 OCR process
圖像預(yù)處理是信息識別過程中非常重要的環(huán)節(jié),預(yù)處理的效果極大地影響到字符信息的識別率。在通常情況下,由于拍照設(shè)備、證件磨損、成像環(huán)境等因素而產(chǎn)生的噪聲、偏色等問題,都需要通過預(yù)處理最大限度地消除與有效信息無關(guān)的干擾,從而獲得所需要的標(biāo)準(zhǔn)二值化字符圖像,以提高將要識別的信息的可檢測性。
圖片中要識別的文字信息雖是圖片中所包含信息的一小部分,但對圖像中需識別的文字區(qū)域進(jìn)行提取是十分必要的。通過采用連通域特征的文字區(qū)域提取算法,根據(jù)候選區(qū)域二值圖中連通域特征去除非文字區(qū)域,確定最終文字區(qū)域。通過對一定數(shù)量的復(fù)雜背景圖像進(jìn)行實(shí)驗(yàn),證明該算法效果較好。
文字OCR識別是整個(gè)過程的關(guān)鍵環(huán)節(jié),識別率的高低直接影響用戶的體驗(yàn)。通過采用基于Tesseracr-OCR的識別技術(shù),對特定字符(如銀行卡上凸字賬號)的訓(xùn)練,使識別效率及精度大大提高,滿足現(xiàn)場使用需要。
保價(jià)系統(tǒng)引入非結(jié)構(gòu)化數(shù)據(jù)方案時(shí),應(yīng)以保價(jià)業(yè)務(wù)發(fā)展的質(zhì)量效益出發(fā),在現(xiàn)有保價(jià)系統(tǒng)框架體系下的方案,充分研究新技術(shù)、新設(shè)備接入的可行性及適配性,合理安排功能,方便操作及作業(yè)。目前,基于鐵路保價(jià)系統(tǒng)的總體框架,正在中國鐵路北京局集團(tuán)有限公司進(jìn)行研發(fā)、完善及試點(diǎn)工作。通過試點(diǎn)使用,及時(shí)總結(jié)經(jīng)驗(yàn),形成示范效應(yīng),使新技術(shù)、新設(shè)備在全路保價(jià)業(yè)務(wù)中得到更廣泛應(yīng)用。未來隨著新技術(shù)、新設(shè)備的發(fā)展,鐵路保價(jià)系統(tǒng)還將不斷融合新技術(shù),推進(jìn)鐵路保價(jià)運(yùn)輸服務(wù)持續(xù)創(chuàng)新發(fā)展。