王棟
(廣東電網有限責任公司 廣東省廣州市 510000)
人工智能簡稱AI,是人類的智慧結晶所創(chuàng)造出來的堪比人類大腦的智能機器大腦。能讓智能機器模擬人類的思維、意識、行為等等的功能并開發(fā)出高質量智能機器產品,高質量智能機器產品可以憑借感應器所接收的材料然后智能感知到周圍的一切[1]。人工智能這項先進技術對人類來說是非常具有挑戰(zhàn)性的領域,盡管人工智能發(fā)展緩慢,但人類為了實現人工智能技術普遍應用到生活中的各方面也一直在為之奮斗著。因為人工智能不僅有利于其他技術的發(fā)展并且人工智能技術的發(fā)展領域非常廣泛,其中OCR(Optical Character Recognition,光學字符識別)識別技術在人工智能領域中是一項重要技術[2]。
隨著現代工業(yè)的發(fā)展,在企業(yè)業(yè)務管理中涉及大量的流程復雜、數量巨大和技術效率要求較高的檢測任務,傳統的計算機算法已不能完全滿足企業(yè)發(fā)展需求[3-4]。例如,在評標專家系統中通過智能驗真輔助支撐的研究,可以實現系統智能驗真輔助評審專家項目評標,可以大幅替代評標專家對每個評審要素逐一對比投標人的響應情況和招標文件的要求情況,提升工作人員工作效率,減少評標過程中人為主觀性因素,規(guī)范化工作流程,有效提升招標采購服務工作的質量和效率。OCR 識別技術是提升公司采購精益管理水平和專業(yè)服務能力的重要措施,是公司推進質量變革和效率變革及突出核心競爭力的直接舉措[5-6]。
OCR 識別也就是光學字符識別的縮寫,光學字符識別信息技術指的是對圖像數據的剖析和處理,也是獲得文字和數據的進程[7-8]。并且OCR 識別技術可應用于文字資料、文案、檔案卷宗、財務票據和身份證、駕駛證、名片等證件的錄入和處理領域等等。傳統的OCR 是由預處理和圖像輸入組成的,預處理方法包含灰度化和二值化及圖像較正還有去除噪聲等等[9]。圖像輸入對不一樣的壓縮方法就有不一樣的存儲方法等等。關于企業(yè)衡量OCR 識別信息系統進行性能的好與壞的指標分析主要有產品的穩(wěn)定性、易用性、可行性、誤識率及識別速度的問題等等,并用相關輔助數據來提升識別的準確率,這在OCR 識別信息技術中是非常重要的。簡略的講就是把文字轉化成圖像數據,而后運用字符識別將圖像數據轉換成能夠應用的輸入技術。并對OCR 識別的結果實行剖析后智能糾正錯誤結果。隨著中國的科技發(fā)展愈來愈好,OCR 識別信息技術隨之也普遍運用起來。OCR 的技術路線和識別過程如圖1 和圖2 所示。
圖1:OCR 技術路線圖
圖2:OCR 識別過程
因不同類型的發(fā)票的大小、顏色均不同,所以本文首先進行的是分類,確定發(fā)票的類別,這樣如火車票這種字符像素固定的發(fā)票,就可以采用固定的模板截取出待識別信息的圖像,同時降低了后續(xù)識別的難度。 其次針對增值稅這種機打字符像素隨打印機的不同而變化的發(fā)票,將使用基于圖像增強的二次分割法,用于實現截取,并進行傾斜校正。這樣既降低了識別難度,又提高了 OCR 識別的準確率,圖3是使用AlexNet 訓練OCR 識別結果示例。
圖3:使用AlexNet 訓練OCR 識別結果示例
OCR 傳統方法在應對復雜圖文場景的文字識別顯得力不從心,越來越多人把精力都放在研究如何把文字在復雜場景讀出來,并且讀得準確作為研究課題,用學界術語來說,就是場景文本識別(文字檢測+文字識別)。
(1)數字化:數字化是OCR 的第一步,我們采用攝像機或掃描儀將包含手寫或機打文本的紙質文件轉換成數字圖像;
(2)預處理:預處理一般包括二值化、文字定位和傾斜校正等步驟。二值化將三原色構成的多色圖像轉換成單色圖像,這就是預處理的第一步,其目的是減少冗余信息量,加快速度。傾斜校正的對傾斜的文本完成校正;
(3)文字分隔:文字分隔是多行字符序列切割為單行字符序列,再分割成單個字符,它是OCR 中的一個重要步驟,其效果直接影響OCR 的最終結果;
(4)特征提?。禾卣魈崛∈菑膯蝹€字符中提取與其他字符相匹配的單個字符特征,是OCR 中最重要的步驟。傳統的特征提取方法,如模板匹配和結構分析等,面對漢子時并不是非常有效,而且會耗費大量時間。深度學習可以輕易完成這項任務,并且只要擁有足夠量的數據集,就能提供更精確的識別。
OCR 技術中的語音識別技術可使機器通過識別及理解來聽懂人類語言,是OCR 技術中的一項重要技術,并且該技術在語音識別功能領域等方面逐漸得到廣泛應用。通過語音識別可實現對用戶語音的檢測,在這個過程中,以信號處理的方式來達到效果,經過識別來滿足對語言智能化分析及處理的要求[10]。其中有前端及后端語音處理,前端語音處理過程中,能夠實現端點檢測及智能打斷。前端指的是將接收到的音頻展開分析,確保用戶從開始到結束的語音處理進程。在后端處理中,需要對說話人語音進行識別,最終得到適合的結果。其中包括了識別及置信度輸出,前端在系統中能夠識別出多種詞匯,達到對語音識別處理的較高要求,并且在用戶不同的年齡、地域、環(huán)境等因素下有著良好的適應性,局限性比較小。后端指的是反映辨別后的結果,以識別引擎為媒介在對語音進行置信度識別,還可通過識別的結果開展詳細的分析,對語音信息進行效地處理。近年來,由于人工智能技術迅速發(fā)展并與傳統行業(yè)實現快速融合,一場由數字化轉型帶來的產業(yè)變革正在蓬勃發(fā)展,將OCR 文字識別帶給每個人、每個項目,構建萬物互聯的智能世界,是時代共同的聲音[11-12]。OCR 的應用目前OCR 識別技術如圖4所示,可應用在證件識別、銀行卡識別、車牌識別、表格識別、票據識別、護照識別、名片識別、人臉識別、文檔識別、人證合一、營業(yè)執(zhí)照識別、發(fā)票識別、VIN 碼識別等各種涵蓋生活、工作的技術核心,目前包含銀行、保險、金融、稅務、海關、公安、邊檢、物流、電信工商管理、圖書館、戶籍管理、審計等很多行業(yè)都已經應用了OCR 技術。OCR 技術讓大家減少了設備配置,降低了人力成本,提高了工作效率。
圖4:OCR 識別的功能
(1)總體基于OCR(Optical Character Recognition,光學字符識別)、深度學習的資質圖像分類、基于自然語言的文本分類與識別等技術,合理設計客觀分智能計算、投標文件自動定位、智能輔助驗真的應用結構,充分借鑒現有數字化、信息化建設成果,明確了應用實現方案,為減輕專家評標客觀分評審工作量、減少專家機械工作內容、對投標文件所提供資料進行驗真提供系統支撐;
(2)支持企業(yè)的信息、證件、信用等信息建立模型,根據評標過程中,專家關注的證照信息的真?zhèn)危瑯I(yè)績是否造假,是否有圍串標行為,通過機器學習相關算法,輔助專家進行辨別,并且在內部實現企業(yè)的各種信息共享;
(3)能夠通過智能驗真輔助支撐的體系的建立,使專家從過去需要對比投標人的響應情況和招標文件的要求,以及對比不同投標人在每個要素的工作中解脫出來,輔助專家進行評標,大大簡化了專家的評標過程,提高了工作效率。應用研究主要從三個方面開展:
一是客觀分智能計算?;贜LP 語義分析方法,針對供應商投標文件中的財務、資質、業(yè)績等客觀指標項進行提取,自動計算客觀分[13]。如圖5 所示。
圖5:客觀分智能計算二級應用視圖
二是投標文件自動定位。采用文本解析、圖像識別等技術,結構化提取投標文件內容,并結合NLP 語義分析,匹配設定的評審因素項,形成結構化數據及頁碼,解決專家評審過程中難以針對評分條款進行定位的問題。
三是智能輔助驗真。運用圖像識別(OCR)技術,智能提取投標文件內容并解析關鍵詞,收集內外部數據建立驗真庫,將投標文件解析提取內容與驗真庫進行驗真比對,智能提示供應商信息真?zhèn)蝃14]。如表1 所示。
表1:客觀分智能計算模塊/功能清單
客觀分智能計算實現視圖如圖6 所示。
圖6:客觀分智能計算應用實現視圖
廣東電網有限責任公司基于人工智能服務平臺正式上線以來,OCR 識別技術在廣電公司人工智能平臺中不斷完善了其兼容性,輕松解決掉以往的人工智能的不足的地方,并以圖像識別和語音識別等技術為廣電公司創(chuàng)造了新的發(fā)展空間。在廣電人工智能平臺中整合了OCR 識別技術中的智能技術,并加以利用到變電站巡檢機器人上,這加快了數字電網的建設并實現了變電站立體巡檢。人工智能技術極大的幫助了廣電公司的工作人員,并且應用這先進的科技來為客戶提供更為優(yōu)質更為便捷的服務。據了解,廣電公司近年來實現了為客戶提供更好的服務,其中包括了用電咨詢服務和節(jié)能服務等功能,不僅如此還能讓廣大客戶及時知情停電管理服務和消息精準等服務。
在實際的智能化客服系統中可以借助語音識別技術,在客服跟客戶通話的時候方便高層管理對客服的整個通話流程進行實時監(jiān)控。運用人工智能系統把通話中的聲音特征提取出來作為參數,更便于靈活地進行調整使得通話的質量得到保障。而且高層管理對客服跟客戶的通話過程進行人工測聽,可深入了解到客戶的情緒狀況及分析出客服的質量和溝通能力。通過聽客戶的聲音變化等情況的監(jiān)測,可對客戶的情緒變化有所了解,并結合客戶情緒進行分析來改變客服語氣。同時為加強人工智能技術在廣電公司的電力客服系統當前的應用效果,還需要合理運用人工智能技術來完善智能服務系統,可將語音轉移文本及預警統計等信息作為判斷服務質量的參考依據,使服務的改善有更好的效果,進一步發(fā)揮出人工智能的重要性。如圖7 所示。
圖7:人工智能的客服系統模塊圖
隨著人工智能技術帶來的便利使得各行各業(yè)的信息化水平都極大提高了,廣電公司在信息技術與人工智能的應用上不僅加大了預算的投入,還投入了很多的精力在人工智能技術的應用上。從廣電公司財務管理系統中來說,與財務相關的軟件應用已經非常普遍了,特別是電子文件普及以來,電子發(fā)票通過掃碼就可以進行自助開發(fā)票,極大減輕了開發(fā)票和發(fā)票購買的巨大工作量,在一定程度上是減輕了財務會計人員的工作量[15]。在人工智能技術應用中不斷優(yōu)化整個財務管理系統的核算方式,以此提升財務管理系統的效率。運用 OCR 技術將報表中的文字、表格、圖像轉化為電子版的數據,通過計算機程序,快速采集報表數據,再通過AI 技術發(fā)現其中隱藏的疑點信息,具體步驟如圖 8 所示。
圖8:報表識別步驟
隨著中國的科技正持續(xù)發(fā)展,人工智能技術隨之廣泛運用到各行各業(yè)。就拿計算這塊來講,人工智能技術擁有非常明顯的優(yōu)勢,快速、精準、高效等等這對人類而言基本是不可能做到的。就此,廣電公司財務管理系統運用人工智能時,最大化利用人工智能的優(yōu)勢來整合財務相關數據。將數據重新整理、歸納和劃分能更全面地看到廣電公司的發(fā)展狀況,也就可以對公司的流動資金集中管理。而且公司的財務數據還可以精確分析出可能會出現的財務相關問題,極大提高了公司財務風險的預防能力水平[16-18]。
本綜述通過識別過程、發(fā)展現狀、關鍵技術、識別功能、研究思路及在廣電公司中的應用五個方面說明了人工智能輔助OCR 技術在企業(yè)現代管理中的主要作用,人工智能OCR技術的應用研究能夠大幅提升企業(yè)各部門的應用管理工作效率和能力水平,實現管理智能化。