沙永兵 肖豐明 曹德勤 余偉 劉小軍
為滿足集控中心和調控電廠發(fā)展需求,保證電廠生產的安全性,現(xiàn)設計一款功能完善、實用性強的智能調度平臺。在該平臺中,主要用到以下四種關鍵技術,分別是人臉識別、語音智控、智能機器人和智能告警。本文結合智能調度平臺,重點研究和實現(xiàn)該平臺四大人工智能技術。希望通過這次研究,為相關人員提供有效的借鑒和參考。
通過運用人臉識別、語音智控、智能機器人和智能告警等多種人工智能技術,完成對智能調度平臺的設計,不僅可以實現(xiàn)集控中心現(xiàn)有生產模式的改革和創(chuàng)新,還能促使電力調度過程管理變得更加智能化、高效化,有效地提高調控電場運維操作的可靠性和安全性,促使智能調度平臺能夠正常、穩(wěn)定、安全地運行。在設計智能調度平臺期間,加強對以上幾種人工智能技術的研究顯得尤為重要。
采集終端設備包括平板、PC所收錄的語音數(shù)據(jù)上傳至聲紋庫,再根據(jù)提取的說話人聲音特征和說話內容信息,對比聲紋庫自動核驗說話人身份,達到精準的聲紋識別要求?;谝勋@授權輸入的圖片中人像破綻及成像畸形,可有效識別目標是否為活體,并給出置信度參考,通過提取兩張人臉的特征進行相似度對比,最終返回相應的置信度得分,系統(tǒng)根據(jù)特征匹配程度決定“拒絕”或者“接受”。用于判斷兩個輸入人臉是否屬于同一人,用于系統(tǒng)身份識別登錄及指令發(fā)布權限的核實。提供服務調用接口,提供聲紋識別和人臉識別標準調用接口,給需要調用的系統(tǒng)調用。
(一)客戶端設計
通過運用客戶端,可以采集用戶或錄音語音輸入發(fā)送到服務端進行轉寫和語義解析,同時根據(jù)語義解析結果執(zhí)行指令,控制終端設備顯示和語音播報??蛻舳酥С諻indows和Android操作系統(tǒng),支持PC、數(shù)字大屏、一體機、機器人等終端設備??蛻舳嗽O計采用如下方式進行:
通過自然語言交互方式實現(xiàn)常用對應用軟件的操控,如PPT、Word等文件的打開,并其內容展示進行操控。如:用戶說“打開訊飛語音智控系統(tǒng)白皮書,詳細版”,接著用戶可以通過語音進行上下翻頁,或者跳轉到第N頁,甚至用戶可以說“幫我打開系統(tǒng)架構”,該Word文件即會自動跳轉到該頁。
通過語音控制音視頻文件播放,用戶說“音頻播放”,會聽到“請選擇您要播放的音頻”,同時看到可供選擇的音頻列表,通過語音交互方式選擇即可播放。視頻播放支持同樣交互方式。用戶也可以直接說出“播放展館介紹”,即可播放對應音頻或者視頻。
(二)服務端設計
智控內容即智控方案管理。針對不同的智控對象可設置不同智控方案。
(1)網(wǎng)頁智控方案。通過運用該方案,對Web應用系統(tǒng)進行演示操作。具體操作步驟如下:首先,直接配置網(wǎng)頁操控指令,即接收并識別用戶語音后執(zhí)行的操控指令,如頁面跳轉、按鈕點擊等操作。其次,配置錄音播報場景,既針對某個業(yè)務場景,實現(xiàn)全自動化演示與操作,無需人工參與:上傳真人錄音或者錄入講解內容合成錄音,在客戶端語音控制播放該錄音,系統(tǒng)即可識別、解析并執(zhí)行錄音中相關操控指令,充分釋放人力。
(2)軟件智控方案。軟件智控方案主要是指應用軟件內容操控,如打開PPT、Word等文件,對PPT、Word文件進行上下翻頁、跳轉到指定頁(如用戶說“回到第8頁”)、調轉到指定內容頁(如用戶說“打開系統(tǒng)架構”),其中上下翻頁、跳轉到指定頁指令在“通用指令管理”中已配置,這里無需重復配置。
在設計智能調度平臺時,重點應用智能機器人技術,通過應用該技術,可以完成對智能服務器機器人的設計,該機器人主要由主控板、工控機、底盤控制板、IMU、激光掃描儀、華為TD-無線數(shù)據(jù)終端、語音識別模塊、表情顯示器、業(yè)務辦理顯示器、人臉識別模塊、3D攝像頭、手臂控制板、手指控制等模塊組成。
該機器人主要包含以下功能。(1)行走播報。支持設定特定時間端,按照既定路線行走,當遇到人員時,會提醒讓行,機器人可以一邊行走,一邊播報預定內容,同時支持智能打斷播報內容。(2)定點講解。語音或者屏幕觸發(fā)機器人按照既定路線或者單點講解,到達指定地點,播放既定內容(語音/圖片/視頻),可設計機器人在指定地點等待時長。同時可以讓機器人做相關動作(按照系統(tǒng)內置動作組選擇)。(3)定制對話。本地無限量QA對話輸入,可以滿足對話內容輕松錄入和編輯,快速響應;支持通過語音輸入控制大屏數(shù)據(jù)頁面切換,頁面切換順滑,數(shù)據(jù)能夠聯(lián)動刷新。(4)遠程監(jiān)控。Android手機或者PAD端可以通過網(wǎng)絡遠程監(jiān)控,通過機器人頭部攝像頭到現(xiàn)場情況進行監(jiān)控巡邏。(5)自動充電。機器人可根據(jù)指令或者電量情況,自行充電。(6)人臉識別。支持2000人本地人臉識別,本地錄入人臉,編輯識別后,問候內容。在待機界面中,只要錄入人臉人員經(jīng)過就可以主動問候。(7)主動迎賓。設置機器人歡迎詞,當機器人待機狀態(tài),只要有人進入1.5米內,就會迎賓問候,同步也有人臉識別打開,按設置內容主動問候。問候結束彈出對話框交流。(8)編程。Android手機或者PAD端可以編程控制機器人做動作、表情、視頻和語音,起到表演的作用。
在設計智能調度平臺時,通過應用智能告警技術,可以將語音助手、應急平臺故障分析和話務系統(tǒng)深度集成,保證平臺多樣化告警提醒功能實現(xiàn)效果。該平臺具體設計步驟如下:
(1)智能話務平臺對接報警分級系統(tǒng)。智慧告警平臺提供接口,可以實時接收水電系統(tǒng)發(fā)送的故障信息,故障信息包括故障類型、故障時間、故障內容等信息。智慧告警平臺與報警分級系統(tǒng)通過接口進行對接,智慧告警平臺接收到告警信息后,可以根據(jù)故障信息從數(shù)據(jù)庫中檢索關聯(lián)的人員列表,如果檢索失敗或者未設置關聯(lián)人員,則可以關聯(lián)系統(tǒng)設置的緊急處理人員。
(2)對接語音合成引擎。智慧告警平臺將文本告警信息通調用語音合成引擎轉換成語音,通過智能話務平臺撥打給告警處理人員并進行告警信息播報。
(3)對接實體機器人或者現(xiàn)場播音設備,實現(xiàn)告警內容播報。智慧告警平臺在接收到告警信息時調用語音合成引擎,通過實體機器人或現(xiàn)場播音設備,將預警內容合成語音信息進行播報。
(4)當發(fā)生故障時,系統(tǒng)自動識別當前故障關聯(lián)的人員,獲取人員電話號碼,并打通相關人員調度電話,對告警信息進行播報。
在人工智能技術的應用背景下,為促使智能調度平臺向智能化、高效化、數(shù)字化方向不斷發(fā)展,技術人員要重視對人臉識別、語音智控、智能機器人和智能告警四大關鍵技術的運用,通過運用以上技術,不僅可以保證調度指揮的智能性和便捷性,還能提高調控電廠生產的安全性和可靠性,為確保智能調度平臺在集控模式下能夠穩(wěn)定、高效地運行提供重要的技術支持。
作者單位:五凌電力有限公司