馬馨雅
摘 要:在不少情境下都存在著考勤制度,例如公司針對(duì)外勤員工的考勤,老師針對(duì)學(xué)生的考勤等。目前現(xiàn)存的一些考勤方式往往存在一定程度上的漏洞,使得被考勤的人員總是有機(jī)可乘?;诖?,文章提出了一種將GPS定位和人聲識(shí)別結(jié)合于一體的考勤方式,以防止員工或?qū)W生在考勤時(shí)鉆空子。
關(guān)鍵詞:GPS定位;聲紋識(shí)別;考勤
考勤制度存在于人們生活中的許多方面,涉及的人除了常見的公司員工,還有廣大大學(xué)生等。早些時(shí)候,常見的考勤的制度是紙質(zhì)簽到,后期又延伸出了掃碼簽到等,但是顯而易見地,這種考勤方式是最容易被代簽的。后來,又有了指紋簽到等較為高科技的簽到方式,但是該方式的速度較慢,成本較高,且不利于外勤人員進(jìn)行簽到。目前最常使用的還有使用軟件,根據(jù)判斷簽到時(shí)的GPS定位進(jìn)行簽到,這種方式雖然成本較低,便于管理外勤人員,但是一旦“人機(jī)分離”,依舊很容易作弊[1]。
因此,本文提出了一種將GPS定位和人聲識(shí)別結(jié)合于一體的考勤方式。目前,GPS定位技術(shù)已經(jīng)較為成熟,許多考勤軟件中都在使用這項(xiàng)技術(shù)。但是光靠GPS定位來簽到也容易作弊。聲紋識(shí)別技術(shù),是生物識(shí)別技術(shù)中較為成熟的一種,它能夠有效地辨別人聲。結(jié)合了GPS定位和人聲識(shí)別的系統(tǒng),能夠在定位的同時(shí),識(shí)別使用者是否用戶本人,這就可以有效地避免作弊現(xiàn)象的發(fā)生。
1 概述
1.1 聲紋識(shí)別技術(shù)
聲紋識(shí)別的基本原理可以理解為:將要判斷的說話人的模型特征與訓(xùn)練模型進(jìn)行匹配,之后再根據(jù)得到的匹配率或概率值進(jìn)行辨認(rèn)或確認(rèn)操作[2]。
本文中,本人選擇的是梅爾倒譜系數(shù)(Mel-scale Frequency Cepstral Coefficients,MFCC)。MFCC和基于線性預(yù)測(cè)的倒譜一比較,MFCC的顯著優(yōu)點(diǎn)是:它不依賴全極點(diǎn)語(yǔ)音產(chǎn)生模型的假定。并且,通常在與文本無關(guān)的說話人識(shí)別系統(tǒng)中,MFCC可以非常好地提高系統(tǒng)的性能[3]。在文本相關(guān)的聲紋識(shí)別系統(tǒng)中,MFCC的表現(xiàn)也十分優(yōu)異。因此,可以選用MFCC。本文中,把MFCC用于隱馬爾可夫模型(Hidden Markov Model,HMM)的訓(xùn)練過程與識(shí)別過程中。HMM模型在聲紋識(shí)別系統(tǒng)中應(yīng)用得較為廣泛[4],HMM中針對(duì)每一幀語(yǔ)音,每一個(gè)音素都有特征向量,而此處,采用何種特征向量,則可以按照具體情況而定。
1.2 GPS定位
該系統(tǒng)是基于安卓系統(tǒng)開發(fā)的。安卓是一款開源的系統(tǒng),其開發(fā)成本較低,可用的API較多。在這個(gè)系統(tǒng)中,擬基于百度地圖LBS定位,進(jìn)行SDK二次開發(fā)。同時(shí)還利用了百度地圖LBS云來作為該系統(tǒng)的服務(wù)端。之所以采用這種開發(fā)方式,是為了減輕該系統(tǒng)的服務(wù)器端的壓力。圖1為云存儲(chǔ)字段定義方式的部分摘錄。
2 系統(tǒng)設(shè)計(jì)
圖2是聲紋識(shí)別模塊的結(jié)構(gòu)。從圖中我們可以清楚地看到,圖上一共有兩個(gè)錄音設(shè)備。第一個(gè)錄音設(shè)備是用于訓(xùn)練模型,用戶在第一次使用該系統(tǒng)時(shí)需要根據(jù)系統(tǒng)提示的文本進(jìn)行語(yǔ)音輸入,系統(tǒng)會(huì)對(duì)用戶的聲紋進(jìn)行采集并提取特征,進(jìn)行模型的訓(xùn)練,并將該模型上傳到服務(wù)器上;之后,在正式使用該系統(tǒng)時(shí),用戶需要語(yǔ)音輸入系統(tǒng)給出的文本,由系統(tǒng)對(duì)聲紋再次進(jìn)行采集并提取特征,將得到的模型與服務(wù)器上的模型進(jìn)行匹配。如果匹配成功,則認(rèn)定為用戶本人。此時(shí),如果GPS定位也在預(yù)設(shè)地點(diǎn)的某個(gè)范圍內(nèi),則認(rèn)為是一次成功的打卡行為。
在第一次進(jìn)行聲紋模型采集時(shí),使用的文本是固定的。但是在隨后的使用中,為了防止預(yù)錄音的情況發(fā)生,系統(tǒng)所給出的文本將會(huì)是隨機(jī)的。
外勤人員的考勤地點(diǎn)并不固定,且室外環(huán)境較為嘈雜。因此,本文中為了提高這個(gè)考勤系統(tǒng)在嘈雜環(huán)境下的性能,聲音要進(jìn)行過濾。同時(shí),用戶的語(yǔ)音特征不是保持不變的,而是會(huì)發(fā)生改變的。在研究本系統(tǒng)的過程中會(huì)進(jìn)行許多次實(shí)驗(yàn)測(cè)試以及計(jì)算來確定一個(gè)最優(yōu)閾值。
3 結(jié)語(yǔ)
本文中研究的是一款A(yù)ndroid平臺(tái)上的結(jié)合了聲紋識(shí)別和GPS定位的雙重認(rèn)證考勤系統(tǒng)。用戶在使用該系統(tǒng)時(shí)需要先上傳自己的聲紋模型,考勤時(shí)需要通過語(yǔ)音輸入來匹配聲紋模型,若匹配成功還需結(jié)合GPS定位的情況,只有在工作地點(diǎn)的某個(gè)范圍內(nèi),才能算作是一次合格的考勤。同時(shí),管理員還可以在后臺(tái)查看員工的打卡情況,包括打卡時(shí)間、定位情況和聲紋匹配結(jié)果。而且管理員還可以發(fā)布打卡任務(wù)。該系統(tǒng)簡(jiǎn)單易用,成本較低,適宜廣泛推廣,并且能夠有效地減少考勤的作弊情況,提升用人單位的監(jiān)管效率。
[參考文獻(xiàn)]
[1]季敏飛,彭媛媛,萬可鑫.基于GPS與聲紋的手機(jī)考勤識(shí)別研究[J].電腦迷,2017(7):174.
[2]沈陽(yáng)麗,趙啟升.GMM-UBM聲紋識(shí)別技術(shù)研究與應(yīng)用[J].電腦編程技巧與維護(hù),2017(16):84-86.
[3]曹輝,徐晨,趙曉,等.說話人識(shí)別中的Mel特征頻率倒譜系數(shù)[J].西北大學(xué)學(xué)報(bào)(自然科學(xué)版),2013(2):203-208.
[4]姚敏鋒.基于HMM的聲紋考勤算法改進(jìn)[J].電腦與信息技術(shù),2016(5):22-25.