艾列富,程宏俊,馮學(xué)軍
(1.安慶師范大學(xué) 計(jì)算機(jī)與信息學(xué)院,安慶 246133;2.安慶師范大學(xué) 智能感知與計(jì)算安徽省高校重點(diǎn)實(shí)驗(yàn)室,安慶 246133)
最近鄰搜索是圖像檢索和機(jī)器學(xué)習(xí)領(lǐng)域的重要基礎(chǔ)性問(wèn)題,但以圖像特征為代表的大規(guī)模高維特征使得精確最近鄰搜索需要花費(fèi)更多的時(shí)間和更大的存儲(chǔ)開(kāi)銷(xiāo)。如何快速并準(zhǔn)確地獲得特征向量的近似最近鄰成為一個(gè)重要研究?jī)?nèi)容,即:在保證近似表示精度的情況下,如何設(shè)計(jì)緊湊的編碼來(lái)標(biāo)識(shí)特征向量,降低存儲(chǔ)空間以及加速特征向量之間歐氏距離的計(jì)算。
根據(jù)衡量特征向量之間相似度距離的方式的不同,用于圖像特征向量近似表示的編碼算法可以劃分為哈希編碼算法和基于量化的編碼算法兩大類(lèi)[1]。雖然都用于降低圖像信息的存儲(chǔ)空間需求,但不同于圖像壓縮[2],用編碼對(duì)特征向量進(jìn)行壓縮存儲(chǔ)時(shí),允許特征向量在重構(gòu)時(shí)存在誤差,但要盡可能小。
歐氏距離比漢明距離對(duì)計(jì)算需求較大,但具有更好的相似度區(qū)分能力?;诹炕木幋a算法不僅采用二進(jìn)制編碼標(biāo)識(shí)特征向量以減少存儲(chǔ)空間需求,還使用近似歐氏距離保持區(qū)分能力。向量量化采用一種映射方式,又稱(chēng)為量化器[3],將特征向量映射到事先訓(xùn)練的碼書(shū)中最相似的單詞,并且用于近似表示該特征向量,單詞的二進(jìn)制編號(hào)用于標(biāo)識(shí)與之對(duì)應(yīng)的特征向量。
率先將量化模型用于近似最近鄰搜索和圖像特征檢索的積量化算法(product quantization,PQ)[4-5],將特征向量分割為若干段子向量,并分別在子向量所在的向量空間訓(xùn)練量化器。將特征向量在各量化器的量化輸出串聯(lián)起來(lái),用于近似表示該特征向量。基于PQ的思想,學(xué)者們提出了各種改進(jìn)方法,具有代表性的研究工作包括:GE等人提出用帶參量和無(wú)參量?jī)煞N笛卡爾優(yōu)化分解來(lái)最小化量化誤差[6];參考文獻(xiàn)[7]中采用倒排索引或多索引對(duì)特征向量集進(jìn)行劃分后,再在每一個(gè)子集上進(jìn)行笛卡爾優(yōu)化分解;為了進(jìn)一步減少量化誤差,HEO等人[8]編碼總長(zhǎng)度不變的情況下,預(yù)留一定長(zhǎng)度的部分編碼給相同量化輸出但量化誤差不同的向量;NOROUZI等人提出了正交k均值算法及笛卡爾積k均值算法[9];雙層PQ[10]和局部?jī)?yōu)化PQ[11]以及利用圖形處理器(graphics processing unit,GPU)[12]從硬件層面對(duì)PQ進(jìn)行加速以及用于聚類(lèi)[13]等PQ的擴(kuò)展應(yīng)用研究。
PQ思想基于一個(gè)假設(shè)前提:特征向量的各個(gè)維度分量相互獨(dú)立,不存在相互關(guān)聯(lián)。然而,實(shí)際情況一般不會(huì)總是滿足這種假設(shè)。為此,BRANDT[14]將轉(zhuǎn)換編碼和PQ相結(jié)合,在特征向量的每個(gè)主成分維度上分別訓(xùn)練量化模型。在此基礎(chǔ)上,子空間量化算法(即通過(guò)將向量空間劃分為多個(gè)子空間)被用來(lái)解決特征向量維度的空間分布不平衡問(wèn)題[15]。類(lèi)似的研究工作還包括樹(shù)形量化方法[16]對(duì)特征進(jìn)行分解,在子向量空間訓(xùn)練子碼書(shū)的同時(shí)對(duì)各子碼書(shū)之間非正交聯(lián)系進(jìn)行約束。
上述量化模型大都考慮如何在單層碼書(shū)的前提下,盡可能地減少量化誤差,然而碼書(shū)的大小決定了量化誤差的大小。通常地,碼書(shū)中單詞的數(shù)量越多,會(huì)使量化誤差越小,然而這帶來(lái)問(wèn)題的碼書(shū)訓(xùn)練所需要的開(kāi)銷(xiāo)也就越大。對(duì)此,殘差向量量化(residual vector quantization,RVQ)[17]利用多層小規(guī)模碼書(shū)構(gòu)成的量化器,其碼書(shū)層數(shù)越多,量化誤差越小,特征向量的近似表示精度越高。通過(guò)對(duì)RVQ引入正交約束條件,正交RVQ[18]設(shè)計(jì)了查詢點(diǎn)和重構(gòu)點(diǎn)之間近似歐氏距離計(jì)算方法。在前期研究中,提出了增強(qiáng)型殘差量化(enhanced residual vector quantization, ERVQ)[19],在RVQ基礎(chǔ)上對(duì)碼書(shū)訓(xùn)練過(guò)程進(jìn)行迭代優(yōu)化,主要目的是在不增加碼書(shū)規(guī)模的條件下,降低總體量化誤差,得到更準(zhǔn)確的碼書(shū),進(jìn)而提升檢索精度。
這類(lèi)模型雖然訓(xùn)練得到的碼書(shū)的區(qū)分度較高,但訓(xùn)練以及量化過(guò)程均發(fā)生在特征向量所在的原始向量空間。向量維度越高,帶來(lái)的最直接影響是在高維向量空間訓(xùn)練碼書(shū)花費(fèi)的時(shí)間越多。因此,特征向量的高維度現(xiàn)象是制約這類(lèi)量化方法的訓(xùn)練效率的關(guān)鍵因素之一。參考文獻(xiàn)[20]中雖然將高維向量投影到低維空間來(lái)訓(xùn)練碼書(shū),但沒(méi)有考慮到投影過(guò)程中所帶來(lái)的投影誤差。參考文獻(xiàn)[21]中提出了一種投影殘差量化(projected residual vector quantization,PRVQ),在訓(xùn)練量化模型時(shí)同時(shí)考慮到了投影誤差,然而卻沒(méi)有考慮殘差量化方法中存在碼書(shū)訓(xùn)練并不是最優(yōu)化總體量化誤差的不足。
作者在前期關(guān)于增強(qiáng)型殘差量化模型的研究工作基礎(chǔ)上,提出一種將主成分分析方法與該模型相結(jié)合的量化方法,通過(guò)將特征向量從原始高維向量空間投影到低維向量空間,并低維向量空間進(jìn)行碼書(shū)訓(xùn)練,提高碼書(shū)訓(xùn)練的時(shí)間效率。由于降維過(guò)程使特征在投影過(guò)程中產(chǎn)生投影誤差,會(huì)降低所訓(xùn)練的低維向量碼書(shū)的精度,而碼書(shū)的精度直接影響到特征的檢索準(zhǔn)確率。為此,在優(yōu)化碼書(shū)的過(guò)程中,同時(shí)考慮訓(xùn)練碼書(shū)產(chǎn)生的總體量化誤差以及投影所產(chǎn)生的誤差。在低維空間訓(xùn)練碼書(shū)旨在提高碼書(shū)訓(xùn)練的時(shí)間效率;碼書(shū)優(yōu)化旨在保證訓(xùn)練所生成的碼書(shū)的精度。在此基礎(chǔ)上,設(shè)計(jì)一種針對(duì)該量化模型的特征向量之間的歐氏距離近似計(jì)算方法,提高檢索效率。
作者前期所提出的ERVQ[19]是由多層碼書(shū)構(gòu)成,逐級(jí)量化的量化模型。所有層的量化輸出向量通過(guò)累加形成輸入特征向量的重構(gòu)向量。除去第1層和最后一層,利用每層碼書(shū)進(jìn)行量化時(shí)產(chǎn)生的量化誤差作為下一層的量化輸入,旨在對(duì)特征向量應(yīng)用多層量化盡可能地減少特征向量的近似表示誤差。ERVQ由碼書(shū)訓(xùn)練和量化特征向量?jī)蓚€(gè)部分構(gòu)成。
為了使訓(xùn)練得到的多層碼書(shū)能更準(zhǔn)確地對(duì)輸入特征向量近似表示,ERVQ利用k均值算法訓(xùn)練得到每一層初始碼書(shū)后,通過(guò)總體量化誤差目標(biāo)函數(shù)對(duì)初始碼書(shū)進(jìn)行迭代優(yōu)化。其中,采用RVQ[17]來(lái)訓(xùn)練進(jìn)行迭代優(yōu)化所需的初始碼書(shū);在此基礎(chǔ)上,對(duì)每一層碼書(shū)按順序進(jìn)行迭代優(yōu)化,不斷更新碼書(shū)。
一次迭代過(guò)程包括所有層碼書(shū)的順序優(yōu)化。對(duì)于某一層碼書(shū),其優(yōu)化的具體實(shí)現(xiàn)思路是基于其它層的碼書(shū),把該層碼書(shū)當(dāng)作最后一層碼書(shū)進(jìn)行重新訓(xùn)練,并將新的碼書(shū)代替原來(lái)的碼書(shū)以及更新訓(xùn)練集的量化輸出[22]。當(dāng)目標(biāo)函數(shù)收斂到一定程度時(shí),迭代優(yōu)化過(guò)程停止。
給定特征向量v,圖1是一個(gè)兩層ERVQ的逐層量化過(guò)程示意圖。
Fig.1 Quantizing feature vector by ERVQ
(1)
式中,i表示當(dāng)前層碼書(shū)的層號(hào);C1為第1層碼書(shū)的k個(gè)聚類(lèi)中心對(duì)應(yīng)的集合,k為每層碼書(shū)的聚類(lèi)中心數(shù);ci,j為第i層碼書(shū)中第j個(gè)聚類(lèi)中心。
(2)根據(jù)下式,計(jì)算v的第1層量化誤差對(duì)應(yīng)的誤差向量e1:
(2)
對(duì)于層數(shù)大于2的ERVQ,需要繼續(xù)將第2層的量化誤差輸入到第3層進(jìn)行量化,直到最后一層。
投影增強(qiáng)型殘差量化方法將主成分分析方法和前期研究的增強(qiáng)型殘差量化方法相結(jié)合,在低維空間訓(xùn)練量化模型得到碼書(shū)以提高訓(xùn)練效率,與此同時(shí),為了減少投影誤差對(duì)碼書(shū)精度的影響,通過(guò)迭代優(yōu)化的方式提升碼書(shū)精度。
投影增強(qiáng)型殘差量化分為訓(xùn)練階段和量化階段,其中,訓(xùn)練階段用于量化模型訓(xùn)練得到多層低維空間的碼書(shū);量化階段則是對(duì)圖像特征向量進(jìn)行量化生成編碼的過(guò)程。
碼書(shū)訓(xùn)練分為兩個(gè)階段:初始碼書(shū)訓(xùn)練和碼書(shū)優(yōu)化兩個(gè)階段。
2.1.1 初始碼書(shū)訓(xùn)練 初始碼書(shū)訓(xùn)練過(guò)程采用類(lèi)似于PRVQ[21]方法,每層初始碼書(shū)的訓(xùn)練過(guò)程需包括步驟:利用主成分分析(principle component analysis,PCA)構(gòu)造降維投影矩陣、訓(xùn)練集投影降維、低維向量空間上利用k均值算法訓(xùn)練碼書(shū)、低維向量空間上量化訓(xùn)練集、逆投影和總體殘差向量計(jì)算。
針對(duì)圖2所示訓(xùn)練兩層初始碼書(shū)的示例,第1層初始碼書(shū)訓(xùn)練過(guò)程如下:首先,利用PCA在訓(xùn)練集X上生成用于特征向量降維的投影矩陣M1,并將X投影到低維向量空間得到X1;然后,利用k均值算法對(duì)投影降維后的訓(xùn)練集進(jìn)行聚類(lèi),生成第1層碼書(shū)C1;緊接著,利用第1層碼書(shū),根據(jù)(1)式對(duì)訓(xùn)練樣本集X1中特征向量進(jìn)行量化;最后,利用逆投影矩陣,將X1的量化結(jié)果逆投影到原始維度,計(jì)算和原始向量之間的誤差向量集E1并作為第2層碼書(shū)訓(xùn)練的輸入。
第2層初始碼書(shū)C2的訓(xùn)練同第1層初始碼書(shū)的訓(xùn)練方法一致,同樣通過(guò)以上幾個(gè)步驟完成。
2.1.2 碼書(shū)聯(lián)合優(yōu)化 基于上述得到的初始碼書(shū),提出一種聯(lián)合優(yōu)化方法,通過(guò)降低特征向量的總體量化誤差來(lái)對(duì)初始碼書(shū)進(jìn)行優(yōu)化,期望得到區(qū)分度更高的多層碼書(shū),進(jìn)而提高特征向量的近似表示精度。
對(duì)于L層(碼書(shū)總層數(shù)L>1)初始碼書(shū),其優(yōu)化方法是一個(gè)順序優(yōu)化的過(guò)程,即:從第1層碼書(shū)開(kāi)始依次優(yōu)化直到最后一層碼書(shū)。
對(duì)于第i層(1≤i≤L)碼書(shū),其優(yōu)化過(guò)程通過(guò)以下步驟完成:(1)計(jì)算訓(xùn)練樣本集中每個(gè)樣本特征向量與其它層對(duì)應(yīng)的量化結(jié)果對(duì)應(yīng)向量之和的殘差向量。這里,由于特征向量與其對(duì)應(yīng)量化結(jié)果對(duì)應(yīng)的向量維度不同,因而在此計(jì)算過(guò)程中,需要根據(jù)每層碼書(shū)對(duì)應(yīng)的逆投影矩陣,將量化結(jié)果投影到原始向量的維度空間;(2)更新碼書(shū)。對(duì)具有相同第i層編碼的樣本特征向量對(duì)應(yīng)的殘差向量求均值,并將其作為新的碼書(shū);(3)根據(jù)新生成的碼書(shū),對(duì)訓(xùn)練樣本集進(jìn)行量化,更新從第i層碼書(shū)到最后一層碼書(shū)對(duì)應(yīng)的編碼。
Fig.2 Training two-level initial codebooks
給定一個(gè)特征向量v,圖3中給出了投影增強(qiáng)型殘差量化對(duì)v進(jìn)行量化的兩層示例。具體過(guò)程如下:(1)利用訓(xùn)練階段得到的第1層投影矩陣,將v投影降維到第1層碼書(shū)所在低維向量空間得到vp;(2)基于第1層碼書(shū),根據(jù)(1)式對(duì)vp進(jìn)行量化,得到Q(vp);(3)利用投影逆矩陣,將第1層的量化輸出逆投影到原始高維向量空間,計(jì)算v與逆投影向量之間的殘差向量e1;(4)利用事先訓(xùn)練的第2層投影矩陣,將e1投影降維到第2層碼書(shū)所在的低維向量空間得到e1,p;(5)根據(jù)第2層碼書(shū),利用(1)式對(duì)e1,p進(jìn)行量化,得到Q(e1,p)。
Fig.3 Quantizing vector by projection-based enhanced residual vector quantization
如果投影增強(qiáng)型殘差量化模型的層數(shù)大于2,那么特征向量在之后碼書(shū)層的量化方式與第2層一致。
為了評(píng)估投影增強(qiáng)型殘差量化對(duì)特征向量的近似表示精度,類(lèi)似于參考文獻(xiàn)[19],設(shè)計(jì)近似歐氏距離計(jì)算方法并用于完全檢索。
(3)
式中,μ為應(yīng)用PCA之前用于調(diào)整中心的均值向量,cv,l∈Cl,cv, l(D×1向量)為v(d×1向量)在第l層碼書(shū)Cl的量化輸出,D為投影降維后的向量維度,d為向量的原始維度,L為投影增強(qiáng)型殘差量化的碼書(shū)總層數(shù),MlT(d×D投影矩陣)為第l層的逆投影矩陣。
(4)
本文中將在GIST和VLAD兩個(gè)公開(kāi)數(shù)據(jù)集[23]上評(píng)估應(yīng)用了投影增強(qiáng)型殘差量化在碼書(shū)訓(xùn)練和完全檢索方面的性能。如表1所示,GIST和VLAD兩個(gè)數(shù)據(jù)集包含3個(gè)子集,其中,訓(xùn)練集用于訓(xùn)練碼書(shū);數(shù)據(jù)庫(kù)集是用于獲取從中檢索同查詢點(diǎn)近似的特征向量;查詢集用于對(duì)檢索算法進(jìn)行性能評(píng)估。
Table 1 Information of experimental datasets
所有實(shí)驗(yàn)都是在一臺(tái)Intel Core i5 2.8GHZ CPU, 32G內(nèi)存的PC,MATLAB 2011環(huán)境下完成的。
圖4和圖5反映了GIST和VLAD數(shù)據(jù)集上投影維度D∈{23,24,25,26,27,28,29}對(duì)總體量化誤差的影響。實(shí)驗(yàn)參量設(shè)置中,投影增強(qiáng)型殘差量化的每層碼書(shū)中聚類(lèi)中心數(shù)量k固定為256,碼書(shū)層數(shù)為L(zhǎng)∈{4,8,16}。
Fig.4 Overall quantization errors over variant projected dimensionality on GIST
Fig.5 Overall quantization errors over variant projected dimensionality on VLAD
如圖4和圖5所示,當(dāng)碼書(shū)層數(shù)固定時(shí)(如L=8),隨著PCA投影的維度從512維~8維的變化,總體誤差呈現(xiàn)出先減少后增加的曲線變化。觀察發(fā)現(xiàn),當(dāng)投影維度D=128維時(shí),GIST和VLAD數(shù)據(jù)集上總體量化誤差最小。
圖6和圖7反映了GIST和VLAD數(shù)據(jù)集上投影維度D∈{23,24,25,26,27,28,29}對(duì)檢索精度(用召回率Rrecall@n(n=100)表示,其中n表示檢索返回的結(jié)果數(shù)量)的影響。實(shí)驗(yàn)參量設(shè)置中,投影增強(qiáng)型殘差量化的每層碼書(shū)中聚類(lèi)中心數(shù)量k固定為256,碼書(shū)層數(shù)為L(zhǎng)∈{4,8,16}。
如圖6和圖7所示,從投影維度512維開(kāi)始,檢索精度先是隨著維度降低而不斷提升直到投影維度為128維,隨后檢索精度隨著投影維度的降低而不斷降低。對(duì)比圖6和圖7,參量D的變化對(duì)VLAD數(shù)據(jù)集上檢索精度的影響比GIST更大。
Fig.6 Rrecall@100 over variant parameter D on GIST
Fig.7 Rrecall@100 over variant parameter D on VLAD
針對(duì)最近鄰搜索的性能對(duì)比,將投影增強(qiáng)型殘差量化(projected enhanced residual vector quantization,PERVQ)與其它4種方法(見(jiàn)表2)從檢索精度和檢索效率(檢索時(shí)間)兩個(gè)方面進(jìn)行比較。在表2所示4種方法的相關(guān)文獻(xiàn)[4,17-19]中,依據(jù)參考文獻(xiàn)中實(shí)驗(yàn)數(shù)據(jù),綜合檢索速度和檢索精度平衡,都是采用8個(gè)子碼書(shū),并且每個(gè)子碼書(shū)都是由256個(gè)聚類(lèi)中心構(gòu)成。
Table 2 Description of compared methods
所有方法均采用相同的編碼長(zhǎng)度,檢索精度用召回率Rrecall@n指標(biāo)進(jìn)行評(píng)估。
為公平起見(jiàn),PERVQ采用同PQ,RVQ,ERVQ和正交RVQ相同的碼書(shū)參量,即L=8層碼書(shū)構(gòu)成的8級(jí)子量化器,并且每層碼書(shū)的碼書(shū)規(guī)模設(shè)置為256。
4.4.1 訓(xùn)練碼書(shū)的時(shí)間開(kāi)銷(xiāo)對(duì)比 PERVQ建立在ERVQ的基礎(chǔ)上,解決ERVQ在原始高維向量空間訓(xùn)練碼書(shū)帶來(lái)的碼書(shū)訓(xùn)練時(shí)間效率受特征向量維度制約的問(wèn)題,旨在提升碼書(shū)的訓(xùn)練效率的同時(shí),綜合投影誤差和量化誤差對(duì)低維向量空間的碼書(shū)進(jìn)行優(yōu)化。
圖8為GIST數(shù)據(jù)集上RVQ,ERVQ以及投影到各個(gè)向量維度D∈{23,24,25,26,27,28,29}上,訓(xùn)練8層碼書(shū)對(duì)應(yīng)碼書(shū)所花費(fèi)的時(shí)間。相比RVQ,由于ERVQ和PERVQ都增加了碼書(shū)優(yōu)化步驟用于提升碼書(shū)精度,因而額外增加了優(yōu)化碼書(shū)階段的時(shí)間開(kāi)銷(xiāo)。從圖8可以觀察到,將PCA和ERVQ結(jié)合后,PERVQ訓(xùn)練碼書(shū)花費(fèi)的時(shí)間要明顯少于ERVQ,此外,當(dāng)D∈{23,24,25}時(shí),PERVQ訓(xùn)練碼書(shū)所花費(fèi)的時(shí)間比RVQ少。
Fig.8 Time cost comparison of different methods on GIST
4.4.2 檢索精度對(duì)比 從圖6可以觀察到,在GIST數(shù)據(jù)集上,當(dāng)L=8,各層碼書(shū)規(guī)模為256個(gè)聚類(lèi)中心,PERVQ在D=128時(shí),具有最優(yōu)的近似最近鄰?fù)耆珯z索精度。圖9為在GIST數(shù)據(jù)集上不同方法的檢索精度。PERVQ采用8層碼書(shū),每層碼書(shū)初始聚類(lèi)中心數(shù)為256。從圖9可以看出,PQ方法檢索性能明顯不如其它方法,RVQ和ERVQ由于考慮了量化誤差,在相同編碼長(zhǎng)度下,其檢索精度有了較大提升,優(yōu)于積量化。PERVQ不僅考慮了總體量化誤差,也考慮了投影誤差,檢索精度較殘差量化方法好于RVQ,ERVQ和PQ。PERVQ同orthogonal RVQ具有相當(dāng)?shù)臋z索精度,但orthogonal RVQ是在原始高維向量空間進(jìn)行多層碼書(shū)訓(xùn)練和優(yōu)化。
Fig.9 Rrecall@n comparison of different methods on GIST
4.4.3 檢索效率對(duì)比 在GIST數(shù)據(jù)集上對(duì)不同方法的檢索時(shí)間進(jìn)行了比較,所有方法的參量設(shè)置同上,檢索時(shí)間如表3所示。
Table 3 Comparison of search time on GIST
PERVQ,ERVQ,RVQ和orthogonal RVQ在應(yīng)用完全檢索時(shí)都是利用向量的近似表示來(lái)計(jì)算查詢向量和庫(kù)向量之間的近似歐氏距離。不同之處在于ERVQ,RVQ以及orthogonal RVQ的查找表構(gòu)造是在高維空間進(jìn)行,而PERVQ的查找表是在低維空間進(jìn)行構(gòu)造,因而PERVQ生成查找表比ERVQ和RVQ具有更快的速度,但是PERVQ將查詢向量投影到低維空間相比RVQ和ERVQ需要花費(fèi)額外的投影時(shí)間。因此當(dāng)構(gòu)造查找表對(duì)效率的提升程度大于向量投影對(duì)時(shí)間效率影響程度時(shí),PERVQ比ERVQ,RVQ以及orthogonal RVQ具有更好的檢索速度。
由表3可見(jiàn),PERVQ的近似最近鄰?fù)耆珯z索在投影維度D∈{23,24,25}時(shí),其檢索時(shí)間花費(fèi)少于PQ,RVQ和ERVQ。結(jié)合圖6和圖9,當(dāng)D∈{23,24,25},PERVQ仍具有同ERVQ和orthogonal RVQ相當(dāng)?shù)臋z索精度。
提出了一種投影增強(qiáng)型殘差量化方法,通過(guò)結(jié)合前期研究工作,在訓(xùn)練碼書(shū)時(shí),將圖像視覺(jué)特征從高維向量空間投影到低維向量空間,降低訓(xùn)練過(guò)程中的時(shí)間開(kāi)銷(xiāo);為了降低投影到低維向量空間帶來(lái)的投影誤差,在訓(xùn)練碼書(shū)的過(guò)程中,同時(shí)考慮量化和投影所產(chǎn)生的誤差,進(jìn)而保證所生成碼書(shū)的精度。實(shí)驗(yàn)結(jié)果表明,提出的PERVQ在碼書(shū)訓(xùn)練時(shí)間效率上,較ERVQ具有明顯提升作用,同時(shí)保證了檢索精度。