潘昊 張志偉 王鐵霖
摘 要:隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,CPU計(jì)算能力在突破瓶頸之后,隨之而來(lái)的是海量數(shù)據(jù)導(dǎo)致的算法準(zhǔn)確率降低的難題。本文在機(jī)器學(xué)習(xí)的幫助下,通過(guò)驗(yàn)證手語(yǔ)表達(dá)數(shù)據(jù)集,借助主成分分析模型(PCA)驗(yàn)證測(cè)試集的準(zhǔn)確率,進(jìn)而嘗試優(yōu)化人感知的召回以及準(zhǔn)確率。
關(guān)鍵詞:機(jī)器學(xué)習(xí);感知;召回率
一、引言
人類的大腦是世界上最精密的組織,它的構(gòu)造比現(xiàn)存的任何一臺(tái)計(jì)算機(jī)的構(gòu)造都復(fù)雜的多。因此,在探索人腦內(nèi)如感覺(jué)、直覺(jué)等相關(guān)問(wèn)題時(shí),以現(xiàn)有的工具手段無(wú)法對(duì)大腦進(jìn)行量化的測(cè)試。我們的工作可以作為數(shù)學(xué)和人工智能領(lǐng)域合作的一個(gè)模型,通過(guò)利用數(shù)學(xué)專業(yè)知識(shí)和機(jī)器學(xué)習(xí)高效計(jì)算的各自優(yōu)勢(shì),可以取得較為很好的效果。
我們可以把大腦中假設(shè)存在的“感覺(jué)”系統(tǒng)看做一個(gè)模型,這個(gè)模型是由我們從生活中各個(gè)領(lǐng)域的經(jīng)驗(yàn)與經(jīng)歷訓(xùn)練而得出:在日常生活中,將一個(gè)人生活中遇到的問(wèn)題抽象化為函數(shù)的輸入與輸出。有效以及無(wú)效的輸入可以被腦海記錄,并影響人做出下一次判斷
所謂“直覺(jué)”,不過(guò)是腦中有若干記憶碎片與五感接受到的信息,綜合在一起,跳過(guò)邏輯層次,直接反射到思維之中,其準(zhǔn)確程度,取決于一個(gè)人的經(jīng)驗(yàn)常識(shí)和判斷能力。本文提出了一個(gè)使用機(jī)器學(xué)習(xí)的過(guò)程,以發(fā)現(xiàn)數(shù)學(xué)對(duì)象之間的潛在模式和關(guān)系,通過(guò)歸因技術(shù)理解它們,并嘗試優(yōu)化準(zhǔn)確率以及召回率。
二、系統(tǒng)方案設(shè)計(jì)
在學(xué)生時(shí)代,學(xué)生在遇到?jīng)]見(jiàn)過(guò)或者拿不準(zhǔn)的題目時(shí),通常會(huì)做出判斷,此時(shí)的判斷的依據(jù)一般由自己的感覺(jué)而的來(lái)“我感覺(jué)這題選擇C”,這是一個(gè)分類問(wèn)題。而形成這個(gè)感覺(jué)的過(guò)程,以及影響人做出選擇判斷的因素在各種方面都存在,難以對(duì)因素進(jìn)行量化統(tǒng)計(jì)。本文將所出現(xiàn)的可能因素抽象化為一個(gè)領(lǐng)域的問(wèn)題,進(jìn)而形象的表達(dá)出外界事物對(duì)人的感知的可能影響因素。通過(guò)一個(gè)領(lǐng)域內(nèi)的具體問(wèn)題,進(jìn)而轉(zhuǎn)化為計(jì)算人對(duì)外界事務(wù)判斷的正確率。
在人工智能范圍內(nèi),特別是機(jī)器學(xué)習(xí)領(lǐng)域,提供了一組可以有效檢測(cè)數(shù)據(jù)模式的技術(shù),并在科學(xué)學(xué)科中日益顯示出實(shí)用性。在數(shù)學(xué)領(lǐng)域,人工智能已經(jīng)被證明是一種很有價(jià)值的工具,它可以發(fā)現(xiàn)現(xiàn)有猜想的反例、加速計(jì)算、生成符號(hào)解以及檢測(cè)數(shù)學(xué)對(duì)象中結(jié)構(gòu)的存在。
手語(yǔ)并非是現(xiàn)代才出現(xiàn),古代就有手語(yǔ)的存在,并非專為聾人所有,古人靠手勢(shì)來(lái)傳達(dá)溝通意見(jiàn),而后才慢慢產(chǎn)生語(yǔ)言。古人以打獵耕種為主,社會(huì)上需要遵循的規(guī)則也少,因此聾啞人較能適應(yīng)生活,但文化發(fā)達(dá)后社會(huì)進(jìn)步,抽象的符號(hào)也多,為了適應(yīng)社會(huì)生活,只好藉手語(yǔ)來(lái)表達(dá)溝通情意了。手語(yǔ)是人體表達(dá)語(yǔ)言的一種方式,手語(yǔ)的不同形狀代表的不同的意思。本文試通過(guò)對(duì)手語(yǔ)問(wèn)題的研究算法,淺談人整體的“感覺(jué)”準(zhǔn)確率的影響因素。
本文的算法內(nèi)核中使用多輸出估計(jì)器來(lái)完成圖像。我們的目標(biāo)是根據(jù)手語(yǔ)數(shù)字的上半部分來(lái)預(yù)測(cè)它的下半部分。例如,我們將用第一部分訓(xùn)練我們的模型,它將預(yù)測(cè)第二部分,如圖1所示,描述了一個(gè)通用的方法,通過(guò)這個(gè)方法,本文可以使用機(jī)器學(xué)習(xí)的模型來(lái)抽象人對(duì)事物感知的一種方式,進(jìn)而驗(yàn)證圖形存在的正確與否。
三、算法實(shí)現(xiàn)
(一)數(shù)據(jù)加載
首先,我們需要先加載手語(yǔ)數(shù)字?jǐn)?shù)據(jù)集,我們數(shù)據(jù)的形狀是(2062,64,64),其中2062是圖像的數(shù)量,有64x64像素。本文將使用從0到9的所有圖像。
x_load = np.load('../input /x.npy')
y_load = np.load('../input/ y.npy')
img_size = 64
其次,我們需要設(shè)置訓(xùn)練集以及測(cè)測(cè)試集的數(shù)量。我們用本地的所有數(shù)據(jù)作為訓(xùn)練集,接著選擇10個(gè)圖像作為測(cè)試集。
(二)模型應(yīng)用
主成分分析是一種最流行的降維技術(shù),PCA是一種統(tǒng)計(jì)分析、簡(jiǎn)化數(shù)據(jù)集的方法。它利用正交變換來(lái)對(duì)一系列可能相關(guān)的變量的觀測(cè)值進(jìn)行線性變換,從而投影為一系列線性不相關(guān)變量的值,這些不相關(guān)變量稱為主成分。
主成分分析使用高方差,這意味著它喜歡多樣性。例如,比較上面的兩個(gè)圖像,色框外沒(méi)有多樣性方差;另一面,在紅色框架中有多樣性,第一步是去相關(guān):旋轉(zhuǎn)數(shù)據(jù)樣本與軸線移動(dòng)數(shù)據(jù)樣本,所以他們有意味著零沒(méi)有信息丟失,并且應(yīng)用已學(xué)到的轉(zhuǎn)換方式。
n_components = estimator = decomposition.PCA(n_components=n_components, svd_solver='randomized', whiten=True)
estimator.fit(X)
for i, comp in enumerate(images):
plt.imshow(comp.reshape((64, 64)),interpolation='nearest',vmin=-vmax, vmax=vmax)
plt.savefig('graph.png')
plt.show()
四、小結(jié)
本文分析了主成分分析類型,分析了感知實(shí)現(xiàn)的感知流程。最后針對(duì)手語(yǔ)數(shù)據(jù)集產(chǎn)生設(shè)計(jì)模型的感知修改和感知表達(dá)提出實(shí)現(xiàn)方法。作為人體表達(dá)感知的方式之一,優(yōu)化處理了人體表達(dá)的準(zhǔn)確率。
參考文獻(xiàn):
[1] 汲夢(mèng)宇.三維場(chǎng)景的多視點(diǎn)感知算法研究?[D]. 中國(guó)科學(xué)技術(shù)大學(xué). 2017
[2] 劉巍巍, 周來(lái)水, 莊海軍, 等.分布式同步協(xié)同 CAD /CAM系統(tǒng)的Web模型及實(shí)現(xiàn)[J]. 南京航空航天大學(xué)學(xué)報(bào), 2004, 36 (5): 539-543
[3] 劉曉平, 石慧, 毛崢強(qiáng). 基于信息可視化的協(xié)同感知模型 [J]. 通信學(xué)報(bào), 2006, 27(11): 24-29
[4] 徐茂峰. 雅可比矩陣引導(dǎo)的無(wú)翻轉(zhuǎn)體映射生成算法研究?[D]. 中國(guó)科學(xué)技術(shù)大學(xué). 2021