萬昌 武漢科技大學(xué)
機器視覺技術(shù)已經(jīng)在各領(lǐng)域得到了廣泛應(yīng)用,并在不斷進行技術(shù)開發(fā)的過程中,展現(xiàn)出了優(yōu)勢性的功能。但在當(dāng)前的技術(shù)條件下,大多數(shù)的可視化程序,都作為固定的工序內(nèi)容發(fā)揮作用。而本文提出的技術(shù)條件,則呈現(xiàn)出更加明顯的動態(tài)性特征,在接收與感知信息內(nèi)容的同時,使機器視覺的功能近似率人工的視覺效果,人機交互式的動態(tài)工作。
視覺識別系統(tǒng)中,對物體的分辨是最為核心的內(nèi)容。對機器視覺的優(yōu)化目標(biāo),就是利用科技條件,完成機器對人類識別能力的模仿。在內(nèi)容上,需要對相關(guān)的硬件系統(tǒng)、計算方法、知識體系等內(nèi)容進行完善,在保證圖像處理技術(shù)的同時,加強對已知特征條件的識別能力。
對機器視覺系統(tǒng)的設(shè)計,應(yīng)將技術(shù)發(fā)展分為圖像的處理與識別兩個階段。處在圖像處理階段時,需集中整理采集的數(shù)據(jù)信息,在剔除噪音、環(huán)境等干擾調(diào)價的同時,進行區(qū)域圖像的分割處理[1]。而在進行圖像識別階段時,應(yīng)將重點放在尺寸、形狀等關(guān)鍵的內(nèi)容上,通過取值范圍的確定,過濾出圖像中的非關(guān)鍵信息條件,然后再對相應(yīng)的模板進行匹配,完成目標(biāo)對應(yīng)管理。
Alpha Go系統(tǒng),是智能化人際圍棋對弈的典型案例。在一次執(zhí)白對弈比賽的過程中,系統(tǒng)通過采集黑子的位置信息,攝像器材采集的圖像進行整理,校正拍照角度中的畸變,并對周圍的環(huán)境條件與邊框進行剪裁。當(dāng)完成整理后,并將圖像進行二值化處理,通過黑白色亮度對比的內(nèi)容,完成伽馬值的調(diào)整,使圖像的顯影更加清晰。然后再利用0/1的二值化位置圖,形成完整的坐標(biāo)系統(tǒng)。在轉(zhuǎn)換格式與閾值的基礎(chǔ)上,帶入圍棋運算核心的19×19直方圖分析,通過直角坐標(biāo)系的確認,定位并捕捉自己白棋的棋盤定位。
人工智能技術(shù)是當(dāng)前學(xué)術(shù)研究與應(yīng)用實踐的重點的方向,受到高速率硬件處理技術(shù)影響,在整合大量企業(yè)與科研研究成果內(nèi)的基礎(chǔ)上,此項技術(shù)已經(jīng)可以在較低的成本條件下,達到提升應(yīng)用條件的效果。
延續(xù)上一部分中的圍棋應(yīng)用案例,在智能AI技術(shù)的開發(fā)中,針對圍棋的對弈規(guī)則,技術(shù)人員研發(fā)出了Alpha Go系統(tǒng)的核心運算內(nèi)容。將完全博弈與MCTS算法作為基礎(chǔ),形成了三層神經(jīng)網(wǎng)絡(luò)環(huán)境下的運算系統(tǒng),在對預(yù)測策略網(wǎng)絡(luò)、判斷策略網(wǎng)絡(luò)、價值網(wǎng)絡(luò)的整合中,使用量化評估與加權(quán)計算的方法得到最優(yōu)化的計算結(jié)構(gòu),滿足運算與對弈的基本需要。而在運算模型中,整合形成的運算系統(tǒng)中,會使用APV-MCTS系統(tǒng)對棋局的每條邊線,從決策收益——Q(s,a)、訪問次數(shù)——N(s,a)、先驗概率——P(s,a),這三個狀態(tài)進行閾值選擇,并最終得到公式:
以此達到執(zhí)行系統(tǒng)計算的效果,保證人機對弈的進行。
而在人工智能系統(tǒng)中,還需組建其完整的硬件平臺,通過對CPU的特性設(shè)計,增加其中的浮點運算能力,保證對層次的神經(jīng)網(wǎng)絡(luò)計算內(nèi)容。以此,使人工智能系統(tǒng)在在計算優(yōu)勢的保證下,不斷進行深入的內(nèi)容學(xué)習(xí),對海量運算數(shù)據(jù)進行整合,提高技術(shù)條件下的運算結(jié)果利用率[2]。通過在圍棋人機對弈過程中積累的樣本,完成記錄數(shù)據(jù)積累,使人工智能系統(tǒng)的圍棋水平,趕上甚至是超越人類棋手。
在完成感知與運算的內(nèi)容后,就需要相應(yīng)的機器設(shè)備,完成智能人機交互的最終步驟。自從1961年美國的Unimate公司推出第一臺商用機器人以來,在此項領(lǐng)域持續(xù)半個世紀的發(fā)展中,機器人技術(shù)已經(jīng)得到了廣泛且全面的應(yīng)用,并在進行工業(yè)化生產(chǎn)的過程中積累了豐富的技能內(nèi)容,從基礎(chǔ)的焊接、搬運等技術(shù)內(nèi)容中,逐漸演化出了多種類型的高級能力。而在與感知、分析系統(tǒng)的配合下,可以更加全面的提升數(shù)據(jù)信息的應(yīng)用條件,通過動態(tài)化的信息處理,自主的完成預(yù)定工作內(nèi)容。在進行機器人人機對弈設(shè)計的過程中,可以將這一動作內(nèi)容作為執(zhí)行整體功能的終端,完成對弈程序的功能需要。
為了更加精確的完成技術(shù)處理,首先要對機器的應(yīng)用條件與技術(shù)內(nèi)容進行分析,以此確定執(zhí)行過程中應(yīng)用機器人的具體類型。在內(nèi)容上,應(yīng)從以下四個方面展開分析,最終確定機器人的型號與工作方式。其一,需對控制模式進行選擇,將點位控制與連續(xù)控制作為基本的選擇類型;其二,在驅(qū)動條件上,應(yīng)對液壓、氣壓、電力等多種類型的技術(shù)條件進行討論;其三,需在使用環(huán)境與應(yīng)用空間的內(nèi)容上,分析機器人的負重條件;其四,應(yīng)從經(jīng)濟性狀上,選擇市場環(huán)境中通用的大眾型號機器人,還是專業(yè)化較強的定制型機器人。
以圍棋的對弈為例,可以結(jié)合應(yīng)用特征,使用點位控制模式的機器人,并在綜合分析視覺采集模型的內(nèi)容,將攝像頭、吸附盤等用于配合的功能設(shè)備總重量控制在5kg以內(nèi),以此保證機型構(gòu)建的執(zhí)行功能的高效率條件。同時,可以為其增添電控式的機械臂,使其長度條件可以覆蓋整個棋盤,以此保證人機互動過程中能正常的進行對弈。
通信系統(tǒng),是為了保證機器人設(shè)備與圖像、計算系統(tǒng)連接的重要條件,在通信端口,可以施工RS232型號的串口,通過網(wǎng)絡(luò)或是線路的形式完成控制。以RS232串口為例,在就執(zhí)行通信過程中,可以直接對其中的波特率、數(shù)據(jù)位、停止位、校驗參數(shù)等內(nèi)容進行確認與合適,以此保證機器人端口與計算數(shù)據(jù)端口的同步性條件,以高匹配度完成人際互動。而為了更好的執(zhí)行這一內(nèi)容,還需細致且全面的完成信息編寫內(nèi)容,在使用特定程序協(xié)議的基礎(chǔ)上,執(zhí)行AI計算機的內(nèi)部序列,并在執(zhí)行指令的基礎(chǔ)上,確定放置棋子與提取棋子的動作指令。
將機器視覺、人工智能、機器智能這三個模塊進行整合,可以更好的完成動態(tài)化的機器視覺應(yīng)用,并在加強人際交互過程的同時,提高智能化水平。通過對智能圍棋對弈系統(tǒng)的分析,可以從簡單的技術(shù)模型基礎(chǔ)上,加深機器視覺的交互研究內(nèi)容,并在拓展應(yīng)用條件的基礎(chǔ)上,擴大適用范圍,使機械視覺背景下的人機交互展現(xiàn)出更加明顯的示范作用,推進技術(shù)的持續(xù)發(fā)展。