周巍
關(guān)鍵詞:圖像識別技術(shù);工業(yè)設(shè)計;信息交互;應(yīng)用
1 相關(guān)理論簡述
1.1 信息交互的概念
信息交互主要是指人類與人類之間、人類與物體之間通過各種各樣的手段來完成不同信息的傳遞,進(jìn)而實現(xiàn)交互的目的。具體而言便是自然以及社會之中各類資料、數(shù)據(jù)、情報以及技術(shù)知識能夠通過某種載體來完成及時的傳遞和交流,而信息交互屬于一種文字信息載體[1]。當(dāng)代社會科學(xué)技術(shù)水平有了長足的進(jìn)步,各類數(shù)字產(chǎn)品應(yīng)運而生,不同于實際產(chǎn)品對于外觀樣式的高度重視,數(shù)字產(chǎn)品主要是對用戶的目的及行為較為關(guān)注,并基于此來實現(xiàn)信息交互,進(jìn)而使用戶能夠收獲上佳的體驗。隨著時代的不斷變遷,信息交互已經(jīng)由傳統(tǒng)的工具以及武器演變成了有著復(fù)雜工藝的各類先進(jìn)設(shè)備,最為常見的便是通過互聯(lián)網(wǎng)所提供的便利來實現(xiàn)信息交互。
1.2 圖像識別技術(shù)的概念
圖像識別技術(shù)主要是指通過計算機來處理、分析以及理解圖形,進(jìn)而在不同模式之下完成既定目標(biāo)的一種技術(shù)。是基于深度學(xué)習(xí)算法的實踐應(yīng)用。圖像識別技術(shù)主要包含了人臉識別以及商品識別兩種技術(shù)。其中人臉識別主要被應(yīng)用于身份驗證、安全檢查以及移動支付領(lǐng)域;商品識別則是被應(yīng)用于對各類商品進(jìn)行流通之時,尤其是智能零售柜以及無人收貨等領(lǐng)域。在進(jìn)行圖像識別時,主要有以下幾個流程:采集圖像、預(yù)處理圖像、提取圖像特點、實現(xiàn)圖像識別。當(dāng)前市場中應(yīng)用較為廣泛的圖像識別軟件主要有國外的有康耐視以及國內(nèi)的海深科技、圖智能等。
2 圖像識別技術(shù)在工業(yè)設(shè)計信息交互中的應(yīng)用意義
設(shè)計可以彌補科技和人之間的缺口,設(shè)計是能夠?qū)⑶楦校ㄐ缕娓?、獨立感、安全感、感性、信心、力量感)、人機工程(易用性、安全性、舒適性)、美學(xué)(視覺、聽覺、嗅覺、觸覺)結(jié)合起來的因素[2]?!凹夹g(shù)”指的是采用先進(jìn)的技術(shù)或加工質(zhì)量很高的傳統(tǒng)性技術(shù),為產(chǎn)品賦予足夠的功能,使產(chǎn)品持續(xù)正常工作,并保持良好的技術(shù)能力。在進(jìn)行工業(yè)設(shè)計時,相關(guān)人員會根據(jù)自身的經(jīng)驗以及視覺感受來讓產(chǎn)品在材料、形態(tài)、結(jié)構(gòu)、裝飾、色彩以及表面加工等方面有著全新的品質(zhì),并且通過各類宣傳、展示以及包裝等手段來對產(chǎn)品的視覺效果進(jìn)行評價。就本質(zhì)而言,工業(yè)設(shè)計并不是最終的目的,而是為了實現(xiàn)人類其它目的而使用信息交互的一種手段。圖像識別在機器視覺工業(yè)領(lǐng)域中最典型的應(yīng)用就是二維碼的識別,二維碼就是我們平時常見的條形碼中最為普遍的一種。將大量的數(shù)據(jù)信息存儲在這小小的二維碼中,通過條碼對產(chǎn)品進(jìn)行跟蹤管理,可以方便的對各種材質(zhì)表面的條碼進(jìn)行識別讀取,大大提高了現(xiàn)代化生產(chǎn)的效率。由此能夠看出,圖像識別技術(shù)應(yīng)用于工業(yè)設(shè)計信息交互之中,能夠有效提升信息交互質(zhì)量及效率,保證工業(yè)設(shè)計所獲取的信息更為準(zhǔn)確,為后續(xù)工業(yè)設(shè)計產(chǎn)品的誕生奠定堅實的基礎(chǔ)[3]。
3 圖像識別技術(shù)在工業(yè)設(shè)計信息交互中的應(yīng)用思路
當(dāng)前工業(yè)設(shè)計已經(jīng)融入了人們?nèi)粘I钪械牟煌I(lǐng)域,有著較為廣泛的應(yīng)用范圍。例如,設(shè)計普通工業(yè)用品、設(shè)計交通運輸工具、設(shè)計商業(yè)廣告形式、設(shè)計各類建筑等。工業(yè)設(shè)計將工業(yè)自身與各類技術(shù)以及設(shè)計進(jìn)行了高度的融合,讓民眾的生活水平有了較大幅度的提升,并且勞動生產(chǎn)率也有了長足的進(jìn)步,人們的文化視野也有所豐富。但其中依然存在著一定的問題,例如部分工業(yè)產(chǎn)品的設(shè)計與制造效率較低,產(chǎn)品的合格率不符合相關(guān)標(biāo)準(zhǔn),產(chǎn)品品相不滿足人們的基本需求等。而通過圖像識別技術(shù)的應(yīng)用,則能夠有效解決這類問題,相關(guān)人員在進(jìn)行工業(yè)設(shè)計時能夠?qū)⒆陨淼南敕w現(xiàn)在產(chǎn)品之中,從而帶給用戶更具個性化的產(chǎn)品體驗。具體而言,圖像識別技術(shù)在工業(yè)設(shè)計信息交互中的應(yīng)用主要有以下幾個方面:
3.1 圖像識別技術(shù)應(yīng)用于工業(yè)產(chǎn)品的外觀設(shè)計
圖像識別技術(shù)最為重要的作用便是更為便捷地完成人類與產(chǎn)品之間的交互,而將其應(yīng)用于外觀設(shè)計之中,有效提升交互的效率及效果。最為典型的便是2017 年所發(fā)布的iPhone X 手機,其將圖像識別技術(shù)作為了其中的核心技術(shù),手機的外觀屏幕采用了異型曲面屏,并且在屏幕中存在著一定的開孔,這樣一來就能夠嚴(yán)格遵循相應(yīng)的交互邏輯,進(jìn)而實現(xiàn)人臉支付等一系列的功能。在該手機中的圖像識別技術(shù)主要流程是對人臉進(jìn)行識別、對面部的特征進(jìn)行提取、對信息進(jìn)行對比分析進(jìn)而得出結(jié)論[4]。手機的人臉識別技術(shù)不同于普通手機,其開孔部位存在著紅外攝像頭、深感攝像頭以及泛光感應(yīng)元件,還有前置攝像頭與點陣投影器。依次經(jīng)過紅外拍臉,結(jié)構(gòu)光與點陣投影器獲取3D 精確模型,轉(zhuǎn)化為數(shù)學(xué)表達(dá)式,存入手機的安全區(qū)域。通過這樣的方式能夠讓產(chǎn)品的安全性得以提升,并且讓圖像識別技術(shù)和工業(yè)設(shè)計進(jìn)行了更為深入的融合,這樣一來工業(yè)設(shè)計方案能夠更為便捷地實現(xiàn),工業(yè)設(shè)計人員也能夠找到全新的延展方向。
3.2 圖像識別技術(shù)應(yīng)用于工業(yè)產(chǎn)品的傳播與推廣
工業(yè)設(shè)計的目的是通過信息交互來全面了解用戶的實際需求,進(jìn)而不斷地對現(xiàn)有的產(chǎn)品進(jìn)行完善。而要想有效提升信息交互質(zhì)量,就必須做好工業(yè)產(chǎn)品的傳播與推廣。通過圖像識別技術(shù)的應(yīng)用,讓相關(guān)人員對用戶的實際情況以及周圍的使用環(huán)境有一個全方位的了解,進(jìn)而在產(chǎn)品形式設(shè)計以及內(nèi)容設(shè)計方面進(jìn)行創(chuàng)新,以此來不斷提升工業(yè)產(chǎn)品在市場中的占有率。較為典型的例子便是二維碼系統(tǒng)[5],在掃描大部分工業(yè)產(chǎn)品所附帶的二維碼之后,系統(tǒng)經(jīng)過用戶同意便可獲取用戶所在的地址及偏好等特征,進(jìn)而通過統(tǒng)計分析得出平均結(jié)果,從而為設(shè)計人員后續(xù)的設(shè)計方向提供理論上的參考。
3.3 圖像識別技術(shù)應(yīng)用于工業(yè)設(shè)計的圖像分類
3.3.1 對圖像進(jìn)行細(xì)粒度分類
這是在分類的基礎(chǔ)上進(jìn)行的基本分類,還有更為詳細(xì)的子分類,如鳥類種類、汽車樣式、犬類品種等。目前,在行業(yè)和現(xiàn)實生活中有著廣泛的業(yè)務(wù)需求和應(yīng)用場景。與粗粒度圖像相比,細(xì)粒度圖像具有更為相似的外觀和特征,并且在采集過程中存在姿態(tài)、透視、光照、遮擋和背景干擾等問題,導(dǎo)致類間差異大、類內(nèi)差異小的現(xiàn)象,使得分類更加困難。
3.3.2 多標(biāo)簽圖像分類
在現(xiàn)實生活中,圖像往往包含多個類別的對象。多標(biāo)簽圖像分類可以同時判斷圖像中是否包含這些內(nèi)容,從而更好地解決現(xiàn)實生活中的問題。單標(biāo)簽圖像分類是指每幅圖像對應(yīng)一個類別標(biāo)簽。根據(jù)目標(biāo)分類的個數(shù),單標(biāo)簽圖像分類可分為兩類和多類。多標(biāo)簽圖像分類主要采用圖像識別技術(shù)中的多標(biāo)簽決策樹算法。該算法利用決策樹技術(shù)處理多標(biāo)簽數(shù)據(jù),基于多標(biāo)簽熵的信息增益準(zhǔn)則遞歸構(gòu)造決策樹。樹結(jié)構(gòu)包括非葉節(jié)點、分支和葉節(jié)點。采用決策樹模型進(jìn)行分類時,特征屬性由非葉節(jié)點表示,特征屬性在一定范圍內(nèi)的輸出由非葉節(jié)點之間的分支表示,類別由葉節(jié)點存儲。其計算思想是:首先計算每個特征的信息增益,選擇增益最大的特征將樣本分成左右兩個子集,進(jìn)行遞歸直至滿足停止條件,構(gòu)造決策樹。對于新的測試樣本,沿著根節(jié)點到葉節(jié)點遍歷一條路徑,并計算葉節(jié)點樣本子集中每個標(biāo)簽為0 和1 的概率。如果概率超過0.5,則包括標(biāo)簽。在遍歷到不同葉節(jié)點的所有路徑之后,可以確定所有標(biāo)簽信息。
目前,圖像分類的任務(wù)在很大程度上依賴于監(jiān)督學(xué)習(xí),即每個樣本都有相應(yīng)的標(biāo)簽。通過深層神經(jīng)網(wǎng)絡(luò),我們可以不斷學(xué)習(xí)每個標(biāo)簽對應(yīng)的特征,最終實現(xiàn)分類。在這種情況下,數(shù)據(jù)集的容量和標(biāo)簽的質(zhì)量往往對模型的性能起著決定性的作用。
3.3.3 無監(jiān)督圖像分類
如果將神經(jīng)網(wǎng)絡(luò)視為在軌道上運行的F1 賽車,則數(shù)據(jù)集是為其持續(xù)提供動力的能量。如果沒有高質(zhì)量的數(shù)據(jù)集作為基礎(chǔ),就無法驅(qū)動神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
高質(zhì)量的數(shù)據(jù)集自然會給注釋帶來困難。據(jù)統(tǒng)計,在一幅圖像中標(biāo)注一個對象類別大約需要2 到3 秒鐘。然而,在實際應(yīng)用中,數(shù)據(jù)集往往包含數(shù)萬幅圖像,因此整個標(biāo)注過程將變得異常漫長。特別是在細(xì)粒度分類和多標(biāo)簽分類任務(wù)中,標(biāo)簽代價隨著目標(biāo)數(shù)目和識別難度的增加呈指數(shù)增長。
無監(jiān)督圖像分類主要采用PCA 和t-SNE 算法。PCA(PrincipalComponent Analysis)算法是機器學(xué)習(xí)領(lǐng)域中一種典型的旋轉(zhuǎn)數(shù)據(jù)集方法,其旋轉(zhuǎn)特征不具有統(tǒng)計相關(guān)性。通過數(shù)據(jù)集的旋轉(zhuǎn),我們可以根據(jù)新特征的重要性構(gòu)造子集來解釋數(shù)據(jù),從而構(gòu)造新的數(shù)據(jù)集表示。作為近年來廣泛應(yīng)用的數(shù)據(jù)分析算法,t-SNE 的主要思想是尋找數(shù)據(jù)的二維表示,并盡可能保持?jǐn)?shù)據(jù)點之間的距離,然后盡量使原始特征空間中較近的點更近,而原始特征空間中較遠(yuǎn)的點更遠(yuǎn)。它關(guān)注的是彼此距離較近的點,而不是較遠(yuǎn)的點。原則上,上述兩種數(shù)據(jù)集轉(zhuǎn)換方法復(fù)雜度較高,且算法目標(biāo)過于明確,使得抽象的低維數(shù)據(jù)中不存在二次信息,而這些二次信息可能是區(qū)分更高層次數(shù)據(jù)的主要因素。因此,這兩種算法大多用于網(wǎng)絡(luò)訓(xùn)練前的數(shù)據(jù)預(yù)處理階段,為后續(xù)的操作提供相應(yīng)的先驗知識。
4 結(jié)語
綜上所述,圖像識別技術(shù)已經(jīng)被應(yīng)用到生活中的各個領(lǐng)域,對于工業(yè)設(shè)計而言能夠有效保障信息交互效果,讓設(shè)計人員認(rèn)識到不斷變化的用戶需求,進(jìn)而合理調(diào)整設(shè)計方案,這樣一來用戶的體驗也會更佳。