最新研究進(jìn)展-信息科學(xué)與電子工程專輯
於志文 教授 西北工業(yè)大學(xué)計算機(jī)學(xué)院
近年來,可記錄會議并以方便未來回顧為目的分析所產(chǎn)生音視頻內(nèi)容的智能會議系統(tǒng)逐漸成為相關(guān)研究領(lǐng)域的興趣熱點。一套成功的智能會議系統(tǒng)依賴多種技術(shù),包括設(shè)備、算法和框架結(jié)構(gòu)等方面。在這里,我們簡要概述了智能會議系統(tǒng)架構(gòu)、會議捕捉、會議識別、語義加工和評估方法等方面已有的研究和技術(shù)。我們旨在通過對基本技術(shù)的概述來幫助理解智能會議系統(tǒng)的關(guān)鍵設(shè)計點。同時,本文還總結(jié)了發(fā)展現(xiàn)有智能會議系統(tǒng)的過程中可能遇到的開放問題。
——摘自《ACM COMPUT SURV》
向世明 研究員 中國科學(xué)院自動化研究所
本文提出了一種用于半監(jiān)督分類的局部樣條回歸法。我們方法的核心是在Sobolev空間中引入一個展開樣條,將數(shù)據(jù)點直接定位到分類標(biāo)簽。樣條由多項式和Green函數(shù)組成,是平滑的、非線性的,可以高精度插入分散的數(shù)據(jù)點。尤其是在臨近區(qū)域內(nèi)通過正則化最小二乘回歸計算最佳樣條中效果更加明顯。利用該樣條,每個臨近數(shù)據(jù)點被定位到分類標(biāo)簽。然后,我們估算了正則損失,并進(jìn)一步制定了分類標(biāo)簽向量。最終,局部臨近數(shù)據(jù)的所有損失被累積在一起,以測定標(biāo)簽與非標(biāo)簽數(shù)據(jù)間的全局一致性。為實現(xiàn)半監(jiān)督分類的全局性,我們將局部樣條的全局損失和標(biāo)記數(shù)據(jù)分類標(biāo)簽的平方差結(jié)合在一起建立了一個目標(biāo)方程。通過這種方法,我們建立了全局最佳分類可以被最終獲得的直推式分類算法。在半監(jiān)督學(xué)習(xí)設(shè)定中,我們分析了所提出的算法,并處理成Laplacian正則化結(jié)構(gòu)。在公共數(shù)據(jù)集、應(yīng)用程序交互圖像分割和圖像摳圖比較分類實驗均表明我們方法的有效性。
——摘自《IEEE T PATTERN ANAL》
周志華 教授 南京大學(xué)計算機(jī)科學(xué)與技術(shù)系
大多數(shù)傳統(tǒng)人臉識別系統(tǒng)都試圖實現(xiàn)低識別錯誤率,在此過程中隱含著假設(shè)所有錯誤分類的損失均是相同的。在這里,我們論證了這絕不是一個合理的假定,這是因為在大多數(shù)人臉識別的應(yīng)用想定中不同類型的錯誤將導(dǎo)致不同的損失。例如,如果一個基于人臉識別系統(tǒng)的門禁將家庭成員錯誤地識別成陌生人,他/她將不被允許進(jìn)入房屋,這僅僅是個錯誤。但是,如果將陌生人錯誤地識別為家庭成員而被允許進(jìn)入,這將是一個很嚴(yán)重的災(zāi)難。我們提出了將人臉識別問題定為多分類代價敏感學(xué)習(xí)任務(wù)的框架,并為該任務(wù)開發(fā)出兩個理論合理的方法。實驗結(jié)果證明了我們所提出方法的有效性和功效。
——摘自《IEEE T PATTERN ANAL》
郇中丹 教授 北京師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院
我們提出了一種用于復(fù)原高密度脈沖噪聲的彩圖的全新變分框架。本項工作的創(chuàng)新之處在于在代價功能中引入了一個自適應(yīng)加權(quán)數(shù)據(jù)保真項。該保真項由統(tǒng)計方法推導(dǎo)出,包含兩個加權(quán)函數(shù)及若干個噪音的統(tǒng)計控制參數(shù)。該方法是基于以下事實:脈沖噪音可以被近似為概率密度函數(shù)為有限混合模型的附加噪音。Bayesian框架被用作公式,其中似然函數(shù)由混合模型給出。受到期望值最大化算法的啟發(fā),在本研究中我們使用了兩個帶變分框架的模型。所提出模型的高級形式是:加權(quán)函數(shù)可有效探測圖像中的噪音;得到噪音信息后,所提出的算法可以通過更新加權(quán)函數(shù)和控制參數(shù)來自動平衡恢復(fù)影像規(guī)律性和保真項。這兩步可以確保即使對于高比例脈沖噪音(90%以上)的退色彩圖,仍能獲得很好的恢復(fù)。此外,利用分裂算法可以非??斓氐玫皆撍惴ǖ臄?shù)值實現(xiàn)。數(shù)學(xué)實驗結(jié)果和其他方法比較證明了我們方法的效率。
——摘自《INT J COMPUT VISION》
查紅彬 教授 北京大學(xué)信息科學(xué)技術(shù)學(xué)院
我們提出了一種新方法用于學(xué)習(xí)推土機(jī)距離的魯棒地面距離函數(shù)以使其適于定量兩個特征集的部分相似性。首先,我們定義了地面距離作為通常用作特征-特征基本距離(或相似性)度量的單調(diào)變換,因此在計算推土機(jī)距離的過程中,算法可以更好地將其核心定位至特征映射上,而不被無關(guān)映射影響。由此,所提出的方法特別適用于存在嚴(yán)重的閉塞和混亂問題的3D局部形狀檢索。我們證明當(dāng)變換滿足某些條件時,基本距離的度量屬性足以保證地面距離為米制,這可以使大型數(shù)據(jù)庫快速檢索技術(shù)上成為可能。其次,我們基于realAdaboost算法提出了差異化的學(xué)習(xí)框架以優(yōu)化變換函數(shù)。該優(yōu)化可以在無參數(shù)假設(shè)變換的分段常近似的范圍內(nèi)實現(xiàn)。最后,3D局部形狀檢索的大量實驗強(qiáng)有力地證明了我們所提出技術(shù)的有效性。
——摘自《INT J COMPUT VISION》
胡占義 研究員 中國科學(xué)院自動化研究所
我們提出一種新方法(ICF),用對應(yīng)函數(shù)來識別點對應(yīng)以避免在給定的推測點對應(yīng)過程中的不匹配。通過分析單應(yīng)性函數(shù)的內(nèi)涵,我們引出了一個用于3D屏幕的雙影像對應(yīng)函數(shù)的新概念,可以通過將一個圖像定位到另一個圖像對應(yīng)點來獲得對應(yīng)點間的關(guān)系。因為在現(xiàn)實應(yīng)用中對應(yīng)函數(shù)是未知的,所以我們還研究了如何從給出對應(yīng)點中計算對應(yīng)函數(shù)的方法,并提出了基于診斷技術(shù)和SVM的迭代估計通信函數(shù)。進(jìn)而,所提出的ICF方法能通過檢查是否與計算對應(yīng)函數(shù)相一致來避免不匹配?;谡鎸崍D像的大量實驗證明我們所提出方法的優(yōu)越性能。此外,ICF是用于避免不匹配的通用方法,還適用于剛性物體或未知變形的非剛性物體的圖像。
——摘自《INT J COMPUT VISION》
張軍 教授 中山大學(xué)信息科學(xué)與技術(shù)學(xué)院
通過傳感器調(diào)度操作使傳感器網(wǎng)絡(luò)生命周期最大化是建設(shè)低能耗無線傳感器網(wǎng)絡(luò)的有效方法。在目標(biāo)區(qū)域內(nèi)隨機(jī)部署后,每套設(shè)備都可以完全覆蓋整個目標(biāo)區(qū)域,如何找出最大數(shù)量的傳感器不相交集是一個NP完全問題。我們提出了一種結(jié)合了遺傳算法和時間表過渡操作的混合方法(STHGA)來解決這一問題。從字面上來說,STHGA與其他方法的不同之處在于,STHGA采用正向編碼方案,并使用了帶時間表過渡操作的算法。正向編碼方案的創(chuàng)新性是每條染色體的最大基因值的增加與解決方案的質(zhì)量保持一致。通過過渡限制染色體,正向編碼方案反映出傳感器可行性計劃的結(jié)構(gòu)特點,并為進(jìn)一步改進(jìn)提供了指導(dǎo)。在STHGA中,遵守編碼要求、基因操作和方案過渡操作可協(xié)同將不完全覆蓋集改變?yōu)橥耆模ㄟ^數(shù)集中冗余傳感器的時間表使其他集仍保持完全覆蓋度。多個目標(biāo)點(點覆蓋面)和整個區(qū)域的感應(yīng)用于評估STHGA的效率。此外,我們還分析了傳感器的數(shù)量和感應(yīng)范圍,STHGA性能對感應(yīng)器豐度的影響。實驗結(jié)果顯示我們所提出的算法在速度和質(zhì)量解決方案兩個方面都優(yōu)于現(xiàn)有方法。
——摘自《IEEE T EVOLUT COMPUT》
姚新 教授 中國科學(xué)技術(shù)大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院
我們研究了將基于群體的算法應(yīng)用于數(shù)值優(yōu)化問題,在一個給定的預(yù)算時間內(nèi)必須得到一個解。雖然進(jìn)化算法、粒子群優(yōu)化和差分進(jìn)化等多個基于群體的算法已被開發(fā)出來,并被用于數(shù)值優(yōu)化問題,但是算法的性能因問題不同而發(fā)生明顯的改變。這暗示著存在于算法選擇相關(guān)的固有風(fēng)險。我們認(rèn)為作為已有算法和向其中投入總時間預(yù)算的替代,必須具備在多種不同的算法中可以更小風(fēng)險的分配時間。由此,我們提出一種可以將多種算法作為其結(jié)構(gòu)算法的的新方法,命名為基于群體算法投資組合(PAP)。PAP運(yùn)行每個帶有給定時間預(yù)算的結(jié)構(gòu)算法,通過遷移方案來刺激結(jié)構(gòu)算法的相互作用。作為通用框架而不是特殊算法,PAP很容易實施,并能適應(yīng)已有的任何基于群體的搜索算法。此外,我們還提出了一個在問題集中比較任意兩種算法風(fēng)險的度量方法。通過研究11個實例和27個Benchmark函數(shù),我們?nèi)嬖u價了PAP。實際結(jié)果表明,PAP在解的質(zhì)量方面優(yōu)于它所包含的結(jié)構(gòu)算法。
——摘自《IEEE T EVOLUT COMPUT》