亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中華藝術視覺信息數(shù)據(jù)庫建設構想(上)

        2009-09-29 03:41:50韓叢耀
        中國教育信息化 2009年9期
        關鍵詞:數(shù)據(jù)庫

        韓叢耀

        摘 要:本項構想擬通過對生物視覺信息共軛關系的研究,提取基于生物視覺物理和生理機制的系譜軸(Paradigm)和毗鄰軸(Syntagm)特征,用數(shù)學語言描述各特征的主要參數(shù),運用遺傳程序設計的編碼方法和多目標優(yōu)化算法計算優(yōu)化這些參數(shù),構建相應的生物視覺信息處理機制模型,并運用到實際的中華藝術視覺信息數(shù)據(jù)庫建設中。

        關鍵詞:視覺信息 數(shù)據(jù)庫 計算機視覺

        中圖分類號:G203文獻標識碼:B 文章編號:1673-8454(2009)17-0047-04

        一、本項構想的理論依據(jù)

        現(xiàn)代科學研究表明,信息的產(chǎn)生、獲取、儲存、傳播和處理等都是可以被數(shù)學語言描述的,Claude Shannon和Warren Weaver早在1949年出版的著作The Mathematical Theory of Communication中即有論述,生物視覺信息也不例外。近年來在數(shù)學語言基礎上發(fā)展起來的計算機視覺技術為視覺信息的數(shù)字化奠定了基礎。

        計算機視覺是一門充滿艱難但又發(fā)展迅速的學科。20世紀80年代初Marr等人提出了“視覺是可以計算的”,這一創(chuàng)造性的觀點引發(fā)了激烈的討論和全世界計算機視覺研究的熱潮。對于人類視覺來說,它是從視網(wǎng)膜感知到的二維圖像中提取出有關場景中的三維物體的形狀和空間位置等的定量信息;而計算機視覺是研究如何使機器具有類似人類視覺的功能,屬于人工智能的重要組成部分,其研究具有雙重意義:一方面是為了建立圖像理解系統(tǒng)以自動描述真實的圖像場景,使計算機等智能系統(tǒng)具有“看”的能力;另一方面也為了進一步理解生物性視覺,運用計算機視覺的計算模擬結果促進對人類自身視覺機理的認識,提升人類視覺認知水平。

        計算機視覺技術現(xiàn)在已經(jīng)被應用到各種智能系統(tǒng)中,如制造業(yè)、檢驗、文檔分析、醫(yī)療診斷和軍事等。一些發(fā)達國家,如美國,把計算機視覺的研究列為對經(jīng)濟、科技有著廣泛影響的科學和工程中的重大基本問題,即所謂的重大挑戰(zhàn)。

        目前計算機視覺主要在以下幾個方面得到應用:

        (1)計算機與人之間的交互。正在興起的語音識別和字符識別使得傳統(tǒng)的交互方式正在發(fā)生變革;

        (2)自動導航。三維計算機視覺獲取外界環(huán)境的位置、形狀和運動速度,可以用于導彈的末端制導;

        (3)生產(chǎn)自動化。裝配焊接或者其他作業(yè)的機器人在配有視覺系統(tǒng)后具有更高的作業(yè)精度和對環(huán)境的適應能力;

        (4)醫(yī)學應用。計算機輔助外科手術等;

        (5)三維場景建模與顯示。近年來計算機視覺和圖形學的發(fā)展產(chǎn)生了基于圖像的建模和真實感繪制技術;

        (6)空間探測。NASA噴推實驗室研制的視覺系統(tǒng)已經(jīng)成功應用到火星探測機器人等。

        在計算機視覺得到應用的同時,目前的發(fā)展還面臨著一些困難,進展也比較緩慢。與計算機視覺的應用需求相比,計算機視覺的建模和模擬研究尚處在初級階段,雖然計算機視覺經(jīng)過30余年的發(fā)展已經(jīng)建立了一套獨立的計算理論和算法,但是它離生物視覺系統(tǒng)的仿真要求還有很大的差距。這也大大制約了其應用,反過來也約束了計算機視覺的發(fā)展。分析原因有如下幾點:

        第一,幾十年來,雖然神經(jīng)生物學、心理學和認知科學對生物視覺系統(tǒng)從解剖學、電生理過程和信息處理等不同角度進行了大量的卓有成效的研究,但是對視覺認知過程的認識還遠遠不夠,尤其是對大腦皮層中各層次視覺信息處理的認識還較為膚淺。

        第二,研究表明,大腦神經(jīng)細胞構成一個極其復雜的巨大的互連網(wǎng)絡,這種神經(jīng)網(wǎng)絡在體系結構上與當前計算機體系結構有很大差別,要實現(xiàn)大量的人工神經(jīng)元的互連網(wǎng)絡,目前在技術上仍很困難。

        第三,在許多應用場合,視覺系統(tǒng)要觀察的環(huán)境比較簡單,如最早的計算機視覺系統(tǒng)實驗源于上世紀60年代,其環(huán)境被限制在所謂的積木世界,即周圍的物體都是一些多面體,需要識別的目標都是簡單的點、線、面的組合。在此基礎上開展的計算機視覺研究顯然不需要復雜的建模,這也導致大量的研究仍被局限在某些特定場合。

        基于這樣的原因,很多計算機視覺學者認為,只要從信息轉(zhuǎn)換的角度真正理解了視覺信息處理過程并發(fā)展出一套信息處理的計算理論,用哪種體系結構去實現(xiàn)它是次要的。絕大多數(shù)學者的研究集中于計算機視覺的人工智能符號論方面,從理論計算機科學的角度去理解和研究計算機視覺,研究成果大都體現(xiàn)為某種具體的算法或者某個具體的應用,它們能夠?qū)δ硞€特定的圖像類型或者某些特定的場合起到良好的識別效果,但是普適性不足。究其原因,主要是絕大多數(shù)學者忽略了生物視覺本身的生理和心理特點,僅僅從視覺圖像的物理特征去認知計算機視覺,這必然會導致研究的局限性。

        我們認為通過幾億年進化來的生物視覺系統(tǒng)必然有其先進性和合理性。從現(xiàn)有的神經(jīng)生理學、生物學、心理學、腦科學和認知科學對生物視覺系統(tǒng)的研究成果出發(fā),結合計算機等現(xiàn)代科技工具,利用現(xiàn)有的如圖像處理和模式識別等理論和算法,找出生物視覺的機理,才是計算機視覺科學發(fā)展的真正方向。

        腦科學研究表明:眼睛的晶狀體將看到的物象聚焦并上下顛倒呈現(xiàn)在眼球后的視網(wǎng)膜上,如圖1所示,在視網(wǎng)膜上散布著許多視桿細胞(Rod)和視錐細胞(Cone)將感知到的物象轉(zhuǎn)換成信息進入到視神經(jīng),如圖2所示。經(jīng)圖像轉(zhuǎn)換(The Switchboard)、知覺視神經(jīng)傳導,如圖3所示,初級視皮層(Primary Visual Cortex)和大腦許多其他的視覺區(qū)域繼續(xù)對視覺信息加以細致的分析,顏色(Color)、運動(Motion)、形狀(Form)和深度(Depth)的特性被強化分析,如圖4所示。但大腦的識別記憶更為簡約化,如圖5所示,只有兩點:顳葉皮層(Temporal Cortex)的神經(jīng)細胞對形狀敏感:是什么;頂壁皮層(Parietal Cortex)的神經(jīng)細胞對位置敏感:在哪里。我們的理論出發(fā)點是遵從生物視覺信息的客觀規(guī)律,對初級視皮層處的顏色、運動、形狀和深度進行仿真,即使用計算機數(shù)字語言進行描述。

        Marr立足于計算機科學的視覺計算理論,系統(tǒng)地概括了心理生理學和神經(jīng)生理學等方面取得的重要成果,依然是目前計算機視覺研究中較為完善的理論。它使計算機視覺研究有了一個比較明確的體系,并且大大推動了計算機視覺研究的發(fā)展。按照Marr的理論,視覺過程可以分為三個階段:早期、中期和后期。對應著三個視覺過程,產(chǎn)生了計算機視覺中的三個層次研究內(nèi)容:

        (1)低層次視覺:表示二維圖像中的重要信息,主要是圖像中的亮度變化、位置及其幾何分布和組織結構;

        (2)中間層次視覺:以觀察者為中心的坐標系中,表示可見表面的方向、深度值和不連續(xù)的輪廓;

        (3)高層次視覺:以物體為中心的坐標系中,用由體積基元和面積基元構成的模塊化多層次表示,描述形狀及其空間組織形式。

        目前,大量的研究集中在處理輸入原始圖像的低層次視覺領域,發(fā)展了大量的圖像處理技術和算法,如圖像濾波、圖像增強、邊緣檢測、線條檢測、角點檢測等,這一過程還包含了各種圖像變換、圖像紋理檢測和圖像運動檢測等。對中高層次視覺的研究相對要少得多,而對生物視覺處理機制建模更是鮮見。

        作為人類感知系統(tǒng)的組成之一,視覺可以被看作是一種元語言(元語言具有言語的自然屬性;語言更多地具有人為屬性。元語言也可以被看作是一種生物性圖像,具有可被量化的表征形態(tài))。對視覺語言的這種“概念”的形成,并不表現(xiàn)在整個的形體上,而只是在某一視覺構成元素上有強烈的暗示性,但組織這種語言的過程基本是視覺的。為容易使用建立的一種視覺語言模式或建立的一種視覺傳播模式,對運行的程序要加以諸多的限制或僅限于視覺界面(或稱生物性圖像)的共軛關系討論,這種限制越具體,越容易找到這種函數(shù)關系。

        在對人類視覺元語言的解構中,Marr曾建構過一個三維的模式,從這里我們可以清晰地看到圍繞著他建立的軸心轉(zhuǎn)動,是對視覺的和語言的理解,同時又形成概念。概念既存在于頭腦中,也凸現(xiàn)于視覺中;既是一種理性的要求,也是一種感性的認識。如圖6所示。

        圖6中的“意識域”類似于我們將要討論的視覺共軛界面,“意識域”能清晰地剖析視覺語言的結構,它是建構語言的邏輯起點。但是,我們也發(fā)現(xiàn),“意識域”只能夠部分說明視覺語言,卻無法在此基礎上建構視覺語言,因為這個“意識”仍是視覺語言之外的——文字語言的范疇。這里,我們必須強調(diào)指出:如果借用其他語言元素作為建構另一種新語言的基礎或稱邏輯起點,本身就是一個邏輯錯誤。

        Marr這種建構從生物視覺語言的角度來看是有一定不足的,但在“界面”的另一側(cè)確又使我們獲得了豐滿的理解,因為概念對于觀察者來講是作為一個整體來理解的,這也正應驗了Jackendoff的觀點:“一切概念性整體,都具有其視覺組成部分”。因此,選擇“概念”作為對形式與內(nèi)容的研究視角是可以成立的,因為概念在某種意義上就是一種視覺構成。研究視覺界面,首先要研究視覺圖像的構成,通過這條途徑有可能使問題簡化,從而約簡出最小公分母,使得討論變得簡單。下面就讓我們看看構成視覺元語言(生物視覺信息)的視覺諸元。

        每一個物理元素都能產(chǎn)生一種或幾種心理效能,諸種元素構成了視覺主體,圖像中有了視覺主體就可能去表達主題(內(nèi)容)了,有了這種主題,概念的表達就變得容易了。圖7是物理元素、視覺諸元構成視覺圖像(畫面文本)的效果。

        這樣一種構成關系似乎變得較為清楚,也容易被人們接受。從這里可以看出,在“物理源”與“心理場”之間確實存在著一個共軛界面,它是物理元素與視覺元素轉(zhuǎn)換的關節(jié)點。“物理源”與“心理場”如圖8所示。

        對于視覺語言來講,圖像的構成形式是極其重要的,構成視覺語言的物理元素都在圖像的構成形式上——點、線、色彩、影調(diào)等,如圖9所示。沒有這些物理元素,視覺語言就無從談起。沒有這樣的“物理源”,其視覺之后的“心理場”就無法獲得,甚至連“視覺”也產(chǎn)生不了,我們試圖尋找的視覺共軛界面就只能是假設。

        至此,我們可以清晰地感知到視覺界面的存在,但還無力將其用科學的方法從感覺中托舉出來。我們好像走入了19世紀藝術批評家約翰·羅斯金的“感情誤置”的理論中:任何一種被我們歸結為外部事物的性質(zhì),但又無法得到科學證明的東西,實際上都只不過是我們內(nèi)在情感的反映。約翰·羅斯金這句話表明外部事物的性質(zhì)可以歸結為我們“內(nèi)在情感的反映”,因此,上文所推論的視覺元語言共軛界面就一定實實在在地存在著;既然情感可以被概念化——概念也可以由物理元素構成——構成元素可以引起我們的心理效能,那么,引起視覺語言的“物理源”就一定存在著。如果“心理場”和“物理源”都存在著,就一定會有共軛的反應機制,不管這種反映多么龐大和雜亂,如果用自然科學的方法,有耐心,善于發(fā)現(xiàn),就一定能夠從中一點點地剝離,最終逼近視覺界面,將其一一對應的關系建立起來,將其共軛的函數(shù)關系建立起來。

        視覺界面具有與生俱來的生物特性,又兼?zhèn)淞宋锢砼c心理的雙重表征特性。視覺界面語言既有指涉性、象征性、類比性特征,又具有痕跡性特征。世界上每一種事物都有其固定不變的物理成分,都有其凸顯本質(zhì)特征的因子。如果將研究的視點錨固在生成生物視覺信息的元素上,通過對視覺界面的量化研究,就可以約簡出構成視覺元素的最小公分母。因為任何生物視覺信息都有其共軛的物象,而共軛關系是可以建模討論的。最嚴密的科學研究應是任何人都無法對其自身的特征提出異議,而只能考慮其可能性。本研究就是確定可能性和不可能性之極限。人文科學和自然科學的基礎都在于感官的認知,通過建立其表述生物視覺特征的顏色(Color)、運動(Motion)、形狀(Form)和場深(Depth)等軸向數(shù)值,可以將其轉(zhuǎn)換成數(shù)字式的分析量值,在定性的前提下取得定量的表征數(shù)據(jù),取精用宏、盡微至廣。通過建立視覺界面系譜軸和輔助的毗鄰軸,我們可以構建一個生物視覺中高層次識別的模型,為計算機視覺應用奠定基礎。

        具體思路就是:以量化視覺界面系譜軸和毗鄰軸為基礎,運用遺傳程序設計的編碼方法和多目標優(yōu)化算法,計算優(yōu)化量化目標的各項參數(shù),構建相應的生物視覺信息處理機制模型。

        系譜軸和毗鄰軸的基本模型如圖10所示。

        猜你喜歡
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        財經(jīng)(2017年15期)2017-07-03 22:40:49
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        兩種新的非確定數(shù)據(jù)庫上的Top-K查詢
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        數(shù)據(jù)庫
        財經(jīng)(2016年3期)2016-03-07 07:44:46
        數(shù)據(jù)庫
        財經(jīng)(2016年6期)2016-02-24 07:41:51
        數(shù)據(jù)庫
        財經(jīng)(2015年3期)2015-06-09 17:41:31
        數(shù)據(jù)庫
        財經(jīng)(2014年21期)2014-08-18 01:50:18
        數(shù)據(jù)庫
        財經(jīng)(2014年6期)2014-03-12 08:28:19
        數(shù)據(jù)庫
        財經(jīng)(2013年6期)2013-04-29 17:59:30
        日韩精品中文字幕无码一区| 女同视频一区二区在线观看 | 中文字幕丰满人妻被公强| 国产av一区二区三区在线播放| 国产免费一区二区三区免费视频| 躁躁躁日日躁| 特级毛片全部免费播放a一级| 日本女同av在线播放| 特黄 做受又硬又粗又大视频| 狠狠色噜噜狠狠狠888米奇视频| 亚洲熟妇网| 美女被搞在线观看一区二区三区| 午夜国产视频一区二区三区| 日本入室强伦姧bd在线观看| 亚洲色欲在线播放一区| 伊人影院在线观看不卡| 日本黑人乱偷人妻在线播放| 丰满多毛的大隂户毛茸茸| 一本色道久久99一综合| 人妻少妇精品视频一区二区三区 | 蜜臀av在线观看| 精品亚洲国产成人av| 亚洲欧美日韩精品久久亚洲区色播| 高清不卡av在线播放| 在线观看av片永久免费| 欧美亚洲日韩国产人成在线播放 | 久久午夜精品人妻一区二区三区 | 久久av粉嫩一区二区| 久久精品国产精油按摩| 日韩在线免费| 女同久久精品国产99国产精| 久久精品国产亚洲av麻豆会员| 亚洲伊人成综合网| 国产午夜无码精品免费看动漫| 字幕网中文字幕精品一区| 免费国产在线精品一区| 久久这里只精品国产免费10 | 欧洲一级无码AV毛片免费| 在线播放国产自拍av| 日本最大色倩网站www| 精品99在线黑丝袜|