賀艷娟,馮 薇,池 娟,姜 丹
(國(guó)家知識(shí)產(chǎn)權(quán)局 專利局專利審查協(xié)作北京中心,北京 100190)
責(zé)任編輯:魏雨博
隨著信息時(shí)代的到來(lái),人們對(duì)信息的依賴越來(lái)越高,對(duì)信息的質(zhì)量要求也越來(lái)越嚴(yán)苛,不可避免地帶來(lái)了多媒體承載信息的吞吐、存儲(chǔ)和傳輸問(wèn)題。所以必須對(duì)數(shù)字化信息進(jìn)行壓縮,實(shí)現(xiàn)快速的編解碼算法,用盡可能少得數(shù)據(jù)來(lái)表達(dá)盡可能多得信息,從而易于傳輸和節(jié)省存儲(chǔ)的空間。由于數(shù)據(jù)是由特征信息和冗余組合而來(lái),而冗余數(shù)據(jù)對(duì)于信息的表達(dá)是沒(méi)有用處的,因此將特征信息保留,將冗余信息去除即可實(shí)現(xiàn)壓縮編碼。
視頻編碼中的關(guān)鍵技術(shù)包括:1)空間抽樣,在實(shí)際應(yīng)用中,對(duì)彩色圖像采用全分辨率編碼實(shí)際上是沒(méi)有必要的,利用人眼視覺系統(tǒng)對(duì)色差信號(hào)的不敏感特性,可以有效降低原始編碼數(shù)據(jù)量;2)量化,量化是視頻編碼中最直觀的數(shù)據(jù)壓縮過(guò)程,也是各種視頻編碼算法產(chǎn)生失真的主要過(guò)程。量化使數(shù)據(jù)的分布范圍變小,分布狀態(tài)變得集中;3)預(yù)測(cè)編碼與運(yùn)動(dòng)估計(jì),預(yù)測(cè)編碼的方法是根據(jù)離散信號(hào)之間存在一定相關(guān)性的特點(diǎn),利用前面一個(gè)或多個(gè)信號(hào)預(yù)測(cè)下一個(gè)信號(hào),然后根據(jù)實(shí)際值和預(yù)計(jì)值之間的差值進(jìn)行校正編碼,從而實(shí)現(xiàn)壓縮的目的,預(yù)測(cè)編編碼主要包括幀內(nèi)預(yù)測(cè)編碼、幀間預(yù)測(cè)編碼,對(duì)于幀間預(yù)測(cè)編碼,需要應(yīng)用幀間運(yùn)動(dòng)補(bǔ)償技術(shù);4)變換編碼,是消除圖像數(shù)據(jù)空間相關(guān)性更有效的方法,盡管圖像變換本身并不壓縮數(shù)據(jù),但可以使圖像數(shù)據(jù)在變換域內(nèi)最大限度的不相關(guān)。其主要包括K-L變換、離散余弦變換(DCT)、鋸齒形掃描和游程編碼;5)熵編碼,利用圖像陣列的數(shù)據(jù)統(tǒng)計(jì)特性進(jìn)行數(shù)據(jù)壓縮,常用的有兩種:變長(zhǎng)編碼和算術(shù)編碼,二進(jìn)制算法編碼是目前最新圖像和視頻編碼標(biāo)準(zhǔn)的主要熵編碼方法。在實(shí)際壓縮過(guò)程中一般采用結(jié)合空間采樣、量化、預(yù)測(cè)、變換、熵編碼等多種方法的混合編碼方案,以達(dá)到最佳的壓縮效率。
從20個(gè)世紀(jì)80年代以來(lái),由ISO和ITU制定了一系列的視頻壓縮國(guó)際標(biāo)準(zhǔn)。其中ITU組織制定的標(biāo)準(zhǔn)以H.26x命名,主要針對(duì)實(shí)時(shí)通信的應(yīng)用,如H.261,H.263,H.264;而ISO和國(guó)際電工委員會(huì)(International Electro technical Commission,IEC)的共同委員會(huì)中的MPEG組織制定的標(biāo)準(zhǔn)以MPEG-x命名,主要針對(duì)視頻數(shù)據(jù)的存儲(chǔ)、廣播電視和視頻流的網(wǎng)絡(luò)傳輸?shù)葢?yīng)用。其中以H.264/AVC性能最為優(yōu)越,在H.264標(biāo)準(zhǔn)中,還分別推出了可分級(jí)視頻編碼(Scalable Video Coding,SVC)擴(kuò)展和多視點(diǎn)視頻編碼(Multiview Video Coding,MVC)擴(kuò)展以應(yīng)對(duì)越來(lái)越多樣的應(yīng)用需求。AVS是我國(guó)自主研發(fā)的視頻編碼標(biāo)準(zhǔn),該標(biāo)準(zhǔn)是以當(dāng)前H.264框架為基礎(chǔ),并在此之上作了一些改進(jìn),增加和刪除了一些算法,壓縮效率比H.264相差不大,實(shí)現(xiàn)的難度大大降低。該標(biāo)準(zhǔn)主要針對(duì)高清晰度電視、高密度光存儲(chǔ)媒體等應(yīng)用。
隨著圖像編碼技術(shù)的進(jìn)一步研究,涉及圖像編解碼的專利申請(qǐng)量也迅速增加,包括對(duì)現(xiàn)有編碼算法的改進(jìn)以及自創(chuàng)的新編碼算法,比如運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償技術(shù)中塊匹配算法的改進(jìn)等,以解決現(xiàn)有算法存在的缺陷,還包括對(duì)現(xiàn)有標(biāo)準(zhǔn)的應(yīng)用或改進(jìn),比如可分級(jí)視頻編碼或多視點(diǎn)視頻編碼的技術(shù)改進(jìn),以解決現(xiàn)有標(biāo)準(zhǔn)中還沒(méi)有涉及到的問(wèn)題。由于標(biāo)準(zhǔn)組織成員、高??蒲性核虼笮推髽I(yè)對(duì)圖像編解碼的各個(gè)方面都在進(jìn)行著深入的研究,覆蓋的技術(shù)面比較廣,比較新穎,在檢索過(guò)程中,通常很難在專利文獻(xiàn)數(shù)據(jù)庫(kù)中檢索到比較相關(guān)的專利文獻(xiàn),而非專利文獻(xiàn)具有更新速度快,技術(shù)內(nèi)容全面,技術(shù)原理類綜述類的資料較多的特點(diǎn),此時(shí)對(duì)于非專利文獻(xiàn)數(shù)據(jù)庫(kù)的檢索就顯得相當(dāng)重要。而對(duì)于高校科研院所的一些研究者,其往往將自己的研究成果第一時(shí)間發(fā)表在比較有影響力的國(guó)內(nèi)核心刊物或國(guó)際刊物上,因此,對(duì)于圖像編解碼算法的檢索,要時(shí)刻考慮非專利文獻(xiàn)數(shù)據(jù)庫(kù)的檢索,而對(duì)于常用的非專利文獻(xiàn)庫(kù)的使用和實(shí)際案例在其非專利文獻(xiàn)數(shù)據(jù)庫(kù)的檢索策略就顯得尤為重要。
下面將對(duì)圖像編碼專利申請(qǐng)常用的非專利文獻(xiàn)數(shù)據(jù)庫(kù)和實(shí)際案例在非專利文獻(xiàn)數(shù)據(jù)庫(kù)中的檢索策略作簡(jiǎn)單的介紹。
對(duì)圖像編解碼領(lǐng)域中常用的數(shù)據(jù)庫(kù)進(jìn)行概括性描述,總結(jié)如下:
1)CNKI全文數(shù)據(jù)庫(kù)是中文非專利文獻(xiàn)庫(kù),其特點(diǎn)是數(shù)據(jù)全,功能強(qiáng)。該數(shù)據(jù)庫(kù)涵蓋的中文期刊相當(dāng)全面,包括了關(guān)于廣播、電視類的文獻(xiàn)80000多篇,有助于我們了解背景技術(shù),另外,碩士博士論文在我們查找申請(qǐng)人為高校學(xué)生的情況下,對(duì)我們查找其論文有很大幫助。
2)IEEE/IEE Electronic Library(IEL)是外文非專利文獻(xiàn)庫(kù),該數(shù)據(jù)庫(kù)屬于全文數(shù)據(jù)庫(kù),能直接查找文獻(xiàn)的全文,包含了很多有關(guān)圖像通信領(lǐng)域的期刊、會(huì)議,有關(guān)圖像編解碼算法的最新研究成果經(jīng)常在這些期刊或會(huì)議上發(fā)表。
3)ISI WEB of knowledge是外文非專利文獻(xiàn)庫(kù),包括科學(xué)引文索引擴(kuò)展版SCIE、科技會(huì)議錄索引ISTP、科學(xué)文摘數(shù)據(jù)庫(kù)INSPEC等,其以科學(xué)引文為核心,可追蹤文獻(xiàn)的引用和被引用情況。
4)ISO和國(guó)際電工委員會(huì)(International Electro technical Commission,IEC)的共同委員會(huì)中的MPEG組織制定的標(biāo)準(zhǔn)以MPEG-x命名,主要針對(duì)視頻數(shù)據(jù)的存儲(chǔ)、廣播電視和視頻流的網(wǎng)絡(luò)傳輸?shù)葢?yīng)用,如MPEG-1,MPEG-2,MPEG-4,可在 http://mpeg.chiariglione.org下載MPEG的多個(gè)視頻標(biāo)準(zhǔn)。對(duì)MPEG視頻標(biāo)準(zhǔn)的改進(jìn)的申請(qǐng)通過(guò)直接到標(biāo)準(zhǔn)的下載網(wǎng)站下載會(huì)獲得很大收獲。
5)ITU組織制定的標(biāo)準(zhǔn)以H.26x命名,主要針對(duì)實(shí)時(shí)通信的應(yīng)用,如 H.261,H.263,H.264,可在 http://wftp3.itu.int下載多個(gè)時(shí)間版本的H.26x音視頻和多媒體標(biāo)準(zhǔn)。對(duì)H.26x音視頻標(biāo)準(zhǔn)的改進(jìn)的申請(qǐng)通過(guò)直接到標(biāo)準(zhǔn)的下載網(wǎng)站下載會(huì)獲得很大收獲。
【案例1】
申請(qǐng)?zhí)枺?009101543362
發(fā)明名稱:一種多視點(diǎn)視頻信號(hào)的編碼方法
申請(qǐng)日:2009年11月27日
申請(qǐng)人:寧波大學(xué)
發(fā)明人:蔣剛毅,彭宗舉;何萍;郁梅
權(quán)利要求1:一種多視點(diǎn)視頻信號(hào)的編碼方法,其特征在于該編碼方法在基于H.264編碼標(biāo)準(zhǔn)的多視點(diǎn)視頻編碼校驗(yàn)?zāi)P蚃MVM上,采用JVT推薦的分層B幀編碼預(yù)測(cè)結(jié)構(gòu)對(duì)多視點(diǎn)視頻信號(hào)中的彩色視頻進(jìn)行編碼,具體過(guò)程如下:對(duì)于彩色視頻中的所有I幀以16×16宏塊為單位進(jìn)行處理,對(duì)于當(dāng)前正在處理的I幀中的各個(gè)16×16宏塊,編碼器采用現(xiàn)有的H.264的率失真優(yōu)化技術(shù)搜索Intra16×16、Intra8×8和Intea4×4宏塊編碼模式,從這三種宏塊編碼模式中選出率失真代價(jià)最小的宏塊編碼模式作為各個(gè)16×16宏塊各自的最優(yōu)宏塊編碼模式,再利用各個(gè)16×16宏塊各自的最優(yōu)宏塊編碼模式對(duì)各個(gè)16×16宏塊進(jìn)行編碼;對(duì)于彩色視頻中的所有P幀以16×16宏塊為單位進(jìn)行處理,對(duì)于當(dāng)前正在處理的P幀中的各個(gè)16×16宏塊,編碼器采用現(xiàn)有的H.264的率失真優(yōu)化技術(shù)搜索 SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4宏塊編碼模式,從這些宏塊編碼模式中選出率失真代價(jià)最小的宏塊編碼模式作為各個(gè)16×16宏塊各自的最優(yōu)宏塊編碼模式,再利用各個(gè)16×16宏塊各自的最優(yōu)宏塊編碼模式對(duì)各個(gè)16×16宏塊進(jìn)行編碼;對(duì)于彩色視頻中的所有B幀以16×16宏塊為單位進(jìn)行處理,對(duì)于當(dāng)前正在處理的B幀中的各個(gè)16×16宏塊采用如下步驟進(jìn)行編碼(此處省略)。
檢索過(guò)程:本申請(qǐng)涉及H.264多視點(diǎn)視頻編碼,是比較新的研究方向,首先在CNKI中國(guó)期刊全文數(shù)據(jù)庫(kù)中以本申請(qǐng)的發(fā)明人為作者進(jìn)行檢索,找到很多相關(guān)文獻(xiàn),但均不能作為對(duì)比文件,考慮到高校通常將研究成果可能首先發(fā)表在IEEE等國(guó)外期刊,于是轉(zhuǎn)向IEEE中進(jìn)行檢索,找到以發(fā)明人為作者內(nèi)容相同發(fā)表日在本申請(qǐng)的申請(qǐng)日之前的文獻(xiàn)(Fast Mode Selection and Disparit Estimation for Multiview Video Coding,2009 Third International Symposium on IITAW,20091122),該文獻(xiàn)最終導(dǎo)致該申請(qǐng)視撤。
啟示:申請(qǐng)人有時(shí)候會(huì)對(duì)研究成果先發(fā)表在國(guó)外刊物上,而不是國(guó)內(nèi)刊物上,因此,在國(guó)內(nèi)非專利數(shù)據(jù)庫(kù)上檢索不到,此時(shí),有必要在國(guó)外非專利數(shù)據(jù)庫(kù)中檢索。在IEEE數(shù)據(jù)庫(kù)中以發(fā)明人為入口進(jìn)行檢索時(shí),由于發(fā)明人有多種英文撰寫方式,比如:姓名的全拼拼音,包括姓在前,名在后和名在前,姓在后兩種情況(例如:Jiang Gangyi,Gangyi Jiang)、姓為全拼名為縮寫,也包括姓在前,名在后和名在前,姓在后兩種情況(例如:Jiang G.Y.,G.Y.Jiang)。所以如果沒(méi)有將這四種情況都考慮到,很可能造成漏檢;另外,如果發(fā)明人比較多,逐一變換為英文名比較費(fèi)力,比如本案例,可以使用發(fā)明名稱中的關(guān)鍵詞作為題名進(jìn)行檢索。
【案例2】
申請(qǐng)?zhí)枺?00780000221.7
發(fā)明名稱:可分級(jí)視頻壓縮中插值的方法與裝置
申請(qǐng)日:2007年1月11日
優(yōu)先權(quán)日:2006年1月11日
申請(qǐng)人:華為技術(shù)有限公司
權(quán)利要求1:一種可分級(jí)視頻壓縮中插值的方法,其特征在于:用于可分級(jí)視頻壓縮的層間預(yù)測(cè)中,亮度分量和色度分量采用互相獨(dú)立精度的插值濾波器,亮度分量和色度分量的插值濾波器的抽頭系數(shù)也互相獨(dú)立,插值濾波器可以是對(duì)稱或者不對(duì)稱的。
檢索過(guò)程:可分級(jí)視頻編碼或可伸縮視頻編碼屬于低碼率視頻編碼H.264的研究范圍。因此,在Google網(wǎng)站用域(site:wftp3.itu.int)輸入以下關(guān)鍵詞進(jìn)行檢索:svc,lum,chroma,filter,interpolat,得到評(píng)價(jià)創(chuàng)造性的對(duì)比文件:Chen Ying,Zhai Jiefu,Yin Peng,New downsampling and upsampling processes for chroma samples in SVC spatial scalability,JOINT,VIDEO TEAM(JVT)OF ISO/IEC MPEG&ITU-T VCEG(ISO/IEC JTC1/SC29/WG11。
啟示:本申請(qǐng)涉及的可分級(jí)視頻編碼或可伸縮視頻編碼屬于低碼率視頻編碼H.264的研究范圍。該類申請(qǐng)的申請(qǐng)人或發(fā)明人可能屬于ITU-T組織的成員,其申請(qǐng)的技術(shù)方案可能已作為提案向ITU-T組織提交并公布,或者已經(jīng)被其它競(jìng)爭(zhēng)成員提交過(guò)。因此,對(duì)涉及到國(guó)際編碼標(biāo)準(zhǔn)的專利申請(qǐng),到相關(guān)的組織網(wǎng)站上直接進(jìn)行檢索是十分有必要的。
【案例3】
申請(qǐng)?zhí)枺?00610041780X
發(fā)明名稱:一種基于上下文自適應(yīng)變長(zhǎng)解碼的方法
申請(qǐng)日:2006年2月13日
申請(qǐng)人:清華大學(xué)
發(fā)明人:何蕓,瞿艷梅
權(quán)利要求1:一種基于上下文自適應(yīng)變長(zhǎng)解碼的方法,其特征是,解碼是在控制器(30)的控制下對(duì)輸入的變長(zhǎng)編碼數(shù)據(jù)解碼,包括對(duì)五個(gè)語(yǔ)法元素的解碼:解碼從coeff_token解碼(1)開始,采用基于分組規(guī)則的組標(biāo)識(shí)數(shù)分配方法或者存儲(chǔ)轉(zhuǎn)換方法解碼非零系數(shù)的個(gè)數(shù)total_coeff和拖尾1trailing_one的個(gè)數(shù)trailing_ones;trailing_one_sign解碼(2),解碼拖尾1trailing_one的符號(hào);level解碼(3),解碼剩下的非零系數(shù)的幅度值;total_zeros解碼(4),解碼最后一個(gè)非零系數(shù)之前零的個(gè)數(shù);run_before解碼(5),從最后一個(gè)非零系數(shù)往前,解碼它到前面一個(gè)非零系數(shù)之間的零的個(gè)數(shù)。
檢索過(guò)程:本申請(qǐng)涉及H.264中的其中一套熵編碼技術(shù),即基于上下文的自適應(yīng)變長(zhǎng)編碼CAVLC,技術(shù)方案是對(duì)變長(zhǎng)編碼數(shù)據(jù)的5部分語(yǔ)法元素的解碼,由于該算法發(fā)展時(shí)間短,目前提出的實(shí)現(xiàn)方案很少,在國(guó)內(nèi)主要集中在高校中研究H.264標(biāo)準(zhǔn)的一些實(shí)驗(yàn)室和課題組,除清華大學(xué)外,本申請(qǐng)背景技術(shù)部分還給出了對(duì)此有比較前沿研究的浙江大學(xué)的嚴(yán)曉浪、秦興。因此擴(kuò)展了相同研究領(lǐng)域的不同高校的研究人員,以擴(kuò)展的多個(gè)作者為入口在CNKI,IEEE,ISI WEB of knowledge中檢索,盡管在CNKI和IEEE中未檢索到合適的對(duì)比文件,但在ISI WEB of knowledge中檢索到一篇對(duì)比 文 件 :Xing Qin,Xiaolang Yan,A Memory and Speed Efficient CAVLC Decoder, Proc.VCIP 2005,pp.1418-1426,Jul.2005,最終該篇對(duì)比文件使申請(qǐng)人縮小了保護(hù)范圍。
啟示:申請(qǐng)人為高?;蚩蒲性核纳暾?qǐng),發(fā)明人的同一實(shí)驗(yàn)室或課題組中研究領(lǐng)域比較接近,有些可能是延續(xù)性的研究,一般還會(huì)有多個(gè)高校的實(shí)驗(yàn)室分別進(jìn)行研究,所以在進(jìn)行檢索時(shí),不僅要檢索發(fā)明人的文章,還要檢索與發(fā)明人研究接近的同實(shí)驗(yàn)室人員和相關(guān)實(shí)驗(yàn)室人員的文章,可以以發(fā)明人和相似研究人員所屬的單位進(jìn)行跟蹤檢索。隨著國(guó)內(nèi)科研人員的專利意識(shí)增強(qiáng),會(huì)注意先申請(qǐng)專利后在期刊上發(fā)表文章,然而他們往往還是會(huì)在專業(yè)會(huì)議,尤其是一些英文國(guó)際會(huì)議上提前公開研究成果,而IEEE的會(huì)議文章并不全面,此時(shí)ISI Web of Knowledge可以作為補(bǔ)充檢索。
通過(guò)以上案例的檢索,結(jié)合在審查過(guò)程中其他案例的檢索得到一些體會(huì),總結(jié)歸納如下:
1)在非專利文獻(xiàn)檢索中,參考文獻(xiàn)可以作為追蹤檢索的工具,這有點(diǎn)類似于專利文獻(xiàn)檢索中根據(jù)同族進(jìn)行追蹤的方法,比如針對(duì)某發(fā)明申請(qǐng),審查員檢索到發(fā)明人的一篇論文,公開了本申請(qǐng)的大部分內(nèi)容,只是時(shí)間晚于本發(fā)明。但是,通過(guò)閱讀該論文的參考文獻(xiàn),審查員可能找到可以作為現(xiàn)有技術(shù)評(píng)價(jià)該申請(qǐng)新穎性創(chuàng)造性的另一篇文獻(xiàn)。
2)對(duì)于申請(qǐng)人為高?;蚩蒲性核纳暾?qǐng),發(fā)明人有可能在將研究成果發(fā)明專利之前,將成果提前發(fā)表在國(guó)內(nèi)外期刊上,尤其是相對(duì)比較新的圖像編解碼算法,大都將研究成果發(fā)表在國(guó)外的期刊或會(huì)議上,所以在外文非專利數(shù)據(jù)庫(kù)中檢索也很有必要;另外申請(qǐng)人為高?;蚩蒲性核纳暾?qǐng),其發(fā)明人的同一實(shí)驗(yàn)室或課題組中研究領(lǐng)域比較接近,有些可能是延續(xù)性的研究,所以在進(jìn)行檢索時(shí),不僅要檢索發(fā)明人的文章,與發(fā)明人研究接近的人員的文章也不能遺漏;比如申請(qǐng)人如果是博士或者碩士,在其博士論文或碩士論文末尾會(huì)有作者在攻讀學(xué)位期間發(fā)表的論文和參與的課題的列表,這些文獻(xiàn)的內(nèi)容與申請(qǐng)的內(nèi)容的相關(guān)性很大,很有參考價(jià)值。
3)對(duì)于圖像編解碼方法的專利申請(qǐng),申請(qǐng)的技術(shù)方案往往與現(xiàn)有的編碼標(biāo)準(zhǔn)之間關(guān)系緊密,大多數(shù)是對(duì)現(xiàn)有標(biāo)準(zhǔn)(比如MPEG,H.264)的應(yīng)用或改進(jìn),而對(duì)于這類申請(qǐng)的技術(shù)內(nèi)容其大部分已被現(xiàn)有標(biāo)準(zhǔn)中公開,相應(yīng)的標(biāo)準(zhǔn)很可能可以作為影響新穎性或創(chuàng)造性的文獻(xiàn)使用。
本文以實(shí)際審查案例為例,對(duì)圖像編解碼方法的特點(diǎn)進(jìn)行了介紹,并根據(jù)其特點(diǎn)分析了在非專利數(shù)據(jù)庫(kù)中的檢索思路,給出了自己的一些心得體會(huì)。錯(cuò)誤之處請(qǐng)大家批評(píng)指正。
[1]周蔭清.信息論理論基礎(chǔ)[M].北京:北京航空航天大學(xué)出版社,1993.
[2]畢厚杰.新一代視頻壓縮編碼標(biāo)準(zhǔn)—H.264/AVC[M].北京:人民郵電出版社,2002.
[3]AVS.The Information Technology Advanced Audio and Video Coding Part 2:Video[S].2005.