陳飛
摘 要: UA025審查單元涉及兩大領域,分別是信息檢索和數據庫領域、圖像識別領域,這兩個領域IPC分類號下文獻量巨大,在實際檢索中關鍵詞難擴展、噪聲大,利用CPC檢索能夠極大降低噪聲,大大提高檢索效率。本文先對UA025審查單元相關的IPC和CPC分類號進行了梳理比較,從理論層面探討了采用CPC分類號能更有利于檢索,然后結合2個典型案例分析UA025領域CPC分類對檢索的有效性,以更全面的視角進行CPC的檢索和審查。
關鍵詞: CPC;信息檢索;圖像識別
一、引言
從所使用的分類系統(tǒng)來看,世界知識產權組織使用的是國際專利分類體系(IPC),美國專利商標局使用的是美國專利分類體系(USPC),歐洲專利局使用的主要是基于IPC的歐洲專利分類體系(ECLA/ICO),日本專利局使用的主要是基于IPC的日本專利分類體系(FI/FT),韓國知識產權局和中國國家知識產權局使用的均為IPC。
在上述各專利分類體系中,IPC被廣泛使用,但其存在更新速度慢、單一分類號下文獻量大的缺點。而且在審查實踐中IPC分類號不利于檢索的缺點也很突出。針對其他幾種分類體系都無法在全球廣泛推廣的局限性,2013年1月1日,美國專利商標局和歐洲專利局宣布,正式啟用嶄新的聯(lián)合專利分類(CPC)這一用于專利文件的全球分類系統(tǒng),CPC是以歐洲專利局分類號ECLA作為整個分類體系的基礎,同時結合美國專利分類實踐經驗構建而成的聯(lián)合分類體系,CPC具有大于250000個細分,CPC分類號對IPC分類號進行了更進一步的細分,從而進一步提高了檢索的準確度和檢索效率。
二、UA025審查單元IPC與CPC分類體系比較
UA025審查單元的一個主審分類號是G06F17/30,涉及信息檢索及其數據庫結構。該分類號屬于一點組,在CNABS數據庫中有8萬多篇文獻,在VEN數據庫中有32萬多篇文獻,并且該分類號下面沒有更細分的IPC分類號。因此,使用該IPC分類號進行檢索時難度巨大,在實際檢索中通常主要采用關鍵詞進行檢索,引入噪聲大。從CPC分類體系中可以看到,G06F17/30分類號下面有15個二點組,其下還被分為三點組、四點組,最多的層級甚至達到了六點組、七點組。
UA025審查單元的另一個主審分類號是G06K9/00-G06K9/82,主要是用于閱讀或識別印刷或書寫字符或者用于識別圖形。G06K9/00下的IPC分類號涉及一點組、二點組和三點組,相對于G06F17/30領域的分類號較為好用。IPC 分類號將G06K9/00-G06K9/82領域大致分為圖像捕獲、圖像預處理、圖像識別以及兩兩之間的組合,而CPC分類更為精細,單是圖像識別就進一步細分為指紋識別、簽名識別、三維物體識別、人臉識別、文檔識別等。經過CPC的細分,每個分類號下面的文獻量都大大減少了,文獻的分類位置也更為準確,這是很有利于檢索的。
三、CPC分類號在UA025審查單元檢索中的應用
以上從理論層面分析了采用CPC分類號進行檢索的有效性,下面分別采用IPC分類號和CPC分類號對2個實際案例進行檢索,通過比較檢索過程表明,利用CPC分類號進行檢索可以提高檢索效率。
【案例一】
權利要求1
1. 一種電子書籍資源信息網絡同步的方法,包括以下步驟:
(1)建立電子書籍章節(jié)信息邏輯結構,并將該章節(jié)信息邏輯結構插入資源結構存儲介質中;
(2)按步驟(1)中所述的章節(jié)信息邏輯結構錄入電子書籍的章節(jié)信息;
(3)建立資源信息邏輯結構,使資源信息邏輯結構與所述電子書籍的章節(jié)信息進行關聯(lián),并將該關聯(lián)插入資源結構存儲介質中;
(4)添加資源文件及資源信息,同時與章節(jié)信息進行關聯(lián),并將其插入資源結構存儲介質中;
(5)打開書籍章節(jié)時,通過章節(jié)信息檢索本地客戶端或網絡服務器,展示資源文件列表,并記錄每個資源文件的來源;
(6)查看資源時,根據資源文件的來源打開該資源信息。
權利要求分析
本申請屬于信息檢索領域,主分類號是G06F17/30,從權利要求中可以提取關鍵詞“電子書”、“關聯(lián)”,對應的英文關鍵詞是“ebook”、“associate”。
得到8篇結果,該結果即為可以評價本申請創(chuàng)造性的X類文獻:US2008/0168073 A1。
【案例二】
權利要求1
1. 畫像系統(tǒng)的標簽詞庫更新方法,其特征在于,包括以下步驟:
步驟1、獲取用戶的畫像數據,所述畫像數據包括用于描述所述用戶的標簽和所述用戶發(fā)表的原始文本;
步驟2、當標簽的數量與原始文本的數量的比值小于預設的第一閾值時,對所述用戶發(fā)表的所有原始文本進行分詞處理,以得到多個標簽候選詞,并將標簽候選詞發(fā)送至推薦系統(tǒng);
步驟3、推薦系統(tǒng)計算每一個標簽候選詞與預設的詞向量模型文件中每一個詞的向量距離,將存在向量距離大于預設的第二閾值的標簽候選詞加入到標簽詞庫中,將不存在向量距離大于第二閾值的標簽候選詞刪除。
權利要求分析
本申請屬于信息檢索領域,主分類號是G06F17/30,從權利要求中可以提取關鍵詞“畫像”、“標簽”,對應的英文關鍵詞是“image”、“picture”、“l(fā)abel”。
檢索得到74篇文獻,通過閱讀文獻,得到一篇可以評述本申請創(chuàng)造性的X類文獻:US2008/0033983A1。
四、總結
UA025審查單元的CPC分類較IPC更加細化,尤其是涉及G06F17/30領域,在實際案例的檢索中發(fā)揮了重要作用,細分的CPC分類位置能夠提供準確的技術信息,縮小檢索范圍,有效地降低檢索噪聲,提高檢索效率。CPC分類體系的出現(xiàn)可以彌補審查員,尤其是G06F17/30領域審查員過分依賴關鍵詞的缺陷,對審查員的檢索方式將產生很大的影響。而CPC條目眾多,對CPC分類號的熟練運用是一個長期積累的過程,在平常的審查過程中,要積極加以運用,以進一步提高檢索水平和審查質量。
參考文獻
[1] 李真等.聯(lián)合專利分類CPC系統(tǒng)介紹,專利文獻研究,2014(2):10-13.
[2] 王偉等,圖像領域G06K9/00的CPC分類研究,電視技術,2014(z2):195-196.