亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        影響專利查全率的檢索平臺(tái)因素研究

        2024-12-14 00:00:00王征清
        江蘇科技信息 2024年24期
        關(guān)鍵詞:信息檢索

        摘要:專利信息檢索平臺(tái)是獲取專利文獻(xiàn)信息、開展專利信息服務(wù)的必備工具,其數(shù)據(jù)檢出質(zhì)量是開展專利文獻(xiàn)信息檢索和情報(bào)分析服務(wù)的基礎(chǔ)保障。文章從數(shù)據(jù)更新、數(shù)據(jù)加工、檢索字段3個(gè)維度,考察在相同檢索條件下各專利信息檢索平臺(tái)影響查全率的因素。具體通過實(shí)際案例對(duì)比CNIPA、PSS等11種專利信息檢索平臺(tái)在數(shù)據(jù)更新周期、分類號(hào)加工、國(guó)省代碼表達(dá)、組合字段處理等方面的檢索結(jié)果差異,挖掘出導(dǎo)致差異的數(shù)據(jù)來源不同、數(shù)據(jù)加工錯(cuò)誤、檢索邏輯有別等因素,進(jìn)而提出相關(guān)建議,為專利信息檢索和分析人員更有效地使用各檢索平臺(tái)提供幫助。

        關(guān)鍵詞:專利;檢索平臺(tái);查全率

        中圖分類號(hào):G354 ""文獻(xiàn)標(biāo)志碼:A

        0 引言

        近年來,隨著全國(guó)知識(shí)產(chǎn)權(quán)信息公共服務(wù)體系建設(shè)的推進(jìn)和高校專利質(zhì)量提升及專利運(yùn)營(yíng)轉(zhuǎn)化需求上漲,專利信息檢索的需求也日趨活躍。專利文獻(xiàn)信息集技術(shù)、法律和經(jīng)濟(jì)信息于一體,是重要的科技信息資源。專利信息檢索平臺(tái)是獲取專利文獻(xiàn)信息、開展專利信息服務(wù)的必備工具,其數(shù)據(jù)檢出質(zhì)量是開展專利文獻(xiàn)信息檢索和情報(bào)分析服務(wù)的基礎(chǔ)保障。查全率是評(píng)價(jià)檢索質(zhì)量的常用指標(biāo)之一,而影響查全率的諸多因素之中,除檢索詞選取、檢索策略制定等[1-2]顯要因素外,還有容易受忽視的檢索平臺(tái)自身因素。因此,深入對(duì)比分析各專利信息檢索平臺(tái),掌握導(dǎo)致漏檢的平臺(tái)因素,對(duì)于提高檢索質(zhì)量具有重要意義。

        當(dāng)前,國(guó)內(nèi)專利信息檢索平臺(tái)蓬勃發(fā)展,形成了國(guó)家/地方知識(shí)產(chǎn)權(quán)管理服務(wù)部門、商業(yè)機(jī)構(gòu)并行發(fā)展的局面,為社會(huì)提供了數(shù)十種專利信息檢索平臺(tái)。本文選擇其中11種專利信息檢索平臺(tái),從數(shù)據(jù)更新、數(shù)據(jù)加工及檢索字段等方面對(duì)比、研究各平臺(tái)之間存在的影響查全的因素,為提高專利檢索質(zhì)量提供幫助。

        1 研究回顧

        自1955年P(guān)erry[3]提出查全率、查準(zhǔn)率以來,查全率一直是評(píng)價(jià)情報(bào)檢索系統(tǒng)性能的重要定量指標(biāo)[4]。在專利信息檢索領(lǐng)域,有關(guān)查全率的研究主要集中在以下兩方面。

        一是數(shù)據(jù)庫(kù)平臺(tái)角度研究造成漏檢的原因及提高查全率的方法,如分析文獻(xiàn)著錄、檢索語言等因素造成漏檢的原因[5];在專利文獻(xiàn)深加工中,通過對(duì)中心詞的同義詞、縮略語、中文詞、上位詞進(jìn)行自由詞標(biāo)引以提高查全率[6];通過正式標(biāo)引詞和非正式標(biāo)引詞的組配標(biāo)引以提高檢索的查全率和查準(zhǔn)率[7];提高非標(biāo)準(zhǔn)主題詞的標(biāo)引比例, 挖掘?qū)@碾[含信息,提高查全率[8]。

        二是從實(shí)務(wù)角度研究提高專利查全率的方法,包括通過檢索策略優(yōu)化提高查全率,如應(yīng)用領(lǐng)域本體對(duì)初始檢索表達(dá)式進(jìn)行檢索擴(kuò)展,在保障查準(zhǔn)率的基礎(chǔ)上提高檢索查全率[9];通過擴(kuò)展技術(shù)分支檢索、進(jìn)行關(guān)鍵詞擴(kuò)展等,防止漏檢[10];優(yōu)化檢索式構(gòu)造思路防止漏檢[11];從檢索需求分析、檢索要素確定、檢索策略制定、對(duì)比文件篩選對(duì)檢索全過程進(jìn)行優(yōu)化以提高查全率[12]。也有研究從構(gòu)建查全樣本集合等角度分析專利檢索的查全率驗(yàn)證過程及注意問題[13],針對(duì)特定領(lǐng)域或特定平臺(tái)進(jìn)行專利信息漏檢的原因分析及對(duì)策研究[14-15]。

        此外,也有研究者針對(duì)專利檢索平臺(tái)進(jìn)行對(duì)比研究。戚敏[16]從性能指標(biāo)(收錄范圍、檢索功能)及費(fèi)用效果指標(biāo)(檢索服務(wù)收費(fèi)、學(xué)習(xí)成本、使用成本)對(duì)中國(guó)專利信息網(wǎng)、中國(guó)知識(shí)產(chǎn)權(quán)網(wǎng)、CNIPA、中國(guó)專利檢索系統(tǒng)、易信專利信息網(wǎng)、CNKI6個(gè)平臺(tái)進(jìn)行比較、分析、評(píng)價(jià)。岳泉等[17]從檢索方式、檢索功能、檢索算符、檢索字段、檢索結(jié)果等方面對(duì)比了CNIPA、IBM知識(shí)產(chǎn)權(quán)網(wǎng)專利數(shù)據(jù)庫(kù)等九種網(wǎng)絡(luò)專利數(shù)據(jù)庫(kù)。李健康等[18]從文獻(xiàn)檢索課教學(xué)實(shí)踐需求出發(fā),從數(shù)據(jù)收錄量、檢索字段、檢索功能、檢索速度等方面對(duì)CNIPR、CNIPA、CNPAT、PATENT、NSTL、CNKI、萬方7個(gè)平臺(tái)進(jìn)行比較分析。曹平[19]從數(shù)據(jù)來源及范圍、檢索功能、更新頻率、輸出結(jié)果、方便易用性等方面對(duì)比了官方專利文獻(xiàn)信息檢索平臺(tái)(CNIPA、USPTO、esp@cenet、JPO)、商用專利文獻(xiàn)信息檢索平臺(tái)(Aureka、Delphion、DII)。羅立國(guó)等[20]針對(duì)智慧芽、佰騰網(wǎng)、Ipexl、Priorsmart、CNIPA、CNIPR、Soopat、Patentics和DII9個(gè)網(wǎng)站,對(duì)其檢索功能、檢索結(jié)果、分析功能和特色功能進(jìn)行比較研究。蔣凌等[21]側(cè)重專利信息平臺(tái)的深度分析功能和增值功能,就基本分析指標(biāo)、組配分析功能、文本挖掘、專利預(yù)警、特色分析功能等方面開展對(duì)CNIPR、Shanghaiip、Patentics、SooPat、佰騰網(wǎng)5個(gè)平臺(tái)進(jìn)行對(duì)比研究。陳海英等[22]從引文收錄范圍、引文檢索方式、前引后引查找功能、引文類型區(qū)分功能、非專利文獻(xiàn)查找功能、可視化呈現(xiàn)功能和引文檢索準(zhǔn)確度等方面對(duì)比Innography、WIPS 和 Patentics 3個(gè)專利檢索系統(tǒng)的引文分析功能。黎子輝等[23]通過考察相同的檢索策略下檢索結(jié)果數(shù)量差值,從數(shù)據(jù)完整性和準(zhǔn)確性、數(shù)據(jù)更新情況以及檢索精確度等方面對(duì)CNIPR、萬方、CNKI、IncoPat、Patsnap 5個(gè)專利數(shù)據(jù)庫(kù)進(jìn)行檢索測(cè)試、評(píng)價(jià)。

        綜上所述,學(xué)界對(duì)提高專利查全率的方法及專利檢索平臺(tái)功能對(duì)比已有豐富的研究,但鮮有學(xué)者從檢索平臺(tái)角度對(duì)影響專利查全率的因素進(jìn)行分析。

        2 研究設(shè)計(jì)

        專利文獻(xiàn)信息檢索結(jié)果的查全率既受檢索特征提取及檢索策略制定準(zhǔn)確與否的影響,也受專利信息檢索平臺(tái)自身因素的影響。本文從數(shù)據(jù)更新、數(shù)據(jù)加工及檢索字段等方面比對(duì)不同專利信息檢索平臺(tái),研究各平臺(tái)存在的影響查全率的平臺(tái)因素,以促進(jìn)提高專利檢索質(zhì)量。

        2.1 研究對(duì)象選取

        本文從國(guó)家知識(shí)產(chǎn)權(quán)局及其下屬機(jī)構(gòu)、商業(yè)性專利信息提供商、專利信息搜索引擎中選取11種國(guó)內(nèi)常用的專利信息檢索平臺(tái)為研究對(duì)象(見表1),包括:國(guó)家知識(shí)產(chǎn)權(quán)局及其下屬機(jī)構(gòu)提供的公布公告查詢系統(tǒng)(以下簡(jiǎn)稱“CNIPA”)、CNIPR專利信息服務(wù)平臺(tái)(以下簡(jiǎn)稱“CNIPR”)、專利檢索及分析系統(tǒng)PSS(以下簡(jiǎn)稱“PSS”)、專利之星檢索系統(tǒng)(以下簡(jiǎn)稱“專利之星”),商業(yè)性專利數(shù)據(jù)庫(kù)商提供的合享incoPat、智慧芽以及提供免費(fèi)檢索服務(wù)的專利信息搜索引擎INNOJOY、專利匯、萬象云、佰騰、潤(rùn)桐。

        2.2 研究方法設(shè)計(jì)

        從文獻(xiàn)存儲(chǔ)來看,影響查全率的因素主要有文獻(xiàn)庫(kù)收錄文獻(xiàn)不全、索引詞匯缺乏控制和專指性、標(biāo)引不詳、標(biāo)引前后不一致等[24]。本文從數(shù)據(jù)更新、數(shù)據(jù)加工、檢索字段3個(gè)維度,考察在相同檢索條件下各專利信息檢索平臺(tái)在專利數(shù)據(jù)更新周期、分類號(hào)、國(guó)省代碼、組合字段處理、公開公告日字段等方面的異同,并針對(duì)檢索結(jié)果數(shù)據(jù)差異進(jìn)行探究,力求找出原因,為專利信息檢索和分析人員更有效地使用各檢索平臺(tái)提供幫助。

        3 專利信息檢索平臺(tái)漏檢因素實(shí)證分析

        3.1 數(shù)據(jù)更新周期因素分析

        國(guó)家知識(shí)產(chǎn)權(quán)局(專利局)于每周二、周五以專利公報(bào)方式公布專利公開、公告數(shù)據(jù),各專利信息檢索平臺(tái)也定期通過接收或爬取國(guó)家知識(shí)產(chǎn)權(quán)局(專利局)的公報(bào)數(shù)據(jù)對(duì)其數(shù)據(jù)進(jìn)行更新,更新周期是影響查全率的因素之一。各檢索平臺(tái)的數(shù)據(jù)更新頻率不一,在時(shí)間敏感性強(qiáng)的專利查新等服務(wù)中,及時(shí)獲取最新公開公告信息具有很強(qiáng)的現(xiàn)實(shí)意義。

        本文從2024年11月8日、12日的發(fā)明、實(shí)用新型、外觀設(shè)計(jì)專利公報(bào)中各選取頭尾兩件數(shù)據(jù),共得12件專利數(shù)據(jù)作為測(cè)試集。于2024年11月9日至14日每天通過公開/公告號(hào)檢索。經(jīng)測(cè)試,CNIPA、CNIPR、PSS、專利之星、incoPat、智慧牙、專利匯和佰騰的數(shù)據(jù)更新及時(shí),在專利公報(bào)發(fā)布第2天即可檢索到最新專利數(shù)據(jù)。相比較而言,INNOJOY滯后2天,潤(rùn)桐滯后4天,萬象云更新頻率則較慢,滯后一周左右,且數(shù)據(jù)更新周期較為不規(guī)則,存在部分舊數(shù)據(jù)比新數(shù)據(jù)更遲收錄現(xiàn)象(見表2)。

        3.2 數(shù)據(jù)加工質(zhì)量因素

        3.2.1 分類號(hào)因素

        采用抽樣方式,選取IPC號(hào)H02K11的專利數(shù)據(jù)進(jìn)行數(shù)據(jù)量測(cè)試,并以CNIPA檢索結(jié)果為基準(zhǔn)值,通過差值直觀體現(xiàn)各平臺(tái)的數(shù)據(jù)差異(見表3)。從檢出數(shù)據(jù)看,智慧芽、incoPat檢出結(jié)果基本一致,數(shù)量也最多;PSS、專利之星、佰騰、潤(rùn)桐則有不同程度的數(shù)據(jù)缺失,其中佰騰的缺失數(shù)據(jù)量占比達(dá)2.4%。

        為進(jìn)一步分析各平臺(tái)數(shù)據(jù)差異原因,本文選取2005年、2020年的兩個(gè)時(shí)間段對(duì)數(shù)據(jù)進(jìn)行逐一比對(duì),發(fā)現(xiàn)導(dǎo)致各平臺(tái)檢出數(shù)據(jù)差異的原因主要有兩個(gè)。

        一是IPC分類號(hào)來源不同導(dǎo)致的差異?!秶?guó)際專利分類表》從2006年1月1日實(shí)施第8版,并要求所有專利文獻(xiàn)均根據(jù)基本版和高級(jí)版的修訂進(jìn)行重新分類,使檢索人員在利用國(guó)際專利分類號(hào)進(jìn)行檢索時(shí),不必再考慮以前國(guó)際專利分類版本的情況。但由于過去的專利文獻(xiàn)數(shù)量巨大,目前互聯(lián)網(wǎng)上的許多專利文獻(xiàn)檢索數(shù)據(jù)庫(kù)中還沒有對(duì)以前文獻(xiàn)的IPC分類號(hào)全部進(jìn)行更新[25],做得較好的是歐洲專利局,除提供原專利分類號(hào)數(shù)據(jù)外,還提供IPC版本8的分類號(hào)數(shù)據(jù),因而每件專利的分類號(hào)數(shù)據(jù)更為豐富。通過2005年的數(shù)據(jù)比對(duì)發(fā)現(xiàn),incoPat、智慧芽均綜合了中國(guó)專利局和歐洲專利局的分類號(hào)數(shù)據(jù),故而檢出結(jié)果明顯多于CNIPA等平臺(tái)。如,專利“電機(jī)起動(dòng)繼電器和使用該電機(jī)起動(dòng)繼電器的電動(dòng)壓縮機(jī)(CN1607719A)”,其在incoPat的數(shù)據(jù)顯示,分類號(hào)有:H02P1/00; H01C7/02; H01H45/02; H01C1/02; H01C1/022; H01H45/00; H02H9/02; H02K11/00。經(jīng)比對(duì),H02P1/00; H01C7/02; H01H45/02為原專利IPC1-7版數(shù)據(jù),H01C1/022; H01H45/00; H02H9/02; H02K11/00為歐專局增加的IPC-8版數(shù)據(jù),而H01C1/02則來源于PSS系統(tǒng)中該件專利的英文版CN:200410095118:A。

        二是檢索平臺(tái)數(shù)據(jù)加工錯(cuò)誤所致。如在2005年的抽樣數(shù)據(jù)中,CNIPR檢出66件,其結(jié)果與incoPat、智慧芽相比,漏檢了以下3件:CN1595766A、CN1607713A、CN1193481C(申請(qǐng)日均在2003-09-11以前),進(jìn)一步檢索可知,CNIPR系統(tǒng)中該3件專利的IPC分類號(hào)中均沒有H02K11,推測(cè)是2003年09月11日以前的IPC數(shù)據(jù)沒有更新到IPC(8)所致。而在2020年的抽樣數(shù)據(jù)中,佰騰未檢出的12件數(shù)據(jù)中,CN109256927B、CN109038910B等均可在佰騰網(wǎng)中通過申請(qǐng)?zhí)柣蚬_公告號(hào)檢出,且授權(quán)公告日期、IPC符合檢索條件,推測(cè)是因?yàn)榉诸愄?hào)處理問題導(dǎo)致未檢出。

        3.2.2 國(guó)省代碼因素

        檢索、分析某一區(qū)域的專利數(shù)據(jù)也是常見專利信息服務(wù)之一。通過省市代碼檢索是獲取區(qū)域?qū)@麛?shù)據(jù)的快捷途徑,其檢索結(jié)果也比通過專利申請(qǐng)人地址窮盡檢索更為全面和準(zhǔn)確。本文以檢索“2020年5月1日至15日公開公告的福建省專利數(shù)據(jù)”為測(cè)試對(duì)象,分析各專利信息檢索平臺(tái)國(guó)省代碼的查全情況(見表4)。

        從檢索結(jié)果看,除CNIPA、潤(rùn)桐不支持國(guó)省代碼字段檢索外,CNIPR、incoPat、INNOJOY、專利匯檢出結(jié)果相同,與之相比,PSS、專利之星、智慧芽、佰騰均有不同程度的漏檢。此外,萬象云檢出的發(fā)明、實(shí)用新型數(shù)據(jù)多于CNIPR等平臺(tái),選取2020年5月5日公開公告的發(fā)明申請(qǐng)/授權(quán)數(shù)據(jù)進(jìn)一步比對(duì)發(fā)現(xiàn),與CNIPR、incoPat、智慧芽等相比,萬象云多檢出的專利數(shù)據(jù)有兩類:① 聯(lián)合申請(qǐng),且福建申請(qǐng)人非第一位的專利數(shù)據(jù),如CN111105962A、CN105325676B;② 原始申請(qǐng)人非福建的,經(jīng)過轉(zhuǎn)讓后,現(xiàn)專利權(quán)人為福建的,如CN108124107B、CN107386383B。進(jìn)一步比對(duì)發(fā)現(xiàn),如CNIPR、incoPat等缺的是①類數(shù)據(jù);智慧芽缺的是①、②兩類數(shù)據(jù)。

        需注意的是,各平臺(tái)對(duì)國(guó)省代碼的檢索詞表達(dá)及范圍界定是有差異的。如針對(duì)福建,CNIPR、incoPat、智慧芽、INNOJOY、佰騰、萬象云用省市代碼數(shù)字35或福建表示,其中萬象云用表達(dá)式“apcp=福建 or apcp=cn35”表示,否則會(huì)漏檢。PSS則用漢字“福建”表示,專利匯用漢字“福建省”表示。專利之星也用數(shù)字35表示,但不包含計(jì)劃單列市廈門(省市代碼為92)。因此,在專利之星中檢索福建省專利時(shí)需用“35+92”表示,否則造成漏檢。

        3.3 檢索字段因素

        3.3.1 文本組合字段

        跨字段檢索是提高查全率的常用方法,多數(shù)專利信息檢索平臺(tái)均通過提供“名稱/摘要”、“名稱/摘要/權(quán)利要求書”等組合字段為用戶提供較為滿意的檢索體驗(yàn)(見表5)。如表5所示,除CNIPA、萬象云外,其他檢索平臺(tái)均提供名稱/摘要、名稱/摘要/權(quán)利要求書等組合字段。而組合字段的邏輯運(yùn)算關(guān)系直接關(guān)系檢索結(jié)果。為此,本文選取一專利申請(qǐng)數(shù)據(jù)“一種μLED巨量轉(zhuǎn)移方法(CN111128813A)”為檢索對(duì)象,通過檢索式“標(biāo)題/摘要/權(quán)利要求書=(μLED AND 光學(xué)膠 AND 減黏膠)”的檢出結(jié)果情況對(duì)比各平臺(tái)組合字段的邏輯運(yùn)算關(guān)系。

        通過檢索發(fā)現(xiàn),PSS、專利之星、incoPat、智慧芽、INNOJOY、專利匯、佰騰可順利檢出目標(biāo)專利,即真正支持跨字段檢索。而CNIPR、潤(rùn)桐則不能檢出,其中,CNIPR中在“名稱,摘要,權(quán)利要求書”字段中檢索時(shí),默認(rèn)采用“+=”算符連接,檢索式為“名稱,摘要,權(quán)利要求書+=(μLED AND 光學(xué)膠 AND 減黏膠)”,要求檢索任意字段上同時(shí)滿足條件的記錄,即檢索式實(shí)為:(名稱=(μLED AND 光學(xué)膠 AND 減黏膠) AND 摘要=(μLED AND 光學(xué)膠 AND 減黏膠) AND 權(quán)利要求書=(μLED AND 光學(xué)膠 AND 減黏膠)) ?!?=”算符也可手動(dòng)改為“*=”(檢索各個(gè)字段上滿足同一條件的記錄)、“^=”(檢索只有一個(gè)字段上滿足條件的記錄)。潤(rùn)桐亦不能檢出目標(biāo)專利,其組合字段內(nèi)的運(yùn)算方式是+=,即檢索任意字段上同時(shí)滿足條件的記錄。

        此外,萬象云在其“技術(shù)主題”檢索欄中支持專利名稱、摘要、權(quán)利要求、說明書的復(fù)選框,本文復(fù)選名稱、摘要、權(quán)利要求3項(xiàng)字段,看到其生成的檢索式為:(ti=(μLED AND 光學(xué)膠 AND 減黏膠) AND ab=(μLED AND 光學(xué)膠 AND 減黏膠) AND cl=(μLED AND 光學(xué)膠 AND 減黏膠))即相當(dāng)于CNIPR的“+=”連接算符。

        3.3.2 公開公告日字段

        發(fā)明申請(qǐng)的公開日期及發(fā)明、實(shí)用新型、外觀設(shè)計(jì)的授權(quán)公告日期是開展專利統(tǒng)計(jì)分析工作的基準(zhǔn)條件之一,在本文所選平臺(tái)中,除專利之星將公開日、公告日分開為兩個(gè)檢索字段外,其他平臺(tái)均將公開日期和授權(quán)公告日期合并為一個(gè)檢索字段。本文以“分類號(hào)=(H02K11) AND 公開(公告)日=(20200101 TO 20200501)”為檢索條件,考察各平臺(tái)的查全率(見表6)。

        通過檢索結(jié)果可看出,CNIPA、CNIPR、PSS、incoPat、INNOJOY、潤(rùn)桐檢出結(jié)果一致,共1005件,其中,發(fā)明申請(qǐng)416件,發(fā)明授權(quán)120件,實(shí)用新型469件。專利之星、智慧芽、萬象云檢出1004件,看似漏檢1件,實(shí)則不然,因檢出結(jié)果集中的發(fā)明專利“電機(jī)端部電壓采集電路及其應(yīng)用(CN110763904B)”的公開日期為2020年2月7日,授權(quán)日期為2020年4月7日,均符合公開、公告日條件,故而能檢出其申請(qǐng)公開(A文檔)和授權(quán)公告(B文檔)兩項(xiàng)數(shù)據(jù),專利之星、智慧芽、萬象云自動(dòng)合并簡(jiǎn)單同族后記為1件,故而只有1004件。

        佰騰檢出結(jié)果中,發(fā)明授權(quán)只有1件。經(jīng)比對(duì),其高級(jí)檢索頁面中的“公開(公告)日”實(shí)際只包含發(fā)明申請(qǐng)的公開日和實(shí)用新型、外觀設(shè)計(jì)的授權(quán)公告日,但未包含發(fā)明授權(quán)的公告日,因而造成發(fā)明授權(quán)的漏檢;其檢出的1件發(fā)明授權(quán)是 “電機(jī)端部電壓采集電路及其應(yīng)用(CN110763904B)”,公開日期為2020年2月7日,授權(quán)日期為2020年4月7日,其實(shí)是通過公開日檢出的。

        專利匯檢出結(jié)果為1046件,比CNIPA等平臺(tái)多出41件,經(jīng)比對(duì),多出的41件專利數(shù)據(jù)的公開公告日均為2020年5月5日,如CN111108668A、CN107078620B、CN210469150U等,應(yīng)是平臺(tái)數(shù)據(jù)處理有誤導(dǎo)致。

        此外,進(jìn)一步在佰騰中修改檢索式,增加授權(quán)公告日字段apd,檢索式為:ic1,ic2:(H02K11) AND ((pd:[20200101 TO 20200501]) OR (apd:[20200101 TO 20200501])) ,則可檢出109件發(fā)明授權(quán)。與CNIPA等相比,仍然漏檢11件。經(jīng)進(jìn)一步比對(duì)發(fā)現(xiàn),其漏檢的數(shù)據(jù),如“一種省去霍爾位置傳感器調(diào)試過程的直流無刷電機(jī)(CN109256927B)”、“塑封電機(jī)(CN109038910B)”等均可在佰騰中通過申請(qǐng)?zhí)柣蚬_公告號(hào)檢出,且授權(quán)公告日期、IPC符合檢索條件,推測(cè)是因?yàn)榉诸愄?hào)處理問題,導(dǎo)致漏檢。

        4 結(jié)論與建議

        本文以查全為視角,深入考察各檢索平臺(tái)的漏檢因素可得出以下結(jié)論與建議。

        (1)多數(shù)專利信息平臺(tái)數(shù)據(jù)更新及時(shí),在國(guó)家知識(shí)產(chǎn)權(quán)局(專利局)發(fā)布專利公報(bào)數(shù)據(jù)的第二天即完成數(shù)據(jù)收錄入庫(kù),這可能得益于國(guó)家知識(shí)產(chǎn)權(quán)局大力提升公共服務(wù)能力,強(qiáng)化知識(shí)產(chǎn)權(quán)數(shù)據(jù)資源供給的扶持政策。但也有部分平臺(tái)存在數(shù)據(jù)更新不及時(shí)、更新周期不規(guī)則等問題,建議在專利查新、新公開專利檢索等時(shí)敏性服務(wù)中留意檢索平臺(tái)的數(shù)據(jù)更新時(shí)間,避免漏檢近期公開專利。

        (2)分類號(hào)是檢索專利技術(shù)的重要途徑,也是較難察覺的漏檢因素。上述測(cè)試表明,部分檢索平臺(tái)未有效整合歐洲專利局等平臺(tái)的IPC分類號(hào)數(shù)據(jù),而自身又不具備及時(shí)大規(guī)模更新數(shù)據(jù)的情況下,難以跟上國(guó)際專利分類號(hào)(IPC)的周期性更新,導(dǎo)致數(shù)據(jù)漏檢。還有部分平臺(tái)因?yàn)榉诸愄?hào)處理問題導(dǎo)致未檢出。建議在涉及專利技術(shù)檢索的應(yīng)用場(chǎng)景中,應(yīng)在多平臺(tái)進(jìn)行試檢,并通過檢出結(jié)果的比對(duì)了解不同平臺(tái)在分類號(hào)處理、表達(dá)之間的細(xì)微差異,進(jìn)而針對(duì)性優(yōu)化檢索策略,提高查全率。

        (3)在省市區(qū)域性專利數(shù)據(jù)檢索中,國(guó)省代碼字段比地址窮舉的檢索方式具有更高的檢索效率和更小的檢索誤差,但各平臺(tái)在國(guó)省代碼的檢索詞表達(dá)及范圍界定上存在差異,檢索時(shí)應(yīng)參照檢索平臺(tái)的字段說明編制檢索式,避免漏檢。同時(shí),不同平臺(tái)在合作申請(qǐng)及轉(zhuǎn)讓專利的專利權(quán)人地域認(rèn)定規(guī)則不盡相同,相關(guān)檢索中應(yīng)根據(jù)檢索要求和平臺(tái)規(guī)則制定相應(yīng)的檢索策略,減少遺漏。

        (4)部分檢索字段名稱相似,如“名稱/摘要/權(quán)利要求書”組合字段、公開公告日字段等,但在不同平臺(tái)中,其含義及檢索規(guī)則存在差別,容易導(dǎo)致漏檢,是影響查全率的隱蔽因素。建議檢索人員通過對(duì)比不同平臺(tái)間相似字段,尤其是組合字段的檢索結(jié)果差異,了解組合字段背后檢索規(guī)則及數(shù)據(jù)范圍的細(xì)微差別,并采取相應(yīng)的措施優(yōu)化檢索策略,避免漏檢。

        參考文獻(xiàn)

        [1]沈艷紅.信息檢索中檢索詞的選擇對(duì)查全率的影響[J].情報(bào)探索,2006(11):73-74.

        [2]俞平.信息檢索中文獻(xiàn)漏檢誤檢因素分析[J].情報(bào)科學(xué),2011(8):1234-1237,1243.

        [3]PERRY J W.[J].Operational criteria designing information rettrival systems[J]. American Documentation,1955(2):93-101.

        [4]邱黎雯.關(guān)于查全率和查準(zhǔn)率問題研究概況[J].情報(bào)科學(xué),1984(5):5-11.

        [5]黃瑞芬.文獻(xiàn)數(shù)據(jù)庫(kù)檢索中的漏檢與誤檢原因及對(duì)策[J].國(guó)防技術(shù)基礎(chǔ),2004(6):43-44.

        [6]馬琦.淺析專利文獻(xiàn)深度加工中標(biāo)引詞的發(fā)展趨勢(shì)[J].中國(guó)發(fā)明與專利,2015(9):34-35.

        [7]王彩霞,魏健波.淺談中國(guó)藥物專利數(shù)據(jù)庫(kù)建設(shè)中的藥物專利標(biāo)引工作[J].中國(guó)發(fā)明與專利,2019(5):82-86.

        [8]李宏芳,鄒小筑.中國(guó)專利數(shù)據(jù)庫(kù)標(biāo)引質(zhì)量測(cè)評(píng)[J].現(xiàn)代情報(bào),2010(12):58-61.

        [9]張杰,張海超,翟東升,等.基于領(lǐng)域本體的專利信息檢索研究[J].情報(bào)科學(xué),2014(10):9-14.

        [10]趙娟,潘薇,劉會(huì)景.基于中國(guó)專利數(shù)據(jù)庫(kù)的專題技術(shù)檢索策略:以循環(huán)腫瘤細(xì)胞技術(shù)為例[J].情報(bào)工程,2016(4):49-55.

        [11]王吉霞.專利防侵權(quán)調(diào)查的檢索方法探究[J].現(xiàn)代情報(bào),2014(6):95-98.

        [12]吳宏霞,胡曉佳.淺析專利檢索中如何避免漏檢[J].中國(guó)發(fā)明與專利,2018(11):87-91.

        [13]周美霞,付占海,麗娜.淺談專利檢索中查全查準(zhǔn)率驗(yàn)證過程及注意問題[J].中國(guó)發(fā)明與專利,2017(9):91-93.

        [14]賈鈞琳,孫海燕,李征,等.化學(xué)領(lǐng)域發(fā)明專利申請(qǐng)檢索的漏檢原因淺析[J].中國(guó)發(fā)明與專利,2012(增刊1):148-151.

        [15]馬莉.從S系統(tǒng)漏檢案例淺談Patentics降噪效果[J].中國(guó)新通信,2019(10):145.

        [16]戚敏.國(guó)內(nèi)專利網(wǎng)站專利檢索的比較評(píng)析[J].情報(bào)雜志,2002(12):59-61.

        [17]岳泉,晏一平.中外專利信息網(wǎng)絡(luò)檢索工具的比較研究[J].圖書情報(bào)工作,2005(9):86-90.

        [18]李健康,許四洋,張政寶.九個(gè)常用中國(guó)專利檢索網(wǎng)站比較研究[J].圖書館論壇,2010(6):191-200.

        [19]曹平.中外專利文獻(xiàn)信息檢索平臺(tái)比較研究[J].情報(bào)探索,2011(7):67-69.

        [20]羅立國(guó),余翔,鄭婉婷,等.專利檢索網(wǎng)站比較研究[J].情報(bào)雜志,2012(3):163-167.

        [21]蔣凌,鐘永恒,劉佳.我國(guó)專利信息平臺(tái)分析與增值服務(wù)對(duì)比研究[J].情報(bào)雜志,2013(9):163-166.

        [22]陳海英,文禹衡.Innography、WIPS和Patentics專利引文分析比較研究[J].圖書情報(bào)工作,2015(18):117-126.

        [23]黎子輝,劉亞娟.常用中國(guó)專利數(shù)據(jù)庫(kù)評(píng)析[J].圖書館研究,2020(1):43-49.

        [24]王云.電腦網(wǎng)絡(luò)信息檢索方法[M].北京:國(guó)防工業(yè)出版社,1999.

        [25]孟俊娥.專利檢索策略及應(yīng)用[M].北京:知識(shí)產(chǎn)權(quán)出版社,2010.

        Research on the factors of retrieval platforms affecting the recall ratio of patents:taking

        domestic patent information retrieval platforms as an example

        Abstract: Patent information retrieval platforms are essential tools for obtaining patent literature information and carrying out patent information services. The quality of data retrieval is the fundamental guarantee for conducting patent literature information retrieval and intelligence analysis services. This paper examines the factors that affect the recall ratio of various patent information retrieval platforms under the same retrieval conditions from three dimensions: data update, data processing, and retrieval fields. Specifically, through actual cases, it compares the differences in retrieval results of 11 patent information retrieval platforms such as CNIPA and PSS in terms of data update cycle, classification number processing, expression of national and provincial codes, combination field processing, etc., and uncovers the reasons for the differences such as different data sources, data processing errors, and different retrieval logics, and then puts forward relevant suggestions to help patent information retrieval and analysis personnel use each retrieval platform more effectively.

        Key words: patent; retrieval platform; recall ratio

        猜你喜歡
        信息檢索
        基于同態(tài)加密支持模糊查詢的高效隱私信息檢索協(xié)議
        基于信息檢索課的大學(xué)生信息檢索行為調(diào)查研究
        高職院校圖書館開設(shè)信息檢索課的必要性探討
        基于MOOC理念的“翻轉(zhuǎn)課堂”教學(xué)改革探索——以海南大學(xué)《文獻(xiàn)信息檢索與利用》課程為例
        網(wǎng)絡(luò)環(huán)境下數(shù)字圖書館信息檢索發(fā)展
        山西青年(2018年5期)2018-01-25 16:53:40
        醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
        新聞傳播(2016年18期)2016-07-19 10:12:06
        在網(wǎng)絡(luò)環(huán)境下高職院校開設(shè)信息檢索課的必要性研究
        新聞傳播(2016年11期)2016-07-10 12:04:01
        基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究
        地理信息檢索中空間相似性度量的一種模糊方法
        教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計(jì)與實(shí)施
        河南科技(2014年11期)2014-02-27 14:10:19
        国产一女三男3p免费视频| 男生自撸视频在线观看| 国产专区国产精品国产三级| 五十六十日本老熟妇乱| 国产性生交xxxxx免费| 无码国产精品第100页| 亚洲性码不卡视频在线| 亚洲精品视频中文字幕| 欧美日韩国产精品自在自线| 草草网站影院白丝内射| 无码91 亚洲| 综合亚洲二区三区四区在线| 成人在线免费电影| 欧美多毛肥胖老妇做爰| 亚洲在战AV极品无码| 日韩中文字幕不卡在线| 人妻精品久久无码区| 亚洲精品久久久久高潮| 亚洲国产一区二区三区,| 区一区二区三区四视频在线观看| 欧美精品videosse精子| 十八岁以下禁止观看黄下载链接 | 国产精品一区二区三区播放| 亚洲成av人的天堂在线观看| 尤物yw无码网站进入| 中文字幕日本一区二区在线观看| 国产女同va一区二区三区| 欧美寡妇xxxx黑人猛交| 成人欧美在线视频| 国产av精品久久一区二区| 人人超碰人人爱超碰国产 | 少妇高潮惨叫喷水在线观看| 亚洲国产精品日韩专区av| 精品国内日本一区二区| 欧美黑人xxxx又粗又长| 日韩欧美国产丝袜视频| 亚洲中文字幕一二区精品自拍| 日本动漫瀑乳h动漫啪啪免费 | av天堂精品久久久久| 美女被强吻并脱下胸罩内裤视频 | 日本老熟妇毛茸茸|