孫麗偉,楊 筱,胡 婷,陳印政
(1.中國專利信息中心,北京 102206;2.國家知識產權戰(zhàn)略實施(天津大學)研究基地,天津 300072;3.天津大學大學文化與校史研究所,天津 300072)
數(shù)據(jù)作為現(xiàn)代生活的基礎媒介和重要資源,其價值已被社會充分肯定,并日益深刻地改變著人們的生活方式和思維觀念[2]。近年來,無論是國家、各級知識產權管理部門,還是創(chuàng)新主體、社會公眾,對知識產權信息都越來越重視。高質量的數(shù)據(jù)是知識產權信息服務的核心引擎,數(shù)據(jù)標準化是提高數(shù)據(jù)質量的重要手段。知識產權數(shù)據(jù)標準體系是促進知識產權信息高效利用、提升信息服務水平的基石。中國《知識產權強國建設綱要(2021—2035 年)》和《“十四五”國家知識產權保護和運用規(guī)劃》都再次強調,要加強知識產權數(shù)據(jù)標準制定和數(shù)據(jù)資源供給,提高知識產權公共服務能力,促進知識產權信息的高效利用。
當前,知識產權治理正進入互聯(lián)網和大數(shù)據(jù)時代。世界范圍內,知識產權行政管理呈現(xiàn)集中化趨勢[3]。從面向知識產權數(shù)據(jù)未來應用的視角分析,為了用好知識產權數(shù)據(jù)這座“金礦”,無論是促進數(shù)據(jù)的國際交流、深化國內外數(shù)據(jù)共享,還是加強各類知識產權數(shù)據(jù)庫之間的深度互聯(lián),從而滿足創(chuàng)新主體和社會公眾對高質量數(shù)據(jù)服務的需求,都迫切需要中國整合數(shù)據(jù)資源,并遵循統(tǒng)一的知識產權數(shù)據(jù)標準,形成覆蓋面廣、收錄全面、智能高效、服務便捷、開放共贏、能夠互聯(lián)互通的知識產權標準數(shù)據(jù),進而增強數(shù)據(jù)的互操作性和實現(xiàn)數(shù)據(jù)的深度互聯(lián),驅動數(shù)據(jù)獲取、加工與綜合利用的便捷與高效。這不但是知識產權強國建設的重要組成部分,也是知識產權制度能否高效運行的重要支柱。
知識產權數(shù)據(jù)標準體系建設必須基于能夠獲得的知識產權數(shù)據(jù)。知識產權數(shù)據(jù)是指創(chuàng)新主體在從事智力創(chuàng)造、獲取知識產權過程中所形成的各種數(shù)據(jù),主要包括知識產權權利主體、客體、內容、權利變更、權利轉移和運用以及法律狀態(tài)等信息[4]。從內容來看,知識產權數(shù)據(jù)包括專利、商標、地理標志、版權等諸多類型的數(shù)據(jù)。知識產權數(shù)據(jù)內涵豐富、數(shù)量巨大、涉及領域寬廣,這給知識產權數(shù)據(jù)的管理與應用帶來巨大挑戰(zhàn)。參與知識產權全球治理體系建構已成為知識產權國際保護的新動力[5],因此,通過對世界知識產權數(shù)據(jù)標準和中國知識產權數(shù)據(jù)標準的系統(tǒng)梳理,分析知識產權數(shù)據(jù)標準的現(xiàn)狀及發(fā)展趨勢,能夠為中國持續(xù)提升知識產權數(shù)據(jù)標準體系建設水平提供有益的參考。
為了增強知識產權信息在各國家(地區(qū))知識產權管理局間的互操作性,促進知識產權信息的處理和傳播,提高知識產權信息的利用效率,世界知識產權組織(WIPO)標準委員會制定了一系列知識產權數(shù)據(jù)、信息和文獻領域的標準、建議或指南,其中對知識產權數(shù)據(jù)處理領域影響較大的是ST.96標準和JavaScript 對象表示法(JSON)標準。
2.1.1 ST.96 標準及其發(fā)展
世界知識產權組織推薦使用的ST.96 標準,使用可擴展標記語言(XML)對專利、商標、工業(yè)設計、地理標志和版權等類型的知識產權信息進行提交、發(fā)布、處理和交換[6]。ST.96 標準是使用XML 處理知識產權信息的集大成者,旨在增進各國家(地區(qū))知識產權局之間的互操作性、加強各類型知識產權信息的協(xié)調、促進數(shù)據(jù)兼容性(尤其是與WIPO 標準ST.36/66/86 的數(shù)據(jù)可轉換性)、提高知識產權信息的一致性和促進XML Schemas 的普遍實施,具有模塊化、互用性、兼容性和復用性等優(yōu)點[7]。最新版的ST.96 標準包括主體文件和7 個附件,它們對標準的范圍、要求、設計規(guī)則、數(shù)據(jù)實體、架構組件等詳細地進行了約定,并提供了不同XML 標準間轉換的指導及具體的符合ST.96 標準的樣例。
我反正抓住一點:是她做長輩的先“黑”我,本來婚前婚后我就有好些不滿意,比如每次我們夫妻吵架她表面勸和,實際背地里和她兒子嘰里呱啦;我爸媽從老家來看我,送給她自家產的農產品,她卻說那土雞不正宗;我結婚什么彩禮也沒要,她還嫌我娘家給的壓箱錢太少……
(1)ST.96 標準的設計理念。ST.96 標準建議在組件級別使用模塊化語言架構,在文檔級別使用扁平化語言架構。ST.96 標準對所有的類型、元素和屬性都定義為全局組件[8]。該標準的模塊化架構組件分為通用組件和業(yè)務組件,通用組件針對公共屬性進行定義,與具體知識產權類型的關聯(lián)性不強,并且由兩種或兩種以上的業(yè)務類型共享;業(yè)務組件包括專利組件、商標組件、工業(yè)設計組件、地理標志組件、版權組件等具體知識產權類型的組件。通用組件和各業(yè)務組件按照層級包括基本組件、集合組件和文檔組件3 種類型[9]。
(2)ST.96 標準的發(fā)展變化。自2012 年WIPO標準委員會發(fā)布第1 版ST.96 標準以來,該標準持續(xù)修訂和完善,截至2022 年年底已經發(fā)布了10 個版本[10]。隨著版本的更新和完善,ST.96 標準的適用范圍已經擴展到專利、商標、工業(yè)設計、地理標志和版權等,其通用組件和業(yè)務組件的類別及數(shù)據(jù)元素也越來越豐富(見表1)。從數(shù)量看,XML 組件的總數(shù)從最初的387 個逐漸擴充到3 333 個;從類別看,自4.0 版本開始,XML 組件涵蓋通用組件以及專利、商標、外觀設計、地理標志和版權等業(yè)務組件。
表1 ST.96 標準各版本包含的XML 組件情況
相較于早期版本,ST.96 V4.0 版本除了新增地理標志(216 個組件)和版權(88 個組件)架構外,還納入了審查報告相關數(shù)據(jù)(約80 個組件)和專利法律狀態(tài)數(shù)據(jù)(約120 個組件)的XML 架構。ST.96 V5.0 的附件五納入了用于確定 ST.96 架構合規(guī)性的XSD Validator 工具的改進版本,以及能夠以標準化的方式從 ST.96 設計架構中生成扁平架構的新工具。在最新版本ST.96 V6.0 中,包含了新的合金成分架構(alloy composition schemas)組件以捕捉專利和非專利文獻中的合金成分數(shù)據(jù),并修訂了與版權和地理標志有關的現(xiàn)有組件。此外,根據(jù)XML4IP工作隊于2022 年9 月公布的未來工作計劃,專利記錄和專利業(yè)務架構的開發(fā)已經相當成熟,商標和外觀設計法律狀態(tài)架構的開發(fā)也將繼續(xù)推進,這些組件有望納入ST.96 的下一個版本中[11]。
(3)ST.96 標準的實施狀況。根據(jù)WIPO 標準的使用狀況調查,截至2018 年4 月,已有23 個國家(地區(qū))的知識產權局部分或者完全地實施了ST.96 標準[12]。根據(jù)XML4IP 工作隊于2020 年9 月在其內部進行的ST.96 標準實施情況的調查,在給出答復的11 個國家(地區(qū))的知識產權局中,有7個實施了ST.96 標準,主要用于馬德里和海牙體系通信;有6 個表示希望未來以ST.96 的格式與國際局進行PCT 數(shù)據(jù)通信[13]。WIPO 標準委員會第八屆會議指出,在海牙體系電子通信方面,從2021 年3月31 日起,ST.96 格式成為各局同國際局進行海牙雙邊數(shù)據(jù)交換的唯一權威格式[14]。
為了便于ST.96 標準的實施,XML4IP 工作隊組織開發(fā)了用于確定ST.96 架構合規(guī)性的XSD Validator工具,以及以標準化方式從ST.96 設計架構中生成扁平結構的新工具;國際局創(chuàng)建了集中存儲庫試點,集中存儲庫用于共享基于各種ST.96 實施情況的XML 樣例,包括其他各局定制的XML 架構,此外還計劃建立外部開發(fā)者論壇,為其他各局和XML開發(fā)者提供合作工作平臺,以共享實施ST.96 標準的經驗和知識。
(4)ST.96 標準的發(fā)展趨勢。ST.96 標準各類組件復用性強。ST.96 標準根據(jù)元素/類型分別制成schema 文件,各文件之間可以按需形成相互調用關系,各國家(地區(qū))知識產權局也可以利用ST.96的組件進行按需組合。此外,XML4IP 工作隊還提出了以ST.96 標準為基礎管理產權組織其他XML 標準的方案,將其他XML 標準(如ST.37 等)中可重復利用的組件納入ST.96 標準的代碼庫[13]。在全球范圍內實施ST.96 標準,能夠提升數(shù)據(jù)的互操作性和可獲取性,促進數(shù)據(jù)共享和數(shù)據(jù)交易,使數(shù)據(jù)結果更易被理解,將有助于提高知識產權數(shù)據(jù)管理效率,提升數(shù)據(jù)傳播的準確性和及時性[15]。
2.1.2 JSON 標準及其發(fā)展
WIPO 的JSON 標準是為適應數(shù)據(jù)傳播和交換的新需求制定的,與ST.96標準相兼容,使用JSON資源,提交、處理、公布和/或交換知識產權信息的新標準。JSON 標準的目標是:為JSON 格式的數(shù)據(jù)標記提供指導;通過提供基于WIPO 標準ST.96 的JSON Schemas 和實例用于交換知識產權數(shù)據(jù),以確保一致性;建議擴展JSON Schemas 或創(chuàng)建兼容的新JSON Schemas 的設計原則;通過促進各國家(地區(qū))知識產權局之間JSON 資源的重復使用以及向公眾提供的數(shù)據(jù),提高數(shù)據(jù)交換效率。
(1)JSON 標準的制定歷程。2019 年7 月,在WIPO 標準委員會第七屆會議上,標準委員會注意到提交供其審議的JSON 規(guī)范工作草案,并認識到使用JSON 格式進行數(shù)據(jù)傳播的國家(地區(qū))知識產權局日益增多,認為需要構建新標準來支持各國家(地區(qū))知識產權局使用這種格式通信,因此創(chuàng)建了第64 號任務——編制提案,建議使用與產權組織標準ST.96相兼容的JSON 資源,以用于提交、處理、公布和/或交換知識產權信息,并將該項任務分配給XML4IP工作隊。
2019—2022 年間,XML4IP 工作隊致力于制定將ST.96 XML 架構變換成等效的JSON 架構的成套變換規(guī)則,并不斷地討論和改進變換規(guī)則及架構,先后發(fā)布了十余個JSON 標準草案。2022 年10 月,XML4IP 工作隊向WIPO 標準委員會第十屆會議提交了JSON 新標準的最終草案。該草案是在WIPO ST.96 V5.0 的基礎上編制的,其內容包括一系列設計規(guī)則以及一套基于WIPO 標準ST.96 XML Schemas 的JSON Schemas 和JSON 實例的樣例[16]。該草案旨在為創(chuàng)建或修改知識產權數(shù)據(jù)作為 JSON 資源的各國家(地區(qū))知識產權局和其他組織提供指導,并明確指出各國家(地區(qū))知識產權局將 JSON 用作應用程序編程接口(API)的負載交換數(shù)據(jù)時,必須遵守該標準。
(2)JSON 標準的發(fā)展趨勢。在編制JSON 標準草案的過程中,XML4IP 工作隊發(fā)現(xiàn)并解決了許多問題,然而JSON Schema 規(guī)范的演變過程中仍然有一些問題懸而未決。這些問題包括:(1)需要根據(jù)JSON 行業(yè)慣例簡化JSON Schemas 的結構,例如從ST.96 XML Schemas 轉換而來的JSON Schemas 需要刪除不必要的嵌套;(2)需要通過業(yè)務專家分析來改進數(shù)據(jù)設計,從而進一步實現(xiàn)更精確的數(shù)據(jù)驗證,同時根據(jù)ST.96 V6.0 對JSON Schemas 進行更新;(3)需要為XML 和JSON 之間的實例添加轉換規(guī)則和相關工具等??梢?,JSON 標準將隨著WIPO ST.96 標準的修訂和JSON Schema 規(guī)范的演變而持續(xù)進行修訂和更新。為此,WIPO 標準委員會制定了快速通道程序,供XML4IP 工作隊審議和/或通過該標準的修訂文本。因此,在JSON 標準的最終草案中,XML4IP 工作隊也建議建立另一個快速通道程序,以考慮和/或采用新JSON 標準的修訂。
與XML 相比,JSON 是一種輕量級的數(shù)據(jù)交換格式,資源消耗更少,數(shù)據(jù)交換和傳輸效率更高。近年來,隨著使用JSON 格式傳播數(shù)據(jù)的國家(地區(qū))知識產權局的數(shù)量日益增多,XML4IP 工作隊以ST.96 標準為基礎編制了新的JSON 標準,包括從ST.96 的XML 架構向JSON 架構的轉換規(guī)則,因此,未來的知識產權數(shù)據(jù)標準將能夠兼容JSON 和XML架構。
中國知識產權數(shù)據(jù)標準建設始于21 世紀初,目前最為完善、使用最為廣泛的是2012 年發(fā)布的《中國專利數(shù)據(jù)元素標準》(ZC 0012—2012)和《專利文獻數(shù)據(jù)規(guī)范》(ZC 0014—2012)。上述標準主要是以WIPO 的ST.36 數(shù)據(jù)標準為基礎制定的,同時兼具中國特色的專利數(shù)據(jù)規(guī)范,對專利文獻數(shù)據(jù)元素、文件名和外部實體進行了規(guī)范,在當時具有一定的前瞻性[17]。近年來,為了促進知識產權基礎信息的數(shù)據(jù)規(guī)范化和標準化,提高知識產權基礎信息的采集加工、共享交換和運用管理水平,中國國家知識產權局于2019 年12 月印發(fā)《知識產權基礎信息數(shù)據(jù)規(guī)范(試行)》,后于2020 年更新發(fā)布《知識產權基礎信息數(shù)據(jù)規(guī)范(試行2020 版)》(以下簡稱《2020 版數(shù)據(jù)規(guī)范》)?!?020 版數(shù)據(jù)規(guī)范》首次將商標、地理標志、集成電路布圖設計、知識產權主體和知識產權綜合應用等知識產權基礎信息納入中國知識產權數(shù)據(jù)標準體系,規(guī)定了知識產權基礎信息的數(shù)據(jù)元素規(guī)范、知識產權基礎信息的文件名規(guī)范、知識產權基礎信息的外部實體規(guī)范及應用與維護。然而,《2020 版數(shù)據(jù)規(guī)范》的基礎元素和專利業(yè)務元素沿用《專利文獻數(shù)據(jù)規(guī)范》,未抽取商標、地理標志、集成電路布圖設計等各類型知識產權公用元素,也未對公用元素進行統(tǒng)一和規(guī)范[18]。
鑒于JSON 標準是基于ST.96 標準制定的,并隨著ST.96 的修訂和JSON Schema 規(guī)范的演變而持續(xù)進行修訂和更新,因此,中外知識產權數(shù)據(jù)標準的比較主要以WIPO 的ST.96 標準(V6.0)和《2020版數(shù)據(jù)規(guī)范》為基準展開。
首先,兩者都采用了XML Schema 的設計模式,但WIPO 的ST.96 標準的適用范圍更為廣泛,除了專利、商標、地理標志等,還適用于版權;而《2020版數(shù)據(jù)規(guī)范》沒有涵蓋版權。其次,就通用組件而言(見表2),WIPO 的ST.96 標準所涉及的元素類別和元素總量均比《2020 版數(shù)據(jù)規(guī)范》更豐富,除了時間、地址、名稱、表格、圖像、文檔、列表、化學、數(shù)學、引用、簽名等基本信息外,還包括了申請、分類、許可、支付等信息。再次,就專利組件而言,ST.96 標準涉及的元素類別較《2020 版數(shù)據(jù)規(guī)范》更豐富,但元素總量較少,原因可能是《2020版數(shù)據(jù)規(guī)范》未充分抽取專利與其他類型知識產權的公用元素并將它們納入相應的通用組件。具體而言,ST.96 標準涵蓋了著錄項目、文摘、權利要求、說明書及附圖、法律狀態(tài)、檢索報告、許可、專利族、生物序列、專利審查、專利申請表、專利交易等信息;《2020 版數(shù)據(jù)規(guī)范》主要涉及著錄項目、摘要、權利要求、說明書及附圖、法律狀態(tài)、檢索報告、被許可人、專利族、生物序列、專利審查等信息,而專利申請表、專利交易等信息有所欠缺。
表2 不同知識產權數(shù)據(jù)標準涉及元素的比較
此外,ST.96 標準建立了較為完善的標準修訂與更新機制,設立專門的工作隊負責修訂與更新,每年最多發(fā)布兩個版本。并且,隨著使用JSON 格式進行數(shù)據(jù)傳播的國家(地區(qū))知識產權局的數(shù)量越來越多,XML4IP 工作隊還承擔了以ST.96 標準為基礎編制新的JSON 標準的新任務,并建議建立快速通道程序以便于考慮標準的后續(xù)修訂??梢?,WIPO 對于相關標準的修訂與更新十分重視,會根據(jù)技術發(fā)展情況以及實際應用需求對標準進行及時修訂與更新;而中國雖然制定了基于XML 的中國專利文獻數(shù)據(jù)格式標準,但是自這一標準頒布和實施以來,較長一段時期內尚未進行必要的更新和完善。
長期以來,中國知識產權體制機制的形成主要依附于科技管理和市場監(jiān)督等,缺乏整體性、自主性和主體意識[19],知識產權信息存在多部門管理的問題,各單位之間的信息加工標準和數(shù)據(jù)標注粒度也不統(tǒng)一,缺少國家層面的、統(tǒng)一的知識產權信息處理標準,不便于數(shù)據(jù)獲取與綜合利用,制約著知識產權強國建設的速度。基于相關文獻梳理和調研發(fā)現(xiàn),中國知識產權數(shù)據(jù)標準體系建設主要存在四方面問題。
中國在數(shù)據(jù)產業(yè)發(fā)展方面尚未建立統(tǒng)一的數(shù)據(jù)標準,對數(shù)據(jù)的流動性和可獲取性構成較大的障礙,使數(shù)據(jù)對經濟發(fā)展的創(chuàng)新效應和乘數(shù)效應大打折扣[20]。近年來,中國國家知識產權局積極運用數(shù)字技術助力專利審查和檢索的提質增效,并著手建設智能化專利審查和檢索系統(tǒng),但通用數(shù)據(jù)作為智能化專利審查和檢索系統(tǒng)的基礎性公共信息資源,目前暫缺完善而規(guī)范的標準構建[21]。其中,數(shù)據(jù)標準頂層設計的不完善主要體現(xiàn)在知識產權數(shù)據(jù)標準設計范圍的不全面。首先,中國當前的知識產權數(shù)據(jù)標準尚未涉及版權,對于專利、商標、地理標志、集成電路布圖設計的公用元素也未進行充分抽取、統(tǒng)一和規(guī)范,造成跨數(shù)據(jù)庫調用業(yè)務元素的障礙,限制了大數(shù)據(jù)等技術處理數(shù)據(jù)的優(yōu)勢,并進一步制約了創(chuàng)新主體對知識產權數(shù)據(jù)的利用效率。其次,中國知識產權數(shù)據(jù)標準只有基于XML 架構設計的知識產權基礎信息數(shù)據(jù)規(guī)范,尚無資源消耗更少、數(shù)據(jù)交換和傳輸效率更高的基于JSON 架構的數(shù)據(jù)標準設計。在WIPO 已經明確指出各國家(地區(qū))知識產權局將 JSON 用作應用程序編程接口(API)的負載彼此交換數(shù)據(jù)時必須遵守JSON 標準草案的背景下,中國理應將使用與知識產權XML 標準相兼容的JSON 標準提上議程。
知識產權數(shù)據(jù)標準中所涉及的數(shù)據(jù)元素需要囊括各類知識產權生命周期中的所有數(shù)據(jù),但中國現(xiàn)有相關標準中的數(shù)據(jù)元素不夠豐富,給數(shù)據(jù)檢索、加工與利用帶來諸多不便。主要表現(xiàn)在:(1)通用元素的定義不全面。中國知識產權數(shù)據(jù)標準對各類知識產權數(shù)據(jù)中的分類、許可、支付機構、身份等相關的通用數(shù)據(jù)元素定義不全面,不利于知識產權數(shù)據(jù)的標準化管理和共享,進而影響知識產權數(shù)據(jù)價值的發(fā)揮。(2)業(yè)務元素覆蓋度有限。以專利業(yè)務元素為例,ST.96 標準不僅包含著錄項目、文摘等元素的相關組件,還開發(fā)了專利申請表、專利交易等組件,專利記錄和專利業(yè)務相關組件的開發(fā)也已經相當成熟,有望納入ST.96標準的下一個版本之中;而《2020 版數(shù)據(jù)規(guī)范》對于專利申請表、專利記錄、專利交易等相關的數(shù)據(jù)元素還有所欠缺。
標準制定過程中難免存在不完善之處,而且隨著科學技術的進步、實際應用需求的變化,也有必要對標準進行及時的訂與更新,因此,對大多數(shù)類型的標準來說,版本控制是一個需求[22]134。WIPO的ST.96 標準由專門的工作隊負責修訂與更新,且每年的4 月和/或10 月為固定的新版本發(fā)布時間。自其首次發(fā)布以來,ST.96 標準現(xiàn)已經更新到了第10 個版本,每個版本對發(fā)現(xiàn)的錯誤或缺陷給予及時糾正,或者根據(jù)新的需求對標準進行擴展與更新[9]。而中國在2012 年制定了在當時較為完善的、以XML為基礎的中國專利文獻數(shù)據(jù)格式標準[23],但是自其頒布和實施以來,較長一段時期內沒有進行必要的更新和完善。
中國知識產權數(shù)據(jù)標準主要聚焦于專利領域,商標、地理標志相關的數(shù)據(jù)標準剛剛起步,版權數(shù)據(jù)標準尚有缺位。而且,中國將本國知識產權數(shù)據(jù)標準化的成功經驗向世界知識產權組織推廣的力度不足,在世界知識產權組織數(shù)據(jù)標準的制定和修訂的歷屆會議中,中國也較少主動提交相關提案,未發(fā)揮與中國國際地位相匹配的影響力。此外,從世界各國制定知識產權數(shù)據(jù)標準的發(fā)展趨勢來看,加強國家之間的數(shù)據(jù)交流與國際合作、實現(xiàn)知識產權數(shù)據(jù)的全球共享成為發(fā)展的必然趨勢。因此,中國需要順應發(fā)展趨勢,持續(xù)完善知識產權數(shù)據(jù)標準體系,并主動對標國際標準,積極參與有關國際標準的制修訂,持續(xù)提升中國在知識產權數(shù)據(jù)標準領域的影響力。
滿足用戶對數(shù)據(jù)質量的期望是知識產權管理部門義不容辭的責任[24]。伴隨著中國創(chuàng)新驅動發(fā)展戰(zhàn)略的實施和知識產權強國建設的穩(wěn)步推進,充分借鑒國際先進經驗,以現(xiàn)有的數(shù)據(jù)標準為基礎,在實踐過程中持續(xù)提升中國的知識產權數(shù)據(jù)標準建設水平已經成為普遍共識。具體而言,未來可以著重在4 個層面作出努力。
為了促進知識產權數(shù)據(jù)的高效利用,實現(xiàn)數(shù)據(jù)加工與分析的便利化,提升國際交往能力,首先需要加強基礎數(shù)據(jù)標準的頂層設計。一是要認真分析國際基礎數(shù)據(jù)標準的發(fā)展趨勢,超前布局中國數(shù)據(jù)標準體系,并為未來發(fā)展留下余地。二是深度整合現(xiàn)有的各類型知識產權基礎數(shù)據(jù),構建既能夠滿足國際交往、開放共享的需要,又能夠貫通融合、集中統(tǒng)一的知識產權數(shù)據(jù)標準體系。三是實現(xiàn)知識產權數(shù)據(jù)與科技文獻、技術標準、商業(yè)信息、法律文書等數(shù)據(jù)的深度整合,實現(xiàn)相關數(shù)據(jù)的標準化與規(guī)范化,促進知識產權信息利用便捷、智能和高效。此外,還需要繼續(xù)搭建標準化、可兼容、可擴展的知識產權數(shù)據(jù)共享平臺,實現(xiàn)各類型知識產權數(shù)據(jù)的有效關聯(lián)、互通共享與深度融合,并滿足國際交往、國家發(fā)展以及各類群體對知識產權數(shù)據(jù)的多樣化需求,提升知識產權數(shù)據(jù)服務經濟社會發(fā)展與科技創(chuàng)新的能力[25]。
國內知識產權基礎信息數(shù)據(jù)標準涉及的字段較少,例如審查信息只有申請?zhí)?、申請人,不便于?shù)據(jù)庫之間建立數(shù)據(jù)聯(lián)系,限制了數(shù)據(jù)的加工與利用潛力。以專利檢索系統(tǒng)為例,中國專利檢索與分析系統(tǒng)設置了涵蓋申請、公開、發(fā)明人、申請人、發(fā)明名稱、摘要、說明書、分類、代理人相關的36 個檢索字段[26]。相比較而言,美國專利檢索系統(tǒng)的可檢索字段多達390 個,除了申請、公開、發(fā)明、代理、分類等基本信息外,還涵蓋了優(yōu)先權、專利族、引文、相關專利、生物序列表、審查員等信息有關的字段[27],能夠檢索到更加豐富的知識產權信息。從WIPO 關于ST.96 標準的制定情況來看,也是希望將知識產權申請相關數(shù)據(jù)和轉移轉化信息納入數(shù)據(jù)標準當中,但目前中國的這些信息仍然存在過于分散的現(xiàn)狀,急需補充這一領域的短板。針對通用元素不全面、業(yè)務元素覆蓋度有限等問題,建議借鑒ST.96 標準的設計理念,抽取各類型知識產權的公用元素作為通用元素,提高各類數(shù)據(jù)元素復用和調用的便捷性;同時,拓展專利數(shù)據(jù)的可檢索項,增加專利申請表、專利記錄、專利交易等有關的數(shù)據(jù)元素。此外,要充分考慮未來技術發(fā)展和創(chuàng)新主體的數(shù)據(jù)需求,從便于數(shù)據(jù)互操作和可獲取的視角,擴展數(shù)據(jù)元素。
標準制定過程中也難免存在不完善之處,隨著科學技術的發(fā)展與進步,知識產權信息加工和處理能力將發(fā)生改變,促使知識產權的數(shù)據(jù)來源、利用與呈現(xiàn)方式更加多樣化,標準的應用場景和應用需求也會發(fā)生變化,因此,對大多數(shù)類型的標準而言,建立修訂及更新機制是必需的。為了進一步解決信息資源共享不充分問題,調和知識產權信息供需之間的矛盾,提高知識產權數(shù)據(jù)的運用水平和促進知識產權事業(yè)發(fā)展,中國應借鑒WIPO 的相關標準的制定與修訂機制,建立更為有效的標準修訂與更新機制,根據(jù)技術發(fā)展情況以及實際應用需求,及時、持續(xù)優(yōu)化和完善知識產權數(shù)據(jù)標準。
如果掌握了國際標準制定的話語權,就能夠在國際競爭中獲取更大的優(yōu)勢,但當前中國知識產權數(shù)據(jù)標準在國際上的影響力明顯不足,需要持續(xù)重視知識產權數(shù)據(jù)標準,并不斷提高標準研究能力。首先需要增強與國際組織及其他國家(地區(qū))知識產權局之間的交流與合作,主動參與國際標準的制定與修訂,發(fā)揮與國際地位相匹配的作用。其次是要在充分借鑒國際經驗的基礎上,盡快結合中國實際,提升自身的數(shù)據(jù)標準制定能力,完善數(shù)據(jù)收集與加工機制。再次,充分發(fā)揮中國在大數(shù)據(jù)分析等領域的技術優(yōu)勢,超前謀劃布局信息處理前沿技術,獲得在國際競爭中的戰(zhàn)略優(yōu)勢。最后,提升公眾對數(shù)據(jù)標準的認知與應用能力,通過定期舉辦專題培訓和經驗交流會等多種形式,靈活運用多種媒介,加強對數(shù)據(jù)標準相關信息的宣傳和普及,幫助政府管理者、企業(yè)負責人、科研人員熟練掌握國際規(guī)則的新變化和新趨勢[28]。
知識產權數(shù)據(jù)標準體系是知識產權數(shù)據(jù)處理的基礎。中國的知識產權數(shù)據(jù)由于長期分散于多個部門進行管理,導致數(shù)據(jù)之間缺乏必要的聯(lián)系,阻礙了數(shù)據(jù)共享與互聯(lián)互通。為促進知識產權基礎信息的采集加工、共享交換和運用管理水平,中國自2019 年開始持續(xù)提升知識產權基礎數(shù)據(jù)標準,但目前仍存在數(shù)據(jù)標準的頂層設計有待完善、元素豐富性有待擴展、標準修訂與更新機制不夠健全、國際影響力有待提升等諸多問題。為進一步提升中國知識產權數(shù)據(jù)標準建設水平,亟須加強基礎數(shù)據(jù)標準頂層設計、擴展數(shù)據(jù)標準的元素、持續(xù)更新數(shù)據(jù)標準、并不斷爭取中國標準的國際話語權。
數(shù)據(jù)標準是解決數(shù)據(jù)共享障礙最直接的方法[22]305。隨著數(shù)字技術的應用與發(fā)展,數(shù)據(jù)加工與處理能力迅速提升,知識產權數(shù)據(jù)標準的重要性更加凸顯。為促進知識產權的國際交往,滿足國家、社會和創(chuàng)新主體對知識產權數(shù)據(jù)的多樣化需求,以適應大數(shù)據(jù)分析技術需求和提升基礎數(shù)據(jù)加工應用能力為目標,構建統(tǒng)一、高效的知識產權數(shù)據(jù)標準體系是促進國際交往,滿足國家、社會和創(chuàng)新主體對知識產權數(shù)據(jù)的樣化需求的客觀需要,也是提升知識產權數(shù)據(jù)處理和治理能力的基礎。建設知識產權強國,持續(xù)提升整個國家的科技創(chuàng)新能力,需要便捷高效的知識產權數(shù)據(jù)標準體系作為基礎。知識產權數(shù)據(jù)標準體系建設水平的提升,既涉及眾多部門的高效協(xié)同,又涉及不同數(shù)據(jù)之間的標準統(tǒng)一與高效管理,是一個宏大的系統(tǒng)工程。以知識產權強國建設為契機,持續(xù)提升知識產權數(shù)據(jù)標準的制定能力,進而完善數(shù)據(jù)管理水平與應用能力,發(fā)揮知識產權信息服務于科技創(chuàng)新和新興產業(yè)發(fā)展的優(yōu)勢,具有重要的現(xiàn)實意義。