謝湘寧
專利挖掘工作是企業(yè)進行專利布局及實施專利管理工作的基礎,因此,專利挖掘中有效的挖掘方法,是助力企業(yè)專利挖掘工作的一個利器。專利挖掘工作中,如何確定待挖掘的數據源,即從何種對象入手實施專利挖掘,是達成專利挖掘的項目目標的一個關鍵。通常情況下,企業(yè)會考慮主要基于如下幾類數據源來規(guī)劃挖掘工作:
1.基于企業(yè)產品來挖掘某一技術領域的專利;
2.基于某一類技術現有的專利來挖掘外圍專利;
3.基于單一競爭對手的專利來有針對性的實施專利挖掘;
4.針對一類產品挖掘其在某一技術領域的標準專利。
此處需要注意的是,企業(yè)在上述挖掘工作中,都同時面臨如何管理好待挖掘的數據源的問題。那么,是否可以找到一種可靠的數據管理模型,來提供高效的數據管理方式?
在此,我們先引入一個在計算機的數據挖掘領域廣泛使用的概念“數據存儲庫”(例如數據倉庫)。數據挖掘可以應用于任何類型的數據存儲庫,一般情況下,數據存儲庫可以包括如下幾種類型:數據倉庫、關系數據庫、事物數據庫、萬維網、一般文件和數據流等。本文將重點關注數據倉庫。所謂數據倉庫,是一種具有收集并組織多維度數據功能的信息存儲庫,正是基于這種特性,本文考慮將其作為著重討論的一種應用于專利挖掘工作的數據管理模型。
下面就針對基于企業(yè)產品來挖掘某一技術領域的專利挖掘工作,以依靠自主研發(fā)技術而聞名的A企業(yè)為例,討論一下在專利挖掘過中如何應用數據倉庫這種數據管理模型,使得專利挖掘工作更簡單、挖掘結果更準確。
假設A企業(yè)是一個成功的跨國公司,我們當前的任務是挖掘該公司每種產品在人工智能領域的專利,A公司產品部門分布全球,涉及的產品線多達幾十個,且每個產品線在人工智能領域都有完善的自主開發(fā)的技術集。目前,該企業(yè)計劃布局每個產品在人工智能領域的專利。
分析可知,A公司產品線多,從數據管理的角度來看,每個產品在人工智能領域開發(fā)的技術方案相對分散,散布在多個開發(fā)部門的開發(fā)組中實現,因此,在專利挖掘過程中,A公司應考慮如何高效、無遺漏地挖掘并管理來自不同開發(fā)組開發(fā)的專利方案。圖1展示了一種數據倉庫構造和使用的典型系統(tǒng)框架,經過研究,可以考慮將圖1所示的數據倉庫的結構模型應用在該專利挖掘項目中,以高效、高質地完成專利挖掘目標。
數據倉庫的核心是多維數據庫結構建模,該模型實現了一種典型的物理結構,即多維數據立方體(multidimensional data cube)。數據立方體可以提供數據的多維視圖,每個維對應于模式中的一個或一組屬性,好處是可以快速查詢到匯總數據。
針對A公司的專利挖掘項目,在待挖掘的數據源是各個產品中人工智能領域的技術內容的情況下,我們可以利用上述多維數據立方體構建一種可靠的數據管理模型。如圖2所示,在此項目中,多維數據立方體中的三個維度可以定義為:產品(電視、音響、電飯煲、冰箱等)、人工智能技術(圖像識別、語義分析、信息檢索、深度學習)和產品的應用場景(物聯(lián)網、智能家居、導航、客服等),即本次項目的挖掘工作可以采用上述模型所限定的三個維度元素進行組合遍歷,該多維數據立方體中的每個單元存儲挖掘到的專利的技術方案。如圖2所示,在物聯(lián)網場景下,同圖像識別相關的家用電視的專利技術方案內容為S4,存放在單元<電視,圖像識別、物聯(lián)網>中,而其他立方體單元中可以存放遍歷其他幾個維度組合上挖掘到的技術方案。
下面就基于上述數據管理模型,簡述A公司產品在人工智能領域的專利挖掘過程和挖掘結果。
1.1 產品維度
分析A公司的產品系列,可以綜合考慮產品的重要度、成熟度等幾個方向綜合確定產品的專利挖掘方向和重點。
在產品重要度的分類中,可以考慮將產品按照重點產品和非重點產品劃分,分別估算重點產品和非重點產品能產出的專利量。需要說明的是重點產品具有如下一個或多個屬性:市場占有率和增長率高、技術含量高、銷售利潤高等。
在產品成熟度的分類中,可以考慮將產品按照市場應用和技術實現的成熟性進行劃分,重點估算成熟度高的產品的專利量。需要說明的是高成熟度的產品包括如下一個或多個屬性:涉及前沿的實現完善的成熟技術、用戶反饋良好的方向等。
另外,關于新產品,需要根據具體情況部署關鍵技術的專利。
1.2 人工智能技術維度
針對人工智能技術所涉及的如圖3所示的多個分支技術,結合已經確定的產品挖掘方向,實現在深度、廣度兩個維度上分別進行縱向布局和橫向布局。
人工智能技術的分支技術的分類如下圖3所示:
縱向布局的挖掘結構,主要是實現基于每一類分支技術開展縱向布局,可以圍繞某一類或某一個分支技術在延續(xù)、縱向這個維度上進行的改進和迭代,形成縱向布局結構。
上述采用延續(xù)、縱向的布局方式,主要基于技術不斷更新發(fā)展的特性來確定。技術的不斷發(fā)展,必然產生迭代的技術改進點,因此,縱向布局結構主要跟隨技術的更迭而產生。
橫向布局的挖掘結構,主要是實現基于不同類型技術的關聯(lián)因素開展的橫向布局,可以圍繞不同技術之間的關聯(lián)關系,形成橫向布局結構。
采用不同技術之間的關系支持的布局方式,主要是因為各類技術都處于相關技術群中,任何一項技術都不是孤立地發(fā)展。隨著相關技術群以及技術群與技術群之間的關聯(lián)日益密切,關聯(lián)技術之間的創(chuàng)新點必然不斷產生,因此,橫向結構布局主要是基于相關技術之間的關系因素為支撐點。
1.3 應用場景維度
基于本文所討論的專利挖掘方法,將最后一個挖掘維度——應用場景與上述兩個維度的挖掘方向進行結合,最終實現多維數據立方體在專利挖掘項目中的有效應用。
基于本文討論的多類產品和人工智能技術,當前涉及到的應用場景的類型大致如下圖4所示:
對于圖4中羅列的應用場景,可以結合1.2中完成的技術布局結構,實現在網狀結構上進行網狀式布局。
技術總是從已知領域滲透至未知領域,并且隨著產品種類的增長,技術及技術之間更迭也是迭代發(fā)展,這也使得技術在不同領域應用時會產生意想不到的新用途,從而可以蔓延出覆蓋型的網狀布局結構。這種網狀布局結構,可以理解為產品的實現技術應用在各個應用場景下所形成的枝蔓結構。
由此可知,基于1.1、1.2和1.3,我們可以完成A公司產品中關于人工智能專利的自主布局和挖掘工作;進一步的,在產品后續(xù)的更新迭代過程中,A公司仍舊可以采用上述挖掘方式,作為繼續(xù)專利進行申請。
此處需要說明的是,在A企業(yè)部署外圍專利、規(guī)避性專利和標準專利的過程中,同樣可以考慮使用本文涉及到的數據管理模型,來開展和規(guī)劃專利挖掘工作。
總結
專利挖掘的過程是一個反復循環(huán)的過程,每一個挖掘步驟如果沒有達到預期目標,都可以回到前面的步驟,重新調整并執(zhí)行專利挖掘。本文提供的關于數據倉庫的數據管理模型,為整個挖掘過程提供了一個可回溯的技術支持,即這種數據管理模型易查詢、易追溯、易替換的優(yōu)點能夠在專利挖掘的過程中,幫助企業(yè)回溯、調整之前的挖掘步驟,真正做到為企業(yè)的專利挖掘項目提供有效、高效的工具。endprint