中國(guó)科學(xué)技術(shù)信息研究所在“發(fā)明人名稱消歧競(jìng)賽”中取得優(yōu)異成績(jī)
【本刊訊】 2015年9月24日,美國(guó)專利與商標(biāo)局(USPTO)首席經(jīng)濟(jì)學(xué)家辦公室在美國(guó)弗吉利亞州USPTO總部舉辦了旨在提高現(xiàn)有專利發(fā)明人名稱數(shù)據(jù)精度的“PatentsView專利發(fā)明人名稱消歧技術(shù)研討會(huì)”。會(huì)議期間,舉行了“專利發(fā)明人名稱消歧競(jìng)賽”。此次競(jìng)賽的目的是通過(guò)設(shè)計(jì)專利發(fā)明人名稱消歧算法,對(duì)USPTO收錄的近40年(1976—2014年)的美國(guó)專利發(fā)明人數(shù)據(jù)(約1239萬(wàn)條記錄)進(jìn)行唯一標(biāo)識(shí),以改進(jìn)現(xiàn)有的專利發(fā)明人標(biāo)識(shí)算法。中國(guó)科學(xué)技術(shù)信息研究所派出代表隊(duì)參加了這次競(jìng)賽,并憑著在預(yù)賽和復(fù)賽階段的突出表現(xiàn),取得了第二名的優(yōu)異成績(jī)。
參加本次“專利發(fā)明人名稱消歧競(jìng)賽”的代表隊(duì)分別來(lái)自美國(guó)、比利時(shí)、澳大利亞、德國(guó)、中國(guó)等國(guó)家的高等學(xué)校和科研機(jī)構(gòu)。他們是賓夕法尼亞州立大學(xué)(美國(guó))、馬薩諸塞大學(xué)(美國(guó))、加州大學(xué)圣巴巴拉分校(美國(guó))、魯汶大學(xué)(比利時(shí))、斯文本科技大學(xué)(澳大利亞)、歐洲經(jīng)濟(jì)研究中心(德國(guó))、中國(guó)科學(xué)技術(shù)信息研究所(中國(guó))等。在競(jìng)賽中,中國(guó)科學(xué)技術(shù)信息研究所代表隊(duì)提出了一套全新的發(fā)明人消歧混合算法(Mixed Method)。該算法融合了機(jī)器學(xué)習(xí)方法、概率記錄鏈接方法、規(guī)則分類方法以及圖聚類方法。其核心思想是:通過(guò)機(jī)器學(xué)習(xí)以及概率鏈接方法首先劃定整個(gè)發(fā)明人名稱匹配對(duì)的核心區(qū)域,然而通過(guò)加入分類規(guī)則逐步擴(kuò)張發(fā)明人名稱匹配對(duì)的外部邊界,從而在保證計(jì)算結(jié)果的高準(zhǔn)確性同時(shí),兼顧了整體算法的穩(wěn)健性。該算法在AWS平臺(tái)C3.8xlarge實(shí)例上的運(yùn)行時(shí)間為7小時(shí)。經(jīng)過(guò)3輪共計(jì)20萬(wàn)數(shù)據(jù)集的測(cè)試,該算法的平均精準(zhǔn)率(Precision)達(dá)到99.52%,平均召回率(Recall)為88.96%左右,平均F1值為93.94%。中國(guó)科學(xué)技術(shù)信息研究所代表隊(duì)算法的最終測(cè)評(píng)結(jié)果也優(yōu)于PatentsView平臺(tái)目前正在運(yùn)行的算法。
PatentsView(http://www.patentsview.org/web/)是由USPTO首席經(jīng)濟(jì)學(xué)家辦公室主持開發(fā)的一個(gè)面向未來(lái)的專利檢索與分析平臺(tái)。該平臺(tái)是以提高美國(guó)專利數(shù)據(jù)價(jià)值功能及實(shí)用功能為目的的可視化分析平臺(tái),是USPTO為實(shí)現(xiàn)其數(shù)據(jù)透明化,便利創(chuàng)新者、知識(shí)產(chǎn)權(quán)從業(yè)者、企業(yè)及個(gè)人利用專利數(shù)據(jù)而開發(fā)的搜索工具。專利發(fā)明人消歧問(wèn)題是目前學(xué)術(shù)界關(guān)注的熱點(diǎn)問(wèn)題,通過(guò)對(duì)發(fā)明人名稱進(jìn)行消岐能夠提升現(xiàn)有科研績(jī)效評(píng)價(jià)、社會(huì)網(wǎng)絡(luò)分析的準(zhǔn)確度,也可以為國(guó)際人才流動(dòng)、知識(shí)溢出等問(wèn)題提供更為準(zhǔn)確的數(shù)據(jù)支持。中國(guó)科學(xué)技術(shù)信息研究所代表團(tuán)隊(duì)取得的研究成果將為相關(guān)方面的研究工作提供更為精確的數(shù)據(jù)支持。
USPTO全程直播“PatentsView發(fā)明人名稱消歧技術(shù)研討會(huì)”。研討會(huì)的視頻已上傳網(wǎng)站,敬請(qǐng)收看。視頻地址為:http://www.uspto.gov/about-us/organizationaloffices/office-policy-and-international-affairs/patentsview-inventor。(楊冠燦)