李 程(國家知識產(chǎn)權(quán)局知識產(chǎn)權(quán)出版社,北京 100081)
?
構(gòu)建以專利為核心的科技大數(shù)據(jù)平臺以促進創(chuàng)新的設(shè)想
李 程
(國家知識產(chǎn)權(quán)局知識產(chǎn)權(quán)出版社,北京 100081)
摘 要:隨著我國知識產(chǎn)權(quán)行業(yè)的發(fā)展,專利申請量不斷創(chuàng)出新高。2015年中國發(fā)明專利申請量突破100萬件,同比增長18.7%,連續(xù)5年位居世界首位。我國已經(jīng)積累了海量的專利數(shù)據(jù),同時也積累了大量的非專利數(shù)據(jù)、應(yīng)用數(shù)據(jù)、檢索數(shù)據(jù)等,并且建立了相應(yīng)的檢索系統(tǒng)和分析系統(tǒng)。本文分析了以專利為核心的科技文獻(xiàn)大數(shù)據(jù)的現(xiàn)狀,提出了基于大數(shù)據(jù)關(guān)聯(lián)與整合思路和基于專利信息服務(wù)產(chǎn)業(yè)鏈整合思路的兩個創(chuàng)新應(yīng)用觀點,并從“五個一”的建設(shè)內(nèi)容、六大關(guān)鍵技術(shù)等方面闡述了以專利為核心的科技文獻(xiàn)大數(shù)據(jù)信息服務(wù)平臺的構(gòu)建設(shè)想,最后從產(chǎn)業(yè)整合、信息服務(wù)、成果轉(zhuǎn)化、價值評估、數(shù)據(jù)挖掘等5個方面強調(diào)了大數(shù)據(jù)服務(wù)平臺對促進創(chuàng)新的作用。
關(guān)鍵詞:專利;大數(shù)據(jù);科技文獻(xiàn);信息服務(wù);創(chuàng)新
作為具有國家知識產(chǎn)權(quán)局背景的專利信息服務(wù)行業(yè)領(lǐng)導(dǎo)者之一,知識產(chǎn)權(quán)出版社多年來積累了大量的國內(nèi)外專利文獻(xiàn)數(shù)據(jù)和非專利科技文獻(xiàn)數(shù)據(jù)。2014年~2016年,我們的數(shù)據(jù)收集范圍從專利擴大到商標(biāo)、標(biāo)準(zhǔn)、科技期刊、知識產(chǎn)權(quán)和創(chuàng)新類圖書等,專利信息也從單純的文摘和全文擴展到法律狀態(tài)、審查文件、流程信息、運營信息、復(fù)審和無效決定、知識產(chǎn)權(quán)司法判例等,數(shù)據(jù)量從1億擴大到近5億,數(shù)據(jù)量達(dá)500TB。如此巨大的數(shù)據(jù)量必須得到有效應(yīng)用才能產(chǎn)生巨大的價值,推進我國技術(shù)創(chuàng)新和科技發(fā)展?,F(xiàn)在有很多專利信息服務(wù)商能夠提供傳統(tǒng)的專利檢索和分析服務(wù),但是都僅限于專利,而且數(shù)據(jù)質(zhì)量參差不齊,不夠全面、準(zhǔn)確和權(quán)威,服務(wù)價格相對較高。如果能以知識產(chǎn)權(quán)出版社的大數(shù)據(jù)為基礎(chǔ),進行整合加工處理,并進行大數(shù)據(jù)關(guān)聯(lián),構(gòu)建一個以專利為核心的科技大數(shù)據(jù)信息服務(wù)平臺,向終端用戶提供質(zhì)優(yōu)、價低、權(quán)威的“一站式”信息服務(wù),以及在此基礎(chǔ)上的專利大數(shù)據(jù)管理、運營、交易等擴展服務(wù),則可以更好地促進我國的知識產(chǎn)權(quán)和科技創(chuàng)新工作。
(一)現(xiàn)狀分析
以專利為核心的相關(guān)科技文獻(xiàn)數(shù)據(jù)有較大規(guī)模。根據(jù)我們當(dāng)前所積累的與專利相關(guān)的科技文獻(xiàn)數(shù)據(jù),總體分為專利文獻(xiàn)數(shù)據(jù)、非專利科技文獻(xiàn)數(shù)據(jù)(二者合稱為核心資源數(shù)據(jù))、檢索數(shù)據(jù)、應(yīng)用數(shù)據(jù)、平臺數(shù)據(jù)和管理數(shù)據(jù)。具體包括:
1. 核心資源數(shù)據(jù)
主要分為專利數(shù)據(jù)(含審查過程數(shù)據(jù))、商標(biāo)數(shù)據(jù)、標(biāo)準(zhǔn)數(shù)據(jù)、法律文書數(shù)據(jù)、期刊數(shù)據(jù)、其他數(shù)據(jù)。主要內(nèi)容如下:
(1)中國專利全文文本數(shù)據(jù);
(2)國外專利全文文本數(shù)據(jù)(包括美國、歐洲、日本、韓國、世界知識產(chǎn)權(quán)組織WIPO、英國、德國、法國、瑞士、奧地利、加拿大、澳大利亞等);
(3)國外專利著錄項目數(shù)據(jù)(共包括100余個國家及地區(qū)、組織);
(4)中外專利法律狀態(tài)數(shù)據(jù);
(5)中外專利引證文獻(xiàn)數(shù)據(jù);
(6)中外專利生物序列數(shù)據(jù);
(7)中外專利化學(xué)結(jié)構(gòu)數(shù)據(jù);
(8)中外期刊元數(shù)據(jù)數(shù)據(jù)庫;
(9)中外標(biāo)準(zhǔn)數(shù)據(jù);
(10)中國知識產(chǎn)權(quán)類法律文書數(shù)據(jù);
(11)知識產(chǎn)權(quán)法律法規(guī)數(shù)據(jù);
(12)中國商標(biāo)數(shù)據(jù);
(13)美國商標(biāo)數(shù)據(jù);
(14)馬德里國際商標(biāo)數(shù)據(jù);
(15)知識庫及詞表數(shù)據(jù)庫;
(16)中外專利說明書及附圖全文圖像數(shù)據(jù)。
2. 檢索數(shù)據(jù)
主要包括為實現(xiàn)檢索而收集整合的原始數(shù)據(jù)和加工數(shù)據(jù),特別是各個檢索字段。
3. 應(yīng)用數(shù)據(jù)
應(yīng)用數(shù)據(jù)包括專利檢索數(shù)據(jù)和非專利檢索數(shù)據(jù)(主要是檢索表達(dá)式和檢索結(jié)果)、專利分析數(shù)據(jù)、項目管理數(shù)據(jù)、大數(shù)據(jù)商城數(shù)據(jù)、客戶服務(wù)數(shù)據(jù)。
4. 平臺數(shù)據(jù)
平臺數(shù)據(jù)包括系統(tǒng)和網(wǎng)站的資源目錄、表單、文本、圖片、視頻和網(wǎng)頁。
5. 管理數(shù)據(jù)
系統(tǒng)管理數(shù)據(jù)包括用戶數(shù)據(jù)、權(quán)限數(shù)據(jù)、日志數(shù)據(jù)、統(tǒng)計發(fā)布數(shù)據(jù)、監(jiān)控數(shù)據(jù)、運維數(shù)據(jù)。
根據(jù)我們當(dāng)前的檢索業(yè)務(wù)運行情況,數(shù)據(jù)檢索日訪問量在10萬左右,數(shù)據(jù)記錄與分析記錄量在10億,在線服務(wù)數(shù)據(jù)量在150TB左右。
(二)基于大數(shù)據(jù)關(guān)聯(lián)與整合思路的創(chuàng)新應(yīng)用分析
根據(jù)與專利相關(guān)的科技文獻(xiàn)大數(shù)據(jù)內(nèi)容分析,專利文獻(xiàn)與非專利文獻(xiàn)表現(xiàn)出很強的相關(guān)性,例如專利與科技文獻(xiàn)間引證關(guān)聯(lián)關(guān)系、檢索內(nèi)容關(guān)聯(lián)關(guān)系、文獻(xiàn)信息相似性關(guān)系等,需要用大數(shù)據(jù)關(guān)聯(lián)的思想對其進行分析、挖掘和整合,將相關(guān)數(shù)據(jù)整合后對外展示和提供服務(wù),產(chǎn)生一系列新的價值。
以專利為核心的科技文獻(xiàn)大數(shù)據(jù)關(guān)聯(lián)與整合的主要過程包括:
1. 對專利和非專利文獻(xiàn)進行收集、整理、存儲。
2. 對數(shù)據(jù)進行清洗、整合、深加工、翻譯、代碼化等處理。處理完成的數(shù)據(jù)經(jīng)過大數(shù)據(jù)分析,采用數(shù)據(jù)挖掘算法、預(yù)測性分析、語義引擎等技術(shù)進行智能關(guān)聯(lián),將文獻(xiàn)引證關(guān)系、技術(shù)關(guān)聯(lián)性、新穎性、創(chuàng)造性、商業(yè)價值等展現(xiàn)出來,同時對部分內(nèi)容進行人工或自動標(biāo)引,提高關(guān)聯(lián)分析的有效性。
3. 在此基礎(chǔ)上形成應(yīng)用服務(wù),例如檢索服務(wù)、分析服務(wù)、預(yù)警服務(wù)、專利價值評估、交易撮合服務(wù)、信息推送服務(wù)等。
其過程如圖1所示。
(三)基于專利信息服務(wù)產(chǎn)業(yè)鏈整合思路的創(chuàng)新應(yīng)用分析
科技文獻(xiàn)大數(shù)據(jù)服務(wù)對知識產(chǎn)權(quán)信息服務(wù)產(chǎn)業(yè)鏈有非常巨大的整合作用,知識產(chǎn)權(quán)信息服務(wù)產(chǎn)業(yè)鏈中包括:直接服務(wù)供應(yīng)商、間接服務(wù)供應(yīng)商、整合服務(wù)集成商、最終客戶等。其構(gòu)成如圖2所示。
我們未來的定位是從直接服務(wù)提供商向整合服務(wù)集成商轉(zhuǎn)變,通過以專利為核心的科技大數(shù)據(jù)信息服務(wù)平臺構(gòu)建,來實現(xiàn)對產(chǎn)業(yè)鏈前后的業(yè)務(wù)進行整合。向后可以聯(lián)合其他間接服務(wù)商利用其能力快速拓展業(yè)務(wù),向前建立服務(wù)運營平臺來為用戶提供更多更好的服務(wù),知識產(chǎn)權(quán)出版社作為平臺服務(wù)者,與供應(yīng)鏈上各個環(huán)節(jié)的用戶共同創(chuàng)造價值。平臺的核心作用是讓各服務(wù)供應(yīng)商基于平臺的海量“大數(shù)據(jù)”靈活、便捷的構(gòu)建自己的“小數(shù)據(jù)”,在此基礎(chǔ)上創(chuàng)造自己的各種服務(wù)產(chǎn)品提供給最終用戶。
由于多年來不斷地數(shù)據(jù)積累和各類應(yīng)用系統(tǒng)的開發(fā),知識產(chǎn)權(quán)出版社已有充足的數(shù)據(jù)資源儲備和檢索技術(shù)儲備來構(gòu)建科技文獻(xiàn)大數(shù)據(jù)信息服務(wù)平臺,提升數(shù)據(jù)服務(wù),整合知識產(chǎn)權(quán)信息服務(wù)產(chǎn)業(yè)鏈。下面從用戶群劃分、大數(shù)據(jù)關(guān)聯(lián)與檢索技術(shù)、數(shù)據(jù)項目管理、大數(shù)據(jù)服務(wù)交易等幾個方面考慮平臺的功能:
平臺本身的用戶群劃分要側(cè)重于服務(wù)公眾,尤其是中小企業(yè)和個人等缺乏創(chuàng)新資金的目標(biāo)群體,同時為平臺管理者提供完善的數(shù)據(jù)和業(yè)務(wù)管理功能。
平臺采用的技術(shù),一方面要自動進行專利數(shù)據(jù)與非專利數(shù)據(jù)的關(guān)聯(lián)分析,另一方面要保證海量數(shù)據(jù)的檢索性能和準(zhǔn)確性,能以最高效的方式展現(xiàn)檢索結(jié)果,直接命中用戶最關(guān)切的部分。
平臺應(yīng)具備大數(shù)據(jù)項目管理功能,用戶能將數(shù)據(jù)自定義劃分成集合,在此基礎(chǔ)上進行個性化加工,形成定制化的數(shù)據(jù)產(chǎn)品和服務(wù)。
為了提高專利創(chuàng)新能力,平臺還應(yīng)該提供大數(shù)據(jù)服務(wù)交易平臺,構(gòu)造專利價值評估體系,建立大數(shù)據(jù)商城,提升專利價值,“盤活”數(shù)據(jù),促進創(chuàng)新。
(一)主要建設(shè)內(nèi)容
對于將要建立的科技文獻(xiàn)大數(shù)據(jù)信息服務(wù)平臺,其主要內(nèi)容應(yīng)該包括“五個一”:
1. 構(gòu)建一個以專利為核心的知識產(chǎn)權(quán)產(chǎn)大數(shù)據(jù)平臺,提供大數(shù)據(jù)管理和訪問服務(wù)支撐,包括建立大數(shù)據(jù)存儲架構(gòu)、提供高效的檢索服務(wù)與分析服務(wù)、提供統(tǒng)一的數(shù)據(jù)展現(xiàn)。
2. 構(gòu)建一個以基礎(chǔ)服務(wù)為支撐的運營平臺,未來基于專利核心數(shù)據(jù)以及相關(guān)的科技文獻(xiàn)數(shù)據(jù),開展檢索、分析、評估、交易等多元化的市場運營,并為知識產(chǎn)權(quán)產(chǎn)業(yè)鏈上的各個環(huán)節(jié)提供更為開放的服務(wù)支撐,包括提供統(tǒng)一的客戶管理、產(chǎn)品(服務(wù))管理、供應(yīng)商管理、計費管理、交易支付、資源(項目數(shù)據(jù))管理等功能。
3. 構(gòu)建一個統(tǒng)一的應(yīng)用開發(fā)支撐平臺,為以數(shù)據(jù)為支撐的各個應(yīng)用開發(fā)組提供統(tǒng)一的基礎(chǔ)服務(wù)和應(yīng)用組件,使各開發(fā)組直接可以復(fù)用平臺基礎(chǔ)功能,或降低技術(shù)難度和開發(fā)風(fēng)險,提升開發(fā)效率,并讓各開發(fā)組將精力集中于向用戶提供特定服務(wù)的功能上。包括統(tǒng)一的用戶權(quán)限管理組件、系統(tǒng)日志服務(wù)、消息服務(wù)、自然語言處理組件、翻譯服務(wù)、數(shù)據(jù)可視化展現(xiàn)組件、知識庫管理組件、消息隊列組件等。
4. 通過構(gòu)建統(tǒng)一的技術(shù)架構(gòu)解決方案,提高各個應(yīng)用質(zhì)量,提升最終用戶的體驗,提高系統(tǒng)的性能、穩(wěn)定性、安全性以及可擴展性,降低總體成本。包括負(fù)載均衡解決方案、分布式緩存、分布式服務(wù)、分布式存儲解決方案、安全服務(wù)解決方案等。
5. 通過構(gòu)建統(tǒng)一的管控平臺,對各個應(yīng)用系統(tǒng)進行統(tǒng)一管理從而提升運維質(zhì)量,并提供運維輔助工具來降低運維成本。包括系統(tǒng)監(jiān)控平臺、自動化運維工具、數(shù)據(jù)核查和修改工具等。
圖1
圖2
(二)平臺關(guān)鍵技術(shù)
1. 大數(shù)據(jù)存儲技術(shù)
科技文獻(xiàn)大數(shù)據(jù)存儲需求包括3部分:
(1)傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)庫,存放系統(tǒng)基礎(chǔ)數(shù)據(jù)、專利及非專利結(jié)構(gòu)化數(shù)據(jù)、操作數(shù)據(jù)等。
(2)大數(shù)據(jù)存儲,存放海量文件,主要是專利和科技文獻(xiàn)全文、附圖、外部文件、部分關(guān)聯(lián)關(guān)系等。
(3)檢索數(shù)據(jù)庫,檢索引擎自身配置的數(shù)據(jù)庫,存放檢索索引、關(guān)聯(lián)關(guān)系等。
其中大數(shù)據(jù)存儲要解決的問題包括:數(shù)據(jù)源多、分布式存儲、海量文件、快速存取以及存取結(jié)構(gòu)應(yīng)便于統(tǒng)計和分析等。
因此,大數(shù)據(jù)存儲架構(gòu)設(shè)計是一個分布式文件系統(tǒng),用以實現(xiàn)專利和科技文獻(xiàn)全文、附圖、外部文件、部分關(guān)聯(lián)關(guān)系的分布式存儲。它有高容錯性的特點,并且部署在價格較為低廉的硬件上;而且它提供高傳輸率來訪問數(shù)據(jù),適合那些有著超大數(shù)據(jù)集的應(yīng)用程序。
大數(shù)據(jù)存儲的分布式架構(gòu),將大數(shù)據(jù)處理引擎盡可能地靠近存儲,實現(xiàn)了將單個任務(wù)打碎,并將碎片任務(wù)發(fā)送到多個節(jié)點上,之后再以單個數(shù)據(jù)集的形式加載到數(shù)據(jù)倉庫里,采用的具體技術(shù)包括分布式文件系統(tǒng)、分布式并行數(shù)據(jù)庫、映射規(guī)約處理模式等。
2. 大數(shù)據(jù)管理及檢索技術(shù)
科技文獻(xiàn)大數(shù)據(jù)管理主要面臨以下幾個問題:
(1)專利與非專利數(shù)據(jù)檢索涉及海量數(shù)據(jù),且隨著業(yè)務(wù)發(fā)展,數(shù)據(jù)量日益增加。
(2)系統(tǒng)用戶廣泛,需要在支持高并發(fā)量的同時,保證檢索性能。
(3)系統(tǒng)穩(wěn)定性是衡量一個應(yīng)用系統(tǒng)的重要指標(biāo),需要保證不會因某個節(jié)點設(shè)備的異常,而影響整個系統(tǒng)對外所提供的服務(wù)。
(4)需保證系統(tǒng)的高可擴展性,可通過增加節(jié)點方式,擴展系統(tǒng)容量與對外服務(wù)能力。
(5)支持結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一檢索。
大數(shù)據(jù)管理及檢索架構(gòu)設(shè)計采用了大數(shù)據(jù)管理系統(tǒng)并提供大數(shù)據(jù)檢索服務(wù),其處于提供全文檢索服務(wù)的基礎(chǔ)組件位置,即基于分布式或虛擬化技術(shù)的硬件支持,為所有通過二次開發(fā)接口進行檢索的請求提供響應(yīng)服務(wù)。大數(shù)據(jù)管理系統(tǒng)與實現(xiàn)大數(shù)據(jù)存儲的數(shù)據(jù)庫處于同等地位,只不過數(shù)據(jù)庫負(fù)責(zé)數(shù)據(jù)存儲,大數(shù)據(jù)管理系統(tǒng)則負(fù)責(zé)數(shù)據(jù)當(dāng)中非結(jié)構(gòu)化數(shù)據(jù)的全文檢索。
大數(shù)據(jù)檢索工具應(yīng)具備以下技術(shù)特性:
扁平化設(shè)計,彈性擴展;異常感知、自動恢復(fù);柔性多引擎技術(shù);高效分區(qū)索引機制;多副本機制;混合索引方式;內(nèi)存表與列存儲;異步檢索;多層次、多粒度的分布式緩存;可擴展的檢索模式,同根詞檢索,算法和詞典結(jié)合的英文詞根檢索,支持基于同義詞、主題詞的擴展檢索。
3. 大數(shù)據(jù)智能化檢索及分析技術(shù)
數(shù)據(jù)智能化檢索和分析技術(shù)的目標(biāo)對象是結(jié)構(gòu)化、半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),包括自然語言文本為對象的數(shù)據(jù)挖掘技術(shù),它是從大規(guī)模的結(jié)構(gòu)化數(shù)據(jù)和文本數(shù)據(jù)集中發(fā)現(xiàn)隱瞞、潛在的和重要規(guī)律的過程。首先從數(shù)據(jù)和文本中提取適當(dāng)?shù)奶卣?,表示成計算機能理解的形式,然后采用各種挖掘方法發(fā)現(xiàn)隱藏的知識模式,最后以用戶可以理解和接受的形式輸出。
針對專利檢索、特別是智能高級檢索,大數(shù)據(jù)檢索涉及到了詞庫管理、概念識別、文本抽詞、關(guān)鍵詞擴展關(guān)聯(lián)、相關(guān)度計算等內(nèi)容,這些功能將基于數(shù)據(jù)智能化檢索和分析技術(shù)來實現(xiàn)。具體技術(shù)包括:自動分詞、文本聚類、自動分類、自動重排、自動摘要、主題詞提取、信息抽取、常識校對、拼音檢索、相關(guān)短語檢索、關(guān)聯(lián)關(guān)系分析、內(nèi)容過濾等。
4. 大數(shù)據(jù)展現(xiàn)技術(shù)
對用戶友好的展現(xiàn)大數(shù)據(jù)分析結(jié)果是提升大數(shù)據(jù)價值的一項重要工作,如何基于分析數(shù)據(jù)集進行形象、直觀的數(shù)據(jù)可視化展現(xiàn)是平臺的關(guān)鍵技術(shù)點之一。數(shù)據(jù)可視化展現(xiàn)的核心是通過各種復(fù)雜的圖形,直觀地將數(shù)據(jù)中包含的內(nèi)在關(guān)系以人們更易接受的方式展現(xiàn)給用戶,在平臺中數(shù)據(jù)可視化展現(xiàn)的關(guān)鍵技術(shù)主要在于以下方面:
(1)豐富的圖形功能。圖表展示組件需要提供各種圖形的展現(xiàn)形式,除了基本的線圖、餅圖、區(qū)域圖,還應(yīng)提供漏斗圖、金字塔圖、線性波譜圖、子彈圖等多種圖形來滿足各種分析功能的圖形展現(xiàn)。
(2)支持多種數(shù)據(jù)格式。包括XML、JSON、多元數(shù)據(jù)組等多種接口的數(shù)據(jù)格式。實現(xiàn)專利分析與分析服務(wù)的一體化標(biāo)準(zhǔn),能夠支持未來其他用戶根據(jù)分析要求自行開發(fā)相關(guān)的應(yīng)用功能。
(3)有優(yōu)秀的兼容性。能夠不依賴于任何Active-X或擴展控件并兼容多種腳本語言,能夠支持未來廣泛用戶的使用。
(4)有良好的開放性。能夠提供二次開發(fā)接口,支持用戶自行開發(fā)相關(guān)的分析產(chǎn)品,支持復(fù)雜的圖形展現(xiàn)(例如專利人合作關(guān)系等的展現(xiàn))。
5. 大數(shù)據(jù)項目管理體系
數(shù)據(jù)項目的建立是為了幫助用戶更好地管理自己生成的操作結(jié)果,方便后續(xù)工作的使用?;诖?,平臺應(yīng)提供獨立的管理功能,并提供對其他功能接口的調(diào)用。用戶可以通過此模塊建立多個項目,每個項目是若干個數(shù)據(jù)存儲單元的集合。數(shù)據(jù)集合以樹形結(jié)構(gòu)存儲,每個數(shù)據(jù)集合包括但不限于形成當(dāng)前數(shù)據(jù)集合的檢索式、專利數(shù)據(jù)和數(shù)據(jù)分析結(jié)果等內(nèi)容。一個項目是由多個數(shù)據(jù)集合包構(gòu)成,每個數(shù)據(jù)集合包又可以由下一層數(shù)據(jù)集合包或者一組專利的集合構(gòu)成,每個專利包括著錄項目、標(biāo)準(zhǔn)信息、標(biāo)引信息、加工信息以及大數(shù)據(jù)包等內(nèi)容構(gòu)成。大數(shù)據(jù)項目管理功能應(yīng)包括:項目信息展示、項目管理基本操作、項目內(nèi)容管理、內(nèi)容統(tǒng)計分析、文獻(xiàn)多方式瀏覽等。
6. 大數(shù)據(jù)服務(wù)交易平臺技術(shù)
科技文獻(xiàn)大數(shù)據(jù)信息服務(wù)平臺中應(yīng)構(gòu)建服務(wù)交易平臺,數(shù)據(jù)商城是其特色功能之一:作為賣家,用戶可在數(shù)據(jù)商城中實現(xiàn)專利分析報告、專題數(shù)據(jù)庫和專利文件資料包的銷售,還將實現(xiàn)應(yīng)用工具和專題數(shù)據(jù)庫的定制服務(wù)。在商城中可實現(xiàn)商城信息的檢索、導(dǎo)航、在線訂購、支付、交易確認(rèn)、點評等業(yè)務(wù)。系統(tǒng)的注冊終端用戶均可作為買家參與商品交易,提供服務(wù)產(chǎn)品的注冊用戶兼具賣家的身份。
如何實現(xiàn)數(shù)據(jù)商城的可持續(xù)發(fā)展,確保數(shù)據(jù)商城能夠匯聚眾多專利服務(wù)需求者和供應(yīng)者,在業(yè)務(wù)設(shè)計上要借鑒互聯(lián)網(wǎng)思維,對數(shù)據(jù)商城進行有一定的前瞻性、超前性的設(shè)計,為用戶提供創(chuàng)新性的服務(wù),并形成創(chuàng)新的服務(wù)模式。其業(yè)務(wù)重點在于對交易過程進行全面地梳理、對流程進行細(xì)致地規(guī)劃、設(shè)立完備的糾紛解決機制、建立賬務(wù)管理體系對交易資金進行全面管理,并通過為用戶提供智能化供需信息匹配服務(wù)等交易撮合功能來提升用戶體驗。
以專利為核心的科技文獻(xiàn)大數(shù)據(jù)信息服務(wù)平臺建立后,通過大數(shù)據(jù)的關(guān)聯(lián)與整合,在產(chǎn)業(yè)鏈中占據(jù)了樞紐地位,整合了上下游,并可在此基礎(chǔ)上,開發(fā)出多種數(shù)據(jù)服務(wù)促進創(chuàng)新工作。
(一)整合專利相關(guān)科技文獻(xiàn)信息服務(wù)產(chǎn)業(yè)鏈,促進用戶創(chuàng)新
平臺將上游專利和相關(guān)數(shù)據(jù)源、服務(wù)、軟件進行整合,面向下游用戶,提供整合后的智能服務(wù)。組織鏈條上各個供應(yīng)商,利用各自的優(yōu)勢,通過不同服務(wù)者的合作來滿足用戶的最終要求。實現(xiàn)了上游數(shù)據(jù)與服務(wù)的增值,整體上提升了對下游最終用戶的服務(wù)水平,由此促進了最終用戶的創(chuàng)新工作。
(二)提供低成本的智能化服務(wù),促進中小企業(yè)創(chuàng)新
企業(yè)在創(chuàng)新的過程中需要檢索大量科技文獻(xiàn),對于大型企業(yè)來說,可以采購科技文獻(xiàn)數(shù)據(jù)庫,建立自己的檢索系統(tǒng)或者購買相關(guān)機構(gòu)的專業(yè)服務(wù)。但是,對于小企業(yè)和普通科研人員來說,傳統(tǒng)的免費檢索效率太低,依靠專業(yè)機構(gòu)則大幅增加了創(chuàng)新成本。
科技文獻(xiàn)大數(shù)據(jù)信息服務(wù)平臺將提供一套智能化檢索服務(wù),給不熟悉科技文獻(xiàn)檢索的用戶提供完善指導(dǎo),比如自動分類、標(biāo)引、導(dǎo)航,自動化的相關(guān)文獻(xiàn)分析,自動化的信息推送和預(yù)警分析等。系統(tǒng)的智能化程度達(dá)到部分取代專業(yè)機構(gòu)的程度,能夠給個人和中小企業(yè)提供近似于專業(yè)機構(gòu)的查新服務(wù)。平臺本身的檢索服務(wù)可以采用免費或低費用的方式,大幅降低了個人和小企業(yè)的創(chuàng)新成本。
通過本平臺,用戶可以了解技術(shù)的最新進展,預(yù)測相關(guān)發(fā)展趨勢;跟蹤競爭對手的活動;發(fā)現(xiàn)和避免專利侵權(quán)行為;充分利用失效專利經(jīng)濟和技術(shù)價值;減少重復(fù)的研發(fā)項目。
(三)完善的信息推送機制,促進科研和成果轉(zhuǎn)化
由于系統(tǒng)會根據(jù)大數(shù)據(jù)分析模型分析已有數(shù)據(jù),并對新進入的數(shù)據(jù)進行關(guān)聯(lián)分析,可以實現(xiàn)如下應(yīng)用:
1. 平臺自動分析客戶以往關(guān)注的領(lǐng)域,然后搜尋相關(guān)新進文獻(xiàn),及時提醒用戶其該領(lǐng)域的技術(shù)革新,并推送相關(guān)文獻(xiàn)。
2. 平臺還可以根據(jù)其他用戶的檢索式、閱讀行為、文獻(xiàn)引證關(guān)系,找出與當(dāng)前用戶關(guān)注領(lǐng)域相關(guān)的其他領(lǐng)域文獻(xiàn),將其推送給用戶。拓展用戶檢索覆蓋面,幫助用戶尋找新思路,在其創(chuàng)新過程中起到自動化地進行科技情報收集的作用。
3. 對于正準(zhǔn)備進行專利交易和成果轉(zhuǎn)化的用戶,平臺提供智能的消息服務(wù),通過對交易數(shù)據(jù)的分析和預(yù)測,提供發(fā)盤提醒、報價參考、同類產(chǎn)品比較、市場預(yù)警等服務(wù)。
(四)構(gòu)建專利價值評估體系,促進規(guī)范化的專利交易
平臺本身將提供一套專利價值評估體系,專利價值由評估模型、專業(yè)人工評估、專利交易價值等綜合而成。專利價值評估可以配合數(shù)據(jù)商城為專利交易雙方提供客觀的價值判斷,供交易雙方參考,從而加強專利交易的可靠性,促進交易業(yè)務(wù)的發(fā)展。
(五)通過用戶的大數(shù)據(jù)交易和數(shù)據(jù)挖掘利用,進一步促進創(chuàng)新
用戶可以將自己生成的專利分析報告、專題數(shù)據(jù)庫和專利文件資料包放到大數(shù)據(jù)商城中進行交易,所產(chǎn)生的利潤反過來可以進一步促進用戶對數(shù)據(jù)的深度挖掘和利用。對專利等科技文獻(xiàn)數(shù)據(jù)的深度利用,會讓用戶能夠收集更全面的信息,認(rèn)識差距、找到創(chuàng)新點,又必將進一步促進創(chuàng)新的發(fā)展。
參考文獻(xiàn)
[1]徐樹振,羅學(xué)禮,王森,楊莉,段嘉杰,張德剛,企業(yè)非結(jié)構(gòu)化數(shù)據(jù)檢索研究[J].信息技術(shù),2014(4):196-200.
[2]馬惠芳.非結(jié)構(gòu)化數(shù)據(jù)采集和檢索技術(shù)的研究和應(yīng)用[D].東華大學(xué),2013.
[3] [美]Ian H. Witten, [美]Alistair Moffat [美]. Timothy C. Bell著,梁斌,楊青譯.管理海量數(shù)據(jù):壓縮、索引和查詢(第2版)[M].北京:電子工業(yè)出版社,2014:26-98.
[4]郭建波.海量結(jié)構(gòu)化大數(shù)據(jù)存儲檢索系統(tǒng)探討[J].軟件,2013(2):95-96.
[5]于海斌.基于知識發(fā)現(xiàn)的專利檢索系統(tǒng)分析與設(shè)計[D].東北林業(yè)大學(xué),2012:18-60.
中圖分類號:C931
文獻(xiàn)標(biāo)識碼:A