文/本刊記者 許歡
但事實上,它需要運用一些數(shù)量分析、歷史分析來預(yù)測一些相關(guān)信息,才能真正用起來。標(biāo)準(zhǔn)館里的標(biāo)準(zhǔn)文獻,可以稱得上是大數(shù)據(jù),所以我們會采用標(biāo)準(zhǔn)化理論數(shù)據(jù)及大數(shù)據(jù)方法來揭示數(shù)據(jù)內(nèi)容,以提升標(biāo)準(zhǔn)化水平。
2018年5月29日,第二屆標(biāo)準(zhǔn)大數(shù)據(jù)服務(wù)發(fā)展研討會,發(fā)布了《2017我國標(biāo)準(zhǔn)起草單位大數(shù)據(jù)報告——國家標(biāo)準(zhǔn)與行業(yè)標(biāo)準(zhǔn)研制貢獻指數(shù)》(以下簡稱《報告》),這份《報告》從大數(shù)據(jù)角度,利用大數(shù)據(jù)方法,全面立體地展現(xiàn)我國標(biāo)準(zhǔn)研制起草單位的發(fā)展脈絡(luò)。此外,會上還詳盡分析了標(biāo)準(zhǔn)信息服務(wù)的發(fā)展趨勢。
中國標(biāo)準(zhǔn)化研究院國家標(biāo)準(zhǔn)館館長汪濱在發(fā)布報告時指出,標(biāo)準(zhǔn)是國家質(zhì)量技術(shù)基礎(chǔ)的重要組成部分,是一個國家、地區(qū)和單位軟實力的體現(xiàn),代表著話語權(quán)、治理能力和技術(shù)質(zhì)量水準(zhǔn)。
這份《報告》涉及的“國家標(biāo)準(zhǔn)”范圍主要有:原國家質(zhì)檢總局、國家標(biāo)準(zhǔn)化管理委員會、住房和城鄉(xiāng)建設(shè)部、原國家衛(wèi)生和計劃生育委員會、原農(nóng)業(yè)部、原環(huán)境保護部等部門發(fā)布的“國家標(biāo)準(zhǔn)”。發(fā)布時間在2001—2016年,出版時間截至2017年10月,數(shù)量約為3.5萬項國家標(biāo)準(zhǔn)和約4萬家起草單位。
從國家標(biāo)準(zhǔn)研制貢獻指數(shù)(以下簡稱“國標(biāo)指數(shù)”)來看,國家標(biāo)準(zhǔn)研制的參與度顯著提升。數(shù)據(jù)顯示:2016年,國標(biāo)指數(shù)為5786.9,國家標(biāo)準(zhǔn)發(fā)布數(shù)量2435 項,國家標(biāo)準(zhǔn)起草單位6009家;2016年相對2015年,國家標(biāo)準(zhǔn)發(fā)布數(shù)量增長7.1%,國標(biāo)指數(shù)降低10.0%,起草單位數(shù)量降低11.5%。
2001—2016 年,國家標(biāo)準(zhǔn)發(fā)布數(shù)量年均增長率5.5%,國標(biāo)指數(shù)年均增長率8.8%,國家標(biāo)準(zhǔn)起草單位數(shù)量年均增長率12.2%;平均每個標(biāo)準(zhǔn)起草單位數(shù)量從2001年1.8穩(wěn)步上升到2016年6.5,增長率達到261%。
通過集中度分析得出:2016年,國家標(biāo)準(zhǔn)研制集中度較高,前5%的300家起草單位貢獻38.85%的國標(biāo)指數(shù),主要由企業(yè)和研究院所組成,其中,研究院所國標(biāo)指數(shù)占比達52.7%,企業(yè)起草單位數(shù)量占比達46.3%,企業(yè)占比逐步上升。這表明,已有更多企業(yè)投入到國家標(biāo)準(zhǔn)研制,企業(yè)正成為國家標(biāo)準(zhǔn)研制的中堅力量。
此外,2016年國家標(biāo)準(zhǔn)起草單位的地域分布也更加廣泛。相對于2015年,2016年北京國標(biāo)指數(shù)和主導(dǎo)國家標(biāo)準(zhǔn)研制數(shù)量的全國占比呈下降趨勢,而廣東、浙江、江蘇、上海、山東五省市國標(biāo)指數(shù)之和與主導(dǎo)國家標(biāo)準(zhǔn)研制數(shù)量之和,均呈現(xiàn)上升趨勢。與北京市相比,這五省市起草單位的數(shù)量和研制國標(biāo)的數(shù)量差距較小,但需要進一步提升研制國家標(biāo)準(zhǔn)的主導(dǎo)程度。
2016年,企業(yè)是“國家標(biāo)準(zhǔn)”研制的主要力量。其國標(biāo)指數(shù)與起草單位數(shù)量占比均超過50%,研究院所對國家標(biāo)準(zhǔn)研制的引領(lǐng)作用明顯,以20.3%國家標(biāo)準(zhǔn)起草單位數(shù)量占比,主導(dǎo)了43.7%國家標(biāo)準(zhǔn)研制。2001—2016年,企業(yè)主導(dǎo)國家標(biāo)準(zhǔn)數(shù)量與研究院所主導(dǎo)國家標(biāo)準(zhǔn)數(shù)量相比增長趨勢明顯,并且在2016年,首次超過研究院所。
由于2016年企業(yè)“國標(biāo)指數(shù)”占比最高,《報告》還特別就企業(yè)研制“國家標(biāo)準(zhǔn)”情況進行了專題分析。地區(qū)分布上,2001—2016 年,企業(yè)參與國家標(biāo)準(zhǔn)研制主要從2008年開始,之后逐步增多。這些企業(yè)主要分布在浙江省、北京市、江蘇省、廣東省、上海市、山東省等發(fā)達地區(qū);領(lǐng)域分布上,2016年制造業(yè)企業(yè)的國標(biāo)指數(shù)占比最高,達到70.5%,第二是科學(xué)研究和技術(shù)服務(wù)業(yè)的企業(yè),第三是信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)的企業(yè)。制造業(yè)企業(yè)國標(biāo)指數(shù)穩(wěn)定且占比高。
這份《報告》涉及的“行業(yè)標(biāo)準(zhǔn)”范圍主要有:機械、電子、郵電通信、化工、農(nóng)業(yè)、輕工、能源、認證認可等63個在國家標(biāo)準(zhǔn)化管理委員會備案并發(fā)布的“行業(yè)標(biāo)準(zhǔn)”;發(fā)布時間在2001—2015年,出版時間截至2017年10月,數(shù)量約為5.5萬項行業(yè)標(biāo)準(zhǔn)和4.4萬家起草單位。
從行業(yè)標(biāo)準(zhǔn)研制貢獻指數(shù)來看,行業(yè)標(biāo)準(zhǔn)研制的參與度顯著提升。數(shù)據(jù)顯示:2015年,行標(biāo)指數(shù)為11088.2,行業(yè)標(biāo)準(zhǔn)發(fā)布數(shù)量4599項,行業(yè)標(biāo)準(zhǔn)起草單位數(shù)量8705家。2001—2015年,行業(yè)標(biāo)準(zhǔn)發(fā)布數(shù)量年均增長7.4%,起草單位數(shù)量年均增長11.9%,平均每個標(biāo)準(zhǔn)起草單位的數(shù)量從2001 年的2.1 逐步上升到2015 年的4.4,增長率達到110%。
通過集中度分析得出:2015 年,行業(yè)標(biāo)準(zhǔn)研制集中度高,前5%的435 家起草單位貢獻45%,主要由企業(yè)和研究院所組成。其中,研究院所的行標(biāo)指數(shù)占比達39.8%,企業(yè)起草單位的數(shù)量占比達41.5%。行標(biāo)指數(shù)排名前十的核心力量呈現(xiàn)出研究院所、企業(yè)、政府機關(guān)并重的局面。在行標(biāo)指數(shù)排名前435家的單位中,北京占比最高,達29.3%,之后依次是廣東、江蘇、上海、浙江。
此外,2001—2015年,行業(yè)標(biāo)準(zhǔn)研制貢獻集中度呈現(xiàn)如下趨勢。整體上,前5%的起草單位研制貢獻占比在增長;地區(qū)分布上,前5%的起草單位在北京數(shù)量占比在降低;類別上,前5%的起草單位中,研究院所數(shù)量和行標(biāo)指數(shù)的占比整體下降,企業(yè)數(shù)量和行標(biāo)指數(shù)的占比整體在上升。
相對于2014 年,2015 年行業(yè)標(biāo)準(zhǔn)起草單位地域分布更加集中,北京市行標(biāo)指數(shù)和主導(dǎo)行業(yè)標(biāo)準(zhǔn)研制數(shù)量的全國占比呈現(xiàn)上升趨勢,而廣東、浙江、江蘇、上海、山東五省市行標(biāo)指數(shù)之和與主導(dǎo)行業(yè)標(biāo)準(zhǔn)研制數(shù)量之和,均呈現(xiàn)下降趨勢。2015年與北京市相比,這五省市在起草單位數(shù)量和研制行標(biāo)數(shù)量上差距較小,但需進一步提升研制行業(yè)標(biāo)準(zhǔn)主導(dǎo)程度。
2015年,企業(yè)是行業(yè)標(biāo)準(zhǔn)研制貢獻的主要力量,其行標(biāo)指數(shù)和起草單位數(shù)量占比均接近或超過50%。研究院所與政府機關(guān)對行業(yè)標(biāo)準(zhǔn)研制引領(lǐng)作用明顯,以合計27.2%的行業(yè)標(biāo)準(zhǔn)起草單位占比,主導(dǎo)了54.8%的行業(yè)標(biāo)準(zhǔn)研制。2001—2015年,企業(yè)主導(dǎo)行業(yè)標(biāo)準(zhǔn)數(shù)量與研究院所主導(dǎo)行業(yè)標(biāo)準(zhǔn)數(shù)量相比,增長趨勢明顯,并且在2012年首次超過研究院所,之后持續(xù)高于研究院所。
由于2015年企業(yè)“行標(biāo)指數(shù)”占比最高,《報告》特別就企業(yè)研制“行業(yè)標(biāo)準(zhǔn)”情況進行專題分析。2015 年,北京、廣東、浙江、江蘇四省市的企業(yè)對行業(yè)標(biāo)準(zhǔn)研制貢獻較高,2001—2015年,從全國重點地區(qū)企業(yè)行標(biāo)指數(shù)分布變化趨勢來看,自2010 年開始,企業(yè)大規(guī)模開展行業(yè)標(biāo)準(zhǔn)研制,之后逐步增長。
另外,2001—2015 年,制造業(yè)企業(yè)對行業(yè)標(biāo)準(zhǔn)研制貢獻最高,其行標(biāo)指數(shù)達到所有企業(yè)行標(biāo)指數(shù)的69.9 %,在全行業(yè)占比較為平穩(wěn)。排名第二的是信息傳輸、軟件和信息技術(shù)服務(wù)業(yè),排名第三的是科學(xué)研究和技術(shù)服務(wù)業(yè)。
中國標(biāo)準(zhǔn)化研究院國家標(biāo)準(zhǔn)館信息技術(shù)主任甘克勤在談到標(biāo)準(zhǔn)信息服務(wù)發(fā)展趨勢時表示,標(biāo)準(zhǔn)信息服務(wù)肩負著各界的期待,大眾期待標(biāo)準(zhǔn)要生動并貼近生活;行業(yè)用戶期待能隨時隨地呈現(xiàn)出準(zhǔn)確的標(biāo)準(zhǔn)內(nèi)容,免去查找煩惱;決策者期待標(biāo)準(zhǔn)滿足市場監(jiān)管需要,挖掘決策依據(jù)。
大數(shù)據(jù)是突破計算機和科學(xué)范疇的行業(yè)概念,具體到標(biāo)準(zhǔn)是交叉性學(xué)科,是圖書館學(xué)科指導(dǎo)業(yè)務(wù)、標(biāo)準(zhǔn)化學(xué)科定義應(yīng)用場景、計算機學(xué)科突破技術(shù)瓶頸。
標(biāo)準(zhǔn)化學(xué)科如何定義應(yīng)用場景?在生產(chǎn)領(lǐng)域里標(biāo)準(zhǔn)是文件,流通領(lǐng)域里標(biāo)準(zhǔn)是語言、說明產(chǎn)品特性和功能,各級貿(mào)易里標(biāo)準(zhǔn)是調(diào)節(jié)手段和進攻戰(zhàn)略,所以標(biāo)準(zhǔn)代表著質(zhì)量的高低。標(biāo)準(zhǔn)信息化服務(wù)應(yīng)該是把標(biāo)準(zhǔn)和質(zhì)量的關(guān)系顯著地表達出來。如何用標(biāo)準(zhǔn)表達質(zhì)量、評價質(zhì)量是標(biāo)準(zhǔn)應(yīng)用場景之一。另外,標(biāo)準(zhǔn)的應(yīng)用情況有評價標(biāo)準(zhǔn)化工作成效的應(yīng)用場景。
到目前為止,計算機與大數(shù)據(jù)已經(jīng)突破了傳統(tǒng)計算機理念,但是計算機科學(xué)仍然非常重要,它突破了兩個技術(shù)瓶頸,一是高效計算、二是機器學(xué)習(xí)?;跀?shù)據(jù)率的查詢大家都會用到,但是當(dāng)數(shù)據(jù)量達到萬百級時,查詢效率就是問題,這時就需要大數(shù)據(jù)的檢索技術(shù),如Solx Lucene等,另外對于非結(jié)構(gòu)化的信息研判,比如標(biāo)準(zhǔn)的分類,主題詞乃至指標(biāo)的抽取,還需要機器學(xué)習(xí)的應(yīng)用。
而有了交叉學(xué)科的概念,也就有了以下業(yè)務(wù)路線。簡單來說就是:定位需求痛點,比如評價質(zhì)量、評價標(biāo)準(zhǔn)化工作成效。還有補足資源短板,包括單位信息、商品信息、指標(biāo)信息。現(xiàn)在國家標(biāo)準(zhǔn)館已通過大數(shù)據(jù)研究補足了單位信息,接下來會補全商品信息和指標(biāo)信息。
此外,應(yīng)用AI技術(shù)針對專題檢索報告形成的情報產(chǎn)品,解決了需求痛點。但現(xiàn)在這項業(yè)務(wù)路線也在轉(zhuǎn)型。目前,大部分標(biāo)準(zhǔn)信息從業(yè)者都能夠做好傳統(tǒng)服務(wù),但增值服務(wù)才是未來發(fā)展方向。需要通過數(shù)據(jù)服務(wù)、專題服務(wù)、情報服務(wù)、標(biāo)準(zhǔn)解決方案來形成增值服務(wù),最后達到持續(xù)效益。
標(biāo)準(zhǔn)信息服務(wù)發(fā)展趨勢的新技術(shù)線路,就是要在深度上挖掘出標(biāo)準(zhǔn)化對象和指標(biāo),標(biāo)準(zhǔn)化對象要基于詞表和規(guī)則,指標(biāo)要基于AI提升效人工抽取指標(biāo)效率。另外,在廣度上要把商品和標(biāo)準(zhǔn)進行關(guān)聯(lián),讓標(biāo)準(zhǔn)和企業(yè)項目新聞、社交、科技文獻等進行關(guān)聯(lián),尤其是標(biāo)準(zhǔn)和商品的關(guān)聯(lián)。
在湖北省標(biāo)準(zhǔn)化與質(zhì)量研究院主任徐術(shù)坤看來,國家層面的大數(shù)據(jù)應(yīng)用、大數(shù)據(jù)戰(zhàn)略可以使國家在發(fā)展中有先發(fā)的優(yōu)勢,包括一些政府也成立了大數(shù)據(jù)局,比如杭州、貴州、浙江、湖北省黃石等地市,說明政府越來越重視大數(shù)據(jù)在社會經(jīng)濟中發(fā)揮的作用。而企業(yè)對于大數(shù)據(jù)的應(yīng)用也越來越廣泛,比如百度年度大數(shù)據(jù)報告、滴滴出行報告等。
他認為,大數(shù)據(jù)并非只是數(shù)量的概念,其實它更是一種思維方法或者技術(shù)方式,能為我們解決現(xiàn)實生活中的一些具體問題。如果單純只是把數(shù)據(jù)管起來,那銀行、稅務(wù)、證券行業(yè)這些年來的數(shù)據(jù)規(guī)模應(yīng)該構(gòu)成大數(shù)據(jù)了。但事實上,它需要運用一些數(shù)量分析、歷史分析來預(yù)測一些相關(guān)信息,才能真正用起來。標(biāo)準(zhǔn)館里的標(biāo)準(zhǔn)文獻,可以稱得上是大數(shù)據(jù),所以我們會采用標(biāo)準(zhǔn)化理論數(shù)據(jù)及大數(shù)據(jù)方法來揭示數(shù)據(jù)內(nèi)容,以提升標(biāo)準(zhǔn)化水平。