徐婷 張自成 李茹 張華 李炎華 呂華
摘 要:油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容技術(shù)指標(biāo)比對對于明確油氣行業(yè)發(fā)展目標(biāo)和提升油氣行業(yè)質(zhì)量效率具有重大理論和現(xiàn)實意義。本文明晰了油氣行業(yè)標(biāo)準(zhǔn)指標(biāo)比對的概念內(nèi)涵,分別從人工比對與機(jī)器自動比對等兩方面對現(xiàn)有研究進(jìn)行了總結(jié)和歸納。圍繞油氣行業(yè)標(biāo)準(zhǔn)技術(shù)指標(biāo)比對的業(yè)務(wù)流程,提出了油氣行業(yè)標(biāo)準(zhǔn)指標(biāo)自動比對的關(guān)鍵技術(shù)的解決方案。在此基礎(chǔ)上,研判了油氣行業(yè)標(biāo)準(zhǔn)指標(biāo)比對技術(shù)或方法面臨的問題,并提出了針對性的對策建議。
關(guān)鍵詞:油氣行業(yè),標(biāo)準(zhǔn)指標(biāo),比對,人工比對,機(jī)器輔助比對,對策建議
DOI編碼:10.3969/j.issn.1674-5698.2024.05.015
0 引 言
目前,“標(biāo)準(zhǔn)比對”尚沒有明確的定義。百度百科對“比對”一詞的解釋是比較對照、核對;全國科學(xué)技術(shù)名詞審定委員會審定的化學(xué)術(shù)語“比對”指通過對比試驗確定和評價分析方法的可靠性、實驗室的水平以及分析者技能的操作;與標(biāo)準(zhǔn)比對近似的電力術(shù)語“比對標(biāo)準(zhǔn)”指用于同準(zhǔn)確度等級的標(biāo)準(zhǔn)器之間相互比對的標(biāo)準(zhǔn)器。
本研究嘗試將“標(biāo)準(zhǔn)比對”定義為:針對同一標(biāo)準(zhǔn)化對象,對不同(同類或有代替關(guān)系)的標(biāo)準(zhǔn)文件按照相同或相近的規(guī)則、指南或特性相互比對,以確定和評價這些規(guī)則、指南或特性的差別。標(biāo)準(zhǔn)比對起源于20世紀(jì)70年代美國的對標(biāo)管理,最初是人們利用對標(biāo)尋找與別的公司的差距,把它作為一種調(diào)查比較的基準(zhǔn)的方法。后來,對標(biāo)管理逐漸演變成為尋找最佳案例和標(biāo)準(zhǔn),加強(qiáng)企業(yè)內(nèi)部管理的一種方法。我國對標(biāo)準(zhǔn)比對有一個逐步認(rèn)識與拓展的過程,近年來,我國進(jìn)出口企業(yè)和一些研究機(jī)構(gòu)基于自身需求做過大量的標(biāo)準(zhǔn)比對,我國的標(biāo)準(zhǔn)比對研究開始于畜牧業(yè),主要是國內(nèi)外產(chǎn)品質(zhì)量標(biāo)準(zhǔn)的不同要求或具體指標(biāo)差異進(jìn)行對比,包括國內(nèi)外羊肉質(zhì)量對比[1]、梨質(zhì)量國內(nèi)外標(biāo)準(zhǔn)對比[2]等。
油氣行業(yè)在國民經(jīng)濟(jì)中具有重要地位,其發(fā)展?fàn)顩r對經(jīng)濟(jì)、政治和軍事等方面都有著深遠(yuǎn)的影響。石油和天然氣是重要的能源和化工原料,廣泛應(yīng)用于交通、工業(yè)、農(nóng)業(yè)等領(lǐng)域,滿足人們?nèi)粘Ia(chǎn)生活需求。當(dāng)前,在油氣行業(yè),標(biāo)準(zhǔn)化意識相對薄弱,主要表現(xiàn)在油氣管網(wǎng)建設(shè)和運營的參與主體較多,涉及指標(biāo)范圍廣泛,缺乏統(tǒng)一規(guī)范的組織與引導(dǎo)。隨著油氣管網(wǎng)建設(shè)的快速推進(jìn),油氣行業(yè)標(biāo)準(zhǔn)指標(biāo)比對工作也相對滯后,同時由于新技術(shù)的快速發(fā)展和市場需求的變化,導(dǎo)致已有的標(biāo)準(zhǔn)指標(biāo)不能完全適應(yīng)當(dāng)前的發(fā)展需求。盡管我國已經(jīng)發(fā)布了一些與油氣勘探開發(fā)相關(guān)的標(biāo)準(zhǔn),但在油氣勘探開發(fā)、生產(chǎn)及儲運等環(huán)節(jié)仍存在許多不規(guī)范的行為。因此,需要開展油氣行業(yè)標(biāo)準(zhǔn)指標(biāo)比對工作,進(jìn)一步加強(qiáng)行業(yè)規(guī)范。鑒于此,針對目前國內(nèi)外重點發(fā)展領(lǐng)域標(biāo)準(zhǔn)指標(biāo)的比對需求,本研究將開展標(biāo)準(zhǔn)指標(biāo)比對的通用方法和技術(shù)研究,在標(biāo)準(zhǔn)文獻(xiàn)結(jié)構(gòu)分析基礎(chǔ)上提出標(biāo)準(zhǔn)內(nèi)容指標(biāo)比對的通用技術(shù)和方法,重點解決國內(nèi)外重點發(fā)展領(lǐng)域標(biāo)準(zhǔn)比對技術(shù)問題,實現(xiàn)國內(nèi)外重點領(lǐng)域標(biāo)準(zhǔn)內(nèi)容獲取、標(biāo)注和比對,為產(chǎn)業(yè)發(fā)展和技術(shù)創(chuàng)新提供技術(shù)和數(shù)據(jù)支撐。
1 研究現(xiàn)狀
1.1 專家主導(dǎo)的人工標(biāo)準(zhǔn)比對
標(biāo)準(zhǔn)作為專業(yè)技術(shù)文件,包含有眾多技術(shù)指標(biāo),隨著生產(chǎn)和管理需求不斷深入和擴(kuò)大,同一對象涉及的標(biāo)準(zhǔn)不斷增加,相關(guān)技術(shù)指標(biāo)也越來越多。因此在做人工對比時,大部分是根據(jù)具體比對目標(biāo)和需求,專家提取核心指標(biāo)進(jìn)行對標(biāo)對比,比對標(biāo)準(zhǔn)范圍包括新舊標(biāo)準(zhǔn)比對和國內(nèi)外標(biāo)準(zhǔn)比對。
在國內(nèi)外標(biāo)準(zhǔn)比對研究方面,目前研究內(nèi)容集中在具體產(chǎn)品或領(lǐng)域的核心指標(biāo)統(tǒng)一認(rèn)定和提取上,采用方式和流程大都相似,比對目的是從技術(shù)標(biāo)準(zhǔn)角度說明產(chǎn)品的差異,研究給出直觀對比分析結(jié)論,目的是通過對比給產(chǎn)品生產(chǎn)和研究提供技術(shù)參考。如:陳曉穗等對國內(nèi)外LED臺燈標(biāo)準(zhǔn)進(jìn)行了比對,對安全、電氣 性能、光度學(xué)性能、色度學(xué)性能等要求和測試方法進(jìn)行了比對分析,對比全球各地標(biāo)準(zhǔn)對 LED 臺燈的要求[3]。朱曉春等進(jìn)行了中蒙《銅精礦·二氧化硅含量的測定方法》標(biāo)準(zhǔn)指標(biāo)比對研究,對蒙古國國家標(biāo)準(zhǔn)與中國國家標(biāo)準(zhǔn)中的方法類標(biāo)準(zhǔn)指標(biāo)進(jìn)行了對比[4]。
在國內(nèi)新舊標(biāo)準(zhǔn)比對方面,目前研究成果集中在新增或差異指標(biāo)的選擇和指標(biāo)值差異研究上,服務(wù)于新舊不同標(biāo)準(zhǔn)的宣貫和進(jìn)一步的新技術(shù)宣傳,如:丁莉等對我國輕型車國六與國五排放標(biāo)準(zhǔn)進(jìn)行比對分析,方便使用者理解標(biāo)準(zhǔn)差異[5]。馬冬妮等通過研究三峽工程水泥新舊標(biāo)準(zhǔn)比對方法,得出在我國新舊標(biāo)準(zhǔn)水泥強(qiáng)度檢驗方法使用上有著很大的差異,主要表現(xiàn)在試驗設(shè)備、使用標(biāo)準(zhǔn)砂、膠砂組成、人員操作、養(yǎng)護(hù)條件等指標(biāo)要求上,以及在計算方法上的差異等,為相關(guān)企業(yè)和技術(shù)人員使用新標(biāo)準(zhǔn)提供相應(yīng)的解釋材料,節(jié)省產(chǎn)業(yè)熟悉新標(biāo)準(zhǔn)時間,進(jìn)一步提高效率[6]。
在比對流程方面,藺菲等在實驗室間電能計量標(biāo)準(zhǔn)比對的方法與數(shù)據(jù)中,介紹了電能計量標(biāo)準(zhǔn)實驗室間標(biāo)準(zhǔn)比對的過程、方法,通過實例給出比對結(jié)果,分析試驗數(shù)據(jù)并進(jìn)行數(shù)據(jù)處理,得出比對試驗的結(jié)論,通過這一比對流程,真實地反映參加比對工作的實臉室電能計量的綜合技術(shù)水平[7]。付卉青和劉霞在開展消費品安全標(biāo)準(zhǔn)比對方法研究中,把消費品安全標(biāo)準(zhǔn)對比的步驟分為4步:確定消費品比較的范圍,收集和整理資料,建立消費品安全標(biāo)準(zhǔn)比對指標(biāo)體系,比較分析并得出結(jié)論[8]。
1.2 基于技術(shù)手段的自動比對研究
由于人工開展標(biāo)準(zhǔn)比對的效率問題和開展比對人員的專業(yè)局限性,標(biāo)準(zhǔn)比對的范圍和比對結(jié)果時效性受到極大制約。近年來國內(nèi)技術(shù)人員也對標(biāo)準(zhǔn)自動比對進(jìn)行過研究,技術(shù)核心是解決對海量標(biāo)準(zhǔn)文本進(jìn)行標(biāo)準(zhǔn)內(nèi)容指標(biāo)提取處理,從而建立基礎(chǔ)的指標(biāo)數(shù)據(jù)庫,再通過語義識別、歸一化處理等技術(shù),加上機(jī)器自動比對與專家經(jīng)驗比對的綜合分析,對相關(guān)標(biāo)準(zhǔn)化對象的不同標(biāo)準(zhǔn)進(jìn)行標(biāo)準(zhǔn)指標(biāo)比對分析,最終輸出結(jié)果。目前整體研究還處于起步階段,當(dāng)前研究成果集中在前期的不同類型標(biāo)準(zhǔn)數(shù)據(jù)庫建設(shè)和語言處理上。
計雄飛等提出實現(xiàn)標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容挖掘與比對需要經(jīng)過標(biāo)準(zhǔn)文獻(xiàn)文本識別、特征提取、內(nèi)容加工、內(nèi)容檢索4個步驟[9]。王昕等基于語義網(wǎng)的理論,研究一種標(biāo)準(zhǔn)指標(biāo)比對的方法,以“產(chǎn)品— 體例—指標(biāo)”三元組的方式將標(biāo)準(zhǔn)文獻(xiàn)碎片化,對細(xì)粒度的指標(biāo)碎片進(jìn)行知識化組織,最終形成“標(biāo)準(zhǔn)指標(biāo)比對”的應(yīng)用系統(tǒng)并應(yīng)用于電力行業(yè)[10]。周生龍等提出了在古文獻(xiàn)版本差異比對中的圖像文字自動比對方法,主要內(nèi)容包括信息采集與分類、文獻(xiàn)圖像預(yù)處理、文字切分與存儲、文字比對與文獻(xiàn)差異標(biāo)注等[11]。吳建港等以標(biāo)準(zhǔn)制修訂、標(biāo)準(zhǔn)內(nèi)容研究、指標(biāo)比對分析、產(chǎn)品質(zhì)量提升等為最終目的,在傳統(tǒng)標(biāo)準(zhǔn)指標(biāo)比對分析研究的經(jīng)驗基礎(chǔ)上,通過構(gòu)建以“標(biāo)準(zhǔn)體系——標(biāo)準(zhǔn)——產(chǎn)品——指標(biāo)項——指標(biāo)值”為數(shù)據(jù)模型,引入圖像識別技術(shù),構(gòu)建指標(biāo)庫[12]。
1.3 研究述評
目前開展的標(biāo)準(zhǔn)比對工作大都選定具體產(chǎn)品(對象)采用人工方式進(jìn)行,需要專業(yè)技術(shù)人員從大量標(biāo)準(zhǔn)中找到相關(guān)的、有差異的信息,雖然有能對Word、PDF等格式的標(biāo)準(zhǔn)文獻(xiàn)全文文件進(jìn)行檢索的軟件工具,但是很難快速獲取所需要的信息,缺乏油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容技術(shù)指標(biāo)比對方法研究,主要由于:(1)油氣行業(yè)標(biāo)準(zhǔn)文獻(xiàn)數(shù)量巨大,題錄檢索和手工查找難于滿足需求;(2)油氣行業(yè)紙質(zhì)的標(biāo)準(zhǔn)文獻(xiàn),雖然能夠掃描制作成PDF等格式的電子文件,建立了全文數(shù)據(jù)庫,實現(xiàn)了電子化館藏,但由于本身未進(jìn)行文字識別,實現(xiàn)不了全文檢索功能;(3)現(xiàn)有油氣行業(yè)Word、PDF標(biāo)準(zhǔn)文獻(xiàn)全文文件為非結(jié)構(gòu)化數(shù)據(jù),很難實現(xiàn)如:結(jié)構(gòu)化數(shù)據(jù)那樣的檢索、提取、挖掘和比對分析等功能。對于需要開展比對的油氣行業(yè)技術(shù)人員和企業(yè)來說,如何從海量的基礎(chǔ)標(biāo)準(zhǔn)、技術(shù)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)、工作標(biāo)準(zhǔn)、產(chǎn)品標(biāo)準(zhǔn)中快速獲取所需相關(guān)信息顯得尤為重要。
2 研究方法
(1)文獻(xiàn)研究法。查閱相關(guān)資料,學(xué)習(xí)研究相關(guān)理論。著眼于標(biāo)準(zhǔn)比對的內(nèi)涵和標(biāo)準(zhǔn)自身特征,進(jìn)行綜合分析,力求方法的創(chuàng)新。
(2)調(diào)查研究法。調(diào)查當(dāng)前開展油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容技術(shù)指標(biāo)比對工作的現(xiàn)狀,分析判斷當(dāng)前油氣行業(yè)標(biāo)準(zhǔn)比對工作開展的影響和制約因素,了解掌握豐富的第一手資料,為任務(wù)研究提供強(qiáng)有力的支撐。
(3)知識庫方法。使用專家+計算機(jī)結(jié)合的方式,進(jìn)行油氣行業(yè)比對標(biāo)準(zhǔn)集成、內(nèi)容指標(biāo)提取,構(gòu)建包含比對標(biāo)準(zhǔn)文本、內(nèi)容、指標(biāo)、比對結(jié)論、比對專家等相互關(guān)聯(lián)的知識庫。
3 油氣行業(yè)標(biāo)準(zhǔn)技術(shù)指標(biāo)比對的實現(xiàn)路徑
3.1 油氣行業(yè)標(biāo)準(zhǔn)指標(biāo)比對的流程
要開展油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容指標(biāo)比對,實現(xiàn)比對任務(wù),均需要在油氣行業(yè)不同的標(biāo)準(zhǔn)中找到相關(guān)內(nèi)容,并根據(jù)具體判定標(biāo)準(zhǔn)進(jìn)行對比,給出結(jié)論。按照解決問題的操作流程,需要解決3個關(guān)鍵問題:需要比對什么標(biāo)準(zhǔn)?需要比對的內(nèi)容、指標(biāo)是什么?結(jié)論是什么?
要解決這3個問題需要研究油氣行業(yè)標(biāo)準(zhǔn)的集成組織方法和工具,標(biāo)準(zhǔn)的結(jié)構(gòu)化分析方法和工具,內(nèi)容指標(biāo)提取方法和工具以及標(biāo)準(zhǔn)內(nèi)容指標(biāo)組織、關(guān)聯(lián)、比對方法和工具。本研究提出的業(yè)務(wù)流程如下。
(1)梳理油氣行業(yè)中外技術(shù)標(biāo)準(zhǔn)體系,確定油氣行業(yè)比對基準(zhǔn)標(biāo)準(zhǔn)及相關(guān)標(biāo)準(zhǔn)集合;
(2)建立油氣行業(yè)標(biāo)準(zhǔn)專業(yè)技術(shù)樹,確定標(biāo)準(zhǔn)比對指標(biāo)點;
(3)結(jié)合油氣行業(yè)專業(yè)技術(shù)樹選擇待比較標(biāo)準(zhǔn);
(4)識別油氣行業(yè)中外技術(shù)標(biāo)準(zhǔn)中的關(guān)聯(lián)條款;
(5)對油氣行業(yè)關(guān)聯(lián)條款進(jìn)行差異分析比較;
(6)形成油氣行業(yè)標(biāo)準(zhǔn)指標(biāo)比對結(jié)果報告。
3.2 油氣行業(yè)標(biāo)準(zhǔn)指標(biāo)自動比對的關(guān)鍵技術(shù)
3.2.1 油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容指標(biāo)比對層級
以油氣行業(yè)實際需求來說標(biāo)準(zhǔn)比對分3個層次:了解油氣行業(yè)宏觀層次的差異、了解油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容及工作思路差異、了解油氣行業(yè)標(biāo)準(zhǔn)技術(shù)細(xì)節(jié)差異。針對這些需求開展比對的層次也有所區(qū)別。在大多數(shù)情況下體系對比可以滿足宏觀層面管理及發(fā)展布局差異的需求,內(nèi)容比對能了解標(biāo)準(zhǔn)內(nèi)容結(jié)構(gòu)、文本結(jié)構(gòu)差異,了解不同操作方式的工作思路;指標(biāo)比對能進(jìn)一步確定技術(shù)細(xì)節(jié)差異,明確不同技術(shù)的實現(xiàn)目標(biāo),了解指標(biāo)取舍的判定過程。因此,在設(shè)計油氣行業(yè)內(nèi)容指標(biāo)比對流程和給出比對結(jié)果時,也需要滿足3個層次的需求。給比對人員足夠的自由度,對結(jié)果的判定也需要油氣行業(yè)基礎(chǔ)專業(yè)背景并能提供可驗證的證據(jù)。
3.2.2 油氣行業(yè)標(biāo)準(zhǔn)比對結(jié)果的判定
專家比對采用的主要方式為兩兩比對,選定一個油氣行業(yè)標(biāo)準(zhǔn)作為基準(zhǔn)比對標(biāo)準(zhǔn),選定待比對的內(nèi)容和指標(biāo),檢索其他標(biāo)準(zhǔn)中的相同或類似指標(biāo),將不同標(biāo)準(zhǔn)中的主要技術(shù)指標(biāo)分別與基準(zhǔn)標(biāo)準(zhǔn)中的指標(biāo)進(jìn)行對比。結(jié)果判定方法如下。
(1)基準(zhǔn)標(biāo)準(zhǔn)的要求低于其他比對標(biāo)準(zhǔn)時,該項指標(biāo)的單項評價為“低于”;
(2)基準(zhǔn)標(biāo)準(zhǔn)的要求等同于其他比對標(biāo)準(zhǔn)時,該項指標(biāo)的單項評價為“等同于”;
(3)基準(zhǔn)標(biāo)準(zhǔn)的要求嚴(yán)于其他比對標(biāo)準(zhǔn)時,該項指標(biāo)的單項評價為“高于”;
(4)若基準(zhǔn)標(biāo)準(zhǔn)的該項指標(biāo)在其他比對標(biāo)準(zhǔn)中未提及時,該指標(biāo)的單項判定結(jié)果為“自定義新指標(biāo)”;
(5)若基準(zhǔn)標(biāo)準(zhǔn)缺少其他比對標(biāo)準(zhǔn)中的指標(biāo)時,該指標(biāo)的單項判定結(jié)果為“xx指標(biāo)缺失”
結(jié)論判斷的一般描述為“***標(biāo)準(zhǔn)的此項要求等同于***標(biāo)準(zhǔn)”“***標(biāo)準(zhǔn)的此項要求高于/低于***標(biāo)準(zhǔn),具體為***”“***標(biāo)準(zhǔn)的此項要求與***標(biāo)準(zhǔn)存在差異為指標(biāo)缺失/自定義新指標(biāo),具體為***”。
3.2.3 油氣行業(yè)標(biāo)準(zhǔn)計算機(jī)輔助比對模型
(1)提取關(guān)鍵字
計算機(jī)通過分詞組件提取比對內(nèi)容涉及的關(guān)鍵字。在油氣行業(yè)標(biāo)準(zhǔn)文本結(jié)構(gòu)中字和標(biāo)點符號共同構(gòu)成一個段落,標(biāo)點符號只是標(biāo)準(zhǔn)內(nèi)容的分隔符,并沒有特殊的意義。因此,標(biāo)點符號不能夠成為文件內(nèi)容的關(guān)鍵字,同時停頓字在文件內(nèi)容中也沒有特殊的意義,因此停頓字也不能夠成為文檔內(nèi)容的關(guān)鍵字。
通過分詞組件完成以下功能:將比對內(nèi)容分成單獨的字;去掉標(biāo)點符號;分詞處理。
油氣行業(yè)標(biāo)準(zhǔn)比對內(nèi)容經(jīng)過以上的過程處理后,就成為算法處理的詞元。系統(tǒng)通過分詞處理的方法將詞元變成比對內(nèi)容的關(guān)鍵字。油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容指標(biāo)比對數(shù)據(jù)模型的研究單元為指標(biāo)化數(shù)據(jù),因此標(biāo)準(zhǔn)內(nèi)容中的指標(biāo)化數(shù)據(jù)可以作為關(guān)鍵字提取的最小單元,有效降低詞元的復(fù)雜性,提高了關(guān)鍵字的提取準(zhǔn)確率。根據(jù)對漢語語法和統(tǒng)計學(xué)規(guī)律的研究,制定了特有的關(guān)鍵字提取機(jī)制,即段落中關(guān)鍵字的字?jǐn)?shù)應(yīng)盡可能多、單個分詞的根數(shù)盡可能少和總詞數(shù)盡可能少。
(2)權(quán)重計算
權(quán)重是比對模型中一個相對的概念,同時權(quán)重是一個可調(diào)的值,權(quán)重一般表示該元素對系統(tǒng)輸出結(jié)果的影響力,影響力越大表示該元素權(quán)重越高,也表示該元素和系統(tǒng)處理結(jié)果越相關(guān)。標(biāo)準(zhǔn)內(nèi)容指標(biāo)比對的對象為標(biāo)準(zhǔn)內(nèi)容中的指標(biāo)數(shù)據(jù),通過對標(biāo)準(zhǔn)內(nèi)容的研究和分析,確定影響關(guān)鍵字在指標(biāo)數(shù)據(jù)中權(quán)重的因素。
通過兩個層次對標(biāo)準(zhǔn)文檔進(jìn)行研究,第一個層次為針對單個標(biāo)準(zhǔn)文檔的研究,第二層次為針對整個標(biāo)準(zhǔn)文檔庫的研究,研究發(fā)現(xiàn),每篇標(biāo)準(zhǔn)文檔都包含不同的主題,而工作人員為了描述該主題都采用了大量的專業(yè)詞匯,如果一篇文檔中某些關(guān)鍵字的詞頻比較高,這些關(guān)鍵字可能是用于描述文檔主題,那么這些關(guān)鍵字應(yīng)該有較高的權(quán)重。同時文檔中詞頻較高的關(guān)鍵字并不都是用于描述文檔主題,有些關(guān)鍵字為生活中的常用詞匯,文檔在編寫過程中會用到較多的常用詞匯,通過統(tǒng)計學(xué)方法的分析,得出了相應(yīng)的處理方法,即如果在一個數(shù)量比較大的文檔集群中,包含某些關(guān)鍵字文檔的數(shù)目越多,這些關(guān)鍵字越不重要,那么這些關(guān)鍵字的權(quán)值較低。
(3)相關(guān)性判斷
通過對指標(biāo)數(shù)據(jù)之間相關(guān)性的判斷,就能夠?qū)崿F(xiàn)指標(biāo)數(shù)據(jù)之間的比對功能。將每段內(nèi)容指標(biāo)數(shù)據(jù)看作是由N個關(guān)鍵字(term)構(gòu)成,每個關(guān)鍵字有一個權(quán)重,不同的關(guān)鍵字根據(jù)在指標(biāo)數(shù)據(jù)中的權(quán)重來影響比對結(jié)果的相關(guān)性。通過處理將所有的關(guān)鍵字的權(quán)重看作一個向量,將比對對象看作是由N個關(guān)鍵字(term)構(gòu)成,也用向量表示。通過計算兩個向量之間的夾角來判斷搜索內(nèi)容和文檔之間的相關(guān)性,兩個向量之間的夾角越小,相關(guān)性越大。可以采用余弦公式作為向量相關(guān)性的打分標(biāo)準(zhǔn),余弦值越大,分?jǐn)?shù)越高,相關(guān)性越大。通過上述過程的處理,系統(tǒng)就能夠根據(jù)條件,自動實現(xiàn)指標(biāo)數(shù)據(jù)的比對功能。
4 研究結(jié)論
當(dāng)前,油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容指標(biāo)比對模型提供的是計算機(jī)輔助功能,深層次的判定和比對工作還需要專業(yè)人員進(jìn)行。對于油氣行業(yè)外文標(biāo)準(zhǔn)文獻(xiàn),加工工具在人工比對操作時支持中英文比對,但機(jī)器輔助目前僅適用于中文標(biāo)準(zhǔn)(或中文譯文)。目前油氣行業(yè)國內(nèi)外標(biāo)準(zhǔn)比對需求旺盛,在開展比對前需要對國外標(biāo)準(zhǔn)文獻(xiàn)進(jìn)行轉(zhuǎn)化(翻譯),因此接入多語種自動翻譯平臺,研制支撐多語言的標(biāo)準(zhǔn)比對模型和工具,實現(xiàn)國內(nèi)外標(biāo)準(zhǔn)自動翻譯、內(nèi)容快速檢索、指標(biāo)比對是下一步工作的重點。目前的方法對油氣行業(yè)標(biāo)準(zhǔn)關(guān)鍵技術(shù)指標(biāo)的自動判定和提取僅限于表格和關(guān)鍵內(nèi)容中,但技術(shù)指標(biāo)的自動歸一化處理和組織還需要進(jìn)一步研究,自動比對和自動結(jié)果判定方法也需進(jìn)一步研究。因此需要對油氣行業(yè)標(biāo)準(zhǔn)文獻(xiàn)智能比對方法或技術(shù)開展更為深入的研究,突破油氣行業(yè)標(biāo)準(zhǔn)比對關(guān)鍵或共性技術(shù)。同時在油氣行業(yè)組織管理與制度機(jī)制建設(shè)、人才隊伍建設(shè)、資金投入與基礎(chǔ)設(shè)施建設(shè)、應(yīng)用推廣服務(wù)等方面加強(qiáng)支持力度。
(1)加強(qiáng)油氣行業(yè)標(biāo)準(zhǔn)比對人才隊伍建設(shè)
油氣行業(yè)標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容指標(biāo)比對是一項以應(yīng)用和服務(wù)為目標(biāo)的基礎(chǔ)性工作,是標(biāo)準(zhǔn)化科研的一個重要組成部分。但是,在比對方法、比對內(nèi)容以及專業(yè)技能和知識構(gòu)成上有別于傳統(tǒng)的標(biāo)準(zhǔn)化科研工作,需要進(jìn)一步加強(qiáng)油氣行業(yè)數(shù)據(jù)資源建設(shè)、更新維護(hù)、軟件開發(fā)與市場營銷相關(guān)的人才隊伍建設(shè),逐步完善標(biāo)準(zhǔn)比對人才隊伍。加強(qiáng)油氣行業(yè)科研人員和業(yè)務(wù)人員的相關(guān)意識和能力培養(yǎng),建立一支由標(biāo)準(zhǔn)化研究和標(biāo)準(zhǔn)化服務(wù)機(jī)構(gòu)共同組成的標(biāo)準(zhǔn)內(nèi)容指標(biāo)比對、翻譯、計算機(jī)與服務(wù)營銷隊伍。
(2)建立油氣行業(yè)標(biāo)準(zhǔn)比對資金持續(xù)投入機(jī)制
油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容指標(biāo)比對數(shù)據(jù)庫建設(shè)是一項長期持續(xù)性工作,需要長期投入。采用科研投入和市場投入相結(jié)合的方式,多方調(diào)動資金,加強(qiáng)油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容指標(biāo)庫更新維護(hù)和開發(fā)應(yīng)用工作。同時,重視資源建設(shè)與應(yīng)用的投入產(chǎn)出評估。
(3)加強(qiáng)油氣行業(yè)標(biāo)準(zhǔn)比對方法的推廣應(yīng)用與服務(wù)工作
油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容指標(biāo)庫建設(shè)不同于標(biāo)準(zhǔn)化科研工作,有其自身的特點,需要按照自身的規(guī)律科學(xué)建設(shè)才能夠可持續(xù)發(fā)展。該項工作涉及多學(xué)科、多領(lǐng)域的知識,是最基礎(chǔ)的資源建設(shè),目標(biāo)是應(yīng)用服務(wù),評價內(nèi)容指標(biāo)庫建設(shè)的重要指標(biāo)是推廣應(yīng)用。因此,在油氣行業(yè)標(biāo)準(zhǔn)內(nèi)容指標(biāo)庫建設(shè)立項的初期就要十分強(qiáng)調(diào)推廣應(yīng)用,明確其市場化思路和步驟以及所服務(wù)的對象和市場前景。
參考文獻(xiàn)
劉春卉. 水泥窯余熱發(fā)電驗收標(biāo)準(zhǔn)法規(guī)比較手冊[M]. 北
京: 中國質(zhì)檢出版社, 2018.
甘克勤. 標(biāo)準(zhǔn)大數(shù)據(jù)實踐[M]. 北京:中國質(zhì)檢出版社,
2016.
陳曉穗,江紹華,徐晨. LED臺燈國內(nèi)外標(biāo)準(zhǔn)比對[J]. 機(jī)械
工業(yè)標(biāo)準(zhǔn)化與質(zhì)量, 2019(07):32-36.
朱曉春,唐文潔,斯慶圖婭. 中蒙《銅精礦·二氧化硅含量
的測定方法》標(biāo)準(zhǔn)指標(biāo)比對研究[J]. 標(biāo)準(zhǔn)科學(xué), 2019(05):
22-25.
丁莉,鄒雄輝,戴春蓓,等. 輕型車國六與國五排放標(biāo)準(zhǔn)比
對分析[J]. 小型內(nèi)燃機(jī)與車輛技術(shù), 2019,48(03):54-59.
馬冬妮,張淑芝,葉國強(qiáng). 淺議三峽工程水泥新舊標(biāo)準(zhǔn)比
對方法[J]. 云南水力發(fā)電, 2002(03):81-82.
藺菲,莊磊,吳蘊潔. 實驗室間電能計量標(biāo)準(zhǔn)比對的方法
與數(shù)據(jù)處理[J]. 安徽電力, 2009,26(03):43-48+84.
付卉青,劉霞. 消費品安全標(biāo)準(zhǔn)比對方法研究 [J]. 中國標(biāo)
準(zhǔn)化, 2018(09):49-52.
計雄飛,張寶林,李抵非,等. 標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容挖掘與比對[J].
標(biāo)準(zhǔn)科學(xué), 2012(08):16-19.
王昕,王宏,周育忠,等. 標(biāo)準(zhǔn)指標(biāo)比對的方法與實踐[J]. 中
國科技資源導(dǎo)刊, 2017,49(04):83-92.
周生龍,張忠林.古文獻(xiàn)版本考究中的圖像文字自動比
對方法設(shè)計與應(yīng)用研究[J]. 河南圖書館學(xué)刊, 2018,38
(09):72-74.
吳建港,國玉寶,崔紹輝. 基于標(biāo)準(zhǔn)指標(biāo)庫的塑料注塑
機(jī)產(chǎn)品標(biāo)準(zhǔn)指標(biāo)比對分析[J].工程塑料應(yīng)用, 2019,47
(04):107-111.