唐晶 屈文建
摘要:[目的/意義]旨在為高??蒲许?xiàng)目周期中數(shù)據(jù)質(zhì)量控制提供一種有效控制途徑與方法。[方法/過(guò)程]圍繞科研項(xiàng)目周期和數(shù)據(jù)質(zhì)量控制周期構(gòu)建數(shù)據(jù)質(zhì)量控制架構(gòu)體系,并在此體系之下從認(rèn)知、管理、流程3個(gè)視角分別實(shí)施數(shù)據(jù)質(zhì)量控制,引入質(zhì)量差距模型、企業(yè)架構(gòu)模型和流程分析等控制方法,剖析高校科研項(xiàng)目周期中科研數(shù)據(jù)質(zhì)量控制機(jī)理。[結(jié)果/結(jié)論] 構(gòu)建了適用于科研項(xiàng)目周期中高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)體系及其數(shù)據(jù)質(zhì)量控制模式,為高校科研數(shù)據(jù)質(zhì)量控制提供理論支撐。
關(guān)鍵詞:數(shù)據(jù)質(zhì)量? ? 科研項(xiàng)目周期? ? 科研環(huán)境? ? 質(zhì)量差距模型? ? 企業(yè)架構(gòu)模型
分類號(hào):G250
引用格式:唐晶, 屈文建. 高??蒲许?xiàng)目周期中數(shù)據(jù)質(zhì)量控制模式探究[J/OL]. 知識(shí)管理論壇, 2020, 5(1): 24-35[引用日期]. http://www.kmf.ac.cn/p/197/.
1? 引言
隨著第四科研范式環(huán)境即數(shù)據(jù)密集型科研環(huán)境的形成,科研數(shù)據(jù)量成指數(shù)型迅猛增長(zhǎng),數(shù)據(jù)表現(xiàn)形式多樣,對(duì)于科研人員來(lái)說(shuō),其所需存儲(chǔ)、處理的數(shù)據(jù)量驚人,數(shù)據(jù)來(lái)源和數(shù)據(jù)結(jié)構(gòu)繁多復(fù)雜,為推動(dòng)科研項(xiàng)目的進(jìn)程帶來(lái)了很大的阻礙[1]。且科研項(xiàng)目中充斥的數(shù)據(jù)資源來(lái)源復(fù)雜、存儲(chǔ)結(jié)構(gòu)多樣,各個(gè)科研項(xiàng)目團(tuán)隊(duì)的數(shù)據(jù)共享技術(shù)兼容性差、數(shù)據(jù)管理意識(shí)不足,導(dǎo)致科研數(shù)據(jù)質(zhì)量低下、利用率不高。而高校具有得天獨(dú)厚的科研數(shù)據(jù)資源優(yōu)勢(shì),是產(chǎn)生、利用科研數(shù)據(jù)從事科學(xué)研究的主力軍,因此,高校更需要加強(qiáng)數(shù)據(jù)密集型科研環(huán)境下數(shù)據(jù)質(zhì)量控制,并以此為基礎(chǔ)探索、構(gòu)建、完善國(guó)內(nèi)高校在數(shù)字化科研背景下的科研數(shù)據(jù)管理架構(gòu)與體系。
回顧國(guó)內(nèi)外高??蒲袛?shù)據(jù)質(zhì)量控制的研究歷程,研究成果集中于理論體系的建立以及實(shí)踐應(yīng)用。在高校科研數(shù)據(jù)質(zhì)量控制理論體系構(gòu)建方面,DAMA將數(shù)據(jù)質(zhì)量控制分為10個(gè)職能域,成為當(dāng)前較為被認(rèn)可的數(shù)據(jù)管理知識(shí)體系[1];包冬梅等創(chuàng)新性地提出了高校圖書館數(shù)據(jù)治理框架——CALib框架,促進(jìn)了高校圖書館數(shù)據(jù)資源有效利用[2];屈文建等基于Krantz理論建立了高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)并剖析其作用機(jī)制,為高??蒲袌F(tuán)隊(duì)控制科研數(shù)據(jù)提供了有效理論支撐[3]。在實(shí)踐應(yīng)用方面,馬波等通過(guò)借鑒和總結(jié)歐美高校圖書館的科研數(shù)據(jù)管理實(shí)踐經(jīng)驗(yàn),提出了加強(qiáng)數(shù)據(jù)治理意識(shí)與基礎(chǔ)設(shè)施構(gòu)建、人才培養(yǎng)等策略,以期提高國(guó)內(nèi)高??蒲袛?shù)據(jù)治理水平[4];徐慧芳等通過(guò)調(diào)研國(guó)內(nèi)科研數(shù)據(jù)管理實(shí)踐并進(jìn)行SWOT分析,從多個(gè)視角提出了國(guó)內(nèi)高校圖書館有效實(shí)施科研數(shù)據(jù)服務(wù)與質(zhì)量控制的途徑[5]。然而通過(guò)對(duì)已有研究的梳理可以發(fā)現(xiàn),在數(shù)字化科研背景下,科研數(shù)據(jù)管理作為高校圖書館及科研機(jī)構(gòu)新的業(yè)務(wù)生長(zhǎng)點(diǎn),其數(shù)據(jù)質(zhì)量控制模式在應(yīng)付海量的數(shù)據(jù)規(guī)模時(shí)還有較大的提升空間。
基于此,本文圍繞科研項(xiàng)目周期構(gòu)建高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)體系,并從認(rèn)知、管理、流程3個(gè)視角提出高??蒲袛?shù)據(jù)質(zhì)量控制模式,為促進(jìn)我國(guó)科研機(jī)構(gòu)、圖書館等開展科研數(shù)據(jù)質(zhì)量工程提供理論參考。
2? 科研項(xiàng)目周期中實(shí)行數(shù)據(jù)質(zhì)量控制的必要性
2.1? 科研項(xiàng)目周期內(nèi)涵及其相關(guān)數(shù)據(jù)活動(dòng)
科研項(xiàng)目生命周期是一種管理學(xué)意義上的項(xiàng)目生命周期,描述科研項(xiàng)目“計(jì)劃—立項(xiàng)—實(shí)施—結(jié)題”的發(fā)展階段和歷程。為便于后續(xù)研究,本文采用陸玉泉提出的科研項(xiàng)目生命周期劃分方法,將科研項(xiàng)目周期劃分為科研構(gòu)思、科研實(shí)施、成果整理和成果發(fā)表4個(gè)階段[6],如圖1所示,基于此來(lái)研究科研項(xiàng)目周期中的高校科研數(shù)據(jù)質(zhì)量控制。
(1)科研構(gòu)思階段。科研構(gòu)思階段是科研項(xiàng)目選題和申報(bào)立項(xiàng)的基礎(chǔ),它體現(xiàn)了科研項(xiàng)目團(tuán)隊(duì)的研究能力和科研項(xiàng)目的新穎性、前沿性。這一階段的數(shù)據(jù)活動(dòng)主要是數(shù)據(jù)資源采集。項(xiàng)目團(tuán)隊(duì)需要進(jìn)行大量科研數(shù)據(jù)搜集、確定項(xiàng)目干系人、科研項(xiàng)目選題及數(shù)據(jù)質(zhì)量規(guī)劃等前期研究相關(guān)工作,其中數(shù)據(jù)搜集來(lái)源主要依靠共享聯(lián)盟、主動(dòng)上傳和直接獲取等方式[7],采集內(nèi)容包括但不限于:相關(guān)科研文獻(xiàn)資料閱讀、國(guó)內(nèi)外發(fā)展方向與研究動(dòng)態(tài)跟蹤、技術(shù)可行性分析、市場(chǎng)調(diào)研等。
(2)科研實(shí)施階段。在科研實(shí)施階段,項(xiàng)目團(tuán)隊(duì)需要根據(jù)科研構(gòu)思階段完成的科研規(guī)劃來(lái)進(jìn)行學(xué)術(shù)論文撰寫、科學(xué)實(shí)驗(yàn)開展等相關(guān)科研活動(dòng)。這一階段是科研數(shù)據(jù)生產(chǎn)、發(fā)現(xiàn)的黃金時(shí)期,需要按照前期行動(dòng)中得到的數(shù)據(jù)準(zhǔn)則嚴(yán)格規(guī)范新建數(shù)據(jù),采取合適的數(shù)據(jù)處理工具對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,盡可能在早期獲得較高質(zhì)量的數(shù)據(jù)。
(3)成果整理階段。得到原始科研數(shù)據(jù)后,需借助數(shù)據(jù)挖掘、數(shù)據(jù)庫(kù)、數(shù)據(jù)質(zhì)量檢測(cè)識(shí)別等技術(shù)工具對(duì)數(shù)據(jù)進(jìn)行提取、整合和挖掘,得到更精準(zhǔn)的實(shí)驗(yàn)結(jié)果,并以此為根據(jù)撰寫科研成果。對(duì)科研數(shù)據(jù)進(jìn)行整合、分析與可視化,使其更直觀地反映事物之間的真實(shí)聯(lián)系是成果整理階段的工作重心。
(4)成果發(fā)表階段。經(jīng)過(guò)前期的努力與錘煉,項(xiàng)目團(tuán)隊(duì)的科研成果成形,經(jīng)修改、調(diào)整后進(jìn)入評(píng)議、審查和發(fā)表階段。這一階段主要由項(xiàng)目評(píng)審小組對(duì)科研成果質(zhì)量進(jìn)行評(píng)議,審核通過(guò)后將科研數(shù)據(jù)上傳至共享聯(lián)盟等科研數(shù)據(jù)共享平臺(tái),進(jìn)行數(shù)據(jù)的存檔和分享,同時(shí)科研項(xiàng)目團(tuán)隊(duì)在經(jīng)短暫休整后著手下一個(gè)科研項(xiàng)目的開展。
2.2? 科研項(xiàng)目周期中高??蒲袛?shù)據(jù)質(zhì)量問(wèn)題及原因
科研數(shù)據(jù)作為高??蒲许?xiàng)目周期中的重要組成,盡管其質(zhì)量控制的重要性不斷被學(xué)者強(qiáng)調(diào),但在高??蒲许?xiàng)目實(shí)踐中仍存在諸多問(wèn)題。數(shù)據(jù)錯(cuò)誤、不完整、不一致、不及時(shí)是高??蒲袛?shù)據(jù)質(zhì)量的主要問(wèn)題(見(jiàn)表1),其原因分為以下幾種:①科研數(shù)據(jù)來(lái)源復(fù)雜且類型多樣[6]??蒲许?xiàng)目團(tuán)隊(duì)成員大多來(lái)自不同學(xué)科,擁有不同學(xué)科背景,由此而生的科研數(shù)據(jù)來(lái)源復(fù)雜且未能有統(tǒng)一數(shù)據(jù)規(guī)范,數(shù)據(jù)孤島現(xiàn)象加劇,給數(shù)據(jù)的采集和整理帶來(lái)不小挑戰(zhàn)。②科研數(shù)據(jù)規(guī)模偏小。高??蒲许?xiàng)目團(tuán)隊(duì)產(chǎn)生的科研數(shù)據(jù)規(guī)模不大,但項(xiàng)目團(tuán)隊(duì)數(shù)量眾多,使得項(xiàng)目團(tuán)隊(duì)在數(shù)據(jù)發(fā)現(xiàn)中很難檢索到高質(zhì)量數(shù)據(jù)。③科研數(shù)據(jù)質(zhì)量控制意識(shí)不足。項(xiàng)目團(tuán)隊(duì)成員的數(shù)據(jù)質(zhì)量管理的習(xí)慣尚未養(yǎng)成,在科研數(shù)據(jù)搜集能力、數(shù)據(jù)共享意識(shí)、數(shù)據(jù)安全意識(shí)等方面還存在一定欠缺。
綜合科研項(xiàng)目周期中數(shù)據(jù)質(zhì)量問(wèn)題剖析和原因分析可知,要將無(wú)序、信息混亂的科研數(shù)據(jù)序化整合以供高??蒲许?xiàng)目團(tuán)隊(duì)重復(fù)利用,就必須針對(duì)存在的質(zhì)量問(wèn)題提出一套基于準(zhǔn)確性、完整性、一致性和及時(shí)性的可靠數(shù)據(jù)質(zhì)量評(píng)估標(biāo)準(zhǔn),構(gòu)建數(shù)據(jù)質(zhì)量工程的實(shí)踐架構(gòu)體系,實(shí)現(xiàn)科研數(shù)據(jù)的創(chuàng)新增值、科研項(xiàng)目管理的效率提升和項(xiàng)目團(tuán)隊(duì)質(zhì)量控制意識(shí)的提高。
2.3? 實(shí)施高??蒲袛?shù)據(jù)質(zhì)量控制的意義
結(jié)合高校科研數(shù)據(jù)自身特點(diǎn)、科研數(shù)據(jù)需求及科研環(huán)境等多方面情況,本文認(rèn)為在高??蒲许?xiàng)目周期中實(shí)施數(shù)據(jù)質(zhì)量控制的意義主要表現(xiàn)在以下幾個(gè)方面:
(1)促進(jìn)跨學(xué)科科研數(shù)據(jù)的組織與融合。由于科研項(xiàng)目研究的需要和項(xiàng)目成員自身學(xué)科背景的異質(zhì)性,科研數(shù)據(jù)普遍具有學(xué)科交叉和關(guān)聯(lián)的特點(diǎn),這一特征使得數(shù)據(jù)管理相關(guān)標(biāo)準(zhǔn)難以制定或缺乏普適性,造成科研數(shù)據(jù)利用率低下。在科研項(xiàng)目周期中實(shí)施數(shù)據(jù)質(zhì)量控制有助于實(shí)施數(shù)據(jù)多維度組織,從不同維度對(duì)科研項(xiàng)目周期中不同階段的科研數(shù)據(jù)進(jìn)行組織與分類,提高科研數(shù)據(jù)利用率。
(2)滿足高??蒲许?xiàng)目團(tuán)隊(duì)對(duì)高質(zhì)量數(shù)據(jù)的需求。對(duì)于高??蒲许?xiàng)目團(tuán)隊(duì)人員而言,有缺陷的、不完整的或誤導(dǎo)性的數(shù)據(jù)極有可能造成科學(xué)實(shí)驗(yàn)的失敗,造成科研成本急劇上升,甚至項(xiàng)目無(wú)法結(jié)題。而準(zhǔn)確、完整的科研數(shù)據(jù)在推動(dòng)科研項(xiàng)目進(jìn)程方面可起到事半功倍的效用,緩解項(xiàng)目團(tuán)隊(duì)的科研壓力,提高數(shù)據(jù)的研究和使用價(jià)值。
(3)融入第四科研范式環(huán)境的必然要求。全新的科研范式下科研數(shù)據(jù)成為科學(xué)研究的基礎(chǔ)性資源[8]。已有的科研數(shù)據(jù)是新研究的寶貴資產(chǎn),對(duì)已有數(shù)據(jù)的整合、挖掘和再利用為學(xué)術(shù)研究提供了一種新的資源[9]。由此而生的高密集科研大數(shù)據(jù)對(duì)傳統(tǒng)的科研數(shù)據(jù)管理造成了巨大沖擊,因此在科研項(xiàng)目周期中構(gòu)建高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)體系、提高科研數(shù)據(jù)質(zhì)量是融入第四科研范式環(huán)境的必然要求。
3? 科研項(xiàng)目周期中高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)體系
高??蒲袛?shù)據(jù)質(zhì)量控制是一項(xiàng)時(shí)間跨度長(zhǎng)、過(guò)程復(fù)雜的項(xiàng)目,在科研項(xiàng)目周期的不同階段,科研數(shù)據(jù)的來(lái)源、質(zhì)量要求和控制方法也不同。本研究從科研項(xiàng)目周期和質(zhì)量控制階段兩個(gè)角度構(gòu)建高校科研數(shù)據(jù)質(zhì)量控制架構(gòu)體系,如圖2所示。高??蒲许?xiàng)目周期中的相關(guān)數(shù)據(jù)活動(dòng)涉及項(xiàng)目規(guī)劃者、數(shù)據(jù)采集者等5類數(shù)據(jù)質(zhì)量角色,他們?cè)诖龠M(jìn)科研項(xiàng)目順利開展的同時(shí),從評(píng)估、認(rèn)知和行動(dòng)3個(gè)階段開展數(shù)據(jù)質(zhì)量控制活動(dòng),根據(jù)評(píng)估階段產(chǎn)生的科研數(shù)據(jù)質(zhì)量評(píng)估結(jié)果確定數(shù)據(jù)質(zhì)量問(wèn)題產(chǎn)生的根本原因,并從認(rèn)知、管理、流程3個(gè)視角制定科研數(shù)據(jù)質(zhì)量提高方案,從而形成科研數(shù)據(jù)質(zhì)量控制周期,不斷提高科研數(shù)據(jù)質(zhì)量。
3.1? 高??蒲袛?shù)據(jù)質(zhì)量控制過(guò)程中相關(guān)角色
科研項(xiàng)目周期中主要涉及項(xiàng)目規(guī)劃者、數(shù)據(jù)采集者、技術(shù)支持者、數(shù)據(jù)分析者和記錄管理人員這5類角色,他們與科研項(xiàng)目和質(zhì)量控制周期緊密相連,影響著科研數(shù)據(jù)的質(zhì)量和價(jià)值。
(1)項(xiàng)目規(guī)劃者。規(guī)劃者一般包括科研項(xiàng)目中的項(xiàng)目主持人、數(shù)據(jù)架構(gòu)師等人,主要在科研構(gòu)思階段收集科研項(xiàng)目數(shù)據(jù)需求,擬定科研項(xiàng)目數(shù)據(jù)管理規(guī)劃,將數(shù)據(jù)質(zhì)量提高融入項(xiàng)目設(shè)計(jì)和體系架構(gòu)中,以便減少風(fēng)險(xiǎn)、抓住機(jī)遇和合理地分配資源。
(2)數(shù)據(jù)采集者。主要是指科研項(xiàng)目團(tuán)隊(duì)中實(shí)施科研實(shí)驗(yàn)或搜集數(shù)據(jù)的人員,他們掌握著數(shù)據(jù)的最初來(lái)源,作為數(shù)據(jù)質(zhì)量角色的重要組成部分承擔(dān)捕獲、創(chuàng)建或維護(hù)數(shù)據(jù)的職責(zé)。
(3)技術(shù)支持者。主要指項(xiàng)目團(tuán)隊(duì)中數(shù)據(jù)庫(kù)管理員、IT支持者等人員,開發(fā)科研數(shù)據(jù)存儲(chǔ)平臺(tái),實(shí)施元數(shù)據(jù)管理并建立數(shù)據(jù)有效性規(guī)則,在邏輯上形成完整的資源體系,使科研數(shù)據(jù)在物理存儲(chǔ)上具有整體性和關(guān)聯(lián)性、在空間上具有較強(qiáng)的擴(kuò)展性。
(4)數(shù)據(jù)分析者。知識(shí)工作者在成果整理階段運(yùn)用數(shù)據(jù)挖掘、數(shù)據(jù)建模等數(shù)據(jù)分析技術(shù),對(duì)原始科研數(shù)據(jù)進(jìn)行深入分析,識(shí)別、檢測(cè)并清洗錯(cuò)誤、無(wú)效等低質(zhì)量數(shù)據(jù),對(duì)高質(zhì)量的數(shù)據(jù)進(jìn)行整理、分析,挖掘科研數(shù)據(jù)背后事物之間的潛在聯(lián)系,得出理想的科研成果。
(5)記錄管理人員。記錄管理人員在整個(gè)科研項(xiàng)目周期和質(zhì)量控制周期中負(fù)責(zé)采集科研數(shù)據(jù)與規(guī)范存檔記錄,并明確其在生命周期各階段的狀態(tài)。由于數(shù)據(jù)通常分散在項(xiàng)目團(tuán)隊(duì)不同成員手中,因此建立科研數(shù)據(jù)在每個(gè)周期階段的狀態(tài)、操作、環(huán)境信息等完整的文檔記錄更為重要,以便減少科研數(shù)據(jù)在項(xiàng)目周期中的流失,加強(qiáng)了科研數(shù)據(jù)的管理與控制[10]。
3.2? 數(shù)據(jù)質(zhì)量控制周期
數(shù)據(jù)質(zhì)量控制周期通過(guò)評(píng)估、溯因和行動(dòng)3個(gè)高層步驟,為討論和著手思考“控制”提供一種簡(jiǎn)單的方法[11]。在評(píng)估階段,需要評(píng)判當(dāng)前科研項(xiàng)目環(huán)境和數(shù)據(jù),并將其與需求和預(yù)期相比較;在溯因階段,了解數(shù)據(jù)和信息的真實(shí)狀態(tài)、對(duì)科研的影響和根本原因是重點(diǎn);前兩個(gè)階段的順利進(jìn)行為行動(dòng)階段打下堅(jiān)實(shí)基礎(chǔ),數(shù)據(jù)質(zhì)量管理人員在這一階段除了糾正當(dāng)前科研數(shù)據(jù)錯(cuò)誤之外,還需預(yù)防未來(lái)信息和科研數(shù)據(jù)質(zhì)量問(wèn)題。評(píng)估是溯因的關(guān)鍵,溯因?qū)⒁鹦袆?dòng),行動(dòng)又由定期評(píng)估來(lái)核實(shí),由此,科研數(shù)據(jù)質(zhì)量控制得以良性循環(huán)。
3.2.1? 評(píng)估階段
評(píng)估階段是整個(gè)質(zhì)量控制周期的基礎(chǔ),也是高??蒲许?xiàng)目周期得以持續(xù)的前提。在這一階段主要包括科研數(shù)據(jù)的需求和環(huán)境分析、定義數(shù)據(jù)質(zhì)量維度和數(shù)據(jù)質(zhì)量評(píng)估3個(gè)方面。有效的規(guī)劃是確保任何科研項(xiàng)目成功實(shí)施必不可少的要素,對(duì)科研數(shù)據(jù)的需求和環(huán)境進(jìn)行全面分析將使科研項(xiàng)目實(shí)施真正做到有的放矢和更有針對(duì)性;根據(jù)科研項(xiàng)目周期中的數(shù)據(jù)質(zhì)量問(wèn)題并結(jié)合以往研究,定義科研數(shù)據(jù)質(zhì)量維度包括正確性、完整性、一致性和及時(shí)性4個(gè)維度,統(tǒng)一規(guī)范科研項(xiàng)目周期中數(shù)據(jù)質(zhì)量控制的標(biāo)準(zhǔn)和測(cè)量方法,以便后續(xù)數(shù)據(jù)質(zhì)量評(píng)估的順利開展。
3.2.2? 溯因階段
找出科研數(shù)據(jù)質(zhì)量問(wèn)題的根本原因并有針對(duì)性地制定提高方案是溯因階段的重中之重。數(shù)據(jù)管理人員收集所有與低數(shù)據(jù)質(zhì)量相關(guān)的背景信息,追蹤和回溯科研數(shù)據(jù)在科研項(xiàng)目周期里流通的路徑并進(jìn)行捕獲和比較,對(duì)質(zhì)量問(wèn)題進(jìn)行優(yōu)先級(jí)分類,最終確定數(shù)據(jù)質(zhì)量問(wèn)題的根本原因。若根本原因引起的質(zhì)量問(wèn)題超出了預(yù)先的數(shù)據(jù)質(zhì)量評(píng)估維度,則需返回評(píng)估階段重新對(duì)數(shù)據(jù)需求和環(huán)境進(jìn)行分析;若根本原因在預(yù)計(jì)質(zhì)量問(wèn)題范圍內(nèi),需要確定根本原因發(fā)生的階段,提出解決根本原因的具體建議,并對(duì)若干建議劃分優(yōu)先等級(jí),確定質(zhì)量提高方案。
3.2.3? 行動(dòng)階段
行動(dòng)階段的目的是糾正當(dāng)前科研數(shù)據(jù)錯(cuò)誤,同時(shí)采取手段預(yù)防未來(lái)科研數(shù)據(jù)錯(cuò)誤。由溯因階段輸入至行動(dòng)階段的質(zhì)量提高方案主要包括質(zhì)量差距模型、企業(yè)架構(gòu)模型和流程分析3種模式。從認(rèn)知視角來(lái)看,引入質(zhì)量差距模型,認(rèn)知并分析期望的科研數(shù)據(jù)質(zhì)量和實(shí)際感知的科研數(shù)據(jù)質(zhì)量之間的差距,對(duì)于正確把握質(zhì)量問(wèn)題產(chǎn)生的根本原因具有關(guān)鍵作用;從管理視角來(lái)看,隨著跨學(xué)科趨勢(shì)的增強(qiáng),高??蒲许?xiàng)目更強(qiáng)調(diào)跨部門性的協(xié)同合作,在企業(yè)架構(gòu)的模型上實(shí)施高??蒲袛?shù)據(jù)質(zhì)量控制能從科研團(tuán)隊(duì)層面為數(shù)據(jù)質(zhì)量控制活動(dòng)提供保障;從流程視角來(lái)看,高??蒲袛?shù)據(jù)質(zhì)量水平還與項(xiàng)目周期中各個(gè)環(huán)節(jié)息息相關(guān),因此本研究還引入流程分析,從微觀角度有計(jì)劃、有組織地把控高??蒲袛?shù)據(jù)質(zhì)量。這3個(gè)視角提出的科研數(shù)據(jù)質(zhì)量改進(jìn)流程和數(shù)據(jù)糾正方法,為科研項(xiàng)目周期中高??蒲袛?shù)據(jù)質(zhì)量控制提供了理論思路和實(shí)踐基礎(chǔ)。
4? 科研項(xiàng)目周期中高??蒲袛?shù)據(jù)質(zhì)量控制模式分析
為確保數(shù)據(jù)管理方可以自始至終控制科研項(xiàng)目周期中的科研數(shù)據(jù)質(zhì)量,在產(chǎn)生實(shí)質(zhì)影響前盡早識(shí)別、排序和修復(fù)數(shù)據(jù)缺陷,本文基于高校科研數(shù)據(jù)質(zhì)量控制架構(gòu)體系的三大階段,提出了科研項(xiàng)目周期中高??蒲袛?shù)據(jù)質(zhì)量控制總模式,如圖3所示。該模式闡述了在高校科研數(shù)據(jù)質(zhì)量控制架構(gòu)體系下數(shù)據(jù)質(zhì)量控制的具體模式及流程。評(píng)估階段和溯因階段是在全項(xiàng)目周期中實(shí)時(shí)監(jiān)測(cè)科研活動(dòng)中的數(shù)據(jù)質(zhì)量,依據(jù)科研數(shù)據(jù)質(zhì)量規(guī)則及維度對(duì)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估后,找出數(shù)據(jù)質(zhì)量問(wèn)題并根據(jù)問(wèn)題的性質(zhì)、出現(xiàn)的階段進(jìn)行分類編號(hào)。在行動(dòng)階段,數(shù)據(jù)管理人員將從認(rèn)知視角出發(fā),引入質(zhì)量差距分析模型,將實(shí)際的數(shù)據(jù)質(zhì)量與項(xiàng)目團(tuán)隊(duì)期望的數(shù)據(jù)質(zhì)量進(jìn)行比較,進(jìn)行質(zhì)量差距分析,從而深入測(cè)量、嚴(yán)密評(píng)判各類數(shù)據(jù)質(zhì)量問(wèn)題并找到根本原因,為科研團(tuán)隊(duì)制定數(shù)據(jù)質(zhì)量控制決策提供關(guān)鍵依據(jù);從管理視角來(lái)看,數(shù)據(jù)管理人員根據(jù)基于質(zhì)量差距模型的科研數(shù)據(jù)質(zhì)量控制模式排查出來(lái)的質(zhì)量問(wèn)題根本原因,將數(shù)據(jù)質(zhì)量控制整合為企業(yè)架構(gòu)的固有組件,從宏觀上提出解決科研項(xiàng)目中跨學(xué)科、跨部門的數(shù)據(jù)質(zhì)量控制和協(xié)同監(jiān)管問(wèn)題的方法,為科研項(xiàng)目周期中的高校科研數(shù)據(jù)質(zhì)量控制活動(dòng)提供理論支撐和數(shù)據(jù)治理規(guī)范;最后,數(shù)據(jù)管理人員從流程視角上對(duì)整個(gè)科研項(xiàng)目周期進(jìn)行數(shù)據(jù)質(zhì)量問(wèn)題監(jiān)測(cè)與跟蹤,從微觀層面確保問(wèn)題能得到及時(shí)有效的處置,并提高項(xiàng)目流程管理效率?,F(xiàn)對(duì)各視角下數(shù)據(jù)質(zhì)量控制模式進(jìn)行剖析。
4.1? 基于質(zhì)量差距模型的高??蒲袛?shù)據(jù)質(zhì)量控制模式
營(yíng)銷學(xué)家A. Parasuraman和L. Berry等人提出服務(wù)質(zhì)量差距模型,通過(guò)對(duì)顧客感知的實(shí)際服務(wù)質(zhì)量與期望服務(wù)質(zhì)量的差距比較來(lái)分析存在的質(zhì)量問(wèn)題[12],J. R. Evans提出“客戶驅(qū)動(dòng)質(zhì)量”方法,主張從需求的角度提升數(shù)據(jù)質(zhì)量[13]。在高??蒲许?xiàng)目周期中,對(duì)科研數(shù)據(jù)管理人員和項(xiàng)目團(tuán)隊(duì)進(jìn)行數(shù)據(jù)質(zhì)量差距分析是發(fā)現(xiàn)數(shù)據(jù)質(zhì)量根本原因、實(shí)現(xiàn)數(shù)據(jù)質(zhì)量有效提高的關(guān)鍵前提。質(zhì)量差距分析模型主要是通過(guò)項(xiàng)目團(tuán)隊(duì)期望的數(shù)據(jù)質(zhì)量和其實(shí)際感知的數(shù)據(jù)質(zhì)量的差距,進(jìn)行根本原因分析,從而精準(zhǔn)修復(fù)數(shù)據(jù)質(zhì)量問(wèn)題,實(shí)現(xiàn)提高科研數(shù)據(jù)質(zhì)量的目的,具體如圖4所示:
影響項(xiàng)目團(tuán)隊(duì)成員期望的數(shù)據(jù)質(zhì)量因素一般包括歷史數(shù)據(jù)的可靠性、科研機(jī)構(gòu)的宣傳力度以及科研數(shù)據(jù)的需求程度等,這些因素的相互作用構(gòu)成了科研項(xiàng)目周期中項(xiàng)目團(tuán)隊(duì)對(duì)科研數(shù)據(jù)質(zhì)量的期望指數(shù);而項(xiàng)目團(tuán)隊(duì)實(shí)際感知到的數(shù)據(jù)質(zhì)量的形成來(lái)源于數(shù)據(jù)采集質(zhì)量的可靠性、數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)制定的科學(xué)性、對(duì)科研數(shù)據(jù)的分析能力和團(tuán)隊(duì)成員的數(shù)據(jù)素養(yǎng)。數(shù)據(jù)質(zhì)量控制人員通過(guò)用戶調(diào)查法、問(wèn)卷調(diào)查法多種方式了解這兩者之間的差距,并根據(jù)調(diào)查結(jié)果進(jìn)行質(zhì)量差距分析。質(zhì)量差距分析內(nèi)容由數(shù)據(jù)質(zhì)量期望差距、數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)差距、數(shù)據(jù)質(zhì)量傳遞差距、溝通質(zhì)量差距和整體感知質(zhì)量差距構(gòu)成,其中整體感知質(zhì)量差距是整個(gè)模型分析的關(guān)鍵,前4個(gè)差距的大小直接影響著科研項(xiàng)目團(tuán)隊(duì)感知的科研數(shù)據(jù)質(zhì)量差距的大小,因而在進(jìn)行質(zhì)量控制時(shí)應(yīng)盡量縮小前4個(gè)差距。數(shù)據(jù)控制人員通過(guò)質(zhì)量差距分析列出來(lái)的差距清單,進(jìn)行快速配置測(cè)試或查詢,記錄下可能需要糾正的數(shù)據(jù)集,進(jìn)行質(zhì)量根本原因分析。識(shí)別錯(cuò)誤源和理解錯(cuò)誤的引入是根本原因分析的重點(diǎn),主要通過(guò)在整個(gè)科研項(xiàng)目周期中重復(fù)識(shí)別數(shù)據(jù)“進(jìn)時(shí)有效、出時(shí)無(wú)效”的處理階段,精準(zhǔn)定位數(shù)據(jù)活動(dòng)中數(shù)據(jù)錯(cuò)誤源的位置,在此基礎(chǔ)上更進(jìn)一步分析數(shù)據(jù)質(zhì)量缺陷造成的原因,了解引入錯(cuò)誤的方式。將數(shù)據(jù)質(zhì)量原因按優(yōu)先級(jí)分類,有助于將業(yè)務(wù)價(jià)值與高質(zhì)量數(shù)據(jù)關(guān)聯(lián)起來(lái),同時(shí)還能發(fā)現(xiàn)少量在評(píng)估階段疏漏的質(zhì)量問(wèn)題,促進(jìn)數(shù)據(jù)質(zhì)量控制體系的改進(jìn)。若問(wèn)題原因在預(yù)計(jì)范圍內(nèi),則需要采取數(shù)據(jù)糾正與清理、根本原因消除、監(jiān)測(cè)和預(yù)防等修復(fù)質(zhì)量方法,以提高科研數(shù)據(jù)質(zhì)量。
4.2? 基于企業(yè)架構(gòu)模型的高??蒲袛?shù)據(jù)質(zhì)量控制模式
高??蒲许?xiàng)目團(tuán)隊(duì)成員大多來(lái)自于不同院系,學(xué)科背景的異質(zhì)性使得科研數(shù)據(jù)內(nèi)容綜合性強(qiáng)、跨學(xué)科性強(qiáng),數(shù)據(jù)難以分類、有序儲(chǔ)存;同時(shí)高校科研數(shù)據(jù)質(zhì)量控制需要多個(gè)部門共同協(xié)作,具有跨部門性,因此從管理角度來(lái)說(shuō)還需要構(gòu)建一套適應(yīng)高校科研數(shù)據(jù)特征的數(shù)據(jù)質(zhì)量控制模式。企業(yè)架構(gòu)是一種按照一定系統(tǒng)設(shè)計(jì)原則進(jìn)行組織的理論框架,在信息資源集成[14]、數(shù)據(jù)治理[15]等方面得到廣泛應(yīng)用,因此可將企業(yè)架構(gòu)模型引入高??蒲袛?shù)據(jù)質(zhì)量控制模式。企業(yè)架構(gòu)的內(nèi)容一般包括業(yè)務(wù)架構(gòu)、應(yīng)用架構(gòu)、數(shù)據(jù)架構(gòu)和技術(shù)架構(gòu)4層[16],將其應(yīng)用于科研數(shù)據(jù)質(zhì)量工程實(shí)踐中,具體如圖5所示。
技術(shù)層是整個(gè)企業(yè)架構(gòu)模式的基礎(chǔ),涉及到網(wǎng)絡(luò)傳輸基本服務(wù)、IT基礎(chǔ)設(shè)施設(shè)備、大數(shù)據(jù)處理技術(shù)和智力支持等要素。其中網(wǎng)絡(luò)傳輸和IT基礎(chǔ)設(shè)施設(shè)備為支撐整個(gè)科研數(shù)據(jù)活動(dòng)和質(zhì)量控制活動(dòng)提供了保障,大數(shù)據(jù)處理技術(shù)是數(shù)據(jù)密集型科研環(huán)境下獲取高質(zhì)量數(shù)據(jù)不可或缺的支撐點(diǎn),為數(shù)據(jù)質(zhì)量控制提供強(qiáng)大的技術(shù)支持,包括數(shù)據(jù)關(guān)聯(lián)分析、用戶行為智能預(yù)測(cè)、知識(shí)圖譜分析、聚類分析等,可實(shí)現(xiàn)對(duì)原始科研數(shù)據(jù)的有效處理。
數(shù)據(jù)層具體可分為數(shù)據(jù)采集、數(shù)據(jù)質(zhì)量控制和數(shù)據(jù)存儲(chǔ)3個(gè)方面,該層面主要是為科研項(xiàng)目提供多維化的科研數(shù)據(jù)來(lái)源,并運(yùn)用數(shù)據(jù)處理工具和技術(shù)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和規(guī)范化存儲(chǔ)。數(shù)據(jù)采集方面,凡是能滿足項(xiàng)目團(tuán)隊(duì)科研需要的資源都成為數(shù)據(jù)采集的對(duì)象,這些多維化數(shù)據(jù)來(lái)源主要包括共享聯(lián)盟資源、網(wǎng)絡(luò)資源和項(xiàng)目歷史資源,項(xiàng)目團(tuán)隊(duì)根據(jù)科研需要從中提取知識(shí),并將其應(yīng)用到實(shí)際科研活動(dòng)之中。但鑒于數(shù)據(jù)質(zhì)量的良莠不齊,應(yīng)當(dāng)按照數(shù)據(jù)質(zhì)量控制周期的循環(huán)步驟對(duì)采集的數(shù)據(jù)進(jìn)行質(zhì)量控制,經(jīng)評(píng)估后確定數(shù)據(jù)質(zhì)量根本原因、確定質(zhì)量提高方案,從而預(yù)防和糾正數(shù)據(jù)錯(cuò)誤,完成數(shù)據(jù)預(yù)處理工作。同時(shí),還應(yīng)設(shè)置必要的數(shù)據(jù)存儲(chǔ)規(guī)范,對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一格式化后再存檔至科研數(shù)據(jù)存儲(chǔ)平臺(tái)。
應(yīng)用層主要是根據(jù)業(yè)務(wù)層和數(shù)據(jù)層提供的數(shù)據(jù)質(zhì)量控制方案進(jìn)一步提高數(shù)據(jù)質(zhì)量,即對(duì)科研數(shù)據(jù)進(jìn)行提取、整合和深入挖掘。其中數(shù)據(jù)提取是指對(duì)科研數(shù)據(jù)進(jìn)行選擇和清洗,保證原始數(shù)據(jù)的準(zhǔn)確性和及時(shí)性;數(shù)據(jù)整合是指對(duì)數(shù)據(jù)進(jìn)行過(guò)濾和合并,降低數(shù)據(jù)的冗余性;數(shù)據(jù)挖掘是通過(guò)挖掘模式和算法應(yīng)用對(duì)科研數(shù)據(jù)下的潛在知識(shí)內(nèi)容進(jìn)行挖掘和分析,最終得到理想的科研數(shù)據(jù)成果。
業(yè)務(wù)層則是為提高科研項(xiàng)目周期中的數(shù)據(jù)質(zhì)量而形成的集成視窗,對(duì)整個(gè)項(xiàng)目中的數(shù)據(jù)活動(dòng)進(jìn)行實(shí)時(shí)監(jiān)測(cè)和維護(hù)。除此之外,還需在科研構(gòu)思階段進(jìn)行需求和環(huán)境分析,如收集數(shù)據(jù)需求、制定數(shù)據(jù)規(guī)范和數(shù)據(jù)管理規(guī)劃等,同時(shí)制定適用于整個(gè)架構(gòu)的科研數(shù)據(jù)標(biāo)準(zhǔn),為科研數(shù)據(jù)質(zhì)量的評(píng)估、控制提供有效且統(tǒng)一的尺度。
4.3? 基于流程分析的高校數(shù)據(jù)質(zhì)量控制模式
科研數(shù)據(jù)質(zhì)量包括過(guò)程數(shù)據(jù)質(zhì)量和結(jié)果數(shù)據(jù)質(zhì)量,結(jié)果質(zhì)量的好壞反映在科研項(xiàng)目過(guò)程的各個(gè)環(huán)節(jié)上,只有改善過(guò)程數(shù)據(jù)質(zhì)量才能促使結(jié)果質(zhì)量的提高。因此,需要對(duì)科研項(xiàng)目周期中的高??蒲袛?shù)據(jù)質(zhì)量控制進(jìn)行流程分析,從微觀的角度有計(jì)劃、有組織、持續(xù)地進(jìn)行質(zhì)量改進(jìn),達(dá)到期望數(shù)據(jù)質(zhì)量的要求,如圖6所示。
在科研構(gòu)思階段,數(shù)據(jù)資源采集、需求環(huán)境分析和質(zhì)量評(píng)估標(biāo)準(zhǔn)的確定是規(guī)劃者和記錄管理人員的重點(diǎn)工作。數(shù)據(jù)資源的采集來(lái)源于科研數(shù)據(jù)共享平臺(tái),采集過(guò)程中從源頭上保證數(shù)據(jù)的準(zhǔn)確性與完整性是數(shù)據(jù)質(zhì)量控制的重點(diǎn);需求環(huán)境分析中主要是了解項(xiàng)目團(tuán)隊(duì)的科研數(shù)據(jù)質(zhì)量需求、前沿性分析等,此時(shí)科研數(shù)據(jù)的準(zhǔn)確性和及時(shí)性是規(guī)劃者的主要需求;在制定數(shù)據(jù)質(zhì)量評(píng)估標(biāo)準(zhǔn)時(shí),規(guī)劃者和記錄管理人員需要充分考慮數(shù)據(jù)質(zhì)量需求,確保標(biāo)準(zhǔn)的可靠性和科學(xué)性。
在科研實(shí)施階段,生產(chǎn)者通過(guò)科研活動(dòng)產(chǎn)生原始實(shí)驗(yàn)數(shù)據(jù),由技術(shù)支持者根據(jù)數(shù)據(jù)質(zhì)量評(píng)估結(jié)果,運(yùn)用大數(shù)據(jù)處理技術(shù)進(jìn)行數(shù)據(jù)預(yù)處理,包括科研數(shù)據(jù)去重、糾正錯(cuò)誤數(shù)據(jù)、統(tǒng)一存儲(chǔ)格式等內(nèi)容,得到符合科研數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范的結(jié)構(gòu)化數(shù)據(jù)。這一階段中嚴(yán)謹(jǐn)科學(xué)的科研活動(dòng)是影響后續(xù)數(shù)據(jù)質(zhì)量的根本要素,數(shù)據(jù)預(yù)處理的正確操作是提高科研數(shù)據(jù)質(zhì)量的基本前提。
在成果整理階段,從數(shù)據(jù)發(fā)現(xiàn)上升到知識(shí)發(fā)現(xiàn)、從數(shù)據(jù)采集到數(shù)據(jù)創(chuàng)造是這一階段的主旋律。數(shù)據(jù)的提取、整合和挖掘依賴于技術(shù)支持者對(duì)數(shù)據(jù)處理技術(shù)的嫻熟掌控和知識(shí)工作者的數(shù)據(jù)素養(yǎng),兩者的協(xié)同作用才能得到更精準(zhǔn)的科研實(shí)驗(yàn)結(jié)果,才能更深入地揭示事物間潛在關(guān)聯(lián)和規(guī)律。
在成果發(fā)表階段,知識(shí)工作者對(duì)成果整理階段的科研數(shù)據(jù)進(jìn)行知識(shí)整合與挖掘,得到論文報(bào)告基本雛形。剔除部分偏離正常值的數(shù)據(jù),對(duì)科研成果進(jìn)行適度修改調(diào)整后存入科研數(shù)據(jù)存儲(chǔ)庫(kù)中。科研數(shù)據(jù)存儲(chǔ)庫(kù)將數(shù)據(jù)結(jié)構(gòu)化,保證關(guān)聯(lián)數(shù)據(jù)的一致性,并實(shí)時(shí)更新數(shù)據(jù),將高質(zhì)量的科研成果存檔、共享至科研數(shù)據(jù)共享平臺(tái)。
5? 結(jié)論
大數(shù)據(jù)時(shí)代下,科學(xué)研究第四范式歸根結(jié)底是對(duì)海量數(shù)據(jù)的挖掘與控制[6],科研數(shù)據(jù)的質(zhì)量控制也就成了科研人員根據(jù)科研數(shù)據(jù)進(jìn)行深入研究的關(guān)鍵所在。本研究從科研項(xiàng)目周期內(nèi)涵及相關(guān)數(shù)據(jù)活動(dòng)闡述了引入數(shù)據(jù)質(zhì)量控制的必要性,并從科研項(xiàng)目周期和質(zhì)量控制階段兩個(gè)角度構(gòu)建高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)體系,在深入剖析體系中各部分的功能和特點(diǎn)基礎(chǔ)上,從認(rèn)知、管理和流程三大視角構(gòu)建了各有側(cè)重又綜合協(xié)同的數(shù)據(jù)質(zhì)量控制模式及流程,為高??蒲许?xiàng)目周期中的科研數(shù)據(jù)質(zhì)量控制提供了理論支撐和有效途徑。
參考文獻(xiàn):
[1] DAMA國(guó)際.DAMA數(shù)據(jù)管理知識(shí)體系指南[M]. 北京:清華大學(xué)出版社, 2012:4-9.
[2] 包冬梅, 范穎捷, 李鳴.高校圖書館數(shù)據(jù)治理及其框架[J]. 圖書情報(bào)工作, 2015, 59(18):134-141.
[3] 屈文建, 唐晶, 陳旦芝.高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)與機(jī)制研究[J]. 情報(bào)理論與實(shí)踐, 2018, 41(11):45-50.
[4] 馬波, 李宇.歐美國(guó)家高校圖書館科研數(shù)據(jù)管理實(shí)踐及啟示[J]. 圖書館工作與研究, 2018(8):17-24.
[5] 徐慧芳.中國(guó)科研數(shù)據(jù)管理實(shí)踐現(xiàn)狀調(diào)研及對(duì)圖書館的啟示[J]. 圖書館學(xué)研究, 2019(17):45-53.
[6] 陸玉泉. 大數(shù)據(jù)時(shí)代高??蒲袛?shù)據(jù)服務(wù)模式與建設(shè)路徑研究[D]. 南京: 南京航空航天大學(xué), 2017.
[7] 熊文龍, 李瑞婻.基于科學(xué)數(shù)據(jù)管理的圖書館數(shù)據(jù)服務(wù)研究[J]. 圖書情報(bào)工作, 2014, 58(22):48-53.
[8] 孫繼周.E - Science 環(huán)境下高校圖書館開展科學(xué)數(shù)據(jù)管理與共享的路徑研究[J]. 圖書館, 2016(5): 66-71.
[9] MARCHIONINI G, 楊冠燦, 蘆昆.科研數(shù)據(jù)管理: 保障數(shù)據(jù)質(zhì)量, 促進(jìn) iSchools 新科學(xué)研究[J]. 圖書情報(bào)知識(shí), 2013(4): 4-9.
[10] 丁寧, 馬浩琴.國(guó)外高??茖W(xué)數(shù)據(jù)生命周期管理模型比較研究及借鑒[J]. 圖書情報(bào)工作, 2013, 57(6):18-22.
[11] MCGILVRAY D.數(shù)據(jù)質(zhì)量工程實(shí)踐[M]. 曹建軍, 刁興春, 張健美, 譯.北京: 電子工業(yè)出版社, 2010.
[12] MBA 智庫(kù)百科.諾伯特維納的控制[EB/OL]. [2012-04-14]. http//wiki.mbalib.com/wiki/Control_theory.
[13] EVANS J R, LINDSAY W M. The management and control of quality[M]. 5th ed.St.Paul:West, 2002.
[14] 屈文建, 周小渝, 孟書榮.基于企業(yè)架構(gòu)的數(shù)字圖書館科技信息資源集成服務(wù)研究[J]. 圖書館學(xué)研究, 2017(13):32-39.
[15] 郭路生, 劉春年.大數(shù)據(jù)時(shí)代應(yīng)急數(shù)據(jù)質(zhì)量治理研究[J]. 情報(bào)理論與實(shí)踐, 2016, 39(11):101-105.
[16] CIOCouncil. Federal Enterprise Architecture Framework [EB/OL]. [2016-02-03]. http://www.enterprise-architecture.info/Images/Documents/Federal%20EA%20Framework.pdf.
作者貢獻(xiàn)說(shuō)明:
唐? 晶:提出研究思路,設(shè)計(jì)研究方案,撰寫論文;
屈文建:提出研究思路,指導(dǎo)論文修改。
Abstract: [Purpose/significance] This paper aims to provide an effective control approach and method for the data quality control in the scientific research project cycle of universities. [Method/process] It built a data quality and quality control architecture system around the scientific research project cycle and the data quality control cycle, and implemented data quality control from the perspectives of cognition, management, and process under this system, and introduced quality gap models and companies. Control methods such as architecture model and process analysis analyzed the data quality control mechanism in the scientific research project cycle of universities. [Result/conclusion] A scientific research data quality control architecture system and a data quality control model suitable for the scientific research project cycle were established, which provided theoretical support for the quality control of scientific research data in universities.
Keywords: data quality? ? research project cycle? ? research environment? ? quality gap model? ? enterprise architecture model