[摘 要]通過對吉林省情數(shù)據(jù)庫建設(shè)發(fā)展?fàn)顩r的研究,指出了建設(shè)吉林省情數(shù)據(jù)庫的重要性和必要性。結(jié)合吉林省情數(shù)據(jù)庫建設(shè),對建設(shè)省情數(shù)據(jù)庫的意義、省情數(shù)據(jù)庫建設(shè)的原則、省情數(shù)據(jù)庫的收錄范圍、數(shù)據(jù)的采集,以及省情數(shù)據(jù)庫的質(zhì)量控制和技術(shù)保障等進(jìn)行了分析和探討。
[關(guān)鍵詞]省情;數(shù)據(jù)庫;數(shù)據(jù)庫建設(shè)
[中圖分類號]G250 [文獻(xiàn)標(biāo)識碼]A [文章編號]1008-0821(2010)05-0070-03
Discussion on the Construction Plan of Database of Jilin Provincial ConditionsYu Chunyan
(Library,Chinese Communist Party Jilin Provincial Party Committee Party School,Changchun 130012,China)
[Abstract]This paper discussed the development situation of Jilin provincial conditions database,pointed out the importance and necessity of construction this database.This article also discussed the meaning,the principles,the collecting scope,the data acquisition,quality control and technical support of constructing the database of Jilin provincial conditions.
[Keywords]provincial conditions;database;database construction
1 省情數(shù)據(jù)庫建設(shè)的發(fā)展?fàn)顩r研究
11 理論方面的研究
目前關(guān)于數(shù)據(jù)庫建設(shè)方面的理論成果無論著作還是論文都很多,而關(guān)于省情數(shù)據(jù)庫建設(shè)的研究成果卻很少,通過各種方法能檢索到的論文僅10篇左右。早期的論文發(fā)表于2000年前后,這些文章論述的內(nèi)容很多都是傳統(tǒng)的工作方式——手工操作的內(nèi)容,現(xiàn)在已顯得過時。最新的文章是江西省委黨校劉加夫、黃勇于2007年1月發(fā)表的《加強(qiáng)省情數(shù)據(jù)庫建設(shè)的方略研究》,該文較以前的文章論述的全面、深入,但是宏觀的論述較多,操作的指導(dǎo)性還不是很強(qiáng)。而這方面的著作還沒有出版過,課題也是寥寥無幾。可見,目前全國各地的省情數(shù)據(jù)庫建設(shè)都是在摸著石頭過河,沒有系統(tǒng)完備的理論做指導(dǎo)。因此,有必要加強(qiáng)省情數(shù)據(jù)庫建設(shè)的理論研究。
12 實踐方面的研究
隨著社會的發(fā)展,信息化傳播平臺的進(jìn)步,省情數(shù)據(jù)庫建設(shè)也在全國范圍內(nèi)展開。我國省情數(shù)據(jù)庫的發(fā)展建設(shè),大致可以分為兩個階段:一是初步發(fā)展階段。自上個世紀(jì)80年代末期,全國有少數(shù)單位開始嘗試性地利用手中掌握的一些省情文獻(xiàn)資料,開展建庫工作,工作方式多為手工操作,成果多為卡片式的題錄,但同時已經(jīng)開始了計算機(jī)數(shù)據(jù)庫管理系統(tǒng)的設(shè)計工作。較早的單位有:福建省委黨校、四川省史志辦等。到了90年代,省情文獻(xiàn)資料數(shù)字化建庫工作已經(jīng)開展起來,但成果內(nèi)容單薄,多為題錄庫,極少有全文庫和深加工的二、三次文獻(xiàn)信息,更新率極低,且僅在單位局域網(wǎng)上發(fā)布,往往是在政府網(wǎng)站或在別的門戶網(wǎng)站開辟一個小欄目或?qū)n},而不是以完整數(shù)據(jù)庫的形式出現(xiàn)。二是快速發(fā)展階段。自本世紀(jì)初開始,全國各省市區(qū)所屬的許多相關(guān)單位都紛紛在建設(shè)網(wǎng)站的同時,開展省情數(shù)據(jù)庫的建設(shè)工作,尤其近幾年得到了快速發(fā)展。目前全國大部分省(市、區(qū))都已建有獨(dú)立的省情網(wǎng)站。在這些省情網(wǎng)站或大的省情信息窗口中,都有一批制作精美、檢索便利、結(jié)構(gòu)比較合理、內(nèi)容相當(dāng)豐富的大型省情數(shù)據(jù)庫作支撐。比較先進(jìn)的如山東省情網(wǎng)、廣東省情調(diào)網(wǎng)等。各省市的政務(wù)網(wǎng)中都有省情方面的信息,一些大型圖書館和學(xué)校也建立起了省情特色數(shù)據(jù)庫。
我省省情數(shù)據(jù)庫的建設(shè)起步于上個世紀(jì)末本世紀(jì)初,經(jīng)過幾年努力,已經(jīng)達(dá)到一定規(guī)模,在網(wǎng)上有相當(dāng)?shù)姆植肌W钪匾木W(wǎng)站是吉林省情網(wǎng)。吉林省人民政府網(wǎng)及各市州政府網(wǎng)站上,也有豐富的省情信息資源。除此之外,我省的一些單位還在自己的網(wǎng)站上建有省情數(shù)據(jù)庫,如吉林省圖書館、等。但總體上看,這些網(wǎng)站和數(shù)據(jù)庫所體現(xiàn)的內(nèi)容大多是我省的部門或行業(yè)指導(dǎo)信息及應(yīng)用性信息,而對研究我省社科理論前沿問題、經(jīng)濟(jì)社會發(fā)展中的各種熱點(diǎn)問題的理論性和研究性文獻(xiàn)信息資料收錄的不多,這樣就不能更好地為我省社科理論研究服務(wù)。
從以上情況可見,加強(qiáng)省情數(shù)據(jù)庫的建設(shè)和研究刻不容緩。
2 建設(shè)省情數(shù)據(jù)庫的意義
省情,是一個省制定經(jīng)濟(jì)社會發(fā)展戰(zhàn)略的客觀依據(jù),對省情特點(diǎn)認(rèn)識越深刻,研究制定的發(fā)展戰(zhàn)略就越具有科學(xué)性。省情數(shù)據(jù)庫建設(shè),就是利用現(xiàn)代信息技術(shù)和計算機(jī)網(wǎng)絡(luò),將有關(guān)省情的文獻(xiàn)資料有序地組織起來,形成以便于人們查詢、檢索的數(shù)字集合體。隨著改革開放的不斷深入發(fā)展,省情文獻(xiàn)資料在信息資源總體系中的作用日益明顯,它對特定地域經(jīng)濟(jì)社會發(fā)展的咨詢決策作用,經(jīng)濟(jì)、社會、文化建設(shè)的推動作用日益增強(qiáng)。因此,搞好省情數(shù)據(jù)庫的開發(fā)建設(shè)具有十分重要的意義。
黨中央、國務(wù)院做出振興東北老工業(yè)基地的決定以來,吉林振興已經(jīng)走上了又好又快的軌道。但是我們還應(yīng)看到,伴隨我省經(jīng)濟(jì)社會的快速發(fā)展,老工業(yè)基地振興中還存在許多突出矛盾和問題,這不僅需要領(lǐng)導(dǎo)決策者認(rèn)真思考,也是我省理論界應(yīng)該研究的重點(diǎn)問題。由于吉林省情數(shù)據(jù)庫收錄能真實全面地記錄我省發(fā)展的各種數(shù)據(jù),同時收錄研究我省經(jīng)濟(jì)社會發(fā)展的理論性文獻(xiàn)資料,因此,能為我省的社科理論界提供有價值的服務(wù),為各級領(lǐng)導(dǎo)決策提供參考和依據(jù),進(jìn)而促進(jìn)我省經(jīng)濟(jì)社會的發(fā)展。
2008年9月新頒布的《中國共產(chǎn)黨黨校工作條例》規(guī)定,中國共產(chǎn)黨黨校是在黨委直接領(lǐng)導(dǎo)下培養(yǎng)黨員領(lǐng)導(dǎo)干部和理論干部的學(xué)校,是黨委的重要部門,是培訓(xùn)輪訓(xùn)黨員領(lǐng)導(dǎo)干部的主渠道,是黨的哲學(xué)社會科學(xué)研究機(jī)構(gòu)。所以,研究哲學(xué)社會科學(xué)領(lǐng)域重大理論和現(xiàn)實問題是黨校教學(xué)科研的中心工作。2009年中共吉林省委黨校已經(jīng)把研究省情、研究我省經(jīng)濟(jì)社會發(fā)展中出現(xiàn)的問題作為我校教學(xué)科研的中心工作。圖書館是我校的文獻(xiàn)信息中心,是為教學(xué)科研服務(wù)的學(xué)術(shù)性機(jī)構(gòu)。圖書館開展省情數(shù)據(jù)庫研究和建設(shè),能夠更好地配合學(xué)校的中心工作,對我校學(xué)科建設(shè)和教學(xué)科研工作起到積極的促進(jìn)作用。也能夠使經(jīng)過黨校學(xué)習(xí)的各級黨員領(lǐng)導(dǎo)干部增強(qiáng)理論水平,提高執(zhí)政能力,從而促進(jìn)我省各項事業(yè)向前發(fā)展。
2010年5月第30卷第5期省情數(shù)據(jù)庫建設(shè)方略探討May,2010Vol30 No53 省情數(shù)據(jù)庫建設(shè)的原則
31 合法性原則
在數(shù)據(jù)庫建設(shè)過程中不觸犯各種法律,主要是指知識產(chǎn)權(quán)法。
32 價值性原則
建設(shè)省情數(shù)據(jù)庫的關(guān)鍵不在于資源量大,而在于質(zhì)量高、內(nèi)容精,在資源的搜集過程中應(yīng)注重其價值,本著認(rèn)真負(fù)責(zé)的態(tài)度來鑒別、篩選,使省情數(shù)據(jù)庫具有較高的參考價值和實用價值。
33 協(xié)調(diào)性原則
建設(shè)省情數(shù)據(jù)庫是一項復(fù)雜的跨部門的協(xié)作工程,涉及面廣,工作難度大,須成立“省情數(shù)據(jù)庫建設(shè)與開發(fā)”課題組,由學(xué)校領(lǐng)導(dǎo)牽頭統(tǒng)籌組織、安排。(1)做好省情數(shù)據(jù)庫建設(shè)的整體規(guī)劃,參照國際國內(nèi)建庫的標(biāo)準(zhǔn),結(jié)合省情文獻(xiàn)的特點(diǎn),在建庫設(shè)計、建庫步驟、建庫標(biāo)準(zhǔn)制訂等方面保證統(tǒng)一控制和指導(dǎo)。(2)選擇高效、安全、性價比高的數(shù)據(jù)庫建設(shè)管理系統(tǒng)。
34 服務(wù)性原則
建設(shè)吉林省情數(shù)據(jù)庫是為了推動我省社科理論研究的發(fā)展,同時也是為了滿足我校教學(xué)科研的實際需要,因此,在選取資源內(nèi)容時,應(yīng)遵循如下規(guī)則(1)能及時反映本省社科問題的發(fā)展動態(tài)和研究成果;(2)內(nèi)容要有針對性,即要考慮到我校教學(xué)科研人員的需求,還要考慮到內(nèi)容的現(xiàn)實意義和社會價值;(3)選取的信息要有系統(tǒng)性、科學(xué)性、時效性。
4 省情數(shù)據(jù)庫建設(shè)的思路和方法
41 數(shù)據(jù)庫的收錄范圍
(1)收錄真實記錄吉林省政治、經(jīng)濟(jì)、文化、歷史、教育、科技、民族、宗教、自然資源、特色產(chǎn)業(yè)等方面的數(shù)據(jù)資料。
(2)收錄研究我省社科理論前沿問題、經(jīng)濟(jì)社會發(fā)展中的各種問題的理論性和研究性文獻(xiàn)信息資料。
(3)收錄中共吉林省委黨校教研人員的科研成果及學(xué)員的調(diào)研報告。
42 數(shù)據(jù)的采集
要建設(shè)高質(zhì)量的省情數(shù)據(jù)庫,必須擴(kuò)大資料收集的范圍。而省情文獻(xiàn)資料分布范圍廣、載體形式多樣。所以,收集哪些資料、采取什么方法從哪些途徑獲取資料,是數(shù)據(jù)庫建設(shè)的核心問題,也是數(shù)據(jù)庫建設(shè)的重點(diǎn)與難點(diǎn)。
421 鏈接有關(guān)反映我省省情的網(wǎng)站
包括:《吉林省情網(wǎng)》、吉林省各級政府的門戶網(wǎng)站、省社會科學(xué)院各個研究所的網(wǎng)站、省內(nèi)的地方報紙等。
422 要利用好本館及本校的資源
包括本館收藏的一些省情文獻(xiàn),如吉林統(tǒng)計年鑒、吉林統(tǒng)計月報、吉林經(jīng)濟(jì)動態(tài)等;本校教研人員的有關(guān)研究成果;本校歷屆主體班次學(xué)員的調(diào)研報告;本校研究生的相關(guān)畢業(yè)論文。
423 收集省內(nèi)有關(guān)單位的文獻(xiàn)資料
要盡量多地收集省內(nèi)有關(guān)單位自編的內(nèi)部資料;省規(guī)劃辦掌握的研究課題、省科委的各類研究課題等是我們應(yīng)該重點(diǎn)收集利用的。
424 通過軟件自動收集和人工處理相結(jié)合的方法,對網(wǎng)上灰色資源進(jìn)行收集利用。
43 數(shù)據(jù)庫的質(zhì)量控制
431 文獻(xiàn)標(biāo)引
文獻(xiàn)標(biāo)引是揭示文獻(xiàn)內(nèi)容特征的一種手段。文獻(xiàn)的標(biāo)引質(zhì)量和標(biāo)引深度,直接關(guān)系到文獻(xiàn)的查全率和查準(zhǔn)率。目前國內(nèi)主導(dǎo)性的標(biāo)準(zhǔn)分類法是《中國圖書館分類法》,主題詞標(biāo)引是《漢語主題詞表》,這在業(yè)內(nèi)已達(dá)成共識。但是地方文獻(xiàn)資料的本身具有很強(qiáng)的專業(yè)性和針對性,不同于一般的圖書資料,也不同于新聞剪報資料,必須遵循自身的特點(diǎn)建立一套適合本地情況的完整的分類體系和主題標(biāo)引體系。
省情文獻(xiàn)的內(nèi)容覆蓋面廣、學(xué)科交叉性強(qiáng),在分類時,應(yīng)盡量給予兩個或多個分類號,從而提高數(shù)據(jù)庫的分類標(biāo)引深度,提高用戶的檢索效率。
主題標(biāo)引是揭示省情文獻(xiàn)的最佳手段之一。對收集到的文獻(xiàn)資料進(jìn)行主題分析,這是主題分類標(biāo)引關(guān)鍵的一步。主題復(fù)雜的文章由多個主題因素構(gòu)成,在進(jìn)行主題分析時應(yīng)反復(fù)推敲,既抓住文章的主題中心,確定主要的類目,又全面涉及相關(guān)的類目,盡力做到主次分清、統(tǒng)籌兼顧。
432 數(shù)據(jù)庫的檢索字段
字段是讀者利用省情文獻(xiàn)數(shù)據(jù)庫的檢索入口,字段的設(shè)置應(yīng)以科學(xué)為根據(jù),便于用戶從多角度查詢數(shù)據(jù)庫內(nèi)容。建立多個字段,還可以模糊檢索的方式,使查找、利用資料更準(zhǔn)確、更便利。鑒于吉林省情數(shù)據(jù)庫中的資源類型大體上會包含圖書、論文、非書資料,其字段應(yīng)按照以上三種文獻(xiàn)信息資源類型分別設(shè)置。下面是幾種資源類型字段設(shè)置時不可缺少的基本元素:
著作:題名、責(zé)任者、出版者、出版日期、分類號、關(guān)鍵詞、正文;
論文:題名、責(zé)任者、來源、期號、分類號、關(guān)鍵詞、正文;
課題:題名、項目負(fù)責(zé)人、基金提供單位、結(jié)項日期、分類號、關(guān)鍵詞、正文;
調(diào)研報告:題名、責(zé)任者、來源、期號、分類號、關(guān)鍵詞、正文。
433 數(shù)據(jù)的審核
在數(shù)據(jù)加工的過程中由于數(shù)據(jù)錄入量較大,錄入時難免產(chǎn)生錯誤,因此應(yīng)該建立數(shù)據(jù)錄入檢查校對制度,確保數(shù)據(jù)一致性。
44 數(shù)據(jù)庫的技術(shù)保障
441 數(shù)據(jù)庫的軟件選擇
要建設(shè)高質(zhì)量的數(shù)據(jù)庫必須有技術(shù)先進(jìn)的軟件做支撐。應(yīng)通過市場調(diào)查、實地參觀、專家指導(dǎo)等手段,了解當(dāng)前建庫軟件的各項性能指標(biāo)和功能特點(diǎn),在綜合分析的基礎(chǔ)上加以選擇。TPI系統(tǒng)即清華同方專業(yè)數(shù)據(jù)庫制作管理系統(tǒng),是基于非結(jié)構(gòu)化文檔管理而開發(fā)的大型智能內(nèi)容管理系統(tǒng)。它能夠同時處理文字、圖片、多媒體等信息,并提供全文檢索服務(wù),支持頁的動態(tài)發(fā)布,是一個面向內(nèi)容管理的數(shù)據(jù)庫開發(fā)平臺。在資源管理方面,TPI能將數(shù)據(jù)庫同時建立多種導(dǎo)航樹,支持多種分類體系并存,是數(shù)據(jù)庫建設(shè)的專業(yè)化軟件。因此我們選擇使用此系統(tǒng)。
442 文獻(xiàn)數(shù)字化轉(zhuǎn)化
文獻(xiàn)數(shù)字化的關(guān)鍵是數(shù)字轉(zhuǎn)化技術(shù),特別是對不同載體形式存貯的信息資料數(shù)字化,如將文字資料、圖片、聲像資料、光盤資料等轉(zhuǎn)換成方便計算機(jī)處理的數(shù)字化信息,文獻(xiàn)數(shù)字化轉(zhuǎn)化技術(shù)要求速度快、準(zhǔn)確率高、轉(zhuǎn)化成的數(shù)化貯存空間小并能夠通過網(wǎng)絡(luò)快速傳送、既能實現(xiàn)全文檢索又能顯示原有版式。
443 數(shù)據(jù)的統(tǒng)一性和可轉(zhuǎn)換性
數(shù)據(jù)的統(tǒng)一性表現(xiàn)在兩個方面,格式的統(tǒng)一和內(nèi)容的統(tǒng)一。不管是文本還是圖像、聲音、視頻在轉(zhuǎn)換的過程中,前后要一致。數(shù)據(jù)的可轉(zhuǎn)換性是建立在數(shù)據(jù)的統(tǒng)一性的基礎(chǔ)之上,只有實現(xiàn)了數(shù)據(jù)的統(tǒng)一才能順利地進(jìn)行數(shù)據(jù)的轉(zhuǎn)換。數(shù)據(jù)的可轉(zhuǎn)換性體現(xiàn)在數(shù)據(jù)從一種工具軟件轉(zhuǎn)換到另一種工具軟件或裝入數(shù)字圖書館的過程中,可以轉(zhuǎn)換并且沒有數(shù)據(jù)丟失。
總之,省情數(shù)據(jù)庫建設(shè)是一項系統(tǒng)工程,是重要的信息化工程和文化建設(shè)工程。必須從實際出發(fā)、突出重點(diǎn)、由點(diǎn)到面、由簡到繁有序地進(jìn)行,才能推動省情數(shù)據(jù)庫建設(shè)健康發(fā)展。
參考文獻(xiàn)
[1]夏紅.高校圖書館特色數(shù)據(jù)庫的建設(shè)研究[J].現(xiàn)代情報,2006,(10):28-29.
[2]蘭天陽.走合作之路 開發(fā)文獻(xiàn)資源[J].圖書館建設(shè),2000,(4):38-39.
[3]劉加夫.加強(qiáng)省情數(shù)據(jù)庫建設(shè)的方略研究[J].江西行政學(xué)院學(xué)報,2007,(1):73-74.
[4]王東閩.省情報刊資料數(shù)據(jù)庫建設(shè)回顧與思考[J].中共福建省委黨校學(xué)報,2002,(12):24-25.
[5]王凱.建立地方文獻(xiàn)數(shù)據(jù)庫之探索[J].大學(xué)圖書情報學(xué)刊,2002,(2):33-34.