王雅戈,葉繼元,黃建年,唐 強(qiáng),劉 峰,楊 斐
索引的歷史和圖書的歷史幾乎一樣久遠(yuǎn)[1]。歐美重視圖書索引。美國學(xué)者H.賓尼(Binney)認(rèn)為,一本好書如果沒有索引,則可能失去一半價(jià)值[2-3]。歐美50%普通圖書有索引,95%以上學(xué)術(shù)著作有索引[4]。歐美索引業(yè)的發(fā)達(dá)與現(xiàn)代索引技術(shù)的發(fā)展密切相關(guān),1980年代中期以來CINDEXER、Macrex、SKYTM等索引軟件相繼問世,把索引編纂員從枯燥的手工標(biāo)引和排序中解放出來,使索引編制效率和質(zhì)量大大提高。
改革開放以來,我國索引事業(yè)取得較大發(fā)展。1991年成立中國索引學(xué)會,著(譯)多部索引著作,發(fā)表了大量研究論文[5]。2003年成功研發(fā)“索引之星”軟件[6]。2009年實(shí)施國家標(biāo)準(zhǔn)《索引編制規(guī)則(總則)》。2012年新聞出版總署下發(fā)《關(guān)于進(jìn)一步加強(qiáng)學(xué)術(shù)著作出版規(guī)范的通知》,規(guī)定學(xué)術(shù)著作編制索引[7]。2014年出版的《習(xí)近平談治國理政》有中、英、俄等10多個(gè)語種版本,每個(gè)版本都編制了索引[8],成為圖書索引的典范。2018年頒布國家標(biāo)準(zhǔn)《地方志索引編制規(guī)則》,《學(xué)位論文索引編制規(guī)則》也成功立項(xiàng)。
但是,我國圖書索引的比例仍然很低,1980年前出版的圖書有索引的僅占18.7%[9],1996年前出版的科學(xué)著作有索引的僅占17%[10],目前學(xué)術(shù)著作有索引的僅占5%[11]。我國圖書索引未能普及的一個(gè)原因是缺乏便捷的現(xiàn)代索引技術(shù)手段。
我國學(xué)者很早就建議開展中文索引自動化研究[12-14],并取得一定進(jìn)展。相關(guān)研究或介紹國外索引軟件開發(fā)經(jīng)驗(yàn)[15-16],或展示計(jì)算機(jī)編纂索引的實(shí)例[17-19],或嘗試開發(fā)索引自動編纂軟件[20,2]。但是,實(shí)踐探索未能實(shí)現(xiàn)較大突破。比如,國外索引軟件一直未加以漢化,不適合中文圖書;“索引之星”軟件開發(fā)成功近15年,一直只有單機(jī)版,適用性弱。2016年我國出版圖書499884種[21],為這些圖書編制索引是一項(xiàng)龐大的工程,也是一個(gè)巨大的市場,已有索引軟件和技術(shù)遠(yuǎn)遠(yuǎn)不能滿足需求。為適應(yīng)圖書索引編制和文化交流傳播需求,亟需建設(shè)一個(gè)能夠提供技術(shù)支持、學(xué)術(shù)交流和信息服務(wù)一體化的中文索引平臺。
針對中文索引軟件不能滿足索引編纂需求的現(xiàn)狀,中國索引學(xué)會積極推動中文網(wǎng)絡(luò)索引軟件研發(fā),軟件定位是為圖書編著人員、出版專業(yè)技術(shù)人員、索引編纂人員提供技術(shù)支持、學(xué)術(shù)交流和一體化的信息服務(wù)。要求軟件要有大格局,能擔(dān)負(fù)起國家索引平臺職責(zé),并起名為“索引家”。
索引編纂包括標(biāo)引和排序兩個(gè)環(huán)節(jié)。標(biāo)引是指在原文中選取有檢索意義的主題詞,并在其后附上頁碼;排序是指把索引標(biāo)目按拼音或筆畫進(jìn)行排序、合并相同標(biāo)目,并把其后的頁碼按順序依次接續(xù)。索引軟件首先實(shí)現(xiàn)標(biāo)引自動化,具體來說就是把標(biāo)引的過程變?yōu)閽呙柽^程,光標(biāo)掃過主題詞就可完成索引標(biāo)目的標(biāo)引且自動添加頁碼;其次是實(shí)現(xiàn)排序自動化,并把完整的索引款目自動保存在索引文件中。
“索引家”的核心內(nèi)容是開發(fā)網(wǎng)絡(luò)版索引軟件,構(gòu)建索引技術(shù)服務(wù)信息平臺。平臺主要包括索引學(xué)術(shù)研究交流和索引編纂出版技術(shù)支持兩方面,具體包括索引標(biāo)引技術(shù)支持、索引研究成果交流、索引編纂供需信息傳遞、索引編纂專業(yè)人才培養(yǎng)、索引編纂業(yè)務(wù)輔導(dǎo)和統(tǒng)計(jì)分析、平臺管理等功能模塊,其中索引編纂技術(shù)支持是核心功能。
“索引家”平臺研發(fā)受多方面因素的影響,也持續(xù)了一段較長時(shí)期。2007年前后,受侯漢清教授鼓勵,嘗試以辦公軟件編制索引。2013年前后,在葉繼元教授倡議下,進(jìn)行了開發(fā)前的準(zhǔn)備和預(yù)研。2015年8月,在葉教授帶領(lǐng)下,啟動研發(fā)工作,期間遇到各種困難,多次停滯重啟。2017年3月1日完成研發(fā),并獲得“索引家標(biāo)引軟件”(簡稱“索引家”)著作權(quán)。在內(nèi)網(wǎng)和公網(wǎng)試運(yùn)行,根據(jù)用戶反饋多次改版,2019年8月21日正式上線[22]。
(1)效率優(yōu)勢明顯。索引家軟件可以代替手工標(biāo)引,提高準(zhǔn)確性,尤其是添加頁碼時(shí)不易出錯,節(jié)約標(biāo)引時(shí)間。經(jīng)測試,利用其它軟件標(biāo)引一本15萬字的社科類圖書約需30小時(shí),利用索引家軟件標(biāo)引則只需6小時(shí)。
(2)功能優(yōu)勢明顯。相較于索引之星、WORD和EXCEL軟件,“索引家”平臺優(yōu)勢包括:索引家不僅可以進(jìn)行索引標(biāo)引,還能進(jìn)行索引排序,具有完整的索引編制功能;大量并發(fā)用戶能同時(shí)在線使用;平臺管理簡便,交流功能強(qiáng),用戶負(fù)擔(dān)??;系統(tǒng)可持續(xù)性好,推出半年多已升級3次,能夠滿足普通用戶的需求;具有很強(qiáng)的輔導(dǎo)功能,能直接在平臺上采用線上或線下、集中或分散、自動或人工等方式對用戶開展培訓(xùn)。
總結(jié)“索引家”開發(fā)過程,經(jīng)歷曲折,經(jīng)驗(yàn)包括:(1)開放原則:在開發(fā)前期,應(yīng)當(dāng)持開放態(tài)度,提出詳細(xì)技術(shù)路線和周密研發(fā)方案,面向用戶、專家充分說明開發(fā)思路,征求各方面的意見。前期方案越周詳,后期開發(fā)困難越少。(2)包容原則:調(diào)研和預(yù)研時(shí),總會聽到不同的意見,對各種意見要合理采納,特別是反對意見有時(shí)會激發(fā)出更好的開發(fā)新思路。(3)合作原則:平臺的用戶主要是著者、編輯、學(xué)生、索引員、圖書館員等,開發(fā)過程需要相關(guān)行業(yè)人員的合作;需要網(wǎng)絡(luò)管理、程序編寫、用戶管理等各方面分工協(xié)作。(4)分工原則:在開發(fā)過程中,管理人員、技術(shù)人員、用戶等要責(zé)任明確。(5)服務(wù)原則:平臺主要圍繞索引編纂開展服務(wù),要堅(jiān)持用戶第一、服務(wù)至上。(6)遵重知識產(chǎn)權(quán):平臺開發(fā)前,已經(jīng)有很多索引自動化方面的研究成果。索引家合理汲取了其思想原理,并進(jìn)行改進(jìn)、提高,在技術(shù)上集成創(chuàng)新,在功能上超越發(fā)展。(7)持續(xù)發(fā)展:平臺雖然發(fā)布了,但還存在這樣那樣的不足,需要不斷改進(jìn)。(8)避免閉門造車:平臺之所以歷經(jīng)曲折,其實(shí)與開發(fā)初期的調(diào)研不充分、應(yīng)用技術(shù)不夠成熟、陷入閉門造車的做法不無相關(guān);也與中期資金困難、試圖簡單了事的動機(jī)相關(guān);更與過于注重學(xué)術(shù)、市場意識淡薄有關(guān),這些今后都應(yīng)當(dāng)避免。
我國索引事業(yè)前景廣闊,市場巨大,需要學(xué)者、編輯、索引員等聯(lián)合起來,形成索引共同體,共同承擔(dān)索引重任?!八饕摇逼脚_開發(fā)過程中,始終離不開中國索引學(xué)會的關(guān)心和支持,也受到地方志辦公室、高校圖書館、研究生院等多個(gè)部門的支持,他們?yōu)槠脚_的完成提供了重要指導(dǎo)。愿平臺能夠隨著各項(xiàng)索引標(biāo)準(zhǔn)的頒布實(shí)施,擔(dān)負(fù)起普及索引知識、保障索引技術(shù)、提供索引服務(wù)的職責(zé)。但是,只有一個(gè)“索引家”平臺遠(yuǎn)遠(yuǎn)難以滿足需求,期冀通過“索引家”的成功研發(fā),能為后續(xù)中文索引平臺建設(shè)探索捷徑。相信會有更多專業(yè)型和通用型的索引平臺建成,共同推進(jìn)中國索引事業(yè)發(fā)展。