鄒 進(jìn)
(人天書店集團(tuán) 北京100165)
本來我沒有資格為這部專著作序,我是地道的業(yè)外人士。去年大概這個時候,人天書店在蘇州召開江蘇、上海、浙江三地高校圖書館館長資源建設(shè)研討會,請吳志榮老師做主題演講。私下,吳老師跟我說到這本書的內(nèi)容,正好我們正在搭建人天數(shù)據(jù)平臺,很多想法有相通之處。意氣相投嘛,我就跟吳老師說,書寫好了我給你出吧。
我的數(shù)據(jù)平臺原理,是要把采訪、編目、聯(lián)合編目、聯(lián)合目錄都放在一個數(shù)據(jù)庫里,而現(xiàn)在的情況并非如此,采訪是采訪,編目是編目,編目還要分為國圖和CALIS兩個標(biāo)準(zhǔn),實際又變成了兩個庫,聯(lián)合目錄已經(jīng)沒人做了,個別專業(yè)圖書館只做自己專業(yè)的聯(lián)合目錄。編制不方便,使用更不方便。書出版了,編目就重做一遍,并不在采訪的基礎(chǔ)上做,編目員嫌麻煩。使用采訪數(shù)據(jù)時,并不知道哪些書已經(jīng)出版了,本來可以使用更準(zhǔn)確的信息。每個庫都是獨立不相通的,是一個個信息孤島,耗費大量的人工,還出現(xiàn)大量的冗余數(shù)據(jù)。我的數(shù)據(jù)平臺把這些問題都解決了,采和編都在一個平臺實現(xiàn),從在版編目(CIP)到采訪,到編目,到聯(lián)合目錄,一條數(shù)據(jù)像在一條流水線一樣生產(chǎn)。好處還在于,一種書或一種書的信息在任何狀態(tài)下,都可以放到這個制作流程中完成,比如某一種書沒有任何信息,就直接編制它的編目數(shù)據(jù),同時也就復(fù)制了它的采訪數(shù)據(jù),沒有一個浪費的動作。
但是,數(shù)據(jù)平臺做到這里,只是解決了館配商采和編的問題,并沒有解決圖書館采選的問題,就如同中圖法和機讀目錄只解決了圖書館的問題,并沒有解決讀者的問題一樣。讀者要用最便捷的方式找到自己想看的書,他們會覺得百度、淘寶、當(dāng)當(dāng)、亞馬遜更方便。圖書館是想最方便、最準(zhǔn)確地找到符合自己館藏要求的書,現(xiàn)在看來還沒有任何手段可以達(dá)到這個目的。
這是一個服務(wù)的概念,館配商可以不做,人天書店也可以不做,但如果做了,就會變得優(yōu)秀。吳老師和他的團(tuán)隊所做的工作給了我一些啟發(fā)。他們所做的工作,是把以往某個時段的書目集中起來,再把哲社類學(xué)術(shù)圖書分離出來,對這部分圖書用引文分析和二八定律遴選,再經(jīng)相關(guān)專家審定,形成核心書目。這個書目可以作為館藏質(zhì)量測評的工具。在這之前,吳老師曾對某段時間的計算機類圖書做過類似分析測評,由此生發(fā)出對所有圖書進(jìn)行評價的欲望。不管圖書館認(rèn)可與否,是否會用這個工具測評本館的館藏圖書質(zhì)量,吳老師他們的工作都是有意義的。
對人天書店來說,這樣的成果來得有點晚了。我是想讓圖書館的采訪人員在沒有看到書的情況下,面對采訪數(shù)據(jù),就能大致判斷出哪些是好書,有哪些圖書符合自己的館藏要求,不至于在若干年后,等吳老師的核心書目出來,與自己的館藏一對比,覆蓋率達(dá)不到50%,甚至達(dá)不到30%(吳老師用計算機類核心書目比對一些大學(xué)圖書館館藏時,就發(fā)生了這樣的情況)。
我們相信圖書館采訪人員大都是敬業(yè)的,但不能要求他們是全才。特別是他們要面對每年17萬種新書的時候,如果加上再版和重印的數(shù)量,那就是37萬種了。所以要有一個推選的工具,把好書、符合館藏要求的書自動推送到采訪人員眼前。我希望在人天書店的數(shù)據(jù)平臺上實現(xiàn)這一要求。如果能把吳老師的一些研究方式,用到對采訪數(shù)據(jù)的評價上,是否能達(dá)到這個目的呢?還不得而知。這個工作肯定比評價已經(jīng)出版的書有更大的難度,但不是不能做,不是無跡可尋。我提出“好書因子”的概念,吳老師同意我的說法。道理是相同的,方法是相通的。已經(jīng)出版的書可以用引文分析的方法,被看得多、被引得多的大致會是好書,但也不盡然,有些書涉及熱點問題或熱點作者,被看被引自然多,但未必是好書,這里有個二次定量的問題。沒有出版的書自然用不上引文分析,但一條采訪數(shù)據(jù)里面也會包含很多信息,從這些信息里可以提取出用于評價的因子,再對其進(jìn)行量化。殊途同歸吧。我希望吳老師的書盡快出版,讓我從中找到答案,同時也希望吳老師和他的團(tuán)隊,能加入到人天書店這項宏大工程中來。