王兆鵬
排行榜是以數(shù)據(jù)為基礎(chǔ),數(shù)據(jù)指標(biāo)的完備與否就成為排行榜的結(jié)果是否科學(xué)有公信力的前提。指標(biāo)設(shè)置越多,越趨向科學(xué)、合理。問題是,文學(xué)作品的許多指標(biāo)無法量化統(tǒng)計(jì),有些能夠量化統(tǒng)計(jì)的,又無法取得完整的數(shù)據(jù)。能夠取得完整數(shù)據(jù)的指標(biāo),其價(jià)值和置信度也不同。比如我們要談?wù)撘粋€(gè)詩人的影響力,我們就渴望知道:他有多少作品傳世,作品有多少版本,歷代刻印發(fā)行量多大,碼洋多少,多少人學(xué)習(xí)、模仿、談?wù)撨^、選過他的作品,海外知名度如何,石刻作品多少次,多少地方有他的遺跡和紀(jì)念地,美譽(yù)度或惡評(píng)如何,畫像有多少,有關(guān)他的文物拍賣價(jià)多高……總之,這些指標(biāo)越多越詳細(xì)越好??上?,它們大部分無法取得準(zhǔn)確的統(tǒng)計(jì)數(shù)據(jù)。
我們在做《唐詩排行榜》時(shí),考慮過要統(tǒng)計(jì)每一首詩對(duì)后世詩人創(chuàng)作的影響,但數(shù)據(jù)采集相當(dāng)困難。做《宋詞排行榜》時(shí),為了統(tǒng)計(jì)每首宋詞對(duì)后世詞人的影響,我們采集了后世詞人追和宋詞的情況,但這也只是后世詞人學(xué)習(xí)仿效宋詞的一個(gè)方面,創(chuàng)作方法和創(chuàng)作精神上的仿效暫時(shí)還沒有好的辦法采集數(shù)據(jù)來統(tǒng)計(jì)。
對(duì)比“國家綜合實(shí)力排行榜”、“城市綜合競爭實(shí)力排行榜”的數(shù)十個(gè)指標(biāo),我們的唐詩宋詞排行榜只用三、五個(gè)指標(biāo),當(dāng)然太少,難以讓人信服。努力尋找新的排行指標(biāo),增加指標(biāo)的豐富度,借以提高可信度,將是改進(jìn)文學(xué)影響力評(píng)價(jià)指標(biāo)體系的主要途徑。理想的情況應(yīng)該找到十種以上的排行數(shù)據(jù)源,然后進(jìn)行數(shù)據(jù)處理。我們目前能考慮到的作品影響力的評(píng)價(jià)指標(biāo),大約可分三類:作品的典范性、美譽(yù)度和傳閱度。權(quán)重的設(shè)置,主要有客觀賦權(quán)和主觀賦權(quán)兩種??陀^賦權(quán),是以定量分析的方法,根據(jù)數(shù)據(jù)的完備程度、分布密度和活躍程度等計(jì)算出各指標(biāo)的權(quán)重;主觀賦權(quán),是用定性分析的方法,根據(jù)各個(gè)指標(biāo)影響因子的大小來人為設(shè)定各指標(biāo)的權(quán)重。主觀賦權(quán)法,又有專家評(píng)判法和層次分析法兩種。唐詩宋詞排行榜主要用主觀賦權(quán)法中的專家評(píng)判法,雖然有一定的學(xué)理依據(jù),但因?yàn)槭浅醮螄L試,沒有前行的成果可資借鑒,也未經(jīng)眾多專家的討論形成共識(shí),所以對(duì)相關(guān)權(quán)重的設(shè)定,能是“一家之言”,未必能得到公眾和專家學(xué)者的認(rèn)可。
文學(xué)排行榜評(píng)價(jià)指標(biāo)的權(quán)重設(shè)置,最理想的狀態(tài)是客觀賦權(quán)法和主觀賦權(quán)法相結(jié)合??梢钥紤]:各種類別的指標(biāo)用客觀賦權(quán)法,通過軟件計(jì)算來確定;而各個(gè)具體指標(biāo),用主觀賦權(quán)法來設(shè)置,定性分析中參用定量數(shù)據(jù)。比如選本,既要考慮選本這一大類指標(biāo)在整個(gè)評(píng)價(jià)指標(biāo)體系中的權(quán)重(用客觀賦權(quán)法計(jì)算),又要考慮每個(gè)選本指標(biāo)的權(quán)重差異。試舉幾個(gè)宋詞選本為例說明:
南宋曾慥的《樂府雅詞》編成于南宋高宗紹興十六年(1146年),黃升的《花庵詞選》成書于理宗淳祐九年(1249年),明代陳耀文的《花草稡編》初刻于萬歷十一年(1583年),清代朱彝尊編選的《詞綜》始刊于清康熙三十年(1691年),近人朱彊邨《宋詞三百首》初印于1924年,宋詞排行榜中采用選本最晚的一種是2003年高等教育出版社出版的《中國古代文學(xué)作品選》。從傳播、出版的周期(時(shí)間長度)來看,如果以2008年統(tǒng)計(jì)得出《宋詞排行榜》的結(jié)果為下限,那么,《樂府雅詞》的出版周期已有862年,《花庵詞選》的周期有759年,《花草稡編》有425年,《詞綜》有317年,《宋詞三百首》為84年,《中國古代文學(xué)作品選》僅5年。傳播周期越長,其傳閱度應(yīng)該越高,到達(dá)率、知曉率應(yīng)該越高。如果不加區(qū)別地將每個(gè)選本入選的數(shù)據(jù)同等看待,當(dāng)然是不公平、不合理的。這還僅僅是時(shí)間上的傳播周期的差別,還沒考慮空間上的傳播廣度。傳播廣度無法用數(shù)據(jù)來衡量,但可以依據(jù)每個(gè)選本的版本種數(shù)(印次)、印數(shù)(發(fā)行量)來評(píng)估。發(fā)行數(shù)百萬冊的《宋詞三百首》肯定比發(fā)行幾萬冊的《中國古代文學(xué)作品選》的到達(dá)率、傳播廣度要大得多。因此,每一部詞選,由于傳播周期(長度)和發(fā)行量(廣度)不同,而具備不同的傳播含金量,也就是傳播實(shí)際效率。因此,在統(tǒng)計(jì)不同作品入選頻次之前,應(yīng)對(duì)所有詞選進(jìn)行這種含金量的系數(shù)評(píng)定,使每一部詞選都有不同的傳播效率系數(shù)。一首作品入選不同的詞選,即獲得不同的系數(shù)積分。這與現(xiàn)代電視的收視率統(tǒng)計(jì)原理大致相同。
傳播周期與傳播廣度又如何設(shè)定分值?唐詩宋詞排行榜是按朝代來區(qū)分權(quán)重,尚嫌粗略。是否可以按年限來計(jì)算傳播周期的得分?比如,上述《樂府雅詞》的周期為862年,如果1年計(jì)1分,那么其傳播周期得分為862分,而《宋詞三百首》得84分,《中國古代文學(xué)作品選》得5分(具體統(tǒng)計(jì)時(shí)當(dāng)然會(huì)對(duì)這些數(shù)值作標(biāo)準(zhǔn)化處理,否則數(shù)值過大,不便于比較分析)。那些出版年代不詳?shù)倪x本,可以據(jù)其成書的時(shí)代虛擬一個(gè)大致的周期時(shí)限。傳播廣度的得分,古代詞選按版本種類計(jì)算(如1種版本得1分),現(xiàn)代詞選按版次計(jì)算(重印或再版1次計(jì)1分),現(xiàn)代詞選還應(yīng)考慮其印數(shù)的多少。傳播周期數(shù)與版本(版次)數(shù)的乘積,經(jīng)過標(biāo)準(zhǔn)化處理后轉(zhuǎn)換成選本的效率系數(shù)。這些印數(shù)和發(fā)行量的數(shù)據(jù),現(xiàn)在有的是可以獲得的。時(shí)過境遷之后,就很難說了。所以,我們應(yīng)該注意搜集和保存這些出版發(fā)行量的資料數(shù)據(jù)。
在考量每個(gè)選本的傳播周期時(shí),還應(yīng)考慮每個(gè)選本的傳播時(shí)間差。這二者表面看起來,都涉及選本出版的時(shí)間長度,但實(shí)際上還是有區(qū)別,傳播周期是就選本在整個(gè)傳播歷程中的長度而言,傳播時(shí)間差是指同時(shí)代的選本出現(xiàn)的先后早晚。如唐詩選本中,盛唐的選本只可能入選初、盛唐人的詩作,無法入選此后中、晚唐的詩篇,以盛唐選本來統(tǒng)計(jì)和比較整個(gè)唐代詩人詩作的人選篇次,顯然對(duì)中、晚唐的詩人不公平,因?yàn)樗麄儧]有“入選權(quán)”。同樣,宋人詞選中,南宋初期成書的《樂府雅詞》,就無法入選南宋中葉以后的詞人,如辛棄疾、張孝祥、陸游和姜夔、吳文英等人都沒有“入選權(quán)”;在黃升的《花庵詞選》中,宋末的周密、王沂孫、張炎、蔣捷和文天祥等人,也沒有機(jī)會(huì)入選。初唐人與晚唐人相差了兩百多年,宋初的詞人比宋末的詞人早了近三百年,前者有更多的傳播機(jī)會(huì)。把他們進(jìn)行同等的傳播數(shù)量統(tǒng)計(jì),必須將這個(gè)時(shí)間差考慮進(jìn)去,以權(quán)重系數(shù)抹平彼此的時(shí)間差。評(píng)點(diǎn)數(shù)據(jù)中,對(duì)同時(shí)代被評(píng)的作家作品,也受這種時(shí)間差的影響,必須一并考慮其權(quán)重以平衡客觀數(shù)據(jù)存在的差異。