摘 要 圖書影響力預(yù)測是出版大數(shù)據(jù)預(yù)測的重要組成部分,旨在通過模型化方法,解析和利用圖書出版發(fā)展規(guī)律,預(yù)測圖書的未來影響力,為管理決策提供社會(huì)效益評(píng)估手段和戰(zhàn)略管理工具。從圖書生產(chǎn)、傳播、消費(fèi)全鏈條出發(fā),分析影響力的內(nèi)在邏輯關(guān)系,建立圖書影響力分析框架;針對(duì)影響力的多維性和時(shí)滯性問題,結(jié)合選題決策模型、邏輯模型、圖書分類分期分級(jí)系統(tǒng),改進(jìn)過程導(dǎo)向的圖書影響力預(yù)測模型;結(jié)合圖書的銷量預(yù)測、社會(huì)影響力預(yù)測、學(xué)術(shù)影響力預(yù)測模型,構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的圖書綜合影響力預(yù)測模型。在開放數(shù)據(jù)和數(shù)字技術(shù)賦能下,數(shù)據(jù)驅(qū)動(dòng)的圖書影響力預(yù)測有望成為保證和促進(jìn)影響力經(jīng)濟(jì)、社會(huì)效益優(yōu)先的重要手段和量化預(yù)測新模式。
關(guān)鍵詞 圖書;社會(huì)效益;影響力預(yù)測;數(shù)據(jù)驅(qū)動(dòng);銷量預(yù)測
影響力既是過程,也是結(jié)果。圖書影響力是由圖書的社會(huì)影響力、學(xué)術(shù)影響力、市場影響力等構(gòu)成的一個(gè)系統(tǒng),是衡量圖書在社會(huì)活動(dòng)中產(chǎn)生的控制力和價(jià)值貢獻(xiàn)、在學(xué)術(shù)活動(dòng)中產(chǎn)生的作用力和知識(shí)貢獻(xiàn)、在文化消費(fèi)活動(dòng)中產(chǎn)生的競爭力和經(jīng)濟(jì)貢獻(xiàn)的重要指標(biāo)。
圖書影響力預(yù)測是出版大數(shù)據(jù)預(yù)測的重要組成部分,旨在通過模型化方法,解析和利用圖書出版發(fā)展規(guī)律,預(yù)測圖書的未來影響力。依據(jù)對(duì)圖書影響力內(nèi)涵的不同界定,學(xué)術(shù)界形成了效果導(dǎo)向和過程導(dǎo)向兩種主流研究思路,在影響力預(yù)測上提供了多種見解和實(shí)現(xiàn)策略,但缺乏從影響力生成的過程、條件、要素視角對(duì)其進(jìn)行分析與預(yù)測,也未能從模型層面系統(tǒng)考察納入情景數(shù)據(jù)的大數(shù)據(jù)預(yù)測模式。傳統(tǒng)的判斷預(yù)測依賴編輯的直覺與經(jīng)驗(yàn)判斷[1],統(tǒng)計(jì)預(yù)測依賴歷史數(shù)據(jù)的采樣范圍、時(shí)效性、顆粒度,大數(shù)據(jù)預(yù)測將情景數(shù)據(jù)納入預(yù)測模型,可解決認(rèn)知偏差、數(shù)據(jù)時(shí)滯、數(shù)據(jù)缺失等問題。
本文擬采用系統(tǒng)論思想,探索數(shù)據(jù)驅(qū)動(dòng)的圖書影響力預(yù)測,將效果研究與過程研究相結(jié)合,通過構(gòu)建影響力的分析框架、預(yù)測模型和時(shí)空關(guān)系網(wǎng)絡(luò),從影響力預(yù)測視角衡量圖書的市場表現(xiàn)和社會(huì)影響,預(yù)測圖書未來的影響力,解決圖書社會(huì)效益評(píng)估的可操作性和經(jīng)濟(jì)效益評(píng)估的準(zhǔn)確性、時(shí)效性問題,為管理決策提供社會(huì)效益評(píng)估手段和戰(zhàn)略管理工具。
1 圖書影響力分析框架建立
影響力分析是影響力預(yù)測的前提和基礎(chǔ),影響力預(yù)測模型建立在影響力產(chǎn)生機(jī)制分析基礎(chǔ)之上。通過分析圖書影響力的內(nèi)在邏輯關(guān)系,建立圖書影響力分析框架,有助于厘清各類影響力間的復(fù)雜關(guān)系。
1.1 過程分析
針對(duì)影響力產(chǎn)生機(jī)制的路徑多樣性和產(chǎn)生最終影響的載體多元性特征,從圖書生產(chǎn)、傳播、消費(fèi)全鏈條出發(fā),分析生產(chǎn)過程產(chǎn)生影響力的核心要素、傳播過程產(chǎn)生影響力的作用方式、消費(fèi)過程產(chǎn)生影響力的作用效果;從價(jià)值產(chǎn)生、價(jià)值提升、價(jià)值實(shí)現(xiàn)3個(gè)環(huán)節(jié),探析圖書影響力產(chǎn)生機(jī)制及影響路徑。
(1)生產(chǎn)過程
內(nèi)容是出版的核心,質(zhì)量是出版的關(guān)鍵。圖書質(zhì)量、作者、編輯、出版社等是圖書在出版過程中產(chǎn)生影響力的核心因素。圖書質(zhì)量是從選題策劃到校對(duì)印制的整個(gè)生產(chǎn)過程質(zhì)量控制的最終結(jié)果,也是圖書產(chǎn)生影響力的根源。圖書入選重點(diǎn)項(xiàng)目和獲得獎(jiǎng)項(xiàng)榮譽(yù)、社會(huì)評(píng)價(jià)、國際影響是出版社文化和社會(huì)影響力的量化指標(biāo),是其作為生產(chǎn)機(jī)構(gòu)的社會(huì)效益的實(shí)現(xiàn)路徑。但是高質(zhì)量的圖書產(chǎn)品僅是圖書社會(huì)效益的實(shí)現(xiàn)基礎(chǔ),還需要圍繞傳播、傳承、消費(fèi)多個(gè)過程得以最終實(shí)現(xiàn)其社會(huì)效益,需要結(jié)合多元主體協(xié)同完成用戶獲得與用戶使用過程。
(2)傳播過程
內(nèi)容產(chǎn)生價(jià)值,傳播提升價(jià)值。從傳播學(xué)5W模型出發(fā),解讀圖書傳播過程的傳播主體、傳播內(nèi)容、傳播渠道、傳播對(duì)象、傳播效果5個(gè)要素及其發(fā)展趨勢(見表1),探索圖書傳播的價(jià)值提升路徑。大數(shù)據(jù)時(shí)代圖書傳播的發(fā)展趨勢為從大眾傳播到人際傳播,從線下口碑到網(wǎng)絡(luò)口碑,從圖書知識(shí)到用戶體驗(yàn),從專業(yè)評(píng)論到大眾評(píng)論,從借閱記錄到數(shù)字指紋。
(3)消費(fèi)過程
渠道傳播價(jià)值,消費(fèi)實(shí)現(xiàn)價(jià)值。圖書消費(fèi)活動(dòng)包括通過購買、租借等方式選擇產(chǎn)品的圖書獲得過程和通過信息獲取、社會(huì)閱讀、學(xué)術(shù)引用、文本生產(chǎn)等方式開展閱讀活動(dòng)的圖書使用過程。圖書與用戶之間的聯(lián)系通過用戶消費(fèi)行為得以建立并證實(shí)圖書是精神產(chǎn)品。圖書與社會(huì)之間的聯(lián)系通過社會(huì)閱讀活動(dòng)得以建立,并證實(shí)閱讀是開展社會(huì)自組織和社會(huì)控制的有效手段[2]。另外,公共圖書館館藏圖書的公共文化產(chǎn)品屬性體現(xiàn)于可供社會(huì)共享、具有正外部性和公共性等特點(diǎn),正外部性產(chǎn)生于圖書消費(fèi)過程中并體現(xiàn)于對(duì)用戶和社會(huì)的正面影響。
1.2 效果分析
影響力預(yù)測是保證和促進(jìn)影響力經(jīng)濟(jì)、社會(huì)效益優(yōu)先的重要手段。本文從市場表現(xiàn)(叫座、不叫座)和社會(huì)影響(叫好、不叫好)兩個(gè)角度,對(duì)經(jīng)濟(jì)效益與社會(huì)效益的關(guān)系進(jìn)行經(jīng)濟(jì)學(xué)解釋和出版學(xué)分析,結(jié)果如表2所示。
“叫好又叫座”的A類型是出版業(yè)追求的理想狀態(tài),體現(xiàn)了社會(huì)效益與經(jīng)濟(jì)效益相統(tǒng)一。在理想的圖書市場下,“叫好”是“叫座”的充分必要條件。“好書能暢銷”“暢銷的是好書”是出版事業(yè)和出版產(chǎn)業(yè)發(fā)展的重要價(jià)值體現(xiàn)。出版物內(nèi)容的信息密度、學(xué)術(shù)水準(zhǔn)、思想內(nèi)涵、傳播時(shí)空范圍等指標(biāo)不僅事關(guān)讀者的認(rèn)同和忠誠度,還會(huì)影響出版企業(yè)品牌的長遠(yuǎn)發(fā)展[3]。
“叫好不叫座”的B類型較多體現(xiàn)于學(xué)術(shù)性專業(yè)性較強(qiáng)、擁有固定讀者群體的學(xué)術(shù)出版或?qū)I(yè)出版中。我國政府采用國家出版基金、低稅率等方式,鼓勵(lì)和支持正外部性強(qiáng)的學(xué)術(shù)圖書、古籍圖書等,發(fā)揮國家政策和圖書產(chǎn)品的價(jià)值功能。主題出版具有記錄歷史真實(shí)、彰顯文化自信等突出價(jià)值[4],旨在加強(qiáng)出版的政治和文化功能。主題出版的部分圖書也存在“叫好不叫座”的問題,一些“題材重大”的主題出版凸顯價(jià)值引領(lǐng)等功能,相對(duì)容易進(jìn)入主流媒體的“好書”榜單,但如果在敘事性、藝術(shù)感染力等方面不強(qiáng),難以得到大眾認(rèn)同,社會(huì)影響力將大打折扣。
對(duì)于“叫座不叫好”的C類型,圖書市場上某個(gè)時(shí)期常出現(xiàn)曇花一現(xiàn)的暢銷書現(xiàn)象。由于圖書本身存在質(zhì)量粗糙、缺乏產(chǎn)生深遠(yuǎn)影響的思想、不被主流媒體認(rèn)可推介等,導(dǎo)致數(shù)量與質(zhì)量之間存在背離現(xiàn)象。這類暢銷書缺乏持久影響力,只是吸引短暫的社會(huì)注意力,難以轉(zhuǎn)化為具有傳承性、延續(xù)性的常銷書。隨著出版制度的不斷完善和讀者閱讀品味的持續(xù)提高,C類型圖書的生存空間將日漸萎縮。
在“不叫好也不叫座”的D類型下,圖書出版的社會(huì)效益與經(jīng)濟(jì)效益俱差。究其最初動(dòng)機(jī)可能是追求“叫好又叫座”,最后產(chǎn)生了背道而馳的結(jié)果,與選題決策的判斷失誤、市場渠道的受限、個(gè)人利己動(dòng)機(jī)等各種因素導(dǎo)致的偏差有關(guān)。
數(shù)字時(shí)代,出版機(jī)構(gòu)出版精品圖書的主動(dòng)作為和國民閱讀能力的普遍提高,以及數(shù)字技術(shù)全鏈全面賦能[5],為“雙效統(tǒng)一”和“叫好又叫座”的理想實(shí)現(xiàn)提供了可能。
2 圖書影響力預(yù)測問題的提出和模型構(gòu)建
圖書影響力的多維性體現(xiàn)于圖書對(duì)經(jīng)濟(jì)、社會(huì)、學(xué)術(shù)等不同維度的影響力,體現(xiàn)在數(shù)量、質(zhì)量、效率、效果等多個(gè)方面??赏ㄟ^分類型、分階段開展及時(shí)且全量的圖書影響力預(yù)測,重構(gòu)時(shí)空關(guān)系,揭示出版發(fā)展規(guī)律。
2.1 圖書影響力預(yù)測問題的提出
(1)多維性。圖書影響力產(chǎn)生的過程存在復(fù)雜性和結(jié)果不確定性,導(dǎo)致難以歸因于某一圖書產(chǎn)品并量化其貢獻(xiàn)度。由于受眾多元化、渠道分散化等,影響力的全面追蹤局限于數(shù)據(jù)可獲得性和數(shù)據(jù)聚合能力。影響因素的多樣化和內(nèi)生性問題,使得影響因素測度和關(guān)鍵因素識(shí)別存在困難。在開放科學(xué)、開放獲取、開放數(shù)據(jù)的推動(dòng)下,可通過多維數(shù)據(jù)聚合,將效果研究和過程研究相結(jié)合,彌補(bǔ)效果研究在貢獻(xiàn)量化、全面追蹤、內(nèi)生性等問題上的不足。
(2)時(shí)滯性。圖書影響力的時(shí)滯性體現(xiàn)在圖書市場表現(xiàn)數(shù)據(jù)在出版社、書店、圖書館、用戶之間反饋效率低、數(shù)據(jù)不全面;專家評(píng)價(jià)、用戶評(píng)價(jià)、學(xué)術(shù)引用等影響力反饋及時(shí)性、有效性存在較大差異;出版、發(fā)行、營銷、評(píng)價(jià)、使用等多個(gè)方面的線上和線下數(shù)據(jù)聚合能力不足;圖書的影響具有持久性、傳承性、滯后性等特征[6]。
2.2 效果導(dǎo)向的圖書影響力預(yù)測模型
效果導(dǎo)向的圖書影響力預(yù)測模型旨在將影響力視為一種結(jié)果,利用系統(tǒng)理論,展示影響力的時(shí)空范圍和時(shí)空關(guān)系,聚焦影響力客體類型,以市場影響力(圖書銷量)預(yù)測模型、社會(huì)影響力預(yù)測模型、學(xué)術(shù)影響力預(yù)測模型等為代表。
(1)圖書銷量預(yù)測模型
圖書銷量預(yù)測主要采用計(jì)量經(jīng)濟(jì)模型、新產(chǎn)品擴(kuò)散模型和人工智能模型等。①計(jì)量經(jīng)濟(jì)模型從經(jīng)濟(jì)角度考慮銷量與其影響因素的因果關(guān)系,依賴較多的歷史數(shù)據(jù)和相關(guān)影響因素的測度。②新產(chǎn)品擴(kuò)散模型采用群體行為分析視角和經(jīng)典Bass模型改進(jìn)策略,將價(jià)格、廣告、用戶評(píng)分等因素納入模型的構(gòu)建,依賴產(chǎn)品每期銷量數(shù)據(jù)和新產(chǎn)品擴(kuò)散的現(xiàn)實(shí)情境。③人工智能模型采用人工神經(jīng)網(wǎng)絡(luò)等對(duì)少量的非線性數(shù)據(jù)建模,但大部分算法都是黑箱模型,模型對(duì)于結(jié)果缺乏可解釋性。
以上方法大多依賴延遲性較大的統(tǒng)計(jì)調(diào)研數(shù)據(jù),預(yù)測時(shí)效性較低;忽視了用戶生成內(nèi)容,缺乏大數(shù)據(jù)分析,預(yù)測準(zhǔn)確性受限。情感分析是從用戶生成內(nèi)容中挖掘用戶情感信息,可為經(jīng)濟(jì)價(jià)值量化與開發(fā)提供用戶口碑傳播行為分析和效果測度工具。孟園等[7]基于細(xì)粒度情感分析技術(shù),構(gòu)建細(xì)粒度綜合情感指數(shù),結(jié)合ARMA模型對(duì)產(chǎn)品的銷量預(yù)測進(jìn)行實(shí)證分析。Rocklage等[8]將圖書評(píng)論的星級(jí)、效價(jià)、文本情感納入計(jì)量經(jīng)濟(jì)模型,提出基于情感分析的圖書銷量預(yù)測模型。
(2)圖書社會(huì)影響力預(yù)測模型
圖書社會(huì)影響力具有評(píng)價(jià)主體多元、傳播渠道分散、評(píng)論關(guān)聯(lián)情感等特點(diǎn),圖書社會(huì)影響力的外在特征為用戶特征、媒介特征等。張紅麗等[9]提出基于網(wǎng)絡(luò)用戶評(píng)論的評(píng)分回歸預(yù)測模型。另外,替代計(jì)量強(qiáng)調(diào)追蹤學(xué)術(shù)文獻(xiàn)在網(wǎng)站和社會(huì)媒體上被提及或使用頻次,體現(xiàn)了受眾觸達(dá)率和關(guān)注度,可作為社會(huì)影響力的量化表征。李綱等[10]從論文、作者和期刊3個(gè)方面構(gòu)建學(xué)術(shù)論文特征框架,構(gòu)建論文推特提及量預(yù)測模型。另外,蘇娜[11]系統(tǒng)梳理并述評(píng)了國內(nèi)外對(duì)科學(xué)研究的社會(huì)影響力評(píng)價(jià)理論與實(shí)踐。
(3)圖書學(xué)術(shù)影響力預(yù)測模型
圖書學(xué)術(shù)影響力具有引用時(shí)滯、數(shù)據(jù)多源、引用關(guān)聯(lián)情感等特點(diǎn),圖書學(xué)術(shù)影響力的外在特征為圖書特征、作者特征、出版社特征、引證特征等。大數(shù)據(jù)時(shí)代,學(xué)術(shù)影響力預(yù)測強(qiáng)調(diào)聚合多平臺(tái)數(shù)據(jù)提升預(yù)測水平,強(qiáng)調(diào)推進(jìn)圖書、作者、出版社等之間的協(xié)同預(yù)測?;舫獾萚12]對(duì)論文、學(xué)者、機(jī)構(gòu)、期刊、項(xiàng)目、專利等不同學(xué)術(shù)實(shí)體影響力預(yù)測研究進(jìn)行述評(píng),總結(jié)學(xué)術(shù)影響力預(yù)測研究的指標(biāo)體系、方法體系和特征體系。
3 數(shù)據(jù)驅(qū)動(dòng)的圖書影響力預(yù)測模型構(gòu)建
圖書影響力預(yù)測模型的可能改進(jìn)策略包括:①組合預(yù)測。依據(jù)組合預(yù)測理論,2種或2種以上無偏的單項(xiàng)預(yù)測組合優(yōu)于每個(gè)單項(xiàng)預(yù)測。銷量預(yù)測可將經(jīng)濟(jì)計(jì)量模型、Bass模型及改進(jìn)模型、人工智能模型進(jìn)行組合,提高預(yù)測準(zhǔn)確度。②網(wǎng)絡(luò)口碑與經(jīng)濟(jì)計(jì)量模型相結(jié)合,可將在線評(píng)論情感分析與經(jīng)濟(jì)計(jì)量模型相結(jié)合進(jìn)行銷量預(yù)測。③網(wǎng)絡(luò)口碑與新產(chǎn)品擴(kuò)散模型相結(jié)合,可將在線評(píng)論情感分析與Bass模型及改進(jìn)模型相結(jié)合進(jìn)行銷量預(yù)測。④基于TEI@I方法論[13]的集成預(yù)測,采用先分解后集成策略,將百度指數(shù)結(jié)合經(jīng)濟(jì)計(jì)量模型進(jìn)行銷量預(yù)測。⑤協(xié)同預(yù)測,可采用圖書實(shí)體與作者實(shí)體協(xié)同策略,構(gòu)建時(shí)空關(guān)系網(wǎng)絡(luò),依據(jù)作者影響力預(yù)測圖書影響力。⑥定性與定量預(yù)測相結(jié)合,借鑒回報(bào)模型[14]的基本原理,將編輯直覺預(yù)測和同類圖書的影響力評(píng)價(jià)相結(jié)合,校正銷量直覺預(yù)測,拓展社會(huì)影響力預(yù)測。
3.1 過程導(dǎo)向的圖書影響力預(yù)測模型改進(jìn)
依據(jù)圖書影響力預(yù)測模型的可能改進(jìn)策略,提出改進(jìn)思路及模型結(jié)構(gòu)。
(1)改進(jìn)思路
科學(xué)研究的經(jīng)濟(jì)與社會(huì)影響力評(píng)價(jià)模型以回報(bào)模型、SIAMPI模型等為代表。Buxton等[14]提出評(píng)價(jià)醫(yī)學(xué)研究的經(jīng)濟(jì)與社會(huì)影響力回報(bào)模型。該模型屬于中長期影響力評(píng)價(jià)模型,解決了時(shí)滯、歸因等問題,但案例分析需要較多資源投入。Spaapen等[15]提出SIAMPI模型,通過追蹤科學(xué)研究主體與利益相關(guān)方的多樣化聯(lián)系來評(píng)價(jià)社會(huì)影響力。本文所構(gòu)建的過程導(dǎo)向的圖書影響力預(yù)測模型,旨在將影響力視為一個(gè)過程,利用知識(shí)轉(zhuǎn)移理論,展示圖書從作者流向社會(huì)的過程,聚焦于影響力產(chǎn)生機(jī)制。
(2)模型結(jié)構(gòu)
通過選題決策模型綜合利用單一性信息(作者知名度)、同類圖書分布性信息(選題成功率、歷史銷量)、市場先驗(yàn)信息(頭部效應(yīng))校正編輯直覺預(yù)測[1];通過邏輯模型劃分影響力產(chǎn)生過程的生產(chǎn)、傳播、消費(fèi)3個(gè)過程,區(qū)分圖書的選題確定、投入、開展、直接成果、間接成果、采納、成效等7個(gè)階段,界定項(xiàng)目申請與篩選、產(chǎn)品擴(kuò)散兩個(gè)關(guān)鍵轉(zhuǎn)換點(diǎn),尋找影響路徑及案例;構(gòu)建圖書影響力分類分期分級(jí)體系,對(duì)圖書出版類型(大眾出版、學(xué)術(shù)出版、專業(yè)出版)進(jìn)行分類,對(duì)短期、中期和長期影響進(jìn)行區(qū)分,對(duì)影響程度進(jìn)行分級(jí),通過圖書分類分期分級(jí)系統(tǒng)區(qū)分影響類型及載體,判定影響歸因于該圖書產(chǎn)品的程度;將定性方法與定量方法相結(jié)合,綜合利用編輯銷量直覺預(yù)測法、案例分析法、文獻(xiàn)計(jì)量法、專家評(píng)價(jià)法等進(jìn)行影響力預(yù)測,從知識(shí)擴(kuò)散視角對(duì)圖書生產(chǎn)(圖書類型、資助項(xiàng)目、國際合作、作者知名度、出版社聲譽(yù))、知識(shí)轉(zhuǎn)化(被引次數(shù)、施引文獻(xiàn)水平、館配量)、知識(shí)轉(zhuǎn)移(國際引用率、領(lǐng)域外引用率、海外館藏量)進(jìn)行文獻(xiàn)計(jì)量。
3.2 數(shù)據(jù)驅(qū)動(dòng)的圖書綜合影響力預(yù)測模型構(gòu)建
數(shù)據(jù)驅(qū)動(dòng)的圖書綜合影響力預(yù)測,旨在聚合不同來源的圖書引用、借閱、提及、評(píng)論等數(shù)據(jù),追蹤用戶關(guān)注、科研前沿和先進(jìn)思想文化,發(fā)現(xiàn)新思想、新理論、新方法,為選題決策、購買決策等提供量化預(yù)測依據(jù)。
本文采用數(shù)據(jù)驅(qū)動(dòng)預(yù)測模式,將傳統(tǒng)的統(tǒng)計(jì)技術(shù)與異質(zhì)信息網(wǎng)絡(luò)挖掘等大數(shù)據(jù)技術(shù)相結(jié)合,在構(gòu)建圖書異質(zhì)信息網(wǎng)絡(luò)模型的基礎(chǔ)上,結(jié)合圖書的銷量預(yù)測、社會(huì)影響力預(yù)測、學(xué)術(shù)影響力預(yù)測模型,構(gòu)建預(yù)測指標(biāo)體系和預(yù)測方法體系,從而構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的圖書綜合影響力預(yù)測框架(如圖1所示),同時(shí)實(shí)現(xiàn)數(shù)據(jù)融合、網(wǎng)絡(luò)構(gòu)建、實(shí)體鏈接和量化預(yù)測。
3.2.1 基本思路
數(shù)字時(shí)代,圖書產(chǎn)品在保持內(nèi)容系統(tǒng)性、思想性的基礎(chǔ)上,彰顯傳播性。用戶、圖書、作者、出版社、媒介等構(gòu)成價(jià)值創(chuàng)造的核心要素,核心要素間的連接作用決定影響力生成的方式,決定圖書價(jià)值產(chǎn)生、價(jià)值提升、價(jià)值實(shí)現(xiàn)的內(nèi)在邏輯。圖書內(nèi)容決定圖書與用戶、媒介、社會(huì)之間連接的持續(xù)性,媒介決定圖書與用戶、社會(huì)之間連接的廣度,用戶決定產(chǎn)品使用價(jià)值和圖書社會(huì)效益的實(shí)現(xiàn)程度。因此,連接作為圖書價(jià)值創(chuàng)造的基礎(chǔ)和前提,決定了影響力產(chǎn)生的方式、路徑、效果。本文堅(jiān)持系統(tǒng)論思想,將圖書置于用戶、作者、出版社、媒介等相互聯(lián)系的整體之中,考察圖書從作者流向社會(huì)的過程和效果。采用異質(zhì)信息網(wǎng)絡(luò)理論和方法[16],綜合考慮圖書、作者、出版社、用戶、媒介之間的交互關(guān)系,構(gòu)建圖書異質(zhì)信息網(wǎng)絡(luò)。考慮圖書、作者、出版社、用戶、媒介等圖書異質(zhì)網(wǎng)絡(luò)實(shí)體互為特征、協(xié)同演化,構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的圖書綜合影響力預(yù)測模型,采用子網(wǎng)絡(luò)建模不同類型實(shí)體間的交互關(guān)系和語義關(guān)系,橫向上協(xié)同開展作者影響力預(yù)測、出版社影響力預(yù)測、媒介影響力預(yù)測、用戶評(píng)分預(yù)測、銷量預(yù)測、學(xué)術(shù)影響力預(yù)測等,縱向上利用結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行屬性挖掘、結(jié)構(gòu)探索、語義探究,實(shí)現(xiàn)以已知鏈接預(yù)測未知鏈接、以現(xiàn)有鏈接預(yù)測未來鏈接。
3.2.2 基本思想
采用數(shù)據(jù)驅(qū)動(dòng)預(yù)測模式,將傳統(tǒng)的統(tǒng)計(jì)技術(shù)與異質(zhì)信息網(wǎng)絡(luò)挖掘等大數(shù)據(jù)技術(shù)相結(jié)合,從社會(huì)影響力、學(xué)術(shù)影響力、市場影響力等維度,分析數(shù)據(jù)特征;從市場表現(xiàn)、網(wǎng)絡(luò)口碑、用戶行為等方面,篩選預(yù)測指標(biāo);從短期、中期、長期3個(gè)層面,構(gòu)建預(yù)測模型。
3.2.3 基本流程
通過大數(shù)據(jù)、人工智能等技術(shù)和方法,對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行采集與預(yù)處理;建立圖書異質(zhì)信息網(wǎng)絡(luò),捕獲圖書、作者、出版社、用戶、媒介之間的交互關(guān)系和語義關(guān)系;對(duì)網(wǎng)絡(luò)口碑等進(jìn)行多層次屬性挖掘和細(xì)粒度情感分析,挖掘用戶的真實(shí)偏好與需求信息,識(shí)別用戶對(duì)圖書產(chǎn)品總體及其各個(gè)屬性的態(tài)度;從圖書產(chǎn)品的生產(chǎn)、傳播、消費(fèi)3個(gè)過程和市場表現(xiàn)、社會(huì)影響2個(gè)層面,系統(tǒng)性構(gòu)建圖書產(chǎn)品的外顯的消費(fèi)數(shù)量(叫座)和內(nèi)隱的消費(fèi)態(tài)度(叫好)的預(yù)測指標(biāo)體系;將屬性挖掘、情感分析、量化預(yù)測集成于網(wǎng)絡(luò)構(gòu)建和挖掘過程,預(yù)測圖書產(chǎn)品的社會(huì)影響力、學(xué)術(shù)影響力、市場影響力等。基本流程主要包括數(shù)據(jù)采集與預(yù)處理、圖書異質(zhì)信息網(wǎng)絡(luò)構(gòu)建、學(xué)術(shù)影響力預(yù)測、市場影響力預(yù)測、社會(huì)影響力預(yù)測。
3.2.3.1 數(shù)據(jù)收集與預(yù)處理
(1)圖書生產(chǎn)數(shù)據(jù)收集。出版大數(shù)據(jù)包括圖書產(chǎn)品的全文本數(shù)據(jù)、元數(shù)據(jù)、經(jīng)營數(shù)據(jù)、銷售數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、引證數(shù)據(jù)、館藏?cái)?shù)據(jù)等。中國版本圖書館可提供圖書產(chǎn)品的CIP核準(zhǔn)號(hào)、ISBN、正書名等圖書元數(shù)據(jù)字段。對(duì)于全文本數(shù)據(jù)、元數(shù)據(jù)、經(jīng)營數(shù)據(jù)等,可通過注冊、自建、采購等方式獲取。
(2)圖書傳播數(shù)據(jù)采集。當(dāng)當(dāng)網(wǎng)可提供星級(jí)評(píng)分、評(píng)論內(nèi)容、評(píng)論時(shí)間等在線評(píng)論信息以及前500圖書銷售排行榜。對(duì)于當(dāng)當(dāng)網(wǎng)、京東網(wǎng)、豆瓣讀書等平臺(tái)的網(wǎng)絡(luò)數(shù)據(jù),可利用LocoyPoster 軟件工具進(jìn)行采集,通過ISBN與圖書元數(shù)據(jù)、經(jīng)營數(shù)據(jù)、營銷數(shù)據(jù)、引證數(shù)據(jù)、館藏?cái)?shù)據(jù)等進(jìn)行關(guān)聯(lián)聚合。
(3)圖書消費(fèi)數(shù)據(jù)收集。中文學(xué)術(shù)圖書引文索引(CBKCI)可提供4 000余本學(xué)術(shù)圖書的被引數(shù)量和施引文獻(xiàn)題錄。CNKI可提供14 000余本中文圖書的被引數(shù)量、閱讀數(shù)量和用戶數(shù)量。讀秀可提供230萬余種中文圖書的被引用指數(shù)、被圖書引用數(shù)量、引證圖書目錄和館藏量。SpringerLink平臺(tái)提供Bookmetrix指標(biāo),包括圖書及章節(jié)的被引、下載、提及、評(píng)論和用戶數(shù)量。WorldCat提供OCLC近兩萬家成員館編目的書目記錄和館藏記錄。百度指數(shù)平臺(tái)可提供搜索引擎用戶關(guān)注度數(shù)據(jù)。對(duì)于引證數(shù)據(jù)、館藏?cái)?shù)據(jù)、搜索數(shù)據(jù)等,采用直接從文獻(xiàn)數(shù)據(jù)庫和平臺(tái)中收集相關(guān)數(shù)據(jù)。
(4)數(shù)據(jù)預(yù)處理。對(duì)于在線評(píng)論等網(wǎng)絡(luò)口碑?dāng)?shù)據(jù),可通過Python、NLPIR、Jiebar等工具,進(jìn)行分句、分詞、詞性標(biāo)注、詞頻統(tǒng)計(jì)等預(yù)處理;整合How Net情感詞典、大連理工大學(xué)情感詞匯本體庫等,形成基礎(chǔ)情感詞典;將在線評(píng)論時(shí)間依據(jù)預(yù)測需求,劃分為年、月、日等不同的時(shí)間粒度;將中圖法分類與電商網(wǎng)站圖書分類進(jìn)行映射,依據(jù)各種分類體系劃分不同的主題粒度。
3.2.3.2 圖書異質(zhì)信息網(wǎng)絡(luò)構(gòu)建
針對(duì)影響力的多維性和信息融合問題,將異質(zhì)信息網(wǎng)絡(luò)作為一種對(duì)復(fù)雜對(duì)象及其關(guān)系建模的方法,通過從網(wǎng)絡(luò)數(shù)據(jù)中挖掘鏈接關(guān)系和語義信息來發(fā)現(xiàn)隱藏模式。
(1)多模網(wǎng)絡(luò)構(gòu)建。例如,由出版大數(shù)據(jù)形成的圖書信息網(wǎng)絡(luò)可被建模為一個(gè)5-模異質(zhì)共現(xiàn)網(wǎng)絡(luò),表示為一個(gè)帶有對(duì)象類型映射函數(shù)t=v→A和關(guān)系類型映射函數(shù)φ=ε→R的有向圖G=(v,ε),包含圖書名稱(B)、作者名稱(A)、出版社名稱(P)、媒介名稱(M)、用戶名稱(U)5個(gè)對(duì)象類型以及同一關(guān)系、創(chuàng)作關(guān)系、出版關(guān)系、傳播關(guān)系、評(píng)價(jià)關(guān)系5個(gè)關(guān)系類型,每個(gè)對(duì)象關(guān)聯(lián)文本屬性和時(shí)間屬性。
(2)元路徑分析。元路徑[16]是在網(wǎng)絡(luò)模式TG=(AR)的圖上的一條路徑,它的形式是,縮寫為A1A2…Al+1,描述了節(jié)點(diǎn)類型A1到Al+1之間的關(guān)系。不同元路徑以不同的語義表示對(duì)象間的關(guān)系序列,其中BAB、BUMUB元路徑分別表示同一作者創(chuàng)作了2本圖書、2個(gè)用戶在同一媒介上評(píng)價(jià)了2本圖書。元路徑分析可通過基于元路徑的相似性測度方法PathSim[16],發(fā)現(xiàn)更相似的兩個(gè)對(duì)象?;谙嗨茍D書的銷量時(shí)間序列,可對(duì)圖書新產(chǎn)品進(jìn)行銷量預(yù)測。異質(zhì)信息網(wǎng)絡(luò)構(gòu)建從網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)入手,通過多模網(wǎng)絡(luò)構(gòu)建,對(duì)異質(zhì)節(jié)點(diǎn)間的共現(xiàn)關(guān)系進(jìn)行融合;通過元路徑分析,對(duì)不同網(wǎng)絡(luò)層級(jí)進(jìn)行關(guān)聯(lián),實(shí)現(xiàn)信息融合和網(wǎng)絡(luò)建模。
3.2.3.3 學(xué)術(shù)影響力預(yù)測
圖書學(xué)術(shù)影響力預(yù)測旨在提前識(shí)別出高質(zhì)量圖書,綜合文獻(xiàn)計(jì)量、圖書、作者、出版社等特征,采用回歸分析方法和人工神經(jīng)網(wǎng)絡(luò)方法等,構(gòu)建引證數(shù)量預(yù)測模型,預(yù)測引證的變化。
(1)預(yù)測指標(biāo)體系構(gòu)建。圖書學(xué)術(shù)影響力的外在特征為圖書特征、作者特征、出版社特征、引證特征等。其中,圖書特征主要包括圖書主題成熟度、圖書名稱長度、參考文獻(xiàn)數(shù)量等;作者特征主要包括作者學(xué)術(shù)影響力(H指數(shù))、署名作者數(shù)量、作者創(chuàng)作圖書數(shù)量、作者被引用圖書數(shù)量、作者國別、作者所屬機(jī)構(gòu)聲譽(yù)等;出版社特征主要包括出版社聲譽(yù)、出版社等級(jí)、編輯影響力等;引證特征主要包括被論文引用數(shù)量、被圖書引用數(shù)量、被引年份跨度、首次被引年份、早期施引者的學(xué)術(shù)影響力等。
(2)預(yù)測方法體系構(gòu)建。①回歸分析預(yù)測方法。以外在特征為自變量,以引證數(shù)量為因變量;采用線性回歸、嶺回歸、逐步線性回歸模型,預(yù)測中短期引證數(shù)量,適用于存在明顯線性關(guān)系的截面數(shù)據(jù)或時(shí)間序列建模。②時(shí)間趨勢分析。從引證歷史數(shù)據(jù)觀察趨勢規(guī)律,采用分解分析、移動(dòng)平均、指數(shù)平滑進(jìn)行短期預(yù)測,采用趨勢外推進(jìn)行中長期預(yù)測,適用于規(guī)律性強(qiáng)的時(shí)間序列建模。③人工神經(jīng)網(wǎng)絡(luò)方法。采用時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)(RNN)等方法,利用數(shù)據(jù)的高維度特征,預(yù)測長期引證數(shù)量。④基于元路徑的關(guān)系預(yù)測方法[16]。對(duì)于圖書異質(zhì)信息網(wǎng)絡(luò),綜合考慮作者權(quán)威度、出版社影響力等相互作用和引用權(quán)重設(shè)置,通過構(gòu)建圖書-作者、圖書-出版社-作者等子網(wǎng)絡(luò),利用網(wǎng)絡(luò)實(shí)體間的交互關(guān)系和子網(wǎng)絡(luò)間的相互強(qiáng)化關(guān)系,采用基于元路徑的關(guān)系預(yù)測方法,實(shí)現(xiàn)引證關(guān)系預(yù)測。
3.2.3.4 市場影響力預(yù)測
圖書市場影響力預(yù)測旨在量化網(wǎng)絡(luò)口碑?dāng)?shù)據(jù),從圖書產(chǎn)品的內(nèi)容、形式、價(jià)值、服務(wù)4個(gè)子維度出發(fā),采用細(xì)粒度情感分析方法,結(jié)合計(jì)量經(jīng)濟(jì)模型、Bass模型及擴(kuò)展、人工智能模型等,構(gòu)建納入屬性情感的銷量預(yù)測模型,預(yù)測未來的銷量。
(1)預(yù)測指標(biāo)體系構(gòu)建。圖書市場影響力的外在特征為圖書特征、用戶特征、媒介特征等。其中,圖書特征主要包括圖書類型、產(chǎn)品生命周期等;用戶特征主要包括用戶級(jí)別、百度指數(shù)等;媒介特征主要包括用戶評(píng)分、評(píng)論數(shù)量、屬性情感等。
(2)預(yù)測方法體系構(gòu)建。①隨機(jī)時(shí)間序列預(yù)測法。采用細(xì)粒度情感分析方法,進(jìn)行屬性詞典構(gòu)建、情感詞典構(gòu)建、屬性抽取、情感詞抽取、屬性的情感分類,構(gòu)造細(xì)粒度情感指數(shù),采用AR模型、ARMA模型等隨機(jī)時(shí)間序列預(yù)測法,構(gòu)建屬性情感感知預(yù)測模型,預(yù)測中短期圖書銷量。②人工智能方法。將圖書名稱作為搜索關(guān)鍵詞,獲取圖書的百度指數(shù),采用SVM、隨機(jī)森林等人工智能方法,預(yù)測中短期圖書銷量,適用于存在搜索關(guān)鍵詞不易產(chǎn)生歧義的百度指數(shù)。③基于元路徑的相似性測度方法[16]。對(duì)于圖書異質(zhì)信息網(wǎng)絡(luò),綜合考慮用戶影響力、媒介影響力等相互作用和評(píng)論權(quán)重設(shè)置,通過構(gòu)建圖書-用戶、圖書-媒介-用戶等子網(wǎng)絡(luò),采用基于元路徑的相似性測度方法,結(jié)合相似圖書的歷史銷量數(shù)據(jù),實(shí)現(xiàn)圖書新產(chǎn)品銷量預(yù)測。
3.2.3.5 社會(huì)影響力預(yù)測
圖書社會(huì)影響力預(yù)測旨在量化外顯的消費(fèi)數(shù)量(叫座)和內(nèi)隱的消費(fèi)態(tài)度(叫好),從圖書的傳播媒介、輻射范圍、傳播效果3個(gè)方面,獲取評(píng)價(jià)數(shù)據(jù)、使用數(shù)據(jù)和替代計(jì)量數(shù)據(jù),采用回歸分析方法和情感分析方法等,構(gòu)建社會(huì)效益量化預(yù)測模型,預(yù)測評(píng)分、熱度等。
(1)預(yù)測指標(biāo)體系構(gòu)建。圖書社會(huì)影響力的外在特征為圖書特征、媒介特征等。其中,圖書特征主要包括重版率、重印率等;媒介特征主要包括圖書下載量、提及量、海外館藏量、國內(nèi)館藏量等。
(2)預(yù)測方法體系構(gòu)建。①回歸分析預(yù)測方法。以文本情感傾向、評(píng)論數(shù)量、讀過數(shù)量、在讀數(shù)量、想讀數(shù)量等為自變量,采用回歸分析方法和情感分析方法,構(gòu)建圖書產(chǎn)品的評(píng)分預(yù)測模型,適用于存在明顯線性關(guān)系的截面數(shù)據(jù)或時(shí)間序列建模。②人工智能方法。結(jié)合圖書特征、媒介特征等,采用SVM、隨機(jī)森林等人工智能方法,構(gòu)建圖書新產(chǎn)品的評(píng)分預(yù)測模型。③時(shí)間趨勢分析。對(duì)于時(shí)間序列數(shù)據(jù),以館藏量、下載量、提及量等為歷史數(shù)據(jù),采用分解分析、移動(dòng)平均、指數(shù)平滑進(jìn)行短期預(yù)測,采用趨勢外推進(jìn)行中長期預(yù)測,構(gòu)建圖書熱度預(yù)測模型。④基于加權(quán)元路徑的相似性測度方法[17]。對(duì)于圖書異質(zhì)信息網(wǎng)絡(luò),通過構(gòu)建圖書-用戶、圖書-媒介-用戶等子網(wǎng)絡(luò),采用基于加權(quán)元路徑的相似性測度方法,結(jié)合用戶-圖書歷史評(píng)分矩陣,實(shí)現(xiàn)評(píng)分預(yù)測。
4 結(jié)語
習(xí)近平總書記在文藝工作座談會(huì)上強(qiáng)調(diào),“一個(gè)好的作品,應(yīng)該是把社會(huì)效益放在首位,同時(shí)也應(yīng)該是社會(huì)效益和經(jīng)濟(jì)效益相統(tǒng)一的作品”。圖書影響力預(yù)測是保證和促進(jìn)影響力經(jīng)濟(jì)、社會(huì)效益優(yōu)先的重要手段。出版經(jīng)濟(jì)是影響力經(jīng)濟(jì),影響力經(jīng)濟(jì)建立在影響力之上[6]。保證和促進(jìn)影響力經(jīng)濟(jì)、社會(huì)效益優(yōu)先,關(guān)鍵在于雙效統(tǒng)一。圖書產(chǎn)品的雙效統(tǒng)一體現(xiàn)于“叫好又叫座”的主題出版圖書,體現(xiàn)于讀者喜聞樂見的暢銷書、常銷書,體現(xiàn)于“為人民出好書”的精品書、品牌書。
圖書是精神產(chǎn)品內(nèi)核和物質(zhì)產(chǎn)品形態(tài)的統(tǒng)一,在空間的社會(huì)傳播、時(shí)間的歷史傳承過程中,通過對(duì)用戶的精神影響,進(jìn)而對(duì)社會(huì)產(chǎn)生作用,體現(xiàn)其社會(huì)效益;在口碑傳播、產(chǎn)品營銷過程,通過對(duì)用戶的消費(fèi)影響,進(jìn)而對(duì)經(jīng)濟(jì)產(chǎn)生作用,體現(xiàn)其經(jīng)濟(jì)效益。圖書社會(huì)效益的評(píng)價(jià)指標(biāo)圍繞圖書質(zhì)量、社會(huì)傳播、歷史傳承展開,其中社會(huì)傳播體現(xiàn)了作者、用戶、傳播媒介、輻射范圍、傳播效果之間交織的時(shí)空關(guān)系以及思想影響的深度和范圍,歷史傳承體現(xiàn)了圖書的長效影響力,但難以使用當(dāng)前指標(biāo)量化。圖書經(jīng)濟(jì)效益的評(píng)價(jià)指標(biāo)圍繞銷量展開,其中常銷書、館配量、重版率、重印率、產(chǎn)品生命周期等市場表現(xiàn)指標(biāo),體現(xiàn)了口碑傳播的廣度、深度、持久度,但難以即時(shí)量化。圖書的雙效評(píng)價(jià)存在時(shí)滯性特征,圖書影響力預(yù)測可以提前預(yù)測圖書產(chǎn)品的經(jīng)濟(jì)效益和社會(huì)效益。
影響力經(jīng)濟(jì)強(qiáng)調(diào)基于圖書內(nèi)容的交互功能和注意力保持策略,主張以供給側(cè)圖書內(nèi)容創(chuàng)新與質(zhì)量提升來保證和促進(jìn)影響力經(jīng)濟(jì)、社會(huì)效益優(yōu)先。數(shù)據(jù)驅(qū)動(dòng)的圖書影響力預(yù)測模型提供了一個(gè)開展圖書影響力預(yù)測的理論框架,勾勒了圖書影響力預(yù)測在模型層面的初步框架,有利于推動(dòng)出版物量化預(yù)測從銷量預(yù)測拓展至影響力預(yù)測。
本文嘗試探索從需求側(cè)圖書影響力預(yù)測來保證和促進(jìn)影響力經(jīng)濟(jì)、社會(huì)效益優(yōu)先。①將效果研究與過程研究相結(jié)合,建立圖書影響力分析框架,分析影響力產(chǎn)生機(jī)制及載體影響,探析“雙效統(tǒng)一”模式的現(xiàn)實(shí)邏輯和實(shí)現(xiàn)路徑;②將編輯直覺預(yù)測和同類圖書的影響力評(píng)價(jià)相結(jié)合,改進(jìn)過程導(dǎo)向的圖書影響力預(yù)測模型,拓展回報(bào)模型的應(yīng)用范圍;③將協(xié)同預(yù)測與異質(zhì)網(wǎng)絡(luò)構(gòu)建相結(jié)合,結(jié)合圖書的銷量預(yù)測、社會(huì)影響力預(yù)測、學(xué)術(shù)影響力預(yù)測模型,構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的圖書綜合影響力預(yù)測模型,拓展影響力預(yù)測新視野。
在開放數(shù)據(jù)和數(shù)字技術(shù)賦能下,數(shù)據(jù)驅(qū)動(dòng)的圖書影響力預(yù)測有望成為保證和促進(jìn)影響力經(jīng)濟(jì)、社會(huì)效益優(yōu)先的重要手段和量化預(yù)測新模式。
(責(zé)任編輯:郭劍)
參考文獻(xiàn)
[1] 楊金花.圖書銷量預(yù)測偏差與校正[J].出版發(fā)行研究,2020(4):46-49.
[2] 徐麗芳.閱讀研究的萬花鏡:讀《閱讀社會(huì)學(xué)》的幾點(diǎn)啟示[J].傳媒,2021(1):77-78.
[3] 王鵬濤.新技術(shù)環(huán)境下閱讀演進(jìn)研究:趨勢、特征與應(yīng)對(duì)[J].編輯之友,2020(4):28-33.
[4] 萬安倫,黃婧雯.論主題出版的特質(zhì)與價(jià)值[J].編輯之友,2019(10):33-37.
[5] 江小涓.數(shù)字時(shí)代的技術(shù)與文化[J].中國社會(huì)科學(xué), 2021(8):4-34.
[6] 于殿利.出版是什么[M].北京:中國傳媒大學(xué)出版社, 2018:75.
[7] 孟園,王洪偉,王偉.網(wǎng)絡(luò)口碑對(duì)產(chǎn)品銷量的影響:基于細(xì)粒度的情感分析方法[J].管理評(píng)論,2017, 29(1):144-154.
[8] ROCKLAGE M D,RUCKER D D,NORDGREN L F.Mass-scale emotionality reveals human behaviour and marketplace success[J].Nature Human Behaviour, 2021:1-7.
[9] 張紅麗,劉濟(jì)郢,楊斯楠,等.基于網(wǎng)絡(luò)用戶評(píng)論的評(píng)分預(yù)測模型研究[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2017, 1(8):48-58.
[10] 李綱,管為棟,馬亞雪,等.學(xué)術(shù)論文的社交媒體可見性預(yù)測研究[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2020,4(8):63-74.
[11] 蘇娜.科學(xué)研究的社會(huì)影響力評(píng)價(jià):研究與實(shí)踐進(jìn)展[J].情報(bào)學(xué)報(bào),2020,39(10):1114-1119.
[12] 霍朝光,董克,魏瑞斌.學(xué)術(shù)影響力預(yù)測研究進(jìn)展述評(píng)[J].情報(bào)學(xué)報(bào),2021,40(7):768-779.
[13] WANG S Y.TEI@I:A New Methodology for Studying Complex Systems[C]// The International Workshop on Complexity Science,Tsukuba,Japan,2004.
[14] BUXTON M, HANNEY S.How can payback from health services research be assessed?[J].Journal of Health Services Research and Policy,1996,1(1):35-43.
[15] SPAAPEN J,VAN D L.Introducing‘productive interactions’in social impact assessment[J].Research Evaluation,2011,20(3):211-218.
[16] 孫藝洲,韓家煒.異構(gòu)網(wǎng)絡(luò)挖掘原理與方法[M].段磊,朱敏,唐常杰,譯.北京:機(jī)械工業(yè)出版社,2016:148-151.
[17] 石川,俞士綸.異質(zhì)信息網(wǎng)絡(luò)分析與應(yīng)用[M].胡琳梅,石川,譯.北京:機(jī)械工業(yè)出版社,2021:95-100.
Research on Data Driving Book Impact Prediction Models
Juan Ren1 Zhao Yang2
1.Shanghai Publishing and Media Research Institute, Shanghai Publishing and Printing College,Shanghai 200093,China; 2.Shanghai Jiao Tong University Library, Shanghai 200240,China
Abstract Book impact prediction is an important part of publishing big data prediction. It aims to analyze and use the development rule of publishing, predict the future impact of books, and provide social benefit evaluation means and strategic management tools for decision-making. It establishes the analysis framework from the whole chain of book production, communication and consumption to analyze the intrinsic logic of book impact. Aiming at the problems of multi-dimensions and time-lag of book impact, it proposes that a process oriented book impact prediction model can be constructed by combining the topic selection decision-making model, logical model and book classification model system with stages and levels. Combined the book sales prediction model, book social impact prediction model with book academic impact prediction model, a data-driven book comprehensive impact prediction model can be constructed. With the empowerment of open data and digital technology, study on data-driven book impact prediction is expected to become an important method and a new quantitative prediction pattern to ensure both social benefits and influence economy.
Keywords Book; Social benefits; Impact prediction; Data driving; Sales