劉萬年
(北京體育大學(xué)出版社,北京 100000)
全球經(jīng)濟(jì)正在迅猛發(fā)展,人們進(jìn)入了大數(shù)據(jù)時代。面對龐大的圖書市場,圖書可選信息越發(fā)繁雜,圖書編輯如何從其中篩選出符合市場需求的信息是極為重要的工作。[1]因為一旦圖書編輯沒有了解到市場的真實需求,就會導(dǎo)致所策劃的圖書無法得到市場認(rèn)可,從而對銷量產(chǎn)生巨大影響,直接威脅著圖書企業(yè)的生存發(fā)展。圖書編輯作為一個肩負(fù)著傳播知識的歷史使命的傳統(tǒng)行業(yè)從業(yè)者,在此大環(huán)境下同樣面臨著大數(shù)據(jù)時代帶來的新挑戰(zhàn)。[2]當(dāng)前,我國出版業(yè)面臨著圖書消費需求增長變緩,圖書成本提高、庫存加重等問題,造成圖書行業(yè)面臨很大的發(fā)展困境。因此圖書行業(yè)迫切需要深化改革,其中圖書選題的進(jìn)一步優(yōu)化是改革重點之一,選題策劃是圖書編輯進(jìn)行決策的關(guān)鍵步驟,一本圖書的成功發(fā)行,離不開準(zhǔn)確有效的選題策劃。
圖書編輯可以根據(jù)出版社的選題方向、市場需求、讀者體驗等大數(shù)據(jù)分析結(jié)果進(jìn)行具體分析規(guī)劃。在圖書的多樣化、個性化、社會化的特征基礎(chǔ)上,準(zhǔn)確了解大眾的閱讀傾向和閱讀需求,分析出圖書消費市場的風(fēng)向動態(tài),及時搜集整理圖書市場的熱點信息,最大限度地判斷圖書市場的趨勢,有效掌握公眾反饋信息,為選題決策提供依據(jù)。
圖書市場的價格趨勢,讀者購買量和閱讀習(xí)慣,圖書各渠道銷售情況的收集、處理和分析均來自圖書市場的反饋,這其中蘊含著很多機遇,進(jìn)而形成新的圖書選題策劃。[3]圖書編輯要對市場趨勢、消費者反饋、競品圖書、推廣方式、盈利能力等信息進(jìn)行了解,需要保證圖書信息的準(zhǔn)確。在當(dāng)前的圖書市場中,圖書信息在各大購物網(wǎng)站上分布廣泛,圖書銷售的數(shù)據(jù)量大、增長速度快,數(shù)據(jù)獲取隨之增加。要想迅速識別圖書市場的有用信息,利用大數(shù)據(jù)技術(shù)開展圖書市場需求的分析就可以高效達(dá)成,且能進(jìn)一步保證數(shù)據(jù)的精準(zhǔn)度。基于此,本文使用大數(shù)據(jù)背景下的Hive數(shù)據(jù)管理技術(shù),對圖書數(shù)據(jù)進(jìn)行管理,完整的模塊信息如下圖1所示。
圖1 基于大數(shù)據(jù)的圖書選題策劃信息模塊
如圖1所示,在大數(shù)據(jù)的應(yīng)用下,圖書選題策劃數(shù)據(jù)驅(qū)動模塊可以分為圖書數(shù)據(jù)提取模塊、圖書數(shù)據(jù)存儲模塊、圖書元數(shù)據(jù)模塊、選題策劃模塊四部分,每個模塊的特征向量均會存在不同的權(quán)重。由于圖書購買用戶不同,根據(jù)用戶信息可以分析出用戶的需求書籍類型,在圖書買賣過程中,會出現(xiàn)不同瀏覽行為,通過圖書翻閱次數(shù)、圖書購買次數(shù)、圖書評價等信息,可以指導(dǎo)圖書的選題策劃方向。[4]此外,本文設(shè)計的圖書選題策劃方法,會根據(jù)圖書近期銷售進(jìn)行預(yù)測,如果對用戶的預(yù)測成功,則說明策劃方案是成功的;如果失敗,則需要進(jìn)一步分析圖書購買需求,完善選題策劃的多樣性與豐富性。在使用大數(shù)據(jù)技術(shù)過程中,需要對用戶的圖書購買特征進(jìn)行分析,去除從眾因素,保證圖書數(shù)據(jù)的真實性。根據(jù)大數(shù)據(jù)分析結(jié)果對圖書市場需求進(jìn)行精準(zhǔn)把控。
在大數(shù)據(jù)時代,人們的需求開始透明化,通過大數(shù)據(jù)的使用,將用戶對圖書的購買行為進(jìn)行分析,了解圖書市場的動態(tài)變化。在圖書編輯領(lǐng)域,選題工作不僅要充分利用大數(shù)據(jù),還要對圖書購買需求進(jìn)行預(yù)測,擴展數(shù)據(jù)所反映的圖書價值。
大數(shù)據(jù)的影響越來越廣泛,已經(jīng)逐漸滲透到人們生活的方方面面。[5]大數(shù)據(jù)正在改變著人們的生活方式,其數(shù)據(jù)信息處理的結(jié)果,有可能比業(yè)內(nèi)資深人士預(yù)測得更加準(zhǔn)確。傳統(tǒng)的選題信息采集工作,局限于策劃者的信息收集,高度依賴于優(yōu)秀編輯的經(jīng)驗判斷。有些時候,圖書編輯人員會出現(xiàn)錯失良機的現(xiàn)象,導(dǎo)致圖書信息采集不準(zhǔn)確,對同期的圖書銷售造成影響。而本文基于大數(shù)據(jù)對圖書選題信息進(jìn)行采集,通過數(shù)據(jù)的全面收集和分析,讓數(shù)據(jù)說話,準(zhǔn)確地預(yù)測圖書銷量信息與受歡迎程度。[1]
在此預(yù)測環(huán)境下,可以增強圖書信息的選題準(zhǔn)確性,并滿足讀者需求。大數(shù)據(jù)的采集工作,主要通過對圖書市場的精準(zhǔn)分析,完整地把控圖書市場需求,同時反向運作也同樣適用,如通過對不同年齡段的喜好,進(jìn)行書籍的推送。以青少年為例,可以推送一些具有豐富科學(xué)知識的小說,不僅可以增加閱讀興趣,還可以學(xué)習(xí)到相關(guān)知識。對中老年人來說,多推送一些她們年輕時代的故事,可以使其回憶起年輕的生活,并對未來的道路充滿希望。我國目前有500多家出版社以及相當(dāng)數(shù)量的民營圖書策劃公司,圖書編輯隊伍龐大,但是圖書選題的主題相對歐美國家要少,每年暢銷書數(shù)量與整體行業(yè)銷售量不成正比。本文認(rèn)為,主要是因為圖書編輯沒有對市場的需求形成正確的理解把握,獲取到的信息不能夠支撐編輯團(tuán)隊的真正成長。大數(shù)據(jù)時代的到來,為圖書編輯指明了方向,那就是利用數(shù)據(jù)支撐,收集有效準(zhǔn)確的選題信息,切實策劃符合市場需求的圖書產(chǎn)品,并提高選題質(zhì)量,促進(jìn)圖書市場的繁榮與發(fā)展。
從市場層面分析,教育類圖書的編輯主題與內(nèi)容框架,可以通過篩選教育數(shù)據(jù),將其進(jìn)行供應(yīng)需求的分析。由于我國對教育行業(yè)的重視程度,圖書市場中教育類圖書所占比重較大,在龐大的教育圖書中,圖書編輯必須提前解決選題內(nèi)容框架,減少潛在的競爭。因此,對教育類的圖書選題策劃過程中,符合市場要求與競爭的有效資源信息方面至關(guān)重要。從供給層面分析,需要圖書編輯參與圖書數(shù)據(jù)庫的搭建。[6]并利用專業(yè)化的指導(dǎo)和時效性的數(shù)據(jù),對教育類圖書的選題進(jìn)行調(diào)研,并利用優(yōu)秀編輯相關(guān)教育圖書方面的編輯經(jīng)驗,對選題內(nèi)容進(jìn)行初步規(guī)劃,再利用大數(shù)據(jù)深度挖掘圖書信息,真正意義上滿足圖書市場的發(fā)展需求。此外,大數(shù)據(jù)的應(yīng)用經(jīng)過多年積累,可以稱其為大數(shù)據(jù)智能平臺,通過大數(shù)據(jù)對用戶的購買行為來獲取數(shù)據(jù)情報,得到圖書的有效價值信息。使用大數(shù)據(jù)的后臺技術(shù),對相關(guān)用戶的圖書購買行為進(jìn)行記錄,收集用戶的搜索關(guān)鍵字,使圖書選題策劃在行業(yè)領(lǐng)域內(nèi)擁有領(lǐng)先優(yōu)勢。任何產(chǎn)業(yè)的發(fā)展,都會結(jié)合最新的尖端技術(shù),圖書行業(yè)也不例外,通過大數(shù)據(jù)的融合,可以將圖書數(shù)據(jù)精準(zhǔn)地把控,得出準(zhǔn)確的數(shù)據(jù)基礎(chǔ),保證圖書選題策劃的精準(zhǔn)性,對圖書行業(yè)的發(fā)展創(chuàng)造潛力條件。綜上所述,本文設(shè)計的圖書選題策劃方法,通過大數(shù)據(jù)的介入,為圖書編輯提供一個接地氣的、強有力的、具有真實市場指導(dǎo)意義的輔助工具。
為了實現(xiàn)數(shù)據(jù)驅(qū)動的選題策劃模式,本文設(shè)計了在數(shù)據(jù)挖掘下的數(shù)據(jù)庫,如下表1所示。
表1 核心數(shù)據(jù)庫
如表1所示,為本文設(shè)計的核心數(shù)據(jù)庫,根據(jù)此數(shù)據(jù)庫的設(shè)計,可以提取圖書相關(guān)信息,通過圖書ID,建立圖書鏈接,從而得到相關(guān)數(shù)據(jù)的屬性信息。
功能數(shù)據(jù)庫設(shè)計如下表2所示。
表2 功能數(shù)據(jù)庫
表2所示為功能數(shù)據(jù)庫的設(shè)計,通過搜索圖書URL,得出相關(guān)圖書的信息數(shù)據(jù)。
數(shù)據(jù)存儲庫的設(shè)計如下表3所示。
表3 數(shù)據(jù)存儲庫
通過此數(shù)據(jù)庫的設(shè)計,可以實現(xiàn)選題策劃的信息讀取、更新、刪除,以及增加等操作,保證圖書數(shù)據(jù)的豐富性。
為了驗證本文設(shè)計方法是否具有實效性,在此對其展開實驗,實驗的過程及結(jié)果如下。
由于圖書市場環(huán)境較為復(fù)雜,本文利用分布式將圖書信息集群分為5個節(jié)點,使用Master與CentOS為主要操作系統(tǒng),以Linux為主要服務(wù)器,CPU主頻保持在3.5GHz,信息數(shù)據(jù)存儲為8G,存儲空間為1T,由此得出的集群參數(shù)如下表4所示。
表4 圖書集群參數(shù)表
如表4所示,在此參數(shù)下,對圖書數(shù)據(jù)進(jìn)行可行性評估。為了提高實驗的精準(zhǔn)度,本文從圖書數(shù)據(jù)量的100萬行至1000萬行之間的圖書進(jìn)行數(shù)據(jù)分析,在大數(shù)據(jù)背景下,得出圖書信息集群的5個節(jié)點圖書選題受歡迎程度如下圖2所示。
圖2 圖書信息集群的5個節(jié)點圖書選題受歡迎程度
如圖2所示,在5個節(jié)點中,隨著數(shù)據(jù)量的增加,圖書選題受歡迎程度也隨之增加,可以滿足選題需求。
在以上環(huán)境下,對傳統(tǒng)選題策劃方法圖書選題受歡迎程度,與本文設(shè)計選題策劃方法圖書選題受歡迎程度做對比,結(jié)果如表5所示,兩種方法圖書選題受歡迎程度均會隨著數(shù)據(jù)量的增加而增加。傳統(tǒng)選題策劃方法圖書選題受歡迎程度始終在60%以下,受歡迎程度較低,無法適應(yīng)大數(shù)據(jù)環(huán)境;本文設(shè)計的選題策劃方法圖書選題受歡迎程度在數(shù)據(jù)量為1000時,理論上受歡迎程度達(dá)到了100%,可以適應(yīng)大數(shù)據(jù)環(huán)境,保證選題的精確性。符合本文研究目的。
表5 實驗結(jié)果
近年來,在大數(shù)據(jù)的背景下,各行各業(yè)得到了空前的發(fā)展,為我國經(jīng)濟(jì)進(jìn)步創(chuàng)造了條件。圖書編輯作為人們學(xué)習(xí)知識的鋪路者,對推動人類精神文明的建設(shè)起到了相當(dāng)重要的作用。傳統(tǒng)圖書選題策劃較為主觀化,其選題受歡迎程度平均水平較低,目前已經(jīng)不再適應(yīng)圖書傳播需求,無法鞏固社會經(jīng)濟(jì)效益?;诖?,本文以大數(shù)據(jù)為前提,設(shè)計選題策劃方法,摒棄傳統(tǒng)方法的缺點,通過與大數(shù)據(jù)的融合,對圖書選題進(jìn)行可行性分析,科學(xué)指導(dǎo)市場圖書選題策劃方向,提高選題受歡迎程度,以期為今后圖書行業(yè)的深化改革與建設(shè)添磚加瓦。