崔永政
大數(shù)據(jù)來勢洶洶,正在改變著世界,出版業(yè)自然也不例外,部分出版單位已經(jīng)開始涉足大數(shù)據(jù)分析。但對于大多數(shù)出版單位而言,大數(shù)據(jù)依然顯得很神秘。什么是大數(shù)據(jù)?通過百度百科查詢可知,大數(shù)據(jù)是指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。出版業(yè)有大數(shù)據(jù)嗎?大家說法不一,但大部分人對出版業(yè)有大數(shù)據(jù)是持肯定態(tài)度的。那到底什么是出版大數(shù)據(jù)呢?目前百度百科和其他百科未能搜到相關詞條。在“出版業(yè)供給側結構性改革解決之道·優(yōu)化供給優(yōu)控庫存2016年度峰會”上,國家新聞出版廣電總局數(shù)字出版司原副司長馮宏聲提出了新聞出版業(yè)大數(shù)據(jù)基本體系,把新聞出版業(yè)大數(shù)據(jù)大致劃分為五個層面:一是新聞出版生產過程中產生的內容資源數(shù)據(jù),這是出版業(yè)最為核心的層面;二是所有產品信息的基礎數(shù)據(jù),是產品層;三是出版產品流通中所產生的數(shù)據(jù),包括整個出版業(yè)務運行狀況的信息,是業(yè)務層;四是市場層,主要是產品的消費數(shù)據(jù);五是用戶層,主要包括消費者的反饋數(shù)據(jù),記錄了廣大用戶的行為數(shù)據(jù)和評價信息。
目前業(yè)界普遍認為,出版社圖書出版的每一個環(huán)節(jié)都離不開大數(shù)據(jù)。出版社應該在以下五個方面運用好大數(shù)據(jù)。
出版社通過調查問卷的方式收集讀者數(shù)據(jù),然后對讀者數(shù)據(jù)進行分析,可以了解讀者對產品的喜好,這樣就可以讓編輯有針對性地策劃、生產出符合讀者潛在需求的出版物。出版社可以積極與掌握線上相關讀者數(shù)據(jù)的客戶合作,分析讀者使用搜索功能的海量數(shù)據(jù),從中發(fā)掘出讀者的偏好趨勢和圖書市場的潛在需求。此外,出版社可以通過對微博、微信上以及在線閱讀網(wǎng)站等與圖書相關的關鍵詞進行排序,挖掘近期熱門的內容題材和作者。
在確定印量的環(huán)節(jié),通過對同類書的市場熱度、作者的影響力和已出版同類圖書的銷售庫存情況進行分析,出版社可以推測出這本書的首印量大概是多少。新書首印的數(shù)量不僅影響成本控制,更重要的是它關系到出版社的贏利,印多了不僅達不到預期的利潤,而且還會增加多余的庫存,從而占用出版社大量資金,為了避免這種情況的出現(xiàn),出版社對新書首印量的數(shù)據(jù)性分析顯得尤為重要,這有助于首印數(shù)的決策參考。
目前,出版社重印書的發(fā)貨碼洋約占當年出版社總發(fā)貨碼洋的60%~80%(不同類型的出版社略有不同),重印書是出版社重要的利潤來源。在圖書重印前,如果出版社對每一本書的印制、發(fā)貨和銷售數(shù)據(jù)進行分析,出版社就可以合理確定圖書印數(shù)并制定相應印制計劃,這樣就能保證圖書不斷貨,而且可以避免多印。
出版效率就是品種效率,是出版社單位時間內所出版的品種數(shù)量,它是衡量出版社一個類別是否盈利的重要指標。出版社可以通過對相關數(shù)據(jù)的整理分析做出以上各個品種的出版效率線柱圖,以供出版決策參考。
每個出版社都有自己的定位和出版方向,出版的品種和類別也各不相同,那怎樣才能讓出版的產品既不會偏離既定出版方向又能精益求精呢?通過出版大數(shù)據(jù)的分析得以實現(xiàn)。把社里近三年內出版的品種庫存數(shù)據(jù)調出來逐一進行分析:出版效率高,市場份額大而且收益較好的品種出版社應該持續(xù)投入,保持優(yōu)勢;出版效率比較低,但市場占有率高的品種,也應該保持優(yōu)勢;出版效率高但市場占有率低利潤不高的品種屬于問題產品,需要重點改進;出版效率和市場占有率都比較低,利潤也低的品種可以選擇放棄,把節(jié)省的資源投入其他幾個類別的產品中去。
在圖書營銷環(huán)節(jié),圖書精準營銷可以通過大數(shù)據(jù)來實現(xiàn)。在大數(shù)據(jù)出現(xiàn)前,對讀者閱讀愛好的調查大部分是抽樣調查,而大數(shù)據(jù)出現(xiàn)后可以通過對相關數(shù)據(jù)(如讀者的閱讀愛好與習慣,不同地區(qū)讀者偏愛的圖書類型,哪些圖書容易組合在一起進行銷售等數(shù)據(jù))的分析,就能發(fā)現(xiàn)讀者的需求和愛好,出版社能更有針對性地進行圖書營銷。通過對這些數(shù)據(jù)的收集、整理和加工分析,可以找到有價值的統(tǒng)計規(guī)律。出版社也可以對社交網(wǎng)站用戶間關系進行大數(shù)據(jù)分析,通過數(shù)據(jù)分析可以發(fā)現(xiàn)有著不同性格、興趣愛好和消費能力的小群體。這些小群體就是我們要找的細分的目標市場。專業(yè)出版物常常只適合于小眾市場的需求,出版社如果在這些小群體進行專業(yè)出版物的營銷活動,則會取得良好的營銷效果。在大數(shù)據(jù)分析的幫助下,出版社對不同的讀者進行定向的新書信息推送和廣告投放,會使營銷更富有針對性,營銷效果會更好。
在工作中經(jīng)常碰到這樣的情況:手里有一大把的數(shù)據(jù),但不知道該從何處下手去分析這些數(shù)據(jù),或者是結果雖然分析出來了,但不是自己想要的,這時候大多數(shù)人會覺得是自己掌握的知識不夠多,統(tǒng)計數(shù)據(jù)的軟件用得不夠熟練或者不合適,甚至認為需要特殊的統(tǒng)計分析軟件才能得到分析結果。其實,這都不是問題所在,因為數(shù)據(jù)的分析能力不是體現(xiàn)在我們掌握什么工具上,更重要的是我們用什么樣的思維方式去分析。在信息時代背景下,數(shù)據(jù)的收集、整理、分析和挖掘,是出版社每個編輯或是營銷人員都應該具備的基本素養(yǎng)。
我們日常做的數(shù)據(jù)分析表通常有兩種:一種是數(shù)據(jù)明細表,也叫源數(shù)據(jù)表;另一種是統(tǒng)計表,也叫分類匯總表。前者必須用正確的方法做;后者只需通過軟件就可以轉化而來。
圖表制作需遵循五大原則:(1)確定表達主題或目的;(2)確定圖表格式;(3)選擇數(shù)據(jù)并制作圖表;(4)檢查是否真實有效的展示數(shù)據(jù);(5)檢查是否表達了你的觀點。
數(shù)據(jù)分析過程主要包括以下六個方面。
第一,明確分析思路和目的。這是數(shù)據(jù)分析的前提,如果沒有思路和目的,我們就不知道需要搜集哪些數(shù)據(jù),不知道要從哪個角度入手進行數(shù)據(jù)分析等。這一步要實現(xiàn)需要我們了解業(yè)務、精通業(yè)務,在這個基礎上還必須了解出版社用什么分析系統(tǒng),知道系統(tǒng)能導出哪些數(shù)據(jù),而且對這些數(shù)據(jù)之間的關系要了如指掌,這樣我們才知道要解決什么樣問題,需要哪些方面數(shù)據(jù),才能有目的地去搜集相關數(shù)據(jù)。
第二,數(shù)據(jù)的收集。收集數(shù)據(jù)一般有兩種方式:一種方式是由業(yè)務系統(tǒng)直接導入,其中包括編務、營銷和印制等系統(tǒng);另一種方式就是直接把收集的數(shù)據(jù)人工錄入。
第三,數(shù)據(jù)的處理。數(shù)據(jù)的處理主要包括這幾個方面:(1)對重復和缺失數(shù)據(jù)處理;(2)對數(shù)據(jù)邏輯錯誤的檢查;(3)數(shù)據(jù)排列及字段匹配等。通過對不規(guī)范的數(shù)據(jù)進行處理后形成一張一維源數(shù)據(jù)表,在這個基礎上我們再用正確的方式做出數(shù)據(jù)明細表,這個表必須規(guī)范而且要滿足我們分析所需的維度,這點非常重要。
第四,數(shù)據(jù)的分析。數(shù)據(jù)分析都是在匯總表的基礎上做的,匯總表通過數(shù)據(jù)透視表變換而來,通過數(shù)據(jù)透視表,你隨時可以變出你想要的匯總表。
第五,數(shù)據(jù)的展現(xiàn)。做完了數(shù)據(jù)分析,需要簡明扼要地展現(xiàn)分析結果。人類對圖像的理解力和記憶力要遠遠高于文字或數(shù)字,所以圖表就成為我們匯報工作中不可缺失的重要元素。只要能準確、直觀地詮釋數(shù)據(jù),就是一張好的圖表。
第六,撰寫數(shù)據(jù)分析報告。數(shù)據(jù)分析報告的主要作用有三個:(1)展示分析結果;(2)給出解決方案;(3)提供輔助決策。專業(yè)的數(shù)據(jù)分析報告能夠充分展示我們在工作中所取得的成績。撰寫數(shù)據(jù)分析報告要避免兩個問題:一是沒有對報告進行解讀;二是沒有提出有效見解和可行性建議,沒有讓領導看出應該在哪方面進行改進。不管用Word還是ppt,我們在運用表格的時候,必須用相匹配的數(shù)量級,單位一定要標注清楚,要讓看數(shù)據(jù)的人一目了然。整個分析報告要結合實際業(yè)務,要有理有據(jù),有可供領導選擇的結果。
在大數(shù)據(jù)時代,數(shù)據(jù)本身就是重要的資源。這種資源只有深入挖掘才能發(fā)現(xiàn)其潛藏的巨大價值。出版社應該清醒地認識到,自身所擁有的豐富內容資源,本身就是一個龐大的數(shù)據(jù)庫。大數(shù)據(jù)為傳統(tǒng)出版業(yè)提供了一種更新的思維方式和別樣的思考模式,它改變了傳統(tǒng)數(shù)據(jù)時代人們注重探尋因果關系和追求數(shù)據(jù)精確性的思維習慣。