撰文:靳帆,鄧三鴻,江瑩
從1995年電子工業(yè)出版社憑借自己的信息技術(shù)優(yōu)勢(shì)率先建立起網(wǎng)站開(kāi)始,我國(guó)出版社的網(wǎng)站建設(shè)已經(jīng)走過(guò)了二十多年的發(fā)展歷程。截至2014年4月,全國(guó)580家出版社中,已經(jīng)有438家建立了屬于自己的官網(wǎng)。[1]出版社網(wǎng)站是出版社數(shù)字化轉(zhuǎn)型的關(guān)鍵,它的主要功能包括溝通和服務(wù)讀者、作者、分銷商、求職者,以及發(fā)布一般性的信息。此外,出版社網(wǎng)站還有一個(gè)重要功能就是宣傳推廣書(shū)籍和出版社的品牌形象,這項(xiàng)功能的實(shí)現(xiàn)需要建立在提高網(wǎng)站訪問(wèn)量的基礎(chǔ)之上。出版社網(wǎng)站51%的訪問(wèn)量是來(lái)自搜索引擎[2],另有一項(xiàng)調(diào)查顯示,有75%的網(wǎng)民會(huì)點(diǎn)擊進(jìn)入搜索引擎提供的檢索結(jié)果的第一頁(yè),檢索結(jié)果排名越靠后,被點(diǎn)擊的幾率就越小。因此,網(wǎng)站的建設(shè)者需要根據(jù)搜索引擎的排名規(guī)則來(lái)設(shè)計(jì)網(wǎng)站,這項(xiàng)工作便是搜索引擎優(yōu)化(SEO,Search Engine Optimization)。
搜索引擎優(yōu)化是和搜索引擎同步發(fā)展起來(lái)的。國(guó)外對(duì)于SEO的研究最早可追溯到20世紀(jì)90年代中期[3]8,其目的是通過(guò)了解各類搜索引擎如何抓取互聯(lián)網(wǎng)頁(yè)面、如何進(jìn)行索引以及如何確定其對(duì)某一特定關(guān)鍵詞的搜索結(jié)果排名等技術(shù),來(lái)對(duì)網(wǎng)站內(nèi)容進(jìn)行相關(guān)優(yōu)化,使其在不損害用戶體驗(yàn)的情況下提高網(wǎng)站的搜索結(jié)果排名,提高網(wǎng)站的訪問(wèn)量。筆者試從影響搜索引擎排名因素的角度切入,結(jié)合實(shí)證研究,探討提高出版社網(wǎng)站訪問(wèn)量的設(shè)計(jì)方案。
搜索引擎的工作過(guò)程可分為網(wǎng)頁(yè)抓取、信息提取、關(guān)鍵字搜索、建立關(guān)鍵字索引和網(wǎng)頁(yè)排序五個(gè)部分[4]。目前主流的搜索引擎大多采用爬蟲(chóng)程序來(lái)完成網(wǎng)頁(yè)的抓取。這些程序像蟲(chóng)子一樣以極快的速度從一個(gè)鏈接爬到另一個(gè)鏈接,不間斷地發(fā)現(xiàn)并下載新的網(wǎng)頁(yè),然后對(duì)網(wǎng)頁(yè)中的鏈接、title、keywords和description以及文字等內(nèi)容進(jìn)行分析,再對(duì)網(wǎng)頁(yè)進(jìn)行編目、索引、排序。當(dāng)用戶在搜索引擎中輸入關(guān)鍵字時(shí),搜索引擎便將匹配上的網(wǎng)頁(yè)按排序的先后呈現(xiàn)給用戶。影響搜索引擎對(duì)網(wǎng)站排序的因素主要包括網(wǎng)站內(nèi)容、title 和meta標(biāo)簽(keywords、description)、網(wǎng)站結(jié)構(gòu)、圖片alt屬性、flash、內(nèi)外鏈接等。
圖1 《鳥(niǎo)與獸的通俗生活》在百度中的一條檢索結(jié)果
內(nèi)容是網(wǎng)站建設(shè)最重要的方面,也是實(shí)施SEO策略的基礎(chǔ)。這個(gè)觀點(diǎn)自SEO出現(xiàn)以來(lái),被業(yè)內(nèi)反復(fù)地強(qiáng)調(diào)。網(wǎng)站要保證提供豐富的原創(chuàng)性內(nèi)容,同時(shí)保持固定的更新頻率。在更新內(nèi)容時(shí),要注意內(nèi)容與網(wǎng)站(網(wǎng)頁(yè))的主題和關(guān)鍵詞相關(guān)。每個(gè)頁(yè)面的內(nèi)容應(yīng)該主題一致,在格式上保持統(tǒng)一的設(shè)計(jì),突然變化的網(wǎng)頁(yè)會(huì)影響搜索引擎對(duì)內(nèi)容的吸收,降低搜索引擎對(duì)網(wǎng)站的評(píng)價(jià)。
搜索引擎非常重視title標(biāo)簽和meta標(biāo)簽中的description、keywords屬性,合理利用這三個(gè)關(guān)鍵內(nèi)容可以極大地提高搜索引擎友好性。
title應(yīng)簡(jiǎn)短,包含網(wǎng)頁(yè)關(guān)鍵詞。譬如國(guó)內(nèi)常用的搜索引擎——百度對(duì)標(biāo)題最多顯示30個(gè)中文字符,過(guò)長(zhǎng)的標(biāo)題不利于突出目標(biāo)關(guān)鍵詞,降低相關(guān)性。一個(gè)網(wǎng)頁(yè)中的keywords不宜超過(guò)20個(gè),密度最好為2%~8%,每頁(yè)重點(diǎn)使用的關(guān)鍵字詞不要超過(guò)3~4個(gè)。關(guān)鍵詞的選取上,編輯可圍繞主關(guān)鍵詞制定一些“長(zhǎng)尾關(guān)鍵詞”。長(zhǎng)尾關(guān)鍵詞派生于長(zhǎng)尾理論,指的是與頁(yè)面內(nèi)容相關(guān),但較為冷門的詞匯。在搜索引擎中檢索時(shí),包含該關(guān)鍵詞的網(wǎng)頁(yè)數(shù)量較少。一個(gè)經(jīng)過(guò)長(zhǎng)尾關(guān)鍵詞優(yōu)化的網(wǎng)站,長(zhǎng)尾關(guān)鍵詞帶來(lái)的流量匯聚起來(lái)將會(huì)達(dá)到甚至超過(guò)網(wǎng)站主關(guān)鍵詞帶來(lái)的流量。[5]description幫助搜索引擎和用戶快速了解網(wǎng)頁(yè)的大致內(nèi)容。百度description最多可顯示70個(gè)左右漢字,其中一定要包含關(guān)鍵詞,如圖1所示。
網(wǎng)站設(shè)計(jì)應(yīng)盡量避免使用框架結(jié)構(gòu),因?yàn)樗阉饕娌荒苎杆?、完整地帶走全部網(wǎng)頁(yè)信息,通過(guò)iframe顯示的內(nèi)容可能被搜索引擎拋棄。如果網(wǎng)頁(yè)已經(jīng)使用了框架,則最好在代碼中使用noframes標(biāo)簽進(jìn)行優(yōu)化,noframes中包含指向frame頁(yè)的鏈接以及帶有關(guān)鍵詞的描述文本,這樣搜索引擎才能夠正確索引到框架內(nèi)的信息??刂坪胾rl層級(jí)也很重要。探測(cè)器在遍歷頁(yè)面的時(shí)候是按照url層級(jí)進(jìn)行的,當(dāng)層級(jí)超過(guò)三層的時(shí)候就很難被探測(cè)器搜索。層級(jí)主要是為了區(qū)分頁(yè)面的重要性,因此重要性區(qū)別不大的項(xiàng)目盡量放在一個(gè)目錄里。
大部分搜索引擎不能識(shí)別圖片主題內(nèi)容,為了不損失圖片搜索帶來(lái)的流量,網(wǎng)站設(shè)計(jì)者應(yīng)為圖片設(shè)置包含關(guān)鍵詞的alt屬性,讓搜索引擎了解圖片的主要信息。alt屬性是在圖像無(wú)法顯示時(shí)的替代文本,即使圖片不能正常顯示也能夠幫助用戶了解圖片內(nèi)容。flash的搜索引擎友好性較差,網(wǎng)頁(yè)關(guān)鍵詞不能放在flash中,如果必須使用flash,則應(yīng)該同時(shí)制作一個(gè)文字版供搜索引擎收錄,并在首頁(yè)使用文本鏈接指向文字版。
爬蟲(chóng)程序收集頁(yè)面的軌跡是順著一個(gè)鏈接到另一個(gè)鏈接,如果網(wǎng)站內(nèi)部存在死鏈、斷鏈,網(wǎng)站信息就不能被完整地收集。長(zhǎng)尾關(guān)鍵詞的鏈接資源幾乎全部來(lái)自內(nèi)鏈。為幫助搜索引擎全面了解網(wǎng)站的結(jié)構(gòu),可以建立網(wǎng)站地圖,引導(dǎo)爬蟲(chóng)程序按照地圖上的鏈接到達(dá)每個(gè)網(wǎng)頁(yè)。同時(shí),網(wǎng)站地圖也可以方便用戶使用,提升用戶體驗(yàn)。
建立優(yōu)質(zhì)的外部鏈接同樣重要。外部鏈接包括導(dǎo)入鏈接和導(dǎo)出鏈接。導(dǎo)入鏈接也稱為反鏈,假設(shè)有兩個(gè)頁(yè)面A和B,B頁(yè)面通過(guò)一個(gè)鏈接指向A頁(yè)面,那么,B→A這個(gè)鏈接就是A的一個(gè)反鏈。Google評(píng)價(jià)網(wǎng)站質(zhì)量的一個(gè)重要指標(biāo)是PageRank(簡(jiǎn)稱PR值,分為10個(gè)等級(jí)),指的就是一個(gè)網(wǎng)站有多少反鏈,以及這些反鏈網(wǎng)站的質(zhì)量如何。導(dǎo)出鏈接即友情鏈接,就是頁(yè)面中指向別的網(wǎng)站的鏈接。某網(wǎng)站的PR值=(1-0.85)+0.85×(友情鏈接網(wǎng)站的PR 值/友情鏈接網(wǎng)站的外鏈數(shù))[6],當(dāng)友情鏈接的網(wǎng)站的PR值一定時(shí),其外鏈數(shù)越少越好。nofollow標(biāo)簽(即“反垃圾鏈接”標(biāo)簽)的作用是指示搜索引擎不要抓取網(wǎng)頁(yè)上的帶有nofollow屬性的任何出站鏈接,以避免垃圾鏈接分散網(wǎng)站權(quán)重。
出版社每年都會(huì)出版發(fā)行一定數(shù)量的圖書(shū),可提供給網(wǎng)站更新的內(nèi)容非常多。圖書(shū)內(nèi)容涵蓋的范圍廣,可以產(chǎn)生大量的關(guān)鍵詞和長(zhǎng)尾關(guān)鍵詞。因此圖書(shū)網(wǎng)站在搜索引擎優(yōu)化方面有天然的優(yōu)勢(shì)。
根據(jù)上文總結(jié)的影響搜索引擎排名的因素,本文制定了表1所示的SEO狀況評(píng)價(jià)指標(biāo)。衡量SEO效果的指標(biāo),國(guó)內(nèi)外學(xué)者主要是從網(wǎng)站流量數(shù)據(jù)方面提出的。[3]13在樣本的選取上,全出版業(yè)綜合實(shí)力排名前10位的出版單位網(wǎng)站,其流量數(shù)據(jù)差別較小,不利于SEO效果研究。本文選取的樣本為新聞出版廣電總局《2015年新聞出版產(chǎn)業(yè)分析報(bào)告》中總體經(jīng)濟(jì)規(guī)模排名前10位的少兒類圖書(shū)出版單位網(wǎng)站。少兒出版是21世紀(jì)以來(lái)中國(guó)出版業(yè)增長(zhǎng)最快、連續(xù)增長(zhǎng)時(shí)間最長(zhǎng)的一個(gè)細(xì)分市場(chǎng),既可以避免網(wǎng)站流量低迷,失去SEO效果研究的意義,樣本之間的差距也更為合理。SEO綜合查詢工具可以檢測(cè)出一個(gè)網(wǎng)站的搜索引擎流量、權(quán)重、友情鏈接情況等數(shù)據(jù),TOOL站長(zhǎng)工具和愛(ài)站網(wǎng)站長(zhǎng)工具是公認(rèn)較好的SEO綜合查詢工具,筆者利用它們檢測(cè)了網(wǎng)站鏈接、權(quán)重、百度日均IP數(shù)和百度收錄、谷歌收錄幾項(xiàng)數(shù)據(jù),然后將數(shù)據(jù)結(jié)果依據(jù)表1的評(píng)價(jià)指標(biāo)分析出結(jié)果。
數(shù)據(jù)收集時(shí)間為2018年1月5日,主要選取各網(wǎng)站最重要的首頁(yè)進(jìn)行分析。從表2的數(shù)據(jù)可以看出,對(duì)最重要的原創(chuàng)性內(nèi)容給予重視的出版社有4家。以中國(guó)少年兒童新聞出版總社為例,在圖書(shū)介紹頁(yè)面中,列出的項(xiàng)目有:書(shū)籍基本信息(包括作者、出版社、出版時(shí)間、版次、開(kāi)本等)——這一項(xiàng)內(nèi)容幾乎所有參與調(diào)查的出版社都具備;3至5分鐘的書(shū)籍內(nèi)容介紹視頻;500字左右的內(nèi)容簡(jiǎn)介;作者簡(jiǎn)介;媒體評(píng)論。后四項(xiàng)內(nèi)容其余6家出版社都沒(méi)有涉及。湖南少年兒童出版社的每本圖書(shū)都只給出了書(shū)名,配有一張圖片,作者信息還需要將鼠標(biāo)放在圖片上才能顯示。中國(guó)少年兒童新聞出版總社列出的上述五項(xiàng)內(nèi)容可以幫助讀者快速了解一本書(shū)的方方面面,且內(nèi)容均為原創(chuàng)。如百度詞條“盤中餐(于虹呈的繪本)”的內(nèi)容就來(lái)自該頁(yè)面,該詞條下面列出的參考資料鏈接指向該頁(yè)面,這就是一條高質(zhì)量的反鏈。
網(wǎng)站首頁(yè)源代碼中設(shè)置了title、keywords和description的只有5家出版社。其中,安徽少年兒童出版社的keywords和description都是“安徽少年兒童出版社”一個(gè)詞,海燕出版社的僅僅是“首頁(yè)”兩個(gè)字。新疆少年兒童出版社雖然也有keywords和description,但其keywords的內(nèi)容是“精品童書(shū)包括阿凡提故事系列、貝貝熊系列、亞瑟小子雙語(yǔ)閱讀全18冊(cè)系列……”,關(guān)鍵詞過(guò)長(zhǎng),并且詞之間沒(méi)有用英文逗號(hào)隔開(kāi),因此也起不到應(yīng)有的作用。接力出版社和長(zhǎng)江少年兒童出版社設(shè)置的keywords和description符合SEO策略,后者就其社名設(shè)置了“長(zhǎng)江少年兒童出版社有限公司”“湖北少年兒童出版社”等5個(gè)同義詞,保證讀者即使不知道準(zhǔn)確的社名,也能搜索到該網(wǎng)站。
雖然表2的數(shù)據(jù)顯示,中國(guó)少年兒童新聞出版總社的圖書(shū)介紹內(nèi)容很豐富,但其宣傳某一本書(shū)的內(nèi)頁(yè)源代碼中并未設(shè)置keywords和description,如在百度搜索引擎中輸入“盤中餐圖書(shū)”,內(nèi)容不如該頁(yè)面豐富的東莞圖書(shū)館網(wǎng)站排在了它前面,東莞圖書(shū)館介紹《盤中餐》這本書(shū)的頁(yè)面設(shè)置了titile、keywords和description,且三項(xiàng)內(nèi)容都符合SEO策略,均經(jīng)過(guò)精心編寫(xiě)。
在圖片alt屬性和flash設(shè)置上表現(xiàn)最好的是明天出版社,10家出版社都沒(méi)有編制網(wǎng)站地圖。
表1 SEO狀況評(píng)價(jià)指標(biāo)
表2 10家少兒類圖書(shū)出版單位網(wǎng)站內(nèi)容、title和meta標(biāo)簽等狀況
表3中數(shù)據(jù)來(lái)自TOOL站長(zhǎng)工具[7]和愛(ài)站網(wǎng)站長(zhǎng)工具[8]。從表3可以看出,有的出版社對(duì)導(dǎo)出鏈接不重視,如海燕出版社沒(méi)有設(shè)置導(dǎo)出鏈接;有的出版社對(duì)導(dǎo)出鏈接沒(méi)有進(jìn)行適當(dāng)選擇,二十一世紀(jì)出版社、長(zhǎng)江少年兒童出版社和湖南少年兒童出版社的導(dǎo)出鏈接的平均權(quán)重較低。中國(guó)少年兒童出版社、明天出版社和接力出版社在鏈接方面的優(yōu)化工作做的較好。
綜上,我們可以看出,上述10家少兒類圖書(shū)出版單位網(wǎng)站中,SEO工作做的較好的是中國(guó)少年兒童新聞出版總社、明天出版社和接力出版社。表4是使用站長(zhǎng)工具對(duì)上述10家少兒類圖書(shū)出版單位網(wǎng)站進(jìn)行測(cè)評(píng)后獲得的數(shù)據(jù),與表1的評(píng)價(jià)指標(biāo)分析出的結(jié)果有部分出入,但基本一致。
從上文的分析中可以看出,作為本文研究對(duì)象的10家少兒類圖書(shū)出版單位網(wǎng)站每天來(lái)自搜索引擎的訪問(wèn)量都很低,大部分出版社網(wǎng)站的SEO工作都很不到位。出版社需要增強(qiáng)SEO意識(shí),依靠自身在內(nèi)容方面的資源優(yōu)勢(shì),在網(wǎng)站設(shè)計(jì)上實(shí)施全面的SEO策略,使出版社網(wǎng)站發(fā)揮更大的作用。據(jù)此,對(duì)出版社網(wǎng)站設(shè)計(jì)提出以下幾點(diǎn)建議:
新書(shū)宣傳頁(yè)面是出版社網(wǎng)站最常見(jiàn)也是最重要的頁(yè)面。圍繞一本新書(shū),網(wǎng)站設(shè)計(jì)者應(yīng)盡可能詳細(xì)地編制內(nèi)容介紹、作者介紹、媒體評(píng)論等欄目,提高讀者的閱讀體驗(yàn)。豐富的原創(chuàng)內(nèi)容才是搜索引擎歡迎的。這一點(diǎn)要改進(jìn)很容易,因?yàn)槊勘緯?shū)本身都有充足的信息,只要編輯在發(fā)布網(wǎng)站內(nèi)容時(shí)選取合適的信息即可。
新書(shū)宣傳頁(yè)不應(yīng)該只選取書(shū)名作為關(guān)鍵詞,為了方便不知道該書(shū)全名的人進(jìn)行查找,還應(yīng)該圍繞該詞選取一些長(zhǎng)尾關(guān)鍵詞。選取長(zhǎng)尾關(guān)鍵詞的方法,一是從搜索者的需求出發(fā),用盡可能多的詞匯和主關(guān)鍵詞組合;二是留意百度搜索頁(yè)面底部“相關(guān)搜索”列出的詞匯,然后將關(guān)鍵詞自然地融入到網(wǎng)頁(yè)描述中。
可以將書(shū)籍分類欄目設(shè)置在首頁(yè),層級(jí)越少就越方便用戶查找和記憶。有些網(wǎng)站盡管可以從首頁(yè)看出網(wǎng)站大體布局,但編制一個(gè)清晰的網(wǎng)站地圖不僅方便爬蟲(chóng)程序抓取網(wǎng)站頁(yè)面,而且可以極大地提高用戶體驗(yàn)。網(wǎng)站地圖入口可以放置在網(wǎng)站首頁(yè)頂部或底部。
出版社網(wǎng)站需要使用大量圖片,如果圖片不能被檢索、加載速度慢,將會(huì)影響網(wǎng)站的搜索引擎排名。網(wǎng)站設(shè)計(jì)者應(yīng)為有價(jià)值的圖片增加alt屬性,并在不影響顯示效果的前提下盡量壓縮圖片大小。flash等對(duì)搜索引擎不友好的代碼也要盡量避免使用。
表3 10家少兒類圖書(shū)出版單位網(wǎng)站鏈接狀況
表4 站長(zhǎng)工具數(shù)據(jù)結(jié)果
導(dǎo)出鏈接的選擇要慎重。上述10家少兒類圖書(shū)出版單位網(wǎng)站中,中國(guó)少年兒童新聞出版總社、浙江少年兒童出版社等幾家出版社網(wǎng)站的導(dǎo)出鏈接都是自己所屬集團(tuán)的兄弟網(wǎng)站。抱團(tuán)推廣的初衷可以理解,但如果兄弟網(wǎng)站質(zhì)量很差,反而會(huì)稀釋自己網(wǎng)站的權(quán)重。表現(xiàn)最好的接力出版社網(wǎng)站導(dǎo)出鏈接就選取的是相對(duì)優(yōu)質(zhì)的網(wǎng)站。
隨著信息技術(shù)的快速發(fā)展,我國(guó)出版行業(yè)正在從傳統(tǒng)出版向數(shù)字出版轉(zhuǎn)型。出版社網(wǎng)站作為數(shù)字出版的窗口,在出版社的日常運(yùn)作和經(jīng)營(yíng)管理中大有可為。出版社應(yīng)重視網(wǎng)站建設(shè),充分發(fā)揮自身的資源優(yōu)勢(shì),做好網(wǎng)站SEO工作,提高網(wǎng)站訪問(wèn)量,為出版社的未來(lái)發(fā)展提供更廣闊的平臺(tái),為用戶提供更便捷的服務(wù),為國(guó)家書(shū)香工程的建設(shè)和全民閱讀助力。
[1]苗倩楠.我國(guó)出版社官網(wǎng)用戶體驗(yàn)研究[D].南京:南京大學(xué),2014.
[2]扈欣悅.我國(guó)圖書(shū)出版社網(wǎng)站建設(shè)研究[D].北京:北京印刷學(xué)院,2013.
[3]周鑫.基于谷歌搜索引擎的企業(yè)SEO方法及其效果的實(shí)證研究[D].寧波:寧波大學(xué),2014.
[4]徐煒.淺析搜索引擎優(yōu)化技術(shù)及其應(yīng)用[J].科技風(fēng),2017(4):53-54.
[5]鄧孜.長(zhǎng)尾關(guān)鍵詞理論在提高出版網(wǎng)站訪問(wèn)量中的應(yīng)用[J].中國(guó)出版,2009(Z3):89-91.
[6]PR值[EB/OL].[2018-01-05].https://baike.baidu.com/item/ PR值.
[7]站長(zhǎng)工具[EB/OL].[2018-01-05].http://tool.chinaz.com.
[8]愛(ài)站網(wǎng)[EB/OL].[2018-01-05].https://www.aizhan.com.