張 楠,樓新遠(yuǎn)
(西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,成都 610031)
互聯(lián)網(wǎng)上的信息非常龐大,復(fù)雜,對(duì)于檢索者就像一個(gè)Maze迷宮一般。時(shí)至今日,它依然還在以非常驚人的速度膨脹著,正是由于誕生了搜索引擎這樣的技術(shù),萬維網(wǎng)復(fù)雜的局面才被打破,幫助大家找到重要的而且也是自己需要的信息,它已經(jīng)逐漸成為人們查詢資料、獲取信息的高效、便捷的方式。
隨著搜索引擎的廣泛使用,以針對(duì)搜索引擎的原理和特點(diǎn),設(shè)計(jì)對(duì)它友好的網(wǎng)頁,以提升被檢索的機(jī)會(huì)為研究?jī)?nèi)容,產(chǎn)生了搜索引擎優(yōu)化(SEO)技術(shù)。人們使用搜索引擎查找自己需要的Web挖掘、計(jì)算機(jī)應(yīng)用。
SEO(search engine optimization)的中文意思就是搜索引擎優(yōu)化。主要工作是通過了解各類搜索引擎如何抓取互聯(lián)網(wǎng)頁面、如何進(jìn)行索引以及如何確定其對(duì)某一特定關(guān)鍵詞的搜索結(jié)果排名等技術(shù),來對(duì)網(wǎng)頁進(jìn)行相關(guān)的優(yōu)化,使其提高搜索引擎排名,讓目標(biāo)用戶找到自己,從而提高網(wǎng)站訪問量。
SEO=∫Clock dt=∫(C1+L2+K3+O4)dt
(1)C=content,L=link,K=keywords,O=
others。SEO就是一個(gè)長(zhǎng)期的對(duì)“時(shí)間”積分過程,內(nèi)容是核心。
(2)C1:豐富的內(nèi)容是第1位的要素,按照原創(chuàng)、偽原創(chuàng)、轉(zhuǎn)載依次排列內(nèi)容的重要性滿足用戶體驗(yàn)。
(3)L2:鏈接的合理與豐富是第2位的要素,合理有效的內(nèi)部鏈接與豐富的外部鏈接同等重要,而外部鏈接中高度相關(guān)性高PR值頁面尤為重要。
(4)K3:關(guān)鍵字因素是第3位的重要因素,包括:合理的Title、Description、Keywords、頁面關(guān)鍵字及相關(guān)關(guān)鍵字的密度與合理布局。
(5)O4:其它因素,比如:域名、站齡、服務(wù)器、網(wǎng)站架構(gòu)、排版、Url、地圖等。
這個(gè)公式把SEO很概括的闡述了,把SEO優(yōu)化需要注意到的問題,都考慮進(jìn)去了。根據(jù)這個(gè)公式,結(jié)合具體的實(shí)際操作來討論SEO搜索引擎優(yōu)化的具體步驟。
SEO是對(duì)網(wǎng)站開展針對(duì)搜索引擎的優(yōu)化工作,因此了解搜索引擎的工作原理有利于優(yōu)化工作的開展[1]。搜索引擎通過一個(gè)稱之為Spider的程序從一個(gè)網(wǎng)頁或者多個(gè)網(wǎng)頁出發(fā),逐步遍歷網(wǎng)上的文件。Spider首先解析網(wǎng)頁的HTML代碼,查找該頁面內(nèi)的超鏈接,然后根據(jù)超鏈接搜索網(wǎng)頁,并建立關(guān)鍵詞與其所在位置的對(duì)照表。搜索引擎為搜索到的網(wǎng)頁建立索引并存入數(shù)據(jù)庫(kù)中。當(dāng)用戶輸入要搜索的關(guān)鍵字時(shí),搜索引擎根據(jù)輸入的關(guān)鍵字從數(shù)據(jù)庫(kù)中查找匹配的網(wǎng)頁,并將結(jié)果返回給用戶。
選擇服務(wù)器→注冊(cè)域名→關(guān)鍵詞研究→基于“蜘蛛友好”網(wǎng)站設(shè)計(jì)→站點(diǎn)內(nèi)容強(qiáng)化→鏈接建立。
筆者曾經(jīng)給印刷行業(yè)的一家公司進(jìn)行過SEO服務(wù),下面結(jié)合這個(gè)具體的案例,來分析SEO優(yōu)化的方法和策略。
檢查服務(wù)器的IP是否被搜索引擎處罰過是SEO的第1步,是必須掌握的技巧。以例舉的印刷公司所在服務(wù)器的IP地址為例,通過在地址欄中輸入http://whois.webhosting.info/IP地址 來查詢?cè)揑P地址上的所有網(wǎng)站;通過在Google中來查詢這個(gè)網(wǎng)站一共有多少個(gè)頁面被收錄。如果大部分都是沒有被Google收錄的話,那么很有可能這臺(tái)服務(wù)器是被Google處罰過的。為了保險(xiǎn)期間,最好別用。
(1)域名的命名應(yīng)該盡量簡(jiǎn)潔并且有一定的內(nèi)涵和意義。(2)對(duì)域名后綴的選擇,最好選擇“.com”“.net”“.cn”“.com.cn”“.org”等后綴有著更高的排名優(yōu)勢(shì)。
在搜索引擎優(yōu)化中,對(duì)關(guān)鍵詞的定位和分析處于核心位置。如果選擇了過于熱門的關(guān)鍵詞,則可能會(huì)浪費(fèi)大量的人力和物力,還不容易得到好的排名;如果選擇了冷門的關(guān)鍵詞,及時(shí)得到了好的排名,雖然能給網(wǎng)站帶來一定流量,但是無法提高潛在客戶轉(zhuǎn)化率;如果選擇了不準(zhǔn)確的關(guān)鍵詞,則可能給網(wǎng)站帶了一些垃圾流量,甚至?xí)黾泳W(wǎng)站服務(wù)器的負(fù)擔(dān),影響瀏覽速度。因此,對(duì)于關(guān)鍵詞的研究,就成了搜索引擎優(yōu)化的重中之重。
2.3.1 關(guān)鍵詞選擇中的“長(zhǎng)尾理論”
長(zhǎng)尾理論(The Long Tail)是網(wǎng)絡(luò)時(shí)代興起的一種新理論,由美國(guó)人克里斯·安德森提出。長(zhǎng)尾理論認(rèn)為,由于成本和效率的因素,過去人們只能關(guān)注重要的人或重要的事,如果用正態(tài)分布曲線來描繪這些人或事,人們只能關(guān)注曲線的“頭部”,而將處于曲線“尾部”、需要更多的精力和成本才能關(guān)注到的大多數(shù)人或事忽略[2]。例如,某著名網(wǎng)站是世界上最大的網(wǎng)絡(luò)廣告商之一,它沒有一個(gè)大客戶,收入完全來自被其他廣告商忽略的中小企業(yè)。長(zhǎng)尾理論對(duì)于搜索引擎優(yōu)化中的關(guān)鍵詞策略非常有用。即雖然少數(shù)核心關(guān)鍵詞或通用關(guān)鍵詞可以為網(wǎng)站帶來可能超過一半的訪問量,但那些搜索人數(shù)不多然而非常明確的關(guān)鍵詞的總和—即長(zhǎng)尾關(guān)鍵詞同樣能為網(wǎng)站帶來可觀的訪問量,并且這些長(zhǎng)尾關(guān)鍵詞檢索所形成的顧客轉(zhuǎn)化率更高,往往也大大高于通用關(guān)鍵詞的轉(zhuǎn)化率。
2.3.2 長(zhǎng)尾關(guān)鍵詞的選擇
長(zhǎng)尾關(guān)鍵詞基本屬性是:可延伸性,針對(duì)性強(qiáng)和范圍廣。
長(zhǎng)尾關(guān)鍵詞一般有以下幾種形式:
(1)與企業(yè)產(chǎn)品或者網(wǎng)站定位精確度高的詞語,此類關(guān)鍵詞針對(duì)一些有明確目標(biāo)需求的搜索引擎引入的用戶,這類人群是對(duì)你所經(jīng)營(yíng)的網(wǎng)站產(chǎn)品有著明確認(rèn)知程度的人群,但是這部分人群是網(wǎng)站流量的一小部分。大概占據(jù)網(wǎng)站整體流量的20%左右。
(2)產(chǎn)品或者網(wǎng)站業(yè)務(wù)擴(kuò)展出來的關(guān)鍵詞,這是面向?qū)δ憬?jīng)營(yíng)的網(wǎng)站或產(chǎn)品有著模糊概念的訪問人群設(shè)計(jì)的關(guān)鍵詞。這塊流量估計(jì)占整體網(wǎng)站搜索引擎流量的30%左右。
(3)即將有可能成為搜索用戶使用并且找到網(wǎng)站的關(guān)鍵詞,這類關(guān)鍵詞語可以理解為比較長(zhǎng)尾性關(guān)鍵詞語,可能是業(yè)務(wù)的周邊產(chǎn)品的延伸詞,或者是與網(wǎng)站內(nèi)容擴(kuò)展出的相關(guān)詞,這塊流量估計(jì)占整體網(wǎng)站搜索引擎流量的20%左右。
以“印刷”這個(gè)關(guān)鍵詞作為基本關(guān)鍵詞擴(kuò)展。
通過搜索引擎相關(guān)搜索來確定長(zhǎng)尾關(guān)鍵詞。
圖1是通過Google關(guān)鍵詞工具,輸入“**印刷”得到的一些相關(guān)關(guān)鍵詞。可以看到“**印刷”這個(gè)關(guān)鍵詞,全球的搜索引擎用戶搜索的次數(shù)比較多,屬于相對(duì)熱門的關(guān)鍵詞,優(yōu)化難度較高。
圖1 關(guān)鍵詞搜索界面圖
2.3.3 長(zhǎng)尾關(guān)鍵詞的部署
網(wǎng)站的每一頁都要針對(duì)該頁面的標(biāo)題,而不是全部使用一樣的標(biāo)題。而且,在主要頁面的標(biāo)題中還要有盡可能豐富的關(guān)鍵詞。
meta元素嵌入了某些搜索引擎用于索引和分類萬維網(wǎng)上的文檔時(shí)所用的文檔信息,meta標(biāo)簽應(yīng)盡量符合當(dāng)前頁面的內(nèi)容。
(3)
搜索引擎對(duì)
(4)標(biāo)簽
這些標(biāo)識(shí)也會(huì)被搜索引擎很好地注意到,雖然權(quán)重不如
(5)
用來對(duì)網(wǎng)頁上的圖片進(jìn)行描述,光標(biāo)在圖片上時(shí)顯示的提示語即采用該標(biāo)簽實(shí)現(xiàn)。
2.4.1 建立網(wǎng)站地圖
對(duì)于用戶,大多數(shù)人都知道網(wǎng)站地圖對(duì)于提高用戶體驗(yàn)有好處:為網(wǎng)站訪問者指明方向,并幫助迷失的訪問者找到他們想看的頁面。搜索引擎蜘蛛非常喜歡網(wǎng)站地圖,對(duì)于SEO,網(wǎng)站地圖的好處就更多了:
(1) 為搜索引擎蜘蛛提供可以瀏覽整個(gè)網(wǎng)站的鏈接。(2)為搜索引擎蜘蛛提供一些鏈接,指向動(dòng)態(tài)頁面或者采用其他方法比較難以到達(dá)的頁面。
2.4.2 Flash優(yōu)化
Flash 技術(shù)給互聯(lián)網(wǎng)帶來了更豐富的用戶體驗(yàn),增加了演示和虛擬旅行的情趣,使你的網(wǎng)站更加吸引人,但是搜索引擎蜘蛛不能索引 Flash 的內(nèi)容,因?yàn)镕lash更像一段視頻。所以,F(xiàn)lash里的文本需要從在外部讀取。比如,每一則新聞做成一個(gè)HTML文件,既讓Flash可以讀取,也讓搜索引擎蜘蛛可以抓到。如news1.html,news2.html,news3.html[3]。
2.5.1 Google PageRank算法
了解Google的PageRank算法對(duì)于進(jìn)行搜索引擎優(yōu)化有重要意義。PageRank 是Google算法的重要內(nèi)容。PageRank里的page不是指網(wǎng)頁,而是指佩奇,即這個(gè)等級(jí)方法是以佩奇來命名的[4]。PageRank是最早利用超鏈接信息進(jìn)行Web挖掘的算法,也是在商業(yè)應(yīng)用中最成功的一種算法,被Google搜索引擎采用。
該算法的基本思想如下:設(shè)頁面i的鏈入集合為{T1,T2,…,Tn},即{T1,…,Tn}中的每一個(gè)頁面都鏈接到頁面i,C(i)為頁面i的鏈出頁面數(shù),則頁面i的等級(jí)值PR(i)可以通過以下兩步計(jì)算得出:(1)以概率e隨機(jī)取Web上任一頁面。(2)以概率1-e隨機(jī)取當(dāng)前頁面任一鏈出頁面。
從上面公式可以看出,如果網(wǎng)頁T存在一個(gè)指向網(wǎng)頁i的連接,則表明頁面T的所有者認(rèn)為頁面i比較重要,把T的一部分重要性得分賦予i。這個(gè)重要性得分值為:PR(T)/C(T)。該算法的優(yōu)點(diǎn)是與用戶查詢條件無關(guān),只是給出每一頁面的等級(jí)值,作為Google搜索引擎搜索結(jié)果排序的一個(gè)參考值,等級(jí)越高的頁面排序越靠前,所有網(wǎng)頁的PageRank值通過離線計(jì)算獲得;有效減少在線查詢時(shí)的計(jì)算量,極大降低了查詢響應(yīng)時(shí)間。
2.5.2 反向鏈接的建立
Google的PageRank根據(jù)網(wǎng)站的外部鏈接(反向鏈接)和內(nèi)部鏈接的數(shù)量和質(zhì)量來衡量網(wǎng)站的價(jià)值。PageRank這個(gè)概念引自學(xué)術(shù)中一篇論文的被引述的頻度—即被別人引述的次數(shù)越多,一般判斷這篇論文的權(quán)威性就越高[4]。提高網(wǎng)站的反向鏈接對(duì)提高網(wǎng)頁的排名至關(guān)重要,網(wǎng)站的反向鏈接要從兩個(gè)方面著手建立:
(1)鏈接數(shù)量 一般來說,收到較多鏈接的網(wǎng)頁會(huì)比收到較少鏈接的網(wǎng)頁排名高些。根據(jù)上面公式,鏈入集合{T1,T2,…,Tn}的數(shù)量越多,說明被人引用的次數(shù)越多,在概率e一定的情況下,鏈入集合數(shù)量大有利于提高網(wǎng)頁的PR值。
(2)鏈接質(zhì)量從受尊敬的和具有權(quán)威性的來源獲得認(rèn)可比其他的更有價(jià)值。搜索引擎通過檢查鏈接來源站點(diǎn)的鏈接流行度來判斷權(quán)威性。因此,如果一個(gè)高權(quán)威性的站點(diǎn)鏈接到你的網(wǎng)站,這就將它的一些權(quán)威性贈(zèng)與到了你的頁面。搜索引擎將最高頁面排名的要素歸因于從很多高質(zhì)量站點(diǎn)來的鏈接。從上面公式可以看出,鏈入集合中網(wǎng)頁的權(quán)威性比較高的話(表現(xiàn)在PR值比較高),在數(shù)量n一定的情況下,頁面i也將獲得比較高的PR值。比如,筆者服務(wù)的印刷公司網(wǎng)站首頁就有一定數(shù)量的反向鏈接,同時(shí)這些鏈接大多來自流量較大的地方門戶網(wǎng)站以及印刷行業(yè)的權(quán)威性網(wǎng)站。
(1)有效地建設(shè)高質(zhì)量的原創(chuàng)文章,使得內(nèi)容即適合用戶瀏覽閱讀,又適合搜索引擎的蜘蛛,讓這些文章能夠提升自己網(wǎng)站的搜索引擎排名。
(2)內(nèi)容的呈現(xiàn)方式清楚、直接而明確。不論使用何種語言進(jìn)行撰寫都盡量使用清楚而具體的語句、簡(jiǎn)潔而明確的句法,并且在該加上批注的地方加注,標(biāo)示縮寫與頭文字等。以便使處于各種層次的瀏覽者都能理解網(wǎng)站內(nèi)容。
搜索引擎優(yōu)化是一個(gè)系統(tǒng)的工作,從搜索引擎的優(yōu)化公式知道,豐富的內(nèi)容、一定數(shù)量的網(wǎng)站內(nèi)部鏈接結(jié)構(gòu)和優(yōu)質(zhì)的外部鏈接數(shù)量,以及準(zhǔn)確的關(guān)鍵詞選擇和部署,才能使網(wǎng)站的網(wǎng)頁在搜索引擎中獲得好的排名,即成功地完成SEO搜索引擎優(yōu)化工作。
[1]廖鍵雙. 淺談企業(yè)網(wǎng)站優(yōu)化技術(shù)_SEO技術(shù)[J]. 科技風(fēng),2009,8(4):505-508.
[2] 呂 梁. 關(guān)鍵字策略在SEO中的應(yīng)用研究[J]. 電子商務(wù),2009,2(3):100-102.
[3]張 丹. FLASH網(wǎng)站的SEO研究[J]. 信息技術(shù),2009,2(4):147-149.
[4] 江裕民. 基于超鏈接的WEB結(jié)構(gòu)挖掘算法研究[M]. 西安:西安電子科技大學(xué),2006(1):26-29.
[5] 陳潔惠. 搜索引擎排序算法的研究[J]. 河海大學(xué),2007(3):11-13.