摘要:隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展和經(jīng)濟(jì)全球化所帶來的激烈挑戰(zhàn),越來越多的企業(yè)開始重視網(wǎng)絡(luò)營(yíng)銷。搜索引擎營(yíng)銷是最常用的方法之一,而如何選擇正確的關(guān)鍵詞以獲得更好的廣告效果是搜索引擎營(yíng)銷中一個(gè)重要的問題。本文針對(duì)關(guān)鍵詞的生成問題,提出了一種基于核的語義相似度的方法來生成有效的關(guān)鍵詞。
關(guān)鍵詞:語義相似度;關(guān)鍵詞;搜索引擎;網(wǎng)絡(luò)營(yíng)銷
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2008)14-20915-02
1 引言
現(xiàn)代信息技術(shù)的進(jìn)步極大地改變了我們的經(jīng)濟(jì)社會(huì)結(jié)構(gòu)以及生活方式,與此同時(shí)營(yíng)銷傳播領(lǐng)域也發(fā)生了翻天覆地的變化,企業(yè)在不斷尋求一種方式來與他們的目標(biāo)群體進(jìn)行更加經(jīng)濟(jì)有效的溝通。新的營(yíng)銷戰(zhàn)略如整合營(yíng)銷傳播應(yīng)運(yùn)而生,在這些新興營(yíng)銷手段中,最受關(guān)注、同時(shí)也最富活力的無疑是搜索引擎營(yíng)銷,一方面Google和百度等搜索引擎服務(wù)商成功整合了互聯(lián)網(wǎng)上的海量資源,成為用戶獲取信息的門戶,從而創(chuàng)造了龐大的用戶群[1]。本文就是在這樣的形勢(shì)下,提出一種基于語義相似度的關(guān)鍵詞生成方法,來極大的促進(jìn)搜索引擎的發(fā)展,提升搜索引擎的效率,最終實(shí)現(xiàn)公司的利潤(rùn)最大化。本文首先介紹了基于語義相似度方法的理論和模型,隨后以一個(gè)虛擬公司的搜索營(yíng)銷方案最為案例來說明這種方法的實(shí)用性以及高效性。
2 方法介紹
企業(yè)在進(jìn)行搜索引擎營(yíng)銷時(shí),首先想到的是選取最能代表本企業(yè)的關(guān)鍵詞。我們從考慮客戶的動(dòng)機(jī)和意圖入手,考慮客戶可能會(huì)提出什么樣的問題?考慮他們想完成什么樣的事情?利用這些問題我們就能獲得許多有價(jià)值的關(guān)鍵詞。但由于這些問題是我們很難獲得的,因此我們就借助搜索引擎來挖掘潛在的重要的關(guān)鍵詞。
關(guān)鍵詞的生成可以被分成三個(gè)獨(dú)立的步驟:
(1)利用搜索引擎產(chǎn)生大量的關(guān)鍵詞;
(2)建立關(guān)鍵詞之間的語義相似度;
(3)利用相似度選取最相關(guān)的、最能描述企業(yè)的關(guān)鍵詞。
為了接下來的討論,我們定義如下符號(hào):
詞典D:可能被選中的候選關(guān)鍵詞庫。
文集C:產(chǎn)生詞典的文檔的集合,這些文檔是與企業(yè)產(chǎn)品相關(guān)的網(wǎng)頁集合。
2.1 初始關(guān)鍵詞的產(chǎn)生
為了能產(chǎn)生大量的關(guān)鍵詞,我們可以利用網(wǎng)絡(luò)上的豐富資源來獲得,過程可以分為兩步[2]。第一步是利用常用的關(guān)鍵詞進(jìn)行搜索(如google、baidu等搜索引擎就是很好的工具)收集大量相關(guān)的文集,所有與企業(yè)相關(guān)的網(wǎng)頁都被收集到。然后對(duì)文集進(jìn)行分析,利用詞的tfidf權(quán)重方法來建立初始的詞典,將權(quán)重排在前t位的詞都放到詞典中。
接下來的步驟是利用詞典中的詞擴(kuò)充文集,獲得更多的關(guān)鍵詞,以創(chuàng)建最終的文集。最后利用最終的文集來形成關(guān)鍵詞,這個(gè)過程同樣是利用tfidf方法實(shí)現(xiàn)。流程見圖1。
2.2 語義相似度
語義相似度的計(jì)算是為了在D中選取最適合的關(guān)鍵詞,在本文中我們利用由Shami和Heilman[3]提出的方法來測(cè)量詞語之間的相似度。首先對(duì)于每一個(gè)詞通過搜索引擎獲得一個(gè)用來表示這個(gè)詞的文集。利用這個(gè)文集創(chuàng)建一個(gè)文本向量,這個(gè)文本向量包含了文集中頻繁出現(xiàn)的詞。然后利用兩兩文集的文本向量的內(nèi)積來比較兩兩之間的相似度。
下面的內(nèi)容說明了計(jì)算x與y這兩個(gè)詞之間相似度k(x,y)的具體算法。
(1)輸入x到搜索引擎中;
(2)生成文檔d1,d2,...,dn的集合R(x);
(3)計(jì)算每一個(gè)文檔的tfidf權(quán)重向量vi;
(4)截?cái)嘞蛄縱i,選取前m個(gè)權(quán)重最高的詞;
(5)將向量vi標(biāo)準(zhǔn)化,計(jì)算其算術(shù)平均值C;
(6)將C標(biāo)準(zhǔn)化得到QE(x);
(7)計(jì)算相似度k(x,y)=QE(x)*QE(y)。
2.3 生成關(guān)鍵詞
利用2.2節(jié)的算法我們可以計(jì)算出初始關(guān)鍵詞的兩兩語義相似度,我們可以選取前m位的關(guān)鍵詞作為我們所需要的關(guān)鍵詞,也可以定義一個(gè)極限k0,將所有大于這個(gè)極限的關(guān)鍵詞都選出來。這樣我們就能得到與本企業(yè)最相關(guān)的、最能代表企業(yè)的關(guān)鍵詞,將他們提供給廣大潛在的客戶。
3 關(guān)鍵詞應(yīng)用
在這一節(jié)中我們通過實(shí)例來證明通過我們方法所選取出來的詞都是能很好的描述企業(yè)產(chǎn)品或服務(wù)的關(guān)鍵詞。
假如我們想為一家虛擬的生產(chǎn)寵物狗的素食品的企業(yè)選取關(guān)鍵詞,以達(dá)到很好的網(wǎng)絡(luò)營(yíng)銷的效果[4]。開始利用已知的“素食狗食品”為關(guān)鍵字搜索,利用本文的關(guān)鍵字?jǐn)U展我們可以獲得諸如:“天然狗食品”,“綠色狗食品”,“健康狗食品”,“有機(jī)狗食品”,“寵物食品”等眾多相關(guān)關(guān)鍵詞。通過這些關(guān)鍵詞的分析,我們知道對(duì)于想為寵物狗購(gòu)買素食食品的人群來說,他們最關(guān)注的是寵物狗的健康,所以我們可以在我們的網(wǎng)頁內(nèi)容,特別是標(biāo)題中,更多的包含這些關(guān)鍵詞。當(dāng)寵物主人想在網(wǎng)上搜索關(guān)于寵物狗的食品或健康時(shí),我們的網(wǎng)頁將能為他們提供非常豐富的內(nèi)容。這樣我們就能夠獲得更多的點(diǎn)擊量,從而獲得更多的訂單。
4 結(jié)束語
網(wǎng)絡(luò)營(yíng)銷是現(xiàn)代社會(huì)發(fā)展的要求,是現(xiàn)代企業(yè)發(fā)展的趨勢(shì)。企業(yè)進(jìn)行網(wǎng)絡(luò)營(yíng)銷有很多種方式,而搜索引擎營(yíng)銷是目前為止最成熟的,也是最有發(fā)展前景的一種方法[5]。在搜索營(yíng)銷的第一步就是要為企業(yè)選取一些具有代表本企業(yè)文化、核心產(chǎn)品服務(wù)的一些關(guān)鍵詞,讓客戶在需要的時(shí)候能夠第一時(shí)間搜索到我們的產(chǎn)品,提高企業(yè)的形象和利潤(rùn)。如何選取有意義的關(guān)鍵詞就成為搜索引擎營(yíng)銷的一個(gè)重要部分,本文提出了一種基于語義相似度的方法來為企業(yè)產(chǎn)生關(guān)鍵詞,將會(huì)大大促進(jìn)企業(yè)的搜索營(yíng)銷的發(fā)展。
參考文獻(xiàn):
[1] 姜鵬.以消費(fèi)者為本實(shí)施搜索引擎營(yíng)銷[J].營(yíng)銷策略,2007(4).
[2] Vibhanshu Abhishek,Kartik Hosanagar.Keyword Generation for Search Engine Advertising using Semantic Similarity between Terms[M].ICEC,2007.
[3] Shami,Heilman.A Web-based Kernel Function for Measuring the Similarity of Short Text Snippets[C].World Wide Web Conference Committee,2006.
[4] Bryan Eisenberg.A practical guide to using Wordtracker to conduct keyword research for an online business[EB/OL].[2004-07]www.Wordtracker.com.
[5] 劉軍.中小企業(yè)網(wǎng)絡(luò)營(yíng)銷中的SEO[J].營(yíng)銷策略,2007(8).
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文