亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于互聯(lián)網(wǎng)的數(shù)據(jù)挖掘技術在競爭情報收集工作中的應用

        2011-04-13 06:50:02車榮海
        科技傳播 2011年4期
        關鍵詞:搜索引擎排序數(shù)據(jù)挖掘

        車榮海

        沈陽師范大學科信軟件學院,遼寧 沈陽 110034

        1 Internet情報收集子系統(tǒng)概述

        一個企業(yè)要進行競爭情報的研究,應該建立自己的基于網(wǎng)絡環(huán)境的競爭情報系統(tǒng)——競爭情報網(wǎng)絡系統(tǒng)是圍繞企業(yè)的經(jīng)營戰(zhàn)略目標,以現(xiàn)代信息技術(尤其是網(wǎng)絡技術)為主要手段,對企業(yè)內(nèi)部和外部的競爭要素,競爭環(huán)境以及競爭對手的信息進行收集、存儲、處理與分析研究的新一代綜合性網(wǎng)絡系統(tǒng)。系統(tǒng)有3部分組成:競爭情報收集子系統(tǒng)、競爭情報分析子系統(tǒng)和競爭情報服務子系統(tǒng)。競爭情報收集子系統(tǒng)是根據(jù)事先確立的情報課題,收集、整理各種信息,初步篩選,同時作好文件、記錄等資料的保管及定期歸檔工作。競爭情報分析子系統(tǒng)是應用恰當?shù)姆治龇椒ㄅc技術,深入分析競爭情報收集子系統(tǒng)的信息,生產(chǎn)競爭情報產(chǎn)品。競爭情報服務子系統(tǒng)是以各種適當?shù)姆绞桨b競爭情報產(chǎn)品,及時將產(chǎn)品傳送到情報用戶手中去,并為企業(yè)決策層提供快捷的瀏覽、查詢服務和情報服務。以企業(yè)現(xiàn)有技術和信息資源為核心, 以網(wǎng)絡為基礎的現(xiàn)代競爭情報系統(tǒng)共分3個層次:第一個層次是企業(yè)內(nèi)部網(wǎng)。它利用Internet技術把企業(yè)內(nèi)部所有的信息資源集成起來,把各子公司、各部門聯(lián)系起來,實現(xiàn)企業(yè)內(nèi)部的信息共享與協(xié)同作業(yè);第二層次是企業(yè)外聯(lián)網(wǎng),它將Internet技術應用于企業(yè)間的信息系統(tǒng),把與企業(yè)有業(yè)務合作關系的交易伙伴、合作對象、相關公司以及主要客戶連成一體;第三層次是因特網(wǎng),它是覆蓋全世界范圍的網(wǎng)絡,通過它可以使國內(nèi)外企業(yè)、遠程用戶、異地資源得以聯(lián)合,實現(xiàn)資源共享,溝通合作。

        2 數(shù)據(jù)挖掘技術在Internet情報收集子系統(tǒng)的應用

        2.1 公共信息挖掘系統(tǒng)

        隨著Internet的迅速發(fā)展,在Internet上儲備了大量的信息,這些信息是零散的分布在全球的各個位置上,也就是分布在各個不同的計算機服務器上,那么我們?nèi)绾蝸砀玫恼业讲⒗眠@些信息,成為了競爭情報工作中一個非常重要的課題研究。競爭情報工作除了要挖掘自身門戶網(wǎng)站的知識,Internet上的各種各樣的公共信息的利用同樣也不容忽視。公共信息挖掘系統(tǒng)就是企業(yè)通過在Internet上免費的信息獲得有價值的信息的系統(tǒng)。通過查閱大量的資料提出一個公共信息挖掘系統(tǒng)的模型如圖1。

        圖1 公共信息挖掘系統(tǒng)模型圖

        WEB上的數(shù)據(jù)與傳統(tǒng)的數(shù)據(jù)庫中的數(shù)據(jù)不同,傳統(tǒng)的數(shù)據(jù)庫都有一定的數(shù)據(jù)模型,可以根據(jù)此模型來具體描述特定的數(shù)據(jù)。而WEB上的數(shù)據(jù)非常復雜,沒有特定的摸模型描述,每一站點的數(shù)據(jù)都各自獨立設計,且數(shù)據(jù)本身具有自述性和動態(tài)可變性。傳統(tǒng)數(shù)據(jù)挖掘技術是用來處理保存在數(shù)據(jù)庫中的結構化數(shù)據(jù),但是Internet上的大量數(shù)據(jù)都是半結構化和非結構化。因此,要在競爭情報工作中充分利用Internet的信息,數(shù)據(jù)由非結構化和半結構化轉化為結構化形式是關鍵,從而就涉及到情報檢索和WEB挖掘兩個領域的研究。

        2.1.1 元搜索引擎

        搜索引擎按其工作方式主要可分為3種,分別是全文搜索引擎目錄索引類搜索引擎和元搜索引擎。元搜索引擎,被稱為搜索引擎之上的搜索引擎。用戶只需遞交一次檢索請求,由于元搜索引擎負責轉換處理后提交給多個預先選定的獨立搜索引擎,并將所有查詢結果經(jīng)過處理后集中起來以整體統(tǒng)一的格式呈現(xiàn)到用戶面前。由于采用了一系列的優(yōu)化運行機制,能夠在盡可能短的時間內(nèi)提供給搜索者相對全面、準確的信息,能夠更好的滿足搜索者的需要,但顯示給搜索者的信息也是不能達到100%,可以通過擴展調用多個搜索引擎來提高搜索的全面性。值得推薦的元搜索引擎有Dogpile、InfoSpace、Vivisimo等。為了在大范圍的檢索中取得較好的效果,本模型采用元搜索引擎。

        2.1.2 WEB結構挖掘(鏈接分析)

        目前的大多數(shù)搜索引擎在進行分類的時候都是利用內(nèi)容的相關性進行排序的,所謂的內(nèi)容相關性排序就是根據(jù)網(wǎng)頁的內(nèi)容進行分類,處理的辦法一般是進行分詞、詞頻統(tǒng)計,根據(jù)統(tǒng)計的結果進行分類和進行相關性排序。這樣的分類不能反映人們對該網(wǎng)頁內(nèi)容的分析與看法,缺乏一定的主觀性。在使用元搜索引擎技術后,調用己有的搜索引擎,因此返回的搜索結果是進行了基于內(nèi)容相關性的相關性排序。這些結果中包含指向的結果頁面的超級連接(URL網(wǎng)址),不同的搜索引擎的結果不同,那么它們的超級連接也是不同的,其中有部分內(nèi)容是重復的。我們知道通過超級連接能夠反映某個頁面是不是權威頁面,也就可以根據(jù)某個頁面被引用的次數(shù)可以知道這個頁面是不是權威頁面,也就是基于超級鏈接的相關性排序。因此我們可以對處理結果中的各個超級鏈接的URL地址進行排序,在原有的基于內(nèi)容排序的基礎上加入了基于超級鏈接的相關性排序,通過鏈接分析,提高搜索結果的精度。Brin和Page提出了的Page-rank算法,并將它應用于搜索引擎谷歌。

        2.2 門戶網(wǎng)站挖掘系統(tǒng)

        隨著互聯(lián)網(wǎng)的飛速發(fā)展,現(xiàn)在很多的企業(yè)擁有自己的門戶網(wǎng)站。如果企業(yè)納入電子商務的運營模式,門戶網(wǎng)站更加是必不可少?;贗nternet的競爭情報工作的研究應該首先把瀏覽本企業(yè)的網(wǎng)站時所保存下來的數(shù)據(jù),進行挖掘分析。通過對網(wǎng)站本身的WEB挖掘,對于競爭情報工作主要會產(chǎn)生以下3方面優(yōu)勢:1)理解客戶行為:通過理解訪問者的動態(tài)行為來優(yōu)化電子商務網(wǎng)站的經(jīng)營模式;獲得個人訪問者的興趣愛好;了解從訪問者到客戶的轉化率;發(fā)現(xiàn)客戶和訪問者對于網(wǎng)頁的瀏覽模式;發(fā)現(xiàn)客戶群對于不同業(yè)務的行為特征;發(fā)現(xiàn)網(wǎng)站上客戶之間的關系;2)判斷站點的效率:發(fā)現(xiàn)站點上不同業(yè)務量;設計網(wǎng)站不依靠專家定性指導,根據(jù)對訪問者路徑分析等手段修改、設計網(wǎng)頁結構和布局;對于不同客戶提供個性化服務;3)評估電子商務模式的成功:將客戶按照模式分類;測評廣告的投資回報率;得到可靠的市場反饋。

        2.3 行業(yè)監(jiān)視挖掘系統(tǒng)

        分析競爭對手的目的是了解每個競爭對手的戰(zhàn)略和目標,評估其優(yōu)勢與劣勢以及競爭反應模式,從而制定自己的競爭戰(zhàn)略。如今公司擁有自己的門戶網(wǎng)站再平常不過了?,F(xiàn)在的網(wǎng)站不僅僅對企業(yè)做簡單的介紹、發(fā)布新聞,更多的是把網(wǎng)站作為與客戶進行交流的前沿陣地。因此,通過對競爭對手門戶網(wǎng)站的分析,可以尋找到許多有價值的信息。不僅可以關注競爭對手或潛在對手的信息,通常每個行業(yè)都有自己的網(wǎng)站,這些網(wǎng)站上的數(shù)據(jù)統(tǒng)計信息都是很有價值的。但是有時更新速度快,因此需要及時進行發(fā)現(xiàn)。對于如何從其他網(wǎng)站進行有效的數(shù)據(jù)挖掘,目前還有些困難,隨著技術的發(fā)展,門戶網(wǎng)站會成為企業(yè)競爭戰(zhàn)略的重點。

        [1]李子方.數(shù)據(jù)挖掘中關聯(lián)規(guī)則在競爭情報系統(tǒng)中應用[J].微計算機信息,2007.

        猜你喜歡
        搜索引擎排序數(shù)據(jù)挖掘
        排序不等式
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        恐怖排序
        節(jié)日排序
        刻舟求劍
        兒童繪本(2018年5期)2018-04-12 16:45:32
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        網(wǎng)絡搜索引擎亟待規(guī)范
        基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
        廣告主與搜索引擎的雙向博弈分析
        中文字幕女同系列在线看一| a午夜国产一级黄片| 日韩国产有码精品一区二在线| 毛片在线播放亚洲免费中文网| 女人高潮内射99精品| 国产人在线成免费视频| 久久久久久久综合日本| 女同在线网站免费观看| 青青草久热手机在线视频观看 | 国产av无码专区亚洲av蜜芽| 人妻无码中文字幕免费视频蜜桃| 国产成人精品人人做人人爽| 亚洲av色av成人噜噜噜| 麻豆婷婷狠狠色18禁久久| 国产偷国产偷亚洲清高| 无码伊人久久大香线蕉| 中文字幕在线乱码亚洲| 亚洲精品无码永久在线观看你懂的| 四虎永久免费一级毛片| 中文乱码字幕在线中文乱码 | 色婷婷五月综合亚洲小说| 亚洲AV无码久久久久调教| 免费a级毛片18禁网站| 麻豆av毛片在线观看| 亚洲精品国产一二三区| 亚洲欧美激情精品一区二区| 四虎精品国产一区二区三区| 亚洲av高清一区三区三区| 性做久久久久久免费观看| 亚洲av无码男人的天堂在线| 久久国产精品超级碰碰热 | 国产91色综合久久免费| 亚洲精品一区国产欧美| 精品人妻中文av一区二区三区| 亚洲精品中文字幕乱码三区99| 少妇真实被内射视频三四区| 内射中出无码护士在线| 欧美亚洲日韩国产人成在线播放| 日本a级免费大片网站| 人妻丰满熟妇av无码区不卡| 亚洲欧美日韩高清中文在线 |