亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合多源數(shù)據(jù)的企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建

        2020-11-06 07:27:28黃曉斌張明鑫
        現(xiàn)代情報(bào) 2020年11期

        黃曉斌 張明鑫

        作者簡(jiǎn)介:黃曉斌(1961-),男,教授,博士,研究方向:信息分析與情報(bào)研究、競(jìng)爭(zhēng)情報(bào)。張明鑫(1996-),男,碩士研究生,研究方向:信息分析與信息行為。

        摘要:[目的/意義]融合多源數(shù)據(jù),從大量真實(shí)具體的企業(yè)競(jìng)爭(zhēng)對(duì)手中抽取出競(jìng)爭(zhēng)對(duì)手的畫像,為解決海量競(jìng)爭(zhēng)對(duì)手無(wú)限性和企業(yè)競(jìng)爭(zhēng)情報(bào)資源有限性之間的矛盾提供啟發(fā)。[方法/過(guò)程]從畫像指標(biāo)體系、數(shù)據(jù)采集、數(shù)據(jù)融合、數(shù)據(jù)分析、畫像構(gòu)建和畫像應(yīng)用等環(huán)節(jié)出發(fā),提出了一套融合多源數(shù)據(jù)的企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建模式,然后以H公司為例開展了實(shí)證研究。[結(jié)果/結(jié)論]基于所提出的競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建模式,構(gòu)建了H公司的主要競(jìng)爭(zhēng)對(duì)手畫像,從而為企業(yè)的競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建實(shí)踐以及為后續(xù)相關(guān)理論研究和實(shí)證研究提供參考。

        關(guān)鍵詞:企業(yè)競(jìng)爭(zhēng)對(duì)手;多源數(shù)據(jù);多源信息;數(shù)據(jù)融合;畫像研究

        DOI:10.3969/j.issn.1008-0821.2020.11.002

        〔中圖分類號(hào)〕G25225〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2020)11-0013-09

        Construction of Enterprise Competitor Portrait Based on Multi-source Data

        Huang XiaobinZhang Mingxin

        (School of Information Management,Sun-Yat-Sen University,Guangzhou 510006,China)

        Abstract:[Purpose/Significance]This paper integrates multi-source data and extracts the portraits of competitors from a large number of real and specific enterprise competitors,which provides inspiration for solving the contradiction between massive competitors and the limitation of competitive intelligence resources.[Method/Process]From the aspects of portrait index system,data collection,data fusion,data analysis,portrait construction and portrait application,this paper put forward a set of competitor portrait construction model with the integration of multi-source data.Furthermore,an empirical study with H company as an example was carried out.[Results/Conclusions]Based on the proposed construction model of competitor portraits,this paper constructed the portraits of major competitors of H company,so as to provide reference for the practice of the construction of competitor portraits and the subsequent theoretical and empirical research.

        Key words:enterprise competitors;multi-source data;multi-source information;data fusion;portrait research

        “知己知彼,百戰(zhàn)不殆”,在激烈的市場(chǎng)競(jìng)爭(zhēng)中,企業(yè)為了保持競(jìng)爭(zhēng)優(yōu)勢(shì),需要不斷監(jiān)測(cè)和分析競(jìng)爭(zhēng)對(duì)手的動(dòng)向,及時(shí)調(diào)整自身的經(jīng)營(yíng)策略和戰(zhàn)略規(guī)劃。傳統(tǒng)的企業(yè)競(jìng)爭(zhēng)對(duì)手監(jiān)測(cè),重點(diǎn)關(guān)注對(duì)某一個(gè)或某幾個(gè)具體的企業(yè)競(jìng)爭(zhēng)對(duì)手進(jìn)行分析;然而,伴隨著大數(shù)據(jù)和互聯(lián)網(wǎng)的不斷發(fā)展,企業(yè)面臨的競(jìng)爭(zhēng)環(huán)境和競(jìng)爭(zhēng)格局日趨復(fù)雜,來(lái)自不同行業(yè)和不同領(lǐng)域的海量競(jìng)爭(zhēng)對(duì)手均有可能對(duì)企業(yè)造成威脅。在實(shí)踐中,囿于企業(yè)競(jìng)爭(zhēng)情報(bào)資源有限性的制約,單一地對(duì)某一個(gè)或某幾個(gè)具體的競(jìng)爭(zhēng)對(duì)手進(jìn)行跟蹤監(jiān)測(cè)或會(huì)造成一定的認(rèn)知偏差,進(jìn)而不利于企業(yè)了解海量競(jìng)爭(zhēng)對(duì)手的一般情況。因此,企業(yè)需要在真實(shí)競(jìng)爭(zhēng)對(duì)手的基礎(chǔ)之上,從具體的競(jìng)爭(zhēng)對(duì)手中抽象出能夠反映海量競(jìng)爭(zhēng)對(duì)手的一般畫像特征。從大量真實(shí)具體的競(jìng)爭(zhēng)對(duì)手中抽象出企業(yè)競(jìng)爭(zhēng)對(duì)手的畫像,不僅有助于企業(yè)快速識(shí)別和了解潛在競(jìng)爭(zhēng)對(duì)手的一般情況,樹立學(xué)習(xí)標(biāo)桿和趕超對(duì)象,同時(shí)也有助于企業(yè)通過(guò)對(duì)競(jìng)爭(zhēng)對(duì)手畫像的分析,來(lái)實(shí)現(xiàn)對(duì)畫像背后所代表的大量競(jìng)爭(zhēng)對(duì)手的監(jiān)測(cè)和預(yù)警,從而提升企業(yè)競(jìng)爭(zhēng)情報(bào)活動(dòng)的效率??梢?,建立企業(yè)競(jìng)爭(zhēng)對(duì)手畫像,是解決海量競(jìng)爭(zhēng)對(duì)手的無(wú)限性和企業(yè)競(jìng)爭(zhēng)情報(bào)資源有限性之間矛盾的重要途徑。尤其在多源數(shù)據(jù)環(huán)境下,如何從不同來(lái)源搜集不同類型的數(shù)據(jù),采用多種方法構(gòu)建企業(yè)競(jìng)爭(zhēng)對(duì)手的畫像,從而為企業(yè)的標(biāo)桿學(xué)習(xí)、競(jìng)爭(zhēng)對(duì)手監(jiān)測(cè)和預(yù)警等提供支撐,成為企業(yè)競(jìng)爭(zhēng)對(duì)手情報(bào)分析的重要問(wèn)題。

        為了解決以上問(wèn)題,本研究首先回顧了多源數(shù)據(jù)融合、畫像研究和企業(yè)競(jìng)爭(zhēng)對(duì)手研究等國(guó)內(nèi)外相關(guān)文獻(xiàn),然后基于已有成果,提出了一套融合多源數(shù)據(jù)和方法的企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建模式,指出了融合多源數(shù)據(jù)和方法的企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建的要素、流程、方法和應(yīng)用等關(guān)鍵問(wèn)題,最后以H公司為例,搜集數(shù)據(jù)開展了實(shí)證研究,以期為企業(yè)的競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建實(shí)踐以及為后續(xù)相關(guān)理論研究和實(shí)證研究提供啟發(fā)。

        1相關(guān)研究述評(píng)

        多源數(shù)據(jù)融合是指將利用多種方式采集的、不同來(lái)源和不同呈現(xiàn)形式(如文本、數(shù)值和圖片等)的數(shù)據(jù)融合到一起,使其形成統(tǒng)一格式并面向多種應(yīng)用的數(shù)據(jù)集合的過(guò)程;多源數(shù)據(jù)融合可以劃分為多傳感器數(shù)據(jù)融合和社會(huì)數(shù)據(jù)融合[1-2]。首先,多源數(shù)據(jù)融合最早起源于軍事遙感領(lǐng)域[2]。由于在遙感領(lǐng)域?qū)嵺`中,不同類型的傳感器采集的數(shù)據(jù)等存在著多源異構(gòu)的特點(diǎn),因此如何對(duì)多源異構(gòu)的數(shù)據(jù)進(jìn)行融合處理,成為遙感領(lǐng)域關(guān)注的重點(diǎn)。因此,早期的多源數(shù)據(jù)融合又被稱為多傳感器數(shù)據(jù)融合[3]。同時(shí),多源數(shù)據(jù)融合在社會(huì)科學(xué)領(lǐng)域也逐漸受到了重視。不同社會(huì)科學(xué)領(lǐng)域的學(xué)者結(jié)合本學(xué)科領(lǐng)域的問(wèn)題,對(duì)搜集的多種來(lái)源和多種形式的社會(huì)數(shù)據(jù)進(jìn)行融合,并開展了相關(guān)研究。例如,魯奇[4]對(duì)旅游客戶多源數(shù)據(jù)進(jìn)行融合,實(shí)現(xiàn)了對(duì)旅客用戶群體的細(xì)分研究;張大勇等[5]融合微信多源數(shù)據(jù),探討了微信用戶信息分享行為的發(fā)生機(jī)理。

        與此同時(shí),如何融合不同來(lái)源的數(shù)據(jù)開展企業(yè)競(jìng)爭(zhēng)對(duì)手相關(guān)研究,也成為情報(bào)學(xué)領(lǐng)域關(guān)注的重要方向。首先,企業(yè)競(jìng)爭(zhēng)對(duì)手評(píng)價(jià)指標(biāo)體系是開展企業(yè)競(jìng)爭(zhēng)對(duì)手評(píng)價(jià)的核心,而指標(biāo)體系所指向的指標(biāo)數(shù)據(jù)往往具有非結(jié)構(gòu)化、異質(zhì)性和分散性等特點(diǎn),因此,企業(yè)競(jìng)爭(zhēng)對(duì)手評(píng)價(jià)應(yīng)當(dāng)包括指標(biāo)信息融合環(huán)節(jié)[6]。具體而言,所建立的企業(yè)競(jìng)爭(zhēng)對(duì)手評(píng)價(jià)指標(biāo)可以包括定性指標(biāo)和定量指標(biāo)[7]。在定量指標(biāo)的融合轉(zhuǎn)換方面,采用數(shù)據(jù)歸一化方法實(shí)現(xiàn)不同類型定量數(shù)據(jù)之間的無(wú)量綱化;在定量-定性指標(biāo)之間的融合轉(zhuǎn)換方面,一般的數(shù)據(jù)融合思路是將定性指標(biāo)統(tǒng)一轉(zhuǎn)換為定量指標(biāo),計(jì)算定性文本的主題隸屬度或情感傾向值(取值范圍[0,1]),將隸屬度或情感傾向值作為數(shù)據(jù)轉(zhuǎn)換結(jié)果[8]。然而,競(jìng)爭(zhēng)對(duì)手評(píng)價(jià)指標(biāo)體系側(cè)重于從競(jìng)爭(zhēng)對(duì)手的資源、能力和技術(shù)等角度評(píng)價(jià)競(jìng)爭(zhēng)對(duì)手的威脅力和競(jìng)爭(zhēng)力[7],而競(jìng)爭(zhēng)對(duì)手畫像的目標(biāo)在于從若干具體的競(jìng)爭(zhēng)對(duì)手中抽取競(jìng)爭(zhēng)對(duì)手的畫像特征,用更加生動(dòng)、直觀和形象的“擬人化”方式理解和描述競(jìng)爭(zhēng)對(duì)手。

        而用戶畫像研究相關(guān)的成果,為企業(yè)競(jìng)爭(zhēng)對(duì)手畫像的構(gòu)建提供了有益的思路。用戶畫像是現(xiàn)實(shí)中典型目標(biāo)用戶的抽象,是基于大量真實(shí)用戶的人口特征、認(rèn)知特征和行為特征的刻畫結(jié)果[9]。例如,在構(gòu)建視頻用戶畫像的過(guò)程中,吳劍云等[9]學(xué)者將用戶的自然屬性(ID、昵稱和性別等)和活動(dòng)屬性(活動(dòng)興趣屬性和視頻興趣屬性等)作為用戶畫像屬性特征,利用K均值算法等模型對(duì)用戶聚類,構(gòu)建了視頻用戶畫像。袁潤(rùn)等[10]學(xué)者將用戶基本屬性數(shù)據(jù)和行為數(shù)據(jù)作為用戶畫像特征數(shù)據(jù),采用數(shù)理統(tǒng)計(jì)等方法構(gòu)建了學(xué)術(shù)博客用戶畫像。王益成等[11]學(xué)者將用戶的期望偏好數(shù)據(jù)和用戶行為日志數(shù)據(jù)作為描述科技情報(bào)用戶畫像的重要數(shù)據(jù)來(lái)源??梢?,基本人口統(tǒng)計(jì)特征、認(rèn)知特征和行為特征是構(gòu)建用戶畫像的3個(gè)重要維度。

        已有的多源數(shù)據(jù)融合、企業(yè)競(jìng)爭(zhēng)對(duì)手和用戶畫像等相關(guān)研究為本研究開展企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建提供了理論基礎(chǔ)和方法基礎(chǔ)。然而,已有研究主要關(guān)注多源數(shù)據(jù)融合視角下的科研團(tuán)隊(duì)畫像和用戶畫像等,較少有學(xué)者關(guān)注企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建研究。融合多源數(shù)據(jù)與方法開展企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建研究,有助于為企業(yè)的競(jìng)爭(zhēng)對(duì)手監(jiān)測(cè)預(yù)警和標(biāo)桿學(xué)習(xí)等提供啟發(fā),解決企業(yè)競(jìng)爭(zhēng)情報(bào)資源有限性和海量競(jìng)爭(zhēng)對(duì)手無(wú)限性之間的矛盾。因此,本研究借鑒用戶畫像構(gòu)建的思路和方法,提出了一套適合企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建的模式,并結(jié)合該模式以H公司為例開展了實(shí)證研究。

        2融合多源數(shù)據(jù)的企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建模式

        本研究從畫像指標(biāo)體系構(gòu)建、指標(biāo)數(shù)據(jù)采集、多源異構(gòu)數(shù)據(jù)融合、畫像構(gòu)建和畫像應(yīng)用5個(gè)環(huán)節(jié)出發(fā),提出了企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建模式的流程、數(shù)據(jù)來(lái)源、數(shù)據(jù)融合方法、畫像構(gòu)建方法和畫像應(yīng)用場(chǎng)景等關(guān)鍵問(wèn)題,如圖1所示。

        21企業(yè)競(jìng)爭(zhēng)對(duì)手畫像維度及指標(biāo)體系

        借鑒用戶畫像的定義,本研究將企業(yè)競(jìng)爭(zhēng)對(duì)手畫像理解為建立在企業(yè)真實(shí)競(jìng)爭(zhēng)對(duì)手的基礎(chǔ)之上,從具體的競(jìng)爭(zhēng)對(duì)手中所抽象出來(lái)的,能夠反映潛在競(jìng)爭(zhēng)對(duì)手普遍典型特征的虛擬代表;其重要意義在于通過(guò)對(duì)畫像的跟蹤監(jiān)測(cè),實(shí)現(xiàn)對(duì)畫像背后所代表的大量真實(shí)競(jìng)爭(zhēng)對(duì)手的分析。借鑒用戶畫像的基本思想,從基本屬性層、認(rèn)知屬性層和行為屬性層3個(gè)維度出發(fā)明確企業(yè)競(jìng)爭(zhēng)對(duì)手畫像的維度,從而實(shí)現(xiàn)了用戶畫像三維度與企業(yè)競(jìng)爭(zhēng)對(duì)手畫像三維度的一一映射,最終實(shí)現(xiàn)了對(duì)企業(yè)競(jìng)爭(zhēng)對(duì)手的“擬人化”描述,如圖2所示。

        在明確了企業(yè)競(jìng)爭(zhēng)對(duì)手畫像的3個(gè)維度之后,分別從基本屬性層、認(rèn)知層和行為層出發(fā)建立畫像指標(biāo)體系。其中,基本屬性層指標(biāo)側(cè)重于各類型的客觀特征(如用戶畫像中的性別年齡和競(jìng)爭(zhēng)對(duì)手的

        企業(yè)規(guī)模等),認(rèn)知層關(guān)注各類型的主觀認(rèn)知層面的指標(biāo)(如用戶畫像中的性格以及競(jìng)爭(zhēng)對(duì)手的品牌形象等),而行為層關(guān)注具體的行為指標(biāo)(如用戶畫像中的用戶瀏覽檢索行為和企業(yè)競(jìng)爭(zhēng)對(duì)手的兼并購(gòu)行為)。

        22指標(biāo)數(shù)據(jù)來(lái)源及采集

        明確了畫像指標(biāo)體系之后,進(jìn)一步采用網(wǎng)絡(luò)爬蟲采集或手工采集等方法搜集競(jìng)爭(zhēng)對(duì)手各個(gè)指標(biāo)的數(shù)據(jù)。例如,采用網(wǎng)絡(luò)爬蟲或手工采集等方式從對(duì)手網(wǎng)站中獲取競(jìng)爭(zhēng)對(duì)手的企業(yè)基本信息、產(chǎn)品信息、企業(yè)戰(zhàn)略、愿景使命和企業(yè)最新動(dòng)態(tài)等涉及基本屬性層、認(rèn)知層和行為層3個(gè)維度的畫像指標(biāo)數(shù)據(jù)。

        23多源異構(gòu)數(shù)據(jù)融合

        然而,不同類型的指標(biāo)數(shù)據(jù)來(lái)源不同,在數(shù)據(jù)類型和數(shù)據(jù)格式上也存在較大差異;因此需要對(duì)多源異構(gòu)指標(biāo)數(shù)據(jù)進(jìn)行融合預(yù)處理。多源數(shù)據(jù)融合主要涉及同名消歧、別名識(shí)別、字段映射和數(shù)據(jù)加權(quán)等問(wèn)題[12-13],而結(jié)合本研究的實(shí)際,本研究的多源數(shù)據(jù)融合主要涉及的是不同類型指標(biāo)數(shù)據(jù)的數(shù)據(jù)類型融合轉(zhuǎn)換和數(shù)據(jù)加權(quán)問(wèn)題。

        1)數(shù)據(jù)類型融合問(wèn)題。首先,在定量-定量指標(biāo)數(shù)據(jù)融合方面,定量指標(biāo)之間存在著量綱差異,而為了消除定量指標(biāo)之間的量綱差異,需要采用一定的算法實(shí)現(xiàn)無(wú)量綱化。離差標(biāo)準(zhǔn)化、對(duì)數(shù)標(biāo)準(zhǔn)化和Z-score算法等方法是較為常見的實(shí)現(xiàn)定量數(shù)據(jù)無(wú)量綱化的方法。其次,在定性-定量指標(biāo)數(shù)

        據(jù)融合方面,以企業(yè)產(chǎn)品口碑等為代表的指標(biāo)以定性指標(biāo)為主,為了實(shí)現(xiàn)定性-定量指標(biāo)數(shù)據(jù)的融合轉(zhuǎn)換,需要綜合采用文本分類算法、TF-IDF算法或LDA主題模型等計(jì)算某文本隸屬于某主題的傾向值(取值范圍[0,1]),將其情感傾向值作為融合轉(zhuǎn)換的結(jié)果并用于后續(xù)研究。其主要流程包括文本清洗預(yù)處理、分詞與詞性標(biāo)注、關(guān)鍵詞抽取、競(jìng)爭(zhēng)對(duì)手關(guān)鍵詞向量構(gòu)建和向量相似度或情感傾向值計(jì)算等。

        2)數(shù)據(jù)加權(quán)問(wèn)題。最后,在指標(biāo)數(shù)據(jù)加權(quán)方面,實(shí)現(xiàn)了不同類型指標(biāo)數(shù)據(jù)的融合之后,還需要確定不同指標(biāo)之間的權(quán)重大小,其主要方法包括模糊綜合評(píng)價(jià)方法、BP神經(jīng)網(wǎng)絡(luò)法和層次分析法等。其中,層次分析法要求參考決策者和領(lǐng)域?qū)<业拇蚍忠庖?,兼具定性和定量的特點(diǎn),是一種計(jì)算指標(biāo)權(quán)重較為重要的方法。具體流程包括:確定指標(biāo)、指標(biāo)判別比較、構(gòu)造判斷矩陣、計(jì)算矩陣特征向量、計(jì)算矩陣權(quán)重向量和一致性檢驗(yàn)?;趯哟畏治龇ㄋ_立的指標(biāo)權(quán)重,計(jì)算出加權(quán)之后的競(jìng)爭(zhēng)對(duì)手各個(gè)維度的指標(biāo)值,為后續(xù)的競(jìng)爭(zhēng)對(duì)手特征向量構(gòu)建提供基礎(chǔ)。

        24數(shù)據(jù)分析及畫像構(gòu)建

        對(duì)企業(yè)競(jìng)爭(zhēng)對(duì)手的各個(gè)維度的指標(biāo)進(jìn)行了融合轉(zhuǎn)換處理和指標(biāo)加權(quán)處理后,進(jìn)一步開展數(shù)據(jù)分析并構(gòu)建畫像。企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建的核心在于對(duì)海量競(jìng)爭(zhēng)對(duì)手的歸納,抽取出具有一般性和代表性的“虛擬對(duì)手”;而聚類分析能夠?qū)崿F(xiàn)對(duì)具有相似特征的單位的聚集和分類,通過(guò)聚類結(jié)果來(lái)抽取畫像。因此,聚類分析方法在畫像研究的方法體系中占據(jù)著十分重要的位置。主要流程包括:

        1)構(gòu)建競(jìng)爭(zhēng)對(duì)手的特征向量。設(shè)企業(yè)競(jìng)爭(zhēng)對(duì)手集為M={A1,A2,A3,…,An},其中An表示第n個(gè)競(jìng)爭(zhēng)對(duì)手;第n個(gè)競(jìng)爭(zhēng)對(duì)手的特征向量為An=(b1,b2,b3,…,bi),其中bi表示第i個(gè)指標(biāo)(取值[0,1])。

        2)特征向量?jī)蓛砷g相似度計(jì)算。采用余弦夾角算法,計(jì)算競(jìng)爭(zhēng)對(duì)手特征向量?jī)蓛芍g的相似度。

        3)構(gòu)造競(jìng)爭(zhēng)對(duì)手特征向量距離矩陣。基于競(jìng)爭(zhēng)對(duì)手特征向量?jī)蓛芍g的相似度,構(gòu)造特征向量相似度矩陣,如表2所示。

        4)基于相似度矩陣,采用K均值聚類和層次聚類等算法進(jìn)行聚類分析。以層次聚類算法為例,利用簡(jiǎn)單連接法、完全連接法、平均連接法、質(zhì)心法或Ward法等對(duì)矩陣進(jìn)行聚類。

        5)提取并描述聚類結(jié)果。由研究者提取出聚類結(jié)果并對(duì)聚類分析結(jié)果進(jìn)行解讀和描述,采用可視化圖表或故事化面板等形式展現(xiàn)企業(yè)競(jìng)爭(zhēng)對(duì)手畫像,并將其提交至決策者。

        25畫像應(yīng)用

        最后,將可視化呈現(xiàn)的競(jìng)爭(zhēng)對(duì)手畫像用于企業(yè)的管理和決策活動(dòng)之中,實(shí)現(xiàn)競(jìng)爭(zhēng)對(duì)手畫像的應(yīng)用價(jià)值,包括:

        1)對(duì)手監(jiān)測(cè)。競(jìng)爭(zhēng)對(duì)手畫像用于企業(yè)競(jìng)爭(zhēng)對(duì)手的動(dòng)態(tài)監(jiān)測(cè)過(guò)程中,能夠通過(guò)對(duì)畫像監(jiān)測(cè)的方式實(shí)現(xiàn)對(duì)海量競(jìng)爭(zhēng)對(duì)手的檢測(cè),包括了解競(jìng)爭(zhēng)對(duì)手近期的成長(zhǎng)變化情況(如市場(chǎng)占有率和市場(chǎng)規(guī)模的變化等)以及了解競(jìng)爭(zhēng)對(duì)手近期的行為軌跡(如招聘和海外并購(gòu)等)。

        2)對(duì)手評(píng)估。用擬人畫像的方式評(píng)估競(jìng)爭(zhēng)對(duì)手的威脅力和實(shí)力等,為企業(yè)競(jìng)爭(zhēng)對(duì)手評(píng)價(jià)提供重要依據(jù),從而為企業(yè)管理層的決策提供支撐。

        3)對(duì)手預(yù)警。與此同時(shí),監(jiān)測(cè)競(jìng)爭(zhēng)對(duì)手畫像,了解競(jìng)爭(zhēng)對(duì)手近期的主要?jiǎng)酉?,從而挖掘出?jìng)爭(zhēng)對(duì)手背后的戰(zhàn)略意圖,為企業(yè)開展競(jìng)爭(zhēng)對(duì)手預(yù)警活動(dòng)提供參考。

        4)標(biāo)桿學(xué)習(xí)。最后,競(jìng)爭(zhēng)對(duì)手畫像對(duì)企業(yè)而言也具有標(biāo)桿學(xué)習(xí)和定標(biāo)比超的作用。借助企業(yè)競(jìng)爭(zhēng)對(duì)手畫像,企業(yè)可以了解競(jìng)爭(zhēng)對(duì)手的主要優(yōu)勢(shì),確定趕超目標(biāo),明確競(jìng)爭(zhēng)方向,為企業(yè)的標(biāo)桿學(xué)習(xí)活動(dòng)提供啟發(fā)。

        3實(shí)證研究

        31研究對(duì)象

        H公司是我國(guó)知名的家電企業(yè),成立于20世紀(jì)50年代末,經(jīng)過(guò)幾十年的發(fā)展已成為我國(guó)家電行業(yè)的綜合型跨國(guó)企業(yè)。在H公司競(jìng)爭(zhēng)對(duì)手的選擇上,結(jié)合本研究的實(shí)際情況(如物力和人力限制,示范過(guò)程為主要目的等),采用簡(jiǎn)單隨機(jī)抽樣方法從目前國(guó)內(nèi)家電行業(yè)領(lǐng)域的上市公司名單中隨機(jī)抽取15個(gè)企業(yè)作為競(jìng)爭(zhēng)對(duì)手,分別將其標(biāo)記為V1、V2、V3、…、V15。通過(guò)構(gòu)建以上競(jìng)爭(zhēng)對(duì)手的畫像,一方面為H公司的競(jìng)爭(zhēng)策略提供啟發(fā);另一方面也為融合多源數(shù)據(jù)構(gòu)建企業(yè)競(jìng)爭(zhēng)對(duì)手畫像提供示范和參考。

        32畫像指標(biāo)體系

        結(jié)合H公司所屬家電行業(yè)的特點(diǎn),分別從基本屬性層、認(rèn)知層和行為層3個(gè)維度構(gòu)建了競(jìng)爭(zhēng)對(duì)手畫像指標(biāo)體系。

        33指標(biāo)數(shù)據(jù)搜集

        在指標(biāo)數(shù)據(jù)采集方法上,采用人工采集和八爪魚爬蟲軟件爬取方式,對(duì)隨機(jī)選取的15個(gè)企業(yè)的指標(biāo)數(shù)據(jù)進(jìn)行了采集。在指標(biāo)數(shù)據(jù)來(lái)源方面,基本屬性層的企業(yè)規(guī)模、盈利能力和科研投入3個(gè)指標(biāo)數(shù)據(jù)主要來(lái)源于上市公司的招股說(shuō)明書和企業(yè)官網(wǎng);認(rèn)知屬性層的企業(yè)文化指標(biāo)來(lái)源于百度百科和企業(yè)官網(wǎng),產(chǎn)品口碑指標(biāo)來(lái)源于官方商城平臺(tái)中的消費(fèi)者評(píng)論;行為屬性層的產(chǎn)品研發(fā)和產(chǎn)品促銷指標(biāo)均來(lái)自企業(yè)官網(wǎng)和官方商城。

        34多源異構(gòu)數(shù)據(jù)融合

        341數(shù)據(jù)類型融合

        1)定量-定量指標(biāo)數(shù)據(jù)融合。首先使用離差標(biāo)準(zhǔn)化方法對(duì)全部定量指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理:

        X*=X-MinMax-Min

        其中,X*表示經(jīng)過(guò)標(biāo)準(zhǔn)化處理的指標(biāo)值(取值范圍[0,1]),X表示實(shí)際值,Min和Max分別表示該指標(biāo)的最小值和最大值。

        2)定性-定量指標(biāo)數(shù)據(jù)融合。首先,采用TF-IDF算法和人工合并的方式,從文本中提煉出企業(yè)文化和產(chǎn)品口碑下的二級(jí)指標(biāo)。采用Python的Jieba分詞工具對(duì)全部文本進(jìn)行分詞和詞性標(biāo)注,去除停用詞和無(wú)實(shí)際意義的詞之后,使用TF-IDF算法從文本中抽取出關(guān)鍵詞,然后由人工對(duì)關(guān)鍵詞進(jìn)行篩選和合并,最終確定了企業(yè)文化和產(chǎn)品口碑兩個(gè)定性一級(jí)指標(biāo)下的6個(gè)二級(jí)指標(biāo),如表4所示。

        然后,借鑒宋新平等[8]的思路,使用Python的SnowNLP庫(kù),計(jì)算每一位企業(yè)競(jìng)爭(zhēng)對(duì)手的各個(gè)二級(jí)指標(biāo)所對(duì)應(yīng)的多個(gè)關(guān)鍵詞所在句子的情感傾向值,將多個(gè)關(guān)鍵詞所在句子的情感傾向值的均值作為對(duì)應(yīng)二級(jí)指標(biāo)的最終情感傾向值;其取值范圍處于[0,1]之間,值越接近1,則表明該二級(jí)指標(biāo)在某競(jìng)爭(zhēng)對(duì)手的特征中越正向明顯。進(jìn)一步地,采用離差標(biāo)準(zhǔn)化方法對(duì)指標(biāo)情感傾向值進(jìn)行無(wú)量綱化處理,最終實(shí)現(xiàn)了對(duì)企業(yè)文化和產(chǎn)品口碑下的6個(gè)定性指標(biāo)的量化融合轉(zhuǎn)換處理。

        342數(shù)據(jù)加權(quán)

        然而,不同類型和不同來(lái)源數(shù)據(jù)的重要性或存在一定差異;因此,多源異構(gòu)數(shù)據(jù)融合的另一個(gè)關(guān)鍵問(wèn)題在于數(shù)據(jù)加權(quán)問(wèn)題。進(jìn)一步采用層次分析法,計(jì)算并賦予不同指標(biāo)權(quán)重系數(shù),主要流程如下:

        1)判別打分,構(gòu)造判斷矩陣。對(duì)一級(jí)指標(biāo)和二級(jí)指標(biāo)兩兩之間進(jìn)行判別打分,構(gòu)造出判別矩陣。

        2)計(jì)算矩陣特征向量。在構(gòu)造了判斷矩陣之后,采用方根法計(jì)算每一個(gè)指標(biāo)的特征向量。其中,Mn表示矩陣每一行中的第n個(gè)元素,n表示每一行的元素個(gè)數(shù),W為計(jì)算出來(lái)的該行的特征向量。以一級(jí)指標(biāo)判斷矩陣為例,其特征向量為(313,050,073,187,059,074,104)。

        W=nM1×M2×M3…×Mn

        3)計(jì)算矩陣權(quán)重向量。進(jìn)一步計(jì)算出判斷矩陣的權(quán)重向量,權(quán)重向量中的值即代表該矩陣中的對(duì)應(yīng)指標(biāo)的權(quán)重。其中,R代表特征向量中對(duì)應(yīng)指標(biāo)的權(quán)重值,n代表特征向量中的向量個(gè)數(shù),Ki表示第i個(gè)特征向量。以一級(jí)指標(biāo)為例,7個(gè)一級(jí)指標(biāo)權(quán)重分別為(036,007,008,021,006,010,012)。

        R=Ki∑ni=1Ki

        4)一致性檢驗(yàn)。最后,計(jì)算全部判別矩陣的CR和CI值,發(fā)現(xiàn)CR和CI均小于01,表明計(jì)算判斷矩陣得到的權(quán)重結(jié)果具有較高的可靠性。

        5)指標(biāo)權(quán)重總排序。匯總得到全部指標(biāo)的權(quán)重結(jié)果,如表6所示。

        6)指標(biāo)數(shù)據(jù)加權(quán)。獲得指標(biāo)權(quán)重之后,將15位競(jìng)爭(zhēng)對(duì)手的各個(gè)指標(biāo)數(shù)據(jù)進(jìn)行加權(quán)處理,賦予其指標(biāo)權(quán)重系數(shù),進(jìn)而實(shí)現(xiàn)了對(duì)不同來(lái)源指標(biāo)的數(shù)據(jù)加權(quán)處理。

        35聚類分析

        1)構(gòu)建競(jìng)爭(zhēng)對(duì)手特征向量。基于數(shù)據(jù)類型融合和數(shù)據(jù)加權(quán)處理結(jié)果,構(gòu)造出15位競(jìng)爭(zhēng)對(duì)手的特征向量。以V1為例,其特征向量V1=(018,018,005,002,003,003,004,007,007,001,0005,0014,008,011)。

        2)向量余弦相似度計(jì)算。對(duì)15位競(jìng)爭(zhēng)對(duì)手特征向量進(jìn)行兩兩之間的余弦相似度計(jì)算。

        COSθ=An·AmAnAm

        3)構(gòu)建競(jìng)爭(zhēng)對(duì)手相似度矩陣?;诟?jìng)爭(zhēng)對(duì)手特征向量?jī)蓛芍g的余弦相似度,構(gòu)建競(jìng)爭(zhēng)對(duì)手相似度矩陣,如表7所示。

        4)層次聚類分析。然后使用層次聚類分析,采用質(zhì)心連接法對(duì)矩陣進(jìn)行聚類,結(jié)果如圖3所示。按照“簇間差異大,簇內(nèi)差異小”的原則,將15位競(jìng)爭(zhēng)對(duì)手劃分為3個(gè)類別:競(jìng)爭(zhēng)對(duì)手一號(hào)(V4、V5,V6,V8,V9,V11,V12,V13,V14,V15)、競(jìng)爭(zhēng)對(duì)手二號(hào)(V2,V7)、競(jìng)爭(zhēng)對(duì)手三號(hào)(V1、V3、V10)。

        36畫像構(gòu)建

        聚類結(jié)果表明,15位真實(shí)具體的競(jìng)爭(zhēng)對(duì)手可以抽象為3個(gè)不同類型的競(jìng)爭(zhēng)對(duì)手畫像。因此,進(jìn)一步對(duì)不同類別中所包含的競(jìng)爭(zhēng)對(duì)手的指標(biāo)數(shù)據(jù)進(jìn)行描述性分析,并采用可視化圖形等方式構(gòu)建競(jìng)爭(zhēng)對(duì)手畫像,描述3種競(jìng)爭(zhēng)對(duì)手畫像的不同特點(diǎn)。

        4結(jié)語(yǔ)與展望

        本研究首先回顧了多源數(shù)據(jù)融合、企業(yè)競(jìng)爭(zhēng)對(duì)手評(píng)價(jià)和用戶畫像研究等相關(guān)成果,然后從競(jìng)爭(zhēng)對(duì)手畫像指標(biāo)體系、指標(biāo)數(shù)據(jù)采集、多源異構(gòu)數(shù)據(jù)融合、聚類分析、畫像構(gòu)建和畫像應(yīng)用等環(huán)節(jié)出發(fā)構(gòu)建了一套融合多源數(shù)據(jù)的企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建模式,并以H公司為例,搜集指標(biāo)數(shù)據(jù)展開實(shí)證研究,最終從H公司的主要競(jìng)爭(zhēng)對(duì)手中抽取出了3個(gè)對(duì)手畫像。

        本研究具有一定的創(chuàng)新性和應(yīng)用價(jià)值。首先,已有研究主要關(guān)注科研團(tuán)隊(duì)畫像和用戶畫像研究,而本研究關(guān)注如何融合多源數(shù)據(jù)構(gòu)建企業(yè)競(jìng)爭(zhēng)對(duì)手畫像;其次,本研究指出企業(yè)競(jìng)爭(zhēng)對(duì)手畫像應(yīng)當(dāng)借鑒用戶畫像的基本思想,從基本屬性層、認(rèn)知屬性層和行為層3個(gè)維度出發(fā)構(gòu)建“擬人化”的畫像指標(biāo)體系;最后,本研究提出了一套融合多源數(shù)據(jù)

        的企業(yè)競(jìng)爭(zhēng)對(duì)手畫像構(gòu)建模式,為后續(xù)理論研究和實(shí)踐研究提供了借鑒。本研究也存在一定局限性,例如,受研究的人力物力等因素的影響,實(shí)證研究部分中所選擇的企業(yè)競(jìng)爭(zhēng)對(duì)手?jǐn)?shù)量較少,未開展用戶虛假評(píng)論的識(shí)別工作,畫像指標(biāo)體系和指標(biāo)權(quán)重的確定過(guò)程較為粗糙。然而,鑒于實(shí)證研究部分的主要目的在于演示和示范本研究所提出的模式體系的有效性,因此從示范和參考的角度來(lái)看,實(shí)證過(guò)程依然具有一定的借鑒價(jià)值。

        未來(lái)相關(guān)研究可以關(guān)注以下幾個(gè)方面的內(nèi)容:

        1)構(gòu)建企業(yè)競(jìng)爭(zhēng)對(duì)手畫像實(shí)時(shí)監(jiān)測(cè)系統(tǒng),實(shí)現(xiàn)競(jìng)爭(zhēng)對(duì)手畫像的自動(dòng)監(jiān)測(cè)和可視化呈現(xiàn)。對(duì)于企業(yè)而言,依賴人工開展指標(biāo)數(shù)據(jù)的采集、數(shù)據(jù)融合、聚類分析和畫像構(gòu)建等,不僅需要耗費(fèi)大量的人力物力,同時(shí)也會(huì)嚴(yán)重影響畫像構(gòu)建的效率和時(shí)效性。因此,企業(yè)可以建立競(jìng)爭(zhēng)對(duì)手畫像監(jiān)測(cè)系統(tǒng),將專家和決策者構(gòu)建出的畫像指標(biāo)體系提交至系統(tǒng),由系統(tǒng)自動(dòng)采集和爬取各類型指標(biāo)數(shù)據(jù),基于數(shù)據(jù)融合算法實(shí)現(xiàn)不同類型數(shù)據(jù)的融合和加權(quán)處理,并自動(dòng)開展聚類分析,形成聚類結(jié)果和可視化圖表等。

        2)注重采集指標(biāo)的時(shí)間序列數(shù)據(jù)而非靜態(tài)截面數(shù)據(jù)。此外,對(duì)于競(jìng)爭(zhēng)對(duì)手畫像的構(gòu)建過(guò)程而言,關(guān)注競(jìng)爭(zhēng)對(duì)手畫像的演變和動(dòng)態(tài)發(fā)展過(guò)程,也是競(jìng)爭(zhēng)對(duì)手畫像研究的重要內(nèi)容。傳統(tǒng)的靜態(tài)截面數(shù)據(jù)只能反映某時(shí)某刻競(jìng)爭(zhēng)對(duì)手的畫像,其作用類似于給競(jìng)爭(zhēng)對(duì)手“拍照”;而采用指標(biāo)的時(shí)間序列數(shù)據(jù)開展競(jìng)爭(zhēng)對(duì)手畫像研究,有利于探析競(jìng)爭(zhēng)對(duì)手畫像的動(dòng)態(tài)演變過(guò)程,其作用類似于給競(jìng)爭(zhēng)對(duì)手“拍視頻”,從而能更好實(shí)現(xiàn)競(jìng)爭(zhēng)對(duì)手畫像的追蹤和實(shí)時(shí)監(jiān)測(cè)。

        3)區(qū)分多源數(shù)據(jù)融合、多源信息融合和多源情報(bào)融合,針對(duì)不同的融合層次選擇恰當(dāng)?shù)娜诤戏椒ā?shù)據(jù)融合面向數(shù)據(jù)底層,信息融合面向中層而情報(bào)融合面向頂層;從底層到頂層,數(shù)據(jù)的有序性、知識(shí)性以及人的介入性越明顯。遙感和物聯(lián)網(wǎng)領(lǐng)域所談及的多源數(shù)據(jù)融合主要面向數(shù)據(jù)底層,在融合方法上包括卡爾曼濾波法、多貝葉斯估計(jì)法、產(chǎn)生式規(guī)則和模糊邏輯理論等面向數(shù)據(jù)底層的融合算法[1,3]。而企業(yè)競(jìng)爭(zhēng)對(duì)手畫像研究面向社會(huì)數(shù)據(jù)融合,其融合層次更高,更多涉及的是中層融合,即信息融合。在融合多源數(shù)據(jù)的競(jìng)爭(zhēng)對(duì)手畫像研究過(guò)程中,除了定量-定量融合的離差標(biāo)準(zhǔn)化和定性-定量融合的LDA主題模型等方法,未來(lái)相關(guān)研究可以結(jié)合多源社會(huì)數(shù)據(jù)融合的特點(diǎn)開發(fā)出更多的融合方法。

        4)關(guān)注多源社會(huì)數(shù)據(jù)融合中的信息失真現(xiàn)象,把握數(shù)據(jù)融合與信息失真之間的平衡。企業(yè)競(jìng)爭(zhēng)對(duì)手的多源數(shù)據(jù)融合面向中層的信息融合,因此競(jìng)爭(zhēng)對(duì)手的多源指標(biāo)數(shù)據(jù)本身攜帶了大量的信息。然而,數(shù)據(jù)融合過(guò)程中或存在一定的信息失真現(xiàn)象,即采用數(shù)據(jù)融合方法對(duì)不同類型和不同來(lái)源的指標(biāo)數(shù)據(jù)進(jìn)行融合處理時(shí),一部分?jǐn)?shù)據(jù)或在融合過(guò)程中丟失其原本形態(tài)所攜帶的信息。

        數(shù)據(jù)融合程度越深,其信息失真現(xiàn)象或越嚴(yán)重。因此,如何選擇合適的融合方法和融合層次,把握數(shù)據(jù)融合與信息失真之間的平衡,也是未來(lái)相關(guān)研究需要關(guān)注的重點(diǎn)。

        參考文獻(xiàn)

        [1]化柏林,李廣建.大數(shù)據(jù)環(huán)境下多源信息融合的理論與應(yīng)用探討[J].圖書情報(bào)工作,2015,59(16):5-10.

        [2]周群,化柏林.基于多源數(shù)據(jù)融合的科技決策需求主題識(shí)別研究[J].情報(bào)理論與實(shí)踐,2019,42(3):107-113.

        [3]徐緒堪,吳慧中,張吉成,等.基于多源數(shù)據(jù)融合的突發(fā)事件決策需求研究[J].情報(bào)理論與實(shí)踐,2017,40(11):40-44,51.

        [4]魯奇.基于多源數(shù)據(jù)挖掘的旅游客戶細(xì)分研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2008.

        [5]張大勇,景東,卜巍.融合多源數(shù)據(jù)的微信用戶信息分享行為特征研究[J].情報(bào)科學(xué),2019,37(2):83-88.

        [6]李賀,毛剛.基于競(jìng)爭(zhēng)情報(bào)分析的企業(yè)競(jìng)爭(zhēng)對(duì)手評(píng)價(jià)系統(tǒng)構(gòu)建研究[J].情報(bào)科學(xué),2009,27(2):249-253.

        [7]徐海寧,孫忠林.企業(yè)競(jìng)爭(zhēng)對(duì)手威脅力評(píng)估指標(biāo)體系研究[J].圖書館學(xué)研究,2016,(2):93-97.

        [8]宋新平,陳夢(mèng)夢(mèng),申彥,等.大數(shù)據(jù)下基于多源信息融合的企業(yè)競(jìng)爭(zhēng)對(duì)手評(píng)價(jià)模型研究[J/OL].情報(bào)理論與實(shí)踐,http://kns.cnki.net/kcms/detail/11.1762.G3.20190919.1333.010.html,2019-09-19.

        [9]吳劍云,胥明珠.基于用戶畫像和視頻興趣標(biāo)簽的個(gè)性化推薦[J/OL].情報(bào)科學(xué),http://kns.cnki.net/kcms/detail/22.1264.g2.20200430.1545.017.html,2020-05-06.

        [10]袁潤(rùn),王琦.學(xué)術(shù)博客用戶畫像模型構(gòu)建與實(shí)證——以科學(xué)網(wǎng)博客為例[J].圖書情報(bào)工作,2019,63(22):13-20.

        [11]王益成,王萍,張禹.基于向量空間模型的科技情報(bào)用戶畫像及場(chǎng)景化服務(wù)推送研究[J].現(xiàn)代情報(bào),2020,40(2):3-10,25.

        [12]莫君蘭,竇永香,開慶.基于多源異構(gòu)數(shù)據(jù)的科研團(tuán)隊(duì)畫像的構(gòu)建[J/OL].情報(bào)理論與實(shí)踐,http://kns.cnki.net/kcms/detail/11.1762.G3.20200502.0936.002.html,2020-05-06.

        [13]化柏林.多源信息融合方法研究[J].情報(bào)理論與實(shí)踐,2013,36(11):16-19.

        (責(zé)任編輯:孫國(guó)雷)

        极品少妇一区二区三区| 国产精品久久久久精品一区二区| 成人午夜福利视频镇东影视| 色一情一乱一伦一区二区三欧美| 国产亚洲日韩欧美久久一区二区| 人妻少妇精品无码系列| 亚洲国产剧情一区在线观看| 成人在线视频自拍偷拍| 一本色道久久88—综合亚洲精品| 在线观看成人无码中文av天堂| 亚洲精品无码高潮喷水在线| 成人xx免费无码| 熟女乱乱熟女乱乱亚洲| 成人性生交大片免费看l| 日韩精品在线视频一二三| 被三个男人绑着躁我好爽视频 | 香蕉视频www.5.在线观看| 精品国免费一区二区三区| 国产在线一区二区三区四区乱码| 日日拍夜夜嗷嗷叫国产| 亚洲成色在线综合网站| 国产成人AV乱码免费观看| 中文字幕精品一区二区的区别| 国产做爰又粗又大又爽动漫| 18无码粉嫩小泬无套在线观看 | 美女极度色诱视频国产免费| 精品精品国产三级av在线| 国产又爽又大又黄a片| 亚洲国产精品一区二区久| 91亚洲精品福利在线播放| 国内精品人人妻少妇视频| av免费不卡一区二区| av无码电影一区二区三区| 九九热线有精品视频86| 欧美性xxxx狂欢老少配| 中文字幕少妇AV| 少妇又色又爽又刺激的视频| 国产桃色一区二区三区| 无码乱人伦一区二区亚洲一| 99久久国语露脸精品国产| 久久精品国产亚洲av麻豆四虎|