摘? 要:隨著Web2.0時代的到來,如何將爬蟲技術(shù)下沉運(yùn)用到社交個人信息的篩選、抽取、組合、分析中,最后得出有助于個人網(wǎng)絡(luò)社交形象的塑造和社交電商營銷的分析報告,成為人們關(guān)注的重要問題。通過OAuth2.0技術(shù),可以實(shí)現(xiàn)經(jīng)過用戶授權(quán)的各類信息的獲取。這一技術(shù)是實(shí)現(xiàn)社群經(jīng)營指標(biāo)分析的基礎(chǔ)。通過有效的系統(tǒng)設(shè)計,我們可以通過系統(tǒng)生成出各種各樣的對比分析圖,用于幫助人們建立更好的、競爭力更強(qiáng)的社交形象,提升發(fā)布內(nèi)容質(zhì)量,進(jìn)一步激發(fā)用戶的自我提升能力。除此之外,該技術(shù)還可以應(yīng)用于電商品牌的塑造和影響力的生成,也可以用于自媒體運(yùn)營和發(fā)布內(nèi)容的分析、知識共享平臺中對用戶提供指導(dǎo)參考等等。
關(guān)鍵詞:爬蟲技術(shù);運(yùn)營管理;社交形象定位和塑造
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2019)08-0023-02
Abstract:With the advent of Web2.0,how to apply crawler technology to the screening,extraction,combination and analysis of social personal information,and finally draw an analysis report that is conducive to the building of personal network social image and social e-commerce marketing,has become an important issue of concern to people. Through OAuth2.0 technology,all kinds of information obtained through user authorization can be realized. This technology is the basis of community management index analysis. Through effective system design,we can generate a variety of comparative analysis charts through the system to help people build a better and more competitive social image,improve the quality of published content,and further stimulate the self-improvement ability of users. In addition,this technology can not only be used to shape and influence e-commerce brands,but also can be used for the analysis of We-Media operation and published content,to provide guidance and reference for users in the knowledge sharing platform,and so on.
Keywords:crawler technology;operation management;social image positioning and shaping
0? 引? 言
隨著互聯(lián)網(wǎng)的快速發(fā)展,爬蟲技術(shù),即在冗雜的海量信息中高效快捷地抽取用戶需要的信息的一項技術(shù)也應(yīng)運(yùn)而生。這樣的一種輔助性搜索技術(shù)被運(yùn)用到互聯(lián)網(wǎng)行業(yè)中去,大大地方便了人們的工作和生活。網(wǎng)絡(luò)社交,作為另一種深刻影響人們生產(chǎn)生活的互聯(lián)網(wǎng)平臺,則是更加普遍地與個體緊密聯(lián)系起來。研究表明,用戶愿意為管理自己的在線社交賬戶而付出更多的成本,這其中包括:過濾負(fù)面信息、人設(shè)塑造、虛擬化、個性化等等。不同于網(wǎng)紅塑造,這樣的社交形象管理不存在商業(yè)化運(yùn)作,但又是人們普遍存在的需求,在經(jīng)營自己的社交形象時,他們很難從專業(yè)的角度,全面的審視自己的社交形象,針對這種情況,本文將闡述一種將信息抓取并初步處理后運(yùn)用到社交形象的管理與塑造的技術(shù)。
1? 國外案例——Socialbakers
Socialbakers是針對社群經(jīng)營指標(biāo)分析,所開發(fā)出來的工具。2008年10月13日,一家全球人工智能社交媒體營銷公司,提出名為Socialbakers Suite的營銷軟件即服務(wù)平臺。它被McDonalds,L’Oreal和Desigual等品牌用于Facebook,Instagram,Twitter,YouTube,LinkedIn,Google +,VK和Pinterest上的社交媒體營銷。2010年7月,Socialbakers推出了FanPage Analyzer,為用戶提供有關(guān)其Facebook頁面所遇到的問題以及競爭對手的信息。2012年1月,Socialbakers推出了針對Twitter的Analytics。他們開始提供Twitter統(tǒng)計數(shù)據(jù)的分析,如每日追隨者增長、每日推文與轉(zhuǎn)推比率、總提及數(shù)量等。
Socialbakers營銷套件包括幾個社交媒體管理工具,包括分析、“競爭洞察”和基準(zhǔn)測試、企業(yè)發(fā)布工具、廣告,在Facebook和Twitter上優(yōu)化和管理廣告、傾聽,幫助品牌跟隨品牌周圍的對話并提供專業(yè)服務(wù)。
Socialbakers Analytics通過監(jiān)控Facebook、Twitter、LinkedIn、VK、Pinterest和YouTube上的社交媒體資料(近期添加了關(guān)于Instagram的報告)來生成營銷信息。該軟件提供性能指標(biāo)來衡量粉絲增長,跟蹤關(guān)鍵影響因素,分析參與率和交互,針對競爭對手和行業(yè)標(biāo)準(zhǔn)的基準(zhǔn)性能,優(yōu)化社交媒體存在并生成圖形報告。Socialbakers Builder是一個用于安排和發(fā)布內(nèi)容以及在社交媒體上圍繞品牌聚合對話的工具。除主要產(chǎn)品套件外,Socialbakers還提供多項服務(wù),包括EdgeRank Checker,這是一種深度學(xué)習(xí)算法,可以告訴用戶哪些內(nèi)容最適合其品牌的Facebook頁面等等。
2? 國外爬蟲技術(shù)介紹
作為Web 2.0時代的典型應(yīng)用,社交網(wǎng)絡(luò)服務(wù)正在世界各地以極快的速度流行起來。隨著社交網(wǎng)絡(luò)的不斷發(fā)展以及注冊用戶的迅猛增加,越來越多的研究人員開始研究如何將現(xiàn)有的python技術(shù)運(yùn)用到社交網(wǎng)站的信息抓取中。國外研究者多針對Facebook、Twitter等進(jìn)行數(shù)據(jù)采集,研究者在Twitter平臺上建立網(wǎng)絡(luò)模型,對網(wǎng)絡(luò)特性進(jìn)行研究,Twitter底層的很多接口和庫是公開的,研究者多利用這一特性對Twitter數(shù)據(jù)進(jìn)行統(tǒng)計;Facebook也逐漸開放了API接口,研究者利用陸續(xù)開放的接口對Facebook用戶數(shù)據(jù)進(jìn)行采集與研究應(yīng)用。國內(nèi)的研究人員將以Twitter為原型的新浪微博作為研究對象,開發(fā)出了OAuth2.0技術(shù)。
3? OAuth2.0技術(shù)
OAUTH是一種開放的授權(quán)標(biāo)準(zhǔn)。它允許用戶將自己存放在一個站點(diǎn)上的資源分享給另一個資源,而在這個過程中用戶不需要將他在資源站點(diǎn)上的證書提供給另一站點(diǎn),如用戶名、密碼。用戶可以通過一系列授權(quán)指令,將信息共享授權(quán)指令發(fā)送給微博的API,微博API提供Rest風(fēng)格的基礎(chǔ)數(shù)據(jù)接口,包括:獲取下行數(shù)據(jù)集接口、微博接口、用戶接口、標(biāo)簽接口、話題接口、OAUTH接口等,這些接口為第三方開發(fā)者提供了諸如獲取用戶信息、獲取好友關(guān)系、發(fā)送微博等功能。
返回數(shù)據(jù)包括:用戶id、用戶昵稱、友好顯示名稱、用戶所在地、用戶博客地址、用戶個人描述、用戶個性化域名、用戶頭像地址、性別、粉絲數(shù)、關(guān)注數(shù)、收藏數(shù)、微博數(shù)、用戶創(chuàng)建(注冊)時間、是否是微博認(rèn)證用戶、認(rèn)證原因、用戶互粉數(shù)、用戶的在線狀態(tài)等。
該技術(shù)采用廣度優(yōu)先的爬行辦法,通過開放API,模擬登錄,獲得更多權(quán)限和相關(guān)信息,實(shí)現(xiàn)了初步的信息抓取。
4? 系統(tǒng)設(shè)計——以新浪微博為例
免費(fèi)功能包括:個人社交頁分析報告:包括近三個月內(nèi)的用戶上線時間散點(diǎn)分布圖;每日平均登錄頻次;關(guān)注量變化情況折線圖;獲取最受歡迎帖子的數(shù)據(jù),包括瀏覽量、點(diǎn)贊數(shù)、轉(zhuǎn)發(fā)量、評論量(Top3進(jìn)行圖片截取展示);話題量統(tǒng)計(表格展示使用量前5名);話題影響度&熱度(與使用該話題熱度最大的帖子進(jìn)行數(shù)據(jù)對比),以上指標(biāo)可以在用戶授權(quán)之后,自動生成報告。用戶可以通過輸入郵箱地址,獲取PDF版本的個人社交頁分析報告。
用戶對比報告:輸入自己微博ID并VS競爭對手的ID(單個),可以獲取關(guān)于近三個月每周發(fā)帖量的對比圖、發(fā)帖總量色條PK圖、每周平均發(fā)帖量色條PK圖;近三個月每周漲粉量對比圖、實(shí)際粉絲活躍量對比圖、1000粉絲量中最大互動量帖子PK色條圖、1000粉絲中最小互動帖子的PK色條圖、1000粉絲量中平均互動量帖子PK色條圖、展示最成功發(fā)帖內(nèi)容Top3(發(fā)帖用戶頭像、發(fā)帖時間、發(fā)帖內(nèi)容、總互動量、點(diǎn)贊、評論量、分享量、每一千粉絲互動比例)。用戶可以輸入郵箱地址獲取PDF版本的用戶對比報告。
多用戶對比分析報告:輸入自己微博ID并VS競爭對手ID(多個),可以獲取以發(fā)帖量和互動量為軸的象限報告;發(fā)帖量與互動量的倍數(shù)曲線圖(分析平均發(fā)帖的影響效率)。用戶可以直接在網(wǎng)頁獲取該報告。
付費(fèi)功能:對不同的平臺進(jìn)行統(tǒng)一監(jiān)控,把握競爭者的實(shí)時數(shù)據(jù),提供更加詳盡的分析報告。具體功能包括:(1)使用社交媒體分析衡量用戶的策略的影響。利用可操作的見解來推動實(shí)際業(yè)務(wù)成果,并輕松地在整個業(yè)務(wù)中共享數(shù)據(jù)。獲取用戶需要的背景信息,并根據(jù)用戶的行業(yè)、國家/地區(qū),進(jìn)一步了解用戶的策略在關(guān)鍵指標(biāo)中的智能程度,例如總廣告支出、廣告參與度、廣告費(fèi)用和內(nèi)容效果。(2)通過受眾分析,將用戶的內(nèi)容定制為合適的人物角色。將用戶的數(shù)字受眾群體數(shù)據(jù)整合到一個位置,借助AI生成用戶可以信賴的角色個人資料。創(chuàng)建與用戶的細(xì)分受眾群產(chǎn)生共鳴的個性化內(nèi)容,并使用社交媒體分析來分析和報告用戶的結(jié)果。(3)分析用戶的廣告系列的情緒。輕松了解受眾對用戶的廣告系列的感受和情感,并分析他們背后的情緒。確定人們喜愛的內(nèi)容并使用這些數(shù)據(jù)來構(gòu)建可帶來更多積極影響的策略。(4)構(gòu)建和共享易于閱讀的社交媒體報告輕松跟蹤和報告用戶的進(jìn)度。獲取可更新的可自定義儀表板,該儀表板配備第三方數(shù)據(jù)集成,用戶可以通過移動設(shè)備輕松導(dǎo)出。通過直接發(fā)送到收件箱的自動報告,讓用戶的團(tuán)隊快速掌握數(shù)據(jù)信息。
5? 結(jié)? 論
綜上所述,該技術(shù)通過收集用戶微博相關(guān)數(shù)據(jù),并對收集到的微博交互情況進(jìn)行分析,定義高影響力用戶,將用戶發(fā)微博時間、用戶微博的轉(zhuǎn)發(fā)、評論、點(diǎn)贊等交互行為因素以及博文的內(nèi)容相結(jié)合,分類提取特征,評估和預(yù)測用戶以及所發(fā)微博的影響力,可以進(jìn)一步凈化網(wǎng)絡(luò)虛假信息,優(yōu)化網(wǎng)絡(luò)生態(tài)環(huán)境;幫助用戶自我經(jīng)營、自我管理社交平臺,自助提升內(nèi)容質(zhì)量,擴(kuò)大影響力,進(jìn)一步促進(jìn)社交環(huán)境的繁榮發(fā)展。
參考文獻(xiàn):
[1] 孫曉,葉嘉麒,唐陳意,等.基于多策略的新浪微博大數(shù)據(jù)抓取及應(yīng)用 [J].合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2014,37(10):1210-1215.
[2] 丁兆云,賈焰,周斌.微博數(shù)據(jù)挖掘研究綜述 [J].計算機(jī)研究與發(fā)展,2014,51(4):691-706.
[3] 孫青云,王俊峰,趙宗渠,等.一種基于模擬登錄的微博數(shù)據(jù)采集方案 [J].計算機(jī)技術(shù)與發(fā)展,2014,24(3):6-10.
[4] 王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望 [J].計算機(jī)學(xué)報,2013,36(6):1125-1138.
[5] 黃延煒,劉嘉勇.新浪微博數(shù)據(jù)獲取技術(shù)研究 [J].信息安全與通信保密,2013(6):71-73+76.
[6] 廉捷,周欣,曹偉,劉云.新浪微博數(shù)據(jù)挖掘方案 [J].清華大學(xué)學(xué)報(自然科學(xué)版),2011,51(10):1300-1305.
[7] 姚科.開放API:新浪微博必經(jīng)之路? [J].互聯(lián)網(wǎng)天地,2010(8):71-72.
[8] 姚峰.Java平臺中Base64編碼/解碼算法的改進(jìn) [J].計算機(jī)應(yīng)用與軟件,2008,25(12):164-165+176.
作者簡介:李雅薇(1998.05-),女,漢族,江西人,在校本科生,研究方向:工商管理。