亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        社交網(wǎng)絡Twitter的推文抽取技術研究*

        2012-07-11 08:47:58劉曉然嚴岳松
        艦船電子工程 2012年9期
        關鍵詞:推文開放平臺應用程序

        游 彬 劉曉然 李 寧 嚴岳松

        (海軍指揮學院信息系 南京 211800)

        1 引言

        隨著互聯(lián)網(wǎng)技術的發(fā)展,時至今日,網(wǎng)頁內容存在多樣性和動態(tài)性等特點[1],為了有針對性的抓取互聯(lián)網(wǎng)信息資源,目前學者對網(wǎng)頁和網(wǎng)絡的分類如表1所示。

        表1 網(wǎng)頁和網(wǎng)絡的分類

        隱藏在互聯(lián)網(wǎng)數(shù)據(jù)庫中的動態(tài)網(wǎng)頁,沒有超鏈接的互相關聯(lián),其信息量卻占據(jù)整個互聯(lián)網(wǎng)的絕大部分。這部分網(wǎng)頁有的只能通過網(wǎng)站的查詢接口提交來動態(tài)生成,有的需要注冊和登錄之后才能查看,因此傳統(tǒng)的Web處理相關技術研究和應用無法獲取這些信息,學者開始研究針對動態(tài)網(wǎng)頁的信息采集技術。

        目前,隨著信息化技術的發(fā)展,信息系統(tǒng)已經成為不可或缺的基礎設施,并廣泛應用于社會生活中[2]。對于社交網(wǎng)站推特(Twitter)等深層網(wǎng)絡,其信息內容一般較短,但時效性很強,觀點突出,因此推特的140字推文(tweets)限制看似缺陷,實則為極大的優(yōu)勢:全球移動通信網(wǎng)絡的擴張使得這種極度適合手機閱讀的傳播方式繼續(xù)爆發(fā),對于各種突發(fā)新聞,推特比CNN等傳媒巨頭更有優(yōu)勢,推特上的推文信息完全可以作為商業(yè)競爭或軍事情報的素材。

        2011年利比亞戰(zhàn)爭初期,北約發(fā)言人、英國皇家空軍中校麥克·布蘭肯首次確認了推特(twitter,國外著名的社交網(wǎng)站)作為情報工具的事實:他們從推特上獲得了很多關于卡扎菲武裝在受困城市班加西和的黎波里的動向的消息[3~5]。推特在情報獲取或輿情分析等應用領域具有廣泛的前景。

        本文研究了Twitter等社交網(wǎng)站所遵循的協(xié)議,并在Java環(huán)境下實現(xiàn)了這類網(wǎng)站的信息抽取的關鍵代碼,以期待為網(wǎng)絡輿情等信息抽取應用領域提供新的動態(tài)網(wǎng)絡的信息來源。

        2 OAuth協(xié)議認證

        2.1 OAuth協(xié)議簡介

        OAuth(開放式驗證協(xié)議)是一種開放的協(xié)議,由IETF(Internet Engineering Task Force,Internet工程任務組)起草,目前最新版本為OAuth2.0第21版[6],支持用戶在不同的Web站點共享其私有數(shù)據(jù)和憑證,但僅在擁有數(shù)據(jù)的原始Web站點公開數(shù)據(jù)。

        2011年互聯(lián)網(wǎng)廠商如騰訊、新浪微博、人人網(wǎng)等都推出了各自的開放平臺,第三方開發(fā)者可以基于開放平臺的開放API開發(fā)各種各樣的應用[7],大多數(shù)開放平臺采用了較新的 OAuth2.0版本[8],也有部分廠家采用了OAuth1.0a版本,或者兩種版本共用,如表2所示。

        表2 各類開放平臺的OAuth版本

        OAuth協(xié)議支持用戶將存儲在一個Web站點的私有資源數(shù)據(jù)(如私人照片)與其他站點共享,而不會將用戶的憑證(如用戶名和密碼)泄漏給除擁有用戶數(shù)據(jù)的Web站點之外的其他站點。采用OAuth作為其中一種身份驗證協(xié)議的Web站點將增強用戶的隱私保護和安全性。

        2.2 OAuth協(xié)議的原理

        在OAuth中有三個主要角色:用戶、使用者和服務提供商。如表3所示。

        表3 OAuth協(xié)議中的主要角色

        為了抓取twitter網(wǎng)上所關注對象的推文內容,首先需要注冊twitter帳戶。用戶、使用者和服務提供商twitter之間的OAuth交互如所示。OAuth協(xié)議認證雖然有用戶登錄的過程[9],但是,其登錄始終是在服務提供商的頁面登錄,而并非在第三方資源數(shù)據(jù)使用者(如桌面應用程序或Web程序)的頁面,從而保證了用戶的登錄名和密碼不泄露給第三方。

        圖1 用戶、應用程序和twitter之間的OAuth交互

        工作流程描述如下:

        1)擁有Twitter帳戶的用戶通過第三方應用程序要求查看推文內容;

        2)應用程序向Twitter網(wǎng)請求Request_Token,Twitter返回臨時未授權Request_Token;

        3)應用程序引導用戶至Twitter登錄授權,授權后Twitter引導用戶回到應用程序;

        4)應用程序向Twitter請求Access_Token;

        5)應用程序用返回的Access_Token訪問用戶的推文;

        6)應用程序將推文反饋并展示給用戶。

        從上述分析可知,整個過程是安全可信的,除非第三方Consumer是不可信的應用程序,在引導用戶至Twitter登錄界面時使用釣魚網(wǎng)站,獲取用戶的帳號名和密碼。

        推特API與twitter4j目前Twitter僅支持HTTP Basic Authentication驗證機制,通過API的方式開放一些應用接口,除了部分API(如公共時間線public timeline)外,所有的API方法都必須要求用戶認證,所有的返回都與認證用戶相關[12]。例如,嘗試獲取一個設置為私密的且不是您的好友的用戶信息時,將會返回失敗狀態(tài)。根據(jù)用戶特定的請求返回對應特定格式的數(shù)據(jù),Twitter目前支持以下的四種數(shù)據(jù)返回格式:XML、JSON、RSS、Atom。與獲取推文有關的部分接口方法如表4所示。

        表4 部分API接口方法

        Twitter4J是一個非官方的封裝了Twitter API的Java客戶端開發(fā)包,使用Twitter4j可以在應用程序中集成Twitter的服務,提供的功能包括:獲取朋友,特殊用戶的時間線(Timeline),收發(fā)私信(Direct Messages),搜索推文等,其主要特點是:不依賴第三方開發(fā)包,支持OAuth協(xié)議。

        3 基于OAuth協(xié)議和twitter4j的推文抽取

        圖2 第三方Consumer程序的流程圖

        文獻[1]針對 Twitter、Facebook和人人網(wǎng)等深層網(wǎng)絡(Deep Web,主要指動態(tài)網(wǎng)絡資源),使用Twitter API調用設計了增量式爬蟲,能較好地抓取關注對象的Twitter信息。為了使抽取的推文信息更具針對性,論文將根據(jù)用戶設定的關鍵詞,調用基于OAuth協(xié)議的twitter4j的編程接口,在Java環(huán)境下實現(xiàn)Twitter的關鍵詞推文抽取,第三方Consumer程序的流程圖如圖2所示。

        程序關鍵代碼及其說明如下:

        在上述代碼的驗證身份信息和訪問權限部分,consumerKey和consumerSecret和accessTokenSecret是兩對密鑰,需到 Twitter網(wǎng)(https://dev.twitter.com/apps/new)使用已注冊的帳戶名和密碼申請,兩對密鑰背后的安全機制為OAuth協(xié)議。密鑰的功能說明如下:

        consumerKey和consumerSecret,代表客戶端應用程序,搜索應用程序將用這對密鑰來訪問您所創(chuàng)建帳戶的Twitter Web服務。

        AccessToken和AccessTokenSecret,結合使用來簽署搜索應用程序發(fā)送到Twitter Web服務的請求。

        在關鍵詞查詢部分,用戶可設定searchKeyword,如在實驗中設定為“Obama”,最后將推文(tweets)存入列表,調用getFromUser()和getText()函數(shù)在控制臺打印。

        4 結語

        因其快捷的信息傳播方式,Twitter在時效性上已超越了廣大媒體,Twitter已不再局限于個人的推文收發(fā),而深受政府和企業(yè)青睞。研究社交網(wǎng)絡的信息抽取技術能為情報分析工作提供有效的信息來源和途徑。

        本文在Java環(huán)境下實現(xiàn)了Twitter推文信息的抽取,如何突破API每小時150次訪問的限制,以抽取更多的信息量,以及如何判斷信息的可信度,整合抽取回的信息,是下一步亟待解決的問題。

        [1]胡亞楠.社交網(wǎng)絡獲取技術與實現(xiàn)[D].哈爾濱工業(yè)大學,2011.

        [2]游彬,韋偉,劉曉然,等.基于主動網(wǎng)絡的軍事化安全防護體系研究[J].艦船電子工程,2011,31(11):1-3.

        [3]Spencer Ackerman.Twitter:利比亞戰(zhàn)爭中的新式武器[EB/OL].譯言 網(wǎng),(2011-06-12)[2012-4-15].http://article.yeeyan.org/view/232379/200519?from=rss_related.

        [4]張品秋.北約利用“推特”網(wǎng)站收集利比亞情報[N].中國日報,2011-6-16.

        [5]社交網(wǎng)站被納入軍方情報網(wǎng)“推特”助力北約空襲[EB/OL].中國網(wǎng)絡 電 視 臺,(2011-6-28)[2012-4-15].http://news.cntv.cn/20110628/101801.shtml.

        [6]OAuth2.0V.21[S/OL].[2011-10-08].http://tools.ietf.org/html/draft-ietf-oauth.

        [7]劉鏑,張智江,張尼.基于國內開放平臺的Oauth認證框架研究[J].信息通信技術,2011(6):43-45.

        [8]時子慶,劉金蘭,譚曉華.基于OAuth2.0的認證授權技術[J].計算機系統(tǒng)應用,2012,21(3):260-264.

        [9]劉為,郝梅.利用OpenID和OAuth進行安全授權及風險防范的分析[J].武漢商業(yè)服務學院學報,2011,25(5):90-92.

        [10]白普易,任明秋,王學軍,等.雷達抗干擾性能評估指標分析與測試平臺設計[J].計算機與數(shù)字工程,2011,39(11).

        [11]楊文君,林偉.基于DSP5402的雷達測速系統(tǒng)硬件、軟件設計[J].計算機與數(shù)字工程,2012(5).

        [12]月光博客.Twitter API中文文檔[EB/OL].(2010-4-20)[2012-4-15].http://www.williamlong.info/archives/2152.html.

        猜你喜歡
        推文開放平臺應用程序
        基于在線開放平臺的混合式課堂教學模式構建與實踐
        特朗普上任至今發(fā)推文1.1萬條
        刪除Win10中自帶的應用程序
        電腦報(2019年12期)2019-09-10 05:08:20
        基于AliGenie語音開放平臺的傳統(tǒng)家居智聯(lián)網(wǎng)解決方案
        電子制作(2018年17期)2018-09-28 01:56:46
        特朗普推文哪條最招人煩
        搭建開放平臺 收獲真情實感——談《品德與生活》教學中開放式教學的實施
        云計算開放平臺的知識產權問題研究
        關閉應用程序更新提醒
        電腦迷(2012年15期)2012-04-29 17:09:47
        三星電子將開設應用程序下載商店
        微軟軟件商店開始接受應用程序
        国产成人精品日本亚洲i8| 91av视频在线| 国产亚洲欧美另类第一页| 亚洲国产一区二区,毛片| 中文字日产幕码三区的做法大全| 少妇被粗大的猛烈进出免费视频 | 国产成人免费一区二区三区| 一区二区三区在线免费av| 国产精品三区四区亚洲av| 国产精品亚洲а∨天堂2021| 欧美成人一区二区三区在线观看| 无码熟妇人妻AV不卡| 亚洲三级香港三级久久| 亚洲爆乳精品无码一区二区三区| 亚洲av无码精品色午夜蛋壳| 极品诱惑一区二区三区| 国产人妖av在线观看| 护士的小嫩嫩好紧好爽| 99久久国产露脸精品竹菊传媒| 日韩精品久久久中文字幕人妻| 午夜桃色视频在线观看| 成人精品一区二区三区电影| 成人无码一区二区三区网站| 国产亚洲精品hd网站| 国产精品国产传播国产三级| 国产精品日本一区二区在线播放| 曰本女人牲交全视频免费播放| av手机在线天堂网| 亚洲国产综合人成综合网站| 亚洲一区自拍高清亚洲精品| 亚洲精品国产美女久久久| 国产精品国产三级国产一地| 99人中文字幕亚洲区三| 久久精品国产亚洲av四虎| 国产精品久久久久影视不卡| 91人妻一区二区三区蜜臀| 色老板美国在线观看| 欧美婷婷六月丁香综合色| 亚洲一区二区三区在线观看蜜桃| 中文有码人妻字幕在线| 国产激情久久久久影院老熟女免费|