亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Python技術(shù)電影口碑的研究

        2019-10-21 09:50:53武永嬌黃寧
        計算機與網(wǎng)絡 2019年9期
        關(guān)鍵詞:爬蟲戰(zhàn)狼文本

        武永嬌 黃寧

        為了解決電影評分體系的打分機制存在諸多不足,提出基于Python網(wǎng)絡爬蟲技術(shù)的電影口碑研究方法。以2部電影為例,利用該技術(shù)將電影網(wǎng)站上的用戶評論提取下來,并對其進行自然語言處理情感分析,通過實驗分析得出的情感分數(shù)可以表示用戶對于電影的態(tài)度,作為一種評判電影口碑的重要依據(jù)。

        1.引言

        電影口碑對于電影營銷的重要性不言而喻,目前國內(nèi)對于電影口碑的研究很少,除了比較具有代表性的豆瓣電影評分,其他相關(guān)機構(gòu)的數(shù)據(jù)都很難有參考價值,而豆瓣電影評分體系的打分機制本身也存在諸多不足,因此,提出一種更權(quán)威的電影口碑研究方法成為亟待解決的問題。

        觀眾對于一部電影的評論能夠真實反映對于該部電影的態(tài)度。詳細的文字描述可以表達出觀眾的主觀態(tài)度,運用大數(shù)據(jù)Python技術(shù),以豆瓣平臺億萬觀眾所發(fā)表的文字為研究對象。實現(xiàn)對電影評論的文本挖掘和情感分析,理論與實際操作相結(jié)合進行研究,解決電影營銷中遇到的問題,進而對營銷人員如何有效應用大數(shù)據(jù)提供啟示,使其可以用于營銷決策。

        2.信息提取

        2.1 Python技術(shù)與信息提取

        網(wǎng)絡爬蟲是一種通過既定規(guī)則,可自動地抓取網(wǎng)頁信息的計算機程序。通過Python技術(shù),可以方便、快捷和高效地對電影評論實現(xiàn)網(wǎng)絡數(shù)據(jù)爬取和網(wǎng)頁解析,部分代碼如圖1所示。其中Requests庫,可以對豆瓣網(wǎng)頁爬取,獲取網(wǎng)絡頁面,Beautiful Soup庫,可以有效地解析HTML頁面的內(nèi)容,并且提取相關(guān)的信息。

        2.2情感分析

        情感分析又稱意見挖掘,簡而言之,是對帶有情感色彩的主觀性文本進行分析、處理、推理和歸納的過程,采取基于深度學習的情感分析方法,實現(xiàn)步驟如下:

        文本預處理包括以下3部分。①分詞:在語言學中,詞作為最小的獨立情感單元具有豐富的情感內(nèi)涵。②詞性標注:詞性是指根據(jù)詞的特點用來劃分詞類的根據(jù)。包括名詞、動詞、助詞、形容詞、副詞和連詞等。③去停用詞和特殊字符:停用詞是指在自然語言處理中可以過濾掉的一些沒有實際意義的功能詞,這些詞在文本中出現(xiàn)的頻率較高,但對文本的情感分析卻沒有實際的影響,如代詞“這”、“那”,助詞“的”、“了”,介詞“在”,語氣助詞“呢”、“啊”等。有研究表明去除這些無實義的高頻停用詞能夠減少數(shù)據(jù)的噪音,降低特征向量的空間維度并提高情感分類的準確率。

        3.觀眾對電影的態(tài)度分析

        3.1電影《戰(zhàn)狼2》口碑分析

        利用網(wǎng)絡爬蟲將豆瓣網(wǎng)上電影《戰(zhàn)狼2》的500條熱門短評抓取下來,對這些評論文本數(shù)據(jù)進行情感分析。每條評論文本數(shù)據(jù)進入情感分析處理后會得到一個0 ~1的概率值,其中1表示該文本的情感是積極的;0表示文本的情感是極度消極的,圖2為《戰(zhàn)狼2》短評的情感分析散點圖。

        根據(jù)分析結(jié)果,《戰(zhàn)狼2》的態(tài)度評分為0.79,如圖3所示。

        由此可見,根據(jù)評論文本得出,觀眾對于電影《戰(zhàn)狼2》的態(tài)度是相當積極的,這與《戰(zhàn)狼2》在票房上所獲得的成功、豆瓣網(wǎng)上的高分是一致的。

        3.2電影《捉妖記2》口碑分析

        與上一節(jié)相同,采取相同的方法對電影《捉妖記2》的口碑進行分析。《捉妖記2》并沒有取得前作《捉妖記》那樣的成功,被視為是一部失敗的續(xù)集,其在豆瓣網(wǎng)上參與評分人數(shù)132 973人,評分為5.0分。

        同樣,抓取《捉妖記2》的500條熱門短評進行情感分析,得到散點圖如圖4所示。

        《捉妖記2》的情感分為0.57,如圖5所示。

        3.3分析結(jié)果

        由以上2節(jié)的分析可知,根據(jù)豆瓣網(wǎng)站上的電影評論,觀眾對于《戰(zhàn)狼2》的情感分為0.79,對于《捉妖記2》的情感分為0.57。這表明,觀眾對于《戰(zhàn)狼2》與《捉妖記2》這兩部電影,偏愛《戰(zhàn)狼2》的程度明顯高于《捉妖記2》。這個研究結(jié)果與實際票房和身邊觀眾的實際感受等都是一致的,說明這種基于Python技術(shù)電影口碑的研究是有效的。

        4.結(jié)束語

        這種基于Python大數(shù)據(jù)的分析方法可以彌補現(xiàn)有電影口碑研究方法的不足,對于電影口碑,電影的立項、制作、發(fā)行和上映等環(huán)節(jié)都可以做出針對性的部署,從而提高效率,獲得更高的收益。

        本案例旨在說明大數(shù)據(jù)技術(shù)在電影營銷中的應用,將這種方法推廣,不局限于比較兩部電影的口碑優(yōu)劣,而對整個電影市場中觀眾的態(tài)度做研究,可以得到一些對于電影營銷極具意義的參考意見。所采用的網(wǎng)絡爬蟲在抓取網(wǎng)頁上的評論時采用單線程的方式,效率較低,從長遠來看其爬蟲效率需要優(yōu)化,有進一步提高的空間。

        猜你喜歡
        爬蟲戰(zhàn)狼文本
        利用網(wǎng)絡爬蟲技術(shù)驗證房地產(chǎn)灰犀牛之說
        基于Python的網(wǎng)絡爬蟲和反爬蟲技術(shù)研究
        在808DA上文本顯示的改善
        《戰(zhàn)狼2》主旋律敘事的藝術(shù)創(chuàng)新與審美表現(xiàn)
        新聞傳播(2018年2期)2018-12-07 00:55:52
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        古代“特種戰(zhàn)”:每一場都是一部《戰(zhàn)狼》
        利用爬蟲技術(shù)的Geo-Gnutel la VANET流量采集
        電子測試(2018年1期)2018-04-18 11:53:04
        呂建民 《戰(zhàn)狼》背后的電影人
        海峽姐妹(2017年10期)2017-12-19 12:26:12
        戰(zhàn)狼Ⅱ:犯我中華者,雖遠必誅
        大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡爬蟲技術(shù)
        電子制作(2017年9期)2017-04-17 03:00:46
        蜜桃视频网站在线免费观看| 精品国产乱码久久久软件下载| 日本久久久| 无码中文字幕人妻在线一区二区三区| 99精品视频69V精品视频| 亚洲精品不卡电影| 蜜臀av中文人妻系列| 国产伦奸在线播放免费| 户外精品一区二区三区| 亚洲字幕av一区二区三区四区| 少妇放荡的呻吟干柴烈火动漫| 久久亚洲AV无码精品色午夜| 白白色发布永久免费观看视频 | 影音先锋男人av鲁色资源网| 欧美丰满大爆乳波霸奶水多| 国产精品自拍首页在线观看| 久久精品国产亚洲av热东京热| 一区二区三区日韩亚洲中文视频| 丰满多毛的大隂户毛茸茸| 久久国产成人精品国产成人亚洲 | 97se亚洲国产综合自在线| 国产精品一区2区三区| 中文字幕在线亚洲精品一区| 成人国产一区二区三区| 漂亮人妻被中出中文字幕久久| 久久av无码精品人妻糸列| 国产精品亚洲精品专区| 午夜精品久久久久久久久| 熟女无套内射线观56| 国产尻逼视频| 女女同性av一区二区三区| 狠狠色丁香婷婷综合潮喷| 国精品无码一区二区三区在线蜜臀| 亚洲国产精品久久久久秋霞1| 国产精品二区三区在线观看| 狠狠色狠狠色综合网| 97午夜理论片在线影院| 国产男女做爰猛烈视频网站| 精品人妻久久一区二区三区| 国产一精品一av一免费 | 后入到高潮免费观看|