亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于標(biāo)簽云的文本可視化方法

        2020-06-12 09:47:44李曉飛
        電子元器件與信息技術(shù) 2020年3期
        關(guān)鍵詞:可視化單詞文本

        李曉飛

        (吉林建筑科技學(xué)院,吉林 長(zhǎng)春 130000)

        0 引言

        可視化(Visualization)是利用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換成圖形或圖像在屏幕上顯示出來(lái),并進(jìn)行交互處理的理論、方法和技術(shù)。它涉及到計(jì)算機(jī)圖形學(xué)、圖像處理、計(jì)算機(jī)視覺、計(jì)算機(jī)輔助設(shè)計(jì)等多個(gè)領(lǐng)域,成為研究數(shù)據(jù)表示、數(shù)據(jù)處理、決策分析等一系列問題的綜合技術(shù)[1]。目前正在飛速發(fā)展的虛擬現(xiàn)實(shí)技術(shù)也是以圖形圖像的可視化技術(shù)為依托的。

        數(shù)據(jù)存儲(chǔ)以及數(shù)據(jù)傳播的主要形式包括文本,而可視化技術(shù)研究的一個(gè)重要的方向就是文本數(shù)據(jù)的可視化。目前研究者們提出了可視化技術(shù)研究的一些方法,比如文本語(yǔ)義結(jié)構(gòu)方法、標(biāo)簽云方法等[2-4]。標(biāo)簽云是一套相關(guān)的標(biāo)簽以及與此相應(yīng)的權(quán)重。權(quán)重影響使用的字體大小或其他視覺效果。標(biāo)簽云彩能代表更多的權(quán),標(biāo)簽是典型的超鏈接,讓用戶可以仔細(xì)了解他們的內(nèi)容[5-7]。

        目前對(duì)可視化技術(shù)的評(píng)價(jià)方法尚處于發(fā)展階段。本項(xiàng)目進(jìn)行過(guò)程中主要工作為建立文本數(shù)據(jù)可視化方法度量指標(biāo),根據(jù)計(jì)算結(jié)果對(duì)權(quán)重值進(jìn)行計(jì)算,從而分析文本信息可視化的應(yīng)用效果[8]。

        1 基于標(biāo)簽云的文本可視化方法

        基于標(biāo)簽元的文本可視化方法通過(guò)建立三類度量指標(biāo),從而根據(jù)度量指標(biāo)進(jìn)行權(quán)重計(jì)算,最后進(jìn)行評(píng)價(jià)分?jǐn)?shù)計(jì)算。

        1.1 數(shù)據(jù)指標(biāo)

        在可視化技術(shù)中,數(shù)據(jù)的規(guī)模大小是整個(gè)量化和評(píng)價(jià)過(guò)程的基礎(chǔ)。標(biāo)簽云根據(jù)文本數(shù)據(jù)單詞的頻率由大到小進(jìn)行展現(xiàn),因此數(shù)據(jù)的規(guī)模指標(biāo)是評(píng)價(jià)可視化效果的一個(gè)重要指標(biāo)。

        假設(shè)文本數(shù)據(jù)中單詞的集合為S{a1,a2,……an},其中ai(i=1,2, ,n)代表文本信息中的某個(gè)單詞,令N(ai)表示文本中單詞出現(xiàn)的個(gè)數(shù)。定義停止詞集合,表示在文本數(shù)據(jù)中多次出現(xiàn)但是對(duì)文本內(nèi)容影響小的單詞為P={p1,p2,……pm},例如中文中出現(xiàn)“的”“是”“個(gè)”等詞,英文中的of、a、an、the 等詞。

        對(duì)文本數(shù)據(jù)可視化的步驟為:①篩選文本數(shù)據(jù)中的單詞——彩信詞;②根據(jù)單詞集合S和停止詞集合P對(duì)文本進(jìn)行過(guò)濾得到S-P;③計(jì)算S-P中的單詞出現(xiàn)的頻度;④選取頻度閾值h,篩選得彩信詞集C。

        1.2 復(fù)雜度指標(biāo)

        復(fù)雜度指標(biāo)主要指用戶對(duì)文本信息進(jìn)行搜索和觀察,本方法主要通過(guò)方向度量和采信詞度量進(jìn)行衡量。

        彩信詞度量指單詞在可視化確定區(qū)域的長(zhǎng)寬比:

        上式中I為單詞圖片的長(zhǎng),W為寬。彩信詞集C中所有單詞的度量均值為:

        每個(gè)單詞出現(xiàn)在可視化區(qū)域的大小則取決于權(quán)重,權(quán)重大的顯示較大。但是對(duì)于一些單詞長(zhǎng)度大而權(quán)重小的情況下彩信詞度量同樣也較大。為了解決這個(gè)問題,增加方向度量來(lái)進(jìn)行評(píng)價(jià)。假設(shè)單詞的角度為ui度,可視化確定區(qū)域展現(xiàn)的方向度量為:

        d(ai)的取值范圍為[0,1],方向度量越大,復(fù)雜度指標(biāo)越高。

        1.3 辨識(shí)度指標(biāo)

        辨識(shí)度指標(biāo)主要用來(lái)呈現(xiàn)單詞色彩的比重以及在可視化展現(xiàn)區(qū)域的位置構(gòu)成。假設(shè)標(biāo)簽云中每個(gè)文本數(shù)據(jù)顯示不同顏色,顏色的數(shù)目為nc,彩信詞的數(shù)量為n,則設(shè)定色彩比重為:

        在文本可視化的展現(xiàn)區(qū)域經(jīng)常會(huì)出現(xiàn)空白區(qū)域,這些區(qū)域采用空間利用度來(lái)衡量,可以通過(guò)填充空白區(qū)域來(lái)增加空間的利用度。假設(shè)單詞所占區(qū)域面積為t,展現(xiàn)區(qū)域的面積t=W×L,其中W和L分別為展現(xiàn)區(qū)域的寬和長(zhǎng),則空間利用度為:

        1.4 權(quán)重計(jì)算

        根據(jù)數(shù)據(jù)規(guī)模指標(biāo)、復(fù)雜度指標(biāo)以及辨識(shí)度指標(biāo)進(jìn)行權(quán)重的計(jì)算。通過(guò)模糊分析方法對(duì)權(quán)值進(jìn)行確定。對(duì)上述三個(gè)指標(biāo)進(jìn)行兩兩互相比對(duì),形成模糊矩陣B,然后將其變成模糊一致性判斷矩陣R:

        數(shù)據(jù)指標(biāo)、復(fù)雜度指標(biāo)和辨識(shí)度指標(biāo)對(duì)總評(píng)分的影響權(quán)重為qw=(0.316,0.419,0.263)。

        1.5 評(píng)價(jià)分?jǐn)?shù)計(jì)算

        根據(jù)相應(yīng)指標(biāo)的計(jì)算和權(quán)重計(jì)算,進(jìn)行了文本數(shù)據(jù)信息頻度算法的分析,算法的具體過(guò)程為:

        Step1:文本數(shù)據(jù)信息可視化參數(shù)初始化處理。比如在可視化確定區(qū)域展示的單詞的最大和最小數(shù)量,色彩度的最大值,展示區(qū)域顏色的設(shè)置等。

        Step2:計(jì)算文本信息的總單詞數(shù)量。

        Step3:根據(jù)過(guò)濾條件確定彩信詞集合,并計(jì)算需要可視化展示的單詞信息。

        Step4:初始化可視化區(qū)域畫布和單詞信息,將單詞展現(xiàn)在畫布上。

        Step5:對(duì)統(tǒng)計(jì)單詞進(jìn)行面積比率和方向度量計(jì)算。根據(jù)計(jì)算公式,獲得可視化分析的指標(biāo)值。

        2 實(shí)驗(yàn)及結(jié)果分析

        實(shí)驗(yàn)中,通過(guò)對(duì)網(wǎng)絡(luò)授課學(xué)生對(duì)科目反饋科目信息,采用標(biāo)簽云可視化方法進(jìn)行指標(biāo)計(jì)算和分析,從而得到可視化結(jié)果,如圖1。

        其中計(jì)算出方向度量值為0.61,彩信詞密度為0.112,顏色比重為0.146,空間利用度為1.689。根據(jù)指標(biāo)值得到最終的總評(píng)價(jià)分?jǐn)?shù)為65.12。

        實(shí)驗(yàn)中對(duì)單文本和多文本來(lái)調(diào)整算法中可視化指標(biāo)并采用多維度圖表進(jìn)行結(jié)果分析。彩信詞指標(biāo)折線分析圖如圖2,色彩比重分析圖如圖3。

        由分析圖可知,隨著彩信詞密度的增加,方向度量基本是在百分之五十左右上下波動(dòng),方度max 值則逐漸上升到平穩(wěn),評(píng)價(jià)總分逐漸下降,可視化效果逐漸變差。

        3 結(jié)論

        本文給出了一種基于標(biāo)簽云的文本可視化分析方法,主要通過(guò)建立文本數(shù)據(jù)可視化方法度量指標(biāo),根據(jù)計(jì)算結(jié)果對(duì)權(quán)重值進(jìn)行計(jì)算,從而分析文本信息可視化的應(yīng)用效果。實(shí)驗(yàn)證明,針對(duì)但文本以及多文本信息,各指標(biāo)間是相互對(duì)立的,該方法在可視化衡量上具有一定的有效性。

        猜你喜歡
        可視化單詞文本
        基于CiteSpace的足三里穴研究可視化分析
        基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        基于CGAL和OpenGL的海底地形三維可視化
        單詞連一連
        在808DA上文本顯示的改善
        “融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        看圖填單詞
        看完這些單詞的翻譯,整個(gè)人都不好了
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        日本最新一区二区三区在线视频| 国产成人精品麻豆| 久九九久视频精品网站| 国产毛片精品av一区二区| 无码乱肉视频免费大全合集| 国产最新进精品视频| 国产肉体xxxx裸体137大胆| 无遮无挡爽爽免费毛片| 四虎永久在线精品免费观看地址| 亚洲女同精品久久女同| 国产精品狼人久久影院软件介绍| 极品老师腿张开粉嫩小泬| 337人体做爰大胆视频| 日韩高清毛片| 精品国产乱码一区二区三区| 日韩av在线播放人妻| 国产成人精品123区免费视频| 精品人妻VA出轨中文字幕| 蜜桃视频网站在线免费观看| 亚洲最全av一区二区| 欧美日韩精品久久久免费观看 | 亚洲黄片高清在线观看| 国产在线91精品观看| 少妇性饥渴无码a区免费| 超91精品手机国产在线| 亚洲中文字幕第一第二页 | 成美女黄网站18禁免费| 国产免费一区二区在线视频| 中文字幕免费在线观看动作大片| 国产在线精品一区二区| 国产精品女同久久免费观看| 久久中文字幕亚洲综合| 天天爽夜夜爽人人爽一区二区| 国产精品11p| 成人综合激情自拍视频在线观看| 亚洲欧洲日产国码av系列天堂| 亚洲欧美综合区自拍另类| 大地资源网最新在线播放| 国产亚洲av手机在线观看| 在线观看国产成人av天堂野外| 欧美成人午夜精品久久久|