亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于武漢高校學(xué)生性格分析及匹配問題

        2018-06-25 09:23:18徐木子倪可欣廖瑜蕾
        現(xiàn)代商貿(mào)工業(yè) 2018年20期
        關(guān)鍵詞:性格特征詞頻質(zhì)心

        徐木子 倪可欣 廖瑜蕾

        (湖北經(jīng)濟(jì)學(xué)院,湖北 武漢 430205)

        0 引言

        心理學(xué)分析研究由心理醫(yī)生西格蒙德·弗洛伊德提出。他在人格結(jié)構(gòu)的意識(shí)形態(tài)中提出了三個(gè)發(fā)展階段-“自我”,“本我”,“超我”。Sigmund Freud根據(jù)自己的研究,將人格劃分為8類。該理論被應(yīng)用于醫(yī)療領(lǐng)域,用以治療患有精神疾病的患者。之后,其他科學(xué)家和學(xué)者也對(duì)性格進(jìn)行細(xì)分,這些理論構(gòu)成了性格分析測試的基礎(chǔ),旨在找出測試者確切的性格類型。MBTI考試主要為企業(yè)提供就業(yè)指導(dǎo),并且為測試人員提供了5點(diǎn)需要遵循的條例,如“回答問題的時(shí)候保持放松狀態(tài)”。由于測試者需要遵循這些,MBTI測試結(jié)果很容易受主觀因素影響。另一個(gè)名為Enneagram(九型人格)的測試模型與MBTI測試不同。該模型將人格分為“完美型”,“助人型”,“成就型”,“自我型”,“理智型”,“疑惑型”,“活躍性”,“領(lǐng)袖型”和“和平型”。它與其他模型相比突出的一點(diǎn)在于它深入到人們的思考模式而不僅是外部行為。此外,這個(gè)理論表明,當(dāng)某些元素發(fā)生變化時(shí),性格特征也會(huì)發(fā)生變化,從而建立了不同個(gè)性之間的關(guān)系。然而,經(jīng)過多次測試,該方法的準(zhǔn)確性受到限制。三個(gè)主要原因可以解釋。一個(gè)是對(duì)于導(dǎo)師的依賴,一個(gè)是算法的缺陷,最后一個(gè)是測試問題的冗雜。與Enneagram(九型人格)測試模型相比,DISC測試減少了性格劃分的維度,并通過對(duì)數(shù)據(jù)進(jìn)行數(shù)字化來區(qū)分最突出的特征與最不突出的特征。更多的測試中的問題數(shù)量是相當(dāng)適度的。根據(jù)研究,發(fā)展成為成熟步驟的大多數(shù)性格測試旨在幫助個(gè)人選擇合適的工作和企業(yè)聘請合適的人員。雖然這些測試開始涵蓋其他領(lǐng)域,比如交友市場。在當(dāng)代,互聯(lián)網(wǎng)成為了匹配朋友的新方式,打破了人們之間的距離界限,因此在市場上出現(xiàn)了大量的相關(guān)應(yīng)用。盡管如此,這種應(yīng)用極少考慮到用戶的性格特征,不利于用戶間長期的交往。這篇學(xué)術(shù)論文的目的是尋找性格分析和匹配的方式,為高校學(xué)生構(gòu)造一個(gè)良好的交友環(huán)境。此外,該方法還可以用于學(xué)校的小組學(xué)習(xí),以盡量減少群體成員之間的潛在矛盾。

        1 研究程序

        1.1 設(shè)定性格標(biāo)準(zhǔn)

        考慮到Enneagram(九型人格)測試的不足,我們決定減少性格的維度?;贒ISC的理論,我們以多維尺度回歸的方法作為問卷設(shè)計(jì)基礎(chǔ),設(shè)立二維坐標(biāo),將問卷中設(shè)定的性格信息數(shù)據(jù)化,以供后期匹配分析。其中一個(gè)評(píng)估人的主動(dòng)性(更接近外向的個(gè)性或內(nèi)向的個(gè)性)另一個(gè)衡量人的靈活性(更傾向于穩(wěn)定的情況或變化的情況)。由于這兩個(gè)維度的測試以前已經(jīng)被測試過,我們主要對(duì)測試題目進(jìn)行了改動(dòng)。

        我們基于二維模型將性格劃分為4種。開朗支持型人格被定義為“OS / SO”型,活潑機(jī)靈性被定義為 “OA / OA”型,沉靜穩(wěn)健型劃為 “IS / SI”型,冷靜思辨性則為 “IA / AI”型。

        1.2 設(shè)計(jì)問卷

        問卷中有15個(gè)問題。前14個(gè)是多項(xiàng)選擇題,每個(gè)問題包括四個(gè)選項(xiàng)。七個(gè)問題旨在衡量主動(dòng)性的維度,而左側(cè)則用于測量靈活性的維度。每個(gè)選擇都反映每個(gè)人物的程度。為了使測試結(jié)果變得更加精確,每個(gè)問題都包括一個(gè)特定的情況。在Enneagram(九型人格)測試中,間隔表是評(píng)估性格的主要方式。然而,考慮到頻率副詞的劃分容易產(chǎn)生誤會(huì),我們這里采用TF-IDF算法,把性格信息轉(zhuǎn)換為權(quán)重向量。此外,考慮到測試人員是大學(xué)生,這些問題的場景設(shè)計(jì)均為學(xué)生的日常生活。最后一個(gè)問題用于確認(rèn)測試者的偏好性格。我們使用數(shù)字表來設(shè)計(jì)問題,可以簡化測量。在提交調(diào)查問卷之前,我們選取了自愿測試的三位學(xué)生,完成過后我們向周圍的學(xué)生詢問了相關(guān)問題,并將其與測試結(jié)果進(jìn)行對(duì)比。在此基礎(chǔ)上,糾正了一些具有爭議的問題。

        我們以多維尺度回歸作為問卷設(shè)計(jì)基礎(chǔ),設(shè)立二維坐標(biāo),將問卷中設(shè)定的性格信息數(shù)據(jù)化,以供后期匹配分析。

        1.3 信息權(quán)重轉(zhuǎn)換

        (1)TF-IDF 算法的具體原理如下。

        第一步,計(jì)算詞頻,即TF 權(quán)重(Term Frequency)。

        詞頻(TF)=每個(gè)詞語在性格選擇中出現(xiàn)的頻率。

        由于每個(gè)人對(duì)理想型性格的訴求不同,我們采取“標(biāo)準(zhǔn)化”詞頻的處理方式,以便不同文本的比較,將文本中單個(gè)研究關(guān)鍵詞除以文本中出現(xiàn)頻率最高的詞的出現(xiàn)頻數(shù)或者文本的詞數(shù)總體之和:

        詞頻(TF)=問卷和調(diào)查中單個(gè)研究關(guān)鍵詞出現(xiàn)的次數(shù)/總詞數(shù)

        第二步,計(jì)算ID權(quán)重,即逆文檔頻率(Inverse Document Frequency),需要建立一個(gè)語料庫(corpus),用來容納性格特征的選擇。逆文檔頻率(IDF)越高,那么這種性格選擇出現(xiàn)于問卷和調(diào)查中的分布就會(huì)越集中于一個(gè)點(diǎn),說明這個(gè)描述詞在內(nèi)容屬性能力方面的區(qū)分能力越強(qiáng)。

        第三步,計(jì)算 TF-IDF 值(Term Frequency Document Frequency)。

        TF-IDF=詞頻(TF)× 逆文檔頻率(IDF)。

        根據(jù)計(jì)算可以分析出 TF-IDF 值越高,則該表現(xiàn)性格特征的詞語在問卷和調(diào)查中出現(xiàn)的次數(shù)就越多(成正比)。反過來說,某個(gè)詞的出現(xiàn)頻率和被選擇的次數(shù)越多,則TF-IDF 值就越大。逐個(gè)算出被選擇和填的每個(gè)性格特征信息的 TF-IDF 值,并對(duì)這些值根據(jù)大小來排出順序,最大的值就是要提取的性格描述中出現(xiàn)的次數(shù)最多的關(guān)鍵詞。

        (2)生成 TF-IDF 向量的具體步驟。

        ①用 TF-IDF 的計(jì)算公式,尋找被測試的人選擇和描述的性格特征頻率最高的五個(gè)描述詞。

        ②這些被選出的五個(gè)描述詞性格特征描述詞,組成一個(gè)共同的集合,并算出在集合中每個(gè)性格特征描述詞的詞頻。若是沒有,則記該詞詞頻為0,這個(gè)詞語被提及的次數(shù)越多,則這個(gè)詞頻的數(shù)值越大。

        ③根據(jù)公式算出各個(gè)性格特征詞的 TF-IDF 權(quán)重向量:

        TF-IDF = 詞頻(TF)× 逆文檔頻率(IDF)

        (3)數(shù)據(jù)統(tǒng)計(jì)。

        ①計(jì)算各個(gè)性格特征描述詞出現(xiàn)的總次數(shù),并通過比較大小單獨(dú)列出最熱門的五個(gè)性格特征描述詞。

        ②對(duì)各個(gè)年齡的理想型的性格進(jìn)行分類計(jì)數(shù),通過排序得出不同年齡層對(duì)理想型性格要求排名前 5 的性格特征。

        ③對(duì)同類職位的理想型的性格進(jìn)行分類計(jì)數(shù),通過排序得出不同類別職位的人對(duì)理想型性格要求排名前 5 的性格特征。

        (4)聚類中心分類結(jié)果。

        用TF-IDF算法最后選出五個(gè)性格描述詞后,借助 K-Means 分類可以得到聚類中心,運(yùn)用KNN算法,得出與聚類中心相匹配的五個(gè)其余類別,并通過對(duì)出現(xiàn)頻數(shù)的估計(jì),衡量聚類中心詞的范疇:

        ①算距離:確定聚類中心,算出范圍內(nèi)的性格描述詞與其自身的 TF-IDF 權(quán)重向量的距離。

        ②找鄰居:挑出最靠近聚類中心的十五個(gè)性格描述詞。

        ③做分類:依據(jù)分類的界限,對(duì)聚類中心進(jìn)行分類。

        1.4 收集和分析數(shù)據(jù)

        我們在互聯(lián)網(wǎng)上發(fā)送了大約三百份問卷,并在湖北經(jīng)濟(jì)學(xué)院發(fā)了一百份。其中有五十份問卷不能使用由于答卷者含糊其辭。剔除掉無用數(shù)據(jù)后,我們獲取了一些有價(jià)值的信息。在分組和匹配過程中運(yùn)用了四種方式。

        (1)二維坐標(biāo)軸。

        二維坐標(biāo)軸是DISC測試模型的理論,它通過二維尺度來評(píng)估性格。該方法的好處是可以直接通過數(shù)字反映性格。我們將每個(gè)選項(xiàng)代表的數(shù)字求和,根據(jù)具體數(shù)字進(jìn)行評(píng)估。每個(gè)維度數(shù)據(jù)最大的反映了其性格。為了計(jì)算一般結(jié)果,將個(gè)人的數(shù)字加起來平均。同樣,將個(gè)人偏好性格的數(shù)字相加后再平均。找出每個(gè)人的偏好個(gè)性。根據(jù)結(jié)果,我們發(fā)現(xiàn),77.17%的人喜歡“IO”字。 此外,大約30%的組是“AO/OA”性格。

        (2)多元回歸模型。

        多元回歸分析方法是研究多個(gè)自變量與一個(gè)因變量間是否具有某種線性或非線性的關(guān)系的統(tǒng)計(jì)學(xué)研究方法,旨在分析多個(gè)自變量與因變量之間可能具有的數(shù)量關(guān)系,以便于分析自變量對(duì)于因變量的影響,達(dá)到優(yōu)良的預(yù)測效果。多元回歸模型的一般模型為:

        Yi=β0+β1X1i+β2X2i+…+βkXki+μii=1,2,…,n

        其中 k為解釋變量的數(shù)目,βj(j=1,2,…,k)稱為回歸系數(shù)。通過對(duì)自變量與因變量的研究, 發(fā)現(xiàn)二者具有線性關(guān)系,因此此次回歸模型歸結(jié)為多元性回歸。設(shè)y為應(yīng)變量,X1,X2…Xk為自變量,多元回歸模型為:

        Y=b0+b1x1+…+bkxk+e

        其中b0為常數(shù)項(xiàng),b1,b2…bk為回歸系數(shù)。

        本文基于文獻(xiàn)回顧以及深入調(diào)查,選取了九個(gè)對(duì)于因變量有一定影響的因素,依次為活躍程度,規(guī)律性,應(yīng)激反應(yīng),抗壓能力,計(jì)劃性,愛好廣泛程度和專注度。為測試這些變量與學(xué)生性格的關(guān)系,我們對(duì)于這些數(shù)據(jù)進(jìn)行了處理。由于用變量的對(duì)數(shù)形式能更好的估計(jì)自變量與因變量的百分比變化,因此建立了對(duì)數(shù)模型加以分析:

        Character=b0+b1x1+…+bkxk+e

        將對(duì)于這九項(xiàng)指標(biāo)的測試數(shù)據(jù)進(jìn)行預(yù)處理后經(jīng)過計(jì)算,活躍程度和規(guī)律性的數(shù)值接近顯著值,因此選為主要變量。

        (3)K-Means算法。

        K-means(MacQueen,1967)是解決眾所周知的聚類問題的最簡單的無監(jiān)督學(xué)習(xí)算法之一。該過程遵循一種簡單的方式,通過先驗(yàn)固定的一定數(shù)量的簇(假設(shè)有k個(gè)簇)來分類給定的數(shù)據(jù)集。主要思想是定義k個(gè)質(zhì)心,每個(gè)集群一個(gè)。由于不同的位置會(huì)導(dǎo)致不同的結(jié)果,這些質(zhì)心應(yīng)該以靈活的方式放置。所以,更好的選擇是讓它們盡可能的遠(yuǎn)離彼此。接下來的步驟是把屬于給定數(shù)據(jù)集的每個(gè)點(diǎn)和它關(guān)聯(lián)到最近的質(zhì)心。當(dāng)沒有點(diǎn)需要處理時(shí),第一步就完成了,并且早期進(jìn)行了組合。在這一點(diǎn)上,我們需要重新計(jì)算k個(gè)新質(zhì)心作為上一步產(chǎn)生的聚類的重心。在制定出這些新的重心之后,必須在相同的數(shù)據(jù)集點(diǎn)和最近的新質(zhì)心之間進(jìn)行新的測量。已經(jīng)生成了一個(gè)循環(huán)。作為這個(gè)循環(huán)的結(jié)果,我們可能會(huì)注意到,k個(gè)質(zhì)心一步一步地改變了它們的位置,直到?jīng)]有進(jìn)行更多的改變。換句話說,重心不再移動(dòng)了。最后,該算法旨在將目標(biāo)函數(shù)最小化,在這種情況下是平方誤差函數(shù)。目標(biāo)函數(shù):

        該算法由以下步驟組成:

        ①將K點(diǎn)放入由聚類對(duì)象表示的空間中。這些點(diǎn)代表初始組質(zhì)心。

        ②將每個(gè)對(duì)象分配給具有最接近質(zhì)心的組。

        ③分配所有對(duì)象后,重新計(jì)算K個(gè)質(zhì)心的位置。

        ④重復(fù)步驟2和3,直到質(zhì)心不再移動(dòng)。 這產(chǎn)生了將對(duì)象分離成可以計(jì)算要最小化的度量的組。

        基于K-means的理論。數(shù)據(jù)被分為4個(gè)類別,因?yàn)镵被設(shè)置為4.然后選擇作為組中項(xiàng)目的圓的質(zhì)心。重復(fù)這一步驟多次,重心固定下來了,代表了整個(gè)組群的水平。

        (4)匹配方法。

        歐幾里德度量是一種計(jì)算m維空間中兩點(diǎn)的實(shí)際距離的方法。在二維坐標(biāo)軸上,可以用來測量點(diǎn)之間的距離。

        ρ(A,B)=√[Σ(a [i] -b [i])^ 2](i = 1,2,…,n)

        基于歐幾里德度量,我們測量測試人員的性格與偏好性格之間的距離。經(jīng)測量,距離范圍在0.5和2.7左右的(最大值為10),可以通過考慮圖來適應(yīng)人物的匹配。定義我們通過特定數(shù)字知道的性格并將其設(shè)置為圓的中心,0.5和2.7分別代表最小和最大半徑。重疊部分是可能涵蓋偏好性格的區(qū)域。

        2 結(jié)論

        本文介紹了分析和匹配個(gè)性的創(chuàng)新方式。根據(jù)前期計(jì)劃的理論,計(jì)算程序分為三個(gè)部分。我們通過“二維坐標(biāo)軸”將問卷信息數(shù)字化,然后通過多維回歸模型測試出顯著性影響因素,運(yùn)用K-means程序?qū)?shù)據(jù)分組為四組。最后,通過歐幾里德度量匹配組。根據(jù)測試結(jié)果,我們發(fā)現(xiàn)一些問題不能清楚地劃分性格,所以測試問題后期還需調(diào)整。總之,該方法可以用于匹配不同個(gè)性的學(xué)生。對(duì)于大學(xué)教育工作者,可以將學(xué)生分成不同的類別,以減少學(xué)生之間的不必要沖突,增加團(tuán)隊(duì)的凝聚力。

        [1] 羅石涌.敏感者的生命色彩——盧西安·弗洛伊德及其藝術(shù)的主觀解讀[J].美術(shù)大觀,2010,(3).

        [2] 曹玉峰.論九型人格在企業(yè)人才招聘中的應(yīng)用[J].人力資源管理,2012,(11).

        [3] 李學(xué)明.基于信息增益與信息熵的TFIDF算法[J].計(jì)算機(jī)工程,2012,(8).

        [4] 周愛武.一種改進(jìn)的K—MEANS聚類算法[J].微型機(jī)與應(yīng)用,2011,(21).

        [5] 李濤.多元線性回歸與LOGISTIC回歸分析的正確應(yīng)用[J].臨床薈萃,2009,(15).

        [6] 施培蓓.初始化獨(dú)立的譜聚類算法[J].計(jì)算機(jī)工程與應(yīng)用,2010,(25).

        猜你喜歡
        性格特征詞頻質(zhì)心
        重型半掛汽車質(zhì)量與質(zhì)心位置估計(jì)
        基于詞頻分析法的社區(qū)公園歸屬感營建要素研究
        園林科技(2021年3期)2022-01-19 03:17:48
        基于GNSS測量的天宮二號(hào)質(zhì)心確定
        從人際功能視角分析唐頓莊園男主人
        理解真情 個(gè)性刻畫
        《亂世佳人》中郝思嘉的性格特征探討
        葫蘆絲樂器教學(xué)中培養(yǎng)學(xué)生良好的性格研究
        成才之路(2016年21期)2016-08-06 10:26:28
        詞頻,一部隱秘的歷史
        云存儲(chǔ)中支持詞頻和用戶喜好的密文模糊檢索
        以關(guān)鍵詞詞頻法透視《大學(xué)圖書館學(xué)報(bào)》學(xué)術(shù)研究特色
        圖書館論壇(2014年8期)2014-03-11 18:47:59
        亚洲a人片在线观看网址| 亚洲人精品午夜射精日韩| 久久精品国产成人| 亚洲综合一区二区三区天美传媒| 精品国产精品久久一区免费式 | 国产精品国产午夜免费看福利| 国产精品美女主播一区二区| 国产玉足榨精视频在线观看| 真人作爱免费视频| 中文字幕经典一区| 成人短篇在线视频夫妻刺激自拍| 一区二区视频在线观看地址| 99久久久国产精品免费蜜臀| 亚洲专区欧美| 国内专区一区二区三区| 国产av精品一区二区三区久久| 黑人巨大精品欧美一区二区 | av一区二区三区综合网站| 最新国产毛2卡3卡4卡| 国产精品卡一卡二卡三| 日韩中文字幕中文有码| 国产精品亚洲av国产| 国产一区二区三免费视频| av国产传媒精品免费| 国产亚洲精品久久久久久久久动漫| 国产精品国产三级国产AvkTV| 国产最新一区二区三区| 成人国产一区二区三区| 久久国产精品精品国产色婷婷| 97久久久久人妻精品专区| 性一交一乱一伦一视频一二三区| 在线观看中文字幕不卡二区| 国产精品天干天干| 无码国产伦一区二区三区视频| 亚洲中久无码永久在线观看软件| 亚洲成a人片77777kkkkk| 国产自拍在线视频91| 私人毛片免费高清影视院| 精品少妇大屁股白浆无码| 不打码在线观看一区二区三区视频| 狠狠爱婷婷网五月天久久|