亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多指標(biāo)的文獻(xiàn)關(guān)聯(lián)程度研究:合理性考察

        2019-11-12 08:02:20鄭州大學(xué)信息管理學(xué)院中國(guó)人民解放軍陸軍軍官學(xué)院軍事運(yùn)籌教研室
        圖書(shū)館理論與實(shí)踐 2019年10期
        關(guān)鍵詞:回歸方程情形分值

        郭 強(qiáng),趙 瑾(.鄭州大學(xué)信息管理學(xué)院;.中國(guó)人民解放軍陸軍軍官學(xué)院軍事運(yùn)籌教研室)

        文獻(xiàn)的共引次數(shù)與文獻(xiàn)之間的關(guān)聯(lián)程度具有較好的正相關(guān)性,因而可以利用共引次數(shù)對(duì)文獻(xiàn)的關(guān)聯(lián)程度進(jìn)行表示,并在此基礎(chǔ)上對(duì)結(jié)構(gòu)關(guān)系進(jìn)行探討,從共引次數(shù)可以拓展至其他的文獻(xiàn)關(guān)聯(lián)指標(biāo),[1-4]由此會(huì)涉及到關(guān)聯(lián)程度的多指標(biāo)情形,如對(duì)研究前沿的探測(cè)。已有的研究包括利用不同的關(guān)聯(lián)指標(biāo)得到不同的探測(cè)方法,以及對(duì)不同探測(cè)方法的有效性的比較。[3-8]目的是使對(duì)結(jié)構(gòu)關(guān)系以及研究前沿的揭示能夠更具有有效性和針對(duì)性。多指標(biāo)的納入會(huì)使對(duì)關(guān)聯(lián)程度的描述更全面,可以考慮將分別建立在不同關(guān)聯(lián)指標(biāo)上的文獻(xiàn)結(jié)構(gòu)以及探測(cè)結(jié)果進(jìn)行綜合考量,也可以考慮先對(duì)不同的關(guān)聯(lián)指標(biāo)進(jìn)行綜合,其中綜合的方式有所不同。[3,9]本研究先對(duì)關(guān)聯(lián)指標(biāo)進(jìn)行綜合,綜合的方式是給出關(guān)聯(lián)程度的多屬性描述以及相應(yīng)的綜合關(guān)聯(lián)程度,并在綜合關(guān)聯(lián)程度的基礎(chǔ)上對(duì)結(jié)構(gòu)關(guān)系進(jìn)行探討。

        此外,多指標(biāo)的納入和對(duì)綜合關(guān)聯(lián)程度的考察,會(huì)有助于對(duì)某一領(lǐng)域的專(zhuān)業(yè)方向的揭示,包括聚類(lèi)關(guān)系的合理性以及對(duì)專(zhuān)業(yè)方向的定性。

        對(duì)綜合關(guān)聯(lián)程度的考察包括指標(biāo)的選取、指標(biāo)合成方式的探討、綜合關(guān)聯(lián)程度的獲取流程以及對(duì)綜合關(guān)聯(lián)程度的合理性的衡量。

        1 關(guān)聯(lián)指標(biāo)的直接合成

        在對(duì)關(guān)聯(lián)指標(biāo)直接合成的情形下,對(duì)于選取的非樣本文獻(xiàn)而言,指標(biāo)之間相關(guān)系數(shù)的絕對(duì)值的最大值僅為0.520,絕對(duì)值小于0.5 的情形具有相對(duì)較高的比例。盡管能夠通過(guò)巴特萊檢驗(yàn),但是KMO 值僅為0.513,說(shuō)明對(duì)指標(biāo)直接合成時(shí)沒(méi)有將原始指標(biāo)轉(zhuǎn)化為相應(yīng)的獨(dú)立變量。由于原始指標(biāo)均具有正向性,對(duì)于此時(shí)的非樣本文獻(xiàn),當(dāng)某個(gè)原始指標(biāo)增加且其余指標(biāo)保持不變時(shí),文獻(xiàn)的關(guān)聯(lián)程度會(huì)有增加的趨勢(shì)。又由于此時(shí)的原始指標(biāo)之間具有較弱的樣本相關(guān)性,擬合方程可以近似為原始指標(biāo)的直接求和,其中的擬合值可以作為非樣本文獻(xiàn)關(guān)聯(lián)程度的近似值。

        當(dāng)非樣本文獻(xiàn)調(diào)整時(shí),確定關(guān)聯(lián)程度的過(guò)程也會(huì)有改變。對(duì)于選取的非樣本文獻(xiàn)而言,如果指標(biāo)之間具有較強(qiáng)的相關(guān)性,那么在指標(biāo)合成時(shí)需要將原始指標(biāo)轉(zhuǎn)化為相應(yīng)的獨(dú)立變量,此時(shí)可以考察指標(biāo)的主成分。首先,當(dāng)確定主成分的大致含義并且從總體上判斷各個(gè)主成分的含義均具有正向性時(shí),得到的主成分及其含義反映的是非樣本文獻(xiàn)的性質(zhì)。而在對(duì)主成分與關(guān)聯(lián)程度的關(guān)系進(jìn)行考察時(shí),通常需要借助得到的主成分的含義,并從總體上進(jìn)行判斷,這樣在該過(guò)程中主成分的含義應(yīng)該是樣本意義上的概念。而對(duì)主成分的含義從總體上進(jìn)行判斷,由此得到的正向性則為總體上的概念。對(duì)于樣本或非樣本文獻(xiàn)而言,當(dāng)某個(gè)主成分增加且其余主成分保持不變時(shí),文獻(xiàn)的關(guān)聯(lián)程度會(huì)有增加的趨勢(shì),又由于得到的主成分之間具有獨(dú)立性,此時(shí)的擬合方程可以近似為對(duì)主成分的直接求和,擬合值可以作為對(duì)非樣本文獻(xiàn)關(guān)聯(lián)程度的近似。其次,當(dāng)確定了主成分的大致含義,但是主成分的含義從總體上與關(guān)聯(lián)程度之間的正向性或負(fù)向性并不顯著時(shí),需要考慮兩者的非線(xiàn)性關(guān)系。如果能夠明確兩者的非線(xiàn)性關(guān)系,那么可以確定或近似相應(yīng)的擬合方程,非樣本文獻(xiàn)的關(guān)聯(lián)程度可以用擬合值近似;如果不能完全確定兩者的非線(xiàn)性關(guān)系,由于非樣本文獻(xiàn)的實(shí)際關(guān)聯(lián)程度是未知的,需要判斷主成分的大致含義及其在總體上與關(guān)聯(lián)程度之間的關(guān)系,由此來(lái)近似非樣本文獻(xiàn)的主成分取值與非樣本文獻(xiàn)的關(guān)聯(lián)程度的關(guān)系。當(dāng)對(duì)非樣本文獻(xiàn)建立擬合方程時(shí),主成分含義在總體上與關(guān)聯(lián)程度之間非線(xiàn)性關(guān)系的不明確會(huì)對(duì)方程的確定或近似帶來(lái)影響。在該情形下可以考察非樣本文獻(xiàn)的概率型綜合關(guān)聯(lián)程度。第三,當(dāng)主成分的大致含義尚無(wú)法確定時(shí),可以通過(guò)正交旋轉(zhuǎn)使新生成的因子更具有可解釋性。在此基礎(chǔ)上如果能夠確定生成因子的大致含義,則根據(jù)因子含義從總體上判斷具有正向性并轉(zhuǎn)入上述第一步中,否則轉(zhuǎn)入第二步;如果生成因子的大致含義仍然無(wú)法確定,可以轉(zhuǎn)入非樣本文獻(xiàn)的概率型綜合關(guān)聯(lián)程度。

        對(duì)于所選取的非樣本文獻(xiàn)而言,在旋轉(zhuǎn)后的成分矩陣中,不同的原始變量只與不同的因子具有較好的相關(guān)性,且每個(gè)原始變量在相應(yīng)因子上的載荷均大于0.9,同時(shí)在其余因子上的載荷的最大值僅為0.278。由于采用的是正交旋轉(zhuǎn),載荷可以反映原始變量與因子的相關(guān)性,此時(shí)原始變量相互之間呈現(xiàn)弱相關(guān),這和上述對(duì)非樣本文獻(xiàn)的考察結(jié)果是一致的。另外,在對(duì)指標(biāo)直接合成的情形下,同樣的兩篇文獻(xiàn),如果屬于兩組不同的非樣本文獻(xiàn),由于在上述過(guò)程中關(guān)聯(lián)程度的近似值是取決于所屬非樣本文獻(xiàn)的性質(zhì)的,那么得到的關(guān)聯(lián)程度的近似值可能也會(huì)有所不同。

        2 概率型綜合關(guān)聯(lián)程度

        在概率型綜合關(guān)聯(lián)程度的情形下,需要考察自變量的共線(xiàn)性。對(duì)于文獻(xiàn)《基于多指標(biāo)的文獻(xiàn)關(guān)聯(lián)程度研究:指標(biāo)的合成》圖4 中的樣本文獻(xiàn),XTX 的特征值分別為1.706、1.502、1.027、0.942、0.589、0.233,最大特征值與最小特征值的比值為7.322,從條件數(shù)的角度來(lái)看模型的共線(xiàn)性偏弱或可以近似為沒(méi)有共線(xiàn)性。此外,每個(gè)自變量與其余自變量的復(fù)相關(guān)系數(shù)以及相應(yīng)的方差擴(kuò)大因子分別為1.957、1.916、1.357、1.107、1.164、1.770,其中最大值也沒(méi)有超過(guò)經(jīng)驗(yàn)標(biāo)準(zhǔn),從方差擴(kuò)大因子的角度來(lái)看,模型不存在中等或較強(qiáng)的共線(xiàn)性,各個(gè)自變量近似為不包含在某些共線(xiàn)關(guān)系中,這樣可以對(duì)原有的自變量直接建立模型。利用Spss 對(duì)文獻(xiàn)《基于多指標(biāo)的文獻(xiàn)關(guān)聯(lián)程度研究:指標(biāo)的合成》 圖4 中的文獻(xiàn)關(guān)聯(lián)指標(biāo)與文獻(xiàn)之間的關(guān)聯(lián)等級(jí)進(jìn)行邏輯回歸,參數(shù)向量的檢驗(yàn)結(jié)果顯示:在0.05 水平下所選取的關(guān)聯(lián)指標(biāo)在整體上的影響是顯著的,并且各個(gè)自變量相應(yīng)的p 值均小于0.05。由樣本文獻(xiàn)得到參數(shù)的估計(jì)以及相應(yīng)的經(jīng)驗(yàn)回歸方程,其中截距的估計(jì)值分別為7.8206、11.2747、16.6736、23.0218,其余參數(shù)的估計(jì)值分別為-0.9539、-0.6533、-1.2947、-1.5590、-11.8506、-5.4366,這些參數(shù)的估計(jì)值均為負(fù)數(shù),這是由于選取的指標(biāo)均具有正向性,當(dāng)某個(gè)自變量增加且其余的自變量保持不變時(shí),兩篇文獻(xiàn)的關(guān)聯(lián)程度處于某個(gè)關(guān)聯(lián)等級(jí)的概率與處于高于該關(guān)聯(lián)等級(jí)上的概率的比值會(huì)有減小的趨勢(shì)。

        在經(jīng)驗(yàn)回歸方程的基礎(chǔ)上給出文獻(xiàn)之間的關(guān)聯(lián)程度處于各個(gè)關(guān)聯(lián)等級(jí)上的預(yù)報(bào)概率,由此可以考察樣本關(guān)聯(lián)程度的預(yù)報(bào)結(jié)果與樣本實(shí)際關(guān)聯(lián)程度的一致性。對(duì)于文獻(xiàn)《基于多指標(biāo)的文獻(xiàn)關(guān)聯(lián)程度研究:指標(biāo)的合成》圖4 中的樣本文獻(xiàn),預(yù)報(bào)與觀(guān)測(cè)的一致比能夠達(dá)到94.2%,這是由于以下幾點(diǎn)。①圖4 中的樣本文獻(xiàn)是在滿(mǎn)足樣本文獻(xiàn)選取要求,并對(duì)初步選取后的文獻(xiàn)進(jìn)行調(diào)整得到的,在調(diào)整時(shí)仍需要滿(mǎn)足樣本文獻(xiàn)的選取要求,其目的是使自變量的影響均是顯著的,并由此可以按照傳統(tǒng)的過(guò)程得到相應(yīng)的預(yù)報(bào)概率及其置信區(qū)間。[10]否則將影響所形成的模型和估計(jì),畢竟在這里認(rèn)為關(guān)聯(lián)程度和所選取的自變量在總體上均具有關(guān)聯(lián)性,而這種有偏差的估計(jì)與預(yù)報(bào)以及預(yù)報(bào)的效果還需要做進(jìn)一步的探討。② 當(dāng)樣本容量較小時(shí),選取滿(mǎn)足要求的樣本后,需要進(jìn)行相應(yīng)的顯著性檢驗(yàn),在此基礎(chǔ)上決定是否需要對(duì)得到的文獻(xiàn)進(jìn)行調(diào)整。但是隨著樣本容量的增加,樣本的性質(zhì)會(huì)趨于總體的性質(zhì),樣本可以對(duì)各個(gè)關(guān)聯(lián)指標(biāo)與關(guān)聯(lián)程度之間的相關(guān)性進(jìn)行反映,從而使解釋變量的影響具有顯著性,這樣就不需要對(duì)文獻(xiàn)進(jìn)行調(diào)整了。

        對(duì)于選取的非樣本文獻(xiàn)而言,由經(jīng)驗(yàn)回歸方程得到文獻(xiàn)關(guān)聯(lián)程度處于各個(gè)關(guān)聯(lián)等級(jí)上的預(yù)報(bào)概率和相應(yīng)的關(guān)聯(lián)程度的期望分值,其中對(duì)各個(gè)關(guān)聯(lián)等級(jí)賦予的關(guān)聯(lián)分值為1-5 分。在關(guān)聯(lián)程度的期望分值的基礎(chǔ)上,得到由任意兩篇文獻(xiàn)分別與其余文獻(xiàn)的期望分值所形成的向量,利用向量的夾角余弦衡量?jī)蓚€(gè)向量的相似度,兩個(gè)向量的相似度越高意味著兩篇文獻(xiàn)與其余文獻(xiàn)的期望分值會(huì)具有更好的相似性,從而這兩篇文獻(xiàn)也會(huì)具有更好的相似性。這里將向量的夾角余弦作為兩篇文獻(xiàn)的相似性度量,又因?yàn)殛P(guān)聯(lián)程度的期望分值均為正數(shù),夾角余弦的取值介于0-1,文獻(xiàn)之間的距離等于1 減去夾角的余弦。在文獻(xiàn)距離的基礎(chǔ)上可以對(duì)非樣本文獻(xiàn)的結(jié)構(gòu)關(guān)系進(jìn)行顯示并對(duì)其合理性進(jìn)行考察,如通過(guò)Excel 由關(guān)聯(lián)程度的期望分值分別得到每?jī)善墨I(xiàn)與其余文獻(xiàn)所形成的向量的夾角余弦,用1 減去向量的夾角余弦后,將得到的距離矩陣作為輸入,通過(guò)Spss 得到非樣本文獻(xiàn)的二維分布情況。

        3 合理性考察

        圖1 為對(duì)指標(biāo)直接合成時(shí)的情形。對(duì)選取的非樣本文獻(xiàn)而言,其關(guān)聯(lián)程度可以近似為對(duì)原始指標(biāo)的直接求和,文獻(xiàn)的相似性度量以及對(duì)文獻(xiàn)距離的表示與在概率型綜合關(guān)聯(lián)程度中所采取的方式相同,目的是使得到的結(jié)構(gòu)關(guān)系具有可比性。另外,指標(biāo)的取值為標(biāo)準(zhǔn)化后的取值。同時(shí)需要指出以下幾點(diǎn)。① 由于選取非樣本文獻(xiàn)時(shí)沒(méi)有對(duì)文獻(xiàn)關(guān)聯(lián)指標(biāo)的取值范圍作要求,當(dāng)某篇文獻(xiàn)與另一篇文獻(xiàn)的關(guān)聯(lián)程度不為零,且與其余文獻(xiàn)的關(guān)聯(lián)程度均為零時(shí),這兩篇文獻(xiàn)的夾角余弦的分母等于零,由此需要剔除非樣本文獻(xiàn)中的部分文獻(xiàn),從而使不同文獻(xiàn)關(guān)聯(lián)程度情形下的考察文獻(xiàn)不僅相同而且其中任意兩篇文獻(xiàn)的夾角余弦也均具有意義,由此夾角余弦的分母為零的情形不影響所得結(jié)構(gòu)關(guān)系的可比性。而當(dāng)文獻(xiàn)關(guān)聯(lián)程度為零的情形增多時(shí),需要剔除的文獻(xiàn)數(shù)量也會(huì)有增加的趨勢(shì)。②當(dāng)某兩篇文獻(xiàn)同與除這兩篇之外的少量單篇或是多篇文獻(xiàn)的關(guān)聯(lián)程度不為零,且與其余文獻(xiàn)的關(guān)聯(lián)程度均為零時(shí),與這兩篇文獻(xiàn)相對(duì)應(yīng)的向量有可能會(huì)具有很好的相似度,特別是當(dāng)兩篇文獻(xiàn)只與除這兩篇文獻(xiàn)之外的某單篇文獻(xiàn)的關(guān)聯(lián)程度不為零時(shí),這兩篇文獻(xiàn)的夾角余弦等于1。因此,當(dāng)關(guān)聯(lián)程度為零的情形較多時(shí),會(huì)出現(xiàn)文獻(xiàn)之間的距離很小以及為零的情況,這樣在非樣本文獻(xiàn)的二維分布中會(huì)表現(xiàn)為文獻(xiàn)位置的重合或近似重合。

        圖1 指標(biāo)直接合成時(shí)的情形

        圖2 概率型綜合關(guān)聯(lián)程度的情形

        圖3 只考慮共引次數(shù)的情形

        圖2 為概率型綜合關(guān)聯(lián)程度的情形。關(guān)聯(lián)程度的期望分值是各個(gè)等級(jí)的關(guān)聯(lián)分值與文獻(xiàn)關(guān)聯(lián)程度處于相應(yīng)等級(jí)上的預(yù)報(bào)概率的乘積的累計(jì)和。由于處于各個(gè)等級(jí)上的概率之和等于1,期望分值的最小值為各個(gè)等級(jí)的關(guān)聯(lián)分值的最小值,對(duì)于所考察的非樣本文獻(xiàn)而言,不同文獻(xiàn)之間的關(guān)聯(lián)程度均大于等于1,且均不會(huì)等于零,這也是與圖1 相比文獻(xiàn)位置重合的情形相對(duì)較少的原因。

        圖4 專(zhuān)家對(duì)關(guān)聯(lián)程度進(jìn)行判斷時(shí)的情形

        圖3 只考慮共引次數(shù)的情形。圖4 為專(zhuān)家對(duì)非樣本文獻(xiàn)的關(guān)聯(lián)程度直接判斷的情形。其中,關(guān)聯(lián)程度是根據(jù)文獻(xiàn)的內(nèi)容在0-10 分進(jìn)行打分。圖1 至圖4文獻(xiàn)位置之間的距離的相對(duì)大小具有大體上的一致性。但是這種比較是建立在對(duì)非樣本文獻(xiàn)相互之間的相似性或是距離進(jìn)行近似的基礎(chǔ)上,由此可以考慮從相似性或是距離衡量不同情形的合理性。如將專(zhuān)家判斷文獻(xiàn)關(guān)聯(lián)程度的情形作為標(biāo)準(zhǔn),考察不同情形中文獻(xiàn)之間的距離關(guān)系與標(biāo)準(zhǔn)情形中文獻(xiàn)之間的距離關(guān)系的一致性。在每種關(guān)聯(lián)情形中均能得到每篇文獻(xiàn)與其余文獻(xiàn)之間的相似度,在某種關(guān)聯(lián)情形中,用某篇文獻(xiàn)與其余文獻(xiàn)之間的相似度和在標(biāo)準(zhǔn)情形中的同一篇文獻(xiàn)與其余文獻(xiàn)之間的相似度的等級(jí)相關(guān)系數(shù)來(lái)衡量?jī)煞N情形中某篇文獻(xiàn)與其余文獻(xiàn)的相似度的相對(duì)大小的一致性。這樣每篇文獻(xiàn)均有相應(yīng)的等級(jí)相關(guān)系數(shù)與其相對(duì)應(yīng)。在此基礎(chǔ)上用所有文獻(xiàn)的等級(jí)相關(guān)系數(shù)的平均值來(lái)衡量?jī)煞N情形中單篇文獻(xiàn)與其余文獻(xiàn)相似度的相對(duì)大小的一致性。

        對(duì)于概率型綜合關(guān)聯(lián)程度與專(zhuān)家判斷關(guān)聯(lián)程度這兩種情形而言,得到相關(guān)系數(shù)的平均值為0.580。但是在對(duì)指標(biāo)直接合成的情形中,如果文獻(xiàn)之間關(guān)聯(lián)程度為零的情形相對(duì)較多,那么文獻(xiàn)夾角余弦中分子為零的情形也會(huì)相對(duì)較多。在專(zhuān)家判斷關(guān)聯(lián)程度的情形中,某篇文獻(xiàn)與其余某兩篇文獻(xiàn)之間具有不同的相似度,在對(duì)指標(biāo)直接合成的情形中可能會(huì)由于這篇文獻(xiàn)與其余兩篇文獻(xiàn)之間的相似度均為零而使得文獻(xiàn)之間會(huì)具有相同的相似度,由此與每篇文獻(xiàn)對(duì)應(yīng)的等級(jí)相關(guān)系數(shù)會(huì)相對(duì)較低,甚至相關(guān)系數(shù)可能會(huì)為負(fù)數(shù)。而當(dāng)某篇文獻(xiàn)的相關(guān)系數(shù)為負(fù)數(shù)時(shí),可將兩種關(guān)聯(lián)情形中的該篇文獻(xiàn)與其余文獻(xiàn)的相似度的相對(duì)大小的一致性取為零,并在此基礎(chǔ)上得到一致性的平均值,如對(duì)指標(biāo)直接合成與專(zhuān)家判斷關(guān)聯(lián)程度這兩種情形的相關(guān)系數(shù)的平均值為0.018。另外,在某種情形中可以設(shè)定某個(gè)閾值,對(duì)于大于等于該閾值的文獻(xiàn)相似度,考察這些相似度的相對(duì)大小能夠在多大程度上與專(zhuān)家判斷關(guān)聯(lián)程度的情形相吻合,并用此來(lái)判斷給定閾值時(shí)的某種關(guān)聯(lián)情形與專(zhuān)家判斷關(guān)聯(lián)程度情形的一致性。如,選取閾值為0.03,在某種情形中,對(duì)于某篇文獻(xiàn)而言,只考慮與該文獻(xiàn)的相似度大于等于0.03 的其他文獻(xiàn),并考察某種情形中該文獻(xiàn)與這些文獻(xiàn)的相似度和在專(zhuān)家判斷關(guān)聯(lián)程度情形中的這篇文獻(xiàn)與這些文獻(xiàn)的相似度的等級(jí)相關(guān)系數(shù)。每篇文獻(xiàn)均有相應(yīng)的等級(jí)相關(guān)系數(shù)與其對(duì)應(yīng)。在某種情形中,如果某篇文獻(xiàn)與其他文獻(xiàn)的相似度均小于0.03,以及某篇文獻(xiàn)只與其余某一篇文獻(xiàn)之間的相似度大于等于0.03,那么這兩種情況中的文獻(xiàn)是不計(jì)入在內(nèi)的。當(dāng)給定閾值時(shí),每篇文獻(xiàn)的等級(jí)相關(guān)系數(shù)體現(xiàn)某種關(guān)聯(lián)情形對(duì)專(zhuān)家判斷關(guān)聯(lián)程度情形中的該篇文獻(xiàn)與相應(yīng)文獻(xiàn)之間的相似度的相對(duì)大小的保持程度,這里仍然是利用每篇文獻(xiàn)的等級(jí)相關(guān)系數(shù)的平均值近似衡量給定閾值時(shí)的某種關(guān)聯(lián)情形與專(zhuān)家判斷關(guān)聯(lián)程度情形的單篇文獻(xiàn)與其余文獻(xiàn)相似度的相對(duì)大小的一致性。

        另外,考察文獻(xiàn)之間相似度的相對(duì)大小時(shí),可以對(duì)每篇文獻(xiàn)進(jìn)行考察,也可以對(duì)所有文獻(xiàn)相互之間的相似度的相對(duì)大小直接進(jìn)行考察。當(dāng)不設(shè)定閾值時(shí),能夠得到某種關(guān)聯(lián)情形的所有文獻(xiàn)之間的相似度和標(biāo)準(zhǔn)情形中的相應(yīng)文獻(xiàn)之間的相似度的等級(jí)相關(guān)系數(shù),如果一致性較高,那么建立在文獻(xiàn)距離相對(duì)大小基礎(chǔ)上的聚類(lèi)結(jié)果也可能會(huì)具有較好的一致性;當(dāng)設(shè)定閾值時(shí),只考慮某種情形中的大于等于閾值的文獻(xiàn)相似度,并考察這些相似度的相對(duì)大小在多大程度上與標(biāo)準(zhǔn)情形相吻合。

        圖5、圖6 為上述前三種情形分別與專(zhuān)家判斷關(guān)聯(lián)程度情形的相關(guān)情況,其中橫軸為閾值。圖5 是對(duì)每篇文獻(xiàn)分別考察的方式,圖6 是對(duì)所有文獻(xiàn)直接考察的方式。圖6 將所有的文獻(xiàn)均考慮在內(nèi),是對(duì)應(yīng)閾值為零的情形。對(duì)于情形一而言,在對(duì)每篇文獻(xiàn)分別考察的方式中,當(dāng)閾值由0.03 增加至0.1 時(shí),相關(guān)情況會(huì)保持不變,這說(shuō)明情形一中的相似度是分布在小于0.03 以及大于等于0.1 的范圍。在對(duì)所有的文獻(xiàn)直接考察的方式中,閾值取為0.03 是對(duì)應(yīng)于相似度大于等于0.03 時(shí)文獻(xiàn)相似度的相對(duì)大小與實(shí)際情況的一致性。

        此外,對(duì)于所選取的非樣本文獻(xiàn),在對(duì)每篇文獻(xiàn)分別進(jìn)行考察的方式中,情形一的相關(guān)情況會(huì)好于情形二和情形三。同時(shí)由于無(wú)論是單指標(biāo)情形還是多指標(biāo)情形,關(guān)聯(lián)指標(biāo)對(duì)文獻(xiàn)關(guān)聯(lián)程度的反映均是基于兩者之間統(tǒng)計(jì)意義上的正相關(guān)性,因而會(huì)出現(xiàn)單指標(biāo)描述好于多指標(biāo)描述的情況,如圖5 中情形三的一致情況要好于情形二。在對(duì)所有文獻(xiàn)考察的方式中,當(dāng)閾值大于零且小于等于0.5 時(shí),與其余的區(qū)域相比,這三種情形的相關(guān)情況會(huì)相對(duì)較為接近,但是情形三的一致情況要好于情形一和情形二;而當(dāng)閾值大于0.5 時(shí),情形一和情形二的一致情況均會(huì)好于情形三。從整體上看,對(duì)于這里選取的非樣本文獻(xiàn)而言,多指標(biāo)描述并不明顯地好于單指標(biāo)描述,但是當(dāng)各個(gè)閾值處對(duì)應(yīng)的文獻(xiàn)數(shù)量均足夠多時(shí),多指標(biāo)描述在整體上好于單指標(biāo)描述,這是建立在多指標(biāo)描述對(duì)于關(guān)聯(lián)程度的反映會(huì)好于單指標(biāo)描述的直觀(guān)認(rèn)識(shí)基礎(chǔ)上,由此多指標(biāo)描述中的關(guān)聯(lián)分值的相對(duì)大小與實(shí)際情況會(huì)具有更好的一致性。另外從整體上看,隨著閾值的變化,多指標(biāo)描述與單指標(biāo)描述會(huì)具有相似的變化趨勢(shì)。

        圖5 對(duì)每篇文獻(xiàn)分別進(jìn)行考察的方式

        4 說(shuō)明

        4.1 存在共線(xiàn)性的情形

        在概率型綜合關(guān)聯(lián)程度的情形下,由于從直觀(guān)上選取的文獻(xiàn)關(guān)聯(lián)指標(biāo)并不獨(dú)立,選取樣本文獻(xiàn)的某些關(guān)聯(lián)指標(biāo)有可能會(huì)具有很好的樣本相關(guān)性,使某些自變量包含在某些共線(xiàn)關(guān)系中。在這里構(gòu)造以下樣本,使共引次數(shù)與相同的參考文獻(xiàn)數(shù)量具有很好的相關(guān)性,并且其余的指標(biāo)取值與文獻(xiàn)《基于多指標(biāo)的文獻(xiàn)關(guān)聯(lián)程度研究:指標(biāo)的合成》圖4 中的原有指標(biāo)取值相同。當(dāng)調(diào)整相同的參考文獻(xiàn)數(shù)量時(shí),如果參考文獻(xiàn)的杰卡德指數(shù)保持不變,那么兩篇文獻(xiàn)總的參考文獻(xiàn)數(shù)量需要作相應(yīng)的改變,當(dāng)杰卡德指數(shù)給定時(shí),對(duì)其分子與分母的取值沒(méi)有限制,只不過(guò)不同的取值情形其發(fā)生的概率會(huì)有所不同。

        圖6 對(duì)所有文獻(xiàn)直接進(jìn)行考察的方式

        圖7 構(gòu)造的樣本文獻(xiàn)

        如果取到了這樣的樣本(見(jiàn)圖7),其中僅列出了文獻(xiàn)的共引次數(shù)與相同的參考文獻(xiàn)數(shù)量,除了相同的參考文獻(xiàn)數(shù)量之外,其余變量的取值與文獻(xiàn)《基于多指標(biāo)的文獻(xiàn)關(guān)聯(lián)程度研究:指標(biāo)的合成》 圖4 中的相應(yīng)變量的取值相同,在這里使得文獻(xiàn)的共引次數(shù)與相同的參考文獻(xiàn)數(shù)量的相關(guān)系數(shù)為0.974。對(duì)于該樣本可以得到XTX 的特征值分別為2.162、1.500、1.002、0.800、0.518、0.018,其中最大特征值與最小特征值的比值達(dá)120.111,這樣標(biāo)準(zhǔn)模型會(huì)存在中等程度的共線(xiàn)性。同時(shí)得到的方差擴(kuò)大因子分別為28.571、27.027、1.377、1.109、1.085、1.852。從方差擴(kuò)大因子的角度來(lái)看,模型也存在共線(xiàn)性,并且前兩個(gè)變量——共引次數(shù)與相同的參考文獻(xiàn)數(shù)量均包含在某些共線(xiàn)關(guān)系中。

        通過(guò)主成分回歸消除共線(xiàn)性,得到XTX 的特征向量以及相應(yīng)的主成分,其中主成分為Z6=0.713X1-0.692X2-0.051X3-0.014X4-0.016X5+0.097X6,由于XTX 的第六特征值僅為0.018 且等于Z6的方差,可以認(rèn)為Z6中的變量組合具有較高的共線(xiàn)性,同時(shí)在該變量組合中X3、X4、X5、X6的系數(shù)和X1、X2的系數(shù)相比均相對(duì)較小,且X1、X2的系數(shù)的絕對(duì)值可以進(jìn)行比擬,X1、X2具有很好的取值一致性,而這和X1、X2較高的相關(guān)系數(shù)是一致的。由于前四個(gè)主成分的特征值的累計(jì)和占特征值總和的91.1%,因而選取前四個(gè)主成分進(jìn)行回歸,這樣剔除Z6,同時(shí)信息損失也在可以接受的范圍內(nèi)。在相應(yīng)的經(jīng)驗(yàn)回歸方程中,將主成分還原為原始變量后,可以得到以原始變量作為自變量的經(jīng)驗(yàn)回歸方程,這樣方程中的所有原始變量都得到了保留。

        4.2 統(tǒng)計(jì)意義上的客觀(guān)性

        利用共引次數(shù)衡量文獻(xiàn)之間的關(guān)聯(lián)程度具有客觀(guān)性,但是這種客觀(guān)性是統(tǒng)計(jì)意義上的客觀(guān)性,對(duì)于共引次數(shù)這個(gè)單指標(biāo)而言,從直觀(guān)上會(huì)存在不客觀(guān)的情形。如,當(dāng)文獻(xiàn)的共引次數(shù)給定且較高時(shí),文獻(xiàn)之間的關(guān)聯(lián)程度并不確定,會(huì)存在一定的變化范圍,文獻(xiàn)之間的關(guān)聯(lián)程度有可能是偏高的,但是此時(shí)的共引次數(shù)或此時(shí)的關(guān)聯(lián)分值卻是較高的,由此會(huì)出現(xiàn)關(guān)聯(lián)分值與文獻(xiàn)實(shí)際關(guān)聯(lián)程度不一致的情形。在共引次數(shù)的基礎(chǔ)上對(duì)文獻(xiàn)結(jié)構(gòu)考察時(shí),這兩篇文獻(xiàn)有可能會(huì)被歸于某一子類(lèi),而實(shí)際上這兩篇文獻(xiàn)是不應(yīng)歸于一類(lèi)的,由此帶來(lái)了不客觀(guān)的結(jié)構(gòu)劃分。又如在一定的取值范圍內(nèi),共引次數(shù)較小的兩篇文獻(xiàn)之間的關(guān)聯(lián)程度未必會(huì)比共引次數(shù)較大的兩篇文獻(xiàn)的關(guān)聯(lián)程度低。由此利用共引次數(shù)來(lái)表征文獻(xiàn)之間的關(guān)聯(lián)程度時(shí)會(huì)有不客觀(guān)的情形出現(xiàn),相應(yīng)地也會(huì)帶來(lái)后續(xù)結(jié)構(gòu)劃分上的不客觀(guān)。假設(shè)考慮三篇文獻(xiàn),文獻(xiàn)A 與文獻(xiàn)B 以及文獻(xiàn)A 與文獻(xiàn)C 的關(guān)聯(lián)分值均低于文獻(xiàn)B 與文獻(xiàn)C 的關(guān)聯(lián)分值,這樣在某細(xì)化程度下,文獻(xiàn)B 與文獻(xiàn)C 會(huì)被歸于一類(lèi),而文獻(xiàn)A 會(huì)單獨(dú)成類(lèi)。但實(shí)際上將文獻(xiàn)A 與文獻(xiàn)B 歸于一類(lèi),且文獻(xiàn)C 單獨(dú)成類(lèi)卻是符合實(shí)際情況的。盡管利用共引次數(shù)衡量關(guān)聯(lián)程度會(huì)具有一定的非客觀(guān)性,但是當(dāng)樣本容量較大時(shí),上述關(guān)聯(lián)分值不客觀(guān)情形的占比應(yīng)當(dāng)會(huì)相對(duì)較小,畢竟此時(shí)的關(guān)聯(lián)分值也就是共引次數(shù),與文獻(xiàn)之間的實(shí)際關(guān)聯(lián)程度會(huì)具有較好的正相關(guān)性,因而共引次數(shù)與文獻(xiàn)關(guān)聯(lián)程度大小關(guān)系相一致的情形會(huì)具有較大的比例,這也是這里的關(guān)聯(lián)分值具有客觀(guān)性,從而建立在該關(guān)聯(lián)分值基礎(chǔ)上的結(jié)構(gòu)劃分也會(huì)在總體上具有客觀(guān)性。

        利用多指標(biāo)衡量文獻(xiàn)之間的關(guān)聯(lián)程度時(shí)會(huì)有類(lèi)似的情形,得到的關(guān)聯(lián)分值在總體上可能會(huì)具有客觀(guān)性。如對(duì)多指標(biāo)直接合成時(shí),如果可以從主成分與各個(gè)指標(biāo)的相關(guān)性大致判斷主成分的含義,并且根據(jù)主成分的含義可以判斷各個(gè)主成分均具有正向性,那么當(dāng)兩篇文獻(xiàn)的各個(gè)主成分具有較高的取值時(shí),得到的關(guān)聯(lián)分值也會(huì)較高。當(dāng)各個(gè)主成分均具有正向性時(shí),各個(gè)主成分的取值較高,意味著文獻(xiàn)之間的關(guān)聯(lián)程度的期望值也會(huì)較高,由此這兩篇文獻(xiàn)之間的關(guān)聯(lián)程度有可能只是偏高的,這樣就可能會(huì)有關(guān)聯(lián)分值與實(shí)際關(guān)聯(lián)程度不一致的情形出現(xiàn),而這種關(guān)聯(lián)分值與關(guān)聯(lián)程度的不一致有可能會(huì)帶來(lái)后續(xù)不客觀(guān)的結(jié)構(gòu)劃分。

        從樣本出發(fā)得到的關(guān)聯(lián)分值也會(huì)有類(lèi)似情況。在樣本中,如果某兩篇文獻(xiàn)的關(guān)聯(lián)指標(biāo)的取值較高,并且相應(yīng)的關(guān)聯(lián)分值也較高,那么當(dāng)兩篇非樣本文獻(xiàn)的關(guān)聯(lián)指標(biāo)的取值與這兩篇樣本文獻(xiàn)的關(guān)聯(lián)指標(biāo)的取值相近時(shí),由于回歸方程的連續(xù)性,非樣本文獻(xiàn)的關(guān)聯(lián)程度處于各個(gè)關(guān)聯(lián)等級(jí)上的概率可能會(huì)與樣本文獻(xiàn)情形下的概率相接近,因?yàn)殛P(guān)聯(lián)分值是關(guān)聯(lián)程度處于各個(gè)關(guān)聯(lián)等級(jí)上的概率與各個(gè)關(guān)聯(lián)等級(jí)分值分別相乘后再進(jìn)行求和,所以非樣本文獻(xiàn)的關(guān)聯(lián)分值也可能會(huì)較高。但實(shí)際上,當(dāng)關(guān)聯(lián)指標(biāo)的取值較高時(shí),非樣本文獻(xiàn)的關(guān)聯(lián)程度有可能只是偏高的,這樣在關(guān)聯(lián)分值基礎(chǔ)上的結(jié)構(gòu)劃分可能會(huì)出現(xiàn)與實(shí)際情況不相符合的情形。

        與共引次數(shù)的情形相類(lèi)似,多指標(biāo)情形中關(guān)聯(lián)分值的不客觀(guān)占比有可能不高,究其原因是由于關(guān)聯(lián)分值與實(shí)際關(guān)聯(lián)程度可能會(huì)具有正相關(guān)性,而這實(shí)際上也是關(guān)聯(lián)分值及其獲取方法是否具有合理性以及有效性的一種基礎(chǔ)。對(duì)于指標(biāo)直接合成這種情形而言,如果各個(gè)主成分均具有正向性,那么任意主成分增加且其他主成分保持不變時(shí),關(guān)聯(lián)程度的期望值會(huì)增加,如此可以對(duì)各個(gè)主成分直接進(jìn)行求和來(lái)對(duì)關(guān)聯(lián)程度的期望值進(jìn)行近似,而各個(gè)主成分的和值也是這里的關(guān)聯(lián)分值,關(guān)聯(lián)分值實(shí)際上也是對(duì)關(guān)聯(lián)程度的期望值的近似。由于從直觀(guān)上關(guān)聯(lián)指標(biāo)與關(guān)聯(lián)程度之間會(huì)具有較好的相關(guān)性,當(dāng)關(guān)聯(lián)指標(biāo)增加時(shí),關(guān)聯(lián)程度會(huì)有增加的趨勢(shì),關(guān)聯(lián)程度的期望值也會(huì)有增加的趨勢(shì),關(guān)聯(lián)分值也可能會(huì)有增加的趨勢(shì)。由此關(guān)聯(lián)指標(biāo)與關(guān)聯(lián)分值之間可能會(huì)具有正相關(guān)性??紤]到關(guān)聯(lián)指標(biāo)與關(guān)聯(lián)程度會(huì)具有較好的正相關(guān)性,則關(guān)聯(lián)分值與關(guān)聯(lián)程度之間也可能會(huì)具有正相關(guān)性。

        同樣地,對(duì)于從樣本出發(fā)得到的關(guān)聯(lián)分值而言,由于從直觀(guān)上關(guān)聯(lián)指標(biāo)與關(guān)聯(lián)等級(jí)在總體上會(huì)具有較好的正相關(guān)性,當(dāng)樣本容量足夠大時(shí),如果關(guān)聯(lián)指標(biāo)的取值增加,那么相應(yīng)的關(guān)聯(lián)等級(jí)也會(huì)有提高的趨勢(shì)。因?yàn)樵诘玫交貧w方程時(shí)是使得由回歸方程得到的關(guān)聯(lián)程度處于各個(gè)關(guān)聯(lián)等級(jí)上的概率能夠盡可能地與樣本相接近,所以回歸方程是對(duì)樣本的近似,不嚴(yán)格地說(shuō),回歸方程可能也會(huì)具有和關(guān)聯(lián)指標(biāo)與關(guān)聯(lián)等級(jí)之間的正相關(guān)性相類(lèi)似的性質(zhì)。對(duì)于回歸方程而言,由于給出的是關(guān)聯(lián)程度處于各個(gè)關(guān)聯(lián)等級(jí)上的概率,回歸方程可能會(huì)表現(xiàn)為具有當(dāng)關(guān)聯(lián)指標(biāo)較高時(shí)關(guān)聯(lián)程度處于較高關(guān)聯(lián)等級(jí)的概率會(huì)較高的趨勢(shì),或回歸方程可能會(huì)具有這樣的性質(zhì)。如果回歸方程通過(guò)顯著性檢驗(yàn),那么可以利用回歸方程對(duì)非樣本文獻(xiàn)之間的關(guān)聯(lián)程度進(jìn)行預(yù)報(bào),能夠給出關(guān)聯(lián)程度處于各個(gè)關(guān)聯(lián)等級(jí)上的概率。由于當(dāng)非樣本文獻(xiàn)的關(guān)聯(lián)指標(biāo)較高時(shí),得到的關(guān)聯(lián)程度處于較高等級(jí)上的概率可能也會(huì)有較高的趨勢(shì),相應(yīng)的關(guān)聯(lián)分值可能也會(huì)有較高的趨勢(shì),這樣對(duì)于非樣本文獻(xiàn)而言,關(guān)聯(lián)指標(biāo)與關(guān)聯(lián)分值之間可能就會(huì)具有正相關(guān)性,而從直觀(guān)上關(guān)聯(lián)指標(biāo)與實(shí)際關(guān)聯(lián)程度會(huì)具有較好的正相關(guān)性,關(guān)聯(lián)分值與實(shí)際關(guān)聯(lián)程度也可能會(huì)具有正相關(guān)性。需要指出的是,上述的討論并不嚴(yán)格,如關(guān)聯(lián)指標(biāo)較高是指各個(gè)指標(biāo)的取值在整體上較高。這與共引次數(shù)相類(lèi)似,在總體上利用多指標(biāo)得到的關(guān)聯(lián)分值可能會(huì)具有客觀(guān)性,不客觀(guān)情形的比例可能會(huì)較小,同時(shí)不客觀(guān)情形的占比應(yīng)當(dāng)和關(guān)聯(lián)指標(biāo)與關(guān)聯(lián)程度之間的統(tǒng)計(jì)相關(guān)性以及對(duì)多指標(biāo)的合成方式有關(guān)。

        猜你喜歡
        回歸方程情形分值
        一起來(lái)看看交通違法記分分值有什么變化
        采用直線(xiàn)回歸方程預(yù)測(cè)桑癭蚊防治適期
        線(xiàn)性回歸方程的求解與應(yīng)用
        線(xiàn)性回歸方程要點(diǎn)導(dǎo)學(xué)
        避免房地產(chǎn)繼承糾紛的十二種情形
        四種情形拖欠勞動(dòng)報(bào)酬構(gòu)成“拒不支付”犯罪
        公民與法治(2020年4期)2020-05-30 12:31:34
        走進(jìn)回歸分析,讓回歸方程不再是你高考的絆腳石
        出借車(chē)輛,五種情形下須擔(dān)責(zé)
        公民與法治(2016年9期)2016-05-17 04:12:18
        擬分裂情形下仿射Weyl群Cn的胞腔
        宿遷城鎮(zhèn)居民醫(yī)保按病種分值結(jié)算初探
        一区二区三区在线乱码| 免费人成网在线观看品观网| 视频一区二区不中文字幕| 久久婷婷综合激情亚洲狠狠| 精品国产av一区二区三区四区| 亚洲国产综合一区二区| 丰满人妻被公侵犯的视频| 亚洲深深色噜噜狠狠网站| 波多野结衣的av一区二区三区 | 一区二区三区四区中文字幕av| 4455永久免费视频| 男女高潮免费观看无遮挡| 亚洲AV永久无码制服河南实里| 国产亚洲高清不卡在线观看 | 欧美最猛性xxxx| 欧美aaaaaa级午夜福利视频| 在线观看免费a∨网站| 久久亚洲国产成人亚| 绿帽人妻被插出白浆免费观看 | 日韩人妖视频一区二区| 国产精品av在线| 中文国产日韩欧美二视频| 提供最新的在線欧美综合一区| 男人深夜影院无码观看| 国产一区二区三区免费在线播放| 手机久草视频福利在线观看| 香港三级午夜理论三级| 无码人妻精品一区二区在线视频| 亚洲av无码片一区二区三区| 国产一区二区三区免费精品| 丝袜美腿亚洲综合一区| 国产婷婷色一区二区三区| 一本一道av中文字幕无码| 国产V日韩V亚洲欧美久久| 妇女自拍偷自拍亚洲精品| 日韩精品中文字幕第二页| 亚洲综合天堂av网站在线观看 | 天堂…在线最新版资源| 91免费在线| 亚洲高清美女久久av| 夜夜高潮夜夜爽免费观看|