亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        時間加權(quán)的h指數(shù)研究

        2018-11-14 03:24:36鄭州大學(xué)信息管理學(xué)院中國人民解放軍炮兵學(xué)院軍事運籌教研室
        圖書館理論與實踐 2018年10期
        關(guān)鍵詞:情形時段影響力

        郭 強(qiáng),趙 瑾(.鄭州大學(xué)信息管理學(xué)院;.中國人民解放軍炮兵學(xué)院軍事運籌教研室)

        1 直觀認(rèn)識

        h指數(shù)與作者的影響力具有較好的相關(guān)性,所以能夠利用h指數(shù)來對作者的影響力進(jìn)行衡量。[1]需要指出的是,由于傳統(tǒng)的h指數(shù)是一個累積量,某一領(lǐng)域過去的高影響力作者和現(xiàn)在的高影響力作者會具有相同的h指數(shù),這樣需要將這兩種情形區(qū)分開來,特別是能否只通過h指數(shù)來對這兩種類型的作者進(jìn)行識別。在這里構(gòu)造這樣的h指數(shù),使其具有對距離考察時間越近的作者影響力越注重的性質(zhì),或者說對作者越近期的影響力越注重,而對于遠(yuǎn)期的作者影響力的重視程度相對較弱,那么該指數(shù)從直觀上應(yīng)當(dāng)具有以下性質(zhì)。① 當(dāng)作者較近期的影響力較高、中遠(yuǎn)期的影響力較低時,作者影響力的衡量值會較高,或者構(gòu)造的h指數(shù)應(yīng)當(dāng)較高。② 當(dāng)作者相對中遠(yuǎn)期的影響力較高、相對近期的影響力較低時,那么構(gòu)造的h指數(shù)應(yīng)當(dāng)不會較高。③ 在對作者越近期的影響力越注重的h指數(shù)中,注重的程度應(yīng)當(dāng)可以變化,由于該h指數(shù)對作者越近期的影響力越注重,所以對作者近期的影響力的重視程度比對作者中遠(yuǎn)期的影響力的重視程度要高,同時注重程度越大,這種重視程度上的差異也越大,當(dāng)注重程度逐漸減小時,對近期和中遠(yuǎn)期的重視程度的差異會逐漸減小。特別是隨著注重程度的逐漸減小,如果把對各個時期的作者影響力的重視程度進(jìn)行加總,那么對中遠(yuǎn)期作者影響力的重視程度在總的重視程度中所占的比例會逐漸增加,所以作者在中遠(yuǎn)期的影響力的作用與作者在近期的影響力相比,會逐漸增加,進(jìn)一步地,如果使總的重視程度保持不變,那么該h指數(shù)對中遠(yuǎn)期作者影響力的重視程度會逐漸增加。④ 當(dāng)注重程度等于0時,對各個時期作者影響力的重視程度相同,這是指對應(yīng)于傳統(tǒng)h指數(shù)的性質(zhì)。

        在具體構(gòu)造對作者越近期的影響力越注重的h指數(shù)時,將使得不同的時段具有不同的權(quán)重,同時權(quán)重之和保持不變,并且權(quán)重是注重近期的。其中,注重近期不是指注重距離考察時間較近的某個時間點,而是距離考察時間越近越重視,因此,距離考察時間越近的時刻或時間段被賦予更高的權(quán)重。由于權(quán)重對作者越近期的時段越注重,對近期時段的重視程度比對中遠(yuǎn)期時段的重視程度要高,同時注重程度越大,這種重視程度上的差異也越大,當(dāng)注重程度減小時,對近期和中遠(yuǎn)期的重視程度上的差異也減小,將權(quán)重對近期的注重程度記為a。進(jìn)一步地,將作者論文的被引次數(shù)按照各個時段的權(quán)重加權(quán)求和并降序排列,按照傳統(tǒng)h指數(shù)的方法可以構(gòu)造相應(yīng)的h指數(shù),將該指數(shù)定義為注重作者近期影響力的h指數(shù)。從直觀上考察,由此構(gòu)造的注重作者近期影響力的h指數(shù),具有上述對作者越近期的影響力越注重的h指數(shù)應(yīng)當(dāng)具有的四個性質(zhì)。

        (1)當(dāng)作者比較近期的影響力較高、中遠(yuǎn)期的影響力較低時,假設(shè)作者較近期的論文數(shù)較多,同時每篇論文的被引次數(shù)也較高,那么作者在近期的影響力較高。由于文章的被引次數(shù)會處于不同的時間段,這樣對于該作者而言,將其每篇文章的被引次數(shù)分別進(jìn)行加權(quán)求和后,按照得到的和值降序排列,那么發(fā)表時間和考察時間相對較近的文章,其被引次數(shù)也處于距離考察時間較近的時段,所以具有較高的權(quán)重,那么這些文章對應(yīng)的和值會較高。因此,在求h指數(shù)時,由于作者在比較近期發(fā)表的文章數(shù)量較多,同時這些文章的被引次數(shù)較高,那么得到的h指數(shù)也會較高。

        (2)當(dāng)作者相對遠(yuǎn)期的影響力較高、相對近期的影響力較低時,假設(shè)作者較遠(yuǎn)期的時候發(fā)表的文章數(shù)量較多,在假設(shè)被引半衰期為5年的情況下,每篇文章獲得的被引次數(shù)會處于距離考察時間較遠(yuǎn)的時段,所以都具有較小的權(quán)重,那么這些文章對應(yīng)的被引次數(shù)的加權(quán)和值會較小。因此,盡管作者較遠(yuǎn)期的文章數(shù)量以及每篇文章的被引次數(shù)均較多,得到的h指數(shù)也是偏低的。對于作者較中期時段的影響力較高、在其余時段的影響力較低的情形,仍然假設(shè)作者發(fā)表的文章數(shù)量較多,并且作者較中期時段得到的被引次數(shù)較多,或者說作者的論文較中期的時段得到的被引次數(shù)會較多,對于每篇論文而言,如果中期的被引次數(shù)較多,其余時段的被引次數(shù)較少,那么論文的被引次數(shù)的加權(quán)和值不會偏高。如果中期的被引次數(shù)與其余時段的被引次數(shù)均不多,那么被引次數(shù)的加權(quán)和值也不會偏高。此外,也存在中期被引次數(shù)較少,近期被引次數(shù)較高的情形,但是這種情形會相對較少,否則作者在近期的被引次數(shù)會相對較高,這樣盡管該篇論文的被引次數(shù)的加權(quán)和值會相對較高,但是由于這類論文的數(shù)量相對較少,對于h指數(shù)的影響或者決定作用并不高,這樣得到的h指數(shù)仍然是中等的。只有當(dāng)作者發(fā)表的文章數(shù)量較多,并且作者在近期的被引次數(shù)較高時,得到的h指數(shù)才是較高的。上述在第一種性質(zhì)中所討論的情形符合這種要求。同樣,對于作者發(fā)表的文章數(shù)量較多且作者在遠(yuǎn)期的被引次數(shù)較多時,得到的h指數(shù)是偏低的,在對第二種性質(zhì)的考察中,當(dāng)作者遠(yuǎn)期的影響力較高且近期的影響力較低時,所討論的情形也符合這種要求。

        (3)可以通過改變權(quán)重對近期時段的注重程度a來改變得到的h指數(shù)對近期的注重程度。如,當(dāng)a減小時,盡管中遠(yuǎn)期時段的權(quán)重低于近期時段的權(quán)重,但是兩者的差異會減小。如果對各個時段的權(quán)重進(jìn)行求和,那么中遠(yuǎn)期時段的權(quán)重占權(quán)重之和的比例會增加,與近期時段的權(quán)重相比,中遠(yuǎn)期時段的權(quán)重的作用會增加。如果使權(quán)重之和保持不變,那么中遠(yuǎn)期時段的權(quán)重會增加,當(dāng)作者中遠(yuǎn)期的影響力較高、近期的影響力較低時,假設(shè)作者發(fā)表的文章數(shù)量較多,并且作者中遠(yuǎn)期得到的被引次數(shù)較高,近期的被引次數(shù)較低,對于每篇論文而言,由于當(dāng)中遠(yuǎn)期時段的權(quán)重增加時,近期時段的權(quán)重會減小。由此,每篇論文的被引次數(shù)的加權(quán)和值會增加,由于論文的數(shù)量是較多的,得到的h指數(shù)也會增加。作者中遠(yuǎn)期的影響力較高、近期的影響力較低,說明此時h指數(shù)對中遠(yuǎn)期影響力的重視程度增加,對近期影響力的重視程度減小,所以h指數(shù)對近期影響力與中遠(yuǎn)期影響力的重視程度的差異會減小,這樣h指數(shù)對近期影響力的注重程度會減小。同理當(dāng)a增加時,如果使權(quán)重之和保持不變,那么中遠(yuǎn)期時段的權(quán)重會減小,仍然考察作者中遠(yuǎn)期的影響力較高、近期影響力較低的情形,當(dāng)中遠(yuǎn)期時段的權(quán)重減小時,每篇論文的被引次數(shù)的加權(quán)和值在總體上會減小,得到的h指數(shù)也會減小,說明此時h指數(shù)對中遠(yuǎn)期影響力的重視程度減小,對近期影響力的重視程度增加,所以h指數(shù)對近期影響力與中遠(yuǎn)期影響力的重視程度的差異會增加,這樣h指數(shù)對近期影響力的注重程度會增加。由此,可以利用權(quán)重對近期的注重程度a,來對構(gòu)造的h指數(shù)對近期的注重程度進(jìn)行表征。

        (4)當(dāng)a=0時,各個時段的權(quán)重相等,由此得到的h指數(shù)對應(yīng)于傳統(tǒng)的h指數(shù),對各個時段的作者影響力具有相同的重視程度。如,對于作者中遠(yuǎn)期的影響力較高、近期影響力較低的情形,仍然假設(shè)作者的文章數(shù)量較多,并且作者中遠(yuǎn)期得到的被引次數(shù)也較多;對于作者近期的影響力較高、中遠(yuǎn)期影響力較低的情形,相類似地,也假設(shè)作者近期得到的被引次數(shù)較多,那么兩種情形下得到的h指數(shù)會是近似相等的,說明得到的h指數(shù)對中遠(yuǎn)期以及近期的作者影響力的重視程度是相同的。這樣從直觀上,構(gòu)造得到的h指數(shù)能夠具有注重作者近期影響力的h指數(shù)應(yīng)當(dāng)具有的性質(zhì),如果這些性質(zhì)對于注重作者近期影響力的h指數(shù)的描述是全面的,那么可以認(rèn)為得到的h指數(shù)是一種注重作者近期影響力的h指數(shù),并且可以利用在確定各個時段的權(quán)重時對近期的注重程度a來調(diào)節(jié)得到的h指數(shù)對近期影響力的注重程度。

        需要指出,在上述的直觀認(rèn)識中只是選取了某些特例來進(jìn)行說明,需要對該指數(shù)的合理性與有效性進(jìn)行進(jìn)一步檢驗;在上述討論中均假設(shè)作者的文章數(shù)較多,這和傳統(tǒng)h指數(shù)的性質(zhì)是一樣的,否則如果作者的文章數(shù)量較少,盡管作者的影響力較高,但是利用h指數(shù)來對作者的影響力進(jìn)行表征時,h指數(shù)是偏低的;另外,在上述討論中,得到的h指數(shù)的取值是相對意義上的高或者低,是在得到的所有h指數(shù)的取值范圍中的相對大小,這和傳統(tǒng)h指數(shù)的取值大小相一致,也是在所有傳統(tǒng)h指數(shù)取值中的相對大小。

        對于作者在中期時段的影響力較高、在其余時段影響力較低的情形,從根本上是由于對中期時段賦予的權(quán)重是中等的,這樣得到的h指數(shù)會是中等的。另外,當(dāng)a減小時,中遠(yuǎn)期時段與近期時段的權(quán)重差異會減小,中遠(yuǎn)期時段權(quán)重占權(quán)重總和的比例會增加,當(dāng)權(quán)重總和保持不變時,中遠(yuǎn)期時段的權(quán)重會增加,而近期時段的權(quán)重會減小,以至于當(dāng)a=0時,近期時段的權(quán)重與中遠(yuǎn)期時段的權(quán)重會相等。在這個過程中,如果在權(quán)重的構(gòu)造方式中,在保持權(quán)重總和不變的同時,使得中期時段的權(quán)重近似保持不變,那么當(dāng)a=0時,由于近期時段的權(quán)重與中期時段的權(quán)重相同,此時近期時段的權(quán)重也會是中等的。其中,權(quán)重取值為中等時,仍然是相對意義上的中等,當(dāng)a任意取值時,在各個時段權(quán)重的所有取值中的相對大小,這樣對于作者在近期的影響力較高、在中遠(yuǎn)期影響力較低的情形,由于此時對各個時段的重視程度相同,并且近期時段的權(quán)重是中等的,那么得到的h指數(shù)也會是中等的,而這時的h指數(shù)對應(yīng)于傳統(tǒng)的h指數(shù)。但是,如果能夠認(rèn)為當(dāng)a=0時,這里構(gòu)造得到的h指數(shù)會轉(zhuǎn)化成為傳統(tǒng)的h指數(shù),那么對于作者在近期影響力較高、在中遠(yuǎn)期影響力較低的情形,傳統(tǒng)的h指數(shù)的取值應(yīng)當(dāng)是較高的,而此時得到的h指數(shù)卻是中等的。由此,從直觀上需要指出這是文中構(gòu)造得到的h指數(shù)的缺陷,從根本上是由于對各個時段進(jìn)行加權(quán)的方式造成的,如,使得各個時段的權(quán)重之和保持不變,但是從直觀上,使得各個時段的權(quán)重之和保持不變應(yīng)當(dāng)具有必要性,目的是為了保證當(dāng)a變化時得到的h指數(shù)仍然具有可比性。

        2 權(quán)重的確定

        在對各個時段的權(quán)重進(jìn)行具體確定時,可以對各個時段的重要性分別進(jìn)行比較,由此建立關(guān)于重視程度的判斷矩陣。[2]在通過一致性檢驗的基礎(chǔ)上,各個時段的權(quán)重為判斷矩陣的最大特征值所對應(yīng)的特征向量,為了滿足對作者近期影響力注重的要求,越近的時段應(yīng)當(dāng)被賦予更高的權(quán)重。同時如果提高對近期的注重程度,那么近期時段的權(quán)重與中遠(yuǎn)期時段的權(quán)重的差異應(yīng)當(dāng)增加,反之權(quán)重的差異應(yīng)當(dāng)減小,這些均可以通過在判斷矩陣中對相鄰時段賦予不同的重要性以及調(diào)整重要性之間的差異來體現(xiàn)。假設(shè)將考察的時間范圍劃分為5個時段,其中劃分的時段數(shù)可以任意選取,當(dāng)對近期的注重程度較低時,使得判斷矩陣右上部的元素均小于1,對于矩陣右上部的同一行中的任意兩個相鄰元素,使得左側(cè)元素大于等于右側(cè)元素;對于同一列中的相鄰元素,使得上方元素小于等于下方元素,從而判斷矩陣具有較好的一致性,這樣得到的權(quán)重也能夠更好地體現(xiàn)上述對作者近期影響力的注重要求,在此基礎(chǔ)上使得矩陣元素在整體上取1/2到1/9之間較大的數(shù)值(見圖1)。

        圖1 判斷矩陣的建立

        在圖1中,左邊矩陣的最大特征值所對應(yīng)的特征向量為(0.3058,0.5149,0.8168,1.2799,2.0826),最大特征值為5.3906,并且一致性比率為0.0872,能夠通過一致性檢驗,取該特征向量的分量為各個時段的權(quán)重。需要指出,只按照上述對元素取值的要求來建立判斷矩陣時,未必能夠通過一致性檢驗,如果不能通過,還需要對元素的取值進(jìn)行調(diào)整,而同時滿足上述對元素取值的要求,以及使得判斷矩陣能夠通過一致性檢驗的取值調(diào)整空間從直觀上是存在的。另外,正是因為滿足這種重視程度之間的一致性,對元素取值的上述要求或者是對作者近期影響力注重的要求才能實現(xiàn),否則得到的權(quán)重未必能夠具有越近期越重視的性質(zhì)。如,為了體現(xiàn)權(quán)重對近期時段的注重,必須要使判斷矩陣右上部分的元素都小于1,但是按照上述的取值要求,矩陣中a21×a15有可能大于1,這樣與a25<1就不一致。那么,由該判斷矩陣得到的權(quán)重既體現(xiàn)了這種不一致也體現(xiàn)了a25<1這兩種性質(zhì),甚至如果這種不一致程度較高,那么就未必能夠有效地體現(xiàn)a25<1,所以滿足一致性檢驗時得到的權(quán)重才是滿足對作者近期影響力注重的要求的權(quán)重。相類似地,當(dāng)對近期的注重程度較高時,使矩陣元素在整體上取1/2到1/9之間較小的數(shù)值,如圖1中右邊的判斷矩陣,此時矩陣最大的特征值所對應(yīng)的特征向量為(0.1727,0.4262,0.7764,1.3103,2.3144),最大的特征值為5.3290,并且一致性比率為0.0734,能夠通過一致性檢驗,在建立判斷矩陣時也需要在滿足上述取值要求的同時對判斷矩陣的元素進(jìn)行調(diào)整,以使判斷矩陣能夠通過一致性檢驗,否則由該判斷矩陣得到的權(quán)重未必能夠滿足對近期時段作者影響力注重程度增加的要求。而在實際取值時,滿足上述取值要求并使判斷矩陣能夠通過假設(shè)檢驗的調(diào)整空間也是存在的。可以對圖1中右邊矩陣的第一行進(jìn)行取值,使得最遠(yuǎn)時段與其余各個時段的相對重要性能夠滿足注重近期時段且注重程度較高的要求,對其余行進(jìn)行取值時,使取值與第一行取值所表示的相對重要性不相沖突,從而使判斷矩陣能夠滿足一致性要求。經(jīng)過初步檢驗,這種取值是存在且不唯一的,由此得到的權(quán)重才是滿足注重要求的權(quán)重。

        能夠注意到,由圖1右邊矩陣得到的權(quán)重對近期時段會更為注重,如,對于任意兩個時段而言,較近時段與較遠(yuǎn)時段之間的權(quán)重差異均會更高。需要指出,為了保證得到的h指數(shù)之間具有可比性,需要使考察的時間范圍相同,同時還需要將考察的時間范圍劃分為相同的時段,這樣得到的權(quán)重也才會具有可比性。

        另外,當(dāng)注重程度等于零時,各個時段具有相同的權(quán)重,由于要使構(gòu)造得到的h指數(shù)能夠轉(zhuǎn)化為傳統(tǒng)的h指數(shù),要求各個時段的權(quán)重相等且等于1。同時,為了保證得到的h指數(shù)具有可比性,需要使各個時段的權(quán)重之和保持不變,這樣當(dāng)分段數(shù)為5時,各個時段的權(quán)重之和均應(yīng)等于5,這也是圖1中兩個判斷矩陣的特征向量沒有取為分量之和等于1的原因。

        由此,可以利用判斷矩陣來對權(quán)重進(jìn)行確定,其優(yōu)點是在賦予各個時段的權(quán)重時可以較為靈活,但是由于當(dāng)對象較多時會對相互之間的相對重要性判斷帶來影響,采取這種方法時對時段數(shù)量的要求較高。同時,由于在賦予各時段權(quán)重后,如需要調(diào)整注重程度,需重新建立判斷矩陣,由此來重新賦予各個時段的權(quán)重,除了計算量可能較大之外,也不一定能夠保證注重程度能夠連續(xù)變化。因此,在確定權(quán)重時還可以嘗試建立某類關(guān)于注重程度的函數(shù),使注重程度作為某種響應(yīng)變量,當(dāng)該函數(shù)的參量以及函數(shù)自身連續(xù)變化時,注重程度也能夠連續(xù)變化,這樣不僅在確定權(quán)重時計算量會減小,而且能夠使注重程度連續(xù)變化。特別地,在建立函數(shù)時可以使注重程度在-1到1這個區(qū)間內(nèi)連續(xù)變化,取值越大,注重程度越高,而當(dāng)注重程度的取值為負(fù)數(shù)時,表示對遠(yuǎn)期的作者影響力更為重視,當(dāng)取值為零時,表示對各個時段的注重程度相同。除此之外,在利用判斷矩陣來確定權(quán)重時,能夠按照注重要求來大致調(diào)節(jié)對近期的注重程度,如在圖1中左側(cè)矩陣對近期的注重程度會弱于右側(cè)矩陣,但是如果需要準(zhǔn)確知道此時注重程度的大小與差異,還需要給出相應(yīng)的衡量方式。由此,確定權(quán)重時使注重程度能夠連續(xù)變化會具有一定的優(yōu)勢,能夠建立相應(yīng)的權(quán)函數(shù)(見圖2)。

        圖2 注重程度連續(xù)變化時的權(quán)重確定

        在圖2中,橫軸為劃分的各個時間段的序號,分別為第0時段至第n時段,縱軸為各個時段的權(quán)重,權(quán)函數(shù)為y=2ax/n+1-a,其中a的取值范圍為-1到1,圖中斜率為負(fù)數(shù)的直線段對應(yīng)于a=-1時的情形。這時近期時段的權(quán)重小于遠(yuǎn)期時段的權(quán)重,并且遠(yuǎn)期時段與近期時段的權(quán)重差異也是最大的,說明此時對遠(yuǎn)期的重視程度是要高于對近期的重視程度,并且對遠(yuǎn)期的注重程度也是最高的,其中的注重遠(yuǎn)期意味著對距離考察時間或者第n時段越遠(yuǎn)的時段會越重視。隨著斜率絕對值的減小,由于遠(yuǎn)期時段的權(quán)重仍然高于近期時段的權(quán)重,并且遠(yuǎn)期時段與近期時段的權(quán)重差異會減小,因此對遠(yuǎn)期的注重程度會逐漸減小。當(dāng)斜率等于零時,a=0,此時各個時段具有相同的權(quán)重且等于1;當(dāng)斜率為正數(shù)時,a>0,這時近期時段的權(quán)重大于遠(yuǎn)期時段的權(quán)重,說明此時的權(quán)重是注重近期的,并且隨著斜率的增加,近期與遠(yuǎn)期時段的權(quán)重差異也會增加,由此,權(quán)重對近期的注重程度也會增加。圖中斜率為正數(shù)的直線段為a=1時的情形,這時對近期的注重程度達(dá)到最大。在圖2中,當(dāng)直線段的斜率或者a連續(xù)變化時,權(quán)重對近期的注重程度也會連續(xù)變化,可以利用a來表征對作者近期影響力的注重程度:當(dāng)a>0時,權(quán)重是注重近期的,并且a越大,對近期的注重程度越高;當(dāng)a<0時,權(quán)重對遠(yuǎn)期注重,并且a的絕對值越大,注重程度越高;而當(dāng)a=0時,權(quán)重對近期或遠(yuǎn)期的注重程度均等于零。

        另外,需要使各個時段的權(quán)重之和保持不變,這樣當(dāng)a固定時,每篇論文的被引次數(shù)的加權(quán)和值是建立在相同的權(quán)重基礎(chǔ)上。由此,對于同一作者以及不同作者而言,得到的h指數(shù)會具有可比性。同時,當(dāng)a變化時,由于權(quán)重之和維持不變,只是各個時段的相對重視程度會發(fā)生改變,這樣每篇論文的被引次數(shù)的加權(quán)和值以及得到的h指數(shù)在數(shù)量上仍然會有可比性。在圖2中,各個時段的權(quán)重之和為2a(1+2+...+n) /n+(n+1)-a(n+1)=n+1,因此,權(quán)重之和與 a無關(guān)。同樣地,為了使a=0時得到的h指數(shù)能夠轉(zhuǎn)化為傳統(tǒng)的h指數(shù),當(dāng)a=0時需要使各個時段的權(quán)重相等且等于1,因此,文中將權(quán)重之和取為n+1。

        3 合理性檢驗

        在確定各個時段的權(quán)重之后,利用傳統(tǒng)h指數(shù)的定義可以構(gòu)造出對作者近期影響力注重的h指數(shù),并進(jìn)行合理性檢驗以及實證分析。如,當(dāng)注重程度較高時,某一領(lǐng)域近期的代表作者的h指數(shù)的排序會相對靠前;當(dāng)注重程度較低時,該領(lǐng)域的奠基性作者的h指數(shù)的排序會相對靠前,這樣只利用h指數(shù)就可以對兩類作者進(jìn)行識別。

        在知網(wǎng)中可以得到每位作者的每篇論文的被引次數(shù)以及這些被引次數(shù)的施引年份,由此可以得到每位作者總的被引次數(shù)以及這些被引次數(shù)的年代分布,利用每篇論文的發(fā)表時間,也可以得到每位作者發(fā)表的總的論文數(shù)以及這些論文的年代分布。同時,由于為了明確不同時期的代表作者,文中只是選取了被引次數(shù)相對較高的作者作為考察對象,其中數(shù)據(jù)的獲取時間為2018年1月,考察的領(lǐng)域為中國知網(wǎng)中的圖書館學(xué)及圖書館事業(yè)這個分類。

        在作者被引次數(shù)的年代分布中,由于選取的對象為被引次數(shù)相對較高的作者,這些作者的影響力也會相對較高,當(dāng)被引次數(shù)的年代分布在足夠長的考察時間范圍內(nèi)可以近似為單峰的情形下,能夠假設(shè)被引次數(shù)最高的年份是作者具有較高影響力的年份,由此能夠近似得到每位作者影響力較高的年份(見圖3)。當(dāng)被引次數(shù)較高時,作者在該年度的影響力也會較高,而文中只是選取了最大年度被引次數(shù)來大致確定作者影響力較高的時間范圍。對于在近期時段影響力較高的作者,由于作者在近期時段得到被引次數(shù)較多,被引次數(shù)的年代分布未必能夠近似為單峰,但是在該情形下最大年度被引次數(shù)通常會出現(xiàn)在近期時段,所以在這里仍然利用最大年度被引次數(shù)來對作者影響力較高的時間范圍進(jìn)行大致確定。另外,在此過程中,如果作者在多個年度的被引次數(shù)均為最大年度被引次數(shù),可以任意選取其中某個年份來近似確定作者具有高影響力的時間范圍。

        圖3 每位作者被引次數(shù)最高的年份

        在圖3中,縱軸為在某個年度被引次數(shù)取為最大年度被引次數(shù)的作者的數(shù)量,在此基礎(chǔ)上可以對考察的時間范圍進(jìn)行分區(qū),分區(qū)的數(shù)量以及每個區(qū)間的長度可以任意選取。文中將橫軸劃分為圖中的5個時段,其中最遠(yuǎn)的時段為2001年及其之前的時間范圍,這樣的劃分能夠使得在求每篇論文的被引次數(shù)的加權(quán)求和時,所需的權(quán)重均能夠構(gòu)造得到。在這里得到的h指數(shù)是截至2017年的作者的h指數(shù),這和截止到某年度的傳統(tǒng)的h指數(shù)也是相同的。同時,在這種分區(qū)的基礎(chǔ)上也可以探討當(dāng)對作者近期影響力的注重程度發(fā)生變化時的每位作者的排序情況,由此來檢驗得到的h指數(shù)的合理性,另外考察的時間范圍以及相應(yīng)的分區(qū)需要保持不變,這樣當(dāng)對近期的注重程度發(fā)生變化時,確定的權(quán)重以及得到的h指數(shù)在數(shù)量上會具有可比性。

        取權(quán)重對近期的注重程度a=0.8,由于可以利用權(quán)重對作者近期影響力的注重程度來對得到的h指數(shù)對其進(jìn)行表征,此時得到的h指數(shù)對近期的注重程度應(yīng)當(dāng)是相對較高的。如果利用注重程度連續(xù)變化時的情形來對權(quán)重進(jìn)行確定,那么各個時段的權(quán)重分別為0.2,0.6,1,1.4,1.8,其中n等于4,那么在此基礎(chǔ)上根據(jù)作者每篇論文的被引次數(shù)及其年代分布可以得到h指數(shù)(見圖4)。

        圖4 構(gòu)造得到的每位作者的h指數(shù)

        在圖4左邊的情形中能夠注意到,當(dāng)對近期的注重程度較高時,越是在近期具有高影響力的作者的h指數(shù)會具有越高的趨勢,所以能夠在一定程度上體現(xiàn)出構(gòu)造得到的h指數(shù)具有對作者越近期的影響力會越重視的傾向。但是也能夠注意到,如,第4時段的作者與第3時段的作者相比,h指數(shù)在整體上會相對偏低,而這和上述直觀認(rèn)識中的討論是不相符合的。從直觀上,由于得到的h指數(shù)對作者越近期的影響力越重視,盡管某位作者較近期的影響力較高,其余時段的影響力較低,同時另外一位作者近期的影響力較高,那么后者的h指數(shù)應(yīng)當(dāng)高于前者才能與得到的h指數(shù)的注重近期的性質(zhì)相符合。因此,第4時段的作者的排序應(yīng)當(dāng)高于第3時段的作者,并且其排序在所有時段中應(yīng)當(dāng)是最為靠前的。但是需要指出,在直觀認(rèn)識中所討論的每位作者在不同時期具有的較高影響力,是這些影響力均較高、并且對這些影響力之間的相對高低不進(jìn)行區(qū)分的意義上的較高影響力,這樣才會有相應(yīng)的認(rèn)識結(jié)果,而實際上盡管每位作者的影響力均較高,但是在程度上仍然可以有較大的差異。盡管得到的h指數(shù)注重作者近期的影響力,但是如果某位作者較近期的影響力較高,并且顯著高于近期影響力也較高的另一位作者的影響力,那么會存在前者的h指數(shù)高于后者的情形,而這與得到的h指數(shù)對作者越近期的影響力越重視的直觀認(rèn)識是不相矛盾的。但是對于影響力均較高的這些作者而言,如果對這些作者進(jìn)行選取時具有一般性,得到的h指數(shù)至少應(yīng)當(dāng)具有在近期影響力較高的作者的h指數(shù)會高于在遠(yuǎn)期影響力較高的作者的h指數(shù)的趨勢,其中的近遠(yuǎn)期是相對意義上的,所以在整體上隨著時段的由遠(yuǎn)而近,得到的h指數(shù)應(yīng)當(dāng)有逐漸增加的趨勢。

        由于只考慮注重近期不一定能使在不同時期分別具有較高影響力的作者完全按照其高影響力所在的時段進(jìn)行排序,文中需要利用某種方式來衡量得到的h指數(shù)是否滿足對于越在近期具有較高影響力的作者,其得到的h指數(shù)的排序會越靠前的要求,以及對滿足的程度進(jìn)行衡量,由此來衡量構(gòu)造方法的合理性與有效性。由于每位作者均有所屬的具有較高影響力時段的序號以及得到的h指數(shù)與該作者相對應(yīng),在這里利用兩者之間的等級相關(guān)系數(shù)作為標(biāo)準(zhǔn)來衡量構(gòu)造的方法對在不同時期分別具有較高影響力的作者的識別程度。如,對近期的注重程度較高時,越在近期時段具有較高影響力的作者會越靠前,這樣在某一領(lǐng)域中最近期的代表性作者的h指數(shù)的排序會最為靠前,從而能夠嘗試對該類作者進(jìn)行區(qū)分。在求兩變量的等級相關(guān)系數(shù)時,沒有將作者所屬的高影響力時段相同的情形計入在內(nèi),目的是只考察作者具有高影響力的時段與得到的h指數(shù)之間的等級關(guān)系,所以文中等級相關(guān)系數(shù)為r=s/t。其中,s為作者具有高影響力時段的序號與作者的得到的h指數(shù)形成的同序?qū)Φ膫€數(shù),對于時段序號差值為零的情形以及作者得到的h指數(shù)的差值為零的情形均不計入在內(nèi)。如果將任意兩個數(shù)對作為一組,并將這些組的個數(shù)稱為總組數(shù),那么t等于總組數(shù)減去時段序號差值為零的情形的個數(shù),這樣t實際上也等于形成的同序?qū)εc異序?qū)σ约暗玫降膆指數(shù)差值為零的情形的總數(shù),這樣時段序號的差值以及得到的h指數(shù)的差值同時為零的情形也是不計入在內(nèi)的。由此,該等級相關(guān)系數(shù)是只對在不同時段具有高影響力的作者的高影響力時段與其得到的h指數(shù)之間的相關(guān)性進(jìn)行衡量,當(dāng)兩位作者屬于同一高影響力時段時不對其進(jìn)行比較,該系數(shù)的取值范圍為0到1,該系數(shù)越高說明同序?qū)Φ膫€數(shù)越多,這樣作者所屬時段與得到的h指數(shù)的正相關(guān)性會越高,當(dāng)系數(shù)等于1時,說明近期時段具有高影響力的作者的h指數(shù)均會高于遠(yuǎn)期時段的作者的h指數(shù)。其中,遠(yuǎn)近均為相對意義上的遠(yuǎn)近,對于圖4左邊的情形,該等級相關(guān)系數(shù)為0.629。

        影響該等級相關(guān)系數(shù)的因素包括上述每位作者的影響力均較高,但是在程度上仍然存在較大差異時,可以對該因素進(jìn)行剔除,從而減少由作者在較遠(yuǎn)時段的影響力較高,且顯著高于在較近時段具有較高影響力的作者其h指數(shù)排序靠前的情形出現(xiàn)。由此,能夠提高作者高影響力所屬時段與得到的h指數(shù)之間的一致性,或者能夠使相關(guān)系數(shù)有所提高。在圖4右邊的情形中,當(dāng)權(quán)重對近期的注重程度a=0.8時,可以得到每位作者此時的h指數(shù),當(dāng)權(quán)重對近期的注重程度等于零時,各個時段的權(quán)重相等且等于1,可以得到作者此時的h指數(shù),且為傳統(tǒng)的h指數(shù)。將前者除以后者作為縱軸并記為h’,在這里利用前者除以后者來減少上述由作者自身影響力的高低所帶來的對作者排序的影響,從而會更注重得到的h指數(shù)的構(gòu)造方式對于作者排序的影響。在圖4中能夠注意到,與左圖相比,對于越在近期具有較高影響力的作者,其排序會越靠前的要求,右圖滿足的程度會更高,并且可以得到此時的等級相關(guān)系數(shù)為0.759,其中需要將數(shù)對中得到的h指數(shù)更換為h’。在圖5中權(quán)重對近期的注重程度a=-0.8,得到的h指數(shù)對遠(yuǎn)期的注重程度相對較高。仍然利用注重程度連續(xù)變化時的情形來對權(quán)重進(jìn)行確定,得到的結(jié)果與a=0.8時的情形相類似,可以得到左圖與右圖的等級相關(guān)系數(shù)分別為0.535與0.788,其中需要將s中的同序?qū)Φ膫€數(shù)更換為異序?qū)Φ膫€數(shù)。

        圖5 構(gòu)造得到的每位作者的h指數(shù)

        除了由作者影響力的差異所帶來的影響外,對作者具有高影響力時段的確定方式也會影響作者的排序情況。文中采用最大年度被引次數(shù)來對作者影響力較高的時間范圍進(jìn)行確定的方式是粗糙的,如,會存在這樣的情形,從最大年度被引次數(shù)所在時段開始向近期或者向遠(yuǎn)期的較長時間范圍內(nèi),作者都會具有較高的影響力,這樣在確定作者具有高影響力的時段時僅由最大年度被引次數(shù)來進(jìn)行確定存在偏差。由此會出現(xiàn)這樣的結(jié)果,如,本應(yīng)屬于在較近時間范圍內(nèi)具有較高影響力的作者會被當(dāng)作在中期時段具有較高影響力的作者進(jìn)行處理,而此時作者得到的h指數(shù)以及標(biāo)準(zhǔn)化后的h指數(shù)均可能是較高的,其中標(biāo)準(zhǔn)化后的h指數(shù)是上述得到的h指數(shù)與傳統(tǒng)h指數(shù)的比值,從而會造成作者所屬的具有較高影響力的時段與得到的h指數(shù)以及標(biāo)準(zhǔn)化后的h指數(shù)之間的排序不一致的情形出現(xiàn),或者說等級相關(guān)系數(shù)的取值還會受到高影響力時段的確定方式的影響,這也是在圖4與圖5的右圖中等級相關(guān)系數(shù)仍然沒有等于1的原因之一。

        另外,對各個時段的加權(quán)方式也會對等級相關(guān)系數(shù)產(chǎn)生影響,文中利用在時段上的線性加權(quán),會造成盡管權(quán)重對作者近期影響力的注重程度很高,但是比較近期與近期兩個時段的權(quán)重差異并不會偏低的情形出現(xiàn)。由此,對于在比較近期影響力較高的作者,且其影響力顯著高于近期影響力較高的作者的情況,盡管可以利用標(biāo)準(zhǔn)化后的h指數(shù)在一定程度上消除作者影響力自身的影響,但是由于這種線性加權(quán)以及h指數(shù)自身取值的相對穩(wěn)定性,在比較近期影響力較高的作者得到的h指數(shù)與其傳統(tǒng)h指數(shù)之間的差異可能會具有高于在近期影響力較高的作者的兩種h指數(shù)之間的差異的傾向。如,在圖4右圖中的兩位作者,具有高影響力的時段分別為2014年與2010年,得到的h指數(shù)與傳統(tǒng)的h指數(shù)分別為9與8以及16與14,假設(shè)作者的某篇論文的被引次數(shù)為c,由于作者是在較近期與近期的影響力較高,在求被引次數(shù)的加權(quán)和值時是將每單位被引次數(shù)均乘以相同的某個大于1的系數(shù)d,這樣這篇文章的加權(quán)和值為cd,并且與這篇文章的被引次數(shù)的差值為c(d-1)。由于與后者的影響力相比,前者的影響力會顯著偏低,可以認(rèn)為后者每篇論文的被引次數(shù)在總體上會高于前者,所以每篇論文的加權(quán)和值與其被引次數(shù)的差值在總體上也會高于前者,這樣對于后者而言,其得到的h指數(shù)與傳統(tǒng)h指數(shù)的差異也會大于前者兩種h指數(shù)之間的差異。因此,可能仍然會使得在較近期影響力較高的作者其標(biāo)準(zhǔn)化后的h指數(shù)高于在近期影響力較高的作者,從而對等級相關(guān)系數(shù)會具有抑制作用。

        文中對h指數(shù)進(jìn)行構(gòu)造的最終目的是使當(dāng)對近期的注重程度較高時,近期代表性作者的h指數(shù)的排序會靠前,當(dāng)對遠(yuǎn)期的注重程度較高時,奠基性作者的排序會靠前。同時注重程度可以連續(xù)變化,由此來對每位作者在不同注重程度時的影響力分別進(jìn)行衡量,其中的注重程度是指h指數(shù)對作者近期影響力的注重程度,同時這種衡量方法應(yīng)當(dāng)適用于影響力的不同情況,而不只限于作者影響力均較高的情形。另外,當(dāng)作者的影響力均較高時,需要在這些影響力可能存在較大差異的情況下,仍然可以將不同時段的代表性作者識別出來,可以考慮利用上述等級相關(guān)系數(shù)來衡量構(gòu)造方式的有效性,以及需要在以上影響因素的基礎(chǔ)上進(jìn)行構(gòu)造方式的改進(jìn),使得等級相關(guān)系數(shù)能夠有所提高。

        猜你喜歡
        情形時段影響力
        避免房地產(chǎn)繼承糾紛的十二種情形
        四種情形拖欠勞動報酬構(gòu)成“拒不支付”犯罪
        公民與法治(2020年4期)2020-05-30 12:31:34
        四個養(yǎng)生黃金時段,你抓住了嗎
        天才影響力
        NBA特刊(2018年14期)2018-08-13 08:51:40
        黃艷:最深遠(yuǎn)的影響力
        出借車輛,五種情形下須擔(dān)責(zé)
        公民與法治(2016年9期)2016-05-17 04:12:18
        3.15消協(xié)三十年十大影響力事件
        傳媒不可估量的影響力
        人間(2015年21期)2015-03-11 15:24:39
        傍晚是交通事故高發(fā)時段
        分時段預(yù)約在PICC門診維護(hù)中的應(yīng)用與探討
        91视频88av| 久久精品成人一区二区三区| 国产精品无码无在线观看| a级黑人大硬长爽猛出猛进| 在线观看亚洲你懂得| 一区二区三区国产天堂| 放荡的美妇在线播放| 久久99精品国产麻豆| 99久久超碰中文字幕伊人| 国产成人美涵人妖视频在线观看 | 麻豆69视频在线观看| 草草浮力影院| 日韩中文字幕中文有码| 免费观看在线视频一区| 日韩少妇人妻中文视频| 午夜视频在线在免费| 亚洲第一看片| 国产精品亚洲av无人区二区| 亚洲欧洲免费无码| 欧美亚洲日本国产综合在线| 国产成人亚洲合集青青草原精品 | 日本超骚少妇熟妇视频| 亚洲成a∨人片在线观看无码| 日韩在线一区二区三区免费视频 | 亚洲啪啪AⅤ一区二区三区| 亚洲国产精品区在线观看 | 久久综合精品国产丝袜长腿| 亚洲欧美国产成人综合不卡| 国产无套一区二区三区久久| 日韩精品一区二区三区中文| 国产成人精选在线不卡| 日本高清一区二区三区在线 | 亚洲综合色秘密影院秘密影院| 亚洲美女av二区在线观看| 久久精品国产亚洲夜色av网站| 三级4级全黄60分钟| 91精品在线免费| 华人在线视频精品在线| 欧美亚洲色综久久精品国产| 午夜精品一区二区三区无码不卡| 丝袜美腿在线播放一区二区|