摘 要:利用布魯克斯(Brookes)圖形法統(tǒng)計(jì)獼猴桃專業(yè)核心期刊時(shí),由于獼猴桃專業(yè)屬于農(nóng)業(yè)類的狹窄專業(yè),可采用的期刊實(shí)體樣本空間狹小,因而會(huì)產(chǎn)生較大的系統(tǒng)誤差,而在實(shí)際統(tǒng)計(jì)中,期刊實(shí)體增量十分有限,即短期內(nèi)通常不會(huì)有大量的新增實(shí)體樣本出現(xiàn)。本研究通過(guò)β圖形輔助分析法得到了可靠的獼猴桃專業(yè)核心期刊布魯克斯圖形分界點(diǎn),并利用這一分界點(diǎn)逆推得到布魯克斯圖形法誤差修正系數(shù)。
關(guān)鍵詞:獼猴桃專業(yè);核心期刊;β圖形;布魯克斯;修正系數(shù)
中圖分類號(hào):O243文獻(xiàn)標(biāo)識(shí)號(hào):A文章編號(hào):1001-4942(2010)02-0089-06
文獻(xiàn)統(tǒng)計(jì)研究是布拉德福(Bradford)文獻(xiàn)分散定律產(chǎn)生和發(fā)展的基礎(chǔ)[1],該定律自20世紀(jì)30年代發(fā)布以來(lái),已在多個(gè)領(lǐng)域的多個(gè)學(xué)科得到了實(shí)際檢驗(yàn)以及后人的不斷發(fā)展和完善。最重要的是布魯克斯對(duì)它的發(fā)展,其分段函數(shù)式對(duì)布拉德福曲線給予了更加全面和準(zhǔn)確地描述[2],并發(fā)展了圖形法,在文獻(xiàn)計(jì)量學(xué)理論和應(yīng)用方面都占有極其重要的地位,專業(yè)核心期刊的統(tǒng)計(jì)就是其中的一項(xiàng)重要功能。從目前已發(fā)表的s值數(shù)據(jù)[3]來(lái)看,布魯克斯圖形法大多應(yīng)用于專業(yè)范圍較為寬泛的學(xué)科。s是標(biāo)度學(xué)科專業(yè)范圍大小的指標(biāo),一般隨專業(yè)范圍的擴(kuò)大而擴(kuò)大,s≤1說(shuō)明專業(yè)范圍非常窄[3]。獼猴桃專業(yè)是典型的狹窄專業(yè),但本研究發(fā)現(xiàn),其s值大于1,為1.75,不具備非常窄專業(yè)的特征,從所采用數(shù)據(jù)樣本來(lái)看,處于1994~2004年,其間經(jīng)歷了一個(gè)產(chǎn)業(yè)發(fā)展膨脹階段,期刊載文數(shù)量也會(huì)產(chǎn)生相應(yīng)的膨脹,但獼猴桃專業(yè)特征并沒有產(chǎn)生持續(xù)的變化,短期膨脹后,仍要回歸狹窄專業(yè)特征。在這種情況下,如果簡(jiǎn)單套用布魯克斯圖形法,很難得到合理的計(jì)算結(jié)果,會(huì)產(chǎn)生很大的系統(tǒng)誤差[8]。筆者進(jìn)行該類研究時(shí),在布魯克斯圖形法的基礎(chǔ)上,采用了β圖形[8,9],即以布魯克斯原模型為基礎(chǔ),按其β值繪制曲線,然后利用該曲線上的合理分界點(diǎn)作為參考點(diǎn),來(lái)獲得誤差變化規(guī)律的曲線,從而得到布魯克斯圖形法誤差修正系數(shù)x,以達(dá)到有效克服誤差目的。在目前國(guó)內(nèi)發(fā)表的專業(yè)文獻(xiàn)中,已有多篇論文[4~7]獲得了該方法的支持并得到了合理的計(jì)算結(jié)果。本成果始于對(duì)杏專業(yè)布魯克斯誤差的研究,并已在多個(gè)果樹專業(yè)中進(jìn)行了驗(yàn)證研究,均取得了良好的結(jié)果,以獼猴桃專業(yè)為采樣數(shù)據(jù)的該類研究目前尚未見報(bào)道。
1 模型與定義
模型:公式1被稱為布魯克斯公式。
R(n)=αnβ(1≤n≤C) ①kln(n/s)(C≤n≤N) ②(公式1)
式中,s是一個(gè)與N成正比的參數(shù),同時(shí)與C呈正相關(guān)。α=R(1),表示等級(jí)為1的期刊載文量,即載文量最多的期刊的載文量。C為核心區(qū)期刊數(shù)。β為小于1的參數(shù),是布魯克斯圖形曲線部分的曲率,與核心區(qū)期刊數(shù)量相關(guān)。k為布魯克斯圖形中直線部分的斜率。N為期刊總數(shù),n為期刊按載文量遞減順序排列的排列序號(hào)[3],即期刊累計(jì)數(shù)。
在研究杏專業(yè)載文核心期刊的統(tǒng)計(jì)誤差[8]時(shí),已在該公式和與之對(duì)應(yīng)的圖形法的基礎(chǔ)上給出了4個(gè)定義,同樣適用于對(duì)獼猴桃專業(yè)載文核心期刊的統(tǒng)計(jì)進(jìn)行誤差分析與修正研究。
定義1:β圖形——以布魯克斯圖形各點(diǎn)的β值為橫軸,以期刊累計(jì)數(shù)n為縱軸制作的曲線。又稱為β曲線。
定義2:合理分界點(diǎn)T——在β圖形中,曲率勻加速變化的線段與曲率趨向常數(shù)的線段之交點(diǎn)。
定義3:不合理分界點(diǎn)C——在布魯克斯圖形中,如果分界點(diǎn)C不對(duì)應(yīng)于β圖形中的T點(diǎn),則C為不合理分界點(diǎn)。
定義4:布魯克斯圖形法修正系數(shù)x——在系統(tǒng)誤差修正過(guò)程中對(duì)實(shí)體樣本空間的最佳虛擬變換倍數(shù)。
2 數(shù)據(jù)與圖形分析
2.1 數(shù)據(jù)采用與處理
表1是一組有關(guān)中國(guó)獼猴桃專業(yè)論文的統(tǒng)計(jì)數(shù)據(jù)[4],其原始數(shù)據(jù)來(lái)源于中國(guó)期刊全文數(shù)據(jù)庫(kù)和中文科技期刊全文數(shù)據(jù)庫(kù),這兩個(gè)數(shù)據(jù)庫(kù)幾乎涵蓋了國(guó)內(nèi)所有的農(nóng)業(yè)科技期刊。為便于數(shù)據(jù)引用和計(jì)算,將原創(chuàng)數(shù)據(jù)表中的常用對(duì)數(shù)值改為“期刊累計(jì)數(shù)自然對(duì)數(shù)值(lnn)”,表中引用的其它原始數(shù)據(jù)不變。根據(jù)該表中的數(shù)據(jù)在笛卡爾坐標(biāo)紙上描圖1,即為布魯克斯圖形,其分界點(diǎn)為C,由該點(diǎn)的橫坐標(biāo)可以求得布魯克斯值n,即核心期刊值。
2.2 β圖形的制作與應(yīng)用
在布魯克斯圖形法的基礎(chǔ)上研究對(duì)其β值的進(jìn)一步應(yīng)用。由兩段數(shù)學(xué)式(公式1)所得的布魯克斯圖形具有連續(xù)性,依此,β亦具連續(xù)性,因而在應(yīng)用中可通過(guò)求取該圖形曲線上各點(diǎn)的β值并作圖,判斷布魯克斯圖形中直觀獲取的分界點(diǎn)的合理性,即圖1中C點(diǎn)的合理性。布魯克斯圖形法是利用分界點(diǎn)上的縱橫坐標(biāo)值來(lái)求取核心期刊的值n,本研究就是要修正該點(diǎn)的計(jì)算結(jié)果。
分析發(fā)現(xiàn),利用布魯克斯圖形法計(jì)算狹窄專業(yè)的核心期刊時(shí),其圖形分界點(diǎn)位置的判斷會(huì)存在較大的誤差,因而,需對(duì)分界點(diǎn)的準(zhǔn)確位置作進(jìn)一步的分析,以便找到縮小這類誤差途徑,即從圖1中第一個(gè)統(tǒng)計(jì)點(diǎn)開始,假設(shè)其后的每一個(gè)描點(diǎn)都是一個(gè)分界點(diǎn)(同時(shí)滿足公式1①和公式1②條件的點(diǎn)),這樣就可針對(duì)每一個(gè)實(shí)際描點(diǎn)利用公式1①逐一計(jì)算其曲率β,并制作曲線,即定義中的“β圖形”。利用指數(shù)與對(duì)數(shù)法則將公式1①轉(zhuǎn)換為公式2:
β=logR(n)R(1)n=lgR(n)R(1)lgn=lgR(n)-lgR(1)lgn=lgR(n)-lg89lgn(公式2)
將表1中各已知量代入公式2,得到對(duì)應(yīng)的β值(表2)。分別以n值和β值為縱橫坐標(biāo)描圖2。β圖形更加直觀和清晰,容易找出β值趨于一致的線段邊際,因而能夠更加準(zhǔn)確地發(fā)現(xiàn)合理分界點(diǎn)的影射點(diǎn),最大限度地避免僅僅依靠圖1來(lái)確定分界點(diǎn)所帶來(lái)的系統(tǒng)誤差。
圖2 獼猴桃專業(yè)文獻(xiàn)的β曲線
2.3 圖形對(duì)比與誤差分析
在研究杏[8]、山楂[9]、棗、核桃等狹窄專業(yè)的分界點(diǎn)時(shí),發(fā)現(xiàn)如下規(guī)律:一是當(dāng)專業(yè)發(fā)展比較穩(wěn)定時(shí),布魯克斯圖形的分界點(diǎn)位于β圖形中勻加速變化階段的線段上,此時(shí)可以確定該線段上方的端點(diǎn)即為合理分界點(diǎn);二是當(dāng)專業(yè)發(fā)展急劇膨脹時(shí),布魯克斯圖形的分界點(diǎn)位于β圖形中勻加速變化階段的線段頂端或頂端以外趨向于垂直于橫軸的射線上的近端點(diǎn)處,此時(shí)的分界點(diǎn)應(yīng)視布魯克斯圖形曲線部分的狀況而定。以上兩種情況的β圖形均存在一條由多個(gè)統(tǒng)計(jì)點(diǎn)構(gòu)成的規(guī)則斜線,即β值勻加速變化的線段。而對(duì)發(fā)展一直較為平穩(wěn)的專業(yè)突然出現(xiàn)急劇萎縮的情況尚沒有典型實(shí)例可供研究。獼猴桃專業(yè)在統(tǒng)計(jì)期間也出現(xiàn)了膨脹式發(fā)展情況,如2001年前,浙江省江山市大力發(fā)展獼猴桃生產(chǎn),到該年度收獲期,價(jià)格由年前的8元/kg直降到1.2元/kg[10],非主產(chǎn)區(qū)尚且如此,主產(chǎn)區(qū)的情況當(dāng)然也同樣不堪。直觀上看,在圖2中存在著5個(gè)比較明顯的拐點(diǎn),分別為B、D、T、E、F。B、D點(diǎn)對(duì)應(yīng)于圖1靠近核心區(qū)的明顯的曲線部分,不予討論;T點(diǎn)明顯地處于勻加速變化線段的頂端,為核心區(qū)與發(fā)散區(qū)的分界點(diǎn)。E、F也是比較明顯的拐點(diǎn),但它們是相鄰的兩個(gè)統(tǒng)計(jì)點(diǎn),是由于專業(yè)發(fā)展不穩(wěn)造成的,不具備分界點(diǎn)的條件。
在圖1中,布魯克斯圖形分界點(diǎn)為C,格魯斯下垂區(qū)為143 此處β<1,說(shuō)明所采用的數(shù)據(jù)符合布魯克斯公式的條件要求,而該點(diǎn)在圖2中的影射點(diǎn)為C’, 顯然,C’已大大超出了β勻加速變化區(qū)(DT線段),進(jìn)入了文獻(xiàn)發(fā)散區(qū),這就難以判斷C’是否是合理分界點(diǎn)。從圖1來(lái)看,從第9描點(diǎn)T’(對(duì)應(yīng)于圖2的T點(diǎn))到C點(diǎn),已完全表現(xiàn)為一條規(guī)則的直線,其趨勢(shì)線T’H與其完全重合,而規(guī)則的布魯克斯直線部分則為CI,T’H與CI存在的剪刀差也正反映了本專業(yè)的發(fā)展出現(xiàn)過(guò)比較大的波動(dòng)并在C點(diǎn)表現(xiàn)出來(lái),由此可見,合理分界點(diǎn)應(yīng)處于C點(diǎn)的下方,C則是“不合理分界點(diǎn)”。而圖2中10.60≤n≤45.00范圍內(nèi)則是一條趨向垂直于橫軸的直線,這在杏專業(yè)等核心期刊的誤差研究中也得到了證實(shí),因此,可以判定此范圍對(duì)應(yīng)于圖1的直線部分,至此,可將圖2中的曲率分界點(diǎn)T判定為“合理分界點(diǎn)”,該點(diǎn)有nβ=10.60≈11,從而確認(rèn)了T點(diǎn)的縱坐標(biāo)10.60即為核心期刊值,這與區(qū)域法[4~7]所獲得的結(jié)果相符[4]。這樣便可以通過(guò)公式計(jì)算找到傳統(tǒng)布魯克斯圖形對(duì)應(yīng)于T點(diǎn)的真實(shí)分界點(diǎn),從而對(duì)布魯克斯圖形給出的結(jié)果進(jìn)行修正。在圖1中,核心區(qū)與發(fā)散區(qū)的分界點(diǎn)除作圖與判定誤差外,對(duì)照區(qū)域法[4]計(jì)算結(jié)果,利用這一分界點(diǎn)所產(chǎn)生的系統(tǒng)誤差則更大,是誤差的主要因素。經(jīng)試驗(yàn)證明,在該點(diǎn)通過(guò)對(duì)s值進(jìn)行變換可以有效縮小對(duì)核心期刊統(tǒng)計(jì)的系統(tǒng)誤差,由于N與s成正比[3],其數(shù)學(xué)意義是對(duì)實(shí)體樣本空間進(jìn)行了變換,這種變換是以β圖形中T點(diǎn)為依據(jù)的。 下面給出了兩種情況下的相對(duì)誤差: (1)假設(shè)樣本空間足夠大,則k≈N[3]=318,C點(diǎn)有R(26)=728,由圖1讀取s=1.75,由公式1②對(duì)其進(jìn)行布魯克斯求值得n=17.27,而該點(diǎn)實(shí)際的期刊數(shù)nc=26.00(表2),其相對(duì)誤差Δnc=|nc-n|=|26.00-17.27|=8.73,相對(duì)誤差率為Δnc/nc=33.58%。 (2)圖上讀取相對(duì)誤差:由圖1讀取C點(diǎn)的lnn=3.26,則n=26,二者進(jìn)行比較后發(fā)現(xiàn),Δn =|nβ-n|=|10.60-26|=15.40,相對(duì)誤差率為Δn/nβ=145.28%。 第一種情況表明,對(duì)于該實(shí)例k≈N是不成立的,即N并不是足夠大;第二種情況則顯示了兩個(gè)圖形讀取值的差別,兩種情況下的Δn值實(shí)際上都已遠(yuǎn)遠(yuǎn)超出了誤差涵義,顯示了布魯克斯模型在這個(gè)專業(yè)的應(yīng)用中其傳統(tǒng)的使用方法存在著缺陷,而出自同一模型的β圖形中T點(diǎn)的結(jié)果則表明布魯克斯公式本身并不存在這樣缺陷,僅有作圖及判斷誤差。這看起來(lái)似乎是矛盾的,實(shí)質(zhì)上這正說(shuō)明在兩段數(shù)學(xué)表達(dá)式中不同的段代表著不同的含義,這種顯著的差異也正是在狹窄專業(yè)中段的使用不合理所造成的,從而使得修正原先的布魯克斯模型使用方法有了依據(jù)。由于誤差是系統(tǒng)性的,因而誤差修正應(yīng)基于公式的計(jì)算結(jié)果。 3 獼猴桃核心期刊的計(jì)算與誤差修正 3.1 k值的求取 s是標(biāo)度學(xué)科專業(yè)范圍大小的指標(biāo),一般隨專業(yè)范圍的擴(kuò)大而擴(kuò)大[3],在圖1中,沿直線作延長(zhǎng)線交于橫軸A點(diǎn),A點(diǎn)所對(duì)應(yīng)的自然對(duì)數(shù)值即為s,這里讀取s=lnA=1.75,在誤差修正過(guò)程中,一經(jīng)讀取就一直假設(shè)該值沒有作圖誤差,是直線在橫軸上的截距(平移量)。 k值即布魯克斯圖形中直線部分的斜率,由于誤差因素,不能以任意描點(diǎn)的縱橫比來(lái)求取,而應(yīng)求取直線部分的每個(gè)描點(diǎn)的實(shí)際值,爾后再取其平均值,這樣會(huì)最大限度地縮小計(jì)算誤差與作圖誤差。直觀上看,圖1中的第15描點(diǎn)C是分界點(diǎn),即k值的計(jì)算從第15描點(diǎn)開始,到格魯斯下垂的分界點(diǎn)為止。由直線方程式R(n)=k(lnn-s)求取直線部分各描點(diǎn)的k值,列表3。k的平均值為: 3.2 n值相對(duì)誤差分析 當(dāng)期刊總數(shù)N充分大時(shí),N≈k[3],而目前的N=318 也正是對(duì)實(shí)體樣本空間進(jìn)行變換。設(shè)x為s值的倍數(shù),將各值和s=xlnA代入公式1得: R(26)=89n0.927 (1≤n≤26) ①ln(n/xlnA) (26≤n≤318)②(公式3) 其中,x即為布魯克斯圖形法修正系數(shù),該系數(shù)用于在布魯克斯模型的基礎(chǔ)上,對(duì)狹窄專業(yè)核心期刊的統(tǒng)計(jì)結(jié)果進(jìn)行修正。由于公式3①所對(duì)應(yīng)的圖形是布魯克斯的曲線部分,正常情況下合理分界點(diǎn)應(yīng)是右邊的端點(diǎn),因此,計(jì)算只要使用公式3②即可,也就是從不合理分界點(diǎn)C開始,按n的順序進(jìn)行。表4列出了通過(guò)公式3②計(jì)算得到的部分布魯克斯n值,s取0.80~1.90倍,對(duì)合理分界點(diǎn)的相對(duì)誤差為:δ=│nβ-n│=│10.60-n│,利用這一公式所獲得的最小誤差值所對(duì)應(yīng)的n值就是逆向推理的依據(jù),即利用β圖形所獲得的結(jié)果確定公式1中n的結(jié)果,再利用這個(gè)結(jié)果反向求取該方程式的一個(gè)因子x,這個(gè)x必須對(duì)應(yīng)于最小的δ。加入這一因子后,使布魯克斯公式可以直接在獼猴桃這個(gè)狹窄專業(yè)中應(yīng)用而不致產(chǎn)生錯(cuò)誤。適當(dāng)加密x值描點(diǎn)作圖3。 由表4和圖3可以看出,在計(jì)算和作圖誤差范圍內(nèi),當(dāng)獼猴桃專業(yè)載文期刊樣本空間擴(kuò)大為實(shí)體樣本空間的1.27倍(x=1.27)時(shí),所產(chǎn)生的相對(duì)誤差最小,為0.02246。 3.3 修正系數(shù)的應(yīng)用將x=1.27代入公式3②進(jìn)行應(yīng)用計(jì)算,即可將核心期刊數(shù)n修正到nβ,即: lnn=R(26)+lns=R(26)+ln(xlnA)=728466.63+ln(1.27×1.75)=2.3588 得此時(shí)獼猴桃專業(yè)核心期刊數(shù)為n=10.58≈11,這樣計(jì)算與區(qū)域法[4~7]所獲得的結(jié)果相符[4]。 4 結(jié)論 本文通過(guò)對(duì)獼猴桃專業(yè)載文核心期刊統(tǒng)計(jì)實(shí)例的研究,獲得了β圖形輔助分析法并逆推獲得了該專業(yè)布魯克斯圖形法修正系數(shù)x。從統(tǒng)計(jì)結(jié)束日開始,今后相當(dāng)長(zhǎng)的一段時(shí)間內(nèi),由于獼猴桃專業(yè)載文實(shí)體期刊樣本的增量極其微小,因而在該時(shí)間區(qū)段內(nèi)可將x視為一個(gè)常數(shù)使用,這為類似專業(yè)的應(yīng)用計(jì)算提供了新的量化依據(jù)。同時(shí)也顯示了β圖形、合理分界點(diǎn)T、不合理分界點(diǎn)C和布魯克斯圖形法修正系數(shù)x這4個(gè)定義的必要性,可以將其推廣到其它狹窄專業(yè)載文核心期刊的統(tǒng)計(jì)中去。本研究成果已為多篇文獻(xiàn)[4~7]的發(fā)表提供了支持,并得到了理想的統(tǒng)計(jì)結(jié)果,這些結(jié)果都得到了區(qū)域法的驗(yàn)證。本研究并不涉及布魯克斯模型本身是否存在缺陷問(wèn)題,而只是研究了該模型在獼猴桃這個(gè)狹窄專業(yè)載文核心期刊的統(tǒng)計(jì)中,其傳統(tǒng)的使用方法因段的使用不合理所產(chǎn)生的問(wèn)題,并給出了彌補(bǔ)的有效方法。這一實(shí)例研究進(jìn)一步證明了同一模型應(yīng)用于同一專業(yè),因計(jì)算作圖方法不同,其結(jié)果卻存在顯著差異的特征。 參 考 文 獻(xiàn): [1] 邱均平.信息計(jì)量學(xué)[M]. 武漢:武漢大學(xué)出版社,2000,315-316. [2] Brookes B C.Bradford’s law and the Bibliography of Science[J].Nature,1969,224:953-956. [3] 龐景安. 科學(xué)計(jì)量研究方法論[M]. 北京:科學(xué)技術(shù)文獻(xiàn)出版社, 2002,168-173. [4] 張 毅,孫玉剛. 1994~2002年獼猴桃專業(yè)研究文獻(xiàn)計(jì)量分析[J]. 中國(guó)農(nóng)學(xué)通報(bào), 2007,23(2):419-421. [5] 張 毅,杜方嶺. 1994~2002年杏專業(yè)研究文獻(xiàn)計(jì)量分析[J]. 農(nóng)業(yè)圖書情報(bào)學(xué)刊,2005,17(5):153-158. [6] 張 毅.1994~2002年山楂研究文獻(xiàn)計(jì)量分析[J]. 農(nóng)業(yè)圖書情報(bào)學(xué)刊,2004, 15(1):94-96. [7] 杜方嶺,張 毅. 1994~2002年核桃專業(yè)研究文獻(xiàn)計(jì)量分析[J]. 農(nóng)業(yè)圖書情報(bào)學(xué)刊,2005, 17(4):143-147. [8] 孫洪雁,蘇勝茂,王金政. 杏專業(yè)載文核心期刊布魯克斯誤差分析與修正[J]. 山東農(nóng)業(yè)大學(xué)學(xué)報(bào),2009,40(4):609-614. [9] 孫洪雁, 馬 青. 山楂專業(yè)載文核心期刊布魯克斯誤差分析與修正[J].圖書情報(bào)工作,2009,53(18):66-69,95. [10]許 群,顧大煒. 浙江省江山市發(fā)展特色農(nóng)產(chǎn)品的思考[N]. 人民日?qǐng)?bào)海外版,2001-11-05(5).