亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        開源項(xiàng)目活躍度模型構(gòu)建及實(shí)證

        2021-07-24 09:29:50楊欣捷江一鳴
        關(guān)鍵詞:貢獻(xiàn)者鏡像開發(fā)者

        楊欣捷,田 蜜,江一鳴

        (上海浦東發(fā)展銀行股份有限公司,上海200000)

        0 引言

        開源軟件(Open Source Software,OSS)是一種源代碼開放的軟件,作為一種有效的軟件開發(fā)模式,已經(jīng)獲得了極大的普及[1],為幾乎所有領(lǐng)域的應(yīng)用程序提供了動(dòng)力。開源已經(jīng)出現(xiàn)了一個(gè)大發(fā)展的趨勢(shì)[2]。代碼倉(cāng)庫(kù)與活躍用戶數(shù)都在高速增長(zhǎng);項(xiàng)目覆蓋面越來越廣,占據(jù)著各領(lǐng)域的主要市場(chǎng)份額;參與開源的企業(yè)數(shù)量保持穩(wěn)定增長(zhǎng)并呈現(xiàn)主動(dòng)開源趨勢(shì)[3]。顯然開源正以它開放共享、合作共贏的特點(diǎn)吞沒著整個(gè)世界。

        在開源高速發(fā)展和國(guó)家自主安全的發(fā)展戰(zhàn)略影響下,不少企業(yè)愿意選擇開源軟件,期望使用開源軟件的企業(yè)從59%迅速提升至77%,而那些已經(jīng)使用了開源軟件的企業(yè)也在加大其使用廣度和深度[2]。開源軟件以社區(qū)形式開展開發(fā)工作,社區(qū)內(nèi)的成員可以自由、開放地交流溝通、共享經(jīng)驗(yàn)、參與協(xié)作。分析社區(qū)中開源項(xiàng)目的活躍度,挖掘開發(fā)者和企業(yè)組織在整個(gè)開源產(chǎn)業(yè)中的表現(xiàn),有利于剖析國(guó)內(nèi)外開源現(xiàn)狀,為企業(yè)開源項(xiàng)目選型提供參考,為企業(yè)數(shù)字化轉(zhuǎn)型賦能。

        1 研究現(xiàn)狀

        圍繞開源主題的研究得到了廣大學(xué)者的關(guān)注,成為一大研究熱點(diǎn)。學(xué)者們分別從開源現(xiàn)狀、開源社區(qū)、開發(fā)者等角度進(jìn)行了研究。對(duì)開源現(xiàn)狀的剖析,如劉凱等對(duì)開源軟件產(chǎn)業(yè)的發(fā)展現(xiàn)狀及趨勢(shì)進(jìn)行了研究[4]。對(duì)開源社區(qū)的探究,如ECKERT R等對(duì)開源社區(qū)的組織間聯(lián)系進(jìn)行了研究,發(fā)現(xiàn)傾向于控制其所有資源的開源社區(qū)屬于自主組織[5]。對(duì)開發(fā)者的研究,如MENEEIY A等利用開發(fā)者的網(wǎng)絡(luò)關(guān)系成功預(yù)測(cè)項(xiàng)目可能出現(xiàn)的缺陷[6]。而針對(duì)開源項(xiàng)目活躍度的研究尚處于起步階段。劉雅新、吳高艷等結(jié)合復(fù)雜網(wǎng)絡(luò)理論與軟件開發(fā)實(shí)踐,以開源社區(qū)中開發(fā)者合作行為為研究取向,分析開發(fā)者在社區(qū)中的活躍度變化情況[7]。華東師范大學(xué)Xlab從社區(qū)披露數(shù)據(jù)出發(fā),考慮了拉取請(qǐng)求(pull request,pr)、問題(issue)和評(píng)論(comment)等多個(gè)指標(biāo),獲取開源項(xiàng)目活躍度,剖析開源現(xiàn)狀[8]。Grank項(xiàng)目活躍度分析工具,以pr、提交暫存(commit)和貢獻(xiàn)者(contributor)為指標(biāo),計(jì)算GitHub上開源項(xiàng)目的活躍度。浦發(fā)銀行利用開源項(xiàng)目活躍度算法,在開源軟件選型中提供重要參考。

        1.1 浦發(fā)銀行開源項(xiàng)目活躍度評(píng)估算法

        浦發(fā)銀行開源治理平臺(tái)活躍度模型(式1)是從開發(fā)者commit代碼的角度去考慮項(xiàng)目的活躍度,但實(shí)際上項(xiàng)目的活躍度還體現(xiàn)在issue提交數(shù)、pr數(shù)、評(píng)論數(shù)等。以chartjs/Chart.js為例,commit有3 118條,pr有5 072條,issue有2 184條,評(píng)論有高達(dá)3萬(wàn)條,所以除了commit以外,pr、issue和評(píng)論均可體現(xiàn)活躍度,因此只考慮commit提交數(shù)存在局限性。

        式中,Ar為項(xiàng)目活躍度;Ccommit_one_month為近一個(gè)月的暫存提交數(shù);Ccommit_three_month為近三個(gè)月的暫存提交數(shù);Ccommit_six_month為近半年的暫存提交數(shù);Ccommit_twelve_month為近一年的暫存提交數(shù);?、β、δ、γ為權(quán)重。

        1.2 Xlab開源項(xiàng)目活躍度評(píng)估算法

        Xlab活躍度計(jì)算模型(式(2)、式(3))是從產(chǎn)生活躍度的開發(fā)者角度出發(fā),更為全面地考慮了pr、issue和comment等多個(gè)因素,但未考慮到時(shí)間衰減因素,以及GitHub鏡相類項(xiàng)目關(guān)閉了pr和issue功能。

        式中,Au為開發(fā)者活躍度;Cissue_comment為問題評(píng)論數(shù);Copen_issue為問題數(shù);Copen_pr為拉取請(qǐng)求數(shù);Crevirew_comment為評(píng)審評(píng)論數(shù);pr_merged為拉取請(qǐng)求合并數(shù);Ar為項(xiàng)目活躍度。

        1.3 Grank項(xiàng)目活躍度分析工具

        Grank項(xiàng)目活躍度評(píng)估算法將項(xiàng)目的提交數(shù)、拉取請(qǐng)求數(shù)和貢獻(xiàn)者數(shù)作為主要因素,分析項(xiàng)目的活躍度變化的趨勢(shì)和幅度。

        綜上,當(dāng)前關(guān)于開源項(xiàng)目活躍度評(píng)估算法選取的指標(biāo)各異。同時(shí),不同類別的開源項(xiàng)目活躍度分析角度是否存在差異,一段周期內(nèi)的活躍度是否受時(shí)間因素的影響,目前均尚無結(jié)論。本文將從這兩個(gè)問題出發(fā)構(gòu)建活躍度模型,完善開源項(xiàng)目活躍度研究。

        2 模型構(gòu)建

        2.1 構(gòu)建原理

        新模型的構(gòu)建原理主要是對(duì)前文提到的“浦發(fā)模型”和“Xlab模型”各自優(yōu)點(diǎn)的融合,并且針對(duì)前文提到的“鏡相類項(xiàng)目”和“時(shí)間衰減”兩個(gè)因素進(jìn)行了優(yōu)化。以下針對(duì)這兩個(gè)因素進(jìn)行具體分析。

        2.1.1 鏡相類項(xiàng)目的活躍度

        以GitHub上的項(xiàng)目作為樣本,發(fā)現(xiàn)存在從私庫(kù)同步至GitHub上的鏡像類項(xiàng)目。通過查找GitHub上的其他鏡像類項(xiàng)目樣本并進(jìn)行統(tǒng)計(jì)(如圖1所示),可以看出鏡像類項(xiàng)目的共同點(diǎn)有:第一,pr和issue數(shù)量很少;第二,pr、issue和comment貢獻(xiàn)者在總貢獻(xiàn)者中占比不大;第三,commit貢獻(xiàn)者在總貢獻(xiàn)者中占比較大;第四,commit貢獻(xiàn)者進(jìn)行了多次的代碼提交。進(jìn)一步訪問各鏡像類項(xiàng)目的GitHub地址,發(fā)現(xiàn)有些項(xiàng)目明確標(biāo)注了關(guān)閉pr和issue功能,可見鏡像類項(xiàng)目的特點(diǎn)是僅在GitHub上同步,進(jìn)行少量的pr和issue。

        圖1 鏡像類項(xiàng)目行為指標(biāo)匯總

        Xlab模型在計(jì)算開發(fā)者活躍度時(shí)僅依托于pr、issue和comment貢獻(xiàn)者,但是產(chǎn)生活躍度的開發(fā)者行為不止表現(xiàn)在pr、issue和comment,所以Xlab模型無法全面體現(xiàn)鏡像類項(xiàng)目的開發(fā)者活躍度,故結(jié)果會(huì)產(chǎn)生偏差。為了能更好地看出差別,引入一些非鏡像類項(xiàng)目,基本信息如圖2所示。

        圖2 非鏡像類項(xiàng)目行為指標(biāo)匯總

        將鏡像類項(xiàng)目和非鏡像類項(xiàng)目做兩兩對(duì)比,如圖3所示,此樣本中鏡像類項(xiàng)目產(chǎn)生活躍度的貢獻(xiàn)者數(shù)量基本上比非鏡像類項(xiàng)目多,且進(jìn)行的貢獻(xiàn)行為次數(shù)也基本上比非鏡像類項(xiàng)目多,有理由猜測(cè)鏡像類項(xiàng)目活躍度并不低。

        圖3 鏡像類、非鏡像類項(xiàng)目行為指標(biāo)匯總

        基于以上猜想,以一個(gè)鏡像類和一個(gè)非鏡像類為一個(gè)組,共10組,每組項(xiàng)目分別利用Xlab模型和浦發(fā)模型計(jì)算活躍度,鏡像類和非鏡像類活躍度大小關(guān)系完全相反,匯總活躍度如圖4所示。在對(duì)于鏡相類項(xiàng)目的活躍度評(píng)估中,浦發(fā)模型考慮了commit因素,顯然更能準(zhǔn)確反映鏡相類項(xiàng)目的活躍度。但由于其未考慮pr、issue和comment等其他因素,其模型效果也有提高空間。

        圖4 鏡像類、非鏡像類項(xiàng)目的Xlab和Spdb模型活躍度對(duì)比

        2.1.2 一段周期內(nèi)的階段性活躍度

        僅對(duì)項(xiàng)目一段周期內(nèi)總活躍度進(jìn)行橫向?qū)Ρ仁遣粔虻?,?duì)項(xiàng)目在一段周期內(nèi)的活躍度變化趨勢(shì)進(jìn)行分析則更具意義。對(duì)樣本項(xiàng)目(2019年3月至2020年3月)這一年期間每個(gè)月的GitHub日志進(jìn)行統(tǒng)計(jì),分析各個(gè)項(xiàng)目活躍度變化趨勢(shì),如圖5所示,各個(gè)項(xiàng)目的活躍度變化趨勢(shì)各不同,有的呈現(xiàn)波動(dòng)趨勢(shì),如996icu/996.ICU;有的比較平穩(wěn),如twbs/bootstrap、github/gitignore和mrdoob/three.js等。

        圖5 項(xiàng)目月活躍度匯總

        現(xiàn)對(duì)996icu/996.ICU和mrdoob/three.js的開發(fā)者活躍度進(jìn)行具體分析,2019年3月至2020年3月期間996icu/996.ICU開發(fā)者人數(shù)為1 263人,mrdoob/three.js開發(fā)者人數(shù)為1 690人,具體分布見圖6,顯然996icu/996.ICU這一年來僅在2019年3月和4月開發(fā)者較多(488人、627人)、貢獻(xiàn)較大,而mrdoob/three.js開發(fā)者較為平穩(wěn)地活躍。

        圖6 單個(gè)項(xiàng)目活躍度周期內(nèi)變化規(guī)律

        觀測(cè)2019年3月至2020年3月期間每一個(gè)月的項(xiàng)目活躍度變化,如表1所示,容易看出,996icu/996.ICU在2019年3月、4月活躍度很高,5月之后出現(xiàn)明顯降低趨勢(shì),而mrdoob/three.js呈現(xiàn)持續(xù)平穩(wěn)態(tài)勢(shì)。

        表1 項(xiàng)目活躍度變化匯總

        對(duì)比兩個(gè)項(xiàng)目這一年總的活躍度(表2)發(fā)現(xiàn),996icu/996.ICU活躍度比mrdoob/three.js高。同時(shí)利用浦發(fā)銀行開源治理平臺(tái)活躍度模型(式(3))計(jì)算兩者的活躍度,結(jié)果為:996icu/996.ICU(314.800 000)、mrdoob/three.js(2 056.500 000),996icu/996.ICU活躍度比mrdoob/three.js低。究其原因,Xlab活躍度模型未考慮時(shí)間因素對(duì)活躍度的影響,使得活躍度趨勢(shì)波動(dòng)較大的項(xiàng)目的整體活躍度有異。

        表2 項(xiàng)目總活躍度

        2.2 構(gòu)建模型

        通過前文的模型計(jì)算實(shí)踐,可以得出結(jié)論:(1)GitHub鏡像類項(xiàng)目大都關(guān)閉提交issue的功能,對(duì)于pr也有限制。Xlab模型未考慮commit變量,因GitHub上存在大量關(guān)閉issue和PR的鏡像類項(xiàng)目,該模型無法有效體現(xiàn)項(xiàng)目活躍度。(2)Xlab模型未考慮時(shí)間衰減因素,不能很好反映發(fā)布時(shí)參與者較多,后勁不足的項(xiàng)目的實(shí)際活躍情況。(3)浦發(fā)模型僅考慮了commit變量,未納入issue和pr等其他因素,模型結(jié)果全面性有待提高。

        為解決以上問題,在Xlab模型基礎(chǔ)上,引入commit變量和衰減函數(shù),形成修正后模型(式(4)~式(6))。

        式中,c為初始值(將為100%)或全權(quán)重;e為自然對(duì)數(shù);k為衰減常數(shù),對(duì)于所需的曲線為0.05;t為月份。Cissue_comment為問題評(píng)論數(shù);Copen_issue為問題數(shù);Copen_pr為拉取請(qǐng)求數(shù);Crevirew_comment為評(píng)審評(píng)論數(shù);Cpr_merged為拉取請(qǐng)求合并數(shù);Ccommit為暫存提交數(shù);Aut是開發(fā)者在t月的活躍度;Au是一段時(shí)間內(nèi)的總開發(fā)者活躍度;Ar是一段時(shí)間內(nèi)的項(xiàng)目活躍度。

        3 模型實(shí)證

        隨著金融行業(yè)開源生態(tài)的日益成熟,加上數(shù)字化生態(tài)銀行轉(zhuǎn)型的需求,越來越多的應(yīng)用系統(tǒng)構(gòu)建在了開源軟件之上,為此浦發(fā)銀行探索了一套開源治理體系。為自主、高效、安全地使用開源軟件提供技術(shù)上和制度上的支持,為提升管理效能,浦發(fā)銀行自研了開源軟件管理平臺(tái),覆蓋了開源軟件治理四個(gè)主要的流程,引入評(píng)估、使用、安全漏洞持續(xù)評(píng)估和生命周期持續(xù)評(píng)估,做到軟件使用有跡可循,實(shí)現(xiàn)介質(zhì)來源可控,防范開源軟件帶來的安全問題。

        現(xiàn)以浦發(fā)銀行開源治理平臺(tái)為例,選取了平臺(tái)引入的軟件,以前文構(gòu)建的活躍度模型進(jìn)行評(píng)價(jià)。以一個(gè)平穩(wěn)類和一個(gè)波動(dòng)類為一個(gè)組,一個(gè)鏡像類和一個(gè)非鏡像類為一個(gè)組,每組項(xiàng)目分別利用Xlab活躍度模型、浦發(fā)活躍度模型和修正后活躍度模型計(jì)算活躍度。Xlab模型與修正后模型計(jì)算出的每組活躍度大小關(guān)系基本完全相反,浦發(fā)模型與修正后模型計(jì)算出的每組活躍度大小關(guān)系基本趨同,如圖7所示。修改后的模型在一定程度上抹平了活躍度趨勢(shì)波動(dòng)較大項(xiàng)目的整體活躍度,同時(shí)也提高了鏡像類項(xiàng)目的活躍度。

        圖7 活躍度結(jié)果對(duì)比

        對(duì)Xlab活躍度模型、浦發(fā)活躍度模型與修正后的活躍度模型的計(jì)算結(jié)果進(jìn)行相關(guān)性分析,如表3所示。第一,修正后的活躍度模型與Xlab活躍度模型不相關(guān),與浦發(fā)活躍度模型相關(guān)。說明修正后的活躍度模型與浦發(fā)活躍度模型結(jié)果趨同,區(qū)別只是浦發(fā)活躍度模型未考慮pr、issue和comment等能產(chǎn)生活躍度的因素。第二,Xlab活躍度模型與浦發(fā)活躍度模型不相關(guān),與修正后的活躍度模型也不相關(guān)。進(jìn)一步剔除鏡像類項(xiàng)目后,結(jié)果如表4所示。Xlab活躍度模型與浦發(fā)活躍度模型相關(guān),與修正后的活躍度模型也相關(guān)。說明雖然Xlab活躍度模型考慮的影響因素很全面,但仍在鏡像類項(xiàng)目活躍度的計(jì)算上存在偏差。同時(shí)結(jié)合平穩(wěn)類和波動(dòng)類項(xiàng)目來看,Xlab模型又未考慮時(shí)間因素,修正后的活躍度模型考慮了時(shí)間權(quán)重因素。綜上,修正后的活躍度模型同時(shí)具備了Xlab活躍度模型與浦發(fā)活躍度模型的優(yōu)勢(shì),從更全面的角度去反映項(xiàng)目活躍度。

        表3 模型結(jié)果相關(guān)性分析

        表4 模型結(jié)果相關(guān)性分析(非鏡像類)

        4 結(jié)論

        目前針對(duì)開源項(xiàng)目活躍度的評(píng)估算法研究尚處于起步階段,考慮的影響因素不同,且未考慮鏡像類項(xiàng)目特點(diǎn)和時(shí)間權(quán)重因素對(duì)活躍度的影響。本文對(duì)浦發(fā)銀行和Xlab活躍度評(píng)估算法進(jìn)行了探索,結(jié)合鏡像類項(xiàng)目特點(diǎn)、時(shí)間權(quán)重因素,將pr、issue、comment和commit等參數(shù)和衰減函數(shù)融合,形成修正后模型,該模型能更好地反映項(xiàng)目活躍度。針對(duì)企業(yè)而言,探索開源社區(qū)的行為規(guī)律,剖析開源項(xiàng)目活躍度算法,能夠在企業(yè)開源項(xiàng)目的選擇上提供一定的參考價(jià)值。對(duì)開源社區(qū)和開源項(xiàng)目而言,需要提高社區(qū)服務(wù)質(zhì)量,確保社區(qū)成員來源多樣化,提高開發(fā)人員的貢獻(xiàn)力度,進(jìn)而提高整個(gè)項(xiàng)目的活躍度,促成良性循環(huán)。

        猜你喜歡
        貢獻(xiàn)者鏡像開發(fā)者
        鏡像
        從“學(xué)習(xí)者”到“貢獻(xiàn)者”:中國(guó)管理學(xué)發(fā)展的路徑
        “‘一國(guó)兩制’杰出貢獻(xiàn)者”國(guó)家榮譽(yù)稱號(hào)
        現(xiàn)當(dāng)代文化貢獻(xiàn)者——布赫賀希格
        鏡像
        小康(2018年23期)2018-08-23 06:18:52
        一種交互式事件常識(shí)知識(shí)的獲取方法
        16%游戲開發(fā)者看好VR
        CHIP新電腦(2016年3期)2016-03-10 13:06:42
        iOS開發(fā)者調(diào)查
        電腦迷(2015年8期)2015-05-30 12:27:10
        iOS開發(fā)者調(diào)查
        電腦迷(2015年4期)2015-05-30 05:24:09
        鏡像
        小康(2015年4期)2015-03-31 14:57:40
        天堂av在线美女免费| 欧美国产日本高清不卡| 国产欧美精品在线一区二区三区| 日韩欧美亚洲国产一区二区三区| 亚洲国产精品第一区二区三区| 日韩亚洲精选一区二区三区| 白白色发布的在线视频| 粉嫩小泬无遮挡久久久久久| 久久夜色精品国产噜噜麻豆| 国内少妇自拍区免费视频| 亚洲国产精品午夜电影| 国内精品女同一区二区三区| 国产精品成人av一区二区三区| 日韩经典午夜福利发布| 国产精品igao视频网| 98精品国产综合久久| av是男人的天堂免费| 日本熟女精品一区二区三区| 国产 麻豆 日韩 欧美 久久| 免费国产交换配乱淫| 亚洲av粉嫩性色av| 日本激情网站中文字幕| 久久久无码精品亚洲日韩蜜臀浪潮| 大地资源中文在线观看官网第二页| 婷婷激情五月综合在线观看| 97久久综合精品国产丝袜长腿| 久久国产人妻一区二区| 免费人成无码大片在线观看 | 人妻久久999精品1024| 日本小视频一区二区三区| 一本色道无码不卡在线观看| 色拍自拍亚洲综合图区| 亚洲av色先锋资源电影网站| 亚洲色偷偷综合亚洲AVYP| 高清不卡av在线播放| 日本h片中文字幕在线| 亚洲妇女无套内射精| 精品乱码久久久久久中文字幕| 日韩国产欧美成人一区二区影院| 区二区三区亚洲精品无| 国产一区二区三区在线蜜桃|