姜文澤 重慶郵電大學(xué)軟件工程學(xué)院
前言:軟件技術(shù)如今已經(jīng)在我們生活的各方各面中都得到了廣泛體現(xiàn),不過從可控性來說,軟件技術(shù)可控性并不顯著。軟件在應(yīng)用時會出現(xiàn)大量的數(shù)據(jù),這些數(shù)據(jù)有著很高的價值。對開發(fā)軟件的企業(yè)來說,合理運(yùn)用數(shù)據(jù)挖掘這項技術(shù),能夠?qū)崿F(xiàn)數(shù)據(jù)信息的再利用。在系統(tǒng)故障時及時處理故障問題,進(jìn)而提高企業(yè)受益。
數(shù)據(jù)挖掘即從混亂、復(fù)雜、大量的數(shù)據(jù)資料中獲得所需數(shù)據(jù)信息,實現(xiàn)利潤的再創(chuàng)造。數(shù)據(jù)挖掘事實上是多種技術(shù)的統(tǒng)稱,包括多層次的數(shù)據(jù)挖掘、數(shù)據(jù)可視化挖掘、準(zhǔn)確性數(shù)據(jù)挖掘、專用數(shù)據(jù)挖掘等等。
多層次的數(shù)據(jù)挖掘指的是通過交互形式或動態(tài)變化的方式獲取數(shù)據(jù)資源[1]。
數(shù)據(jù)可視化挖掘指的是通過特殊的技術(shù)與方式,實現(xiàn)挖掘數(shù)據(jù)的可視化處理與顯示。
準(zhǔn)確性數(shù)據(jù)挖掘即為用戶提供精準(zhǔn)的數(shù)據(jù)信息,提高數(shù)據(jù)應(yīng)用價值[2]。
專用數(shù)據(jù)挖掘指的是從不同系統(tǒng)中獲取信息資源,在不同數(shù)據(jù)庫中完成信息處理。
軟件工程信息數(shù)據(jù)復(fù)雜、種類較多[3]。人們一般將軟件工程數(shù)據(jù)分為兩類,一類是結(jié)構(gòu)化數(shù)據(jù),另一類則是非結(jié)構(gòu)數(shù)據(jù)。軟件代碼會對非結(jié)構(gòu)數(shù)據(jù)處理起到明顯的作用,版本信息則會對結(jié)構(gòu)化數(shù)據(jù)造成深刻的影響。結(jié)構(gòu)化與非結(jié)構(gòu)化兩種數(shù)據(jù)之間存在著密切的聯(lián)系。合理利用數(shù)據(jù)資源即通過特殊的技術(shù)從結(jié)構(gòu)化與非結(jié)構(gòu)化兩種數(shù)據(jù)找到相似的規(guī)律。通過對兩種數(shù)據(jù)的處理與整合,能夠提高軟件工程數(shù)據(jù)資源有效性。
借助于數(shù)據(jù)挖掘,人們能夠從龐大的數(shù)據(jù)信息中獲得最有價值的結(jié)果,但由于缺少統(tǒng)一的標(biāo)準(zhǔn),目前的軟件信息出現(xiàn)了較為復(fù)雜的情況。如信息標(biāo)書存有差異,致使信息獲取者并不能合理應(yīng)用與對比數(shù)據(jù)信息。
在開發(fā)軟件時候會應(yīng)用到大量的源代碼,這些源代碼數(shù)量龐大,對軟件開源有著重大意義。此時可以使用數(shù)據(jù)挖掘技術(shù)將所需的源代碼挖掘出來,降低軟件開發(fā)難度,提高軟件開發(fā)效率和軟件開發(fā)質(zhì)量。
工作人員在管理軟件時,會遇到大量的數(shù)據(jù)信息,不論是使用這些數(shù)據(jù)信息,還是處理這些數(shù)據(jù)信息都是一項比較繁重的工作。所以數(shù)據(jù)挖掘在軟件管理中同樣有著重要作用。人力資源的調(diào)配與分析對軟件管理來說等同于數(shù)據(jù)管理的過程。大規(guī)模軟件工程開發(fā)的人員結(jié)構(gòu)非常復(fù)雜,為合理的調(diào)配和分析人力資源就必須使用數(shù)據(jù)挖掘技術(shù)處理和挖掘相關(guān)信息,降低時間成本和人力成本。
數(shù)據(jù)挖掘還能夠便捷、高效的檢測軟件故障。實現(xiàn)軟件測試、軟件故障原因搜集、數(shù)據(jù)清理和轉(zhuǎn)換。在實際操作的過程中,數(shù)據(jù)挖掘會對系統(tǒng)內(nèi)部的數(shù)據(jù)進(jìn)行合理選擇、抽取與采集,準(zhǔn)確描述與定位系統(tǒng)漏洞和故障。在加快故障處理效率的同時,降低系統(tǒng)的維護(hù)成本。
在軟件工程中,數(shù)據(jù)庫有著重要的作用。數(shù)據(jù)庫能夠為軟件開發(fā)與應(yīng)用提供數(shù)據(jù)存儲,具體體現(xiàn)為源數(shù)據(jù)獲取、處理與管理等工作。數(shù)據(jù)庫建模能夠?qū)?shù)據(jù)構(gòu)建為合理、安全的數(shù)據(jù)庫,包括可行性報告、軟件信息、用戶信息等內(nèi)容。
軟件工程在運(yùn)行中所產(chǎn)生的數(shù)據(jù)信息,同樣會對企業(yè)管理軟件項目、開發(fā)軟件項目有重大影響。挖掘軟件執(zhí)行記錄,就是在分析執(zhí)行記錄對之進(jìn)行逆向的建模工作,從而達(dá)到了解程序、維護(hù)程序的目的。
數(shù)據(jù)挖掘在版本信息中的應(yīng)用,必須確保項目參與檔案相同。這樣才能夠更加方便的獲取數(shù)據(jù)信息,為系統(tǒng)更新提供便利。在系統(tǒng)管理和開發(fā)軟件的過程中使用版本信息是非常尋常的事情。利用不同版本信息,能夠獲得不同的信息數(shù)據(jù)資源。通過所獲取的信息數(shù)據(jù)檢查系統(tǒng)的問題和漏洞。隨著近些年數(shù)據(jù)挖掘在軟件工程的應(yīng)用越來越普遍,軟件技術(shù)員的系統(tǒng)把控能力也在不斷的加強(qiáng),這在某些程度上推動了軟件行業(yè)的發(fā)展。
數(shù)據(jù)挖掘在軟件工程中有著極高的應(yīng)用價值。強(qiáng)化數(shù)據(jù)挖掘能力,推動數(shù)據(jù)挖掘進(jìn)步,對軟件工程應(yīng)用和發(fā)展有著深遠(yuǎn)的意義。在數(shù)據(jù)挖掘這項技術(shù)的應(yīng)用范疇越來越廣泛的今天,挖掘技術(shù)也需要不斷的研發(fā)與探究,只有這樣挖掘技術(shù)才能夠在軟件工程中發(fā)揮更大的價值,為軟件工程提供更加穩(wěn)定、可靠的能力。