◆張立鑒
?
數(shù)據(jù)挖掘技術在軟件工程中的應用研究
◆張立鑒
(保山中醫(yī)藥高等??茖W校 云南 678000)
隨著社會經(jīng)濟的快速發(fā)展,計算機軟件對現(xiàn)代生產(chǎn)生活產(chǎn)生了非常重要的促進作用。通過在軟件工程中應用數(shù)據(jù)挖掘技術,不僅能夠提高軟件工程的開發(fā)質(zhì)量,還能夠有效整合軟件工程開發(fā)過程中存在的問題積極進行分析,促進軟件工程的開發(fā)水平的進步。本文探討了數(shù)據(jù)挖掘技術在軟件工程中的應用,供相關讀者參考。
軟件工程;數(shù)據(jù)挖掘技術;應用研究
數(shù)據(jù)挖掘技術的發(fā)展雖然不長,但發(fā)展迅速,它受到了各個領域的歡迎,促進了分析技術的發(fā)展。目前,計算機數(shù)據(jù)挖掘技術已廣泛應用于市場營銷、金融投資等領域,極大地滿足了市場的實際需求。
在計算機數(shù)據(jù)挖掘技術中,技術的結(jié)合是傳統(tǒng)技術與先進技術的結(jié)合。在計算機數(shù)據(jù)挖掘的發(fā)展過程中,應注意以下幾點:第一,應注意傳統(tǒng)統(tǒng)計方法的應用。采用傳統(tǒng)統(tǒng)計方法的原因是該方法所需數(shù)據(jù)較少,只選取幾個有代表性的數(shù)據(jù)。同時,通過對數(shù)據(jù)的分析和分析,提高了數(shù)據(jù)分析的效率。第二,注意可視化技術的應用。為了突出了數(shù)據(jù)的特點,可以使用圖表等方式顯示數(shù)據(jù),在可視化技術的作用下,清楚地看到數(shù)據(jù)的實際情況。第三,在線分析與處理的應用。使用它可以順利完成數(shù)據(jù)分析,用戶不僅可以主動分析數(shù)據(jù),還可以完成分析算法的選擇,了解網(wǎng)絡影響下數(shù)據(jù)的真實情況。
隨著數(shù)據(jù)挖掘技術的快速發(fā)展,對軟件工程的促進作用十分明顯,尤其是在銀行、運輸、保險、零售等行業(yè)通過數(shù)據(jù)挖掘技術可以有效地提高軟件的使用性能。首先,數(shù)據(jù)挖掘技術可以用于軟件開發(fā)規(guī)劃,為軟件產(chǎn)品的質(zhì)量控制提供重要的參考。通過合理、準確地規(guī)劃軟件開發(fā)過程中各種能源的消耗,準確地預測開發(fā)過程,可以避免較大的差距。如果出現(xiàn)錯誤,可以及時改進,保證軟件產(chǎn)品的質(zhì)量。其次,數(shù)據(jù)挖掘技術可以為軟件學習型組織的構建提供基礎。在過去的軟件項目開發(fā)過程中必須以項目事件為參考,但由于知識和經(jīng)驗的積累首先要通過實際問題的測試,數(shù)據(jù)挖掘技術可以利用比較分析的能力發(fā)現(xiàn)實際問題的共性,并以共性為項目經(jīng)驗,提高軟件開發(fā)的效率。通過軟件開發(fā)及數(shù)據(jù)挖掘技術的應用,可以為后續(xù)的操作和維護提供幫助。因為軟件開發(fā)很容易受到各種因素的影響,導致變更必須及時解決,通過數(shù)據(jù)挖掘軟件就會避免風險,并尋找一個積極的解決策略,也可以提高軟件開發(fā)的效率和管理,加強對項目的科學決策。例如,數(shù)據(jù)挖掘可以有效地分析軟件的具體應用方式,解決軟件故障,實現(xiàn)軟件的綜合管理。
數(shù)據(jù)挖掘技術在軟件工程中的應用已有20多年的歷史。隨著科學技術的不斷進步,數(shù)據(jù)挖掘技術的應用越來越廣泛,如數(shù)據(jù)挖掘技術在銀行業(yè)、保險業(yè)、交通運輸業(yè)和零售業(yè)的應用。
軟件工程版本控制信息挖掘是軟件工程領域應用最廣泛的數(shù)據(jù)挖掘技術之一。版本控制軟件工程是開發(fā)人員在軟件開發(fā)過程中對編輯信息的統(tǒng)一管理。它確保在軟件開發(fā)過程中,所有數(shù)據(jù)軟件工程都能得到一致的更新。保證軟件開發(fā)質(zhì)量,積極開發(fā)軟件項目任務,是軟件工程的重要途徑。數(shù)據(jù)挖掘技術在軟件工程系統(tǒng)版本信息控制技術的應用中,應重點研究軟件開發(fā)變更信息中的數(shù)據(jù)挖掘。對同一軟件平臺下不同應用的深入分析和探索,模塊關系的存在或差異,可以更有效地分析和預測軟件工程系統(tǒng)模塊在未來實際應用中的潛在脆弱性,以及未來可能的軟件工程開發(fā)分析。
軟件執(zhí)行記錄挖掘是數(shù)據(jù)挖掘中最重要的應用之一。將數(shù)據(jù)挖掘技術應用于軟件執(zhí)行記錄。對于軟件系統(tǒng)的執(zhí)行路徑,不同的軟件模塊代碼與大數(shù)據(jù)分析或不同的軟件之間存在著相同的關系。在軟件執(zhí)行記錄中應用數(shù)據(jù)挖掘技術的實質(zhì)是深入實現(xiàn)路徑跟蹤軟件系統(tǒng),以實現(xiàn)逆向建模的目的,從而更好地跟蹤、分析、維護現(xiàn)有代碼中使用的軟件系統(tǒng),保證軟件工程的穩(wěn)定性。
數(shù)據(jù)挖掘技術的一大優(yōu)點就是可以檢測軟件漏洞,可以保證數(shù)據(jù)的安全性和穩(wěn)定性,檢測軟件自身的程序漏洞,在錯誤發(fā)生前就可以通過自身修復漏洞,保證軟件的安全性和穩(wěn)定性。一般數(shù)據(jù)挖掘技術在進行軟件的檢測時,首先根據(jù)軟件的自身特點進行調(diào)整,在滿足用戶基本需求的前提條件下,進一步確定軟件的測評手段和測評方式。其次根據(jù)前期確定的測評方式,排查和修復軟件的數(shù)據(jù)錯誤,對數(shù)據(jù)進行加密和保護處理。對軟件需要的后臺信息進行相應的處理,定期清除后臺冗余數(shù)據(jù),過濾長時間運行出現(xiàn)的數(shù)據(jù),保留有用和必要的關鍵信息,保證軟件安全穩(wěn)定地運行。在建模過程中,針對數(shù)據(jù)的特性和大小選擇數(shù)據(jù)模型,通過多方面對比和驗證,保證信息安全和真實。根據(jù)軟件的不同用途,結(jié)合項目的實際需求采用對應的數(shù)據(jù)挖掘方式,比較多方面的數(shù)據(jù)信息,找到最合理并且最貼切的數(shù)據(jù)挖掘方式,這樣才可以帶給用戶最優(yōu)的軟件使用體驗。
在軟件工程項目開發(fā)過程中,程序設計不可避免地會出現(xiàn)一些漏洞,或因編程人員的操作失誤,使軟件功能受到影響。需要對軟件故障問題進行快速定位和檢測,從而盡快對程序代碼加以完善,確保各項功能的正常發(fā)揮。采用數(shù)據(jù)挖掘技術主要通過對信息進行跟蹤檢測,或采用逆向建模方法,及時發(fā)現(xiàn)軟件故障問題,提高程序的可維護性。
傳統(tǒng)的定位軟件故障的方法是用程序切片方法,但是這個方法不太可靠,常常導致不準確的定位。之后的傳統(tǒng)定位方法不斷完善,現(xiàn)在更成功的是通過將成功的操作與故障操作相比,確定斷層的起源之間的區(qū)別,并通過近鄰查詢故障定位的方法。這些新的數(shù)據(jù)挖掘技術的使用極大地提高了軟件問題檢查的能力和準確性。
數(shù)據(jù)挖掘技術可以在應用上進行分類。在工作之前,我們可以對模型進行分析,然后根據(jù)一定的規(guī)則收集數(shù)據(jù),方便后續(xù)的應用。在數(shù)據(jù)挖掘中,我們可以更詳細地將數(shù)據(jù)信息劃分為不同的類別。數(shù)據(jù)挖掘技術中使用的關聯(lián)方法是海量數(shù)據(jù)信息之間的連接,類似于軟件工程代碼克隆。軟件工程的數(shù)據(jù)檢索功能是原始的數(shù)據(jù)挖掘方法。數(shù)據(jù)挖掘過程包括數(shù)據(jù)輸入、搜索和內(nèi)容分析,軟件工程數(shù)據(jù)輸入過程是修改后的數(shù)據(jù)輸入程序,用戶可以下載軟件工程的數(shù)據(jù),同時會有一個下載記錄,這樣我們可以很容易地找到相關的客戶信息。
數(shù)據(jù)挖掘在軟件工程中的應用具有很大的實用價值。加強數(shù)據(jù)挖掘技能研討對促進軟件工程項目的發(fā)展具有重要意義。因此,相關人員應加強探索,使數(shù)據(jù)挖掘技術在軟件工程中的應用更加成熟可靠,以促進其在其他領域的應用也能取得良好的效果。
[1]趙麗坤,陳立文,張國宗.基于數(shù)據(jù)挖掘技術的軟件項目管理體系[J].經(jīng)營與管理,2012(112):31-3.5.
[2]鄒文東,張立厚.數(shù)據(jù)挖掘在水環(huán)境分析信息化中的應用[J].圖書館論壇,2006(05).
[3]張?zhí)貋?,劉萬軍.數(shù)據(jù)挖掘在醫(yī)學領域的應用研究[J].自動化技術與應用,2005(10).
[4]鄭繼剛,王邊疆.數(shù)據(jù)挖掘研究的現(xiàn)狀與發(fā)展趨勢[J].紅河學院學報,2010(02).
[5]朱世武,崔巍,張堯庭,謝邦昌.數(shù)據(jù)挖掘運用的理論與技術[J].統(tǒng)計研究,2003(08).
[6]沈文淵,丁穎.計算機數(shù)據(jù)挖掘技術的開發(fā)及其應用探究[J].信息系統(tǒng)工程,2014(06):87.
[7]都園園.計算機數(shù)據(jù)挖掘技術的開發(fā)及其應用探究[J].信息化建設,2015(10):105.