劉知云
摘要:近年來,信息技術的快速發(fā)展使得數據挖掘技術也在各個行業(yè)中獲得了廣泛的應用,并且數據挖掘技術也充分展現出了顯著優(yōu)勢,推助許多行業(yè)的快速發(fā)展。計算機技術也已經成為人們生產生活中不可或缺的工具,而數據挖掘技術在計算機軟件工程中的運用則具有現實意義。信息化時代下,以往的信息處理技術難以滿足海量信息的處理和存儲要求,數據挖掘技術的應用則很好地解決了這些問題,在軟件工程中的運用能夠將數據挖掘技術的優(yōu)勢全面發(fā)揮,在改善軟件工程研發(fā)效率的同時也降低了管理成本。本文主要圍繞軟件工程中數據挖掘技術的運用展開論述,探討了有關的應用策略。
關鍵詞:數據挖掘技術;軟件工程;應用對策
在大數據分析領域中,數據挖掘是一項新興的概念,數據挖掘的關鍵便是針對數據量大且價值密度低的數據進行高效分析,從中提取出具有應用價值和研究價值的信息數據,從而進一步提高數據的應用率。軟件工程經歷了多年的發(fā)展,在軟件開發(fā)與項目管理等方面也面臨著數據分析的問題,如漏洞分析和源代碼管理等。軟件在長時間運作之下不斷累積數據,但數據量越來越大的同時傳統的處理手段無法實現全面處理,所以數據挖掘技術在軟件工程中的有效應用成為當下研究的重點方向。
1 數據挖掘技術簡介
數據挖掘技術屬于現代化的信息處理技術,與傳統的信息處理技術對比之下具有非常明顯的功能性優(yōu)勢,因此也在許多行業(yè)中獲得了普遍運用。目前在軟件工程領域中,對于數據挖掘技術應用價值的研究仍然較少,很多軟件工程都在沿用傳統的數據處理技術,導致數據處理效率難以提升。而數據挖掘技術則包含了多種功能,不同功能之間也有著明顯的聯系性,可以實現全面評估,對于部分軟件工程來說,數據挖掘技術的應用最明顯的優(yōu)勢便在于數據處理效率獲得了顯著提升,同時數據丟失等問題也得到了很好的解決,對企業(yè)的發(fā)展帶來了有效保障。
2 數據挖掘技術應用于軟件工程的關鍵意義
2.1 有助于信息的獲取
數據挖掘技術也包括傳統信息處理中的各項重要功能,在完成信息采集工作后,可以按照數據信息的具體類型進行分類處理。在這一處理機制下,數據挖掘技術所涉及的業(yè)務范圍也有了進一步的拓展,可以結合數據的具體特征進行分析,在海量數據資源中建立一個功能性完備的信息管理系統,可以幫助人們快速檢索到需要的數據資源。將數據挖掘技術應用于軟件工程中,也可以將許多信息進行整合處理,幫助企業(yè)快速掌握各方面數據信息。
2.2 信息的正確錄入
數據挖掘技術的運算水平非常高,常規(guī)數據信息系統在運算過程中往往會需要較高的時間成本,并且部分情況下也可能由于數據處理量過高導致運算系統崩潰等問題。而數據挖掘技術的應用則可以有效避免這一問題,運算效率更高的同時在運算期間也能夠進一步規(guī)避數據丟失或運算混亂等問題,加強數據處理的整體效果。對于大規(guī)模數據的運算來說,一些垃圾數據并沒有利用價值,但可能會存儲于數據處理系統中影響系統運作效率,數據挖掘技術的應用也可以將這些垃圾數據進行處理,將具有價值的信息錄入到系統中。
2.3 提高數據處理效率
對于數據挖掘技術來說,數據轉換也是最主要的優(yōu)勢之一,能夠將混亂的數據信息進行整合處理,成為使用形式,而這些混亂的信息也可以在整合之后進行合理利用。雜數據挖掘過程中,可以自動選擇合理的分析模式,針對模糊數據進行及時處理,使最后的數據結果能夠全面利用。結合獲取到的數據,從不同方向著手考查數據的真實性和價值,將真實地數據進行整合,讓數據可讀化,也就是將分析結果作為全新的知識以供參考。數據分析過程一般較為煩瑣,需要對不同過程進行多次驗證,才能獲取真實的運算結果,而數據挖掘技術在軟件工程中的有效應用則可以全面改善數據運算的效率與質量[1]。
3 數據挖掘技術在軟件工程中的應用策略
3.1 信息挖掘
軟件工程可以實現信息數據的全方位管控,而且軟件工程的應用范圍也非常廣闊,在軟件開發(fā)過程中需要涉及的信息類型多種多樣,而軟件工程的版本則可以對這些信息數據進行統一控制,確保軟件在開發(fā)期間的各種數據資源都能進行同步更新,進一步確保軟件開發(fā)的質量以及開發(fā)過程的效率性,讓開發(fā)項目的目標能夠順利實現。在數據挖掘過程中,包括軟件開發(fā)更替的數據,技術人員可以快速區(qū)別軟件的內部結構,并且還可以充分應用數據挖掘技術的優(yōu)勢,在后續(xù)的工作中能夠迅速找出軟件內部問題并解決,完成軟件開發(fā)任務。
3.2 軟件漏洞檢測
在軟件工程中,漏洞檢測作為其中不可或缺的工作內容,可以確保軟件開發(fā)質量和系統的安全運作,及時發(fā)現隱患并及時排除隱患。軟件漏洞的快速修復可以為用戶提供更加穩(wěn)定的保障。在數據挖掘技術的應用方面,漏洞檢測中不但要針對軟件進行基本的測試內容,而且也應當進行相關性檢測,與軟件漏洞有關的項目內容也應該進行全面檢測,才能滿足軟件開發(fā)的現實要求。數據挖掘技術可以結合所記錄的內容來分析數據,針對分析結果進行改進,之后再決定選擇哪種測試模式完成測試工作,確保測試模式的選擇更加符合軟件工程的現實需求。在漏洞數據的處理方面,數據挖掘技術需要先清理掉數據,之后利用相關的數據進行分析和提取,清除掉沒有應用價值的數據,再對缺失的部分內容進行補充,以數據的方式呈現出來。除此之外,數據挖掘技術在軟件漏洞中的運用需要選擇合理有效的數據模型來完成分析與驗證工作,盡量選擇可行的挖掘模式,使其成為測試集。具有關聯的系統也需要針對運算結果進行類比,選擇最為合理的結果。在漏洞檢測中,還要對軟件漏洞進行分類與描述,在數據庫中及時更新軟件漏洞數據,如此一來但凡其他的相關軟件或系統在遭遇相似問題時便可以及時從數據庫中調取數據,從而進行快速操作,降低漏洞檢測所需時間的同時也為漏洞的檢測與解決提供參考依據,因此在漏洞數據更新方面也要保證數據分類的合理性[2]。
3.3 開源軟件的數據挖掘