胡宇輝
(廣東省科技基礎條件平臺中心,廣東 廣州 510033)
隨著網絡通信技術的不斷發(fā)展,各種信息技術也需要更具針對性的軟件來提供服務,并對網絡中的信息進行集成和過濾。在傳統(tǒng)的軟件工程領域中,數據處理存在許多問題,導致信息傳輸不穩(wěn)定、軟件操作錯誤和卡頓現象,使用戶體驗非常差。在軟件工程開發(fā)中采用新的數據挖掘技術可以避免這一問題,保證信息和數據的正確傳輸,增強數據處理能力,更好地過濾和收集信息,保證信息源的準確性。
數據挖掘技術的發(fā)展可以追溯到上世紀末。它以數據庫中大量的理論知識為基礎,已成為數據庫領域創(chuàng)新應用研究技術的典型代表。經過不斷的理論探討和實踐積累,數據挖掘技術在數據庫領域占據了主導地位。然而,由于種種原因,該技術缺乏明確的基本概念。目前,提出的數據挖掘技術的定義最為公眾所認可。它將此技術解釋為從具有實際應用價值、內容新穎、形式獨特的海量數據庫中提取數據信息,并以可理解的模式使用。具體內容如下:一是數據信息不僅要包含許多專業(yè)領域,而且要保證信息的真實性和可靠性;二是能夠滿足公眾的興趣和愛好;三是所獲得的信息新穎獨特,具有實用價值;四是沒有專門的專業(yè)領域。總之,數據挖掘技術要求較高的專業(yè)性,涉及內容廣泛、復雜,是集人工智能模型和數據分析模型于一體的創(chuàng)新學科。
數據挖掘過程主要包括以下三個階段:
在這一階段,有效獲取原始數據信息的根本是澄清任務處理的對象,也就是說,獲取滿足實際需求的數據信息。數據清理的目的是彌補原始數據的缺陷,保證數據信息的完整性。數據提取是從大量數據庫中快速獲取與實際任務密切相關的數據信息。數據轉換的實質是改變數據格式,提高數據信息的適用性,最大限度地滿足需求。
第一步是制定合理的挖掘任務,包括數據歸納與分類、數據評估與總結,然后確定合適的挖掘作業(yè)方法,結合數據的實際特點和系統(tǒng)的具體需求,對作業(yè)方法進行深思熟慮。
該模式的實際應用是準確地表達數據挖掘結果,并以興趣為衡量標準,建立一個具有識別能力的完整的表達模式。
軟件工程涉及到大量與軟件相關的數據。通常這些數據由軟件代碼庫保存和存儲。數據庫的合理應用可以進一步提高軟件開發(fā)人員的實際工作效率,確保系統(tǒng)維護人員全面了解整個系統(tǒng)框架。例如,在分配軟件工程的特定任務的過程中,程序員可以快速、準確地識別系統(tǒng)組件的獨立性。在軟件工程中,統(tǒng)一軟件開發(fā)過程的循環(huán)產生大量的數據信息,這些數據是需要挖掘的對象。根據軟件工程的周期限制,整個過程分為以下幾個階段:
要求和設計階段是根據軟件工程的設計標準制定實用的計劃。一旦需求發(fā)生變化,軟件工程設計應遵循這些變化。同時,對程序員的專業(yè)技術提出了更高的標準。設計人員需要掌握優(yōu)秀的設計手段,借助數據挖掘技術對軟件代碼重組進行深入分析。為了提高程序代碼提取的實際效率。
這一階段是對數據挖掘技術需求最大的關鍵階段,包括以下幾個環(huán)節(jié):首先,在軟件工程編碼過程中,我們需要結合工程研發(fā)的實際需要,實時記錄軟件編碼過程,以此為基準,深入分析其內部機制。二是具有調試效果的數據挖掘技術。對于軟件工程來說,由于其在調試過程中的專業(yè)要求很高,大多數軟件開發(fā)技術人員都是獨立工作的。其目的是提高軟件系統(tǒng)的安全性和適用性,滿足用戶的需求。軟件系統(tǒng)的調試基于其復雜性和,需要大量的時間和精力。調試技術人員應遵守行業(yè)標準和規(guī)范,特別是對于系統(tǒng)較為復雜的軟件工程,在一定程度上增加了調試的難度。調試的實際目的是分析系統(tǒng)漏洞并定位軟件錯誤信息。合理利用數據挖掘技術,可以降低調試難度。三是,檢測軟件工程漏洞。任何軟件工程都不能完全避免系統(tǒng)漏洞。根據相關社會調查的結果,常見的軟件工程系統(tǒng)漏洞一般不會對用戶造成過度的經濟損失。例如,1996年美國的航天器墜毀事件是最具代表性的。此外,軟件系統(tǒng)漏洞檢測需要消耗整個開發(fā)設計周期的30%以上,這使得軟件工程系統(tǒng)的漏洞檢測工作更加重要。具體包括以下幾點:
1.從源代碼推斷錯誤,復制粘貼錯誤檢測,功能匹配檢測。以源代碼錯誤推斷為例,首先利用頻繁項集挖掘算法在代碼中查找頻繁項集,確定滿足最小支持的程序規(guī)則,然后推斷程序對規(guī)則的符合程度。一旦我們發(fā)現它們中的大多數滿足了程序的基本需求,就表明它們中的一小部分最有可能是漏洞規(guī)則。
2.在軟件工程中,系統(tǒng)維護階段更為關鍵,需要維護技術人員全面了解整個系統(tǒng)框架。一般來說,軟件維護的具體工作包括修復程序缺陷、糾正程序錯誤和遺漏、優(yōu)化設計環(huán)境、根據實際需要添加程序應用程序。在系統(tǒng)維護階段應用數據挖掘技術的主要內容如下:指導軟件修改。對于軟件系統(tǒng)來說,一次代碼調整會引發(fā)一系列的相關反應,而數據挖掘技術就是確定修改模式,以防止模塊修改頻率過高;其次,實現分段挖掘。具體來說,它是一個有針對性的補充編程程序,以進一步提高系統(tǒng)的安全性和穩(wěn)定性。
總之,數據挖掘技術在軟件工程項目中的應用可以促進軟件工程的健康發(fā)展。結合現階段的實際應用情況,可以看出數據挖掘技術有著非常廣闊的發(fā)展空間,需要技術人員進行深入的研究,不斷提高技術水平,加強專業(yè)素質,為軟件的健康發(fā)展提供建議。