王廷 王博
摘要:數(shù)據(jù)挖掘是根據(jù)需求從大量混亂數(shù)據(jù)信息中搜索、尋找數(shù)據(jù)信息的過程,在大數(shù)據(jù)時代背景下,這項技術(shù)被廣泛應用于軟件工程開發(fā)、企業(yè)財務管理、人力資源管理等領(lǐng)域。在新形勢下,受到計算機技術(shù)、互聯(lián)網(wǎng)技術(shù)的影響,軟件工程發(fā)展迅速,在軟件開發(fā)中,應用數(shù)據(jù)挖掘技術(shù),可提升工作效率,節(jié)省人力和時間成本,而且,軟件工程的進步,推動數(shù)據(jù)挖掘技朝著自動化、智能化的方向發(fā)展,二者相互促進,相互影響。
關(guān)鍵詞:數(shù)據(jù)挖掘;驅(qū)動;軟件工程;發(fā)展
所謂數(shù)據(jù)挖掘,是指目的性從大量數(shù)據(jù)中搜索、尋找數(shù)據(jù)信息的過程,在這項技術(shù)中,需將驗證驅(qū)動法作用于數(shù)據(jù)中,并默認想要搜尋的信息是存在的。從目前社會的發(fā)展形勢來看,數(shù)據(jù)挖掘技術(shù)在軟件工程中的重要性會越來越高,而且,隨著軟件工程的發(fā)展,這項技術(shù)會逐步朝著自動化、智能化的方向發(fā)展。
1.數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘是從數(shù)量大、種類繁雜的海量數(shù)據(jù)資源中,根據(jù)需求尋找相對應數(shù)據(jù)信息的過程。數(shù)據(jù)挖掘是按照業(yè)務需求理解、數(shù)據(jù)理解、數(shù)據(jù)搜集、建模、模型測評、部署的流程展開的,而且這一流程是迭代式進行的。在這項技術(shù)中,工作人員會將分類后的幾個樣本作為模板,來制作模型,并將未分類數(shù)據(jù)按照規(guī)定數(shù)目進行分類,建模后,進行數(shù)據(jù)挖掘,分類輸出值是非連續(xù)的,然后,再尋找不同數(shù)據(jù)間的聯(lián)系,對數(shù)據(jù)進行分組,將相似數(shù)據(jù)分在同一組。
基于數(shù)據(jù)挖掘的技術(shù)優(yōu)勢,以及軟件工程開發(fā)、企業(yè)財務管理、人力資源管理在數(shù)據(jù)處理上的需求,這項技術(shù)在上述領(lǐng)域有著廣闊的發(fā)展前景??茖W技術(shù)是第一生產(chǎn)力,在信息爆炸的現(xiàn)階段,單純依靠人工進行數(shù)據(jù)的采集、整理、分析,工作效率高,且工作質(zhì)量得不到保障,而依靠數(shù)據(jù)挖掘從海量混亂信息中尋找所需求的信息,可大大提升工作成效,節(jié)省大量的人力、時間成本,這對于提升社會生產(chǎn)效益有著積極意義。
數(shù)據(jù)挖掘流程大致如下:
數(shù)據(jù)挖掘是一項較為先進的技術(shù),國外對于這項技術(shù)的研究起步較早,最初將之應用于人工智能領(lǐng)域。不過,隨著大數(shù)據(jù)時代的到來,目前這項技術(shù)已經(jīng)被應用于軟件工程、金融、保險、零售、財務信息處理等各個領(lǐng)域。基于科技水平的差異,我國對于數(shù)據(jù)挖掘的研究比國外晚了很多年,所以,理論研究基礎薄弱,技術(shù)體系相較不完善。在近些年,受到計算機技術(shù)、數(shù)據(jù)庫技術(shù)、信息技術(shù)發(fā)展的推動,我國在數(shù)據(jù)挖掘這方面的研究取得了十足的進展,有關(guān)于這項技術(shù)的論文數(shù)量顯著增加,論文引用次數(shù)大幅增長,這促進了數(shù)據(jù)挖掘在我國工業(yè)生產(chǎn)、公共管理等領(lǐng)域的應用?;跀?shù)據(jù)挖掘的重要性,國家對于這項技術(shù)研發(fā)的重視度較高,也投入了較大的資金,但是,在實踐過程中,仍然遇到了不少的阻礙,比如說無統(tǒng)一評測標準等,仍需進一步解決。
2.現(xiàn)代數(shù)據(jù)挖掘驅(qū)動的軟件工程發(fā)展
軟件開發(fā)是一個如同循序漸進的過程,包括設計、運行、維護等多道工序。在軟件工程開發(fā)時,工作流程如下:
互聯(lián)網(wǎng)時代的到來,為軟件工程的發(fā)展提供了良好的環(huán)境,而大數(shù)據(jù)時代的進入,則預示著數(shù)據(jù)挖掘的重要性會越來越高。目前,人們所使用的計算機、智能手機軟件中,有不少都需要用到數(shù)據(jù)挖掘技術(shù),比如說百度、360瀏覽器、知網(wǎng)、淘寶等,這些軟件能夠根據(jù)用戶的個人信息、瀏覽記錄等,為其推送相關(guān)內(nèi)容,這樣能夠讓用戶在短時間內(nèi)迅速查找到所需信息,提升人們的生活效率。
在軟件工程開發(fā)過程中,迭代式循環(huán)會產(chǎn)生大量運行數(shù)據(jù),儲存在軟件工程數(shù)據(jù)庫中,如果硬要數(shù)據(jù)挖掘技術(shù),能夠充分高效地利用上述信息,為軟件開發(fā)人員提供精準的信息支持,從而提升軟件開發(fā)效率。目前,數(shù)據(jù)挖掘技術(shù)包含關(guān)聯(lián)技術(shù)、聚類技術(shù)、人工神經(jīng)網(wǎng)絡等技術(shù)類型,在軟件工程中,被應用于以下幾個方面:
①檢查漏洞。數(shù)據(jù)挖掘技術(shù)能夠在短時間內(nèi)進行漏洞檢查,將相關(guān)數(shù)據(jù)進行整合分析,提供給軟件開發(fā)人員,讓其明確軟件設計中的不足,再按照客戶需求進行修改;
②執(zhí)行記錄。數(shù)據(jù)挖掘技術(shù)能夠記錄軟件程序的執(zhí)行路徑,加以分析,尋找相關(guān)聯(lián)的代碼關(guān)系,進行跟蹤與檢驗,這樣能夠利用數(shù)據(jù)的相關(guān)性進行編程,提升工作效率。
3.結(jié)語
隨著社會的發(fā)展,智能手機、計算機等移動終端逐步普及,為軟件工程的發(fā)展提供了推廣基礎。數(shù)據(jù)挖掘技術(shù)是軟件工程領(lǐng)域中應用較為廣泛的一項技術(shù),在大數(shù)據(jù)時代背景下,這項技術(shù)的重要性愈發(fā)重要,所以,從發(fā)展角度來看,現(xiàn)代數(shù)據(jù)挖掘驅(qū)動的軟件工程發(fā)展前景是較為廣闊的。
參考文獻:
[1]喬偉軒.淺析現(xiàn)代數(shù)據(jù)挖掘驅(qū)動的軟件工程發(fā)展[J].中國新通信,2018,20(24):154.
[2]李曉晨. 面向軟件倉庫挖掘的數(shù)據(jù)驅(qū)動特征構(gòu)建方法[D].大連理工大學,2015.
[3]喬偉軒.淺析現(xiàn)代數(shù)據(jù)挖掘驅(qū)動的軟件工程發(fā)展[J].中國新通信,2018,20(24):154.
[4]劉芬.數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究[J].山東工業(yè)技術(shù),2018(17):123.
[5]黃鋒.軟件工程數(shù)據(jù)挖掘的發(fā)展趨勢[J].電子技術(shù)與軟件工程,2017(21):165.
[6]謝怡文.探討數(shù)據(jù)挖掘技術(shù)的研究現(xiàn)狀及發(fā)展方向[J].通訊世界,2016(17):30.
作者簡介:
王廷(1996—).男.漢族.福建省福州市.本科.研究方向:軟件工程
王博(1995—).男.漢族.陜西省西安市.本科.研究方向:應用物理學