楊小梅
摘要:研究中將軟件設(shè)計(jì)挖掘中的模型構(gòu)建作為了研究的重點(diǎn),對(duì)數(shù)據(jù)挖掘的基本過(guò)程、數(shù)據(jù)資源的運(yùn)用現(xiàn)狀以及模型設(shè)計(jì)的核心理念進(jìn)行了系統(tǒng)性的研究,旨在通過(guò)對(duì)數(shù)據(jù)挖掘模型的有效構(gòu)建,實(shí)現(xiàn)軟件工程數(shù)據(jù)挖掘的科學(xué)分析,為信息系統(tǒng)的優(yōu)化設(shè)計(jì)提供系統(tǒng)支持。
關(guān)鍵詞:軟件系統(tǒng);數(shù)據(jù)挖掘;模型設(shè)計(jì)
中圖分類(lèi)號(hào):TP31 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)02-0086-03
對(duì)于軟件數(shù)據(jù)挖掘系統(tǒng)而言,其數(shù)據(jù)資源的挖掘是一種對(duì)數(shù)據(jù)發(fā)現(xiàn)模型構(gòu)建及規(guī)律認(rèn)知的過(guò)程,通過(guò)對(duì)數(shù)據(jù)資源信息的優(yōu)化分析可以實(shí)現(xiàn)對(duì)數(shù)據(jù)資源系統(tǒng)的有效收集。在實(shí)際軟件系統(tǒng)開(kāi)發(fā)的過(guò)程中,通過(guò)對(duì)軟件信息資源的有效收集,可以實(shí)現(xiàn)對(duì)軟件基礎(chǔ)編碼及測(cè)試依據(jù)的有效分析,而在現(xiàn)階段軟件數(shù)據(jù)挖掘系統(tǒng)分析的過(guò)程中,怎樣實(shí)現(xiàn)軟件系統(tǒng)的有效處理,逐漸成為數(shù)據(jù)資源信息模型構(gòu)建中需要解決的問(wèn)題。所以,在研究中,通過(guò)對(duì)數(shù)據(jù)挖掘系統(tǒng)的模型構(gòu)建,進(jìn)行了軟件挖掘系統(tǒng)的分析,核心目的是通過(guò)信息資源數(shù)據(jù)庫(kù)的穩(wěn)定優(yōu)化,實(shí)現(xiàn)數(shù)據(jù)資源模型的穩(wěn)定構(gòu)建。
1 數(shù)據(jù)挖掘的過(guò)程分析
對(duì)于典型的數(shù)據(jù)挖掘系統(tǒng)而言,其基本的過(guò)程可以通過(guò)圖1所示。
1.1 數(shù)據(jù)挖掘?qū)ι虡I(yè)目標(biāo)的理解
在數(shù)據(jù)資源挖掘的過(guò)程中,首先應(yīng)該在商業(yè)的角度對(duì)用戶(hù)的真實(shí)需求進(jìn)行理解及分析,其中,信息資源的收集及理解會(huì)將行業(yè)的信息作為基礎(chǔ),通過(guò)對(duì)行業(yè)運(yùn)行現(xiàn)狀的分析,進(jìn)行問(wèn)題的理解及確立。同時(shí),在問(wèn)題分析的過(guò)程中,需要對(duì)項(xiàng)目的實(shí)行計(jì)劃、項(xiàng)目風(fēng)險(xiǎn)以及受益項(xiàng)目進(jìn)行合理性的問(wèn)題的有效設(shè)計(jì),充分保證資源項(xiàng)目評(píng)估的穩(wěn)定性及優(yōu)勢(shì)性,從而為項(xiàng)目目標(biāo)的優(yōu)化設(shè)計(jì)提供穩(wěn)定支持。
1.2 數(shù)據(jù)挖掘?qū)?shù)據(jù)資源的理解
數(shù)據(jù)資源系統(tǒng)構(gòu)建的過(guò)程中,項(xiàng)目設(shè)計(jì)者需要在了解數(shù)據(jù)挖掘的商業(yè)目標(biāo)之后,進(jìn)行相關(guān)原始數(shù)據(jù)信息資源的優(yōu)化設(shè)計(jì),并通過(guò)對(duì)數(shù)據(jù)相關(guān)特征的分析,進(jìn)行數(shù)據(jù)格式、形式及數(shù)量的優(yōu)化統(tǒng)計(jì),從而保證數(shù)據(jù)資源信息的穩(wěn)定連接。
1.3 數(shù)據(jù)資源的準(zhǔn)備
在軟件系統(tǒng)數(shù)據(jù)資源準(zhǔn)備的過(guò)程中,通過(guò)數(shù)據(jù)資源的準(zhǔn)備及數(shù)據(jù)挖掘過(guò)程的穩(wěn)定分析,可以發(fā)現(xiàn)在數(shù)據(jù)資源準(zhǔn)備系統(tǒng)設(shè)計(jì)的過(guò)程中,主要內(nèi)容應(yīng)該包含數(shù)據(jù)的集成、數(shù)據(jù)的清理、數(shù)據(jù)的選擇以及數(shù)據(jù)的變換,通過(guò)這些步驟的確定,保證數(shù)據(jù)資源在大量、全面及豐富的狀態(tài)下,實(shí)現(xiàn)對(duì)數(shù)據(jù)資源的準(zhǔn)備及集成性分析。同時(shí),在數(shù)據(jù)集成問(wèn)題分析的過(guò)程中,應(yīng)該通過(guò)對(duì)多種異質(zhì)數(shù)據(jù)的有效整合,保證數(shù)據(jù)資源庫(kù)數(shù)據(jù)處理的原始性特點(diǎn)。數(shù)據(jù)清理主要是通過(guò)對(duì)噪音數(shù)據(jù)、數(shù)據(jù)沖突現(xiàn)象的消除,實(shí)現(xiàn)對(duì)數(shù)據(jù)信息的有效填補(bǔ),從而為數(shù)據(jù)資源系統(tǒng)的數(shù)據(jù)污染處理提供穩(wěn)定支持。數(shù)據(jù)選擇主要是通過(guò)對(duì)數(shù)據(jù)清洗后的數(shù)據(jù)進(jìn)行集成化的樣本篩選、維度提升,使數(shù)據(jù)樣本在項(xiàng)目?jī)?yōu)化設(shè)計(jì)的基礎(chǔ)上,保證數(shù)據(jù)信息挖掘的技術(shù)性及分類(lèi)型特點(diǎn),實(shí)現(xiàn)數(shù)據(jù)格式資源轉(zhuǎn)化的合理性。
1.4 數(shù)據(jù)模型的算法實(shí)施
在數(shù)據(jù)資源整合及設(shè)計(jì)的過(guò)程中,通過(guò)優(yōu)化的測(cè)量進(jìn)行參數(shù)資源的設(shè)定,可以保證數(shù)據(jù)資源挖掘算法的穩(wěn)定性執(zhí)行,并在模型構(gòu)建及模型規(guī)則分析的基礎(chǔ)上,實(shí)現(xiàn)系統(tǒng)闡述的穩(wěn)定設(shè)計(jì)[1]。
1.5 評(píng)估模型的設(shè)計(jì)
在數(shù)據(jù)挖掘系統(tǒng)結(jié)果分析的過(guò)程中,應(yīng)該將數(shù)據(jù)挖掘的結(jié)果中作為分析的對(duì)象,并將數(shù)據(jù)挖掘的學(xué)習(xí)類(lèi)型作為項(xiàng)目的指導(dǎo),從而尋找并認(rèn)識(shí)到設(shè)計(jì)評(píng)估的基本規(guī)則及模型。在評(píng)估系統(tǒng)設(shè)計(jì)的環(huán)境下,其內(nèi)容不僅需要包括對(duì)數(shù)據(jù)資源的處理及檢測(cè),而且也應(yīng)該發(fā)現(xiàn)數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)系統(tǒng)的中心環(huán)節(jié),保證項(xiàng)目的設(shè)計(jì)的穩(wěn)定性及核心性,從而實(shí)現(xiàn)系統(tǒng)評(píng)估及評(píng)價(jià)模型設(shè)計(jì)的科學(xué)性。
1.6 商業(yè)實(shí)踐環(huán)節(jié)優(yōu)化
通過(guò)對(duì)數(shù)據(jù)挖掘過(guò)程的分析可以發(fā)現(xiàn),其資源庫(kù)的構(gòu)建可以指導(dǎo)企業(yè)進(jìn)行穩(wěn)定性的社會(huì)實(shí)踐,并在某種程度上滿(mǎn)足商業(yè)實(shí)踐的基本標(biāo)準(zhǔn)。在商業(yè)實(shí)踐優(yōu)化設(shè)計(jì)的中,應(yīng)該注意的是,數(shù)據(jù)信息庫(kù)的資源處理,應(yīng)該充分展現(xiàn)動(dòng)態(tài)化的知識(shí)活動(dòng)構(gòu)建體系,并在商業(yè)實(shí)踐及資源挖掘的基礎(chǔ)上,保證商業(yè)活動(dòng)柜的有效拓展,從而為數(shù)據(jù)挖掘資源平臺(tái)的設(shè)計(jì)提供穩(wěn)定支持。
2 數(shù)據(jù)挖掘系統(tǒng)需要解決的問(wèn)題
2.1 數(shù)據(jù)準(zhǔn)備及處理階段的問(wèn)題
在現(xiàn)階段設(shè)計(jì)挖掘系統(tǒng)設(shè)計(jì)的過(guò)程中,很多數(shù)據(jù)資源庫(kù)的設(shè)計(jì)在數(shù)據(jù)準(zhǔn)備及預(yù)處理的過(guò)程中,并沒(méi)有形成自動(dòng)化的數(shù)據(jù)庫(kù)資源分析模式,而且,對(duì)于冗余、沖突以及異常的現(xiàn)象缺乏應(yīng)急性規(guī)定處理制度,從而導(dǎo)致數(shù)據(jù)庫(kù)的資源選擇以及樣本篩選都需要得到專(zhuān)業(yè)人群進(jìn)行干預(yù),造成了資源的嚴(yán)重浪費(fèi)[2]。
2.2 數(shù)據(jù)挖掘?qū)ο蟮膯?wèn)題
在設(shè)計(jì)挖掘?qū)ο蠓治龅倪^(guò)程中,要求數(shù)據(jù)挖掘系統(tǒng)需要面對(duì)大規(guī)模的數(shù)據(jù)資源模型,但是,在現(xiàn)階段數(shù)據(jù)資源挖掘系統(tǒng)設(shè)計(jì)中,其數(shù)據(jù)異質(zhì)性現(xiàn)象較為突出,數(shù)據(jù)的特征及維度空間也相對(duì)較高,因此,在特征及屬性間關(guān)系優(yōu)化分析中面臨著繁雜的特點(diǎn),同時(shí),在數(shù)據(jù)系統(tǒng)非機(jī)構(gòu)化數(shù)據(jù)處理及分析的狀態(tài)下,其結(jié)果也很難得到量化的處理。
2.3 企業(yè)數(shù)據(jù)庫(kù)資源不完善
數(shù)據(jù)挖掘庫(kù)作為信息資源儲(chǔ)存的重要平臺(tái),在現(xiàn)階段數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)的過(guò)程中,企業(yè)存在著數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)設(shè)計(jì)不完善的現(xiàn)象,這一問(wèn)題的出現(xiàn)也就會(huì)為信息數(shù)據(jù)的收集及整理造成較為嚴(yán)重的時(shí)間浪費(fèi)[3]。
2.4 數(shù)據(jù)挖掘系統(tǒng)知識(shí)體系不成熟
數(shù)據(jù)挖掘問(wèn)題分析的過(guò)程中,由于知識(shí)的形成及表示方法的差異性,導(dǎo)致在實(shí)際數(shù)據(jù)資源挖掘及項(xiàng)目指導(dǎo)及分析中,存在著領(lǐng)導(dǎo)人員缺乏專(zhuān)業(yè)性的數(shù)據(jù)挖掘知識(shí)的現(xiàn)象,使指導(dǎo)工作面臨著一定的制約。
2.5 對(duì)系統(tǒng)處理方式?jīng)]有形成有效體系
在數(shù)據(jù)資源挖掘及處理的過(guò)程中,系統(tǒng)項(xiàng)目在某種程度上會(huì)起到指導(dǎo)性的作用,所以,對(duì)數(shù)據(jù)系統(tǒng)的算法及模型的處理應(yīng)該保證項(xiàng)目評(píng)價(jià)的客觀(guān)性,這種客觀(guān)性評(píng)價(jià)也是數(shù)據(jù)資源信息挖掘中較為關(guān)鍵的環(huán)節(jié)。但是,在現(xiàn)階段數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)的過(guò)程中,存在著系統(tǒng)不完善的設(shè)計(jì)現(xiàn)象,從而為系統(tǒng)資源的處理造成了制約[4]。
2.6 樣本分布中的不均勻現(xiàn)象
在系統(tǒng)設(shè)計(jì)及樣本分析的過(guò)程中,其不均衡的數(shù)據(jù)集中問(wèn)題存在著一定的制約性問(wèn)題,其主要的內(nèi)容包括了對(duì)學(xué)習(xí)理解不深刻、算法不合理以及評(píng)價(jià)不完善等,這些不均衡的因素得到了廣大學(xué)者的廣泛關(guān)注。因此,在現(xiàn)階段數(shù)據(jù)挖掘資源優(yōu)化的過(guò)程中,應(yīng)該認(rèn)識(shí)到樣本分布不均勻的問(wèn)題,通過(guò)對(duì)數(shù)據(jù)資源挖掘系統(tǒng)的有效分析,保證系統(tǒng)運(yùn)行的穩(wěn)定性及科學(xué)性。
3 軟件數(shù)據(jù)挖掘中的模型研究
3.1 聚類(lèi)挖掘中數(shù)據(jù)模型系統(tǒng)的構(gòu)建
在對(duì)城市發(fā)展類(lèi)型化問(wèn)題分析的過(guò)程中,其初始環(huán)境中的數(shù)據(jù)模型構(gòu)建,應(yīng)該在數(shù)據(jù)實(shí)例設(shè)計(jì)分析的基礎(chǔ)上,進(jìn)行聚合關(guān)系的有效確定,但是,在現(xiàn)階段數(shù)據(jù)模型分析中,系統(tǒng)內(nèi)容并沒(méi)有形成系統(tǒng)化的建模方式。因此,在現(xiàn)階段數(shù)據(jù)挖掘系統(tǒng)優(yōu)化設(shè)計(jì)的狀態(tài)下,應(yīng)該通過(guò)對(duì)聚類(lèi)問(wèn)題的有效分析,進(jìn)行數(shù)據(jù)挖掘技術(shù)的有效優(yōu)化[5]。
第一,層次狀態(tài)下的聚類(lèi)分析。對(duì)于系統(tǒng)聚類(lèi)方式而言,是一種層次化的聚類(lèi)方式,其使用的范圍相對(duì)較廣。在系統(tǒng)運(yùn)行的狀態(tài)下,通過(guò)對(duì)各個(gè)樣本類(lèi)型的分析,合理規(guī)定樣本之間的相互距離,然后在兩類(lèi)合并分析的狀態(tài)下,形成一種全新的類(lèi)型模式,通過(guò)對(duì)其他聚類(lèi)數(shù)據(jù)資源的計(jì)算,重復(fù)兩類(lèi)合并化的工作內(nèi)容,并將相關(guān)的工作成本合為一類(lèi),保證數(shù)據(jù)資源的合并化及順序化處理。同時(shí),在數(shù)據(jù)挖掘系統(tǒng)處理的過(guò)程中,軟件系統(tǒng)會(huì)提供一種hclust()的函數(shù)層次聚類(lèi)方式,hclust()聚類(lèi)方式是hclust(d,merhod=“ward”,members=NULL),函數(shù)中的d是指距離結(jié)構(gòu)的距離,而merhod是一種制定的聚類(lèi)方法,在運(yùn)用的過(guò)程中,可以通過(guò)最短距離、最長(zhǎng)距離以及中間距離方式的運(yùn)用,進(jìn)行數(shù)據(jù)挖掘系統(tǒng) 的有效設(shè)計(jì)。對(duì)于聚類(lèi)系統(tǒng)而言,是也中非監(jiān)督的模式,通過(guò)對(duì)各個(gè)數(shù)據(jù)資源的合理關(guān)注,可以通過(guò)對(duì)實(shí)際狀況的分析及調(diào)整,進(jìn)行聚類(lèi)內(nèi)容的程序優(yōu)化。在程序設(shè)計(jì)的過(guò)程中,其基本的程序如下所示。
subest<-subest (datasrt,sckect=出(3:11)
city<-dist (subest) 該程序主要是對(duì)Euclide的距離進(jìn)行測(cè)定分析
hclust<-hclust(city,“ward”)該程序?yàn)榱藢?shí)現(xiàn)對(duì)Ward進(jìn)行系統(tǒng)聚類(lèi)分析
Plclust(hclust)實(shí)現(xiàn)系統(tǒng)繪制程序的聚類(lèi)化譜圖
result<-rect.hclust(hclust,k=4,border=“red”)實(shí)現(xiàn)對(duì)特定的聚類(lèi)進(jìn)行劃分
第二,劃分聚類(lèi)方式分析
在聚類(lèi)方式分析的過(guò)程中可以發(fā)現(xiàn),k-means是一種較為經(jīng)典的劃分模式,其基本的設(shè)計(jì)思想是通過(guò)對(duì)聚類(lèi)化指標(biāo)的最小優(yōu)化,進(jìn)行聚類(lèi)準(zhǔn)則及聚類(lèi)函數(shù)的樣本分析,從而保證距離的最小化。因此,在整個(gè)聚類(lèi)方法分析的過(guò)程中,第一,應(yīng)該通過(guò)對(duì)制定聚類(lèi)數(shù)據(jù)的分析,進(jìn)行聚類(lèi)項(xiàng)目的合理確定,并保護(hù)走鞥初始聚類(lèi)中心設(shè)計(jì)的穩(wěn)定性、合理性。第二,通過(guò)對(duì)養(yǎng)成集里以及樣本最小距離的分析,可以對(duì)不同的聚類(lèi)樣本進(jìn)行平均聚類(lèi)中心的穩(wěn)定設(shè)計(jì),從而保證數(shù)據(jù)資源系統(tǒng)處理的優(yōu)化設(shè)計(jì)[6]。
3.2 分類(lèi)模型的設(shè)計(jì)
在社會(huì)運(yùn)行及發(fā)展的狀態(tài)下,人類(lèi)在生產(chǎn)活動(dòng)設(shè)計(jì)的過(guò)程中,需要對(duì)不同的信息系統(tǒng)做出預(yù)測(cè),如天氣變化狀況以及股票指數(shù)等內(nèi)容,通過(guò)預(yù)測(cè)可以對(duì)相關(guān)數(shù)據(jù)的歷史指數(shù)進(jìn)行綜合性的分析,并在指標(biāo)分析及評(píng)價(jià)的基礎(chǔ)上,劃分出綜合性的預(yù)估內(nèi)容,保證項(xiàng)目生產(chǎn)活動(dòng)效率的穩(wěn)定提升,降低數(shù)據(jù)模型構(gòu)建中出現(xiàn)的風(fēng)險(xiǎn)因素。有效提升生產(chǎn)活動(dòng)的整體效率。在分類(lèi)技術(shù)分析的過(guò)程中,需要對(duì)控制變量的控制進(jìn)行預(yù)測(cè)及取值特征的分析,因此,在預(yù)測(cè)狀態(tài)下,可以將其內(nèi)容分為分類(lèi)及回歸兩種。因此,需要對(duì)預(yù)測(cè)的項(xiàng)目?jī)?nèi)容進(jìn)行分類(lèi)處理。在數(shù)據(jù)挖掘模型輸出結(jié)果設(shè)計(jì)的狀態(tài)下,我們會(huì)將其過(guò)程稱(chēng)為回歸學(xué)習(xí)方式。通常情況下,在分類(lèi)技術(shù)概述分析的狀態(tài)下,對(duì)決策樹(shù)進(jìn)行分析。其中的決策樹(shù)主要是一種無(wú)序性的數(shù)據(jù)記錄內(nèi)容,并通過(guò)對(duì)數(shù)據(jù)資源的有效分析及結(jié)構(gòu)的表述,實(shí)現(xiàn)數(shù)據(jù)挖掘資源的有效處理。
首先,通過(guò)這種本屬性值的比較及分析,可以構(gòu)建分子化的系統(tǒng)處理模式,從而保證分類(lèi)樹(shù)資源結(jié)構(gòu)優(yōu)化的合理性,其基本的決策樹(shù)分類(lèi)技術(shù)可以分為以下幾點(diǎn):第一,ID3算法內(nèi)容思考的分析中,其核心的工作內(nèi)容是對(duì)樣本數(shù)據(jù)進(jìn)行檢測(cè),并在計(jì)算的各個(gè)活動(dòng)中,實(shí)現(xiàn)信息增益的資源優(yōu)化處理,實(shí)現(xiàn)不同屬性值建立的穩(wěn)定性。通過(guò)對(duì)ID3算法理論的科學(xué)化分析,可以保證數(shù)據(jù)資源的穩(wěn)定設(shè)計(jì)及便利性分析,并在此基礎(chǔ)上,擴(kuò)大數(shù)據(jù)集成性的理想內(nèi)容,保證數(shù)據(jù)資源項(xiàng)目核算的穩(wěn)定優(yōu)化及合理改進(jìn)。第二,C4.5算法。對(duì)于C4.5算法而言,在計(jì)算的過(guò)程 中會(huì)在項(xiàng)目設(shè)計(jì)的基礎(chǔ)上實(shí)現(xiàn)對(duì)數(shù)據(jù)挖掘的有效改進(jìn),并在此基礎(chǔ)上,建立了分類(lèi)樹(shù)的項(xiàng)目過(guò)程。首先,需要構(gòu)建數(shù)據(jù)決策樹(shù),這種決策方式與ID3的構(gòu)建決策方式呈現(xiàn)出一直化的發(fā)展變化,其主要的區(qū)別是ID3在信息增益分析的狀態(tài)下,可以實(shí)現(xiàn)對(duì)屬性分子問(wèn)題的有效解決,而C4.5算法需要通過(guò)對(duì)信息收益率的綜合性分析,并進(jìn)行屬性不足的確立。其次,在對(duì)已經(jīng)形成分類(lèi)樹(shù)剪裁及處理的狀態(tài)下,應(yīng)該通過(guò)對(duì)噪音數(shù)據(jù)分支問(wèn)題的分析,進(jìn)行離散化的項(xiàng)目處理,從而保證數(shù)據(jù)資源處理狀態(tài)下的系統(tǒng)缺失值,并在最大程度上為決策樹(shù)算法的運(yùn)用提供良好依據(jù)[7]。
其次,在函數(shù)類(lèi)分類(lèi)算法分析的過(guò)程中,應(yīng)該支持向量機(jī)化的合作管理模式,并在理論統(tǒng)計(jì)及學(xué)習(xí)的基礎(chǔ)上,保證函數(shù)項(xiàng)目設(shè)計(jì)的穩(wěn)定性發(fā)展。因此,在函數(shù)類(lèi)分類(lèi)算法分析的基礎(chǔ)上,應(yīng)該通過(guò)對(duì)樣本信息模型的復(fù)雜性設(shè)計(jì),應(yīng)該尋求復(fù)雜性及學(xué)習(xí)性的分類(lèi)算法,有效克服傳統(tǒng)信息模型設(shè)計(jì)的局限性,從而保證函數(shù)分類(lèi)的廣泛性發(fā)展。同時(shí),在函數(shù)分類(lèi)算法分析的同時(shí),為了支持向量機(jī)化學(xué)校模型的構(gòu)建,就應(yīng)該構(gòu)建集樣本是否為線(xiàn)性化的分析,對(duì)線(xiàn)性函數(shù)進(jìn)行穩(wěn)定的構(gòu)造,所以,在函數(shù)類(lèi)分類(lèi)算法過(guò)程中,應(yīng)該做到以下幾點(diǎn)內(nèi)容:第一,認(rèn)識(shí)到訓(xùn)練集體成本的的構(gòu)造分類(lèi),從而實(shí)現(xiàn)數(shù)據(jù)挖掘環(huán)境下非線(xiàn)性映射技術(shù)的空間化轉(zhuǎn)化。第二,在支持向量機(jī)采用投影技術(shù)確立及使用的過(guò)程中,應(yīng)該對(duì)非線(xiàn)性的特征進(jìn)行系統(tǒng)化的設(shè)計(jì),保證全局項(xiàng)目上合計(jì)的最優(yōu)化處理,保證期望風(fēng)險(xiǎn)的有效執(zhí)行[8]。
3.3 實(shí)現(xiàn)模型選擇的不均衡性模型構(gòu)建
對(duì)于不均衡分類(lèi)模式而言,主要是在分類(lèi)問(wèn)題處理的過(guò)程中,通過(guò)對(duì)多數(shù)樣本數(shù)量的分析,進(jìn)行少數(shù)樣本數(shù)量的合理優(yōu)化。同時(shí),在不均衡分離的理念下,可以將其分為不均衡的數(shù)據(jù)集約分類(lèi)方式,通過(guò)數(shù)據(jù)的穩(wěn)定研究,可以實(shí)現(xiàn)數(shù)據(jù)資源挖掘狀態(tài)下的全新發(fā)展,例如,在軟件系統(tǒng)檢測(cè)中,當(dāng)發(fā)現(xiàn)了軟件缺陷問(wèn)題,應(yīng)該保證模塊在98%以上,其錯(cuò)誤的軟件模塊應(yīng)該時(shí)刻小于2%,從而實(shí)現(xiàn)數(shù)據(jù)挖掘系統(tǒng)分類(lèi)算法的合理預(yù)測(cè)及系統(tǒng)分析,實(shí)現(xiàn)模型項(xiàng)目設(shè)計(jì)中信息價(jià)值的穩(wěn)定提升。同時(shí),在集成學(xué)習(xí)模式構(gòu)建的狀態(tài)下,也需要對(duì)組合學(xué)習(xí)項(xiàng)目進(jìn)行優(yōu)化,通過(guò)對(duì)原數(shù)據(jù)訓(xùn)練分類(lèi)模型的好送將誒,可以額保證分類(lèi)模型及子分類(lèi)模型的優(yōu)化設(shè)計(jì),實(shí)現(xiàn)模型測(cè)試項(xiàng)目的集中化及預(yù)測(cè)化判斷,為不均衡性模型的優(yōu)化設(shè)計(jì)提供穩(wěn)定性的技術(shù)支持[9]。
4 結(jié)語(yǔ)
總而言之,在現(xiàn)階段數(shù)據(jù)挖掘系統(tǒng)優(yōu)化設(shè)計(jì)的過(guò)程中,為了保證資源項(xiàng)目設(shè)計(jì)的穩(wěn)定性及合理性,不僅應(yīng)該保證系統(tǒng)挖掘的完善性及功能性,而且也應(yīng)該對(duì)用戶(hù)界面進(jìn)行綜合性的設(shè)計(jì)及分析,從而保證數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)條件的穩(wěn)定性,實(shí)現(xiàn)數(shù)據(jù)挖掘系統(tǒng)的實(shí)用性。同時(shí),在軟件挖掘系統(tǒng)優(yōu)化的狀態(tài)下,也可以通過(guò)對(duì)不同語(yǔ)言程序的開(kāi)發(fā)及挖掘能力的提升,充分展現(xiàn)出資源數(shù)據(jù)目標(biāo)挖掘的基本特點(diǎn),完善數(shù)據(jù)資源的挖掘功能,從而保證數(shù)據(jù)資源系統(tǒng)設(shè)計(jì)的穩(wěn)定性及互動(dòng)操作的特點(diǎn)。而且,在圖形界面數(shù)據(jù)資源可視化效果的分析,需要通過(guò)對(duì)流程化資源挖掘狀態(tài)的分析,進(jìn)行功能及用戶(hù)界面的有效改進(jìn),實(shí)現(xiàn)數(shù)據(jù)資源挖掘系統(tǒng)的優(yōu)化提供穩(wěn)支持。
參考文獻(xiàn)
[1]王國(guó)勛.基于多目標(biāo)決策的數(shù)據(jù)挖掘模型選擇研究[D].電子科技大學(xué),2013.
[2]龔璞.數(shù)據(jù)挖掘在軟件項(xiàng)目風(fēng)險(xiǎn)管理系統(tǒng)中應(yīng)用研究[D].大連理工大學(xué),2014.
[3]陳榮鑫.R軟件的數(shù)據(jù)挖掘應(yīng)用[J].重慶工商大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,(06):602-607.
[4]林立,朱小冬,王毅剛,閻旭坤.基于數(shù)據(jù)挖掘的軟件故障診斷研究[J].微計(jì)算機(jī)信息,2010,(34):156-158.
[5]王輝,杜慶峰.基于軟件信息庫(kù)挖掘的軟件缺陷預(yù)測(cè)方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2012,(08):3094-3098.
[6]崔廣風(fēng).數(shù)據(jù)挖掘中的統(tǒng)計(jì)方法及其應(yīng)用研究[D].西南石油大學(xué),2014.
[7]張曉艷.股市數(shù)據(jù)挖掘中偏模型的檢驗(yàn)和應(yīng)用[D].西南財(cái)經(jīng)大學(xué),2014.
[8]曾強(qiáng).面向軟件漏洞的挖掘方法研究[D].燕山大學(xué),2014.
[9]金蓮花.數(shù)據(jù)挖掘在軟件缺陷管理中的研究與應(yīng)用[D].長(zhǎng)春理工大學(xué),2010.