(呂梁學院,經(jīng)濟管理系,山西呂梁市,033000) 郭越樂
作為信息化建設(shè)項目的核心,軟件造價分析工作發(fā)揮著重要作用,在分析和利用信息化工程造價數(shù)據(jù)時,如果沒有大數(shù)據(jù)技術(shù)作支撐,軟件造價分析新方法的功能難以充分發(fā)揮,從而造成大量異常數(shù)據(jù)產(chǎn)生,從而影響造價分析的準確率[1-2]。目前,造價數(shù)據(jù)在不同階段的復雜度都較高,同時編寫報告的工作量龐大,采用人工計算方式獲取造價數(shù)據(jù)相對較低,造價費用在不同階段具體應(yīng)用情況不易高效且精準獲取[3]。本研究基于國家標準功能點評估,同時將智能軟件度量系統(tǒng)創(chuàng)造性的借鑒,工作量評估以“需求導向”為重點,同時結(jié)合機器學習及大數(shù)據(jù)知識體系,針對工作量評估方法體系從流程、制度等層面開展創(chuàng)新性研究,確保工作效率能得到顯著提高。
按照說明書模板,對word文檔內(nèi)的格式信息進行讀取,在此基礎(chǔ)上對“業(yè)務(wù)功能”相關(guān)內(nèi)容進行識別[4]。參考說明書模板讀取相應(yīng)章節(jié)內(nèi)容,具體文本描述包括:業(yè)務(wù)流程描述、模塊名稱、業(yè)務(wù)功能說明等。在對存在各模塊中全部的動名詞短語、名詞短語及名詞進行識別時需合理利用數(shù)據(jù)挖掘技術(shù)及自然語言處理方法。在此基礎(chǔ)上再完成不同候選集的構(gòu)建,包括ILF,EI,EQ這三種。
當模型采用數(shù)據(jù)挖掘技術(shù)完成構(gòu)建后,此時要進行測試和驗證,以實際數(shù)據(jù)作為參考依據(jù)。在對各個預測模型的有效性進行驗證時,推薦系統(tǒng)常用的評價指標主要包括召回率Recall、準確率Precision等[5]。
在構(gòu)建模型的初期,數(shù)據(jù)支撐的審核主要通過功能點實現(xiàn)。驗證數(shù)據(jù)、深度學習模型、機器學習模型及其他模型均從語料集中獲取。因此在后期評估和訓練模型的過程中,收集語料集發(fā)揮著關(guān)鍵性作用。
應(yīng)用word2vec 完成詞向量轉(zhuǎn)換,可實現(xiàn)向量化文本中全部的詞,從而對它們的關(guān)系展開定量分析和研究,基于此將存在于詞與詞間的隱含關(guān)系進行充分挖掘。作為自然語言處理中的核心概念,NGram 也被稱為N 元模型,通過N-Gram 可實現(xiàn)對某句或詞義合理性的判斷和評估,一般而言,人們在NLP 中僅需通過語料庫就能實現(xiàn)這一目的。功能項短語通過該算法就能完成分詞功能。前面存在若干詞語后某個詞接著出現(xiàn),通過這種思想來實現(xiàn)算法功能,事實上該思想也算法假設(shè)n變量的基礎(chǔ)。
在構(gòu)建模型時需考慮不同類型的語料,在此基礎(chǔ)上再完成任務(wù)。模型訓練重復次數(shù)隨著語料集不斷增加而增多,這樣一來模型精度可根據(jù)數(shù)據(jù)新增狀況有不同程度的提升。當結(jié)束模型訓練后,再評估模型準確性指標及模型性能指標,將模型預測的效率及準確性作為重點考量指標。
功能點分類模型可通過模型流程進行構(gòu)建,下列為詳細步驟:①驗證集與訓練集語料均包含在已有語料集種,將特定識別名稱賦予給模型。語料管理頁面中如果缺少語料需先將相關(guān)語料進行上傳;②分詞處理方式以及詞典均采取自定義選取方式,結(jié)合行業(yè)類型和特征完成自定義詞典選擇,可選擇新建詞典或者不做選擇;③對神經(jīng)網(wǎng)絡(luò)分類模型、包含SVC 及邏輯回歸在內(nèi)的基本機器學習方法的分類器模型進行選擇;構(gòu)建模型參數(shù)數(shù)值可參考所選模型;④訓練模型前需要完成模型屬性的設(shè)置。通常情況下,訓練模型需要較長的時間,完成訓練需耐心等待。在結(jié)束訓練后評估分析模型性能。
模型管理人員負責完成構(gòu)建機器學習模型過程中的配置與管理工作。具體工作內(nèi)容包括評估、調(diào)整、訓練及構(gòu)建模型。模型使用人員使用權(quán)限由管理人員負責分發(fā)。
模型管理人員在語料集變動條件下需隨時重新調(diào)整已有模型的參數(shù)。該過程要求使用者對這些變化調(diào)整沒有任何感知,從而有效開展模型評估。
在未正式生產(chǎn)使用前,模型結(jié)束訓練后需要再次通過評估和測試。確保模型具有應(yīng)用價值。為實現(xiàn)這一目的,需不算完善和更新模型評估體系。
在未正式生產(chǎn)使用前,模型結(jié)束訓練后需要再次通過評估和測試。確保模型具有應(yīng)用價值。為實現(xiàn)這一目的,需不算完善和更新模型評估體系。
針對構(gòu)建的模型定制相應(yīng)的評估指標,選取指標需結(jié)合各功能點及應(yīng)用場合來完成,在無法確定選取評估指標的情況下,全部指標作為選擇;驗證集數(shù)據(jù)全都來源于評估模型,在此基礎(chǔ)上評估各種類型的驗證集;評估指標在多次評估環(huán)節(jié)都不一致,這種情況下,對于使用模型人員而言,可根據(jù)自己需求預測選取合適的模型。
通過模型評估體系測試已經(jīng)過訓練的模型,進一步評估該模型的準確性指標及性能指標。確認投放使用模型的前提是需要通過測試,模型管理人員面對未經(jīng)測試的模型僅有對比使用的權(quán)限。
一般模型包含多種性能指標,因此在多個層面各指標都能對模型性能進行較好詮釋。模型性能指標在不同場合要求下所需滿足的條件不一致。表1 為模型評估指標的結(jié)果。事實上,模型性能指標可通過準確率進行精準反饋,模型識別能力隨著準確率的提高而增強;因此通常需要采取必要措施提高模型識別率。
表1 模型評估指標
綜上所述,本文考慮到低效、人工計數(shù)難度高等問題,在功能點技術(shù)過程中對已識別功能點計數(shù)文檔的特征抽取出來進行探索,基于此完成分析框架的構(gòu)建以及功能點輔助審核規(guī)則的形成。系統(tǒng)類別以及主要功能的識別需通過參考功能點計數(shù)項完成,人工審核工作量可采取文本分析能力構(gòu)建所降低,從而促進預算管理效率的提高。