李崗崗,趙婷婷
(運城學院 大學英語教學部, 山西 運城 044000)
?
紡織科技英語強化訓練的詞匯分類方法
李崗崗,趙婷婷
(運城學院 大學英語教學部, 山西 運城 044000)
為了提高紡織科技英語強化訓練的水平,實現(xiàn)詞匯信息的準確分類,提出一種基于英語詞匯語義指向性信息素濃度聚焦和模糊C均值聚類的紡織科技英語強化訓練詞匯分類模型.通過分析紡織科技英語強化訓練詞匯分布數(shù)據(jù)結(jié)構(gòu),構(gòu)建詞匯語義特征序列模型,除去詞匯語義指向性信息素濃度聚焦特征,采用改進的模糊C均值聚類算法實現(xiàn)詞匯優(yōu)化分類.仿真結(jié)果表明,采用該方法進行紡織科技英語強化訓練詞匯的分類,具有較好的語義特征聚焦性能,分類準確度較高,收斂性較好,提高了對詞匯的查準性能.
紡織科技;英語強化訓練;詞匯分類;語義
紡織科技英語詞匯分布復雜,對其熟練掌握的難度較高,需要進行紡織科技英語詞匯強化訓練,通過對用于紡織科技英語強化訓練詞匯進行優(yōu)化分類,采用語義信息處理方法實現(xiàn)英語詞匯的信息融合和特征提取,提高對紡織科技英語詞匯強化訓練的對象性和針對性.通過對紡織科技英語詞匯進行語義信息融合和檢索,實現(xiàn)詞匯信息的準確分類,提高紡織科技英語強化訓練水平,研究用于紡織科技英語強化訓練的詞匯分類方法具有重要意義.
由于紡織科技英語強化訓練的詞匯為一組非線性語義特征序列,采用語義本體模型構(gòu)建和語義特征提取方法進行英語詞匯的分類研究具有可行性.傳統(tǒng)方法中,對用于紡織科技英語強化訓練的詞匯分類方法主要有K-Means法、模糊C均值聚類算法、K均值聚類算法、遺傳算法、粒子群進化算法以及BP神經(jīng)網(wǎng)絡(luò)模糊控制算法等[1-3],用于紡織科技英語強化訓練的詞匯是通過云計算和云存儲方式進行加工和處理,通過提取詞匯的語義信息特征,對特征進行分類處理,結(jié)合信息融合法和分裂法實現(xiàn)詞匯分類,根據(jù)上述原理,相關(guān)學者進行了詞匯分類算法研究,其中,文獻[4]提出基于混沌特征擾動模糊C均值聚類的英語詞匯語義特征分解和聚類算法,采用特征分割方法進行詞匯屬性特征提取和統(tǒng)計,使得用于紡織科技英語強化訓練的詞匯屬性特征提取過程滿足收斂性要求,提高詞匯數(shù)據(jù)分類的準確性,但是該算法計算開銷較大,特征分類實時性不好;文獻[5]提出基于序貫重采樣蟻群濾波的紡織科技英語強化訓練詞匯優(yōu)化聚類方法,該方法舍棄了低權(quán)值聚類中心的多樣性信息,降低了計算開銷,提高了數(shù)據(jù)聚類的收斂性,但是在較大詞匯相關(guān)信息的擾動時,詞匯分類的信息融合中心出現(xiàn)失真和位置偏移,導致詞匯分類準確度下降,性能不佳[6-10].因此,提出一種基于英語詞匯語義指向性信息素濃度聚焦和模糊C均值聚類的紡織科技英語強化訓練詞匯分類模型.構(gòu)建紡織科技英語強化訓練詞匯分布數(shù)據(jù)結(jié)構(gòu)分析和詞匯語義特征序列模型,提取英語詞匯語義指向性信息素濃度特征,對提取的詞匯語義信息特征進行模糊C均值聚類算法研究和改進,實現(xiàn)詞匯的有效分類,最后通過仿真實驗進行了性能測試,得出有效性結(jié)論.
圖 1 紡織科技英語強化訓練詞匯 分類總體構(gòu)架Fig.1 Vocabulary classification framework of textile science and technology English intensive training
為了實現(xiàn)對用于紡織科技英語強化訓練詞匯的優(yōu)化分類,首先需要分析用于紡織科技英語強化訓練詞匯在詞匯信息云存儲系統(tǒng)中的分布式結(jié)構(gòu)模型,用于紡織科技英語強化訓練的詞匯采用的是I/O虛擬計算機和USB接口層進行詞匯信息和存儲和傳輸調(diào)度,設(shè)當前英語詞匯的信息流在時序滑動窗口中的第i個語義特征幾何結(jié)構(gòu)本體模型記為CF=
根據(jù)圖1所示的總體模型,采用字符串的匹配技術(shù),將標記為Mountain的節(jié)點以及模型利用字符串匹配方法進行相似度特征分解,得到S1和S2間相似度的公式為
(1)
2.1 詞匯語義指向性信息素濃度聚焦特征提取模型
通過對紡織科技英語詞匯進行語義信息融合和檢索,實現(xiàn)詞匯信息的準確分類,可提高紡織科技英語強化訓練水平.傳統(tǒng)方法采用基于序貫重采樣蟻群濾波算法的紡織科技英語強化訓練詞匯分類,由于特征提取過程中抗干擾性不強,詞匯分類信息融合中心出現(xiàn)失真和位置偏移,導致詞匯分類準確度下降[16-20],為了克服傳統(tǒng)方法的弊端,本文提出一種基于英語詞匯語義指向性信息素濃度聚焦和模糊C均值聚類的紡織科技英語強化訓練詞匯分類模型,首先給出基礎(chǔ)概念.
定義2 (詞匯語義指向性信息素濃度的聚集交叉項)若詞匯語義指向性信息素濃度特征提取的時頻平面任意點(t,f)通過聚類相似性特征提取,記SB,則令聚類目標函數(shù)在采樣時序i時的鄰近點(t-t′,f-f′)上的近鄰樣本數(shù)為SBi={bi-w+1,bi-w+2,...,bi},來自多分量時頻坐標(t,f)的函數(shù)為聯(lián)合搜索X、Y所得到的詞匯信息相似度交叉項.若詞匯分類窗口數(shù)為n,則詞匯語義指向性信息素濃度sbi(span)=n*p.
根據(jù)上述定義,得到詞匯語義指向性信息素濃度聚焦特征對象結(jié)構(gòu)的干擾向量模型表達式為
(2)
式中:a(t)為概念間層次關(guān)系本體模型的信息幅度.節(jié)點概念深度特征空間的尺度信息z(t)的瞬時幅度可通過離散傅里葉變換計算,構(gòu)建詞匯語義指向性信息素濃度的相關(guān)函數(shù).假設(shè)英語詞匯數(shù)據(jù)庫中語義信息數(shù)據(jù)挖掘過程的特征分布的有限數(shù)據(jù)集為
(3)
式中:P(X)、P(Y)是語義內(nèi)容X、Y在集合頁面數(shù)的動態(tài)差異性特征.通過詞匯語義指向性信息素濃度聚焦特征提取和分類,得到n個樣本特征分解結(jié)果,以此為特征輸入進行詞匯分類.
2.2 詞匯分類算法改進實現(xiàn)
在上述進行詞匯語義指向性信息素濃度聚焦分析的基礎(chǔ)上,在英語詞匯主題特征空間中,采用領(lǐng)域知識和模式匹配方法,結(jié)合模糊C均值聚類進行詞匯分類算法改進,在詞匯語義指向性梯度下降方向,計算詞匯分類融合中心權(quán)值為
(4)
(5)
對于含有n個樣本的有限數(shù)據(jù)集,構(gòu)造短文檔向量空間,其中主題特征樣本為xi,i=1,2,…,n,英語詞匯語義指向性擾動矢量為
(6)
對短文檔的向量空間進行相位合成,把語義特征數(shù)據(jù)集合X分為K類,采用模糊C均值算法對用于紡織科技英語強化訓練的詞匯進行正則化計算及加權(quán)平均,結(jié)合兩個詞語相似性的度量實現(xiàn)分類控制和模糊判決,判決函數(shù)為
(7)
式中:Vi為向量空間詞匯分類中心的第i個矢量.根據(jù)個體最優(yōu)和搜索詞條的向量空間得到第i個聚類中心矢量,修正每個向量vi,則模糊劃分矩陣表示為
(8)
圖 2 用于紡織科技英語強化訓練的 詞匯文本特征匹配Fig.2 Lexical text feature matching for intensive training in textile science and technology English
式中:c為搜索步數(shù);μik為最大特征值的詞語泛函集,由此實現(xiàn)基于詞匯語義指向性信息素濃度聚焦的詞匯分類.利用主題詞表實現(xiàn)對用于紡織科技英語強化訓練的詞匯的特征匹配,實現(xiàn)框圖如圖2所示.
根據(jù)上述分析,用于紡織科技英語強化訓練詞匯分類的實現(xiàn)步驟描述為
(1) 輸入主題詞中的語義特征數(shù)據(jù)集合X到語義信息搜索引擎中;
(3) 對每個文檔di計算描述文本的語義信息向量vi,vi=((w1,t1),(w2,t2),…(wj,tj)),其中,wj表示文檔中詞匯語義指向性;tj表示wj的敘詞表特征值;
(5) 對各分向量進行標引、存儲和檢索,通過樹狀層次結(jié)構(gòu)進行信息拓撲,得到英語詞匯分類結(jié)果集R(X)的中心向量C(X),選擇搜索結(jié)果滿足:
(9)
(6) 同樣,計算出英語詞匯Y的語義指向性信息素濃度,綜合詞語相似度結(jié)果確定詞匯分類的中心向量C(Y),則X、Y的相似度為
(10)
根據(jù)語義相似性比較詞語特征值,通過英語詞匯語義指向性信息素濃度聚焦和模糊C均值聚類,實現(xiàn)紡織科技英語強化訓練詞匯分類.
為了測試改進詞匯分類算法在實現(xiàn)紡織科技英語強化訓練詞匯分類中的性能,進行仿真實驗.實驗采用Matlab仿真軟件,仿真實驗中,測試數(shù)據(jù)來自于Textile Science Technology紡織科技實驗室提供的CWT200G紡織科技英語強化訓練詞匯分數(shù)據(jù)庫,英語詞匯特征信息采樣的歸一化初始頻率f1=0.8Hz;終止頻率f2=0.15Hz;紡織科技英語強化訓練詞匯的圖一聚類空間半徑設(shè)為R=16,詞語相似度的特征片段閾值設(shè)為μ=12;主題詞表特征空間的維度設(shè)置為20;其他參量設(shè)定為Gmax=30;D=12;c=3;NP=30;詞匯分類的干擾強度擾動范圍為-10~10dB;干擾比特率為0.67 Bps/s;詞匯分類的加速因子為2.根據(jù)上述仿真環(huán)境和參數(shù)設(shè)定,進行用于紡織科技英語強化訓練的詞匯分類仿真,紡織科技英語強化訓練的詞匯為一組語義特征序列,進行語義特征序列時域模型構(gòu)建和采樣,得到兩個采樣通道的原始數(shù)據(jù)信息的采樣時域波形,如圖3所示.以上述采樣的英語強化訓練詞匯語義特征為訓練集(imf1)和測試集(imf2),進行英語詞匯語義指向性信息素濃度聚焦分析,計算英語詞匯分類的相似度信息,構(gòu)建主題詞表,得到英語詞匯語義指向性信息素濃度聚焦結(jié)果如圖4所示.
圖 3 紡織科技英語強化訓練詞匯語義特征序列時域模型構(gòu)建濃度聚焦 圖 4 英語詞匯語義指向性信息素Fig.3 Vocabulary semantic feature sequence time domain model construction of textile science Fig.4 English lexical semantic orientation pheromone concentration focusing and technology English intensive training
抽取主題詞表中紡織科技英語強化訓練詞語對共2 902對,進行詞匯分類,得到詞匯分類結(jié)果如圖5所示,從圖可見,采用本文方法進行詞匯分類,具有較好的語義特征聚焦性能,分類的準確度較高,收斂性較好.為了定量對比算法性能,采用本文方法和傳統(tǒng)方法,以英語強化訓練詞匯分類查準率為測試指標進行對此分析,得到仿真結(jié)果如圖6所示,從圖6可見,采用本文方法進行英語詞匯分類,提高了對詞匯的查準性能.
圖 5 主題詞表詞語分類輸出仿真結(jié)果 圖 6 查準率對比 Fig.5 Simulation results of thesaurus Fig.6 Precision comparison words classification output
本文提出一種基于英語詞匯語義指向性信息素濃度聚焦和模糊C均值聚類的紡織科技英語強化訓練詞匯分類模型.通過分析紡織科技英語強化訓練詞匯分布數(shù)據(jù)結(jié)構(gòu)構(gòu)建詞匯語義特征序列模型,提取英語詞匯語義指向性信息素濃度特征,在此基礎(chǔ)上,進行模糊C均值聚類算法研究和改進,實現(xiàn)詞匯的有效分類.研究結(jié)果表明,采用本文方法進行紡織科技英語強化訓練詞語的語義特征分析和詞匯分類,準確度較高,抗干擾性能較好,詞匯查準率高,展示了較好的應(yīng)用性能.
[1] 孫延.基于蟻群算法的紡織企業(yè)生產(chǎn)調(diào)度技術(shù)研究[J].電子設(shè)計工程,2015,23(18):116-118.
SUNYan.Researchonschedulingworkshopproductionofmoderntextileenterprises[J].ElectronicDesignEngineering, 2015, 23(18):116-118.
[2] 文天柱,許愛強,程恭. 基于改進ENN2 聚類算法的多故障診斷方法[J]. 控制與決策, 2015, 30(6): 1021-1026.
隨著r提高,流經(jīng)各受熱面的煙氣流速增加,加強了對各受熱面的擾動程度,各受熱面煙氣對流放熱系數(shù)均呈顯著增長趨勢。對于各受熱面?zhèn)鳠嵯禂?shù),隨著r提高,爐膛上部分隔屏過熱器及后屏過熱器受熱面?zhèn)鳠嵯禂?shù)基本不變;高溫過熱器傳熱系數(shù)略有增長;尾部煙道的省煤器傳熱系數(shù)增長顯著。
WENTianzhu,XUAiqiang,CHNEGGong.Multi-faultdiagnosismethodbasedonimprovedENN2clusteringalgorithm[J].ControlandDecision, 2015, 30(6): 1021-1026.
[3] 邢長征, 劉劍. 基于近鄰傳播與密度相融合的進化數(shù)據(jù)流聚類算法[J]. 計算機應(yīng)用, 2015, 35(7): 1927-1932.
XINGChangzheng,LIUJian.Evolutionarydatastreamclusteringalgorithmbasedonintegrationofaffinitypropagationanddensity[J].JournalofComputerApplications, 2015, 35(7): 1927-1932.
[4] 陶新民, 宋少宇, 曹盼東,等. 一種基于流形距離核的譜聚類算法[J]. 信息與控制, 2012,19(3): 307-313.
TAOXinmin,SONGShaoyu,CAOPandong,etal.Aspectralclusteringalgorithmbasedonmanifolddistancekernel[J].InformationandControl, 2012,19(3): 307-313.
[5]GLENTISGO,JAKOBSSONA,ANGELOPOULOSK.Block-recursiveIAA-basedspectralestimateswithmissingsamplesusingdatainterpolation[C]∥InternationalConferenceonAcoustics,SpeechandSignalProcessing(ICASSP),F(xiàn)lorence, 2014: 350-354.
[6]SUNW,SOHC,CHENY,etal.Approximatesubspace-basediterativeadaptiveapproachforfasttwo-dimensionalspectralestimation[J].IEEETransactionsonSignalProcessing, 2014, 62(12): 3220-3231.
[7] 田剛, 何克清, 王健, 等. 面向領(lǐng)域標簽輔助的服務(wù)聚類方法[J]. 電子學報, 2015, 43(7): 1266-1274.
TIANGang,HEKeqing,WANGJian,etal.Domain-orientedandtag-aidedwebserviceclusteringmethod[J].ChineseJournalofElectronics, 2015, 43(7): 1266-1274.
[8] 吳濤,陳黎飛,郭躬德. 優(yōu)化子空間的高維聚類算法[J]. 計算機應(yīng)用, 2014, 34(8): 2279-2284.
WUTao,CHENLifei,GUOGongde.High-dimensionaldataclusteringalgorithmwithsubspaceoptimization[J].JournalofComputerApplications, 2014, 34(8): 2279-2284.
[9] 辛宇,楊靜,湯楚蘅,等. 基于局部語義聚類的語義重疊社區(qū)發(fā)現(xiàn)算法[J]. 計算機研究與發(fā)展, 2015, 52(7): 1510-1521.
XINYu,YANGJing,TANGChuheng,etal.Anoverlappingsemanticcommunitydetectionalgorithmbasedonlocalsemanticcluster[J].JournalofComputerResearchandDevelopment, 2015, 52(7): 1510-1521.
[10]LIAOLüchao,JIANGXinhua,ZOUFumin,etal.Aspectralclusteringmethodforbigtrajectorydataminingwithlatentsemanticcorrelation[J].ChineseJournalofElectronics, 2015, 43(5): 956-964.
[11] 余曉東,雷英杰,岳韶華,等.基于粒子群優(yōu)化的直覺模糊核聚類算法研究[J].通信學報,2015,13(5):99
YUXiaodong,LEIYingjie,YUEShaohua,etal.ResearchonPSO-basedintuitionisticfuzzykernelclusteringalgorithm[J].JournalofCommunication, 2015,13(5):99.
[12]XINYu,YANGJing,TANGChuheng,etal.Anoverlappingsemanticcommunitydetectionalgorithmbasedonlocalsemanticcluster[J].JournalofComputerResearchandDevelopment, 2015, 52(7): 1510-1521.
[13] 馬俊濤,高梅國,董健. 基于稀疏迭代協(xié)方差估計的缺失數(shù)據(jù)譜分析及時域重建方法[J]. 電子與信息學報, 2016, 38(6): 1431-1437.
MAJuntao,GAOMeiguo,DONGJian.Sparseiterativecovarianceestimation-basedapproachforspectralanalysisandreconstructionofmissingdata[J].JournalofElectronics&InformationTechnology,2016, 38(6): 1431-1437.
[14]KARLSSONJ,ROWEW,XUL,etal.Fastmissing-dataIAAwithapplicationtonotchedspectrumSAR[J].IEEETransactionsonAerospaceElectronicSystems, 2014, 50(2): 959-971.
[15]PARKHR,LIJie.Sparsecovariance-basedhighresolutiontimedelayestimationforspreadspectrumsignals[J].ElectronicsLetters, 2015, 51(2): 155-157.
[16] 劉俊,劉瑜,何友,等. 雜波環(huán)境下基于全鄰模糊聚類的聯(lián)合概率數(shù)據(jù)互聯(lián)算法[J]. 電子與信息學報, 2016, 38(6): 1438-1445.
LIUJun,LIUYu,HEYou,etal.Jointprobabilisticdataassociationalgorithmbasedonall-neighborfuzzyclusteringinclutter[J].JournalofElectronicsandInformationTechnology, 2016, 38(6): 1438-1445.
[17]BAESH,YOONKJ.Robustonlinemultiobjecttrackingwithdataassociationandtrackmanagement[J].IEEETransactionsonImageProcessing, 2014, 23(7): 2820-2833.
[18]JIANGX,HARISHANK,THAMARASAR,etal.Integratedtrackinitializationandmaintenanceinheavyclutterusingprobabilisticdataassociation[J].SignalProcessing, 2014,14(14):241-250.
[19]LIL,XIEW.Intuitionisticfuzzyjointprobabilisticdataassociationfilteranditsapplicationtomultitargettracking[J].SignalProcessing, 2014,14(26):241-250.
[20]ZHAOH.Nationallaureatesfortextilescienceandtechnology[J].ChinaTextile, 2015,13(1):60-62.
編輯、校對:趙 放
Vocabulary classification method for intensive training of textile science and technology English
LI Ganggang,ZHAO Tingting
(Department of College English, Yuncheng University,Yuncheng 044000,Shanxi,China)
In order to improve the training of textile science and technology English,and complete the accurate classification of lexical information. A new vocabulary classification model is proposed for textile science and technology English intensive training based on the semantic orientation of English lexical semantic orientation and fuzzy C-means clustering. By vocabulary distribution data structure analyzing,a semantic feature sequence model is construded, removing lexical semantic directivity pheromone concentration focus characteristics,and using the improved fuzzy C-means clustering algorithm to achieve optimal classification of vocabulary. The simulation results show that the vocabulary classification, has better focusing semantic features, classification accuracy,and convergence, and it can improve the vocabulary recall and precision performance.
textile science and technology; English intensive training; vocabulary classification; semantic
1674-649X(2016)04-0440-06
10.13338/j.issn.1674-649x.2016.04.006
2016-02-12
運城學院教學改革項目(JG201428)
李崗崗(1985—), 男,甘肅省天水市人,運城學院講師,研究方向為二語習得與測試及語言學.
E-mail:lgg-snow@163.com
李崗崗,趙婷婷.紡織科技英語強化訓練的詞匯分類方法[J].西安工程大學學報,2016,30(4):440-445.
LI Ganggang,ZHAO Tingting.Vocabulary classification method for intensive training of textile science and technology English[J].Journal of Xi′an Polytechnic University,2016,30(4):440-445.
TP391
A