方志堅(jiān) 程玉 金耀 湯哲沖 徐錦英
DOI: 10.19398j.att.202401018
摘? 要: 服裝產(chǎn)業(yè)是全球最重要的制造行業(yè)之一,而服裝產(chǎn)業(yè)鏈圖譜則是服裝產(chǎn)業(yè)生態(tài)中的重要工具。為了服裝相關(guān)企業(yè)能快速、準(zhǔn)確掛鏈,文章研究并構(gòu)建服裝產(chǎn)業(yè)鏈圖譜,將產(chǎn)業(yè)鏈中的鏈點(diǎn)、關(guān)系和屬性進(jìn)行建模和表示,再通過企業(yè)信息收集和企業(yè)關(guān)鍵詞提取構(gòu)建企業(yè)信息數(shù)據(jù)庫,從而提出了一種產(chǎn)業(yè)鏈企業(yè)自動(dòng)掛鏈算法。該算法基于CoSENT模型計(jì)算企業(yè)關(guān)鍵詞和產(chǎn)業(yè)鏈鏈點(diǎn)之間的相似性,并通過自定義規(guī)則對(duì)匹配結(jié)果進(jìn)行過濾,進(jìn)而評(píng)估關(guān)鍵詞和鏈點(diǎn)之間的相關(guān)性,自動(dòng)匹配和選擇最優(yōu)的產(chǎn)業(yè)鏈圖譜鏈點(diǎn),實(shí)現(xiàn)企業(yè)的產(chǎn)業(yè)鏈自動(dòng)掛鏈。通過與其他匹配算法的對(duì)比實(shí)驗(yàn)表明,該算法在F1-Measure指標(biāo)上明顯優(yōu)于其他算法(比基于Jaccard方法高14%,比Word2Vec方法高10.5%,比SBERT方法高2.5%),顯著提升了企業(yè)掛鏈效率和準(zhǔn)確性,為優(yōu)化服裝產(chǎn)業(yè)鏈圖譜提供了有力的支撐和參考。
關(guān)鍵詞:服裝產(chǎn)業(yè)鏈;產(chǎn)業(yè)鏈圖譜;自動(dòng)掛鏈算法;CoSENT模型
中圖分類號(hào):TS101.8; TP391.1
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1009-265X(2024)06-0108-08
收稿日期:20240115
網(wǎng)絡(luò)出版日期:20240326
基金項(xiàng)目:浙江省軟科學(xué)研究計(jì)劃項(xiàng)目(2024C35031); 浙江省高等教育“十四五”教學(xué)改革項(xiàng)目(jg20220192)
作者簡(jiǎn)介:方志堅(jiān)(1983—),男,浙江浦江人,工程師,主要從事學(xué)術(shù)大數(shù)據(jù)和產(chǎn)業(yè)大數(shù)據(jù)方面的研究。
通信作者:徐錦英,E-mail:793032295@qq.com
隨著信息技術(shù)的迅猛發(fā)展,數(shù)字化轉(zhuǎn)型已成為企業(yè)維持競(jìng)爭(zhēng)力和推動(dòng)持續(xù)創(chuàng)新的關(guān)鍵路徑。在此背景下,傳統(tǒng)服裝行業(yè)正面臨著科技高速發(fā)展與消費(fèi)者需求增長(zhǎng)的雙重驅(qū)動(dòng),既帶來了前所未有的機(jī)遇,也伴隨著諸多挑戰(zhàn)。因此,實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型已成為行業(yè)的迫切需求[1]。其中,服裝產(chǎn)業(yè)鏈圖譜的建設(shè)作為數(shù)字化轉(zhuǎn)型的核心環(huán)節(jié),備受關(guān)注。這一圖譜通過數(shù)字化技術(shù),將整個(gè)服裝產(chǎn)業(yè)鏈進(jìn)行可視化呈現(xiàn),旨在提升效率、降低成本并優(yōu)化資源配置,進(jìn)而增強(qiáng)企業(yè)的競(jìng)爭(zhēng)力和市場(chǎng)地位[2-3]。
服裝產(chǎn)業(yè)鏈圖譜的研究不僅涉及對(duì)整個(gè)產(chǎn)業(yè)鏈的可視化呈現(xiàn),更深入地聚焦于企業(yè)掛鏈的研究。企業(yè)掛鏈,是指根據(jù)企業(yè)的產(chǎn)品、技術(shù)及其在產(chǎn)業(yè)鏈中的位置,將企業(yè)與特定的產(chǎn)業(yè)鏈鏈點(diǎn)進(jìn)行精準(zhǔn)關(guān)聯(lián),從而構(gòu)建緊密的合作關(guān)系。這一過程對(duì)于確定企業(yè)在產(chǎn)業(yè)鏈中的具體位置、分析企業(yè)間的關(guān)聯(lián)關(guān)系以及優(yōu)化資源配置等方面具有重要意義,對(duì)產(chǎn)業(yè)招商、提高生產(chǎn)效率、降低成本等同樣具有深遠(yuǎn)的影響。
傳統(tǒng)的企業(yè)掛鏈方法主要依賴于人工查看企業(yè)信息并進(jìn)行標(biāo)簽標(biāo)注,這種方法不僅耗時(shí)費(fèi)力,而且由于數(shù)據(jù)支撐不足和缺乏統(tǒng)一判斷標(biāo)準(zhǔn),其效率和效果均不盡如人意[4-5]。目前針對(duì)企業(yè)產(chǎn)業(yè)鏈自動(dòng)掛鏈算法的研究相對(duì)較少,現(xiàn)有的研究工作主要聚焦于利用文本信息挖掘和機(jī)器學(xué)習(xí)的方法來構(gòu)建和分析產(chǎn)業(yè)鏈圖譜,以及生成企業(yè)標(biāo)簽和畫像[6-8]。此外,傳統(tǒng)的相似度計(jì)算算法如Jaccard和Word2Vec在鏈點(diǎn)特征關(guān)鍵詞和企業(yè)畫像關(guān)鍵詞的相似度計(jì)算上,其準(zhǔn)確度和效率也有待進(jìn)一步提高[9-11]。目前中國(guó)紡織服裝類企業(yè)數(shù)量龐大,已達(dá)154萬余家,如何高效、精準(zhǔn)地將這些企業(yè)關(guān)聯(lián)到相應(yīng)的產(chǎn)業(yè)鏈鏈點(diǎn),成為了一個(gè)亟待解決的問題。
鑒于上述問題和挑戰(zhàn),本文提出了一種基于CoSENT模型的服裝企業(yè)產(chǎn)業(yè)鏈掛鏈算法。這一算法旨在借助機(jī)器學(xué)習(xí)技術(shù),自動(dòng)處理海量的服裝企業(yè)信息,為企業(yè)掛鏈提供一套更為高效和可行的解決方案。
1? 服裝產(chǎn)業(yè)鏈框架及數(shù)據(jù)處理
1.1? 服裝產(chǎn)業(yè)鏈圖譜構(gòu)建
為了深入探討中國(guó)服裝產(chǎn)業(yè)的結(jié)構(gòu)和內(nèi)在運(yùn)作機(jī)制,了解產(chǎn)業(yè)鏈的各個(gè)環(huán)節(jié)及其相互關(guān)系顯得尤為重要。服裝產(chǎn)業(yè)鏈圖譜作為一種直觀且系統(tǒng)的展示方式,為企業(yè)生產(chǎn)提供了寶貴的參考。敖利民等[12]提出中國(guó)紡織服裝產(chǎn)業(yè)的產(chǎn)業(yè)鏈環(huán)(生產(chǎn)部門)劃分長(zhǎng)期保持計(jì)劃體制時(shí)期的狀態(tài),即依據(jù)原料、紗線、坯布、服裝的產(chǎn)品鏈,將產(chǎn)業(yè)劃分為原材料企業(yè)、紡紗企業(yè)、織造企業(yè)、印染企業(yè)、服裝企業(yè)的產(chǎn)業(yè)鏈環(huán)布局,技術(shù)關(guān)聯(lián)度高的產(chǎn)業(yè)部門如紡紗、織造和印染等被劃分成多個(gè)產(chǎn)業(yè)鏈環(huán)。蘇丹等[13]聚焦于可持續(xù)發(fā)展的服裝產(chǎn)業(yè)鏈構(gòu)建,采用綠色環(huán)保型纖維,可使紡織品行業(yè)的環(huán)境保護(hù)力度得到整體提升。
本文在構(gòu)建服裝產(chǎn)業(yè)鏈圖譜的過程中,通過訪問行業(yè)協(xié)會(huì)的官方網(wǎng)站、專業(yè)媒體的網(wǎng)站以及市場(chǎng)研究機(jī)構(gòu)的網(wǎng)站,獲取最新的行業(yè)動(dòng)態(tài)、趨勢(shì)分析和市場(chǎng)報(bào)告等信息。并與行業(yè)內(nèi)的專家、從業(yè)者和供應(yīng)商進(jìn)行交流,深入了解服裝產(chǎn)業(yè)鏈的各個(gè)環(huán)節(jié)和參與者以及服裝產(chǎn)業(yè)鏈的具體鏈點(diǎn)信息。本文充分運(yùn)用以上多種方式來定義服裝領(lǐng)域的模型、概念和關(guān)系。通過對(duì)產(chǎn)業(yè)鏈的研究和分析,明確了上中下游的分類,圖1為服裝上中下游產(chǎn)業(yè)鏈關(guān)系圖,上游環(huán)節(jié)主要涉及原材料供應(yīng)和設(shè)備,這為中游和下游提供了必要的資源支持。中游環(huán)節(jié)承擔(dān)著紡織品的生產(chǎn)和加工任務(wù),將原材料轉(zhuǎn)化為半成品或成品,為下游企業(yè)提供各種類型的面料和紡織品。而下游環(huán)節(jié)則致力于成衣的設(shè)計(jì)、制造和銷售,將紡織品轉(zhuǎn)化為最終的成衣產(chǎn)品,并將其推向市場(chǎng)。這3個(gè)環(huán)節(jié)之間相互依賴、相互合作,構(gòu)成了完整的服裝產(chǎn)業(yè)鏈。
定義服裝產(chǎn)業(yè)鏈上中下游,有助于建立完整的服裝產(chǎn)業(yè)鏈圖譜。通過圖譜,可以更清晰地了解產(chǎn)業(yè)鏈的結(jié)構(gòu)和相互關(guān)系,本文所構(gòu)建的服裝產(chǎn)業(yè)鏈圖譜概念圖如圖2所示。在圖譜中,每個(gè)結(jié)點(diǎn)代表著產(chǎn)業(yè)鏈中的主體實(shí)體,而邊則表示主體之間的隸屬關(guān)系。這種圖譜的表示方式實(shí)現(xiàn)了產(chǎn)業(yè)鏈各個(gè)環(huán)節(jié)和主體之間信息的連接和共享,以一種知識(shí)圖形化的視角展現(xiàn)了產(chǎn)業(yè)的運(yùn)行機(jī)制。
1.2? 數(shù)據(jù)采集及處理
1.2.1? 企業(yè)信息收集
企業(yè)信息及其獲取過程往往具有分散、不透明、難以獲取和驗(yàn)證等特點(diǎn),這為企業(yè)合作、投資和決策帶來了一定困難。隨著企業(yè)管理數(shù)字化進(jìn)程的推進(jìn),越來越多的企業(yè)建立了集中、可靠的企業(yè)信息平
臺(tái)[14]。在本文中,企業(yè)數(shù)據(jù)主要來源于第三方數(shù)據(jù)源。首先采用網(wǎng)絡(luò)爬蟲技術(shù)[15-16],編寫程序訪問第三方數(shù)據(jù)源和目標(biāo)企業(yè)的官方網(wǎng)頁;其次,對(duì)獲取的數(shù)據(jù)進(jìn)行網(wǎng)頁解析和數(shù)據(jù)提取。后續(xù)步驟涉及文本預(yù)處理,包括去除HTML標(biāo)簽、特殊字符和分詞等操作,整個(gè)爬取過程如圖3所示。
1.2.2? 關(guān)鍵詞提取
在獲取企業(yè)信息后,需要對(duì)預(yù)處理后的文本進(jìn)行關(guān)鍵詞提取。由于企業(yè)經(jīng)營(yíng)范圍內(nèi)容較為特殊,通常由多個(gè)關(guān)鍵詞、短語或句子組成,因此無需使用復(fù)雜的文本挖掘技術(shù)。如圖4所示,只需將待提取關(guān)鍵詞中的文本句子進(jìn)行分詞,使用NLP分詞技術(shù)將文本拆分成一個(gè)個(gè)詞語或短語,再進(jìn)行去重操作[17-18],就可以得到企業(yè)關(guān)鍵詞。而一般中小型企業(yè)專利信息較少,只需在分詞后去除停用詞(如常見的連接詞、代詞等),進(jìn)行詞干化或詞形還原,去重后并輔助與人工進(jìn)行篩選就能獲得企業(yè)專利關(guān)鍵詞。
2? 企業(yè)自動(dòng)掛鏈方法
2.1? 算法步驟及流程圖
企業(yè)自動(dòng)掛鏈算法步驟描述如下:
Step1:將每個(gè)企業(yè)關(guān)鍵詞分別看作一類構(gòu)成集合A={a1,a2,...,an} ;
Step2:統(tǒng)一關(guān)鍵詞的大小寫,并去除特殊符號(hào)(例如逗號(hào)、分號(hào)、連接符等);
Step3:根據(jù)ConSNET模型計(jì)算企業(yè)關(guān)鍵詞與預(yù)定義產(chǎn)業(yè)鏈點(diǎn)之間的相似度;
Step4:如果大于設(shè)定的閾值且匹配結(jié)果符合制定的先驗(yàn)規(guī)則添加到映射表中;
Step5:如果類集合中類的個(gè)數(shù)大于1,則重復(fù)步驟3,步驟4,否則跳到步驟6;
Step6:結(jié)束。
算法的整體流程如圖5所示,其中L表示預(yù)定義產(chǎn)業(yè)鏈鏈點(diǎn)的數(shù)量。
2.2? 基于CoSENT模型的關(guān)鍵詞匹配
CoSENT模型是一種基于BERT模型的神經(jīng)網(wǎng)絡(luò)模型[19-20],該模型的網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示。本文基于CoSENT模型計(jì)算企業(yè)關(guān)鍵詞和產(chǎn)業(yè)鏈鏈點(diǎn)之間的相似性,并通過自定義規(guī)則對(duì)匹配結(jié)果進(jìn)行過濾,進(jìn)而評(píng)估關(guān)鍵詞和鏈點(diǎn)之間的相關(guān)性,實(shí)現(xiàn)企業(yè)的自動(dòng)掛鏈。
2.2.1? 特征嵌入
與傳統(tǒng)的文本匹配方法不同,CoSENT模型采用兩個(gè)權(quán)值共享的BERT模型作為編碼器獲得文本的向量表示。BERT模型是由Google提出的一種預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,其網(wǎng)絡(luò)結(jié)構(gòu)如圖7所示。該模型采用前饋神經(jīng)網(wǎng)絡(luò)并具有多層的自注意力機(jī)制,能夠進(jìn)一步提取文本特征并對(duì)文本中不同位置的詞匯賦予不同的權(quán)重,從而更好地捕捉文本序列的語義信息。
BERT模型輸入如圖8所示,文本中每個(gè)詞語的向量表示分別由詞嵌入(Token embeddings)、分段嵌入(Segment embeddings)和位置嵌入(Position embeddings)3種不同嵌入向量相加而成[21]。其中,詞嵌入是將每個(gè)詞語轉(zhuǎn)化為詞向量來表示其語義信息。分段嵌入是為了區(qū)分不同句子中的詞語。位置嵌入用于表示每個(gè)詞語的位置信息。此外,標(biāo)記[CLS]位于句子的開頭,用于表示整個(gè)句子的向量表示。標(biāo)記[SEP]位于句子中的不同部分,用于表示句子中不同段落之間的邊界。
2.2.2? 池化
為了得到輸入文本的向量表示,還需要對(duì)詞語的嵌入向量進(jìn)行池化。CoSENT模型包含以下3種不同的池化策略:
a)直接采用CLS位置的輸出向量代表整個(gè)語句的向量表示。
b)MEAN策略,計(jì)算各個(gè)token輸出向量的平均值代表整個(gè)語句的向量表示。
c)MAX策略,取所有輸出向量各個(gè)維度的最大值代表語句的向量表示。
本文采用MEAN策略,即取所有詞語向量表示的均值。
2.2.3? 損失函數(shù)
得到文本的向量表示后,為了更好地衡量它們之間的相似性和差異性,本文在傳統(tǒng)三元組數(shù)據(jù)(原始句子,相似句子,不相似句子)的基礎(chǔ)上,使用了一種基于余弦相似度的三元組損失函數(shù)來提高文本匹配的結(jié)果[22],損失函數(shù)如式(1):
ζ=log1+∑sim(i,j)>sim(k,l)eλ(cos(uk,ul)-cos(ui,uj))(1)
式中:i,j,k,l表示四個(gè)訓(xùn)練樣本,ui,uj,uk,ul表示樣本對(duì)應(yīng)的向量表示,cos()表示兩個(gè)向量之間的余弦相似度,sim()則表示它們之間的相似標(biāo)簽,λ是一個(gè)超參數(shù)。這樣做的目的是讓正樣本cos(ui,uj)之間的相似度大于負(fù)樣本cos(uk,ul)之間的相似度,而不需要找到一個(gè)精確的數(shù)值來區(qū)分正樣本對(duì)和負(fù)樣本對(duì)。這樣可以防止模型過擬合,并且有效地提高模型能力來區(qū)分語義相同但是字面相似度低的“困難樣本”。
3? 數(shù)值實(shí)驗(yàn)及結(jié)果分析
3.1? 數(shù)據(jù)集
為了驗(yàn)證CoSENT模型算法的有效性,同時(shí)方便對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行統(tǒng)計(jì),本文選取紡織領(lǐng)域1000條企業(yè)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。由于企業(yè)經(jīng)營(yíng)范圍信息中的關(guān)鍵詞通常涵蓋產(chǎn)品、服務(wù)、技術(shù)、行業(yè)、市場(chǎng)等多個(gè)方面,為提高后續(xù)企業(yè)精準(zhǔn)匹配產(chǎn)業(yè)鏈鏈點(diǎn),本文提取經(jīng)營(yíng)范圍前10個(gè)無重復(fù)關(guān)鍵詞和全部專利信息關(guān)鍵詞存于企業(yè)信息數(shù)據(jù)庫中,如表1所示。
3.2? 基準(zhǔn)方法
為了測(cè)試CoSENT模型算法的性能,本文與Jaccard、Word2Vec、SBERT 3種目前常用的文本匹配方法進(jìn)行了對(duì)比實(shí)驗(yàn)。這些方法的更多詳細(xì)介紹如下所示:
Jaccard:Jaccard指數(shù)是一種常用的文本相似度度量方法。本文采用Jaccard指數(shù)進(jìn)行鏈點(diǎn)特征關(guān)鍵詞和企業(yè)畫像關(guān)鍵詞匹配,并結(jié)合規(guī)則對(duì)匹配結(jié)果進(jìn)行過濾。
Word2Vec模型:Word2Vec模型是一種通過學(xué)習(xí)詞語在文本中的上下文信息來訓(xùn)練詞向量的方法,它可以將每個(gè)單詞映射為一個(gè)低維向量表示,通過計(jì)算句向量之間的相似度來衡量鏈點(diǎn)特征關(guān)鍵詞和企業(yè)畫像關(guān)鍵詞之間的相似性。
SBERT模型:SBERT模型是一種權(quán)衡性能和效率的句向量表示模型,它在訓(xùn)練時(shí)通過有監(jiān)督訓(xùn)練上層分類函數(shù)對(duì)BERT預(yù)訓(xùn)練模型進(jìn)行微調(diào)(Fine-tuning),從而得到更為準(zhǔn)確的句向量表示。預(yù)測(cè)時(shí)直接對(duì)鏈點(diǎn)特征關(guān)鍵詞和企業(yè)畫像關(guān)鍵詞進(jìn)行余弦相似度計(jì)算,以衡量它們之間的相似性。
CoSNET模型:CoSENT模型是在SBERT模型的基礎(chǔ)上引入一種基于余弦相似度的損失函數(shù),旨在使模型的訓(xùn)練過程更貼近預(yù)測(cè),從而提高模型的性能和泛化能力。
3.3? 實(shí)驗(yàn)結(jié)果及分析
主流匹配算法對(duì)比實(shí)驗(yàn)結(jié)果如表2所示,實(shí)驗(yàn)設(shè)置的評(píng)估指標(biāo)為準(zhǔn)確率(Precision)、召回率(Recall)和F1值(F1-Measure)。從表2中實(shí)驗(yàn)結(jié)果可見,本文提出的算法在F1值上要優(yōu)于其他對(duì)比方法(比基于Jaccard方法高14%,比Word2Vec方法高10.5%,比SBERT方法高2.5%)。
同時(shí),CoSENT模型算法實(shí)驗(yàn)結(jié)果表明本文所提出的基于知識(shí)圖譜的自動(dòng)掛鏈算法能夠顯著提升企業(yè)掛鏈準(zhǔn)確率。表3體現(xiàn)出算法能夠?yàn)槠髽I(yè)準(zhǔn)確匹配和選擇最佳的產(chǎn)業(yè)鏈鏈點(diǎn)。此外,算法在不同規(guī)模和復(fù)雜度的環(huán)境下均具有良好的適應(yīng)性和擴(kuò)展性。
4? 結(jié)語
本文基于深入研究和探索服裝產(chǎn)業(yè)鏈圖譜,提出了一種基于CoSENT模型的企業(yè)自動(dòng)掛鏈算法,并進(jìn)行了詳盡的實(shí)驗(yàn)設(shè)計(jì)和驗(yàn)證。算法通過利用CoSENT模型的強(qiáng)大能力,實(shí)現(xiàn)了對(duì)企業(yè)信息的自動(dòng)分析和處理,能夠自動(dòng)匹配和選擇最佳的產(chǎn)業(yè)鏈鏈點(diǎn)。通過與其他匹配算法的對(duì)比實(shí)驗(yàn)表明相較于傳統(tǒng)的Jaccard、Word2Vec、SBERT方法,該算法在F1-Measure這一關(guān)鍵指標(biāo)上展現(xiàn)出了顯著的優(yōu)越性,不僅提高了掛鏈的準(zhǔn)確率,還大幅提升了算法的運(yùn)行效率,為服裝產(chǎn)業(yè)鏈的數(shù)字化轉(zhuǎn)型提供了有力的技術(shù)支撐。
這一優(yōu)化算法在供應(yīng)鏈管理過程中具有廣闊的應(yīng)用前景。通過自動(dòng)匹配和選擇最佳的產(chǎn)業(yè)鏈鏈點(diǎn),服裝企業(yè)可以更快速地找到合適的供應(yīng)商和合作伙伴,從而大幅提升供應(yīng)鏈的響應(yīng)速度和運(yùn)營(yíng)效率。同時(shí),這也有助于企業(yè)更準(zhǔn)確地把握市場(chǎng)需求和變化,及時(shí)調(diào)整生產(chǎn)策略,提高市場(chǎng)競(jìng)爭(zhēng)力。此外,該算法還能幫助企業(yè)更好地了解和分析自身在產(chǎn)業(yè)鏈中的位置和關(guān)系。通過清晰地展示企業(yè)在產(chǎn)業(yè)鏈中的位置和與其他企業(yè)的關(guān)聯(lián)關(guān)系,企業(yè)可以更加清晰地認(rèn)識(shí)到自身的優(yōu)勢(shì)和不足,有助于企業(yè)制定更加科學(xué)合理的戰(zhàn)略規(guī)劃,并做出更明智的決策。
隨著大數(shù)據(jù)和人工智能技術(shù)的不斷發(fā)展、數(shù)據(jù)要素市場(chǎng)的不斷開放,有望搜集到更多、更全面的企業(yè)信息,包括公域數(shù)據(jù)以及業(yè)財(cái)數(shù)據(jù)等。這些豐富的數(shù)據(jù)資源將為構(gòu)建更加精細(xì)、準(zhǔn)確的企業(yè)畫像提供有力支持,從而進(jìn)一步提高掛鏈的效率和準(zhǔn)確性。
參考文獻(xiàn):
[1]熊興,王婧倩,陳文暉.新形勢(shì)下我國(guó)紡織服裝產(chǎn)業(yè)轉(zhuǎn)型升級(jí)研究[J].理論探索,2020(6):97-101.
XIONG Xing, WANG Jingqian, CHEN Wenhui. Research on the transformation and upgrading of China's textile and clothing industry under the new situation[J]. Theoretical Exploration, 2020(6): 97-101.
[2]常新.泰安市紡織服裝產(chǎn)業(yè)鏈高質(zhì)量發(fā)展路徑研究[J].化纖與紡織技術(shù),2023,52(6):7-9.
CHANG Xin. Research on the high-quality development path of textile and garment industry chain in Tai'an [J]. Chemical Fiber & Textile Technology, 2023, 52(6): 7-9.
[3]綜編.推動(dòng)產(chǎn)業(yè)鏈上下游協(xié)同合作、融通發(fā)展 2023全國(guó)紡織服裝產(chǎn)業(yè)鏈融鏈固鏈對(duì)接交流在魏橋舉行[J].紡織服裝周刊,2023(24):6.
ZONG Bian. Promote the upstream and downstream cooperation and development of the industrial chain in 2023, the national textile and garment industry chain was held in Wei Qiao[J]. Textile & Apparel Weekly, 2023(24): 6.
[4]楊偉杰. 基于知識(shí)圖譜的企業(yè)關(guān)系推理[D].哈爾濱: 哈爾濱工業(yè)大學(xué),2022:6-9.
YANG Weijie. Enterprise Relationship Inference Based on Knowledge Graph [D]. Harbin: Harbin Institute of Technology, 2022:6-9.
[5]楊傳龍, 王金龍. 基于NLP的企業(yè)供應(yīng)關(guān)系自動(dòng)抽取研究[J].計(jì)算機(jī)科學(xué)與應(yīng)用, 2018, 8(12): 1823-1832.
YANG Chuanlong, WANG Jinlong. Research on automatic extraction of enterprise supply relationship based on.
NLP [J]. Computer Science and Application, 2018, 8(12):1823-1832.
[6]宋華峰. 區(qū)域性服裝產(chǎn)業(yè)數(shù)字化大腦平臺(tái)的規(guī)劃與設(shè)計(jì)[D].杭州:浙江理工大學(xué),2022:28-51.
SONG Huafeng. Planning and Design of Regional Garment Industry Digital Information System [D]. Hangzhou: Zhejiang Sci-Tech University, 2022:28-51.
[7]田娟,朱定局,楊文翰.基于大數(shù)據(jù)平臺(tái)的企業(yè)畫像研究綜述[J].計(jì)算機(jī)科學(xué),2018,45(S2):58-62.
TIAN Juan, ZHU Dingju, YANG Wenhan. Research on enterprise portraits based on big data platforms[J].Computer Science,2018,45(S2):58-62.
[8]劉海. 大數(shù)據(jù)時(shí)代服裝精準(zhǔn)營(yíng)銷下的服務(wù)策略研究[D].上海;上海工程技術(shù)大學(xué),2016:50-54.
LIU Hai. Research on Service of Precision Marketing on Clothing in Era of Big Data [D].Shanghai;Shanghai University of Engineering Science, 2016:50-54.
[9]俞婷婷,徐彭娜,江育娥,等.基于改進(jìn)的Jaccard系數(shù)文檔相似度計(jì)算方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2017,26(12):137-142.
YU Tingting, XU Pengna, JIANG Yu'e, et al. Text similarity method based on the improved jaccard coefficient[J].Computer Systems & Applications,2017,26(12):137-142.
[10]唐明,朱磊,鄒顯春.基于Word2Vec的一種文檔向量表示[J].計(jì)算機(jī)科學(xué),2016,43(6):214-217.
TANG Ming, ZHU Lei, ZOU Xianchun. Document vector representation based on word2Vec[J].Computer Science,2016,43(6):214-217.
[11]周練.Word2vec的工作原理及應(yīng)用探究[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2015,25(2):145-148.
ZHOU Lian. Exploration of the working principle and application of Word2vec[J]. Sci-Tech Information Develo-pment & Economy, 2015, 25(2): 145-148.
[12]敖利民,唐雯,李向紅,等.我國(guó)紡織服裝產(chǎn)業(yè)鏈面臨的問題及對(duì)策[J].棉紡織技術(shù),2012,40(4):57-59.
AO Limin, TANG Wen, LI Xianghong, et al. Problem and countermeasure of textile garment industrial chain in china [J]. Cotton Textile Technology, 2012,40 (4): 57-59.
[13]蘇丹,李喆,王陽.基于可持續(xù)發(fā)展理念的服裝面料設(shè)計(jì)及其應(yīng)用[J].毛紡科技,2020,48(4):75-79.
SU Dan, LI Zhe, WANG Yang. Design and application of apparel fabrics based on the concept of sustainable development [J]. Wool Textile Journal, 2020,48 (4): 75-79.
[14]戚聿東,肖旭.數(shù)字經(jīng)濟(jì)時(shí)代的企業(yè)管理變革[J].管理世界,2020,36(6):135-152.
QI Yudong, XIAO Xu. Transformation of enterprise management in the era of digital economy [J]. Journal of Management World, 2020, 36(6): 135-152.
[15]鐘機(jī)靈.基于Python網(wǎng)絡(luò)爬蟲技術(shù)的數(shù)據(jù)采集系統(tǒng)研究[J].信息通信,2020,33(4):96-98.
ZHONG Jiiling.Research on the python-based web crawler for data collection system [J]. Changjiang Information & Communications, 2020,33(4):96-98.
[16]肖新鳳,張絳麗,鄧祖民.基于Python的爬蟲技術(shù)的網(wǎng)站設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代信息科技,2020,4(14):73-75.
XIAO Xinfeng, ZHANG Jiangli, DENG Zumin. Website desian and lmplementation of crawler technology based on python [J]. Modern Information Technology, 2020, 4(14): 73-75.
[17]江大鵬.基于詞向量的短文本分類方法研究[D].杭州:浙江大學(xué),2015:6-16.
JIANG Dapeng. Research on Short Text Classification Based on Word Distributed Representation [D].Hangzhou:Zhejiang University,2015:6-16.
[18]QIU X, SUN T, XU Y,? et al.Pre-trained models for natural language processing: A survey[J].Science China Technological Sciences,2020,63(10):1-26.
[19]蘇劍林. CoSENT(一):比Sentence-BERT更有效的句向量方案 [EB/OL]. [2023-04-20]. https://kexue.fm/archives/8847.SU Jianlin. CoSENT (I): A more effective sentence vector scheme than Sentence-BERT [EB/OL]. [2023-04-20]. https://kexue.fm/archives/8847.
[20]段丹丹,唐加山,溫勇,等.基于BERT模型的中文短文本分類算法[J].計(jì)算機(jī)工程,2021,47(1):79-86.
DUAN Dandan, TANG Jiashan, WEN Yong, et al. Chinese short text classification algorithm based on BERT model[J].Computer Engineering,2021,47(1):79-86.
[21]林學(xué)民,王煒.集合和字符串的相似度查詢[J].計(jì)算機(jī)學(xué)報(bào),2011,34(10):1853-1862.
LIN Xuemin,WANG Wei. Set and string similarity queries:a survey[J].Chinese Journal of Computers,2011,34(10):1853-1862.
[22]湯哲沖.基于圖神經(jīng)網(wǎng)絡(luò)的姓名消歧算法研究[D].杭州:浙江理工大學(xué),2023:8-46.
TANG Zhechong. Research on Graph Neural Network-Based Name Disambiguation Algorithm[D].Hangzhou:Zhejiang Sci-Tech University,2023:8-46.
Mining the industry chain link relationship of clothing enterprises
based on the industry chain map
FANG? Zhijian1,2,? CHENG? Yu1,? JIN? Yao1,2,? TANG? Zhechong1,? XU? Jinying3
(1.School of Computer Science and Technology (School of Artificial Intelligence), Zhejiang Sci-Tech University,
Hangzhou 310018, China; 2.Zhejiang Provincial Innovation Center of Advanced Textile Technology
(Jianhu Laboratory), Shaoxing 312000, China; 3.Zhejiang Science and Technology Project
Management Service Center, Hangzhou 310018, China)
Abstract:
The construction of the clothing industry chain map has become a focal area and a key strategy for the digital upgrade of China's clothing industry. Serving as a vital tool, the clothing industry chain map helps enterprises and researchers better understand and grasp the structure, relationships, and dynamics of the entire industry chain.
This study aims to use digital technology to visually present the entire clothing industry chain, so as to enhance the efficiency, reduce costs, optimize the resource allocation, and ultimately boost the competitiveness and market position of enterprises. In the clothing industry chain map, determining which industry chain point a company belongs to and understanding the relationships among various enterprises are crucial for industry investment, resource optimization, production efficiency improvement, and cost reduction. However, traditional methods of enterprise linkage often involve manual examination of company names, business scopes, and product information, leading to time-consuming and inefficient processes with suboptimal results. Therefore, researching automatic linkage algorithms for clothing enterprises is of practical significance and theoretical value in optimizing the clothing industry chain map. Current research efforts are primarily focused on text information mining and machine learning methods. Nevertheless, limited research has been conducted on how to use the enterprise profiles and industrial chain map for automatic linkage in the industry chain. This study addresses this gap by collecting enterprise information, extracting keywords, establishing an enterprise information database, and proposing an automatic linkage algorithm based on the CoSENT model. The algorithm utilizes the CoSENT model to calculate the similarity between enterprise keywords and industry chain points, filters matching results through custom rules, assesses the relevance between keywords and points, and achieves automatic linkage in the industry chain for enterprises. Leveraging machine learning technology, this approach provides a more feasible solution for handling vast amounts of information related to clothing enterprises.
Experimental results demonstrate that the proposed algorithm significantly outperforms other traditional algorithms on the F1-Measure metric. Compared to the Jaccard method, the accuracy of this algorithm improves by 14%; compared to the Word2Vec method, it improves by 10.5%; and compared to the SBERT method, it improves by 2.5%. The substantial enhancement elevates the accuracy and efficiency of enterprise linkage, providing robust support and guidance for optimizing the clothing industry chain map. Future research directions include collecting more enterprise information to build richer enterprise profiles, so as to further enhance the linkage efficiency. This study offers a practical solution for the digital upgrade and optimization of the clothing industry chain.
Keywords:
garment industry chain; industrial chain map; automatic linkage algorithm; CoSENT model