摘要:本研究旨在探討如何利用人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等AI技術(shù),構(gòu)建個(gè)體化的私人定制音樂(lè)治療模式。研究提出的個(gè)性化音樂(lè)治療模式主要由基于Transformer架構(gòu)的治療音樂(lè)個(gè)性化標(biāo)注AI模型和治療音樂(lè)個(gè)性化遴選與推薦系統(tǒng)兩部分組成。盡管目前尚未有實(shí)驗(yàn)數(shù)據(jù)對(duì)該模式進(jìn)行驗(yàn)證,但隨著技術(shù)的不斷升級(jí),AI驅(qū)動(dòng)下的個(gè)性化音樂(lè)治療有望成為未來(lái)臨床應(yīng)用和技術(shù)開(kāi)發(fā)的關(guān)鍵領(lǐng)域,因此,對(duì)這一話題的深入探討已顯得尤為迫切。
關(guān)鍵詞:個(gè)性化音樂(lè)治療" AI Transformer架構(gòu)" 深度學(xué)習(xí)
一、引言
在傳統(tǒng)的臨床音樂(lè)治療中,治療師通常會(huì)使用固定的治療音樂(lè)庫(kù),或根據(jù)與患者的深入交流和治療需求,依照通用標(biāo)準(zhǔn)從治療音樂(lè)庫(kù)中選擇合適的音樂(lè)作為處方。然而,實(shí)際應(yīng)用中,由于患者的文化背景、需求層次、對(duì)音樂(lè)的理解與喜好,以及共情能力的差異,治療音樂(lè)的選用標(biāo)準(zhǔn)需因人而異。這需要不斷嘗試以了解不同治療音樂(lè)對(duì)患者的效用,并根據(jù)反饋調(diào)整音樂(lè)處方。然而,這種過(guò)程可能導(dǎo)致一定的負(fù)面影響:許多患者因病痛折磨,渴望快速有效的治療,往往在接受到適用其個(gè)體的治療音樂(lè)前就對(duì)音樂(lè)治療失去信心,其周?chē)颊咭矔?huì)對(duì)音樂(lè)治療望而卻步。如果僅采用單一的分類(lèi)方式,根據(jù)所謂的普適性體系進(jìn)行治療,往往難以確保療效。甚至因接受了與自身情況不匹配的治療,錯(cuò)誤地認(rèn)為音樂(lè)治療就是聽(tīng)聽(tīng)音樂(lè)而已。隨著科技的進(jìn)步,人工智能(AI)在音樂(lè)處理和分析中的應(yīng)用前景日益廣闊。將AI技術(shù)引入音樂(lè)治療領(lǐng)域,可為個(gè)性化音樂(lè)治療提供新工具和方法。因此,本文提出一種由AI驅(qū)動(dòng)的個(gè)性化音樂(lè)治療模式,為個(gè)性化治療的實(shí)現(xiàn)盡微薄之力。
二、個(gè)性化音樂(lè)治療模式設(shè)計(jì)
此模式由兩部分組成,首先是基于Transformer架構(gòu)的治療音樂(lè)個(gè)性化標(biāo)注AI模型,該模型由經(jīng)患者個(gè)性化標(biāo)注后的治療音樂(lè)數(shù)據(jù)進(jìn)行訓(xùn)練,生成與患者主觀情感和客觀生理表現(xiàn)高度契合的治療音樂(lè)標(biāo)注,并構(gòu)建個(gè)性化治療音樂(lè)數(shù)據(jù)庫(kù)。其次是治療音樂(lè)個(gè)性化遴選與推薦系統(tǒng),該系統(tǒng)利用AI模型構(gòu)建的個(gè)性化治療音樂(lè)數(shù)據(jù)庫(kù),結(jié)合患者當(dāng)前的生理和心理狀況,進(jìn)行針對(duì)性的音樂(lè)遴選與推薦。系統(tǒng)還可根據(jù)患者身心狀況實(shí)時(shí)變化,動(dòng)態(tài)調(diào)整治療音樂(lè),滿足患者的實(shí)時(shí)需求。此外,該系統(tǒng)還可以根據(jù)每位患者的獨(dú)特需求,建立特需治療音樂(lè)庫(kù),從而確保治療方案的最大包容性和有效性。此模式的流程設(shè)計(jì)如圖所示:
三、基于Transformer架構(gòu)的治療音樂(lè)個(gè)性化標(biāo)注AI模型
(一)治療音樂(lè)個(gè)性化標(biāo)注AI模型的作用與必要性
對(duì)治療音樂(lè)進(jìn)行特征標(biāo)注與功能性分類(lèi)是音樂(lè)治療活動(dòng)的重要基礎(chǔ),傳統(tǒng)方法通常依照音樂(lè)的情感色彩或應(yīng)用場(chǎng)景進(jìn)行分類(lèi),形成具有普適性的標(biāo)注、分類(lèi)標(biāo)準(zhǔn)。然而,這些通用標(biāo)準(zhǔn)并不總是適用于所有患者。例如,明亮的大三和弦通常給人以愉快的感覺(jué),而暗淡的小三和弦則令人感到沉悶;大調(diào)音樂(lè)能夠激發(fā)斗志,小調(diào)音樂(lè)則容易引起負(fù)面情緒。盡管這些音樂(lè)色彩與情感共振似乎作為一種共識(shí)性標(biāo)準(zhǔn)存在于人類(lèi)的集體潛意識(shí)中,但需要音樂(lè)治療的患者常常表現(xiàn)出不同于常人的反應(yīng)模式。他們對(duì)于音樂(lè)色彩的理解與接受外部情感共振的能力由于其特殊的心理結(jié)構(gòu)無(wú)法與常人使用同一標(biāo)準(zhǔn)。因此,治療音樂(lè)標(biāo)注不應(yīng)采用通用標(biāo)準(zhǔn),而應(yīng)基于患者的心理結(jié)構(gòu)和情感需求進(jìn)行個(gè)性化治療音樂(lè)標(biāo)注。
榮格認(rèn)為,人類(lèi)共有的意識(shí)原型和潛在心理結(jié)構(gòu),通過(guò)象征、文化符號(hào)(如音樂(lè))表達(dá)出來(lái),對(duì)人類(lèi)情感產(chǎn)生普遍影響。但對(duì)于有特殊心理經(jīng)歷的患者,他們的個(gè)體潛意識(shí)可能產(chǎn)生了異質(zhì)化,導(dǎo)致與集體潛意識(shí)產(chǎn)生沖突,從而對(duì)音樂(lè)表現(xiàn)出不同的情感反應(yīng)。
弗洛伊德的精神分析理論揭示了潛意識(shí)的重要性。他認(rèn)為,個(gè)體的心理行為和情感反應(yīng)并不完全由意識(shí)控制,而是受到潛意識(shí)中未解沖突、壓抑情感的支配。因此,患者對(duì)音樂(lè)的感觸可能被這些潛意識(shí)力量所扭曲,導(dǎo)致與常人不同的情感反應(yīng)。公認(rèn)愉悅的音樂(lè)也可能因觸及潛意識(shí)中的痛苦記憶,而引發(fā)患者焦慮或抑郁。
因此,針對(duì)不同患者進(jìn)行個(gè)性化的治療音樂(lè)標(biāo)注、分類(lèi)與選擇,是確保音樂(lè)治療有效性的關(guān)鍵。這種定制化模式不僅要考慮患者的當(dāng)前心理狀態(tài)和生理反應(yīng),還必須結(jié)合潛意識(shí)動(dòng)機(jī)和深層心理沖突。傳統(tǒng)治療模式下,為每位患者制定不同的治療音樂(lè)分類(lèi)標(biāo)準(zhǔn)是不可能的。并且治療師主要依賴患者的自我陳述獲取信息,而這些信息往往只能觸及表層意識(shí)。弗洛伊德認(rèn)為,潛意識(shí)動(dòng)機(jī)和心理沖突常隱藏在本我中,難以通過(guò)自我意識(shí)表現(xiàn)出來(lái)。治療師因此面臨巨大挑戰(zhàn),難以深入挖掘和理解這些深層次的信息,更難將其與治療音樂(lè)進(jìn)行有機(jī)結(jié)合。
然而,人工智能(AI)技術(shù)的發(fā)展為這一問(wèn)題的解決提供了可能性。通過(guò)人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù),使用含有患者標(biāo)注信息的治療音樂(lè)數(shù)據(jù)進(jìn)行模型訓(xùn)練與優(yōu)化,AI模型能夠識(shí)別音樂(lè)特征與患者身心狀態(tài)之間的復(fù)雜關(guān)系,將音樂(lè)特征與患者的生理特征和心理表現(xiàn)進(jìn)行數(shù)據(jù)耦合。更重要的是,AI可以處理那些隱藏在患者本我中的潛意識(shí)情感動(dòng)機(jī),將其與音樂(lè)治療中的特定元素進(jìn)行耦合。AI模型因此具備與患者行為高度一致的治療音樂(lè)標(biāo)注能力,能夠?qū)λ兄委熞魳?lè)進(jìn)行近似患者本人的個(gè)性化標(biāo)注與分類(lèi),并分析其在作用于患者時(shí)可能引發(fā)的情感和生理變化。
這種個(gè)性化治療音樂(lè)標(biāo)注AI模式不僅提高了治療音樂(lè)分析的精確性,還能為患者構(gòu)建個(gè)性化治療音樂(lè)數(shù)據(jù)庫(kù),使治療師更好地理解患者需求,制定更加精準(zhǔn)的治療方案。AI模型還可以通過(guò)差異性學(xué)習(xí)和算法優(yōu)化,根據(jù)患者的反饋動(dòng)態(tài)調(diào)整標(biāo)注策略,確保每位患者都能獲得最適合的治療音樂(lè),從而最大化治療效果。
(二)模型設(shè)計(jì)
得益于Google AI部門(mén)Magenta團(tuán)隊(duì)為我們揭示了使用通用Transformer架構(gòu)模型進(jìn)行音樂(lè)項(xiàng)目訓(xùn)練的可行性,以及其無(wú)需針對(duì)特定領(lǐng)域進(jìn)行任何調(diào)節(jié)的優(yōu)點(diǎn)[1]。將此架構(gòu)擴(kuò)展到同屬于MIR任務(wù)的本研究中可謂是應(yīng)時(shí)對(duì)景,相得益彰。
Transformer架構(gòu)是目前應(yīng)用于自然語(yǔ)言處理和其他數(shù)據(jù)處理任務(wù)的五大神經(jīng)網(wǎng)絡(luò)之一,它由Ashish Vaswani在其2017年的論文《Attention Is All You Need》[2]中提出。Transformer架構(gòu)的主要優(yōu)勢(shì)在于其能夠并行處理整個(gè)序列,提高計(jì)算效率,并且其特有的自注意力機(jī)制能夠捕捉序列中長(zhǎng)距離的依賴關(guān)系。有研究表明將其用于AMA自動(dòng)標(biāo)注(automatic music annotation)領(lǐng)域可解決CNN與RNN只能對(duì)局部特征提取和長(zhǎng)程依賴的問(wèn)題,而并行計(jì)算更是充分利用了GPU的計(jì)算資源。[3]并且Transformer中的自注意力機(jī)制(Self-Attention Mechanism),增強(qiáng)了Transformer的局部特征提取能力,使得Transformer能夠更好地適應(yīng)音頻信號(hào)等前后聯(lián)系緊密的數(shù)據(jù)。
綜上,治療音樂(lè)個(gè)性化標(biāo)注AI模型采用Transformer架構(gòu)具有其獨(dú)特優(yōu)勢(shì),通過(guò)采用Transformer架構(gòu)進(jìn)行個(gè)性化音樂(lè)治療AI模型的訓(xùn)練,能夠高效地完成治療音樂(lè)標(biāo)注與分類(lèi)任務(wù)。
對(duì)于輸入數(shù)據(jù),選用梅爾頻譜圖與MFCC系數(shù)共同作為輸入數(shù)據(jù),梅爾頻譜圖為主要輸入數(shù)據(jù),MFCC系數(shù)為輔助輸入數(shù)據(jù),由于梅爾頻譜圖符合人類(lèi)的非線性聽(tīng)覺(jué)特征,因此在與音樂(lè)或語(yǔ)音相關(guān)的AI模型中多作為主要的輸入項(xiàng)。使用梅爾刻度濾波器組對(duì)信號(hào)進(jìn)行處理可得到梅爾頻譜圖。隨后對(duì)梅爾頻譜圖的幅值進(jìn)行對(duì)數(shù)壓縮,然后對(duì)壓縮后的梅爾頻譜圖進(jìn)行離散余弦變換(DCT),提取出一組倒譜系數(shù),這些系數(shù)即梅爾頻率倒譜系數(shù)(MFCC)。其二者針對(duì)不同的音樂(lè)特征具有各自獨(dú)特優(yōu)勢(shì)。梅爾頻譜圖保留了更詳細(xì)的頻譜信息,可以更好地描述音頻信號(hào)在時(shí)間上的變化,因而將梅爾頻譜圖作為主要輸入數(shù)據(jù)。而選擇MFCC作為輔助輸入數(shù)據(jù)的原因在于其在語(yǔ)音特征提取中的優(yōu)勢(shì),由于部分治療音樂(lè)具有歌詞,歌詞的語(yǔ)義性無(wú)疑會(huì)對(duì)患者具有一定的暗示效應(yīng),因此使用MFCC作為輔助輸入數(shù)據(jù),可大大提高模型對(duì)音樂(lè)中具有語(yǔ)義性的歌詞進(jìn)行理解和分析。
(三)模型訓(xùn)練步驟
1.治療音樂(lè)訓(xùn)練數(shù)據(jù)庫(kù)的建立
在個(gè)性化音樂(lè)治療中,治療音樂(lè)本體始終為最重要且核心的部分。治療音樂(lè)個(gè)性化標(biāo)注AI模型訓(xùn)練的基礎(chǔ)則是科學(xué)合理的治療音樂(lè)訓(xùn)練數(shù)據(jù)庫(kù)的建立。
治療音樂(lè)具有廣泛的定義,并非是一種特定的音樂(lè)形式,它是一種音樂(lè)的應(yīng)用范圍和價(jià)值概念。也就是說(shuō),無(wú)論何種音樂(lè)形態(tài),只要被應(yīng)用到了醫(yī)療和健康之中,它就可以被稱為治療音樂(lè),治療音樂(lè)不具備固有的音樂(lè)形式和音樂(lè)屬性,在治療音樂(lè)的使用場(chǎng)景中我們所重視的不是音樂(lè)的藝術(shù)、審美、娛樂(lè)價(jià)值,其最高權(quán)重表現(xiàn)為健康價(jià)值,也就是說(shuō)治療音樂(lè)的立足點(diǎn)在于人的健康,任何用于治療行為中且能夠?qū)θ梭w健康產(chǎn)生積極效應(yīng)的音樂(lè)都可稱為治療音樂(lè)。
也正因治療音樂(lè)幾乎可以涵蓋一切人類(lèi)的音樂(lè)創(chuàng)作,所以在進(jìn)行治療音樂(lè)訓(xùn)練數(shù)據(jù)庫(kù)的建立時(shí),對(duì)治療音樂(lè)的選擇尤為重要,數(shù)據(jù)庫(kù)應(yīng)盡可能涵蓋每一種音樂(lè)形式或是文化背景,唯有如此才能保證患者標(biāo)注數(shù)據(jù)的完整性和可信度。
2.患者標(biāo)注
采用E-Prime2.0軟件在治療音樂(lè)訓(xùn)練數(shù)據(jù)庫(kù)中隨機(jī)選擇音樂(lè)進(jìn)行播放,在音樂(lè)播放結(jié)束后由患者進(jìn)行主觀標(biāo)注,主觀標(biāo)注項(xiàng)目選用常見(jiàn)的6種基礎(chǔ)情緒,包括:快樂(lè)、悲傷、憤怒、驚訝、恐懼和厭惡??陀^標(biāo)注由音樂(lè)治療師借助各項(xiàng)生理數(shù)據(jù)檢測(cè)儀器進(jìn)行標(biāo)注,治療師需實(shí)時(shí)記錄患者接受每首治療音樂(lè)時(shí)的各項(xiàng)生理參數(shù)變化,包括但不限于心率、血壓、血氧飽和度等容易影響情緒變化的生理參數(shù)。
標(biāo)注數(shù)據(jù)采用類(lèi)似李克特五級(jí)量表的評(píng)價(jià)量表對(duì)計(jì)量項(xiàng)目變化趨勢(shì)進(jìn)行記錄,記錄項(xiàng)目分為1、2、3、4、5五級(jí),3為無(wú)變化,1為顯著降低或是十分消極,5為顯著升高或是十分積極,2、4介于之間。
在完成治療音樂(lè)訓(xùn)練數(shù)據(jù)庫(kù)中所有治療音樂(lè)標(biāo)注工作后,將治療音樂(lè)與對(duì)應(yīng)的主觀標(biāo)注和客觀標(biāo)注進(jìn)行數(shù)據(jù)整合,得到個(gè)性化治療音樂(lè)訓(xùn)練數(shù)據(jù)集,使用此數(shù)據(jù)集對(duì)治療音樂(lè)個(gè)性化標(biāo)注AI模型進(jìn)行訓(xùn)練。
3.數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理是治療音樂(lè)個(gè)性化標(biāo)注AI模型訓(xùn)練過(guò)程中的重要步驟,在此步驟需要進(jìn)行格式轉(zhuǎn)換、音頻分段、降噪、歸一化四個(gè)細(xì)分步驟。
使用Librosa庫(kù)將個(gè)性化治療音樂(lè)訓(xùn)練數(shù)據(jù)庫(kù)中的音頻文件統(tǒng)一轉(zhuǎn)化為WAV格式;由于模型需要處理格式統(tǒng)一的項(xiàng)目,所以首先需要將音頻數(shù)據(jù)分割成固定長(zhǎng)度的片段,為保證統(tǒng)一,將所有數(shù)據(jù)庫(kù)音樂(lè)分割為29秒;在此步驟對(duì)統(tǒng)一分割后的音頻數(shù)據(jù)進(jìn)行降噪處理,使用Spectral Gating算法進(jìn)行降噪工作;繼而歸一化音頻信號(hào),以消除背景噪音和音量差異,確保音頻信號(hào)的一致性。
4.輸入數(shù)據(jù)提取
提取梅爾頻譜圖與MFCC系數(shù)作為輸入數(shù)據(jù),提取步驟如下:
(1)音頻信號(hào)分幀:音頻信號(hào)通常是連續(xù)的波形數(shù)據(jù),為了處理和分析,首先需要將其分割成多個(gè)短時(shí)間窗口(幀);(2)應(yīng)用窗函數(shù):在每一幀上應(yīng)用漢明窗函數(shù),以減少頻譜泄漏現(xiàn)象,防止信號(hào)在快速傅里葉變換過(guò)程中引入不必要的高頻成分;(3)快速傅里葉變換(FFT):對(duì)每個(gè)分幀的音頻信號(hào)進(jìn)行快速傅里葉變換,將時(shí)間域信號(hào)轉(zhuǎn)換為頻率域信號(hào);(4)將頻率映射到梅爾刻度:使用梅爾刻度將線性頻率軸映射到更符合人耳感知的非線性頻率軸上;(5)應(yīng)用梅爾濾波器組:在梅爾刻度上應(yīng)用一組三角形濾波器,每個(gè)濾波器覆蓋一部分頻率范圍;(6)計(jì)算對(duì)數(shù)功率譜:對(duì)通過(guò)每個(gè)梅爾濾波器的能量進(jìn)行對(duì)數(shù)壓縮,得到對(duì)數(shù)功率譜;(7)生成梅爾頻譜圖:將所有幀的對(duì)數(shù)功率譜排列在一起,形成一個(gè)二維表示即為梅爾頻譜圖;(8)離散余弦變換(DCT):對(duì)梅爾頻譜圖的對(duì)數(shù)功率譜應(yīng)用離散余弦變換,生成梅爾頻率倒譜系數(shù)MFCC。
5.模型訓(xùn)練與個(gè)性化治療音樂(lè)數(shù)據(jù)
使用梅爾頻譜圖和MFCC系數(shù)作為輸入數(shù)據(jù)至通用Transformer模型進(jìn)行訓(xùn)練,最終得到的模型變?yōu)橹委熞魳?lè)個(gè)性化標(biāo)注AI模型。繼而將治療音樂(lè)輸入至此AI模型之中,輸出數(shù)據(jù)便為近似患者本人標(biāo)注的個(gè)性化治療音樂(lè)數(shù)據(jù)。
四、治療音樂(lè)個(gè)性化遴選與推薦系統(tǒng)
在AI驅(qū)動(dòng)下的個(gè)性化音樂(lè)治療模式中,遴選與推薦系統(tǒng)是實(shí)現(xiàn)精準(zhǔn)治療的關(guān)鍵環(huán)節(jié)。此系統(tǒng)通過(guò)分析患者的生理和心理數(shù)據(jù),結(jié)合個(gè)性化治療音樂(lè)庫(kù)中的音樂(lè)特征,計(jì)算每首治療音樂(lè)與患者需求的匹配程度,并依照匹配程度進(jìn)行排序后提供給音樂(lè)治療師,由音樂(lè)治療師結(jié)合自身觀點(diǎn)與患者狀況進(jìn)行治療音樂(lè)處方的制定。遴選與推薦系統(tǒng)通過(guò)分析患者的生理和心理數(shù)據(jù),并推薦最合適的音樂(lè)。該系統(tǒng)由數(shù)據(jù)采集、特征提取、匹配計(jì)算、遴選推薦四部分組成。
1.數(shù)據(jù)采集與特征提取
數(shù)據(jù)采集是遴選與推薦系統(tǒng)的基礎(chǔ),系統(tǒng)需要采集患者的生理和心理數(shù)據(jù),包括心率、血壓、血氧飽和度、皮膚電信號(hào)以及情緒狀態(tài)等;將原始數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的表現(xiàn)形式,通過(guò)對(duì)患者生理和心理指標(biāo)的標(biāo)準(zhǔn)化和歸一化處理,將其同樣轉(zhuǎn)化為類(lèi)似李克特五級(jí)量表的評(píng)價(jià)量表,進(jìn)行患者需求特征集的構(gòu)建,對(duì)患者的身心需求趨勢(shì)進(jìn)行表現(xiàn)。
2.匹配計(jì)算與遴選推薦
匹配計(jì)算是遴選與推薦系統(tǒng)的核心,系統(tǒng)通過(guò)提取到的患者需求特征集與個(gè)性化治療音樂(lè)數(shù)據(jù)庫(kù)中的特征標(biāo)注數(shù)據(jù)進(jìn)行相似度匹配。個(gè)性化治療音樂(lè)數(shù)據(jù)庫(kù)由治療師使用個(gè)性化治療音樂(lè)標(biāo)注AI模型,對(duì)治療音樂(lè)總庫(kù)中的音樂(lè)進(jìn)行個(gè)性化標(biāo)注并整理而成。繼而,系統(tǒng)采用協(xié)同過(guò)濾、余弦相似度、歐幾里得距離和加權(quán)評(píng)分等方法評(píng)估每首音樂(lè)的適用性。根據(jù)匹配計(jì)算的結(jié)果,系統(tǒng)生成推薦列表。推薦列表按照匹配度從高到低排序,選擇最適合患者的前幾首音樂(lè)進(jìn)行推薦。
五、余論
本文通過(guò)將人工神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等AI技術(shù)引入個(gè)性化音樂(lè)治療之中,提出新的個(gè)性化音樂(lè)治療模式,通過(guò)個(gè)性化治療音樂(lè)標(biāo)注AI模型,構(gòu)建患者專(zhuān)屬的個(gè)性化治療音樂(lè)數(shù)據(jù)庫(kù),并且借助治療音樂(lè)遴選與推薦系統(tǒng)實(shí)現(xiàn)個(gè)性化治療音樂(lè)的推薦。文章表明AI技術(shù)在個(gè)性化音樂(lè)治療領(lǐng)域具有廣泛的應(yīng)用潛力,未來(lái)還可探尋如何將Suno、Stable Audio、MT3等AIGC音樂(lè)生成AI模型引入至個(gè)性化音樂(lè)治療模式中,根據(jù)患者反饋實(shí)時(shí)生成治療音樂(lè)。
參考文獻(xiàn):
[1]Gardner, Josh, et al. \"MT3: Multi-task multitrack music transcription.\" arXiv preprint arXiv:2111.03017 (2021).
[2]Vaswani, Ashish, et al. \"Attention is all you need.\" Advances in neural information processing systems 30 (2017).
[3]焦佳輝,馬思遠(yuǎn),宋玉,等.基于卷積注意力機(jī)制的雙模態(tài)音樂(lè)流派分類(lèi)模型MGTN[J].計(jì)算機(jī)工程與科學(xué),2023,45(12):2226-2236.
作者簡(jiǎn)介:劉凡,海南大學(xué)碩士研究生在讀