□ 孫金艷 文海良
在現代的音樂制作中,音色是能夠被使用到的所有原聲、電聲樂器的總和,其概念并不代表單一樂器,而是僅僅代表單一色彩的樂器演奏。例如,小提琴可以奏出的音色有撥奏、連奏、顫音等多種,通常都可以制作成數字的、虛擬的音色,供作曲家、編曲師在音樂制作的實踐中使用。為了提高音樂制作的效率,各大合成器制造廠商與音源開發(fā)公司都不同程度地將人工智能技術應用到音色的制作與使用上。本文試圖厘清人工智能技術與音色制作相結合的發(fā)展脈絡,探析音色的人工智能化進程。
音色的智能形態(tài)最早可追溯到19世紀歐洲經歷第一次工業(yè)革命后所發(fā)明的音樂盒、手搖風琴等,這也許是因為當時人們對延續(xù)了千百年的傳統樂器演奏方式的厭倦,在經過周密的數學計算后把樂譜刻在一個卷筒上,在發(fā)條慣性動能的驅動下觸發(fā)與其捆綁在一起的樂器演奏。雖然這種音樂盒只能演奏一兩個樂句,但它的自發(fā)演奏行為與記憶功能在當時卻足夠引起人們的注意,這是樂器音色人工智能化的萌芽。
真正能夠進行音色人工智能化的并不是具有物理屬性的原聲樂器,而是電子合成器,早期人工智能演奏的雛形就是步進器。1946年,美國音樂家雷蒙德-斯科特使用步進繼電器、電磁閥、控制開關和16 個獨立震蕩器電路等裝置組成了最早的模擬步進器,通電后能夠自動演奏16個步進的節(jié)奏。雖然這臺步進器因噪音太大而操控性與實用性不強,但它為音色的人工智能化開辟了新的道路,啟迪了后來的電子工程師,并在此基礎上開發(fā)出了更為實用的步進音序器。
步進音序器以步進(Step)為單位,早期一般以8 個或16 個分步為一個句子,現在可以擴展到32 個分步,但使用最普遍的還是16 分步。在早期模擬設備階段,步進樂句的長度與數量都很有限,但后來的數字音序器彌補了模擬設備不能存儲的缺憾,這也直接引導了多軌步進音序器的發(fā)展,如1971年,EMS 公司開發(fā)出世界上第一款名為“EMS Sequencer 256”的數字音序器,提供256 個步進以及3 個音軌。
現在,步進音序器在音色領域的應用主要表現在節(jié)奏制作與音色合成兩方面。在節(jié)奏制作方面,步進音序器廣泛地運用到鼓機上,不管是傳統的硬件鼓機如羅蘭的TR808/TR909,還是插件式鼓機如 FXpansion 的 Tremor,都是通過不同步進的智能演奏來編創(chuàng)新的鼓組節(jié)奏。在音色合成方面,步進音序由單一音高刻度的智能演奏模型演變?yōu)榭蛇M行不同音高智能演奏的琶音器,廣泛應用于合成音色的制造。初級的琶音器只能進行向上、向下、自下而上、自下而上、隨機等幾種簡單的步進音序演奏;后來的琶音器引入MIDI 音序的概念與方法,可以激活不同的步進,調節(jié)每一個步進上的音高,并由此產生比較復雜的智能演奏樂句,這就超越了早期琶音器簡單而機械的演奏。
如果說步進音序器使鼓組音色獲得了人工智能化的演奏,那么,現在的模版演奏就是使其他非打擊樂器獲得人工智能演奏的常見形式了。
所謂模版演奏,就是音色在制作時內置MIDI 演奏音序,使用時用鍵盤音符就可以觸發(fā)MIDI 音序的演奏。在一定意義上來說,模版演奏是步進音序、琶音器的一種升級與進化,它與采樣音色制作技術相結合,可以制作出與真人實錄相同的演奏效果。
模版演奏技術率先在吉他、貝司、鼓組等流行音樂常用音色中得到應用,而后又推廣到交響樂的音色中。最先推出具有模版演奏功能音色的廠商是Steinberg 公司,2002年它們推出了基于VSTi 技術的樂器插件虛擬吉他手(Virtual Guitarist),該音色內置25 套吉他手演奏模版,不但可以進行一鍵觸發(fā)式的演奏,還可以自主編輯演奏模版,音色質量與演奏效果幾乎可以與成熟樂手相匹敵。隨后,Steinberg 公司又連續(xù)推出了虛擬電吉他手(Virtual Guitarist Electric Edition)、虛擬鼓手(Groove Agent)和虛擬貝斯手(Virtual Bassist),在音樂制作領域刮起了一股虛擬演奏手的風潮。這是人工智能與音色制作技術的一次大融合,豐富了音色制作的方式方法,使其他廠商紛紛效仿。在這之后,更多種類的虛擬演奏手樂器插件開始面世,比如Musiclab 開發(fā)的虛擬吉他手RealGuitar、電吉他手Real-Strat,ToonTrack 推出的虛擬鋼琴手 EZKeys,Native Instruments 聯合倫敦Abbey Road 錄音棚推出的虛擬鼓手系列ABBEY ROAD | 70s DRUMS、ABBEY ROAD 80s DRUM 和Abbey Road Modern Drums 等。
在交響樂音色的人工智能化制作方面,Native Instruments 公司基于其在業(yè)界處于領導地位的采樣器Kontakt的技術上,相繼開發(fā)了多款用于交響樂配樂中使用的人工智能化演奏樂器。比如ACTION STRINGS 就可以用一鍵觸發(fā)的方式獲得弦樂快速斷弓演奏的樂句效果;再比如SESSION HORNS,同樣可以用一個和弦按鍵來觸發(fā)在該和弦音上的銅管樂智能演奏。
模版演奏的智能化音色制作,可以實現音色短樂句的自動演奏,在實際的音樂制作中大大節(jié)約制作時間,并盡可能地獲得更好的演奏效果,在某一個時期內是音樂制作的一大利器。但時間一長其弊病就難以隱藏了,核心的難題就是模版幾乎是固定的,用一兩次有點新意,但用多了音樂就失去了本該有的原創(chuàng)性。于是,新一代的音色工程師又開始在模版新意方面進行開發(fā)拓展,目前卓有成效的是在鼓組自動演奏方面,突出代表是Apple 在其音樂制作平臺Logic 中自帶的虛擬鼓手插件Drummer,為了避免內置鼓組節(jié)奏的刻板,將概率引入節(jié)奏的合成中,設立一個XY 軸板,四個邊框分別是簡單/復合、大聲/柔和,操縱XY 軸板中的圓盤可以隨意調節(jié)節(jié)奏形態(tài),再根據個人的喜好確定節(jié)奏。
在步進音序、演奏模版的音色自動化技術之后,如果說還有什么技術能夠引領音色制作技術的變革,那可能只有動作探測了。
動作探測源于多層采樣音色制作技術。該技術是在采樣音色制作中將多個不同演奏形態(tài)的聲音樣本疊加在同一個鍵位音符上,依靠不同的音符來觸發(fā)這些不同的聲音采樣,以此來獲得更豐富的樂器演奏。比如用C1 觸發(fā)長音演奏樣本、D1 觸發(fā)跳音演奏樣本、E1 觸發(fā)強奏聲音樣本等。這是早期多層采樣音色制作的原理。
隨著計算機芯片處理能力的提升以及內存的擴大,將多層采樣音色制作技術進行深化與細化,比如每一個鍵位不同的力度同樣也可以觸發(fā)不同的聲音采樣,由此制造出采樣數更多、體積更大的音色。而在演奏時,通過分析演奏者彈奏MIDI 鍵盤時的力度與音符走向,可以觸發(fā)與之匹配的聲音樣本,以此達到更細膩化的樂器演奏。這一技術的運用在弦樂類音色的制作中有著尤其實用的價值。因為弓弦類樂器的演奏技術很復雜,一直都是MIDI 音樂制作領域中音色表達的短板。比如連奏,在此之前是音色制作廠商都要刻意避開的技術黑點,但通過動作探測技術,可以提前分析演奏者的演奏意圖,從而觸發(fā)連奏的采樣,如此一來,樂器演奏的表達性能就大大提升了。
使用動作探測技術制作的音色主要在弦樂器,如拉弦樂器小提琴、大提琴,撥弦樂器吉他等。現在市面上比較有名的成品音色有Best Service 的小提琴獨奏音色Chris Hein Solo Violin 和古典尼龍弦吉他Ilya Efimov Nylon Guitar等,這些音色都具有演奏技法細膩、音色表達能力強的特點。
幾十年來,音色的人工智能化進程從未停止其前進的步伐,目標只是為了實現更為便捷、高效的音樂制作。探討音色的人工智能既可以普及我們在樂器音色智能演奏方面的理論,也可以使這些音色工具更好地為實際的音樂制作服務。