■曹軍軍 姜 紅
(中國(guó)文聯(lián)出版社,北京,100125)
結(jié)構(gòu)化文本格式MusicXML對(duì)音樂編輯出版思維的影響
■曹軍軍 姜 紅
(中國(guó)文聯(lián)出版社,北京,100125)
大數(shù)據(jù)和互聯(lián)網(wǎng)時(shí)代,給音樂編輯出版人員提出了一些新的要求。掌握好數(shù)據(jù)庫(kù)技術(shù)與思維,善用結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化文本的相關(guān)理論與實(shí)踐工具,有望改進(jìn)傳統(tǒng)的編審工序,提升工作效率,擴(kuò)展效益空間,同時(shí)更好地服務(wù)于音樂文化受眾。XML標(biāo)記語言作為編輯和處理結(jié)構(gòu)化文本的一種重要工具,在音樂領(lǐng)域擁有MusicXML這一既嚴(yán)謹(jǐn)又帶有開放性的專門規(guī)范,它無論是作為記譜媒介還是用于輔助音樂結(jié)構(gòu)分析,都有一定價(jià)值。若能用好MusicXML和與之直接相關(guān)的一系列知識(shí),則策劃編輯、內(nèi)容編輯的業(yè)務(wù)思維和專業(yè)素養(yǎng)體系都會(huì)有所演進(jìn),朝融合編輯、創(chuàng)新跨界的方向發(fā)展。
結(jié)構(gòu)化文本 信息系統(tǒng) XML MusicXML 音樂編輯 音樂出版
數(shù)據(jù)科學(xué)的興起和發(fā)展,讓數(shù)據(jù)庫(kù)技術(shù)與思維的意義在各個(gè)領(lǐng)域開始凸顯,人文學(xué)科亦莫能全然置身事外。其中,藝術(shù)類學(xué)科與數(shù)據(jù)思維聯(lián)姻的案例更是值得關(guān)注,這類的案例,在諸多“互聯(lián)網(wǎng)+藝術(shù)”的研究與產(chǎn)業(yè)建設(shè)中都可以找到,比如筆者供職的中國(guó)文聯(lián)出版社開展的“中國(guó)藝術(shù)(出版)資源素材庫(kù)”項(xiàng)目。從事這類工作的音樂編輯人員,若能積極掌握相關(guān)的新思路和新概念,無疑將事半功倍;而這些新的工作方式在融入音樂出版物的傳統(tǒng)編審工序之后,也會(huì)為其基本理論體系補(bǔ)充一些新的命題。音樂文化的傳播是多么倚重音樂出版事業(yè),自不待言,因此筆者試在適度介紹相關(guān)技術(shù)概念的基礎(chǔ)上,就未來音樂類出版專業(yè)技術(shù)人員的理想的能力結(jié)構(gòu),以及相應(yīng)人才隊(duì)伍的建設(shè)與培養(yǎng)提出幾點(diǎn)自己的看法,以期拋磚引玉。
數(shù)字時(shí)代的出版業(yè)已經(jīng)不能再將“文本”簡(jiǎn)單理解為文字內(nèi)容,而是應(yīng)從語言學(xué)和符號(hào)學(xué)的角度,將其看作一個(gè)相對(duì)封閉、自足的符號(hào)系統(tǒng)。各種向讀者傳達(dá)信息的形態(tài),都可以看成由符號(hào)構(gòu)成的一個(gè)文本。而早在結(jié)構(gòu)主義和符號(hào)學(xué)的研究中,文本已是結(jié)構(gòu)化的對(duì)象。結(jié)構(gòu)對(duì)應(yīng)于內(nèi)在的符號(hào)關(guān)系,具有重要的世界觀意義,這正如結(jié)構(gòu)主義者的基本觀點(diǎn)所說,“事物的真正本質(zhì)不在于事物本身,而在于我們?cè)诟鞣N事物之間構(gòu)造,然后又在它們之間感覺到的那種關(guān)系……世界是由各種關(guān)系而不是由事物構(gòu)成的觀念”①[英]特倫斯·霍克斯著《結(jié)構(gòu)主義和符號(hào)學(xué)》,瞿鐵鵬譯,劉峰校,上海譯文出版社1977年版,第8頁(yè)。。對(duì)人文學(xué)科中的藝術(shù)資源,我們可稱其為結(jié)構(gòu)化文本,它直達(dá)事物內(nèi)容和語義的根本。
大數(shù)據(jù)理論認(rèn)為,不僅數(shù)據(jù)是可以結(jié)構(gòu)化的,文本也是可以結(jié)構(gòu)化的,②參見周寶曜、劉偉、范承工主編《大數(shù)據(jù):戰(zhàn)略·技術(shù)·實(shí)踐》,電子工業(yè)出版社2013年版,第7頁(yè)。而且可被稱為“半結(jié)構(gòu)化數(shù)據(jù)”。一般說來,可以被二維模式(或說二維結(jié)構(gòu))表現(xiàn)的數(shù)據(jù),即為結(jié)構(gòu)化數(shù)據(jù);而半結(jié)構(gòu)化數(shù)據(jù)并沒有嚴(yán)格的模式,以下文要涉及的XML為例,它的模式、結(jié)構(gòu),與它的數(shù)據(jù)值、內(nèi)容是混合在一起的,或者說,它的結(jié)構(gòu)是通過可“自描述”的“標(biāo)記”,與內(nèi)容結(jié)合在一起的。①參見孟小峰《XML數(shù)據(jù)管理:概念與技術(shù)》,清華大學(xué)出版社2009年版。筆者認(rèn)為,結(jié)合結(jié)構(gòu)主義的視角看,后者之所以被表述為“半結(jié)構(gòu)”,在于文本的一部分符碼的能指可以成為標(biāo)記,或者可以組成標(biāo)記,而還有相當(dāng)一部分符碼在文本規(guī)模有限的情況下很難被納入縝密的結(jié)構(gòu)關(guān)系中,其語義信息很難在結(jié)構(gòu)關(guān)系中得到體現(xiàn)。所以我們應(yīng)該認(rèn)為,結(jié)構(gòu)化與非結(jié)構(gòu)化之間沒有絕對(duì)的界限。
傳統(tǒng)數(shù)據(jù)庫(kù)中的是典型的結(jié)構(gòu)化數(shù)據(jù),對(duì)應(yīng)的技術(shù)范疇是數(shù)據(jù)庫(kù)系統(tǒng);而文本是半結(jié)構(gòu)化的,所以它對(duì)應(yīng)的技術(shù)范疇是信息系統(tǒng)。檢索數(shù)據(jù)庫(kù)系統(tǒng)已有成熟的技術(shù),如SQL;而查詢半結(jié)構(gòu)化的文本被稱為信息檢索,②參見[美]西爾伯沙茨等著《數(shù)據(jù)庫(kù)系統(tǒng)概念》,楊冬青等譯,機(jī)械工業(yè)出版社2012年版。筆者使用該文獻(xiàn)時(shí)用詞有改動(dòng),原文稱文本為“非結(jié)構(gòu)化的”,實(shí)際上指的就是筆者改動(dòng)后的“半結(jié)構(gòu)化”。如“音樂信息檢索”(Music Information Retrieval)等。
這里必須明確,作為文本的藝術(shù)出版資源,它所對(duì)應(yīng)的信息系統(tǒng)領(lǐng)域的技術(shù),在很大程度上和數(shù)據(jù)庫(kù)系統(tǒng)的技術(shù)相同——特別是資源存儲(chǔ)和檢索方面。因?yàn)橹灰獙?duì)半結(jié)構(gòu)化數(shù)據(jù)稍加處理,就能將其在一定程度上轉(zhuǎn)換成格式化的、結(jié)構(gòu)化的數(shù)據(jù),從而應(yīng)用于數(shù)據(jù)庫(kù)系統(tǒng)。③參見陳建紅等主編《Web數(shù)據(jù)庫(kù)與XML應(yīng)用》,高等教育出版社2004年版,“前言”。但是,信息系統(tǒng)領(lǐng)域和數(shù)據(jù)庫(kù)系統(tǒng)領(lǐng)域強(qiáng)調(diào)的重點(diǎn)又不盡相同——藝術(shù)(出版)資源素材庫(kù)的技術(shù)重點(diǎn),是基于關(guān)鍵詞的查詢,文檔與查詢的相似度分析,以及文檔的分析、分類和索引等。④參見《數(shù)據(jù)庫(kù)系統(tǒng)概念》。而對(duì)這類數(shù)據(jù)資源的檢索以至各種整合來說,XML技術(shù)的支撐尤有意義。⑤推薦深入閱讀潘有能著《XML挖掘:聚類、分類與信息提取》,浙江大學(xué)出版社2012年版。
XML(eXtensible Markup Language)意為“可擴(kuò)展標(biāo)記語言”。XML文檔其實(shí)也是一個(gè)文本文件,但它是由標(biāo)記及其所標(biāo)記的內(nèi)容構(gòu)成的文本文件(最初設(shè)計(jì)它,就是為了讓它成為給正文文檔添加標(biāo)注信息的一種途徑),這些標(biāo)記可以自由定義(自描述),所以它有“可擴(kuò)展”之稱。它的核心是(使用標(biāo)記)描述數(shù)據(jù)的組織結(jié)構(gòu),從而從中體現(xiàn)含義。通過將文本與子標(biāo)記嵌套在父標(biāo)記之下,再層層嵌套直到根標(biāo)記,形成“樹形結(jié)構(gòu)”,可以很好地揭示文本內(nèi)容與它們之間的結(jié)構(gòu)關(guān)系。(形象地說,圖書的目錄即是典型的樹形結(jié)構(gòu),它可以很好地概括書的內(nèi)容編排情況,也利于讀者查找。)XML通過文檔類型定義(Document Type Definition,DTD)和XML綱要定義(XML Schema Definition,XSD)模式對(duì)數(shù)據(jù)結(jié)構(gòu)(內(nèi)容)進(jìn)行定義與約束,通過層疊樣式表(CSS)和可擴(kuò)展樣式語言(XSL)對(duì)顯示方式(形式)進(jìn)行規(guī)定。
XML既可以使用在結(jié)構(gòu)化數(shù)據(jù)上,也可以使用在半結(jié)構(gòu)化數(shù)據(jù)上,且可以用來處理“結(jié)構(gòu)化文本”。它不是編程語言,而是一組語法規(guī)則,可在諸多領(lǐng)域創(chuàng)建語義豐富的標(biāo)記語言(比如下文提及的音樂),也可以作為數(shù)據(jù)交換的標(biāo)準(zhǔn)格式。應(yīng)該說,它對(duì)出版資源的存儲(chǔ)、檢索、分析、加工和處理都可以有重要作用。
樂譜作為音樂語言的符號(hào)表達(dá)方式,是一種很典型的結(jié)構(gòu)化文本。所以,XML對(duì)音樂記譜領(lǐng)域的滲入是有其自然趨勢(shì)的。
目前通用的一種使專業(yè)音樂和互聯(lián)網(wǎng)、數(shù)字出版無縫對(duì)接的XML制式是MusicXML,它由Recordare公司開發(fā),至2011年已發(fā)布3.0版本,該公司也在公共領(lǐng)域發(fā)布了名為“MusicXML 3.0 Tutorial”的官方使用教程。Music XML基于XML,是一種開放的、用于電子樂譜發(fā)布與信息交換的文件格式,適用于各種記譜軟件、音序軟件、音頻軟件(如Steinberg系列等)。相對(duì)于MIDI,Music XML可以在傳遞音樂文件時(shí)讓更多的信息完好保存,并很容易用來在網(wǎng)上發(fā)布交互式樂譜,⑥參見楊萬鈞《從MIDI到MusicXML——計(jì)算機(jī)樂譜信息交換格式的發(fā)展》,載《演藝科技》2014年第7期。這是因?yàn)樗鼈鬟f的信息中有相當(dāng)一部分是在傳達(dá)音樂的結(jié)構(gòu)和語義信息,這是MIDI所不具備的。舉一個(gè)最簡(jiǎn)單的例子:關(guān)于“等音”概念,MIDI無法表現(xiàn)升F音和降G音在符號(hào)意義上的區(qū)別(顯然這一區(qū)別在樂理和作曲技術(shù)理論領(lǐng)域是非常重要的),但MusicXML可以做到。
MusicXML設(shè)計(jì)理念的核心,就是描述音樂文本的組織結(jié)構(gòu)。其各層標(biāo)記形成的樹狀結(jié)構(gòu)如下頁(yè)圖1所示。⑦金玉《基于MUSICXML的音樂個(gè)性化推薦系統(tǒng)》,吉林大學(xué)2015屆碩士學(xué)位論文。圖經(jīng)過重制,中文釋義是重制時(shí)加的,僅供參考。圖中的每個(gè)方框代表MusicXML中定義的一種標(biāo)記,方框之間的從屬關(guān)系代表標(biāo)記之間的嵌套關(guān)系。MusicXML中定義的標(biāo)記非常多,此圖僅列舉了主要的一些,具體可參見MusicXML 3.0的官方教程。MusicXML的意義可以具體地從以下兩個(gè)方面得到詮釋。
MusiiccXXMMLL作為記譜媒介的意義我們知道,五線譜作為一種記譜法,其重要意義不僅在于從作曲技法層面記錄音樂,還在于從表演層面做記錄,二者緊密結(jié)合,才能盡量給音樂語義信息“保真”。類似地,在描述信息特征時(shí),MusicXML也顯著地把信息的標(biāo)記分為“可視的”和“可聽的”兩個(gè)層面:聽覺層面信息的標(biāo)記和MIDI基本相同,如對(duì)音高、時(shí)值等的記錄;視覺層面的信息標(biāo)記則主要有對(duì)譜面上的基本音型的選定,對(duì)聲部劃分、樂句劃分,以及拍子、調(diào)號(hào)、歌詞、速度、表情記號(hào)等的記錄。這一劃分對(duì)應(yīng)到XML文件中,通常表現(xiàn)為
當(dāng)然,圖1所示的結(jié)構(gòu)如果以XML標(biāo)記(用尖括號(hào)包圍的關(guān)鍵字)的形式寫出來,樣貌應(yīng)基本如下(為節(jié)約篇幅,這里僅列出開頭,而且,每個(gè)標(biāo)記其實(shí)還有一個(gè)對(duì)應(yīng)的結(jié)束標(biāo)記,以加斜杠來表示,這里也不再贅列):
除了基本的樂譜元數(shù)據(jù)信息(如上述標(biāo)簽中的樂章及其編號(hào)、名稱等)之外,這個(gè)文件的主體是結(jié)構(gòu)化文本信息。但是這里有一個(gè)必須說明的問題:樂譜的結(jié)構(gòu)是由“橫向的組合”與“縱向的聚合”兩個(gè)維度構(gòu)成的——音符按照節(jié)拍、小節(jié)與時(shí)值橫向組合,也按照對(duì)位線條、樂器聲部與和聲縱向聚合,但XML本身是通過標(biāo)記逐級(jí)嵌套來形成結(jié)構(gòu)的。所以,我們要么選擇將縱向的聚合嵌套在橫向的組合之內(nèi),要么反過來將橫向組合嵌套在縱向聚合之內(nèi)。前文給出的示例是常用的方式,即讓縱向嵌套在橫向之內(nèi),其根標(biāo)記為“聲部序列”即
圖1 MusicXML的各種標(biāo)記形成的樹狀結(jié)構(gòu)舉例
MusiiccXXMMLL對(duì)音樂文本結(jié)構(gòu)分析的意義既然對(duì)音樂文本的建構(gòu)可以從橫向的聲部出發(fā),也可以從縱向的節(jié)律出發(fā),那么從音樂分析的角度來看,對(duì)側(cè)重于用復(fù)調(diào)思維建構(gòu)起來的音樂和對(duì)側(cè)重于用和聲思維建構(gòu)起來的音樂,MusicXML的描述可以有所區(qū)別。因?yàn)閄ML的結(jié)構(gòu)如同數(shù)據(jù)庫(kù),在構(gòu)建文本信息的層次關(guān)系時(shí),也需要考慮如何更有效地去構(gòu)建,即如何盡量避免信息冗余、信息缺失。我們可以合理地設(shè)想:對(duì)側(cè)重于復(fù)調(diào)結(jié)構(gòu)的音樂,將小節(jié)標(biāo)記嵌套于聲部標(biāo)記之內(nèi)為宜;對(duì)側(cè)重于和聲結(jié)構(gòu)的音樂,將聲部標(biāo)記嵌套于小節(jié)標(biāo)記之內(nèi)為宜。更加幸運(yùn)的是,對(duì)同樣的音樂文本,MusciXML能夠靈活地在這兩種類型之間轉(zhuǎn)換。
在這種區(qū)別化的描述之間進(jìn)行抉擇與設(shè)計(jì),對(duì)音樂結(jié)構(gòu)的認(rèn)知、音樂的語義分析,都別具意義。就像普通XML有檢索優(yōu)勢(shì)那樣,MusicXML可以實(shí)現(xiàn)音樂結(jié)構(gòu)信息的索引功能。我們可以設(shè)計(jì)出特定的算法,給音樂分析方面的問題提供幫助,比如對(duì)四部和聲的規(guī)范性進(jìn)行校驗(yàn)、對(duì)曲式進(jìn)行基本歸類與聚合、對(duì)對(duì)位法的類型進(jìn)行識(shí)別、對(duì)和聲進(jìn)行與和聲節(jié)奏進(jìn)行辨認(rèn)、對(duì)配器布局進(jìn)行分析等。這意味著未來在信息系統(tǒng)平臺(tái)上工作的音樂編輯從業(yè)者,可以給音樂家和音樂學(xué)者提供更為科學(xué)、有效的專業(yè)支持。
在簡(jiǎn)單討論了關(guān)于音樂資源文本的結(jié)構(gòu)化問題之后,就可以回到數(shù)字出版的話題上來了。數(shù)字出版的技術(shù)平臺(tái),以數(shù)字資源的管理為核心,以傳統(tǒng)出版資源和新興資源的數(shù)字化轉(zhuǎn)型和構(gòu)建為關(guān)鍵,而基于XML的結(jié)構(gòu)化文本處理技術(shù)正好對(duì)應(yīng)著這個(gè)關(guān)鍵。面對(duì)文本和數(shù)據(jù)以及二者交融的信息資源,出版社的編輯團(tuán)隊(duì)該如何定位自己的職能呢?筆者認(rèn)為,從傳統(tǒng)的專業(yè)門類編輯逐步過渡到基于信息系統(tǒng)的數(shù)字化管理編輯是比較合適的。下文謹(jǐn)按傳統(tǒng)的對(duì)編輯職能的分類,嘗試申說這一潮流對(duì)音樂類編輯人員職能的影響。
(一)策劃編輯
策劃編輯的重要職能包括進(jìn)行選題策劃與營(yíng)銷,以及管理涉及讀者、作者等的客戶關(guān)系。未來,若要使其職能在新的技術(shù)條件下得到更好的發(fā)揮,至少應(yīng)考慮強(qiáng)化以下幾項(xiàng)有益的技能:建立用戶數(shù)據(jù)庫(kù)、作者與受眾數(shù)據(jù)庫(kù);建立出版物的元數(shù)據(jù)①元數(shù)據(jù)的定義,參見《XML挖掘:聚類、分類與信息提取》,第99頁(yè)。亦可參見國(guó)家新聞出版廣電總局出版專業(yè)資格考試辦公室編《數(shù)字出版基礎(chǔ)》,電子工業(yè)出版社2015年版。標(biāo)引規(guī)范,使之指向基礎(chǔ)的、元數(shù)據(jù)層面的信息資源整合;熟悉關(guān)系數(shù)據(jù)庫(kù)的構(gòu)建和SQL查詢語言②關(guān)系數(shù)據(jù)庫(kù)是指建立在關(guān)系模型基礎(chǔ)上的數(shù)據(jù)庫(kù),其存儲(chǔ)的數(shù)據(jù)對(duì)格式的要求非常嚴(yán)謹(jǐn),是高度結(jié)構(gòu)化的。正因如此,關(guān)系數(shù)據(jù)庫(kù)允許用戶使用符合特定語法的查詢語言對(duì)其進(jìn)行條件非常復(fù)雜的查詢。的使用,使之最終指向基于用戶信息需求的數(shù)字出版模式。
(二)內(nèi)容編輯
對(duì)文本內(nèi)容的處理,主要包括校、編、審。傳統(tǒng)的內(nèi)容編輯從業(yè)者主要是從版式、語言文字規(guī)范和學(xué)科專業(yè)視角來把關(guān)的,而數(shù)字出版的內(nèi)容編輯應(yīng)該還可以結(jié)合結(jié)構(gòu)化文本的處理思想,優(yōu)化這些工作環(huán)節(jié)。概括地說,對(duì)文本的結(jié)構(gòu)化描述和基于它的信息檢索,無疑是內(nèi)容編輯的有效工具,所以面對(duì)結(jié)構(gòu)化的文本,應(yīng)該結(jié)合信息系統(tǒng)的觀念來認(rèn)知并處理。下面就校、編、審三個(gè)環(huán)節(jié)分別做具體論述。
“?!钡沫h(huán)節(jié)首先,文本作為一種半結(jié)構(gòu)化數(shù)據(jù),可以用類似于關(guān)系模式的“模式信息”(即通過DTD或XSD)在一定程度上規(guī)定文本的結(jié)構(gòu)。
其二,之所以有“校異同比校對(duì)錯(cuò)要難”的公認(rèn)看法,是因?yàn)橛僧愅碌摹安铄e(cuò)”是一個(gè)相對(duì)而非絕對(duì)的問題。但就結(jié)構(gòu)化的文本而言,破除異同障礙的齊、清、定原則履行起來就容易得多。而正如概念的本質(zhì)在于結(jié)構(gòu)中的關(guān)系那樣,概念的正謬也應(yīng)該根據(jù)結(jié)構(gòu)關(guān)系來判斷。對(duì)被納入結(jié)構(gòu)關(guān)系中的文字文本來說,校異同更為重要,而在何種程度上將“異”化為“同”,又要參考其結(jié)構(gòu)模式。對(duì)于未被納入結(jié)構(gòu)關(guān)系中的文本,依然以校是非為主要任務(wù)。
具體到樂譜的校對(duì)方面更是如此。從記譜法的角度看,可以通過對(duì)MusicXML數(shù)據(jù)結(jié)構(gòu)的特定限制(使用DTD或XSD)避免記譜方面出現(xiàn)基本邏輯錯(cuò)誤。當(dāng)然,許多打譜軟件已經(jīng)通過特定的算法基本滿足了這個(gè)訴求,但仍存有一些模棱兩可的問題,比如“西貝柳斯”軟件在一行五線譜記錄兩個(gè)聲部(符桿分別向上和向下)的情況下,對(duì)那些在一個(gè)小節(jié)內(nèi)時(shí)值不完整的聲部,究竟允許省略其休止符還是必須通過休止符填滿那個(gè)小節(jié),其實(shí)并不明確,這常常給校對(duì)造成棘手的問題。而通過DTD和XSD進(jìn)行限制,就可以很容易地統(tǒng)一規(guī)范并鑒別錯(cuò)誤。
當(dāng)然,有些音樂流派,比如結(jié)構(gòu)主義,其作曲家及編輯可能會(huì)有意識(shí)地在聲部的處理方式、連音線對(duì)樂句的劃分方式等方面突出結(jié)構(gòu)上的呼應(yīng)。將來MusicXML通過標(biāo)記的深度擴(kuò)展與算法的開發(fā),也可以去實(shí)現(xiàn)一定程度上的校異同功效。
“編”的環(huán)節(jié)這個(gè)環(huán)節(jié)就MusicXML的特點(diǎn)來說,重點(diǎn)會(huì)集中在標(biāo)引的問題上——標(biāo)注出哪些屬于結(jié)構(gòu)的范圍,哪些屬于非結(jié)構(gòu)化的內(nèi)容范圍,這也是半結(jié)構(gòu)化文本XML之所長(zhǎng)。而且,XML及圍繞其周邊的技術(shù)可以對(duì)文本從內(nèi)容到形式進(jìn)行由內(nèi)到外的統(tǒng)一整合,比如,利用XML的樣式表即CSS或XSL對(duì)版式進(jìn)行規(guī)定,或?qū)ML和HTML有效對(duì)接,可以更好地實(shí)現(xiàn)網(wǎng)絡(luò)上的交互與內(nèi)容結(jié)構(gòu)的可視化。
圖2 使用Excel軟件分析結(jié)構(gòu)化的音樂文本的一個(gè)例子
對(duì)高度結(jié)構(gòu)化的音樂作品文本,可以另從關(guān)系數(shù)據(jù)庫(kù)的“數(shù)據(jù)透視表”模式著眼。這里舉一個(gè)關(guān)于僅憑數(shù)據(jù)內(nèi)容就能將音樂結(jié)構(gòu)可視化的簡(jiǎn)單例子:在一本關(guān)于“曲式與作品分析”的圖書中,加進(jìn)MusicXML的作品數(shù)據(jù)庫(kù),甚至將XML格式化為關(guān)系數(shù)據(jù)表,就能在Excel軟件上通過類似于數(shù)據(jù)透視表的工具進(jìn)行交叉分析,如圖2。
鑒于作品的音樂結(jié)構(gòu)特點(diǎn)和分析訴求,圖2的根標(biāo)記是小節(jié)(即
若還原它的XML數(shù)據(jù)面貌,無論對(duì)大多數(shù)傳統(tǒng)音樂編輯還是對(duì)音樂學(xué)師生而言,可能都不夠“友好”:
當(dāng)然,XML也有豐富的對(duì)版式進(jìn)行定義和表現(xiàn)的功能,即樣式表。通過樣式表,再將其展示為音樂學(xué)師生熟悉的曲式分析圖是不難的。限于篇幅,在此不作詳述。
總之,從編輯學(xué)中“編”這個(gè)環(huán)節(jié)的視角看,結(jié)構(gòu)化文本帶來了很重要的一個(gè)概念,可以寫作“匯·編”:它的要點(diǎn)在于對(duì)已有資源——對(duì)音樂資源而言,是音樂文本的“語料庫(kù)”——進(jìn)行重新整合。如果擁有像上例這樣的音樂資源庫(kù),那么很多彼此相似的樂譜類出版物在加工中就省去了不少重復(fù)勞動(dòng)。
“審”的環(huán)節(jié)這個(gè)環(huán)節(jié)主要牽扯到對(duì)信息的認(rèn)知的問題。編輯業(yè)務(wù)中的審稿過程,實(shí)際上是審稿者對(duì)文本的語義信息的定性過程,從信息論的角度看,這種性質(zhì)實(shí)際上是信息的規(guī)律性與變化性之間的對(duì)立與統(tǒng)一。筆者認(rèn)為,文本既然可以被XML充分描述,那么它的這種規(guī)律性與變化性也是可以在XML的結(jié)構(gòu)中自然體現(xiàn)出來的:有序的結(jié)構(gòu)關(guān)系是規(guī)律性的體現(xiàn),而除了標(biāo)記之外,其他內(nèi)容以及標(biāo)記的屬性(這個(gè)屬性是非結(jié)構(gòu)化的)是不斷變化的信息,它們具有不確定性,缺乏模式的約束,是趨于非結(jié)構(gòu)化的,以前文的思路來看是“很難被納入縝密的結(jié)構(gòu)關(guān)系中”的。所以,XML的“自描述”結(jié)構(gòu),本身就可以很好地揭示這樣一種思維:一部稿件,既作為信息系統(tǒng)中的文本,又作為音樂藝術(shù)領(lǐng)域中的文本,可以因?yàn)榛靵y而復(fù)雜(指非結(jié)構(gòu)化信息過多,這里的復(fù)雜是貶義),也可以因?yàn)榭b密而復(fù)雜(指以結(jié)構(gòu)化信息為主導(dǎo),這里的復(fù)雜是褒義),亦可以因?yàn)樗缮⒍?jiǎn)單(指以非結(jié)構(gòu)化信息為主導(dǎo),這里的簡(jiǎn)單是貶義),還可以因?yàn)槿哂喽?jiǎn)單(指結(jié)構(gòu)化信息充足,這里的簡(jiǎn)單是褒義)。
這種思想,是結(jié)構(gòu)化文本與XML的描述技術(shù)給關(guān)于“審”的理論的重要啟發(fā)。為了便于體會(huì)其間的辯證關(guān)系,筆者擬下頁(yè)圖3以示意之。
圖3 從結(jié)構(gòu)化的視角看音樂文本稿件的質(zhì)量①這個(gè)編審方陣模式圖系本文作者之一曹軍軍設(shè)計(jì),力圖結(jié)合XML結(jié)構(gòu)化數(shù)據(jù)描述的實(shí)際。例如,通常所見的“流水清單”是非常適于用XML文檔描述的,而對(duì)這個(gè)文檔的判定,恰可以結(jié)合此方陣的思路——該文檔應(yīng)當(dāng)處于右下部,因?yàn)橛肵ML描述的流水清單恰恰是結(jié)構(gòu)化程度非常高且有大量冗余的。
進(jìn)一步說,對(duì)音樂藝術(shù)作品類的出版資源的審讀也是一個(gè)審美的問題,所以圖3的理念也可以在審美領(lǐng)域得到引用:從形式主義藝術(shù)觀的視角來看,方陣的右列對(duì)應(yīng)于自律性和結(jié)構(gòu)化的資源,方陣的左列對(duì)應(yīng)于有更多現(xiàn)代主義②王宏建在其《藝術(shù)概論》(文化藝術(shù)出版社2010年版)中論及現(xiàn)代主義思潮時(shí),有意地用了“結(jié)構(gòu)趨于松散而復(fù)雜”這兩個(gè)看似相悖的概念。筆者認(rèn)為這一用法是很有道理的,而且可以通過圖3所示的方陣“可視化”地展現(xiàn)出來——非結(jié)構(gòu)化恰對(duì)應(yīng)于兩種樣態(tài),即松散且復(fù)雜。方陣的左側(cè)趨于“貶義”,和文藝界對(duì)現(xiàn)代主義“反傳統(tǒng)”的價(jià)值評(píng)判也是不無關(guān)聯(lián)的。特性以致趨于解構(gòu)的、漸受詬病的后現(xiàn)代主義。
因此,藝術(shù)類出版物的編輯對(duì)文本質(zhì)量的評(píng)審與審美,是相通的且彼此融合的。具體到音樂領(lǐng)域,也早已有如上所述的“信息論”式的,將質(zhì)化、量化融合的評(píng)述。樂譜編輯面對(duì)讓人眼花繚亂的樂譜資源,做最基本的審閱時(shí),是可以嘗試結(jié)合圖3的思路的:冗余而簡(jiǎn)單的信息特征應(yīng)該對(duì)應(yīng)古典主義音樂風(fēng)格,趨于“縝密而復(fù)雜”的可能就對(duì)應(yīng)著傳統(tǒng)和聲學(xué)歷史的復(fù)雜化演進(jìn)但又不失一個(gè)“(調(diào)性)中心”的風(fēng)格發(fā)展歷程,而無調(diào)性的序列音樂則大致對(duì)應(yīng)著方陣的左側(cè)。
(三)融合編輯——編輯人才建設(shè)的方向
我們知道,在策劃編輯業(yè)務(wù)范圍內(nèi)獲得的基礎(chǔ)的元數(shù)據(jù)等一系列信息資源,本身就容易成為完全結(jié)構(gòu)化的數(shù)據(jù)——XML標(biāo)記的可擴(kuò)展特征,讓它很利于元數(shù)據(jù)標(biāo)引。而且從數(shù)字出版技術(shù)的角度看,“描述信息資源的粒度既要能夠描述一個(gè)資源集合,也要能夠描述一個(gè)單一資源或者資源的內(nèi)部組成部分”③參見《數(shù)字出版基礎(chǔ)》,第166頁(yè)。關(guān)于這個(gè)論題,從實(shí)用層面來看,Jing.fm創(chuàng)始人施凱文曾談及:“我們能獲取的信息只有名稱、歌手、作曲等,而里面更豐富的信息,比如包含的樂器、使用的語言、包含的情感、適合的場(chǎng)景等信息,則處于隱藏狀態(tài),無從而知?!保ㄘ短剿鞯谒拇诰€音樂——深度揭秘Jing.fm》,載“豆瓣網(wǎng)”,2012年6月26日。https://site.douban.com/133015/wi-dget/ notes/5649776/note/222027481/)這自然地牽引著我們將數(shù)據(jù)量化的目標(biāo)由元數(shù)據(jù)轉(zhuǎn)向結(jié)構(gòu)化的文本內(nèi)部,即音樂作品文本內(nèi)部。,因此,XML與文本內(nèi)容信息的有機(jī)對(duì)接,合乎數(shù)字出版技術(shù)的發(fā)展趨勢(shì)。
策劃與編、審、校這些業(yè)務(wù),是可以在結(jié)構(gòu)化數(shù)據(jù)層面彼此接通的。策劃工作中如果善用XML和它的檢索與挖掘技術(shù)(如XQuery),就相當(dāng)于具體編校工作中善用元數(shù)據(jù)層面的關(guān)系數(shù)據(jù)庫(kù)和SQL查詢語言。這種接通的意義,在數(shù)字出版的一些目前略顯尷尬的微觀領(lǐng)域可以有所體現(xiàn),比如編輯結(jié)合對(duì)專業(yè)內(nèi)容的“前理解”、對(duì)作者與讀者需求的調(diào)查,自主地對(duì)出版資源進(jìn)行標(biāo)引工作,定義自己的XML擴(kuò)展標(biāo)記,從而形成信息數(shù)據(jù)化的管理架構(gòu)。當(dāng)然具體來說還有一些需要注意的事情,比如像西方古典音樂這樣的嚴(yán)肅音樂出版內(nèi)容,其資源的整合就不會(huì)像流行音樂中“單曲和專輯”那樣簡(jiǎn)單明了。如果將某部組曲,或者規(guī)范的四樂章交響曲,又或古典主義奏鳴曲定義為獨(dú)立的標(biāo)記,那么標(biāo)記之內(nèi)嵌套的子標(biāo)記就要是完整作品之下的某個(gè)單曲小品或某個(gè)樂章,再往下才可能是對(duì)作品的內(nèi)部結(jié)構(gòu)的標(biāo)記。而從曲式與音樂作品分析的視角來看,單曲小品和樂章的劃分與排序,本身就有著很重要的結(jié)構(gòu)意義。若出版人員將這類單樂章、單曲小品視同于流行歌中的“單曲”并純粹地將其作為元數(shù)據(jù)加以標(biāo)引和處理,就顯得缺乏一定的音樂專業(yè)的意識(shí)。這也從另一個(gè)角度說明,策劃編輯的元數(shù)據(jù)處理和內(nèi)容編輯的文本結(jié)構(gòu)數(shù)據(jù)處理,本應(yīng)當(dāng)無縫對(duì)接、有機(jī)融合。所以,恰是XML這樣的文本和數(shù)據(jù)處理工具在思想上啟發(fā)我們:未來應(yīng)當(dāng)有一種“融合編輯”的角色,這種角色應(yīng)當(dāng)具有數(shù)據(jù)庫(kù)的管理思想并能使之滲入宏觀的策劃與微觀的內(nèi)容編校工作。
簡(jiǎn)單概括來說,出版技術(shù)發(fā)展的趨勢(shì)是趨于實(shí)現(xiàn)更加有效的查詢與匹配?;赬ML的挖掘——聚類、分類與信息提取——為我們提供了多種出版效益模式的可能性。數(shù)字出版人才既要人文學(xué)科式地從質(zhì)化的角度縱深認(rèn)識(shí)每項(xiàng)專業(yè)內(nèi)容的信息層面,做好數(shù)字內(nèi)容的標(biāo)引工作(如對(duì)XML標(biāo)記的擴(kuò)展描述),又要自然科學(xué)式地敢于接納量化的工具與思想。后一方面是本文尤其想強(qiáng)調(diào)的,例如:“分類”挖掘是基于門類專業(yè)縱深的預(yù)定義(如參照已經(jīng)標(biāo)準(zhǔn)化的MusicXML的標(biāo)記)去對(duì)文本進(jìn)行分類與匹配,“聚類”挖掘是在海量資源的基礎(chǔ)上更客觀地實(shí)現(xiàn)自動(dòng)化分類,“發(fā)現(xiàn)XML文檔間隱含的知識(shí),確定XML文檔內(nèi)標(biāo)記的真實(shí)語義信息,為語義網(wǎng)的發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)”。①《XML挖掘:聚類、分類與信息提取》,第26頁(yè)。
曹軍軍,中國(guó)文聯(lián)出版社音樂分社及中國(guó)文聯(lián)音像出版公司編輯,主要研究方向?yàn)閭鞑W(xué)。
姜紅,中國(guó)文聯(lián)出版社數(shù)字出版中心信息中心業(yè)務(wù)主管,主要研究方向?yàn)橛?jì)算機(jī)應(yīng)用科學(xué)。