摘要:伴隨著數(shù)字化革命的到來,傳統(tǒng)音頻檔案陷入了“窘迫”的境地。一方面由于新技術(shù)的層出不窮,舊的記錄載體和播放設(shè)備早已過時;另一方面,數(shù)字信號記錄的音頻復(fù)制無衰減,高信噪比,已呈現(xiàn)出取代模擬音頻的態(tài)勢。如果不及時地對這些音頻檔案進行轉(zhuǎn)換,或許在不久的將來它們都將無法識讀,造成“社會記憶”的喪失。為此,如何完好地保存和利用這些珍貴的音頻檔案就十分迫切。本文結(jié)合國外在這方面的情況,對我國音頻檔案數(shù)字化提出了自己的看法。
關(guān)鍵詞:音頻 檔案 數(shù)字化 采樣參數(shù)
1國外音頻檔案數(shù)字化現(xiàn)狀
國外相關(guān)領(lǐng)域開展音頻資源數(shù)字化研究較早,不同類別的機構(gòu)組織成立了眾多項目,并在實踐的基礎(chǔ)上形成了各自相關(guān)的音頻檔案數(shù)字化標準。
1.1國外音頻檔案數(shù)字化項目
國際音像檔案協(xié)會IASA于2005年12月出臺了IASA-TC 03指南修訂版:保護音頻遺產(chǎn):道德,原則與保管策略(The Safeguarding of the Audio Heritage:Ethics, Principles and Preservation Strategy)。該指南闡述了數(shù)字環(huán)境中傳統(tǒng)音頻檔案保存所面臨的各種問題,指出為了長久保存,記錄在傳統(tǒng)載體上的音頻信息必須轉(zhuǎn)換成數(shù)字格式存儲于數(shù)字環(huán)境中,并推薦傳統(tǒng)音頻數(shù)字化加工過程中涉及的相關(guān)參數(shù)設(shè)置以及文件存儲格式。
美國國家錄音保管署音頻文件保存項目。美國國會于2000年頒布了國家錄音保護法案,根據(jù)法案,專設(shè)國家錄音保管署(NRPB)。致力于音頻資源的長久保存,并統(tǒng)領(lǐng)圖書館、檔案館、歷史研究界、音頻工作站等其他機構(gòu)對其所擁有的音頻資源所開展的保管和利用工作。同時在國會引導(dǎo)下NRPB及美國國家圖書館共同撰寫了國家音頻保護現(xiàn)狀的報告,并拓寬保護音頻資料的途徑。
聲音指南:世界音頻遺產(chǎn)數(shù)字存儲和利用項目。該項目目前是世界范圍內(nèi)開展音頻檔案保存眾多項目中的典型。由美國人文資源存儲和利用研究及發(fā)展項目為其專設(shè)基金,意在解決瀕臨消失的珍貴音頻檔案準確、穩(wěn)定并長期保存的問題,同時滿足利用者檢索的需求。
歐洲廣播檔案保護技術(shù)PRESTO項目,旨在為歐洲包括英國BBC、德國SWR、法國INA在內(nèi)的十家知名公共廣播公司所擁有的聲像廣播檔案研發(fā)關(guān)鍵的保護技術(shù),制定經(jīng)濟適用的保管策略。該項目在對歐洲公共廣播公司廣播檔案的現(xiàn)狀及現(xiàn)行保管的方案與技術(shù)調(diào)查過程中,發(fā)現(xiàn)至少有兩百萬小時的聲像資料面臨載體過時、受損、老化等種種危險。目前RAI廣播公司承擔(dān)著整個歐洲廣播音頻檔案數(shù)字化工作。
澳大利亞國家檔案館NAA在開展音頻檔案數(shù)字化工作時,著重參照國際音像檔案協(xié)會IASA 制定的IASA TC-04數(shù)字音頻資源形成與保護指南,確保了對數(shù)字化后的音頻檔案長久保存。同時,澳大利亞檔案館承諾在不久的將來,將為用戶提供互聯(lián)網(wǎng)在線利用服務(wù)。
1.2采樣參數(shù)的設(shè)置
模數(shù)轉(zhuǎn)換在音頻檔案數(shù)字化過程中尤為重要。在進行模數(shù)轉(zhuǎn)換時,勢必會涉及到采樣參數(shù)的設(shè)置問題。目前,國外普遍認為CD標準44.1KHz/16Bit已無法滿足音頻檔案保存的要求。在音頻檔案數(shù)字化存儲時采樣精度設(shè)置為24Bit得到國外眾多項目的認同。
然而,國外關(guān)于音頻檔案數(shù)字存儲方面在采樣頻率的設(shè)置上存在分歧。國際聲音和聲像檔案組織IASA強調(diào)音頻檔案數(shù)字化時應(yīng)對輔助信息(如人耳難以識別的噪聲)進行保存,建議最低采樣頻率為48KHz。對于特殊保存價值的需高達96KHz。美國國會圖書館對特殊要求的音頻檔案也要求采用96KHz/24Bit。而部分專家建議采用88.2KHz/24Bit,因為這轉(zhuǎn)換為44.1KHz低采樣頻率時信息失真較之選取96KHz小。挪威國家圖書館一般采用48KHz用于年代較久的音頻檔案數(shù)字化。哈佛大學(xué)圖書館獲取和保存模擬音頻文件時規(guī)定采樣頻率為88.2KHz。伊利諾斯州圖書館學(xué)術(shù)研究協(xié)會CARLI則是根據(jù)音頻文件的內(nèi)容提出了不同的要求。一般從CD載體上獲得的音頻資源采用44.1KHz/16Bit,內(nèi)不含樂器演奏的錄音檔案選用48KHz/24Bit,歷史悠久特別是內(nèi)容中包含音樂、自然聲響的音頻檔案采樣時推薦采用96KHz/24Bit。
1.3文件格式
IASA、澳大利亞檔案館、美國國會圖書館和歐洲廣播聯(lián)盟EBU(The European Broadcasting Union)等項目都強烈推薦BWF格式作為音頻檔案存儲格式。目前,國外檔案界普遍使用廣播波形格式BWF格式,該格式由歐洲廣播聯(lián)盟在《廣播波形格式用于音頻數(shù)據(jù)文件交換》標準中提出,適用于基于不同計算機平臺的音頻工作站之間的數(shù)字音頻文件格式的無縫交換。
在服務(wù)格式的選擇上,美國國會圖書館選用低采樣頻率的44.1KHz/16Bit的WAVE格式以及流行的MP3格式。伊利諾斯州圖書館學(xué)術(shù)研究協(xié)會(CARLI)采用MP3以及流媒體格式Real Audio、Windows Media、Quick Time作為服務(wù)格式。為了快速傳輸,便于互聯(lián)網(wǎng)利用,該協(xié)會還規(guī)定了MP3格式不同傳輸比率應(yīng)用標準:不含音樂的歷史原聲傳輸比特率設(shè)定為128Kbps,一般的音頻資源比特率為192 Kbps,對于高音質(zhì)要求的音頻檔案建議采用320 Kbps比特率。
可見,國外特別是需要高質(zhì)量存儲的音頻檔案模數(shù)轉(zhuǎn)換時都采用高于CD“紅寶書”音頻標準的采樣頻率和采樣精度。因為選取高采樣頻率和精度可以準確捕捉噪聲以及人耳難以感知但頻率高于44.1KHz將來可以被新算法捕捉的輔助信息,保存聽不見但影響音質(zhì)效果的和聲,增強聽眾的空間感和樂感。
2 我國音頻檔案數(shù)字化現(xiàn)狀
長期以來,作為信息服務(wù)行業(yè)的圖書館、檔案館保留了豐富的音頻資源。圖書館領(lǐng)域較早開展音頻資源數(shù)字化工作,在對音頻資源進行數(shù)字化技術(shù)加工方面積累了大量的經(jīng)驗。檔案領(lǐng)域音頻檔案數(shù)字化工作起步相對較晚,而圖書館館藏的一部分音頻資源其實質(zhì)就是音頻檔案,因而,該領(lǐng)域的經(jīng)驗無疑對檔案界開展音頻檔案數(shù)字化工作起到借鑒作用。
圖書館領(lǐng)域在數(shù)字圖書館標準規(guī)范建設(shè)的框架下專門設(shè)立《數(shù)字資源加工標準與操作指南》項目,其中,有關(guān)音頻資源數(shù)字化加工的《通用數(shù)字資源(音頻數(shù)據(jù))格式標準分析報告》已經(jīng)完成并進入了實質(zhì)性階段。該報告對目前存在眾多不同的數(shù)字音頻標準、編碼以及格式進行調(diào)研。對于與取樣、壓縮和編碼等方式有關(guān)的算法級標準,該報告認為應(yīng)在跟蹤MPEG系列標準的發(fā)展動態(tài)基礎(chǔ)上進行。相關(guān)文件格式的選取應(yīng)充分考慮已有資源的普及程度和對相應(yīng)MPEG標準的支持程度。在此基礎(chǔ)上,還應(yīng)遵循保存與使用兼顧的原則以及充分支持流媒體應(yīng)用方式的原則[1]。保存格式選取不壓縮或無損壓縮的WAV文件格式,服務(wù)格式選用MP3和AAC(MPEG-2及MPEG-4標準采用AAC編碼)格式。在對音頻資源進行數(shù)字化存儲時在采樣參數(shù)的設(shè)置上根據(jù)不同的文獻類型提出了不同的要求。特殊錄音資料的采樣頻率為128KHz/96KHz,采樣精度為24Bit;CD質(zhì)量標準應(yīng)選用96KHz/48KHz;語音質(zhì)量的采樣頻率為44.1KHz/22.05KHz,采樣精度為16Bit。音頻資源使用推薦標準針對應(yīng)用場景的不同,對于比特率范圍在56KHz~256 KHz較高比特率的情況下,采樣時選用44.1 KHz/16Bit。比特率范圍在30KHz~64 KHz以及20KHz~40 KHz的較低比特率情況下,均選用22.05KHz/16Bit。
近年來,我國從中央到地方的各級檔案部門都將音頻檔案數(shù)字化工作納入了工作計劃范圍。2010年,國家檔案局出臺了《數(shù)字聲像檔案著錄規(guī)則(征求意見稿)》,適用于各級、各類檔案館(室)內(nèi)聲像檔案收集整理、數(shù)字化、編目加工、交換、對外提供等相關(guān)業(yè)務(wù)[2]。為音頻檔案數(shù)字化工作的開展奠定了基礎(chǔ)。同時,大部分省市也已開展音頻檔案數(shù)字化工作,并做出相應(yīng)的規(guī)定。例如青島市檔案館根據(jù)《青島市電子檔案管理技術(shù)標準》制定了《檔案資料數(shù)字化標準(試行)》,該標準規(guī)定傳統(tǒng)音頻檔案存儲格式為WAV或MP3,選用44.1KHz作為聲音采樣標準,對于DVD中的聲音選用48KHz。長沙市城建檔案館聯(lián)合高新科技企業(yè)共同開發(fā)了多格式、多對象完全兼容的“長沙市城建檔案館聲像檔案信息管理系統(tǒng)”,對檔案館內(nèi)傳統(tǒng)的聲像檔案資料采集時,將錄像機輸出的視音頻信號通過采集上載工作站數(shù)字化,生成時間上精確到幀的MPEG-2高碼流文件和WMV流媒體低碼流文件,形成數(shù)字化聲像檔案,并且可以嵌入在現(xiàn)有的GIS系統(tǒng)和綜合辦公系統(tǒng)中。但我國還未制定有關(guān)音頻檔案數(shù)字化加工標準。各級檔案部門實踐的重點仍在紙質(zhì)檔案數(shù)字化處理上,涉及音頻檔案數(shù)字化研究不夠深入。
3 啟示
在數(shù)字化席卷的今天,傳統(tǒng)音頻檔案處于模擬音頻向數(shù)字音頻轉(zhuǎn)化的過渡階段。大量有價值的傳統(tǒng)音頻檔案還是以模擬音頻的形式存在,無論是長久保存還是方便利用,對其數(shù)字化都勢在必行。
音頻檔案數(shù)字化是一項批量加工生產(chǎn)的工程。在音頻檔案數(shù)字化加工過程中,存在著眾多可選擇的數(shù)字音頻標準、編碼以及格式,若缺少統(tǒng)一的標準,不僅使實踐缺乏規(guī)范,更會給檔案信息資源的整合共享帶來極大困難。為避免重復(fù)建設(shè),選擇適當?shù)牟蓸訕藴屎蛢?nèi)容文件格式標準尤其重要。為此,在對音頻檔案數(shù)字化加工時,應(yīng)明確音頻檔案數(shù)字化的目的,在此基礎(chǔ)上,不斷權(quán)衡各因素的相互關(guān)系,兼顧不同的需求和應(yīng)用環(huán)境。
目前,國外音頻檔案數(shù)字化加工規(guī)范趨向成熟,在對音頻檔案數(shù)字化長久保存方面的要求更為嚴格,在參數(shù)設(shè)定上選擇了更高的采樣方案。同時,檔案界不能“閉門造車”,而應(yīng)緊密跟蹤國外音頻檔案數(shù)字化研究和國內(nèi)相關(guān)行業(yè)的發(fā)展動態(tài),借鑒國內(nèi)外已取得的先進成果,結(jié)合檔案自身特點,盡量采用或兼容其標準規(guī)范,以實現(xiàn)不同信息源的音頻資源交流共享,爭取音頻檔案數(shù)字化加工標準早日出臺。
注釋:
[1] 我國數(shù)字圖書館標準規(guī)范建設(shè):通用數(shù)字資源(音頻數(shù)據(jù))格式標準分析報告
2002DEA20018,2003年8月。
[2] 檔案行業(yè)標準:數(shù)字聲像檔案著錄規(guī)則(征求意見稿),2010。
參考文獻:
1.International Association of Sound and Audiovisual Archives.IASA-TC 03 The Safeguarding of the Audio Heritage: Ethics, Principles and Preservation Strategy[R]. Version 3, December 2005.6
2.National Recording Preservation Board of the Library of Congress.Capturing Analog Sound for Digital Preservation: Report of a Roundtable Discussion of Best Practices for Transferring Analog Discs and Tapes[R].March 2006.
3. http://presto.joanneum.ac.at/index.asp(檢索日期:2010-12-3)
作者單位:蘇州大學(xué)