摘 要:數(shù)字語言學習系統(tǒng)隨著計算機、網(wǎng)絡、多媒體的發(fā)展越來越普及,為了實現(xiàn)其很好的教學效果,需要語音的傳遞實時性強,能實現(xiàn)語音的多點通信和分組通信。隨著DSP技術的發(fā)展,將DSP技術運用到該數(shù)字語言學習系統(tǒng),實現(xiàn)語音信息數(shù)字化和數(shù)字通信網(wǎng)絡化,采取DMA讀取硬盤的方式,使得該系統(tǒng)性能好,達到了實現(xiàn)全數(shù)字語言教學的目的。
關鍵詞:DSP; 數(shù)字語言; 網(wǎng)絡通信; 實時通信
中圖分類號:TP334 文獻標識碼:A
文章編號:1004-373X(2010)09-0148-03
Real-time, Multi-point Speech Communication of Digital Language Learning System
LIU Fang
(Engineering and Commerce South-Central University for Nationalities Institute of Business and Experiment Center, Wuhan 430065, China)
Abstract: Digital language learning system is becoming more and more popular with the development of computers, networks and multimedia, which needs real-time transmission, multi-point communication and packet communication of speech for achieving its good teaching result. With the development of DSP, it is applied to the digital language learning system to realize speech information digitization and digital communication networking. DMA is taken to read the hard disk, make the system performance good and achieve the full digital language teaching.
Keywords: DSP; digital language; network communication; real-time communication
0 引 言
全數(shù)字語言學習系統(tǒng)(語音教室)在本專院校培養(yǎng)外語人才中廣泛運用。本文主要設計了數(shù)字語言學習系統(tǒng)的語音通信過程,實現(xiàn)了教師端和某個學生端、教師端對一組學生端、分組的多個學生端、單個和單個學生端間的實時交流通話。
隨著計算機技術、網(wǎng)絡通信技術、多媒體技術的發(fā)展和普及,語音通信系統(tǒng)也從傳統(tǒng)的模擬電路產(chǎn)品發(fā)展成為全數(shù)字化產(chǎn)品,改進了傳統(tǒng)語言學習系統(tǒng)的不足。在結構設計上,本系統(tǒng)的數(shù)據(jù)傳輸是建立在計算機網(wǎng)絡的IT技術之上,結構由復雜變得簡單,功能由單一變得齊全,更重要的是在語音通信中不僅保證傳輸?shù)膶崟r性,而且抗干擾能力強、失真小、清晰、音質(zhì)音色好。該系統(tǒng)的設計主要結合現(xiàn)代高端DSP技術,保證系統(tǒng)的穩(wěn)定和通信的實時可靠。
1 數(shù)字語言學習系統(tǒng)的設計
1.1 系統(tǒng)功能
數(shù)字語言學習系統(tǒng)所應有的功能如下:一是能對教師端或?qū)W生端發(fā)出的語音信號進行采集和播放;二是該系統(tǒng)具備數(shù)字錄音和點播重放的功能,需要對語音信號進行存儲,由外設的FLASH存儲器來完成;三是在整個教室的局域網(wǎng)系統(tǒng)中,語音的傳輸要通過DSP的ISA總線平臺來進行網(wǎng)絡化的傳輸。
為了實現(xiàn)上述功能,在技術上必須實現(xiàn)語音信息的數(shù)字化和數(shù)字通信網(wǎng)絡[1],語音的數(shù)字化指對從麥克風發(fā)出的語音信號進行放大、濾波后通過ADC采樣轉化成數(shù)字信號,然后由DSP芯片對數(shù)字信號進行糾錯、壓縮成語音壓縮包,按照MPEG標準對語音進行編碼,最后通過解碼,解壓縮,DAC轉換成模擬語音信號,通過功放放大后輸出給終端的接收部分。數(shù)字通信的網(wǎng)絡化是指局域網(wǎng)中的多臺學生計算機通過計算機網(wǎng)絡技術,將傳統(tǒng)語音通信中的控制線路和模擬線路改進為單一的數(shù)字線路。在這個網(wǎng)絡語音通信中,學生機也采用PC機的聲卡和網(wǎng)卡,基于DSP的ISA總線平臺,通過網(wǎng)卡直接編程實現(xiàn)DSP與聲卡、網(wǎng)卡的接口連接,構建了DSP的以太網(wǎng),通過DSP接收和發(fā)送以太網(wǎng)的數(shù)據(jù),通過標準的網(wǎng)絡協(xié)議實現(xiàn)網(wǎng)絡數(shù)據(jù)的交換。
1.2 數(shù)字語言學習系統(tǒng)的結構圖
系統(tǒng)硬件主要包括網(wǎng)絡交換機、教師機、服務器、語音控制器、學生終端[2],系統(tǒng)結構框圖如圖1所示。中央控制器是插在計算機里的一塊 ISA總線適配卡,它是這個系統(tǒng)的核心,它與交換機和語音控制器相連接,采用時分多址的策略對整個網(wǎng)絡進行管理,同時控制所有語音信息通信的切換和處理。一方面中央控制器將PC機發(fā)出的語音和控制信號通過以太網(wǎng)傳傳遞給學生端,另一方面又對學生端發(fā)出的信號進行分析處理,然后發(fā)終端信號給PC機,在該系統(tǒng)中以太網(wǎng)數(shù)據(jù)包中包含有源地址和目的地址,每個學生端網(wǎng)卡的IP地址是惟一的,方便教師端對學生端的控制。
圖1 數(shù)字語言學習系統(tǒng)的結構圖
2 數(shù)字語音通信的DSP平臺設計
2.1 數(shù)字語言通信的DSP平臺硬件圖
該數(shù)字語音學習系統(tǒng)的語音通信平臺由數(shù)字處理器DSP作為核心部分,通過語音采集與編解碼模塊TLV320AIC23實現(xiàn)語音的采集與傳輸,由以太網(wǎng)控制器實現(xiàn)該系統(tǒng)通過網(wǎng)卡、聲卡在網(wǎng)絡上傳輸語音數(shù)據(jù),由DMA控制器直接讀取硬盤數(shù)據(jù),其硬件結構圖如圖2所示。
圖2 數(shù)字語言通信的DSP平臺
2.2 數(shù)字信號處理器TMS320VC5416
DSP作為一種專用的數(shù)字信號處理器[3],是一種可編程的微處理器,對語言和圖像有強大的處理功能,運算速度快,接口靈活,能實時、快速實現(xiàn)各種數(shù)字信號處理算法。在數(shù)字語言學習系統(tǒng)中DSP選用TI公司TMS320VC5416芯片,對語音壓縮編碼運算能力達到50 MIPS,數(shù)據(jù)、程序的存儲空間大,對語音輸入/輸出、信碼輸入/輸出提供雙向串口。為保證語音質(zhì)量,語音壓縮編碼技術采用ITU-T制定為低速率編解碼算法G.729標準,即CS-ACELP 算法。它實現(xiàn)了8 Kb/s的碼率,能實現(xiàn)DSP對編解碼的處理。
2.3 語音采集與編解碼(CODEC)模塊TLV320AIC23
音頻芯片采用一塊可編程的芯片TLV320AIC23[4],AIC23是通過數(shù)字控制口將芯片的控制字寫入AIC23內(nèi)部的寄存器。音頻控制口與DSP的通信主要由多通道緩沖串行口McBSP1來實現(xiàn),支持立體聲或MIC兩輸入方式和立體聲輸出。TLV320AIC23的模數(shù)轉換(ADCs)和數(shù)模轉換(DACs)部件高度集成在芯片內(nèi)部,采用了先進的Sigma-Delta過采樣技術,可以在8~96 kHz的頻率范圍內(nèi)提供16 b,20 b,24 b和32 b的采樣。語音控制器的控制接口為標準的RS 232接口,TLV320AIC23與TMS320VC5416的接口電路圖如圖3所示。
圖3 TLV320AIC23與TMS320VC5416
的接口電路圖
2.4 DMA控制器,HPI的配置
在數(shù)字語言學習系統(tǒng)中,DMA[5]在對聲卡進行控制和訪問時,需要實現(xiàn)DSP對DMA功能的擴展,通過ISA總線兼容聲卡、網(wǎng)卡的硬件結構,為了有效地采集信號、播放語音,對聲卡、語音網(wǎng)卡采用中斷和DMA控制方式,結合DSP使用HOLD操作進行,直接讀取硬盤數(shù)據(jù),DMA控制器可以不需要CPU介入而直接在內(nèi)部存儲器,外部存儲器和芯片上外設之間傳遞數(shù)據(jù),當操作完成后,DMA控制器可以向CPU發(fā)出中斷,同時DMA有一個輔助端口用于HPI 和存儲器間傳遞數(shù)據(jù)。
2.5 以太網(wǎng)控制器
該系統(tǒng)的交換機采用先進的芯片作為以太網(wǎng)控制器[6],簡化了系統(tǒng)的線纜連接,解決了語音通信的堵塞問題,以太網(wǎng)控制器采用臺灣Realtek生產(chǎn)的RTL8019AS,內(nèi)置16 KB的SRAM,用于收發(fā)緩沖、半雙工通信,達到10 Mb/s,與主機采用PnP接口模式。在DSP接收和發(fā)送以太網(wǎng)數(shù)據(jù)時,選擇聯(lián)合體作為DSP接收和發(fā)送以太網(wǎng)數(shù)據(jù)包的緩沖區(qū),使得在各層協(xié)議間的數(shù)據(jù)傳輸,實質(zhì)上是數(shù)據(jù)指針在傳遞而不是數(shù)據(jù)拷貝傳遞。該控制器實現(xiàn)該系統(tǒng)通過網(wǎng)卡、聲卡在網(wǎng)絡上傳輸語音數(shù)據(jù),通過DSP對聲卡直接操作實現(xiàn)語音的錄放控制。
2.6 DSP的存儲器擴展
為了防止TMS320C5416在斷電程序和數(shù)據(jù)的丟失,需要用配置容量為(512K×16)b FLASH和(256K×16)b SRAM將程序和數(shù)據(jù)存儲起來,在系統(tǒng)恢復電位后,將外部FLASH中的程序搬移到DSP內(nèi)部的程序存儲空間中,同時也通過 FLASH存儲器[7]進行語音數(shù)據(jù)的存儲。
3 語音的網(wǎng)絡傳輸
3.1 傳輸方式
傳輸控制協(xié)議TCP[8]和用戶數(shù)據(jù)報協(xié)議UDP這兩種傳輸協(xié)議都是在IP協(xié)議上完成的。TCP協(xié)議需要在教師端和學生端間建立直接的通信通道, 采用存儲轉發(fā)式的非實時方式。而語言學習系統(tǒng)的語音通信要求實時性強,UDP作為一種底層的傳輸協(xié)議, 是無連接的數(shù)據(jù)報傳輸,不需要建立通信通道,直接把數(shù)據(jù)送到接收端,且提供復用機制的能力,可以迅速地實現(xiàn)該系統(tǒng)的實時通信。
3.2 傳輸協(xié)議
RTP/RTCP協(xié)議,是由實時傳輸協(xié)議(RTP)及其控制協(xié)議(RTCP)組成,控制數(shù)據(jù)的擁塞和流量。在數(shù)字語言學習系統(tǒng)中,RTP和RTCP配合使傳輸效率最佳化。實時傳輸協(xié)議是一種應用型的傳輸層協(xié)議,通過UDP協(xié)議對語音數(shù)據(jù)進行單播或者多播,實現(xiàn)通過學習系統(tǒng)的語音間通信。
3.3 IP組播
IP組播(IP Multicast)[9]是一種點到多點的通信方式,包括3種IP數(shù)據(jù)通信方式:點對點通信、全網(wǎng)廣播和居于以上兩者之間IP多播。能實現(xiàn)源IP主機教師端向指定IP的某個學生端間進行通信;源IP主機教師端向一個網(wǎng)絡段中所有IP的學生機組間進行通信;更重要的是IP多播通過使用一個特殊的IP地址組作為組播地址,并對這個組進行命名,這個地址也同時惟一地表示了一個多點廣播組,在這里,源主機能夠向 IP 網(wǎng)絡上的任何一組IP地址組發(fā)送IP信息包,實現(xiàn)了IP分組語音通信[9]。
4 結 語
通過先進的數(shù)字信號處理器結合現(xiàn)代通信基本協(xié)議實現(xiàn)了數(shù)字語言學習系統(tǒng)的語音傳輸?shù)膶崟r性,采取DMA讀取硬盤的方式,實現(xiàn)了多點語音傳輸和分組語音傳輸,滿足了現(xiàn)代教學的需要,解決了在通信中語音信息數(shù)字化和數(shù)字通信網(wǎng)絡化,使得該系統(tǒng)有效運行。
參考文獻
[1]劉國福,張屺,王躍科,等.基于DSP的全數(shù)字式語言學習系統(tǒng)的設計[J].網(wǎng)絡與多媒體,2003(12):57-59.
[2]曹軍.基于IP組播技術的遠程教學系統(tǒng)的研究與實現(xiàn)[D].上海:華東師范大學,2009.
[3]郭良濤,黃建國,韓晶,等.基于DSP的小型數(shù)字語音通信平臺設計[J].計算機測量與控制,2009,17(6):1209-1211.
[4]游燕,李開貴,吳靜.DSP網(wǎng)絡實時視頻教學系統(tǒng)[J].成都紡織高等??茖W校學報,2006,23(2):25-27.
[5]汪春梅,孫洪波,任志剛.TMS320C5000DSP系統(tǒng)設計與開發(fā)實例[M].北京:電子工業(yè)出版社,2004.
[6]羅劍.基于以太網(wǎng)傳輸?shù)恼Z音錄放存儲系統(tǒng)[J].可編程控制器與工廠自動化,2007(1):70-71.
[7]劉國福,張屺,王躍科.基于DSP的語音錄放、存儲及傳輸系統(tǒng)[J].電聲技術,2002(11):30-32.
[8]盛青松.一種基于TCP/IP協(xié)議的局域網(wǎng)通信系統(tǒng)[J].中國新技術新產(chǎn)品,2008(10):14-15.
[9]唐曉東,徐洪梅,熊建設,等.局域網(wǎng)多點語音通信系統(tǒng)的實現(xiàn)[J].微計算機信息,2007,23(1):128-129.