天涯衰草
在Balabolka的官網(http: //balabolka.site/cn/balabolka.htm)下載并安裝最新版程序。啟動后依次點擊“工具→從文件中提取文本”,在彈出的對話框中點擊“文本”選項卡,可以按需設置“輸出文件編碼”“格式化文本”等選項。設置完后點擊“添加文件”按鈕并選擇需要提取文本的文件(可多選)(圖1),支持的文件類型非常豐富,包括純文本文件、Office文檔、PDF文檔、電子書格式、網頁格式、電子郵件格式、壓縮格式等。添加完文件后,點擊“上移”和“下移”按鈕還可以調整它們的順序。然后在“輸出文件夾”處設置保存目錄,最后點擊“轉換”按鈕即可將文本提取出來并保存為純文本文件。
如果在提取純文本時總是出錯,很可能是因為該文件的體積過大,以至于消耗了過多的系統(tǒng)資源從而造成軟件“崩潰”。我們可以先將其分割為幾個小文件,然后再提取。
依次點擊“工具→文件分割”,在彈出的對話框中點擊“文件導入”選項后的“瀏覽”按鈕并選擇需要分割的文件,再點擊“輸出文件夾”選項后的“瀏覽”按鈕,設置分割后文件的保存目錄(圖2)。然后在“分割模式”選項下按需選擇一種分割方式,提供按文本塊大小、連續(xù)兩個空行(適合分割網絡文章)、輸入文件的特別字串等方式。
設置完后,點擊“測試”按鈕,它就會按照上述設定的方式進行分割測試。如果測試成功,那么在彈窗中可以看到分割后的文件數(shù)。如果沒有問題,點擊“分割”按鈕,在打開的窗口中即可看到每個分割文件的摘要信息,檢查無誤后點擊“分割”按鈕就可以了(圖3)。
到此我們就可以開始最后的轉換操作了。依次點擊“工具→ 批量文件轉換”,在彈出的對話框中點擊“添加文件”按鈕并選擇需要批量轉換為音頻的文本文件。添加完后點擊“輸出文件夾”選項后的“瀏覽”按鈕,設置轉換后音頻文件的保存目錄。接下來在“音頻文檔格式”下拉列表中選擇一種音頻格式,包括WAV、MP3、OGG、WMA、MP4等。完成所有的設置后,點擊左下角的“轉換為音頻文件”按鈕,即可將所選的文件轉換為音頻了(圖4)。
在該窗口中切換到“附加選項”選項卡,勾選“拆分每個文本文件并轉換為音頻文件”選項,還可以按照設定的條件拆分和轉換選中的文本文件(圖5)。不過使用該方法無法預覽拆分后的文件,這樣也就無法了解拆分后的實際效果。
“批量文件轉換”命令默認使用微軟的TTS服務,如果大家對音頻文件的播放效果不滿意,那么還可以改用其他的T TS服務。依次點擊“工具→使用在線T TS服務”,在彈出的對話框中添加需要轉換的文件,并設置保存音頻文件的目錄。然后在對話框的下方選擇一種TTS服務(包括谷歌、亞馬遜、百度、IBM、有道等),比如“Google[2]”,接著在“語言”下拉列表中選擇“中文(簡體,中國)”,再根據(jù)自己的實際需要分別設置“語速”“音量”和“性別”(即選擇朗讀時使用女聲還是男聲)。完成所有的設置后,點擊“保存”按鈕即可開始轉換(圖6)。