- 愛奇藝年卡 + 京東 Plus = 123元 | PD17 虛擬機限時官網史低 | Win11 專業版立減 150
- 百度網盤 SVIP 年卡 188 送 QQ 音樂月卡 | SetApp 1 年訂閱 6.5 折 | 騰訊雲 618 秒殺
AI 技術在飛速發展,比如美顏換臉、文字識別、語音識別、移除圖片背景、自動駕駛等等都在生活的各個方面起到了應用。而「語音合成 TTS」方面,如今實用性也已非常驚人了。
像騰訊雲、阿里雲、百度雲等都推出文字轉語音在線服務 API,但合成的人聲大多時候都很容易聽出「機械人味」。而微軟的 Azure TTS 文本轉語音服務效果就比較讓人驚嘆了!它擁有多種聲音和情感風格,能像真人一樣朗讀出抑揚頓挫,使得合成的人聲非常逼真自然,不妨來看看……
微軟自然語音轉換 - 像真人般將文本朗讀出來並保存成音頻
「微軟文本轉語音」Azure Text to Speech 是一個能將文字轉換成真人般自然朗讀的雲服務,相比同類 TTS 強大之處在於,它藉助 AI 神經網絡技術,讓合成的語音擁有媲美真人的表現力,實現人聲語調與情感匹配,朗讀時能表現出高興、悲傷、新聞廣播、客服、恐懼、耳語等情感。
加上語速、語調、發音、停頓都可以由用戶調節,實際生成的語音非常自然逼真!完全不再像機械人了!因此微軟文本轉語音技術幾乎能應用在任何場景。新版的 Edge 瀏覽器的朗讀功能就是基於此技術而來。可惜此服務是付費的,你還懂編程才能用上它,這似乎離普通用戶很遠?
別急!其實,微軟提供了一個免費的在線 DEMO 演示,可以讓用戶隨便輸入文字實現在線試聽 (但字數有限制,且試聽無法保存)。於是,高手們紛紛各顯神通,給我們帶來了幾款如微軟語音合成助手、Edge-TTS-record、微軟 TTS 下載按鈕腳本插件等免費工具,可以幫助你將一大段文字轉換成音頻導出 mp3 或錄製成 wav 保存下來,用於其他地方。
微軟 TTS 朗讀效果預覽:
我們先來聽幾段微軟文本轉語音的效果吧,相信你一定能聽出來,它真的比目前大多數 TTS 同行要優秀很多,情感表現力簡直滿分!開心、嚴肅不同場景可以用不同的調調,就連講個鬼故事也都能講出害怕的感覺。
其實如今在嗶哩嗶哩、抖音、快手裡好多視頻的配音,都有使用了這個微軟語音庫來生成,人的聲音聽起來很自然,不特意地去留意,基本都分辨不出來是用機器合成的。
微軟語音合成助手免費版 (Windows)
「微軟語音合成助手」是一款完全免費的文字轉語音的 Windows 電腦版軟件,它綠色免安裝,而且體積小巧,打開就能使用 (需聯網),軟件界面非常簡潔,上手即會使用。
它完全藉助了微軟的 Azure TTS 服務來將文字合成並生成語音,支持在線試聽,也可以保存成 mp3 音頻文件,效果非常接近真人朗讀!不僅真實自然,而且也能設置它的情感風格、語速、停頓、音量等等。
微軟語音合成助手可以支持導入 TXT、SRT 字幕、PDF 多種格式的文檔文件,甚至還能支持 JPG、PNG 截圖裡的文字識別並導入成文本內容。並且重點是,此軟件使用了分段下載合併的方式解決了一次只能轉換 2500 個字數限制的問題。
軟件支持保存導出編輯內容,支持翻譯,自動排版,自動標點,文本替換,敏感詞提醒,敏感詞替換,SSML 多人語音混編等多種功能,還可以實現批量轉換。
瀏覽器插件:微軟 TTS 下載音頻按鈕(油猴腳本)
前面說到,微軟 TTS 本身提供了文字轉語音的在線演示的網頁版,可以讓用戶在瀏覽器上輸入或粘貼文本,轉換成語音進行試聽,但官網上並不提供下載功能。因此,有開發者製作了這麼一個「微軟 TTS 下載音頻按鈕」插件,可以讓你將試聽的語音下載保存成 MP3 音頻。
這款瀏覽器插件是完全免費的,它是以 UserScript (油猴腳本) 的形式提供的,比如 Chrome、Edge 等瀏覽器安裝了 Tempermonkey 插件后就能安裝此類腳本。安裝成功並啟用的話,微軟 TTS 的網頁上除了試聽按鈕以外,還會如上圖一樣,增加一個「下載音頻」的按鈕。
所以,如果你使用 Mac、Linux 或者不希望下載第三方軟件,那麼使用此腳本也可以在瀏覽器里搞定文本轉音頻。
Edge-TTS-record 開源錄製工具
這款開源免費的「edge-TTS-record」工具,是一款可以錄製 Microsoft Edge 瀏覽器的語音合成(TTS)語音並輸出為 .wav 音頻的 Windows 版工具。另外,網上也有一款名為「Read Aloud by asup」的工具與此程序幾乎一樣,暫不知道是否同一作者。
由於 Edge 瀏覽器也是使用了微軟 Azure TTS 的技術,因此它擁有了同樣的逼真自然的聲音引擎,包括了曉曉、雲楊等人物聲音。不過相比前兩者,此工具的實現方法是需要將試聽的聲音進行「錄音」而來的,因此錄製時間較長,同時過程中也可能受到系統其他軟件聲音的影響。
aspeak - 命令行文字轉語音工具:
對於有特殊需求的朋友,還有一款命令行版的微軟 TTS 語音合成工具 aspeak
,這是用 Python 編寫的基於 Azure 語音合成的命令行程序,安裝簡單,還可以跨平台使用。
#安裝 aspeak pip install --upgrade aspeak # 最簡單的例子: aspeak -t "異次元軟件世界,你好呀!" -l zh-CN #導入 .txt 文件,並轉換成 .wav 音頻保存 aspeak -f input.txt -l zh-CN -o ouput.wav
更多具體的參數,比如怎樣指定語音,大家可以看 aspeak 的官方文檔。至於此工具的的實際應用例子嘛,就得看大家發揮想象力和二次開發的能力了。
總結:
不管你是視頻 UP 主、自媒體還是辦公人士,藉助微軟 Azure TTS 的語音合成引擎來不僅能錄製一些旁白、朗讀稿子電子書、給視頻配音等,也能自娛自樂,給生活和工作都帶來方便與樂趣。
上面的幾款工具都是免費的,感興趣和有需要的朋友都可以下載使用。當然了,微軟這個 TTS 雲服務接口本來是需要付費的,而這些免費工具都是基於微軟的免費 Demo 演示開發而來,哪一天要是被關掉了,可能就無法使用了。所以,免費有限,大家且用且珍惜吧……
相關文件下載地址
官方網站:訪問
軟件性質:免費/開源
相關鏈接:人工智能相關 | 微軟相關 | 視頻相關 | 素材相關 | 語音相關
解壓密碼:www.iplaysoft.com
下載微軟語音合成助手 (Win) | Edge-TTS-record (Win) | 微軟 TTS 下載按鈕 (瀏覽器腳本)