微軟語音合成我見過水平最高兩個,另一個是剪映的語音生成,跟自然人發音非常像,沒有什麼機器合成的調調.
而Ms edge 開放大聲朗讀的功能,就是雲端合成聲音後在本地播放,其它最受好評的就是xiaoxiao的錄音.
充滿情感的女生,非常好聽,但是在閱讀PDF ,有兩個地方極其影響閱讀:
- 會在換行的地方停頓一下,非常讓人崩潰
- 會因為來不及合成造成播放卡頓,甚至失出焦點,不再朗讀.
因此我試了一個可以在手機用 MS朗讀接口的APP.
Android開源庫
這個庫實際把微軟的語音雲端合成接口偽裝成Android本地tts接口
安裝後會顯示如下界面,
並在Android系統tts接口顯示這個接口
它本身提供一個接口,想聽書還是使用支持朗讀的聽書軟件,
其中支持這個庫的有兩個,
一個是開源的閱讀軟件,但這個軟件太老了,無法在新的手機導入本地pdf沒法測試
另外是靜讀天下
這個能使用tts接口,果然解決了換行停頓的問題,而且在網絡較好還是能正常讀書,
但網絡不好也跟edge一樣,失支閱讀焦點停止閱讀,要重複App才能使用.
痛點解決
使用下來,發現整個方案里,還是有改進空間,一是閱讀軟件在閱讀功能變成很複雜,花哨.
但是在閱讀細節上,和與新系統配合還很多小問題
比如把注釋,引用,頁腳等也讀取. 碰到這種拼音字體就讀一下拼音,又讀一下漢語
導入文件居然不支持文件分享功能,這樣導致必須另存文件,然後在系統目錄找到手動增加
因此需要一個專業集中聽書的小App來解決這個事件,我來試着開發一個這個