快轉到主要內容

免費Linux語音輸入轉文字&AI語音合成軟體:Speech Note

分類   開源AI應用 AI音訊處理
標籤   Speech to Text Text to Speech
🗓️ 民國113年 甲辰年
✍ 切換正體/簡體字
目錄

Linux目前沒有語音轉文字的輸入法,所以得從應用程式方面著手。於是我在Github找到了一款簡單易用的軟體:Speech Note

Speech Note (dsnote) 是mkiol開發的自由軟體,特色功能如下:

  • 整合VOSK、DeepSpeech、Whisper、Coqui、Piper等模型,支援中文、英文、日文等多國語言輸入
  • 使用語音輸入轉文字(Speech to text, STT),語音辨識,錄下逐字稿,匯出為txt或srt字幕檔
  • 使用文字轉語音(Text to speech, TTS),AI複製人聲,合成語音並唸出文本,匯出為音訊檔
  • 支援翻譯文本
  • 所有運算都是在本機進行的,不會回傳給第三方

我覺得跟TTS Generation Web UI這類軟體比起來,Speech Note使用上算是比較簡單了。

下文討論Speech Note的用法。

1. 安裝Speech Note主程式
#

參考 Github說明

推薦使用 Flatpak安裝,適用Arch Linux、Ubuntu、Fedora、openSUSE

flatpak install flathub net.mkiol.SpeechNote

接著看你的需求是否啟用GPU加速。沒有的話就是用CPU算,耗時較長。

2. 啟用GPU加速
#

GPU非必須,但是可以加速語音模型的運算速度達二倍以上。

建議GPU的VRAM至少要有4GB。

  1. 請先Linux安裝CUDA(Nvidia)或ROCm(AMD)

  2. 然後安裝對應的Flatpak Add-On:

# Nvidia
flatpak install net.mkiol.SpeechNote.Addon.nvidia

# AMD
flatpak install net.mkiol.SpeechNote.Addon.amd
  1. 開啟Speech Note程式,點選Settings → Speech to Text,勾選Enable GPU Acceleration

3. 使用語音轉文字功能
#

  1. 點選Languages,到zh(中文)的頁面下載模型。建議使用較新的Whisper模型。VOSK和DeepSpeech效果很不好。我自認講話不會含滷蛋,中文語音辨識得使用Speech to Text 的「Whisper Large」或更大的模型才有好的辨識效果。

  2. 然後回到主頁面,選取要使用模型,點選Listen圖示開始講話,等待處理完成,文字就會印出來。

  3. 預設模式是Plain Text,所有講的話都會連在一起。

  4. 如果勾選Subtitle,則每句話會加上時間戳。

  5. 點選File → Export to text file將文本另存新檔

4. 使用文字轉語音功能
#

  1. 點選Languages,到zh的頁面下載模型,例如Conqui XTTS的中文模型

  2. 接著要點選Voice Samples新增語音樣本,只需要10秒就夠了。

請錄製一段自己的聲音,或者從網路上找人聲樣本的音訊檔。順帶一提,需要從音樂抽取人聲的可以用 UVR

  1. 有了樣本後,就可以在主界面選取聲音,並讓AI嘗試唸出文本框的字串了。唸出的檔案可按Export匯出成mp3

相關文章

Kdenlive搭配Whisper語音轉文字,影片AI自動上字幕
分類   開源AI應用 AI音訊處理
標籤   Kdenlive Speech to Text Whisper AI
Suno Bark GUI,支援多國語言的生成式語音合成AI
分類   開源AI應用 AI音訊處理
標籤   Text to Speech
Whisper UI,開源免費AI語音轉文字軟體,一鍵產生逐字稿與字幕檔
分類   開源AI應用 AI音訊處理
標籤   Speech to Text Whisper AI

留言板

此處提供二種留言板。點選按鈕,選擇您覺得方便的留言板。要討論程式碼請用Giscus,匿名討論請用Disqus。

這是Giscus留言板,需要Github帳號才能留言。支援markdown語法,若要上傳圖片請貼Imgur或Postimages。您的留言會在Github Discussions向所有人公開。

這是Disqus留言板,您可能會看到Disqus強制投放的廣告。有時留言可能會被系統判定需審核,導致延遲顯示,請見諒。若要上傳圖片請貼Imgur或Postimages。