快轉到主要內容

SillyTavern 設定語音合成服務

開源AI人工智慧應用 大型語言模型 Text to Speech
🗓️ 民國113年 甲辰年
✍ 切換正體/簡體字
目錄
SillyTavern使用教學 - 點選展開系列文章
5: 本篇文章

語音合成服務(TTS,又稱文字轉語音)是讓SillyTavern角色把對話唸出來的技術。

在跟角色對話的時候,按下對話框旁邊的喇叭圖示,將對話內容唸出來。

SillyTavern支援多款語音合成服務,分為線上與本機執行。

線上:ElevenLabs、Edge-TTS、Novel AI TTS、OpenAI TTS

本機:System(作業系統內建的TTS,例如Microsoft TTS)、SpeechT5、Silero、Coqui-TTS、XTTS、AllTalk TTS、RVC

1. 使用線上語音合成服務
#

以ElevenLabs為例

  1. ElevenLabs官網取得API key

  2. 啟動SillyTavern Extras的伺服器服務

  3. 到SillyTavern的Extensions頁面,選取TTS,Provider勾選ElevenLabs,再於下方欄位填入API Key即可。

2. 使用本機語音合成服務
#

以Coqui-TTS為例

  1. 如果要使用Conqui-TTS的語音合成功能,請務必啟動SillyTavern Extras的伺服器服務,並在啟動引數中啟用相關的Coqui-TTS模組。
--enable-modules=coqui-tts --coqui-gpu
  1. 接著到SillyTavern的Extensions頁面設定TTS,勾選Coqui

  2. 點選Add Voice,輸入新的語音名稱

  3. 下面的Models選Coqui API,語言選en,Speaker選female。並按照指示點選Download下載語音模型。

  4. 往上捲這裡會有對話過的角色卡名字(如果沒顯示,請至少與該角色對話過一次後再來),選取要使用的語音。

參考
#

SillyTavern TTS

SillyTavern使用教學 - 點選展開系列文章
5: 本篇文章

相關文章

SillyTavern Extras 擴充功能 安裝教學
開源AI人工智慧應用 大型語言模型
SillyTavern 安裝教學 Linux / Windows / macOS
開源AI人工智慧應用 大型語言模型
SillyTavern 設定大型語言模型服務
開源AI人工智慧應用 大型語言模型 Large Language Model LLaMA AI ChatGPT

留言板

此處提供二種留言板。點選按鈕,選擇您覺得方便的留言板。要討論程式碼請用Giscus,匿名討論請用Disqus。

這是Giscus留言板,需要Github帳號才能留言。支援markdown語法,若要上傳圖片請貼Imgur連結。您的留言會在Github Discussions向所有人公開。

這是Disqus留言板,您可能會看到Disqus強制投放的廣告。有時留言可能會被系統判定需審核,導致延遲顯示,請見諒。