語音合成服務(TTS,又稱文字轉語音)是讓SillyTavern角色把對話唸出來的技術。
在跟角色對話的時候,按下對話框旁邊的喇叭圖示,將對話內容唸出來。
SillyTavern支援多款語音合成服務,分為線上與本機執行。
線上:ElevenLabs、Edge-TTS、Novel AI TTS、OpenAI TTS
本機:System(作業系統內建的TTS,例如Microsoft TTS或Google TTS或Speech Dispatcher)、SpeechT5、Silero、Coqui-TTS、XTTS、AllTalk TTS、RVC
1. 設定語音合成服務#
1.1. 使用線上語音合成服務#
以ElevenLabs為例
到 ElevenLabs官網,註冊帳號取得API key
到SillyTavern的Extensions頁面,選取TTS,Provider勾選ElevenLabs,再於下方欄位填入API Key,再點選Connect,點選Reload。
這樣你就有聲音模型可以選了。
1.2. 使用本機語音合成服務#
以Coqui-TTS為例
- 如果要使用Conqui-TTS的語音合成功能,請務必在啟動引數中啟用相關的Coqui-TTS模組。
--enable-modules=coqui-tts --coqui-gpu
接著到SillyTavern的Extensions頁面設定TTS,勾選Coqui
點選Add Voice,輸入新的語音名稱
下面的Models選Coqui API,語言選en,Speaker選female。並按照指示點選Download下載語音模型。
2. 給角色卡設定對應語音#
請先設定好語音合成服務再操作,否則選單會是空白。
點選SillyTavern的選單,選TTS
這裡會有對話過的角色卡名字(如果沒顯示,請至少與該角色對話過一次後再來)。然後在Default Voice下面,給每個角色設定要使用的語音。你可以給自己和角色卡設定不同的語音模型。