語音合成服務(TTS,又稱文字轉語音)是讓SillyTavern角色把對話唸出來的技術。
在跟角色對話的時候,按下對話框旁邊的喇叭圖示,將對話內容唸出來。
SillyTavern支援多款語音合成服務,分為線上與本機執行。
線上:ElevenLabs、Edge-TTS、Novel AI TTS、OpenAI TTS
本機:System(作業系統內建的TTS,例如Microsoft TTS)、SpeechT5、Silero、Coqui-TTS、XTTS、AllTalk TTS、RVC
1. 使用線上語音合成服務#
以ElevenLabs為例
到 ElevenLabs官網取得API key
啟動SillyTavern Extras的伺服器服務
到SillyTavern的Extensions頁面,選取TTS,Provider勾選ElevenLabs,再於下方欄位填入API Key即可。
2. 使用本機語音合成服務#
以Coqui-TTS為例
- 如果要使用Conqui-TTS的語音合成功能,請務必啟動SillyTavern Extras的伺服器服務,並在啟動引數中啟用相關的Coqui-TTS模組。
--enable-modules=coqui-tts --coqui-gpu
接著到SillyTavern的Extensions頁面設定TTS,勾選Coqui
點選Add Voice,輸入新的語音名稱
下面的Models選Coqui API,語言選en,Speaker選female。並按照指示點選Download下載語音模型。
往上捲這裡會有對話過的角色卡名字(如果沒顯示,請至少與該角色對話過一次後再來),選取要使用的語音。