SillyTavern 設定語音合成服務

SillyTavern使用教學 - 點選展開系列文

7: 現在位置

語音合成服務（TTS，又稱文字轉語音）是讓SillyTavern角色把對話唸出來的技術。

在跟角色對話的時候，按下對話框旁邊的喇叭圖示，將對話內容唸出來。

SillyTavern支援多款語音合成服務，分為線上與本機執行。

線上：ElevenLabs、Edge-TTS、Novel AI TTS、OpenAI TTS、Google翻譯小姐

本機：System（作業系統內建的TTS，例如Microsoft TTS或Google TTS或Speech Dispatcher）、SpeechT5、Silero、Coqui-TTS、Kokoro、XTTS、AllTalk TTS、RVC、

1. 設定語音合成服務
#

以ElevenLabs為例

到ElevenLabs官網，註冊帳號取得API key
到SillyTavern的Extensions頁面，選取TTS，Provider勾選ElevenLabs，再於下方欄位填入API Key，再點選Connect，點選Reload。
這樣你就有聲音模型可以選了。

以Coqui-TTS為例

--enable-modules=coqui-tts --coqui-gpu

請先設定好語音合成服務再操作，否則選單會是空白。

點選SillyTavern的選單，選TTS
這裡會有對話過的角色卡名字（如果沒顯示，請至少與該角色對話過一次後再來）。然後在Default Voice下面，給每個角色設定要使用的語音。你可以給自己和角色卡設定不同的語音模型。

SillyTavern使用教學 - 點選展開系列文

7: 現在位置