快轉到主要內容

SillyTavern 設定語音合成服務

分類   開源AI應用 大型語言模型
標籤   Text to Speech
🗓️ 民國113年 甲辰年
✍ 切換正體/簡體字
目錄
SillyTavern使用教學 - 點選展開系列文章
7: 本篇文章

語音合成服務(TTS,又稱文字轉語音)是讓SillyTavern角色把對話唸出來的技術。

在跟角色對話的時候,按下對話框旁邊的喇叭圖示,將對話內容唸出來。

SillyTavern支援多款語音合成服務,分為線上與本機執行。

線上:ElevenLabs、Edge-TTS、Novel AI TTS、OpenAI TTS

本機:System(作業系統內建的TTS,例如Microsoft TTS或Google TTS或Speech Dispatcher)、SpeechT5、Silero、Coqui-TTS、XTTS、AllTalk TTS、RVC

1. 設定語音合成服務
#

1.1. 使用線上語音合成服務
#

以ElevenLabs為例

  1. ElevenLabs官網,註冊帳號取得API key

  2. 到SillyTavern的Extensions頁面,選取TTS,Provider勾選ElevenLabs,再於下方欄位填入API Key,再點選Connect,點選Reload。

  3. 這樣你就有聲音模型可以選了。

1.2. 使用本機語音合成服務
#

以Coqui-TTS為例

  1. 如果要使用Conqui-TTS的語音合成功能,請務必在啟動引數中啟用相關的Coqui-TTS模組。
--enable-modules=coqui-tts --coqui-gpu
  1. 接著到SillyTavern的Extensions頁面設定TTS,勾選Coqui

  2. 點選Add Voice,輸入新的語音名稱

  3. 下面的Models選Coqui API,語言選en,Speaker選female。並按照指示點選Download下載語音模型。

2. 給角色卡設定對應語音
#

請先設定好語音合成服務再操作,否則選單會是空白。

  1. 點選SillyTavern的選單,選TTS

  2. 這裡會有對話過的角色卡名字(如果沒顯示,請至少與該角色對話過一次後再來)。然後在Default Voice下面,給每個角色設定要使用的語音。你可以給自己和角色卡設定不同的語音模型。

參考
#

SillyTavern TTS

SillyTavern使用教學 - 點選展開系列文章
7: 本篇文章

相關文章

SillyTavern 安裝教學 Linux / Windows / macOS
分類   開源AI應用 大型語言模型
SillyTavern 設定語言模型服務,與AI聊天前最重要的設定步驟
分類   開源AI應用 大型語言模型
標籤   Large Language Model LLaMA AI ChatGPT
SillyTavern Extras 擴充功能API 安裝教學
分類   開源AI應用 大型語言模型

留言板

此處提供二種留言板。點選按鈕,選擇您覺得方便的留言板。要討論程式碼請用Giscus,匿名討論請用Disqus。

這是Giscus留言板,需要Github帳號才能留言。支援markdown語法,若要上傳圖片請貼Imgur或Postimages。您的留言會在Github Discussions向所有人公開。

這是Disqus留言板,您可能會看到Disqus強制投放的廣告。為防止垃圾內容,有時留言可能會被系統判定需審核,導致延遲顯示,請見諒。若要上傳圖片請善用圖床網站。