快轉到主要內容

SillyTavern設定語音辨識服務,麥克風聲控

分類   開源AI應用 大型語言模型
標籤   Stable Diffusion
🗓️ 民國113年 甲辰年
✍ 切換正體/簡體字
目錄
SillyTavern使用教學 - 點選展開系列文章
8: 本篇文章

語音辨識(Speech Recognition)讓你對麥克風講話來輸入文字,與AI對話。

SillyTavern可以利用瀏覽器內建的語音辨識系統來輸入文字,也能夠使用OpenAI的Whisper AI進行更精確的偵測。

1. 安裝語音辨識擴充套件
#

這個功能需要手動安裝。

  1. 點選擴充套件選單,點一下右上角「安裝擴充套件」按鈕,輸入網址https://github.com/SillyTavern/Extension-Speech-Recognition下載

  2. 在電腦安裝 ffmpeg

2. 設定語音辨識
#

請注意~本機Whsiper運算的時候會耗用GPU資源計算,因此速度可能比瀏覽器的語音辨識要慢些。

1.點選擴充功能的Speech Recognition選單,Speech-to-text-Provider選取Whipser (Local)

  1. Speech Language建議手動指定語言比較精準。Message Mode選取Append就是在聊天欄輸入文字,Auto send即講完話自動送出訊息。

  2. Message Mapping為將聲控對應到SillyTavern的特定指令。

  3. 下面Whisper Model選取whisper-base,使其支援多語言。

  4. 然後就在聊天欄按麥克風圖示發話即可。

參考
#

SillyTavern使用教學 - 點選展開系列文章
8: 本篇文章

相關文章

SillyTavern介紹,好玩的角色扮演AI聊天軟體
分類   開源AI應用 大型語言模型
標籤   SillyTavern Large Language Model ChatGPT Stable Diffusion
SillyTavern 設定語音合成服務
分類   開源AI應用 大型語言模型
標籤   Text to Speech
SillyTavern 安裝教學 Linux / Windows / macOS
分類   開源AI應用 大型語言模型

留言板

此處提供二種留言板。點選按鈕,選擇您覺得方便的留言板。要討論程式碼請用Giscus,匿名討論請用Disqus。

這是Giscus留言板,需要Github帳號才能留言。支援markdown語法,若要上傳圖片請貼Imgur或Postimages。您的留言會在Github Discussions向所有人公開。

這是Disqus留言板,您可能會看到Disqus強制投放的廣告。為防止垃圾內容,有時留言可能會被系統判定需審核,導致延遲顯示,請見諒。若要上傳圖片請善用圖床網站。