快轉到主要內容

SillyTavern設定語音辨識服務,麥克風聲控

· 民國113年甲辰年
·
切換繁體/簡體
分類   開源AI應用 大型語言模型
標籤   Stable Diffusion
目錄
SillyTavern使用教學 - 點選展開系列文
8: 現在位置

語音辨識(Speech Recognition)讓你對麥克風講話來輸入文字,與AI對話。

SillyTavern可以利用瀏覽器內建的語音辨識系統來輸入文字,也能夠使用OpenAI的Whisper AI進行更精確的偵測。

1. 安裝語音辨識擴充套件
#

這個功能需要手動安裝。

  1. 點選擴充套件選單,點一下右上角「安裝擴充套件」按鈕,輸入網址https://github.com/SillyTavern/Extension-Speech-Recognition下載

  2. 在電腦安裝ffmpeg

2. 設定語音辨識
#

請注意~本機Whsiper運算的時候會耗用GPU資源計算,因此速度可能比瀏覽器的語音辨識要慢些。

1.點選擴充功能的Speech Recognition選單,Speech-to-text-Provider選取Whipser (Local)

  1. Speech Language建議手動指定語言比較精準。Message Mode選取Append就是在聊天欄輸入文字,Auto send即講完話自動送出訊息。

  2. Message Mapping為將聲控對應到SillyTavern的特定指令。

  3. 下面Whisper Model選取whisper-base,使其支援多語言。

  4. 然後就在聊天欄按麥克風圖示發話即可。

參考
#

SillyTavern使用教學 - 點選展開系列文
8: 現在位置

相關文章

SillyTavern介紹,好玩的角色扮演AI聊天軟體
分類   開源AI應用 大型語言模型
標籤   SillyTavern LLM ChatGPT Stable Diffusion
SillyTavern 設定語音合成服務
分類   開源AI應用 大型語言模型
標籤   Text to Speech Voice Cloning
SillyTavern 如何下載與匯入角色卡
分類   開源AI應用 大型語言模型
標籤   SillyTavern Live2D

此處提供二種留言板。點選按鈕,選擇您覺得方便的留言板。

這是Disqus留言板,您可能會看到Disqus強制投放的廣告。為防止垃圾內容,有時留言可能會被系統判定需審核,導致延遲顯示,請見諒。若要上傳圖片請善用圖床網站。