語音辨識(Speech Recognition)讓你對麥克風講話來輸入文字,與AI對話。
SillyTavern可以利用瀏覽器內建的語音辨識系統來輸入文字,也能夠使用OpenAI的Whisper AI進行更精確的偵測。
1. 安裝語音辨識擴充套件#
這個功能需要手動安裝。
點選擴充套件選單,點一下右上角「安裝擴充套件」按鈕,輸入網址
https://github.com/SillyTavern/Extension-Speech-Recognition
下載在電腦安裝 ffmpeg
2. 設定語音辨識#
請注意~本機Whsiper運算的時候會耗用GPU資源計算,因此速度可能比瀏覽器的語音辨識要慢些。
1.點選擴充功能的Speech Recognition選單,Speech-to-text-Provider選取Whipser (Local)
Speech Language建議手動指定語言比較精準。Message Mode選取Append就是在聊天欄輸入文字,Auto send即講完話自動送出訊息。
Message Mapping為將聲控對應到SillyTavern的特定指令。
下面Whisper Model選取whisper-base,使其支援多語言。
然後就在聊天欄按麥克風圖示發話即可。