快轉到主要內容

讓AI陪你玩遊戲,SillyTavern + EmulatorJS設定方法

· 民國114年乙巳年
· ·
分類   開源AI應用 大型語言模型
標籤   RetroArch Text to Speech
目錄
SillyTavern使用教學 - 點選展開系列文
9: 現在位置

讓AI跟你一起打電動!

「EmulatorJS」即網頁版的RetroArch,能在瀏覽器裡透過WebAssembly跑懷舊主機遊戲,例如任天堂紅白機、PC-98、DOS遊戲等等。

這款SillyTavern擴充套件能讓AI角色跟你一起玩遊戲。

這邊我的例子是載入不知火舞的角色卡(因為誕生年代與瑪莉歐相近~),提示詞設定為電玩咖。接著讓她觀看我遊玩超級瑪莉並給出回應。她確實看到了遊戲畫面裡面的水管,並說出了她的想法。

嚴格來說,AI沒辦法操控遊戲,僅能根據你遊玩的遊戲畫面給予評論。AI在這裡算是吐槽役擔當吧!AI會根據你由畫面的變化,生成文字,還會透過TTS合成語音講話。

順帶一提,SillyTavern有名為「Chess」的擴充套件,可以跟AI下西洋棋。ㄟ…但是下棋根本不需要動用到語言模型吧!你是要跟AlphaGo對奕麼?

1. 準備多模態模型
#

你必須使用多模態模型,它才能「看到」圖片內容。

建議使用OpenAI GPT-4 Vision或是LLaMA Vision、LLaVA、Phi Vision。

我這邊以Ollama + LLaVA為例,在SillyTavern的連線頁面,切換為LLaVA模型。

2. 準備遊戲檔案
#

  1. EmulatorJS支援的遊戲主機請參見官網。你需要自行準備遊戲ROM和遊戲主機的BIOS,網路上很多盜版可以找到。

  2. 以超級瑪莉(1985年)為例,要先取得遊戲ROM還有NES的BIOS檔案。

3. 設定語音合成
#

(選擇性)

因為玩遊戲的時候EmulatorJS會擋住聊天欄,不如設定語音合成,讓AI直接把他的意見唸出來。

參見之前的系列文SillyTavern 設定語音合成服務

4. 安裝圖片註解擴充套件
#

  1. 開啟SillyTavern擴充套件頁面,點選下載擴充功能,安裝Screen Share

  2. 點選圖片註解,來源選多模態,API選Ollama,模型使用現在選取的模型。

5. 安裝EmulatorJS擴充套件
#

  1. EmulatorJS截圖需要瀏覽器支援CaptureImage標準,所以Safari不能用。

  2. 從SillyTavern的擴充套件列表下載EmulatorJS。

  3. 點開EmulatorJS設定AI要幾秒輸出一次回應。SillyTavern會自動截圖EmulatorJS畫面,並傳送給AI,設定0的話就是不回應。

  4. 再點選上傳遊戲ROM與BIOS。

  5. 點選一個角色卡,進入聊天。

  6. 點選聊天欄的魔法棒,選取Play EmulatorJS,進入遊戲。

  7. 等待AI生成回應,如果有啟用TTS,生成回應後AI角色應該會一併講話。只要一直在EmulatorJS操作,SillyTavern就會持續傳送截圖給AI分析。

  8. 當然了,由於SillyTavern支援上傳檔案給AI分析,所以你也可以手動截圖EmulatorJS畫面,再傳給AI評論圖片內容。

參考
#

EmulatorJS | docs.ST.app

SillyTavern使用教學 - 點選展開系列文
9: 現在位置

相關文章

SillyTavern 設定語音合成服務
分類   開源AI應用 大型語言模型
標籤   Text to Speech
SillyTavern 連接AI生圖服務Stable Diffusion,聊天時回傳圖片
分類   開源AI應用 大型語言模型
標籤   Stable Diffusion Multimodal
SillyTavern設定語音辨識服務,麥克風聲控
分類   開源AI應用 大型語言模型
標籤   Stable Diffusion

留言板

此處提供二種留言板。點選按鈕,選擇您覺得方便的留言板。要討論程式碼請用Giscus,匿名討論請用Disqus。

這是Disqus留言板,您可能會看到Disqus強制投放的廣告。為防止垃圾內容,有時留言可能會被系統判定需審核,導致延遲顯示,請見諒。若要上傳圖片請善用圖床網站。