快轉到主要內容

Linux電腦部署 OpenClaw 龍蝦AI代理人 + Gemini,使用Telegram手機APP遙控

· 民國115年丙午年
·
切換繁體/簡體
分類 Linux系統 Self-hosting自架
標籤 Linux Gemini ChatGPT AI Agent
目錄

這篇文章Ivon將討論如何在Linux電腦離線部署OpenClaw,讓AI自動操控電腦。

OpenClaw,俗稱「龍蝦AI」,是一款免費開源的AI代理人軟體。能夠讓AI在本機離線執行任務。讓你不只是與AI聊天,還能讓它實際操控電腦為你幹活。OpenClaw具有在電腦上自動點擊GUI程式,和執行任意終端機指令操作檔案的能力。

用不恰當的類比來說,這個軟體可以說是比較簡單的n8n,讓你不用在那邊接水管,就可以實現自動化操作。OpenClaw將AI Agent與MCP操作的程式全部整合了在一起,還能夠搭配手機通訊軟體傳遞命令。使用者只要串接好需要的AI服務之後,就能夠使用手機APP發號施令,讓AI自動操作電腦執行任務。更棒的是,OpenClaw整個程式還是開放原始碼(MIT授權),使用者可以自行檢查程式背後運作原理,並回報bug,協助作者改進。

OpenClaw的一大特色在於技能系統,使用者可以透過撰寫名為「Skill」的Markdown檔案,來擴充OpenClaw能做到的事情,例如:自動回覆郵件、操控IDE寫程式、爬網路資料產生PDF報告、上網訂票、玩Minecraft遊戲、控制智慧家電、生成圖片、上Moltbook發廢文……等等用途(見文末「參考資料」的列表)。

根據歐美媒體報導,OpenClaw由企業家兼工程師Peter Steinberger使用vibe coding開發,於2025年年底釋出,最初僅是作為hobby project展示,看看能否從手機控制電腦上的AI寫程式。這個專案在Github爆紅之後一度改了好幾次名字,從一開始的Clawdbot改成Moltbot,又變成了OpenClaw(拜託不要再改了)。但是logo都是一隻太空龍蝦。

我主要想使用的功能,是透過手機APP與AI聊天並下指令,讓OpenClaw自動去操控GNU/Linux電腦的桌面,進行一些上網的操作。

一個很普通的使用例子:叫OpenClaw打開瀏覽器,上購物網站,看看最近有什麼優惠活動,然後定期整理傳到我的手機……這寫個爬蟲程式就能辦到,根本不需要用AI吧こらぁ!當然OpenClaw能做到的遠遠不止如此,這只是最簡單的示範。

1. OpenClaw系統需求
#

OpenClaw支援Linux、macOS、Windows系統的電腦。最好要裝圖形環境。

OpenClaw是在本機離線執行的軟體,並非雲端計算。不過它需要一個語言模型為其提供決策過程,充當其「大腦」。

如果語言模型是串接線上跑的服務,例如使用Claude、ChatGPT、Gemini,任何規格的電腦都可以部署,從樹莓派,一般的x86電腦,到Mac Mini都行,因為最耗算力的服務都外包給線上伺服器了。反之,若連語言模型都要本地跑,例如使用Ollama技術串接語言模型,就需要獨立顯示卡提供算力。

另外,OpenClaw可以透過通訊軟體遠端下令操作電腦。目前OpenClaw支援WhatsApp、Telegram、Discord、iMessage、Slack、Matrix、Line等等,選一個方便使用的就行。我選Telegram是因為它建立機器人相對簡單許多。

2. 準備AI語言模型服務
#

兩者選一個。我是建議先用線上AI服務啦,比較容易上手。

線上模型
#

OpenClaw支援串接許多線上AI服務,包括Claude、ChatGPT、Gemini等等。

以Gemini為例,到Google AI Studio新建專案,就可以取得API Key。越新越大的模型API call越貴,如果有更多需要請乖乖付費。OpenClaw作為AI代理人,會進行許多複雜的操作,加上開發者尚未針對prompt context最佳化,API額度會耗很快。以Gemini 3 Flash為例,免費額度每天可以呼叫20次。可是10分鐘內連續跟OpenClaw對話5次就超出額度了。

另一種比較取巧的方式,是讓OpenClaw透過「Gemini CLI」的OAuth來存取線上模型,這樣一分鐘可以傳送60次請求,比使用API call模式要寬大許多。只是這樣會不會違反Google服務條款就不知道了www 這個方法需要先在Linux安裝Gemini CLI程式並登入Google帳號,然後再依照下一段步驟進行初始化。

本機模型
#

在你自己的電腦安裝Ollama再下載個語言模型,你想怎麼用就怎麼用,不會像線上模型有額度限制。缺點是硬體要很好,因為OpenClaw執行的是複雜的AI代理人操作,根據Ollama官方文件,跑OpenClaw建議要用到20B以上參數的模型,且context length要設定到64000以上。這起碼需要8GB VRAM以上的獨立顯示卡才跑得動。純用CPU跑回應速度會很慢。

  1. 首先,裝好Ollama與OpenClaw。建議用二進位檔版本,不要用Docker版本

  2. 參考Ollama官方文件下載一個適用OpenClaw的模型,例如gpt-oss:20b

  3. 啟動Ollama服務,並暫停OpenClaw服務

sudo systemctl start ollama

systemctl --user stop openclaw-gateway.service
  1. 用以下指令,選取要用的本機模型,讓Ollama自動編輯OpenClaw的設定檔~/.openclaw/openclaw.json,令其連接到Ollama
ollama launch openclaw --config

3. Linux電腦安裝OpenClaw
#

我主要想使用的功能是讓OpenClaw操控Linux電腦的桌面進行自動化(這很危險,請謹慎操作),因此Linux是有圖形環境的。我這裡使用Ubuntu桌面版。Wayland和X11桌面應該都是可以用的。

OpenClaw本身是用TypeScript寫的,有一個OpenClaw Gateway服務負責處理外部連線。作者提供多種安裝方式。

論安裝方式,我準備將整台電腦的權限都開給OpenClaw使用,包括所有系統目錄的權限都開給它。因此不用Docker容器部署,因為這樣AI能看到的目錄會受限。我使用官方提供的指令稿,讓它自動裝好OpenClaw所需要的依賴。並用Linux內建的Systemd控制系統服務。

  1. 根據Github說明,執行OpenClaw作者提供的這個指令稿安裝。Ubuntu這類主流的發行版應該都能用。
curl -fsSL https://openclaw.ai/install.sh | bash
  1. 如果遇到缺npm或Homebrew的問題請自行安裝再重試。是的,Linux也是可以用Homebrew的。

  2. 初始化OpenClaw,讓它自動安裝為系統服務

openclaw onboard --install-daemon
  1. 使用鍵盤上下鍵+空白鍵選取選項,Enter同意。

    1.webp

  2. 選取以NPM或Git模式安裝

  3. Model Provider選取Gemini,使用線上模型。

    2.webp

  4. 填入剛剛取得的Gemini API Key,或者用Gemini CLI的OAuth網址登入

  5. 選一個適合的模型。撰文當下我是使用Gemini 3 Flash,每分鐘的免費額度比較高

    3.webp

  6. 暫時先跳過通訊軟體的設定。其他API Key全部跳過。

  7. 啟用所有的Hooks。Skills(依賴Homebrew)可以先不裝。

    4.webp

  8. 選取Hatch in TUI,在終端機裡面初始化。完成後按Ctrl+C退出。

  9. 依照終端機顯示的網址,用瀏覽器開啟http://localhost:18789/就可以進入網頁後台。這個界面可以直接跟OpenClaw聊天並下指令。

  10. OpenClaw除了用網頁介面對話之外,也可以用TUI在終端機執行:

openclaw tui
  1. 初始化設定結束後,按Ctrl+C退出設定程式,並用以下指令控制開關。停止與重啟OpenClaw Gateway服務的systemctl指令:
# 停止
systemctl --user stop openclaw-gateway.service

# 啟動
systemctl --user start openclaw-gateway.service

# 查看OpenClaw Gateway服務狀態
openclaw status

# (選擇性)開機登入後自動啟動OpenClaw Gateway服務
systemctl --user enable openclaw-gateway.service
  1. 再重啟OpenClaw服務。
systemctl --user restart openclaw-gateway.service
  1. OpenClaw設定檔位於~/.openclaw/openclaw.json,產生的檔案會放到~/.openclaw/workspace/

  2. 日後更新OpenClaw的指令,就重跑一次安裝指令稿:

curl -fsSL https://openclaw.ai/install.sh | bash

4. 讓OpenClaw網頁界面可以從外網存取
#

如果有需要,設定內網穿透軟體讓OpenClaw服務可以從外網存取。

Cloudflare TunnelTailscale Serve這類方案還能免費給你建立一個HTTPS。

如果Ubuntu有裝防火牆,記得開放OpenClaw通訊埠:

sudo ufw allow 18789

sudo ufw reload

但請注意OpenClaw網頁界面要保護好,否則會讓別人很容易取得AI和你電腦的控制權限。

我下面要使用的是透過Telegram遙控OpenClaw,這個操作不需要開放外網存取也能用,安全性較高。只要Telegram帳號不要被盜即可。

5. 連接到手機Telegram機器人
#

這個非必要步驟。OpenClaw網頁本身就有跟AI聊天的功能了。不過用手機APP遠端控制AI的話感覺比較厲害!

  1. OpenClaw推薦使用Telegram官方的@BotFather服務快速建立機器人。在Telegram頻道跟它聊天,輸入指令/newbot,再輸入名字,就會獲得一個你專屬的Bot和token。

  2. 在Linux電腦再跑一次OpenClaw初始化指令

openclaw onboard --install-daemon
  1. 填入Telegram機器人名稱和token

    3.webp

  2. 嘗試在Telegram跟你新建的機器人聊天,獲得一組配對碼。

  3. 執行OpenClaw指令,填入配對碼

openclaw pairing approve telegram "配對碼"
  1. 然後就可以從Telegram透過你建立的機器人,與OpenClaw對話了。

6. 讓OpenClaw操控瀏覽器
#

OpenClaw會開啟瀏覽器,建立設定檔操控它。或者你在現有的瀏覽器安裝OpenClaw Browser Relay擴充套件讓OpenClaw操控。

我使用後者方案。

  1. 在Linux安裝Chromium或Chrome瀏覽器。不要用Flatpak或Snap安裝。

  2. 建立OpenClaw的擴充套件

openclaw browser extension install
  1. 開啟Chrome → 右上角設定 → 擴充功能 → 開啟開發人員模式,點選載入未封裝項目,選取目錄~/.openclaw/browser/chrome-extension/

  2. 點一下OpenClaw Browser Relay圖示,開始偵錯。這樣OpenClaw就能看到瀏覽器的所有內容了。你對OpenClaw下的指令,它都能在瀏覽器中自動幫你完成。但要注意的是,OpenClaw可以讀取你瀏覽器的所有內容,擔心隱私問題的,建議開一個專門的設定檔給它用。

    b.webp

參考資料
#

相關文章


此處提供二種留言板。點選按鈕,選擇您覺得方便的留言板。

(留言板載入中)這是Giscus留言板,需要Github帳號才能留言。支援Markdown語法,若要上傳圖片請善用外部圖床。您的留言會在Github Discussions向所有人公開。

Click here to edit your comments.

(留言板載入中)這是Disqus留言板,您可能會看到Disqus強制投放的廣告。為防止垃圾內容,有時留言可能會被系統判定需審核,導致延遲顯示,請見諒。若要上傳圖片請善用外部圖床網站。