快轉到主要內容

Linux電腦部署 OpenClaw 龍蝦AI代理人 + Gemini,使用Telegram手機APP遙控

· 民國115年丙午年
·
切換繁體/簡體
分類 Linux系統 Self-hosting自架
標籤 Linux Gemini
目錄

OpenClaw,俗稱「龍蝦AI」,是一款開放原始碼的AI代理人軟體。能夠讓AI在本機離線執行任務。讓你不只是與AI聊天,還能讓它實際操控電腦為你幹活。OpenClaw具有在電腦上自動點擊GUI程式,和執行任意終端機指令操作檔案的能力。

用不恰當的類比來說,這個軟體可以說是比較簡單的n8n,讓你不用在那邊接水管,將AI Agent與MCP操作的程式全部整合了在一起,還能夠搭配手機通訊軟體傳遞命令。使用者只要串接好需要的AI服務之後,就能夠使用手機APP發號施令,讓AI自動操作電腦執行任務。

使用者還可以透過撰寫名為「Skill」的Markdown檔案,來擴充OpenClaw能做到的事情,例如讓它自動回覆郵件、操控IDE寫程式、爬網路資料產生PDF報告、上網訂票、玩遊戲、控制智慧家電、生成圖片等等用途(見文末列表)。

根據歐美媒體報導,OpenClaw由企業家兼工程師Peter Steinberger使用vibe coding開發,於2025年年底釋出,最初僅是作為hobby project展示,看看能否從手機控制電腦上的AI寫程式。這個專案在Github爆紅之後一度改了好幾次名字,從一開始的OpenClaw改成Moltbot,又變成了Clawbot(拜託不要再改了)。但是logo都是一隻太空龍蝦。

我主要想使用的功能,是透過手機APP與AI聊天並下指令,讓OpenClaw自動去操控GNU/Linux電腦的桌面,進行一些上網的操作。

一個很普通的使用例子:叫OpenClaw打開瀏覽器,上購物網站,看看最近有什麼優惠活動,然後定期整理傳到我的手機。這寫個爬蟲程式就能辦到,根本不需要用AI吧こらぁ!當然OpenClaw能做到的遠遠不止如此,這只是最簡單的示範。

1. OpenClaw系統需求
#

OpenClaw支援Linux、macOS、Windows系統的電腦。最好要裝圖形環境。

OpenClaw是在本機離線執行的軟體,並非雲端計算。不過它需要一個語言模型為其提供決策過程。如果語言模型是串接線上跑的服務,例如使用Claude、ChatGPT、Gemini,任何規格的電腦都可以部署,因為最耗算力的服務都外包給這些伺服器了。反之,若連語言模型都要本地跑,例如使用Ollama,就需要獨立顯示卡提供算力。

另外,OpenClaw可以透過通訊軟體遠端下令。目前OpenClaw支援WhatsApp、Telegram、Discord、iMessage、Slack、Matrix、Line等等,選一個方便使用的就行。

2. 準備語言模型服務
#

線上
#

OpenClaw支援串接許多線上AI服務

以Gemini為例,到Google AI Studio新建專案,就可以取得API Key。越新越大的模型API call越貴,如果有更多需要請乖乖付費。

OpenClaw作為AI代理人,會進行許多複雜的操作,加上開發者尚未針對prompt context最佳化,API額度會耗很快。以Gemini 3 Flash為例,免費額度每天可以呼叫20次。可是10分鐘內連續跟OpenClaw對話5次就超出額度了。

另一種比較取巧的方式,是讓OpenClaw透過Gemini CLI來存取線上模型,這樣一分鐘可以傳送60次請求,比使用API要寬大許多。只是這樣會不會違反Google服務條款就不知道了www

這個方法需要先在Linux安裝Gemini CLI程式並登入Google帳號。

本機
#

安裝Ollama,你想怎麼用就怎麼用。

缺點是硬體要很好,因為OpenClaw執行的是複雜的AI代理人操作,Ollama官方文件提到的OpenClaw建議要用到20B以上參數的模型,且context length要設定到64000以上。這大概需要8GB VRAM以上的獨立顯示卡才跑得動。

可以使用ollama官方文件提到的指令連接OpenClaw。或者手動編輯OpenClaw的設定檔~/.openclaw/openclaw.json選取模型。

3. Linux電腦安裝OpenClaw
#

我主要想使用的功能是讓OpenClaw操控Linux電腦的桌面進行自動化(這很危險,請謹慎操作),因此Linux是有圖形環境的。我這裡使用Ubuntu搭配KDE Plasma桌面。Wayland和X11桌面應該都是可以用的。

OpenClaw本身是用TypeScript寫的,有一個OpenClaw Gateway服務負責處理外部連線。

論安裝方法,我準備將整台電腦的權限都開給OpenClaw使用,包括所有系統目錄的權限都開給它。因此不用Docker部署,因為這樣能看到的目錄會受限,要手動設定它能存取的目錄。我使用官方提供的指令稿,讓它自動裝好OpenClaw所需要的依賴,並用Systemd控制服務。

  1. 執行官網提供的這個指令稿,Ubuntu這類主流的發行版應該都能用。如果遇到缺pnpm和Homebrew的問題請自行安裝再重試。
curl -fsSL https://openclaw.ai/install.sh | bash
  1. OpenClaw會為AI代理人建立一個專屬的Linux家目錄,若無法建立,手動建立:
sudo mkdir -p /home/node/

sudo chown -R $(whoami) /home/node/.
  1. 初始化
openclaw onboard --install-daemon
  1. 使用鍵盤上下鍵+空白鍵選取選項

    1.webp

  2. 選取以Git模式安裝

  3. Model Provider選取Gemini

    2.webp

  4. 填入剛剛取得的API Key,或者用OAuth登入

  5. 選一個適合的模型。撰文當下我是使用Gemini 3 Flash,每分鐘的免費額度比較高

    3.webp

  6. 暫時先跳過通訊軟體的設定。

  7. 啟用所有的Hooks,Skills可以先不裝。

    4.webp

  8. 在終端機裡面初始化。

  9. 用瀏覽器開啟http://localhost:18789/就可以進入網頁後台。這個界面可以直接跟OpenClaw聊天並下指令。

  10. 停止與重啟OpenClaw服務的systemctl指令

systemctl --user stop openclaw-gateway.service

systemctl --user start openclaw-gateway.service
  1. OpenClaw為了安全性考量,預設需要HTTPS才能連線,若無,手動編輯~/.openclaw/openclaw.json設定檔,開啟不安全模式。再執行systemctl --user restart openclaw-gateway.service重啟OpenClaw服務。
  "gateway": {
	  "controlUi": {
		  "allowInsecureAuth": true
	  }
  }
  1. OpenClaw設定檔位於~/.openclaw/openclaw.json,但是執行時產生的檔案會放到/home/node/.openclaw/

  2. 日後更新的指令,就重跑一次安裝指令稿:

curl -fsSL https://openclaw.ai/install.sh | bash

4. 讓OpenClaw網頁界面可以從外網存取
#

如果有需要,設定內網穿透軟體讓OpenClaw服務可以從外網存取。Cloudflare Tunnel、Tailscale這類方案還能免費給你建立一個HTTPS。

但請注意OpenClaw網頁界面尚未加入登入密碼的驗證機制,這會讓別人很容易取得AI和你電腦的控制權限。

我下面要使用的是透過Telegram遙控OpenClaw,這個操作不需要開放外網存取也能用。只要Telegram帳號不要被盜即可。

5. 連接到手機Telegram機器人
#

這個非必要步驟。OpenClaw網頁本身就有跟AI聊天的功能了。不過用手機APP遠端控制AI的話感覺比較厲害!

  1. OpenClaw推薦使用Telegram官方的@BotFather服務快速建立機器人。在Telegram頻道跟它聊天,輸入指令/newbot,再輸入名字,就會獲得一個你專屬的Bot和token。

  2. 在Linux電腦再跑一次OpenClaw初始化指令

openclaw onboard --install-daemon
  1. 填入Telegram機器人名稱和token

    3.webp

  2. 嘗試在Telegram跟你新建的機器人聊天,獲得一組配對碼

  3. 執行OpenClaw指令,填入配對碼

openclaw pairing approve telegram "配對碼"
  1. 然後就可以從Telegram透過你建立的機器人,與OpenClaw對話了。

6. 讓OpenClaw操控瀏覽器
#

OpenClaw會開啟瀏覽器,建立設定檔操控它。或者你在現有的瀏覽器安裝OpenClaw Browser Relay擴充套件讓OpenClaw操控。

我使用後者方案。

  1. 先在Linux安裝Chromium或Chrome瀏覽器。不要用Flatpak或Snap安裝。

  2. 建立OpenClaw的擴充套件

openclaw browser extension install
  1. 開啟Chrome → 右上角設定 → 擴充功能 → 開啟開發人員模式,點選載入未封裝項目,選取目錄~/.openclaw/browser/chrome-extension

  2. 點一下OpenClaw Browser Relay圖示,開始偵錯。這樣OpenClaw就能看到瀏覽器的所有內容了。

    b.webp

參考資料
#

相關文章


此處提供二種留言板。點選按鈕,選擇您覺得方便的留言板。

(留言板載入中)這是Giscus留言板,需要Github帳號才能留言。支援Markdown語法,若要上傳圖片請善用外部圖床。您的留言會在Github Discussions向所有人公開。

Click here to edit your comments.

(留言板載入中)這是Disqus留言板,您可能會看到Disqus強制投放的廣告。為防止垃圾內容,有時留言可能會被系統判定需審核,導致延遲顯示,請見諒。若要上傳圖片請善用外部圖床網站。