快轉到主要內容

在Linux桌面使用Codex CLI / Codex Desktop進行自動化操作

· 民國115年丙午年
·
切換正體/简体 ·
分類 Linux系統 Linux好用軟體
標籤 ChatGPT AI Agent
目錄

分享在Ubuntu Linux使用Codex的方法。

Codex是OpenAI推出的AI Agent程式,可以讓ChatGPT直接在電腦上執行指令操控電腦,內建多種Skills。

它能讀取你Linux系統環境變數,根據你的發行版提供適合你環境的解答。

Codex主要有與兩種版本:Codex CLI和Codex Desktop

撰文當下,Codex CLI在Linux能用NPM安裝,但Codex Desktop尚未推出適用Linux的版本,只能靠第三方移植。

1. 安裝版本的考量
#

讓AI Agent操縱你的電腦是很危險的(但是誰管它(ry)),Codex沒有沙盒隔離,可以存取你所有的檔案內容。請務必檢視所有指令再執行。

如果你都是在SSH遠端用指令操作Linux,那麼就用Codex CLI就可以了。不依賴Codex Desktop。

若是Linux桌面用戶,要做一般問答,安裝Codex Desktop

如果要一邊寫程式一邊生成程式碼,也可以考慮透過IDE裡面的Codex擴充對話。只需要安裝Codex CLI。例如VS Code有Codex IDE Extension,Zed也支援Codex。這樣Codex Desktop就顯得沒什麼用處了。

2. 原理
#

參考: Unofficial Linux build of OpenAI Codex Desktop

Codex Desktop疑似是Electron寫的,該專案將macOS的.dmg重新打包,透過拆包轉成Linux版本安裝。

依然需要安裝Codex CLI才能使用。並搭配專為Linux設計的MCP codex-computer-use-linux來讓Codex調用Linux桌面程式,譬如,讓它讀取Thunderbird的行事曆。

Codex的手機APP也能控制Codex操作Linux電腦,不過非官方支援。

3. 適合的Linux桌面環境
#

若是一般的檔案操作,如批次重新命名檔案,AI Agent會自動用CLI工具去修改,這正好是Linux最擅長的地方。

如果要操作程式自動化才需要GUI,那麼前提條件是讓AI Agent能看到畫面。

關於GUI自動化部分,Wayland桌面需要ydotool,X11用xdotool。

X11桌面程式權限可說是幾乎沒有限制,可以透過Xorg的原生方法拍攝桌面上任意視窗。Wayland的話會受到XDG Desktop Portal制約,限制AI Agent存取的內容,需要比較多workaround。

理論上GNOME桌面是比較適合讓AI Agent去操作的,因為設計語言比較統一而且有無障礙模式。

不過我用KDE Plasma桌面同樣能自動化。

4. 安裝Codex CLI
#

  1. 安裝NodeJS
sudo apt install node npm
  1. 安裝Codex CLI
sudo npm install -g @openai/codex@latest
  1. 執行,登入OpenAI帳號。設定檔案位於~/.config/Codex
codex

5. 安裝Codex Desktop
#

  1. 複製這個儲存庫,安裝,會有一個服務定期檢查Codex Desktop更新。
git clone https://github.com/ilysenko/codex-desktop-linux.git

cd codex-desktop-linux

make bootstrap-native
  1. 從Linux應用程式列表找到Codex Desktop打開。

相關文章


感謝您的閱讀。我寫作是為了誠實表達想法,而不是追逐社群互動與流量。我很樂意傾聽你在仔細閱讀我文章之後的心得。若有內容勘誤 or 技術問題 or 回饋想法,歡迎透過本站「關於」頁面的Email與我聯絡。