分享在Ubuntu Linux使用Codex的方法。
Codex是OpenAI推出的AI Agent程式,可以讓ChatGPT直接在電腦上執行指令操控電腦,內建多種Skills。
它能讀取你Linux系統環境變數,根據你的發行版提供適合你環境的解答。
Codex主要有與兩種版本:Codex CLI和Codex Desktop
撰文當下,Codex CLI在Linux能用NPM安裝,但Codex Desktop尚未推出適用Linux的版本,只能靠第三方移植。
1. 安裝版本的考量#
讓AI Agent操縱你的電腦是很危險的(但是誰管它(ry)),Codex沒有沙盒隔離,可以存取你所有的檔案內容。請務必檢視所有指令再執行。
如果你都是在SSH遠端用指令操作Linux,那麼就用Codex CLI就可以了。不依賴Codex Desktop。
若是Linux桌面用戶,要做一般問答,安裝Codex Desktop。
如果要一邊寫程式一邊生成程式碼,也可以考慮透過IDE裡面的Codex擴充對話。只需要安裝Codex CLI。例如VS Code有Codex IDE Extension,Zed也支援Codex。這樣Codex Desktop就顯得沒什麼用處了。
2. 原理#
參考: Unofficial Linux build of OpenAI Codex Desktop
Codex Desktop疑似是Electron寫的,該專案將macOS的.dmg重新打包,透過拆包轉成Linux版本安裝。
依然需要安裝Codex CLI才能使用。並搭配專為Linux設計的MCP codex-computer-use-linux來讓Codex調用Linux桌面程式,譬如,讓它讀取Thunderbird的行事曆。
Codex的手機APP也能控制Codex操作Linux電腦,不過非官方支援。
3. 適合的Linux桌面環境#
若是一般的檔案操作,如批次重新命名檔案,AI Agent會自動用CLI工具去修改,這正好是Linux最擅長的地方。
如果要操作程式自動化才需要GUI,那麼前提條件是讓AI Agent能看到畫面。
關於GUI自動化部分,Wayland桌面需要ydotool,X11用xdotool。
X11桌面程式權限可說是幾乎沒有限制,可以透過Xorg的原生方法拍攝桌面上任意視窗。Wayland的話會受到XDG Desktop Portal制約,限制AI Agent存取的內容,需要比較多workaround。
理論上GNOME桌面是比較適合讓AI Agent去操作的,因為設計語言比較統一而且有無障礙模式。
不過我用KDE Plasma桌面同樣能自動化。
4. 安裝Codex CLI#
- 安裝NodeJS
sudo apt install node npm- 安裝Codex CLI
sudo npm install -g @openai/codex@latest- 執行,登入OpenAI帳號。設定檔案位於
~/.config/Codex
codex5. 安裝Codex Desktop#
- 複製這個儲存庫,安裝,會有一個服務定期檢查Codex Desktop更新。
git clone https://github.com/ilysenko/codex-desktop-linux.git
cd codex-desktop-linux
make bootstrap-native- 從Linux應用程式列表找到Codex Desktop打開。


