離線版ChatGPT安裝方法！在個人電腦跑AI大型語言模型的開源軟體列表

Running free and open source large language models locally on your PC.

這是「開源大型語言模型」與「跑大型語言模型的開源軟體」列表。

本文Ivon解說如何在您的個人電腦跑類似ChatGPT的大型語言模型。免費、開源、無需網路，支援Linux/Windows/macOS系統。

1. 語言模型是什麼？為什麼要離線跑？
#

大型語言模型（Large Language Model，簡稱LLM）是一種語言模型，屬於生成式AI的技術，最知名的應用莫過於OpenAI的ChatGPT了。2022年，隨著ChatGPT的出現，讓人們了解到通用大型語言模型的應用潛力。

不過ChatGPT有些缺點，就是它跑在OpenAI的雲端伺服器，必須連上網路才可以使用。且ChatGPT提示詞會受到OpenAI限制，導致不能肆意妄為，有些甚至要催眠一下才會聽話。對話資料由OpenAI掌控，對注重隱私的用戶來說肯定是不合適的。

還有，ChatGPT是封閉原始碼的軟體，沒有人知道背後如何運作，改進方法也只有OpenAI自己知道。

那麼有沒有可能在個人電腦跑大型語言模型呢？

有的，ChatGPT的替代品很多的，但這篇文章Ivon要講的不是其他公司提供的線上AI服務，而是可以真正離線執行的大型語言模型。

相較於ChatGPT跑在雲端，跑在個人電腦的大型語言模型，我們會稱之為本機語言模型（Local LLM）。跑在本機的好處不言而喻，除了保障隱私外，你還可以自由的調整AI，讓它發揮你想要的功能。如果採用的是自由開放原始碼的方案，有能力的人更是能著手改進相關程式。

寫AI聊天程式不難，問題是語言模型何處尋？我們有許多開源的語言模型能用。

2023年，Meta釋出了開源的「LLaMA」模型，提供了對應各種等級硬體的模型，模型後面的「B」即billion，十億的意思，代表訓練資料數量，LLaMA的訓練資料量從7B、14B、40B、到65B都有。65B以上的模型是給伺服器使用的，讓他們可以跟ChatGPT競爭。至於7B以下適合在個人電腦跑，中階以上的CPU就夠跑了，甚至連GPU都不需要。一般來說訓練資料越少的硬體需求越低。

在LLaMA釋出之後，基於LLaMA訓練的模型如雨後春筍出現，人們餵給LLaMA各式各樣的資料進行微調(finetune)，強化LLaMA的聊天能力。比方說：Alpaca、Vicuna、WizardLM、Open Assistant等等。甚至有基於LLaMA的模型支援中文對答了，比如台灣聯發科的Breeze-7B。

LLaMA一出，其他科技公司陸續開源了自家訓練的語言模型，例如2023年的Mistral AI，還有Google於2024年釋出的Gemma。這些模型給了人們更多選擇，讓使用者可以自由下載到個人電腦使用。未來應該還會有更多模型出現吧。

咦？可是這些模型都不是ChatGPT啊？是的，Open AI自從GPT 3以後就沒有開源自家模型了，這篇文章的標題「離線版ChatGPT」是一種方便理解的比喻而已（我承認這個標題有點誤導）。這些開源模型都不是原版的ChatGPT，只是各家廠商釋出的開源模型，功能類似ChatGPT。

能夠在個人電腦跑的主要為訓練資料1B、2B、3B、4B、7B、8B、13B、30B的開源模型，儘管這些模型回答品質差ChatGPT一截，但是在做特定方面任務表現就已經很不錯了，比如寫文案、整理重點、翻譯文字、生成一小段程式碼，所以這些語言模型已經具備實用價值。隨著時代演進，開源模型的性能應會逐步追上ChatGPT。

有了這麼多開源模型，要如何在個人電腦使用呢？大型語言模型只是模型檔案，你需要開發者撰寫軟體方能與模型互動，這篇文章下面會介紹的，就是著名的開源大型語言模型，以及操作大型語言模型的軟體。

2. 著名的開源大型語言模型列表
#

這裡列出著名開源的大型語言模型。在你選好要用的語言模型後，還要安裝跑大型語言模型的軟體才能對話。

大型語言模型日新月異，這個列表我會不定時參照Reddit r/Localllama的資訊更新推薦的模型，並務求耗費資源最小，不用太高級的硬體也可以跑（以7B的為主）。列表越上面的模型越推薦使用。

那如何下載模型呢？模型檔案多半可以在HugginFace或者語言模型軟體的官網下載。如果模型為.gguf格式且經過量化，建議選擇Q5_K_M的版本，不會太佔資源，輸出品質也還能接受。

由於開源模型在釋出後多半會有人製作修改版，比如將其調整為*-Instruct和*-Coder版本以接受複雜指令，或是改成*-Uncensored和*-Abliterated去除道德限制。因此我沒辦法將變種全部列出來，只能盡量按照譜系去分，並從中挑出評價比較好的模型。

名稱	說明
Gemma 3	2025年3月由Google釋出，提供1B ~ 27B版本，支援多國語言與圖像辨識的多模態模型。
Breeze2	2025年2月釋出，提供3B與8B版本。聯發科基於LLaMA 3.2微調的繁體中文模型，支援圖像辨識。
DeepSeek R1	2025年1月釋出，提供1.5B ~ 671B版本的模型。深度求索釋出的低成本模型，最大的版本號稱性能近似OpenAI o1，中文能力佳。另提供圖像辨識與生成圖片的Janus-Pro。
Phi 4	2024年12月由Microsoft釋出，另提供多模態模型Phi-4-multimodal。
Qwen 2.5	2024年9月釋出，提供0.5B ~ 72B的版本，阿里巴巴釋出的簡體中文語言模型。
LLaMA 3.2	2024年9月釋出，提供1B、3B版本，支援128K上下文。另有支援圖像辨識的多模態模型LLaMA 3.2 Vision 11B。
Llama-3-Taiwan-8B	2024年7月釋出，研發代號Project TAME，基於LLaMA 3微調的大模型，強化台灣在地繁體中文的理解能力。
Llama-3-TAIDE-LX-8B	2024年5月釋出，台灣國科會發表的繁體中文模型，基於LLaMA 3微調。