快轉到主要內容

Ubuntu LTS如何安裝Nvidia顯示卡驅動、CUDA、NVIDIA Container Toolkit套件

分類   Linux系統 Linux使用技巧
標籤   Ubuntu Nvidia
🗓️ 民國113年 甲辰年
✍ 切換正體/簡體字
目錄

適用系統版本:Ubuntu 24.04 LTS以上

本文解說如何在Ubuntu LTS以終端機指令安裝Nvidia專有驅動(proprietary driver),以及相關的CUDA、NVIDIA Container Toolkit套件。

一般用戶玩遊戲只要裝完Nvidia專有驅動即可收工。

要跑3D渲染、神經網路、深度學習的用戶才裝後面的CUDA、cuDNN、TensorRT、NVIDIA Container Toolkit套件。這些套件都依賴Nvidia專有驅動,但是不一定要全裝,端看專案需求。

0. 前言
#

Ubuntu內建支援Nvidia顯示卡的開源驅動「nouveau」,為Linux社群逆向工程而來,不至於讓電腦開機沒畫面。那為什麼Nvidia官方發表的專有(閉源)驅動並非開源軟體,仍建議您安裝?因為nouveau驅動會導致Nvidia顯示卡性能下降,控制風扇失效,並且無法使用Nvidia獨家的加速技術「CUDA」、「NVENC」。欲發揮Nvidia顯示卡全部潛能,安裝Nvidia專有驅動乃必要之舉。

一切安裝指令以參考資料處的【Nvidia官方文件】為準。

Nvidia官方文件提供的安裝方式主要有四種:

  1. 從tar檔安裝
  2. 下載deb檔匯入PPA安裝(Local)
  3. 套件管理員匯入PPA安裝(Network)
  4. 下載.run檔安裝

本文採用「3.套件管理員匯入PPA安裝」,這樣就不需要去官網註冊帳號下載安裝檔了,Nvidia驅動會自動跟著系統套件管理員更新,裝錯版本也比較好解除安裝。

儘管Ubuntu本身的套件庫有Nvidia驅動相關的套件,但是有的是舊版本,所以我們使用Nvidia官方維護的套件庫取得最新驅動套件。

1. 安裝Nvidia專有驅動
#

這裡的Nvidia驅動是從Ubuntu官方套件庫安裝的。

1.1. 桌電與伺服器
#

  1. 想知道目前電腦是使用哪一個主顯示卡,開啟終端機,安裝套件:sudo apt install vulkan-tools,再使用指令:vulkaninfo --summary指令查看,GPU0欄位應會印出Nvidia。

  2. 若有Nvidia顯示卡,Ubuntu預設會載入開源的nouveau驅動,用指令sudo lshw -C display確認,driver區段會顯示"nouveau"

  3. 先將nouveau套件與舊版Nvidia套件刪除:

sudo apt update

sudo apt upgrade

sudo apt purge *nvidia*
  1. 接著使用ubuntu-drivers list指令列出目前Nvidia顯示卡可用的驅動版本。例如Nvidia GTX 1050Ti會看到以下畫面:

  2. 如果您沒有要使用CUDA,那就讓Ubuntu自動挑選適合的版本安裝;要使用CUDA請注意挑選正確的驅動版本。

# 讓Ubuntu自動挑選推薦的驅動版本
sudo ubuntu-drivers autoinstall

# 或者手動指定版本,填入要安裝的Nvidia驅動版本號。
sudo ubuntu-drivers install nvidia:560
  1. 安裝後nouveau應會自動加入黑名單禁止載入。接著重開機,用指令sudo lshw -C display確認是否安裝成功,driver區段應會顯示"nvidia"

  2. 輸入nvidia-smi指令應會看到目前的驅動狀況

1.2. 雙GPU筆電
#

搭載Nvidia獨立顯示卡的筆電安裝顯示卡驅動的方式跟桌上型電腦一樣。

不過,像Intel+Nvidia這種的雙GPU筆電,即使裝了Nvidia驅動也可能繼續用Intel的GPU渲染3D,導致3D性能低下。

此時可以使用prime-select指令,指定用Nvidia顯示卡負責渲染作業。

sudo prime-select nvidia

重開機後再使用指令:vulkaninfo --summary查看主顯示卡為何。

相關文章: Nvidia PRIME指令使用方式

2. 安裝CUDA
#

CUDA (Compute Unified Device Architecture),在做深度學習、Blender渲染時常用到的技術。

必須先裝Nvidia專有驅動才能裝CUDA。

  1. 安裝GCC與kernel headers
sudo apt install build-essential

sudo apt install linux-headers-$(uname -r)
  1. 刪除過期的金鑰
sudo apt-key del 7fa2af80
  1. 加入的Nvidia官方PPA,裡面含有各種CUDA版本與最新Nvidia專有驅動。
# 使用環境變數os指定系統版本
os=ubuntu2404

# 使用環境變數arch指定系統架構
arch=x86_64

# 取得套件庫鑰匙圈
wget https://developer.download.nvidia.com/compute/cuda/repos/$os/$arch/cuda-keyring_1.1-1_all.deb

# 安裝鑰匙圈
sudo apt install ./cuda-keyring_1.1-1_all.deb
  1. 安裝最新的CUDA Toolkit,重開機。由於Nvidia官方套件庫有最新版本驅動,若Ubuntu的Nvidia專有驅動版本對不上,在安裝CUDA的過程會自動升級。
sudo apt update

sudo apt install cuda-toolkit
  1. nvcc --version指令確認CUDA版本

  2. 如果顯示Command nvcc not found,則將路徑加入至~/.bashrc

export PATH=/usr/local/cuda-12.6/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.6/lib64:${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
  1. 再嘗試檢查一次版本
source ~/.bashrc
nvcc --version
如何安裝舊版本CUDA

如果裝了CUDA 12.6,才發現你需要的其實是CUDA 11.8,那就將其移除重裝。

  1. 刪除目前已安裝的Nvidia驅動、CUDA、cuDNN
sudo apt purge *nvidia*
sudo apt --purge remove "*cublas*" "cuda*" "nsight*"
sudo apt autoremove
  1. 安裝舊版CUDA,會一併把對應的Nvidia驅動一起裝回來。
os=ubuntu2204

arch=x86_64

wget https://developer.download.nvidia.com/compute/cuda/repos/$os/$arch/cuda-keyring_1.0-1_all.deb
sudo dpkg -i cuda-keyring_1.0-1_all.deb
sudo apt update
sudo apt install cuda-11-8
  1. 編輯~/.bashrc,將PATH修改為指向CUDA 11.8的路徑
export PATH=/usr/local/cuda-11/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11/lib64:${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
  1. 確認CUDA版本是否為11.8
source ~/.bashrc
nvcc --version

3. 安裝cuDNN
#

CUDA Deep Neural Network (cuDNN)

必須先裝CUDA才能裝cuDNN,安裝cuDNN前務必檢查CUDA版本是否正確。

  1. 如果有新增CUDA套件庫,從Nvidia官方套件庫安裝cuDNN即可。CUDA 12就安裝cuDNN 9的套件:
sudo apt install cudnn9-cuda-12
  1. 安裝cuDNN執行時與範本。
sudo apt install libcudnn9-samples
  1. 編譯執行官方範本,測試cuDNN安裝是否成功
cd $HOME/cudnn_samples_v9/mnistCUDNN

make clean && make

./mnistCUDNN
  1. 看到Test passed!代表安裝成功。

4. 安裝TensorRT
#

TensorRT是Nvidia推出的深度學習推理平台。

必須先安裝CUDA才能安裝TensorRT。

  1. TensorRT目前還沒有PPA可以用,很多套件都找不到,必須註冊Nvidia帳號下載匯入。至 Nvidia官網註冊帳號,登入,勾選同意授權條款,點選TensortRT 10,選Ubuntu 22.04的deb檔下載

  2. 安裝TensorRT的deb檔,加入套件庫

# 指定系統版本
os="ubuntu2204"

# 指定TensorRT版本
tag="10.5.0.x-1+cuda12.6"

sudo dpkg -i nv-tensorrt-local-repo-${os}-${tag}_1.0-1_amd64.deb

sudo cp /var/nv-tensorrt-local-repo-${os}-${tag}/*-keyring.gpg /usr/share/keyrings/

sudo apt update
  1. 安裝TensorRT
sudo apt install tensorrt

5. 安裝NVIDIA Container Toolkit
#

這是設計給Docker和Podman容器用的Nvidia工具,使容器可以使用CUDA計算。

即使宿主機沒有安裝CUDA套件,容器內照樣可以使用CUDA計算。

必須先安裝Nvidia專有驅動才可以安裝NVIDIA Container Toolkit。

  1. 在Ubuntu 安裝Docker

  2. 加入Nvidia的套件庫

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
  1. 安裝NVIDIA Container Toolkit
sudo apt update

sudo apt install nvidia-container-toolkit
  1. 向Docker註冊Nvidia裝置
sudo nvidia-ctk runtime configure --runtime=docker
  1. 重新啟動Docker
sudo systemctl restart docker
  1. 執行Ubuntu容器,測試能否印出Nvidia顯示卡的資訊。
sudo docker run --rm --runtime=nvidia --gpus all ubuntu nvidia-smi

參考資料
#

相關文章

教你在Arch Linux安裝Nvidia、CUDA、cuDNN、TensorRT專有驅動程式
分類   Linux系統 Linux使用技巧
標籤   Arch Linux Nvidia
遠端開機:Ubuntu如何啟用Wake-On-Lan,透過NetworkManager設定
分類   Linux系統 Linux使用技巧
標籤   Remote Desktop Ubuntu
Linux如何解除安裝軟體並刪除乾淨
分類   Linux系統 Linux使用技巧
標籤   Ubuntu Flatpak Snap AppImage

留言板

此處提供二種留言板。點選按鈕,選擇您覺得方便的留言板。要討論程式碼請用Giscus,匿名討論請用Disqus。

這是Giscus留言板,需要Github帳號才能留言。支援markdown語法,若要上傳圖片請貼Imgur或Postimages。您的留言會在Github Discussions向所有人公開。

這是Disqus留言板,您可能會看到Disqus強制投放的廣告。為防止垃圾內容,有時留言可能會被系統判定需審核,導致延遲顯示,請見諒。若要上傳圖片請善用圖床網站。