快轉到主要內容

Stable Diffusion相關術語表,中英翻譯對照

分類   開源AI應用 AI繪圖教學
標籤   Stable Diffusion
🗓️ 民國113年 甲辰年
✍ 切換正體/簡體字
目錄

本頁面列出Stable Diffusion相關的專有名詞,以期討論相關技術的時候能有一個準確的中文術語參考表。

所有項目皆附上中文翻譯與註釋,以正體中文(臺灣)的翻譯為主。

術語
#

  • artificial intelligence generated content (AIGC): 生成式人工智慧
  • ancestral sampling: 祖先取樣,又稱向前取樣
  • annotation: 標示
  • batch count: 批次數量
  • batch size: 批次大小
  • checkpoint: 存檔點,模型格式,附檔名為.ckpt。又稱大模型。
  • classifier-free guidance scale (CFG scale): 事前訓練的條件控制生成方法。
  • CodeFormer: 2022年由Shangchen Zhou等人發表的臉部修復模型。
  • ComfyUI: 2022年推出的AI生圖軟體,強調節點操作,十分靈活。
  • conditioning:制約訓練
  • ControlNet: 2022年由Lvmin Zhang發表,通過加入額外條件來控制擴散模型的神經網路結構。
  • cross-attention: 分散注意
  • CUDA:Nvidia推出的專有技術,可利用GPU加速軟體運算。
  • dataset: 資料集
  • denoising: 去噪,降噪
  • diffusion: 擴散
  • Denoising Diffusion Implicit Models (DDIM): 去噪擴散隱式模型,2022年由Jiaming Song等人發表的取樣方法。
  • Dreambooth: Google Research和波士頓大學於2022年發表的深度學習模型,用於調整現有的文生圖模型。
  • embedding: 嵌入
  • epoch: 時期
  • Euler Ancestral (Euler a): 基於k-diffusion的取樣方法,使用祖父取樣與歐拉方法步數。可在20~30步數生出好結果。
  • Euler: 基於k-diffusion的取樣方法,使用歐拉方法步數。可在20~30步數生出好結果。
  • fine-tune: 微調
  • float16 (fp16): 半精度浮點數
  • float32 (fp32): 單精度浮點數
  • generate:生成圖片
  • Generative Adversarial Network (GAN):生成對抗網路,讓兩個神經網路相互博弈的方式進行學習的訓練方法。
  • GFPGAN: 騰訊於2021年發表的臉部修復模型。
  • hypernetwork: 超網路
  • image to image: 圖生圖
  • inference: 模型推理
  • inpaint: 局部重繪;圖像修復;內補繪製
  • interrogator: 圖像理解
  • k-diffusion: Karras等人於2022年發表的PyTorch擴散模型,基於論文〈Elucidating the Design Space of Diffusion-Based Generative Models〉所實作。
  • latent diffusion: 潛在擴散
  • latent space: 潛在空間
  • Latent Consistency Models (LCM):2023年發表的新取樣方法。
  • learning rate: 學習率
  • Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion (LyCORIS):
  • low-rank adaptation (LoRA): 低秩自適應,2023年由Microsoft發表,用於微調大模型的技術。
  • machine learning: 機器學習
  • model:模型
  • negative prompts: 負向提示詞
  • outpaint: 畫外畫;外補繪製
  • pickle: 儲存張量的模型格式,副檔名為.pt
  • postprocessing: 後處理
  • precision: 精度
  • preprocessing: 預處理
  • prompts: 提示詞;指令;咒語
  • PyTorch: 一款開源機器學習庫
  • safetensors: 副檔名為.safetensors,由Huggingface研發,安全儲存張量的模型格式。
  • sampling method: 取樣方法
  • sampling steps: 取樣步數
  • scheduler: 排程器
  • seed: 種子碼
  • Stable Diffusion: 穩定擴散,文生圖模型,2022年由CompVis發表,由U-Net、VAE、Text Encoder三者組成。
  • Stable Diffusion WebUI: 2022年AUTOMATIC1111推出的AI生圖軟體,以Gradio作為網頁界面。
  • text encoder: 文本編碼
  • text to image: 文字生成圖片,文生圖
  • textual inversion: 文本倒置
  • tiling: 平鋪
  • token: 詞元
  • tokenizer: 標記解析器
  • Transformers: HuggingFace研發的一系列API,用於輔助PyTorch、TensorFlow、JAX機器學習,可下載最新預訓練的模型。
  • U-Net:用於影像分割的卷積神經網路
  • unified predictor-corrector (UniPC): 統一預測校正,2023年發表的新取樣方法。
  • upscale: 升頻;放大
  • variational auto encoder (VAE): 變分自動編碼器
  • weights: 權重
  • xFormers: 2022年由Meta發表,用於加速Transformers,並減少VRAM佔用的技術。

參考資料
#

相關文章

如何下載Stable Diffusion模型 & ComfyUI的模型路徑
分類   開源AI應用 AI繪圖教學
標籤   ComfyUI Stable Diffusion
Krita搭配ComfyUI AI生圖,krita-ai-diffusion外掛安裝教學
分類   開源AI應用 AI繪圖教學
標籤   ComfyUI Krita Stable Diffusion Image Inpainting ControlNet
AI Horde:免費線上AI生圖與文字生成服務的衆籌網站
分類   開源AI應用 AI繪圖教學
標籤   Stable Diffusion LLaMA AI

留言板

此處提供二種留言板。點選按鈕,選擇您覺得方便的留言板。要討論程式碼請用Giscus,匿名討論請用Disqus。

這是Giscus留言板,需要Github帳號才能留言。支援markdown語法,若要上傳圖片請貼Imgur或Postimages。您的留言會在Github Discussions向所有人公開。

這是Disqus留言板,您可能會看到Disqus強制投放的廣告。為防止垃圾內容,有時留言可能會被系統判定需審核,導致延遲顯示,請見諒。若要上傳圖片請善用圖床網站。