快轉到主要內容

Pixiv與Danbooru圖站下載器:Hydrus Downloader用法,批次下載圖片&抓取網頁所有圖片

· 民國114年乙巳年
·
切換繁體/簡體
分類   Linux系統 Self-hosting自架
標籤   Hydrus Network Pixiv Danbooru 4chan Komica
目錄

圖片管理軟體Hydrus Network提供下載器功能,能下載Danbooru、Pixiv圖站的圖片,也能用來抓取4chan、Komica這類網站的網頁圖片。

Gallery Downloader會直接從各大圖站下載圖片,批次匯入到資料庫,不需要你手動去網頁右鍵存檔。

這個用來下載大量圖片非常好用,不只能夠快速取得符合搜尋條件的圖片,還能夠把圖站上面的標籤一併複製下來,省得日後手動打標籤的痛苦。Hydrus Network作者在官方文件裡面警告使用者不要過度濫用,一抓可能就會停不下來,一不小心就會精盡人亡。

不過,Hydrus Network提供的是「圖片下載器」,它會在你鍵入搜尋條件之後就開始抓圖,下載的都是完整解析度的大圖檔。如果想要瀏覽網站縮圖再決定是否要下載的話,建議使用imgbrd-grabber會有更好體驗。或者在瀏覽器安裝Hydrus Companion,將網頁看到的圖片按右鍵直接傳送到Hydrus資料庫。

另外,Hydrus Network沒有限定只能下載圖站的圖片。內建簡易的下載器Simple Downloader,能夠從一個網頁裡面抓出所有的圖片下載。經過我自己測試,4chan和Komica討論串的都可以下載呦!

1. Gallery Downloader圖站下載器操作#

目前支援的圖站有:Artstation、Danbooru、Gelbooru、E621、Furry booru、Hentai Foundry、Inkbunny、Konachan、Nijie、Pixiv、Realbooru、Rule34、Safabooru、Sakugabooru、TBIB、Tumblr、Xbooru、yande.re等網站。

可以透過插件的方式擴充更多網站的下載器,這也是一個很好玩的點。Hydrus要求開發者的下載器得用.png格式分發,其實是把程式碼藏在png的附加資料裡面,可以用來藏不能說的祕密網址,用Komica島民的話術來說就是「心眼」了!

  1. 點選page → new download page → gallery,新增畫廊下載頁面。

  2. 如下圖所示,搜尋框下面的圖站選取Danbooru,輸入圖片標籤開始搜尋圖片,並將下載的圖片數量上限改成20。

Danbooru標籤搜尋建議使用全英文。如果不知道標籤怎麼搜尋,參閱Danbooru Wiki

Pixiv的話就得學著用日文標籤搜尋了!繪師得填寫Pixiv ID才能搜尋。Hydrus Network下載圖片的標籤可能會用日文儲存,但是命名空間用英文,譬如creator:黒糖ニッケ

  1. 例如搜尋《少女與戰車》的版權圖繪:girls_und_panzer official_art,按下Enter,就會開始下載Danbooru網站的最新圖片,並進到Hydrus的收件匣。

  2. 對圖片點二下,放大檢視,可看到下載器也自動抓取了圖片的標籤。

  3. 對順眼的圖片按下右鍵(Shift或Ctrl多選),按archive selected將圖片封存進Hydrus資料庫。

  4. 封存完成後,信封的圖示會消失。對gallery的頁面右鍵,close page。

  5. 回到主界面,對左邊的搜尋框search tags點一下,按system:everythingsystem:archived便會列出資料庫所有的圖片。

  6. 需要更多下載器的請到Github或Gitlab找,譬如Hydrus-Presets-and-Scripts。Hydrus開發者要求下載器得用.png格式分發,故點選network → downloaders → import downloaders,將.png檔案拖到Lain的頭上匯入下載器。

2. 處理需要登入才能下載的圖站
#

有些網站能夠從Hydrus Netowrk內部登入。點選network → logins → manage logins,輸入帳號與密碼。

至於Pixiv沒有登入帳號的情況下,無法顯示R18圖片,又Hydrus無法處理登入請求,因此需要手動取得瀏覽器的cookie。其他不能從Hydrus登入的網站應該也能這樣如法炮製。

  1. 開啟Chromium系列瀏覽器,登入Pixiv帳號。

  2. 使用Hydrus CompanionGet cookies.txt LOCALLY擴充元件匯出cookie。

  3. 回到Hydrus Network,按network → data → review session cookies

  4. 如果已經有Pixiv的cookie,全選按delete。接著點選import cookies.txt,匯入剛剛取得的cookie。


再如,Gelbooru需要編輯cookie才能搜尋到蘿莉標籤的圖片。

  1. 按network → data → review session cookies

  2. 按下create new,填入gelbooru.com,按apply。

  3. 對web domain:gelbooru按二下,點選add新增cookie,name欄位填寫fringeBenefits,value填寫yup

3. 下載其他類型的檔案
#

點選page → new download page

URL download: 下載單一網址的檔案

Watchers: 監視特定網站變更,有新圖片便會下載。例如貼上Danbooru圖站網址,就會自動下載新上傳的圖片。

Simple downloader: 下載完整網頁之用。

在這裡填入網址,然後選取要的選項。按Enter便會下載。

all images embedded in the page應該是比較常用的選項,就是單純把網頁內所有的圖片下載下來。

或者嘗試all files linked by images in the page,才能抓到完整解析度的圖片。

參考資料
#

相關文章

Hydrus Network:以標籤分類的圖片管理軟體,數位囤積症救星
分類   Linux系統 Self-hosting自架
標籤   Hydrus Network Photo Gallery Media Server Data Hoarding 4chan
標籤式圖片管理軟體,Hydrus Network的Docker遠端存取方案
分類   Linux系統 Self-hosting自架
標籤   Hydrus Network Docker Media Server Photo Gallery
Hydrus Network:藉由DeepDanbooru自動給匯入的動漫圖片上標籤
分類   Linux系統 Self-hosting自架
標籤   Hydrus Network Danbooru

此處提供二種留言板。點選按鈕,選擇您覺得方便的留言板。

這是Disqus留言板,您可能會看到Disqus強制投放的廣告。為防止垃圾內容,有時留言可能會被系統判定需審核,導致延遲顯示,請見諒。若要上傳圖片請善用圖床網站。