當我用VPN切換地區,看到Google搜尋結果變成外文,回傳的結果並不是那麼容易出現我的網站,甚至搜尋小眾術語也看不到的時候。
我就想到了希斯特莉亞說過的:困在(中文圈的)牆內,是沒有未來的啊!
那麼,我要把我blog邪惡的思想散播到全世界!就翻譯為英文和日文等多國語言吧!簡體中文應該不用刻意翻譯因為我網站有繁轉簡按鈕。利用Hugo的i18n功能製作多語言部落格。
最主要我認為包含原創想法,而非依靠中英文資訊差割韭菜(就是簡單寫個README翻譯的教學文,價值比XDA首頁文章還低的),起碼有100篇,例如對自由軟體的思考,是可以優先推廣的對象。
不敢說我寫的多好,但這些rant的內容驚世駭俗的程度隨便一篇都是能被掛上Hacker News公幹的。
我應該是挑戰自己寫英文內容的才對,從2022年就有在做英文版網站了(https://ivonblog.com/en-us/),又做了日本版網站(https://ivonblog.com/ja-jp/),主要是把一些在Reddit反響不錯的技術文章貼上來,內容就是我一字一字翻譯的。有時候發現中文原文寫的太抽象,我還得用英文思維重寫段落,等同再創作。翻譯速度最快也就1天1篇1000字的文章。
可惜的是,我沒辦法像以前一樣手動一篇一篇翻譯了,這樣根本不可能翻譯得完。這也是我英文版網站更新頻率很低的緣故。雖然手動翻譯能維持英語寫作語感,可是不切實際呀。
所以…交給VS Code裡面的ChatGPT Codex執行吧。網站文章原始碼都是Markdown應該很好給機器處理。
訂閱ChatGPT Plus,使用GPT 5 Thinking模型,這樣它會考量文章整體內容再翻譯,較為通順。並會把覺得有問題的翻譯文本寫入log向我回報,我再看情況手動糾正。在VS Code裡面操作,協同AI修改檔案很是方便。
給了它20條翻譯規則,然後依序執行,自動編輯每個Markdown檔案,發現語句怪怪的會嘗試考慮文化因素,就像真人譯者在思考。ChatGPT Plus的方案額度,每5個小時大概能處理50個檔案。燒完token額度就休息個幾小時再繼續。
規則大致如下:
Markdown檔案翻譯規則:
1. 只翻譯`路徑`的檔案
2. Markdown內已有`<!-- Co-translated by ChatGPT -->`的檔案不翻譯。
3. 你的角色是名為Ivon Huang的Linux + Free Software技術宅。參考我在ChatGPT儲存的長期記憶。請用最精確、自然、忠實的語言,將我的文章從「臺灣繁體中文」翻譯成「美式英文」,並保留原文的技術風格與語氣。允許使用文學的艱深術語表達文藝概念。如果遇到粗言穢語,也要照實翻譯。
4. 最小翻譯單位是一個檔案,必須讀完整篇Markdown檔案,考慮上下文,再翻譯。專有名詞的翻譯在同一篇文章裡面應保持相同翻法。
5. 除`title`外,Front Matter其他欄位全部不動。
6. Markdown內的超連結文字若只是文章標題,請維持原樣,不要翻譯。只有當該標題文字與前後文直接連成一句或需要語意連貫時,才可視情況翻譯。
7. 若段落原文已經是英文,請保持不變,不要重複翻譯或改寫。不要修正文法與拼字錯誤。
8. 如果中文名詞和人名找不到適合的詞,優先使用音譯。
9. 完成翻譯後,請在Markdown Front Matter之後、正文開始之前,插入一行 HTML 註解:`<!-- Co-translated by ChatGPT -->` 並且你是要翻譯完整篇文章才能加上。
10. 請保留原始Markdown結構、標點、連結、標題層級與排版,不要擅自重構內容。也不要擅自加入空格。
11. Hugo Shortcode和Hugo Partial不要翻譯。
12. HTML註解保留不動。
13. 程式碼區塊只有註解要翻譯。
14. 引用文字要翻譯。除非本來就是英文,或者我在該段落已經附上中文與英文原文。
15. 若Markdown語法遇到專有名詞、技術名詞、程式碼、指令、檔名、URL、變數名稱,請保留原樣,不要意譯。
16. 列出並整理翻譯可能有問題的檔案列表。包括翻譯有困難(無法生成回應或找不到適合的詞),以及連結可能404的問題。把這些問題記錄寫入到`路徑/translation-logs.md`裡面。格式:檔案路徑 問題描述這原本是我所不齒的行為,大規模機器翻譯會顯得你很沒誠意,可是如果Reddit和知乎都在這麼做了,那我也得跟上時代吧。我知道Google搜尋的AI總結已經會去抓異國語言的網站並自動翻譯來作為回答內容了,那麼我方便他們抓取不是更好?
長期來看,至少我能夠讓更多語言的人們認知到我網站的存在。
現在做的事情,就是先把餌放下去。
我唯一的良心,大概就是請ChatGPT翻譯完成後在文章加入Co-translated by ChatGPT的HTML註解罷了。


