追蹤
ddy 狡兔三窟之一
關於部落格
技術、攝影、生活的記錄
  • 323879

    累積人氣

  • 0

    今日人氣

    19

    追蹤人氣

Linux繁、簡與UTF8之間的轉換

例: iconv -f big5  -t gb2312  test.big5.txt  > test.gb.txt
繁-->簡,這行指令就能把內容為big5編碼檔 test.big5.txt 轉換成gb2312 並輸出為 test.gb.txt

例: iconv -f big5  -t utf8  test.big5.txt  > test.utf8.txt           
big5-->utf8,這行指令就能把內容為big5編碼檔 test.big5.txt 轉換成utf8 並輸出為 test.utf8.txt

例: iconv -f utf8  -t gb2312  test.utf8.txt  > test.gb.txt
utf8-->gb2312,這行指令把剛剛轉換出內容為utf8的編碼檔 test.utf8.txt f8轉換成gb2312 並輸出為 test.gb.txt

如果是utf8 簡體-->utf8繁體,就比較麻煩要三道手續
1. utf8簡體 -->gb2312        「iconv -f utf8 -t gb2312 test.gb.utf8.txt >test.gb.txt
2. gb2312 --> big5          「iconv -f gb2312 -t big5 test.gb.txt >test.big5.txt
3. big5 --> utf8繁體         「iconv -f big5 -t utf8 test.big5.txt >test.big5.utf8.txt

上述作法看起來很累,需要多產生二個中繼檔(test.gb.txt,test.big5.txt)
有沒有更smart 的做法呢,當然有,可以善用「管線 (PIPE)」功能
例:
iconv -f utf8 -t gb2312 test.gb.utf8.txt | iconv -f gb2312 -t big5 | iconv -f big5 -t utf8 > test.big5.utf8.txt
簡單吧!!一個指令完成 ^_^

iconv 的輸入可以接受 * 鍞的萬用字元,也可以間接的把一推文字檔轉換後放到同一個檔案中

除了 iconv 之外,也有不少軟體可以做繁簡轉換
例:
pycodec - 中文碼/萬國碼轉換程式

hc - 漢字轉換器

autoconvert - 智慧的中文編碼轉換

參考資料:
I18N Papers in PC2000 Magazine
親手打造 GNU/Linux 中文環境






Creative Commons License
相簿設定
標籤設定
相簿狀態