UTF16,UTF32,UNICODE,ANSI,CP54936編碼字符串轉(zhuǎn)換工具.例如:在工具中輸入"我是中國人",UTF16,UTF32,UNICODE,ANSI,CP54936各欄中會相應顯示對應的編碼數(shù)據(jù).在一些開發(fā)編碼相關(guān)方面會有用到簡單好用.本人就常用,很方便.感謝原作者.
CodeView怎么用?
我在工作中經(jīng)常需要查看幾個字的編碼,或者查看幾個編碼對應的字符,所以寫了這個工具。用戶可以在文本欄輸入文本,或者在編碼欄輸入對應的編碼。在您輸入的同時,其它各欄會同步變化。輸入編碼格式是固定的:必須用兩個16進制數(shù)字表示一個字節(jié)。每個字節(jié)用一個空格分隔。
CodeView有一點特色,就是用戶可以設(shè)置要顯示的代碼頁(兩個左邊有按鈕的編碼欄)。點擊代碼頁按鈕,在彈出的對話框選擇代碼頁:
可以用編碼欄右側(cè)的保存按鈕將數(shù)據(jù)保存到文件,可以選擇是否需要加BOM。BOM的概念可以見 淺談文字編碼和Unicode(下) 的4.2.4節(jié)。如果您不熟悉UTF16-LE、UTF16-BE等概念,可以看看這篇文章的的4.2節(jié)。
請注意:當某個編碼欄不支持特定字符時,CodeView會顯示默認編碼,通常是3F。
用CodeView解決“字符實體”類型亂碼
CodeView 是一個查看文本編碼的小工具。我們用它來解決這個亂碼問題。
2.1 得到CP1252字符
首先要得到命名實體對應的亂碼,即CP1252字符。
à′DÅêÕμ½£¬D»D»
如果你的郵件已經(jīng)是這個樣子,就可以跳過這步。如果你的郵件是
À´ÐÅÊÕµ½£¬Ð»Ð»
你就新建一個文本文件,內(nèi)容如下:
À´ÐÅÊÕµ½£¬Ð»Ð»
BODY標簽之間粘貼上要轉(zhuǎn)換的命名實體。保存到html文件,用瀏覽器打開,就可以看到:
à′DÅêÕμ½£¬D»D»
復制這些CP1252字符。
2.2 由CP1252字符得到對應編碼
打開CodeView。CodeView有兩行是可以自己設(shè)置編碼的。把第二行設(shè)置成CP1252,將最后一行設(shè)置成CP936,即GBK。 然后把前面復制的字符粘貼到文本行
這樣就可以從CP1252行得到CP1252字符對應的編碼文本。在CP1252行點右鍵,在右鍵菜單選擇“復制全部”復制這行編碼文本。
2.3 將編碼當作GBK編碼轉(zhuǎn)換到文本
先刪除掉最后一行的文本,然后將復制的CP1252編碼文本粘貼到最后一行,即CP936行。這時在文本行就可以看到對應的文本。
3 結(jié)束語
如果把CP1252編碼當作GBK編碼,文本行還是亂碼,你可以再試試Big5,即把最后一行設(shè)置成CP950。 這種類型的亂碼郵件還是比較容易處理的,你可以自己動手解決它。