CJK字符集是什么?
cjk代號意思是:漢語(Chinese)、日語(Japanese)、韓語(Korean)。也就是包含這3國語言的字符集。包含這3個國家常見的漢字,一共有2萬多個。
所有軟件都會默認(rèn)是:ANSI字符集嗎?
不同程序默認(rèn)讀取字符集不同,上面舉例是記事本默認(rèn)是這樣的。在php里面會以:iso-8859-1讀取。 jsp程序,java默認(rèn)字符集也是:iso-8859-1。
為什么很多軟件程序編譯過程使用是:iso-8859-1字符集?
由于我們通過應(yīng)用程序書寫的軟件是用各種字符集編碼保存在磁盤中。如果中文默認(rèn)是用gbk。保存于磁盤中,默認(rèn)以字節(jié)碼保存,是否有無中文,每個字碼值在:1-256。這些剛好可以用iso-8859-1擴(kuò)展單字節(jié)字符集。因為,它是存儲最小單元。在程序語言里面,不會用中文作變量,函數(shù)等名稱。那些對應(yīng)都是常見ascii碼。而中文用字注釋,或者一些常量中。在編譯時候不會影響到語法問題。它會以原來字節(jié)碼保持原樣。在讀取時候,只需要用對應(yīng)的字符集編碼讀出,就能得到對應(yīng)中文字符。
本文導(dǎo)航
- 第1頁: 首頁
- 第2頁: 什么是字符編碼?
- 第3頁: 常見問題字符疑問收集
- 第4頁: 為什么bom頭會產(chǎn)生亂碼?
- 第5頁: 字符集是怎么樣一個演變過程呢?
- 第6頁: CJK字符集是什么?