2007年1月25日 星期四

Unicode vs ISO 10646

Unicode 的編碼方式與 ISO 10646 的通用字符集(Universal Character Set,UCS)概念相對應,目前實際應用的 Unicode 版本對應於 UCS-2,使用16位的編碼空間。

通用字符集(Universal Character Set,UCS)是由ISO制定的ISO 10646(或稱ISO/IEC 10646)標準所定義的字元編碼方式,採用4位元組編碼。

ISO 10646或Unicode都只是編碼標準,並不處理字形風格標準之問題。字形的風格可以透過改變顯示字體來解決。
參見維基百科(http://zh.wikipedia.org/w/index.php?variant=zh-tw)內相關條目

Unicode各版本字數

  1. unicode 1.0版提供了20,916個漢字(包括正體中文、簡體中文、日語及韓語所用的漢字)。
  2. unicode 3.0版引進的「擴展A區用字」
  3. unicode 3.1版的「擴展B區用字」
  4. unicode 4.1版的「GB 18030 與 HKSCS 增補用字」。一般電腦若不特別去裝上字體,無法看到這些字。
Windows XP & Windows Server 2003預設是 Unicode 2.0,待安裝新細明體更新套件 1.0 版(內有 Extension A 與 Extension B Surrogate package,微軟網站下載點己移除 )之後,有下列的組合:
Unicode 2.0 & Ext-A --> Unicode 3.0
Unicode 3.0 & Ext-B --> Unicode 3.1
(資料來源:microsoft.public.tw.windows)

沒有留言: