UTF-8(8 位元 Universal Character Set/Unicode Transformation Format)是针对Unicode 的一种可变长度字符编码。它可以用来表示 Unicode 标准中的任何字符,而且其编码中的第一个字节
字符编码形式(Character Encoding Form,CEF)定义将编码字符集的整数代码转换成有限大小整数代码值以有利于使用固定位的二进制表示数字的形式(比如,几乎任何的计算机系统)的系统存储。例如,使用16位单元存储数字信息的系统每个单元只
时至今日表情不再仅仅只是图片语言更是一种艺术表达形式,在很多情境下比文字更具感染力。最新消息指出统一码技术委员会(UTC)已经公布
杂锦符号(Dingbat)俗称杂锦字体,本来是印刷品之中使用的装饰及图形符号。在计算机被用来制作印刷刊物后,印刷业界便制造了各种杂锦字体,最著名的是Adobe的Zapf Dingbats字体。Zapf Dingbats 字符集
One problem that has been plaguing CJK Compatibility Ideographs i
认识全型字(Full-Width)和半型字(Half-Width)
以往在Unicode不普及的时候,我们的地方编码里头就有全型及半型之分,例如英文字母a这是半型,但在我们GB/Big-5码中也有相对的全型的字母a。半型的a是1byte,全型的a,是2bytes。但是,这其实和几个byte无关,而是半型是占字体的em框的一半宽度,全型字则是占字体em
March 21, 2012 — The Unicode CLDR Survey Tool is open for beta te
Unicode 5.2.0新标准正式发布 增加6648个字符
2009年10月1日,The Unicode Consortium(统一码联盟)正式发布最新版字符编码标准Unicode 5.2.0。Unicode 5.2.0相比Unicode 5.1.0,增加了6648个字符。主要新增了数个文字区块:Bamum(巴穆姆文)、Javanese(爪哇文)、

GB 12052-89: PRC Standard For Korean
While it was not uncommon for early (pre-Unicode) CJK character s