# Unicode

Unicode 是一种计算行业标准,旨在对世界各地的书面语言中使用的 字符进行一致和唯一的编码。 Unicode 标准使用 十六进制来表示字符。例如,值 0x0041 表示拉丁字符 a。Unicode 标准最初设计使用 16 位对字符进行编码,因为主要机器是 16 位 pc 机。

因为 16 位编码支持 2^16(65,536) 个字符,这不足以定义全世界使用的所有字符,所以 Unicode 标准扩展到了0x10FFFF,它支持超过 100 万个字符。Java 编程语言中的字符定义不能从 16位 更改为 32 位,而不会导致数百万个 Java 应用程序不再正常运行。为了纠正这个定义,开发了一种方案来处理不能用 16 位编码的字符。

值在 16 位范围之外、范围在 0x10000 到 0x10FFFF 之间的字符称为 补充字符,它们被定义为一对 char 值。

本课包含以下部分内容: