HTML 字符集
要正确显示 HTML 页面,浏览器必须知道要使用的字符集(编码)。
示例
<meta charset="UTF-8">
HTML 字符集
所有现代计算机语言都默认使用 UTF-8 字符集。
早期 Web 的编码是 ASCII。ASCII 使用 7 位表示字符,只能表示 128 个不同的字符(英文字母)。
如需更详细的了解,请研究我们的 完整 ASCII 参考。
Windows-1252 是 Windows 中的第一个字符集。它是 ASCII 的副本,但使用 8 位来表示 256 个不同的字符(国际字母)。Windows-1252 受所有浏览器支持。
如需更详细的了解,请研究我们的 完整 Windows-1252 参考。

HTML 4:ISO-8859-1
从 HTML 2.0 到 HTML 4.01 的默认字符是 ISO-8859-1。
ISO-8859-1 是 ASCII 的扩展,增加了国际字符。
示例
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
在 HTML 4 中,可以在 <meta> 标签中指定与 ISO-8859-1 不同的字符集。
示例
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
所有 HTML 4 处理器也支持 UTF-8。
示例
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
当浏览器检测到 ISO-8859-1 时,它通常会默认使用 Windows-1252,因为 Windows-1252 拥有额外的 32 个国际字符。
如需更详细的了解,请研究:完整的 ISO-8859-1 参考
在 HTML5 中:Unicode UTF-8
HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集。
示例
<meta charset="UTF-8">
可以在 <meta> 标签中指定与 UTF-8 不同的字符集。
示例
<meta charset="ISO-8859-1">
Unicode Consortium 开发了 UTF-8 和 UTF-16 标准,因为 ISO-8859 字符集有限,并且与多语言环境不兼容。
Unicode 标准涵盖(几乎)世界上所有的字符、标点符号和符号。
所有 HTML5 和 XML 处理器都支持 UTF-8、UTF-16、Windows-1252 和 ISO-8859。
如需更详细的了解,请研究:完整的 Unicode 参考。