XML 语法规则
XML 的语法规则非常简单和逻辑。这些规则易学易用。
XML 文档必须有一个根元素
XML 文档必须包含一个根元素,它是所有其他元素的父元素
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
在本例中,<note> 是根元素
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
XML 序言
这行称为 XML 序言
<?xml version="1.0" encoding="UTF-8"?>
XML 序言是可选的。如果存在,它必须位于文档的最前面。
XML 文档可以包含国际字符,例如挪威语 øæå 或法语 êèé。
为避免错误,您应该指定使用的编码,或将 XML 文件保存为 UTF-8。
UTF-8 是 XML 文档的默认字符编码。
字符编码可以在我们的 字符集教程 中学习。
UTF-8 也是 HTML5、CSS、JavaScript、PHP 和 SQL 的默认编码。
所有 XML 元素必须有结束标签
在 XML 中,省略结束标签是非法的。所有元素必须有结束标签
<p>这是一段文字。</p>
<br />
注意:XML 序言没有结束标签!这不是错误。序言不是 XML 文档的一部分。
XML 标签区分大小写
XML 标签区分大小写。标签 <Letter> 与标签 <letter> 不同。
开始标签和结束标签必须使用相同的大小写
<message>这是正确的</message>
"开始标签和结束标签" 通常称为 "开始标签和结束标签"。使用您喜欢的任何称呼。它们完全相同。
XML 元素必须正确嵌套
在 HTML 中,您可能会看到不正确嵌套的元素
<b><i>此文本为粗体和斜体</b></i>
在 XML 中,所有元素必须正确嵌套
<b><i>此文本为粗体和斜体</i></b>
在上面的示例中,"正确嵌套" 仅仅意味着,由于 <i> 元素是在 <b> 元素内部打开的,因此它必须在 <b> 元素内部关闭。
XML 属性值必须始终用引号括起来
XML 元素可以像 HTML 中一样具有名称/值对的属性。
在 XML 中,属性值必须始终用引号括起来
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
实体引用
某些字符在 XML 中具有特殊含义。
如果您在 XML 元素中放置像 "<" 这样的字符,它将生成错误,因为解析器将其解释为新元素的开始。
这将生成 XML 错误
<message>salary < 1000</message>
为避免此错误,请将 "<" 字符替换为实体引用
<message>salary < 1000</message>
XML 中有 5 个预定义的实体引用
< | < | 小于 |
> | > | 大于 |
& | & | 和号 |
' | ' | 撇号 |
" | " | 引号 |
仅 < 和 & 在 XML 中严格是非法的,但将 > 替换为 > 也是一个好习惯。
XML 中的注释
在 XML 中编写注释的语法类似于 HTML 的语法
<!-- 这是一个注释 -->
注释中间不允许有两个连字符
<!-- 这是一个无效的 -- 注释 -->
XML 保留空白符
XML 不会截断多个空白符(HTML 会将多个空白符截断为一个空白符)
XML | Hello Tove |
HTML | Hello Tove |
XML 将换行符存储为 LF
Windows 应用程序将换行符存储为:回车符和换行符 (CR+LF)。
Unix 和 Mac OSX 使用 LF。
旧 Mac 系统使用 CR。
XML 将换行符存储为 LF。
格式良好的 XML
符合上述语法规则的 XML 文档被称为 "格式良好的" XML 文档。