XML 语法规则
XML 的语法规则非常简单和逻辑化。这些规则易于学习和使用。
XML 文档必须有一个根元素
XML 文档必须包含一个作为所有其他元素的父元素的根元素
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
在此示例中,<note> 是根元素
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
XML 声明
这行被称为 XML 声明
<?xml version="1.0" encoding="UTF-8"?>
XML 声明是可选的。如果存在,它必须是文档的第一行。
XML 文档可以包含国际字符,例如挪威语的 øæå 或法语的 êèé。
为避免错误,您应该指定所使用的编码,或将 XML 文件保存为 UTF-8。
UTF-8 是 XML 文档的默认字符编码。
字符编码可以在我们的字符集教程中学习。
UTF-8 也是 HTML5、CSS、JavaScript、PHP 和 SQL 的默认编码。
所有 XML 元素必须有结束标签
在 XML 中,省略结束标签是违法的。所有元素必须有结束标签
<p>这是一个段落。</p>
<br />
注意: XML 声明没有结束标签!这不是错误。声明不是 XML 文档的一部分。
XML 标签区分大小写
XML 标签区分大小写。标签 <Letter> 与标签 <letter> 不同。
开始标签和结束标签必须使用相同的大小写
<message>这是正确的</message>
"开始标签和结束标签" 通常被称为 "起始标签和末尾标签"。使用您喜欢的任何一种说法。它们是完全相同的事物。
XML 元素必须正确嵌套
在 HTML 中,您可能会看到不正确嵌套的元素
<b><i>这段文本是粗体和斜体</b></i>
在 XML 中,所有元素必须正确嵌套
<b><i>这段文本是粗体和斜体</i></b>
在上面的示例中,“正确嵌套”仅仅意味着由于 <i> 元素在 <b> 元素内部打开,它也必须在 <b> 元素内部关闭。
XML 属性值必须始终加引号
XML 元素可以像 HTML 一样具有名称/值对的属性。
在 XML 中,属性值必须始终加引号
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
实体引用
某些字符在 XML 中具有特殊含义。
如果您将 "<" 等字符放在 XML 元素中,它将生成错误,因为解析器会将其解释为新元素的开始。
这将生成一个 XML 错误
<message>salary < 1000</message>
为避免此错误,请将 "<" 字符替换为实体引用
<message>salary < 1000</message>
XML 中有 5 个预定义的实体引用
< | < | 小于 |
> | > | 大于 |
& | & | 和号 |
' | ' | 撇号 |
" | " | 引号 |
只有 < 和 & 在 XML 中是严格非法的,但最好也用 > 替换 >。
XML 中的注释
XML 中编写注释的语法与 HTML 类似
<!-- 这是一个注释 -->
注释中间不允许出现两个破折号
<!-- 这是一个无效的 -- 注释 -->
XML 中的空白被保留
XML 不会截断多个空白(HTML 会将多个空白截断为一个空白)
XML | Hello Tove |
HTML | Hello Tove |
XML 将换行符存储为 LF
Windows 应用程序将换行符存储为:回车符和换行符 (CR+LF)。
Unix 和 Mac OS X 使用 LF。
旧 Mac 系统使用 CR。
XML 将换行符存储为 LF。
格式良好的 XML
符合上述语法规则的 XML 文档被称为“格式良好的”XML 文档。