DTD - XML 构建块
XML 和 HTML 文档的主要构建块是元素。
XML 文档的构建块
从 DTD 的角度来看,所有 XML 文档都是由以下构建块组成
- 元素
- 属性
- 实体
- PCDATA
- CDATA
元素
元素是 XML 和 HTML 文档的主要构建块。
HTML 元素的例子有 "body" 和 "table"。XML 元素的例子可以是 "note" 和 "message"。元素可以包含文本、其他元素或为空。空 HTML 元素的例子有 "hr"、"br" 和 "img"。
示例
<body>一些文本</body>
<message>一些文本</message>
属性
属性提供有关元素的额外信息。
属性始终放置在元素的开始标签内。属性始终以名称/值对的形式出现。以下 "img" 元素包含有关源文件的额外信息
<img src="computer.gif" />
元素的名称是 "img"。属性的名称是 "src"。属性的值是 "computer.gif"。由于元素本身为空,因此通过 " /" 闭合。
实体
某些字符在 XML 中具有特殊含义,例如小于号 (<),它定义了 XML 标签的开始。
你们中的大多数人可能知道 HTML 实体:" "。此 "不间断空格" 实体用于在 HTML 中插入文档中的额外空格。实体在文档被 XML 解析器解析时展开。
以下实体在 XML 中是预定义的
实体引用 | 字符 |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA 代表解析字符数据。
将字符数据视为 XML 元素的开始标签和结束标签之间找到的文本。
PCDATA 是解析器将解析的文本。解析器将检查文本中的实体和标记。
文本中的标签将被视为标记,实体将被展开。
但是,解析的字符数据不应包含任何 &、< 或 > 字符;这些需要分别由 & < 和 > 实体表示。
CDATA
CDATA 代表字符数据。
CDATA 是解析器不会解析的文本。文本中的标签不会被视为标记,实体不会被展开。