------- android培训、java培训、期待与您交流！ ----------

一．XML(ExtnsibleMarkupLanguage)是W3C组织发布。

XML技术用于解决的问题：

1）.XML出现的根本目的在于描述在现实生活中经常出现的有关系的数据。

2）在XML语言中，允许用户自定义标签。一个标签用于描述一段数据；一个标签可分为开始标签和结束标签，在开始标签和结束标签之间，又可以使用其他标签描述其他数据，以此来实现数据关系的描述。

3）XML技术除了用来保存数据之外，还经常用做软件的配置文件，以描述程序模块之间的关系。在一个软件系统中，为提高系统的灵活性，它所启动的模块通常由其配置文件决定

例如一个软件在启动时，它需要启动Ａ、Ｂ两个模块，而A、Ｂ这两个模块在启动时，又分别需要A1、A2和B1、B2模块的支持，为了准确描述这种关系，此时使用ＸＭＬ文件最为合适不过。

二XML语法：

一个XML文件分为如下几部分内容

1）处理指令（processinginstruction）

2）文档声明

3）元素

4）属性

5）注释

6）DATA区、特殊字符

1.xml处理指令：

处理指令，简称PI（processinginstruction）。处理指令用来指挥解析引擎如何解析XML文档内容

例如，在XML文档中可以使用xml-stylesheet指令，通知XML解析引擎，应用css文件显示xml文档内容。

<?xml-stylesheettype="text/css"href="1.css"?处理指令必须以“<?”作为开头，以“?>”作为结尾，XML声明语句就是最常见的一种处理指令。

2.文档声明

在编写XML文档时，需要先使用文档声明，声明XML文档的类型。

最简单的声明语法：

<?xmlversion="1.0"?>

用encoding属性说明文档的字符编码：

<?xmlversion="1.0"encoding="GB2312"?>

(xml文档以什么编码保存，就要以什么编码打开)

用standalone属性说明文档是否独立：

<?xmlversion="1.0"encoding="GB2312"standalone="yes"?>

3元素

XML元素指XML文件中出现的标签，一个标签分为开始标签和结束标签，一个标签有如下几种书写形式，例如：

包含标签体：<a>www.itcast.cn</a>

不含标签体的：<a></a>,简写为：<a/>

一个标签中也可以嵌套若干子标签。但所有标签必须合理的嵌套，绝对不允许交叉嵌套，例如：

<a>welcometo<b>www.it315.org</a></b>

格式良好的XML文档必须有且仅有一个根标签，其它标签都是这个根标签的子孙标签。

对于XML标签中出现的所有空格和换行，XML解析程序都会当作标签内容进行处理。例如：下面两段内容的意义是不一样的。

第一段：

<网址>www.itcast.cn</网址>

第二段：trim()

<网址>

www.itcast.cn

</网址>

由于在XML中，空格和换行都作为原始内容被处理，所以，在编写XML文件时，使用换行和缩进等方式来让原文件中的内容清晰可读的“良好”书写习惯可能要被迫改变。

元素的命名规范：

一个XML元素可以包含字母、数字以及其它一些可见字符，但必须遵守下面的一些规范：

区分大小写，例如，<P>和<p>是两个不同的标记。

不能以数字或"_"(下划线)开头。

不能以xml(或XML、或Xml等)开头。

不能包含空格。

名称中间不能包含冒号（:）。

4属性

一个标签可以有多个属性，每个属性都有它自己的名称和取值，例如：

<inputname=“text”>

属性值一定要用双引号（"）或单引号（'）引起来

定义属性必须遵循与标签相同的命名规范

多学一招：在XML技术中，标签属性所代表的信息，也可以被改成用子元素的形式来描述，例如：

5注释

Xml文件中的注释采用：“”格式。

注意：

XML声明之前不能有注释

注释不能嵌套，例如：

<!--大段注释

……

……->

6CDATA区

在编写XML文件时，有些内容可能不想让解析引擎解析执行，而是当作原始内容处理。

遇到此种情况，可以把这些内容放在CDATA区里，对于CDATA区域内的内容，XML解析程序不会处理，而是直接原封不动的输出。

语法：<![CDATA[内容]]>

例如：<![CDATA[

<br/>

</itcast>

]]>

转义字符：

对于一些单个字符，若想显示其原始样式，也可以使用转义的形式予以处理。

一些常见的转义字符如下：

XML约束

什么是XML约束：

在XML技术里，可以编写一个文档来约束一个XML文档的书写规范，这称之为XML约束。

常用的约束技术

XMLDTD

XMLSchema

一．DTD约束：DTD(DocumentTypeDefinition)，全称为文档类型定义。

IE5以上浏览器内置了XML解析工具：Microsort.XMLDOM，开发人员可以编写javascript代码，利用这个解析工具装载xml文件，并对xml文件进行dtd验证。

创建xml文档解析器对象

varxmldoc=newActiveXObject("Microsoft.XMLDOM");

开启xml校验

xmldoc.validateOnParse="true";

装载xml文档

xmldoc.load("book.xml");

获取错误信息

xmldoc.parseError.reason;

xmldoc.parseError.line

编写DTD的两种方式：

1.DTD约束即可以作为一个单独的文件编写：

XML文件使用DOCTYPE声明语句来指明它所遵循的DTD文件，DOCTYPE声明语句有两种形式：

当引用的文件在本地时，采用如下方式：

<!DOCTYPE文档根结点SYSTEM"DTD文件的URL">

例如：<!DOCTYPE书架SYSTEM“book.dtd”>。在xml文件中手写一下。

当引用的文件是一个公共的文件时，采用如下方式：

<!DOCTYPE文档根结点PUBLIC"DTD名称""DTD文件的URL">

例如：<!DOCTYPEweb-appPUBLIC

"-//SunMicrosystems,Inc.//DTDWebApplication2.3//EN"

"http://java.sun.com/dtd/web-app_2_3.dtd

2.也可以在XML文件内编写。

例如：

<?xmlversion="1.0"encoding="UTF-8"standalone="yes"?>

<!DOCTYPE书架[

<!ELEMENT书架(书+)>

<!ELEMENT书(书名,作者,售价)>

<!ELEMENT书名(#PCDATA)>

<!ELEMENT作者(#PCDATA)>

<!ELEMENT售价(#PCDATA)>

<书架>

<书>

<书名>Java就业培训教程</书名>

<作者>张孝祥</作者>

<售价>39.00元</售价>

</书>

...

</书架>

DTD语法约束细节

元素定义：在DTD文档中使用ELEMENT声明一个XML元素，语法格式如下所示：

<!ELEMENT元素名称元素类型>

元素类型可以是元素内容、或类型

如为元素内容：则需要使用()括起来，如

<!ELEMENT书架(书名，作者，售价)>

<!ELEMENT书名(#PCDATA)>

如为元素类型，则直接书写，DTD规范定义了如下几种类型：

EMPTY：用于定义空元素，例如<br/><hr/>

ANY：表示元素内容为任意类型。

元素内容中可以使用如下方式，描述内容的组成关系

元素内容使用空白符分隔，表示出现顺序没有要求：<!ELEMENTMYFILE(TITLEAUTHOREMAIL)>

用逗号分隔，表示内容的出现顺序必须与声明时一致。<!ELEMENTMYFILE(TITLE,AUTHOR,EMAIL)>

用|分隔，表示任选其一，即多个只能出现一个

<!ELEMENTMYFILE(TITLE|AUTHOR|EMAIL)>

在元素内容中也可以使用+、*、?等符号表示元素出现的次数：

+:一次或多次(书+)

?:0次或一次(书?)

*:0次或多次(书*)

也可使用圆括号()批量设置，例

<!ELEMENTMYFILE((TITLE*,AUTHOR?,EMAIL)*|COMMENT)>

属性定义

xml文档中的标签属性需通过ATTLIST为其设置属性

语法格式：

<!ATTLIST元素名

属性名1属性值类型设置说明

属性名2属性值类型设置说明

……

属性声明举例：

<!ATTLIST商品

类别CDATA#required

颜色CDATA#IMPLIED

对应XML文件：

<商品类别="服装"颜色="黄色">…</商品>

<商品类别="服装">…</商品>

设置说明：

#required：必须设置该属性

#IMPLIED：可以设置也可以不设置

#FIXED：说明该属性的取值固定为一个值，在XML文件中不能为该属性设置其它值。但需要为该属性提供这个值

直接使用默认值：在XML中可以设置该值也可以不设置该属性值。若没设置则使用默认值。

例：

<!ATTLIST页面作者

姓名CDATA#IMPLIED

年龄CDATA#IMPLIED

联系信息CDATA#required

网站职务CDATA#FIXED"页面作者"

个人爱好CDATA"上网"

常用的属性类型：

CDATA：表示属性值为普通文本字符串。

ENUMERATED

ENTITY(实体)

实体定义

实体用于为一段内容创建一个别名，以后在XML文档中就可以使用别名引用这段内容了。

在DTD定义中，一条<!ENTITY…>语句用于定义一个实体。

实体可分为两种类型：引用实体和参数实体

引用实体：

引用实体主要在XML文档中被应用

语法格式：

<!ENTITY实体名称“实体内容”>：直接转变成实体内容

引用方式：

&实体名称;

举例：

<!ENTITYcopyright“Iamaprogrammer">

……

©right;

参数实体：

参数实体被DTD文件自身使用

语法格式：

<!ENTITY%实体名称"实体内容">

引用方式：

%实体名称;

举例1：

<!ENTITY%TAG_NAMES"姓名|EMAIL|电话|地址">

<!ELEMENT个人信息(%TAG_NAMES;|生日)>

<!ELEMENT客户信息(%TAG_NAMES;|公司名)>

举例2：

<!ENTITY%common.attributes

"idID#IMPLIED

accountCDATA#required"

...

<!ATTLISTpurchaSEOrder%common.attributes;>

<!ATTLISTitem%common.attributes;>

Schema约束

Schema基础

XMLSchema文件自身就是一个XML文件，但它的扩展名通常为.xsd。

一个XMLSchema文档通常称之为模式文档(约束文档)，遵循这个文档书写的xml文件称之为实例文档。

和XML文件一样，一个XMLSchema文档也必须有一个根结点，但这个根结点的名称为Schema。

编写了一个XMLSchema约束文档后，通常需要把这个文件中声明的元素绑定到一个ＵＲＩ地址上，在XMLSchema技术中有一个专业术语来描述这个过程，即把XMLSchema文档声明的元素绑定到一个名称空间上，以后XML文件就可以通过这个URI（即名称空间）来告诉解析引擎，xml文档中编写的元素来自哪里，被谁约束。

Schema案例

<?xmlversion="1.0"encoding="UTF-8"?>

<xs:schemaxmlns:xs="http://www.w3.org/2001/XMLSchema"

targetNamespace="http://www.itcast.cn"

elementFormDefault="qualified">

<xs:elementname='书架'>

<xs:complexType>

<xs:sequencemaxOccurs='unbounded'>

<xs:elementname='书'>

<xs:complexType>

<xs:sequence>

<xs:elementname='书名'type='xs:string'/>

<xs:elementname='作者'type='xs:string'/>

<xs:elementname='售价'type='xs:string'/>

</xs:sequence>

</xs:complexType>

</xs:element>

</xs:sequence>

</xs:complexType>

</xs:element>

</xs:schema>

------- android培训、java培训、期待与您交流！ ----------

原文链接：/xml/299820.html

黑马训练营 -----XML语法与DTD,Schema约束

XML约束

DTD语法约束细节

属性定义

实体定义

Schema约束

猜你在找的XML相关文章