前言
一直想系统性的学XML,就没时间学,今晚抽出几个小时时间学完了XML。过几天再过来看看,背一背应该就差不多,记得东西较多,没什么难理解的。
XML数据传输格式
第一章 XML概述
1.1 引入
当我们看到 XML 标准突飞猛进的开发进度,以及大批的软件开发商采用这个标准的日新月异的速度时,真的是不禁感叹这真是令人叹为观止。
目前,XML 在 Web 中起到的作用不会亚于一直作为 Web 基石的 HTML。
XML 无所不在。XML 是各种应用程序之间进行数据传输的最常用的工具,并且在信息存储和描述领域变得越来越流行。
XML的主要用途有哪些?
1.程序之间的数据传输通讯(可以是跨语言传输)2.配置文件config.xml
3.存储数据,充当小型数据库
优势:
规范数据格式,是数据具有结构性,易读易处理
1.2 什么是XML
XML 指可扩展标记语言(eXtensible Markup Language),被设计用来传输和存储数据;XML 需要自行定义标签,且标签名称具有自我描述性;XML 是 W3C 推荐的数据传输存放标准。
XML和HTML的区别?
1.html标签不能自定义,XML只能自定义标签。2.html语法要求不严格,xml对于语法的要求非常严格,标签必须是闭合的。
第二章 XML的基本语法
2.1 语法规则
1.XML 文档必须有根元素,根元素是所有其他元素的父元素。
2.XML声明语句是可选部分,如果存在需要放在文档的第一行
所谓的文档声明就是告诉解析器当前文档格式、版本号以及编码格式。
3.所有的 XML 元素都必须是成对闭合标签;非闭合标签是非法的,解析器将报错,不无正常解析.
5.XML标签不允许有交叉嵌套,也就是父子标签关系不能交叉嵌套。
6.XML标签名不要使用特殊字符,尽量只用数字字母下划线。
7.XML 中的注释与HTML中注释一个语法格式。
8.实体引用 & 特殊字符
在 XML 中,一些字符拥有特殊的意义,如果您把字符 "<" 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始
<age>46 < 100 </age>
这样会产生 XML 错误;
实体引用 | 实体字符 | 含义 |
---|---|---|
< | < | 小于-less than |
> | > | 大于-greater than |
& | & | 与--ampersand |
&apos | ' | 单引号-apostrophe |
" | " | 双引号-quotation mark |
2.2 元素属性
属性值一定要用引号(单引号或双引号)引起来元素中的属性是不允许重复的
属性也是用来存储数据信息的但实际开发经验是 在HTML中,属性用起来很便利,而在 XML 中,应该尽量避免使用属性,原因是
1.一个属性不能包含多个值(元素可以)2.属性值不能是结构化数据(元素可以)
3.属性不容易扩展(为未来的变化)
4.属性难以阅读和维护。
总结:将数据放在属性中和放在子元素中,目的都是为了传输数据,而子元素更加容易被解析,更好维护,更便于引用。
2.3 CDATA
要处理大量特殊字符时,不能再用实体引用来处理了(主要是太麻烦,工作量大)可以使用CDATA将数据包裹就可以按原格式输出。
格式:
<test><![CDATA[第一题题1:已知 c<4,d>5,问:c和d那个更好看? ]]> </test>
实体引用和CDATA的使用时机:
1.对于内容比较少的情况,可以使用实体引用对特殊字符进行直接替换操作。2.对于内容比较多的情况,建议采用CDATA区段。
第三章 使用PHP解析XML文档
在PHP5版本以后,其提供了一个非常非常强大的类库,SimpleXML类库,专门用于实现对XML文档的解析操作。PHP中使用这个类库来处理XML数据。
3.1 XML解析原理
XML在解析时一共要经历三个步骤:
- 读取XML文档到内存
2.形成DOM树结构(DOM树可以简单理解文档的父子结构)
3.生成SimpleXML对象
3.2 SimpleXML类库
语法:simplexml_load_file('test.xml');
<?xml version="1.0" encoding="UTF-8"?> <user> <man> <name>aklman</name> <age>20</age> <sex>男</sex> </man> <man sex="男"> <name>ak</name> <age>22</age> </man> </user>
$xml=simplexml_load_file('test.xml');//引入文件并读取 var_dump($xml);//输出,输出个格式就是一个对象
1.如果当前读取的节点是对象就通过->来进行访问;2.如果当前读取的节点是数组就通过[]来进行访问;
3.3 遍历XML数据
1.foreach循环遍历
$xml=simplexml_load_file('test.html); foreach($xml->man as $v){ echo 'Name:'.$v->name.'Age:'.$v->age.'<br>'; }
2.for循环遍历
$xml=simplexml_load_file('test.html); $length=count($xml); for($i=0;$i<$length;$i++){ echo $xml->man[$i]->name; }
读取节点的属性时XML属性要加到父节点,PHP才能解析
$xml=simplexml_load_file('test.xml'); echo $xml->man[1]->attributes()->sex; //attributes()方法是用来获取节点属性,//内存中节点属性存放在attributes中,它是一个以为数组,可以使用attributes()方法获取
3.4 使用SImpleXML增加节点
$xml=simplexml_load_file('test.html); $man= //创建添加子节点 $man = $xml->addChild('man'); //为节点添加属性 $man->addAttribute('sex','女'); //创建添加子节点及节点值 $man->addChild('name','aklman'); $man->addChild('age','23'); var_dump($xml);//打印,已经添加到内存 $xml->asXML('test1.xml');//保存数据进XML文件,没有文件,则创建;
3.5 案例
查询手机归属地案例,数据来源聚合网
<form action="03.5.PHP" method="get"> <input type="text" name="num"><br> <input type="submit" value="提交"> </form>
//接受前台提交的数据 $tel = $_GET['num']; //组装请求地址 $url = 'http://v.juhe.cn/telephone/index?telephoneNumber='.$tel.'&dtype=xml&format=&key=810c3b2c488bc37d5f521196d8799a7211';//地址已经打乱了,需要从聚合网购买 //发送请求并接受返回的数据 $s = file_get_contents($url); // echo $s; //打印返回的XML数据 //使用 simplexml_load_string 函数读入并解析XML数据 $xml = simplexml_load_string($s); //找到并打印我们想要的数据 echo '归属省:'.$xml->result->place->city111.'<hr>'; echo '归属城市:'.$xml->result->place->city.'<hr>';
第四章 Xpath语言
4.1 概述
XPath是一门在 XML 文档中查找信息的语言,XPath可用来在 XML 文档中对元素和属性进行遍历。
4.2 使用及语法
使用注意事项:
1.使用绝对路径实现数据查询
$xml = simplexml_load_file('user.xml'); //按节点的绝对路径查找 $data = $xml->xpath('/user/man/name');//返回数组 foreach($data as $v){ echo $v.'<hr>'; } /* *如果路径以斜线 / 开始,那么该路径就表示到一个元素的绝对路径, *绝对路径实现数据查询必须一级一级的查询下去,不能越级。 */
2.使用相对路径实现数据查询
$xml = simplexml_load_file('user.xml'); //按节点的相对路径查找 $data = $xml->xpath('//name');//返回数组 foreach($data as $v){ echo $v.'<hr>'; } /* *如果路径以双斜线 // 开头,则表示选择文档中所有满足双斜线//之后规则的元素(无论层级关系) */
3.使用*来匹配所有节点
$xml = simplexml_load_file('user.xml'); //匹配man节点下的所有元素节点。 $data = $xml->xpath('//man/*');//返回数组 foreach($data as $v){ echo $v.'<hr>'; }
4.使用[]方括号的形式来实现数据查询
$xml = simplexml_load_file('user.xml'); //匹配man节点下的最后一个节点。 $data = $xml->xpath('//man[last()]');//返回数组 var_dump($data); echo $data[0]->name; //man[1] : 获取第一个man元素 //man[last()]:获取最后一个man元素 //man[age > 200] :获取age>200的man节点 /* *方块号里的表达式可以进一步的指定元素,其中数字表示元素在选择集里的位置 *默认从1开始,而last()函数则表示选择集中的最后一个元素,括号内还可以放置表达式 */
5.使用属性来获取元素
$xml = simplexml_load_file('user.xml'); //匹配man节点下含有sex属性的节点。 $data = $xml->xpath('//man[@sex]');//返回数组 var_dump($data); echo $data[0]->name;