XML文件解析器TXml

前端之家收集整理的这篇文章主要介绍了XML文件解析器TXml前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

前几天看了开源的XML文件解析器TinyXml,它是怎么实现解析的没怎么看懂,于是决定自己实现一个,反正最近不忙。先命名为TXml。现在完成了解析和查询功能,全部代码加起来不到1000行,将会继续完善它。源码必共享

先简单说一下我的思路:

1:读取XML文件信息,并存入一个字符数组中;

2:遍历数组,将数组解析成一棵树;

3:以路径的方式查询和按属性查询

这个解析器最麻烦的地方就在怎么将字符数组解析成一颗树。我们先看一下一个简单XML文件,他包括文件头、节点、节点名称及节点值、属性名称属性值,子节点、父节点、注释等。

  1. <?xml version="1.0" encoding="utf-8" ?>
  2. <!--注释-->
  3. <Items>
  4. <item name="chentaihan">89757</item>
  5. </Items>


简单介绍一下解析的实现,不太好说清楚,看代码可能更容易理解一些。递归实现,每次都从一个节点开始解析,就是从字符“<”开始,到字符“>”结束,字符<后面就是节点的名称,之后的就是节点属性,字符>后一个字符如果不是<,那就是节点的值,如果是字符<,可能是子节点也可能是这个节点结束了。遇到字符<开始递归,空格和注释直接被PASS。大致代码如下:

  1. const char* TXmlParser::ParseContent(const char* p,XmlNode* baseNode)
  2. {
  3. if(p==NULL || !*p)
  4. return NULL;
  5. if(*p=='<')//开始一个节点
  6. {
  7. bool isNote;
  8. p=SkipNote(p,isNote);//跳过注释
  9. if(isNote) {//是注释
  10. ParseContent(p,baseNode);
  11. return NULL;
  12. }
  13. if(*p=='/')//结束节点
  14. {
  15. while(p!=NULL && *p && *p!='>')
  16. {
  17. p++;
  18. }
  19. ++p=SkipWhiteSpace(p);
  20. ParseContent(p,baseNode->parent);//新节点
  21. }else{ //节点属性
  22. string name;
  23. while(p!=NULL && *p && *p!='>' && *p!=' ' && *p!='/')
  24. {
  25. name.push_back(*p++);
  26. }
  27. XmlNode* node=new XmlNode(name,baseNode);
  28. baseNode->AppendNode(node);
  29.  
  30. if(*p=='>')
  31. {
  32. ++p=SkipWhiteSpace(p);
  33. ParseContent(p,node);//新节点
  34. }else{
  35. p=GetAttr(p,node);
  36. if(*p=='/')
  37. {
  38. while(p!=NULL && *p && *p!='<')
  39. p++;
  40. ParseContent(p,baseNode);//新节点
  41. }else{
  42. ++p=SkipWhiteSpace(p);
  43. ParseContent(p,node);//新节点
  44. }
  45. }
  46. }
  47. }else{//节点的值
  48. GetNodeValue(p,baseNode);
  49. }
  50. }


按路径的方式查询。利用两个数组实现,假设这两个数组分别为A,B;第一次查询将结果存入数组A,将A作为数据源,将查询结果存入B,清除A中的数据,将B作为数据源,将查询结果存入A,反复进行,最后A,B中有一个就是查询结果。当然也可以用递归实现,我们都知道递归太深容易爆线程栈,且性能低。

属性查询。同样没有用递归实现,有个经常出现的面试题:按层序打印一个棵树。那么这里也是按层序查找,就是利用一个队列,按根节点、根节点的直接子节点进栈,一个个匹配,不匹配就出队列。

  1. //根据属性查询--利用队列按层序查询
  2. XmlNode* XmlNode::SelectSingleNodeByAttr(const string& attrName,const string& attrValue,XmlNode* node)
  3. {
  4. if(node==NULL)
  5. return NULL;
  6. if(node->attribute!=NULL && (*node->attribute)[attrName]==attrValue)
  7. {
  8. return node;
  9. }
  10. queue<XmlNode*> list;
  11. for(int i=node->ChildCount()-1;i>=0;i--)
  12. {
  13. list.push((*node->childNodes)[i]);
  14. }
  15.  
  16. while(list.size()>0)
  17. {
  18. XmlNode* tmpNode=list.front();
  19. if(tmpNode->attribute!=NULL && (*tmpNode->attribute)[attrName]==attrValue)
  20. {
  21. return tmpNode;
  22. }
  23. for(int i=tmpNode->ChildCount()-1;i>=0;i--)
  24. {
  25. list.push((*tmpNode->childNodes)[i]);
  26. }
  27. list.pop();
  28. }
  29. return NULL;
  30. }


看了按属性查找,我们就很容易知道,C#中ConfigurationManager读取配置文件的大致实现,因为配置文件很简单,就是一个节点下面有多个节点,完全可以这样实现,根节点基本可以无视,直接就是一个字典,KEY存key的值,VALUE存value的值,查找的时间复杂度就是O(1)。

简单测试:

  1. #include "XmlDocument.h"
  2. int main()
  3. {
  4. {
  5. XmlDocument doc;
  6. doc.Load("test.txt");
  7. cout<<"XML头部:"<<doc.Head().c_str()<<endl;
  8. cout<<"显示全部学生成绩:" ;
  9. doc.ShowXML(doc);
  10. cout<<endl;
  11. vector<XmlNode*> vect;
  12. doc.SelectNodes("students/student/courses/course",vect);
  13. XmlNode* node=doc.SelectSingleNode("students/Student/courses/course/Course");
  14.  
  15. if(node!=NULL)
  16. {
  17. node->ShowXML(*node);
  18. cout<<"name:"<<node->Name().c_str()<<endl;
  19. cout<<"属性:";
  20. node->ShowAttr() ;
  21. cout<<endl;
  22. cout<<"value:"<<node->Value().c_str()<<endl;
  23. cout<<"ChildCount:"<<node->ChildCount()<<endl<<endl;
  24. XmlNode::Iterator iter=node->begin();
  25. while(iter!=node->end())
  26. {
  27. cout<<"name:"<<(*((iter)._Ptr))->Name().c_str() <<endl;
  28. cout<<"value:"<<(*((iter)._Ptr))->Value().c_str() <<endl;
  29. iter++;
  30. }
  31. }
  32. cout<<"查找name=‘英文’的节点:"<<endl;
  33. XmlNode* node2=doc.SelectSingleNodeByAttr("name","英文");
  34. if(node2!=NULL){
  35. node2->ShowXML(*node2);
  36. }
  37. }
  38. system("pause");
  39. return 0;
  40. }


未完...待续...功能将会更加丰富,我们都值得期待!

我的博客目录

猜你在找的XML相关文章