找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 1146|回复: 4

[分享] TinyXML基础知识(包含类的说明)

[复制链接]

已领礼包: 145个

财富等级: 日进斗金

发表于 2014-10-6 08:29:53 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
一、      TinyXml的特点
TinyXml是一个基于DOM模型的、非验证的轻量级C++解释器。
1.      SAXDOM
目前XML的解析主要有两大模型:SAX和DOM。
其中SAX是基于事件的,其基本工作流程是分析XML文档,当发现了一个新的元素时,产生一个对应事件,并调用相应的用户处理函数。这种方式占用内存少,速度快,但用户程序相应得会比较复杂。
而DOM(文档对象模型),则是在分析时,一次性的将整个XML文档进行分析,并在内存中形成对应的树结构,同时,向用户提供一系列的接口来访问和编辑该树结构。这种方式占用内存大,速度往往慢于SAX,但可以给用户提供一个面向对象的访问接口,对用户更为友好。
另据说,一些同时提供了SAX和DOM接口的库,是在底层先实现SAX,再在SAX的基础上实现DOM。

目前我知道的XML解析库有下面几个:

名称
访问接口
是否支持验证
备注
Expat
SAX/Local
不清楚
Local指它还有一套自己访问模型
LibXML2
SAX/DOM


TinyXml
DOM


XML4C
SAX/DOM
Xerces-C是一家,不过用了ICU,国际化似乎更好
Xerces-C
SAX/DOM


XML Booster
Local
不清楚
这个库不是特别了解,好像是类似yacc那样,可以生成一个特定的解析器,估计效率应该很高(看名字也像)。


2.      验证和非验证
对于一个特定的XML文档而言,其正确性分为两个层次。首先是其格式应该符合XML的基本格式要求,比如第一行要有声明,标签的嵌套层次必须前后一致等等,符合这些要求的文件,就是一个合格的XML文件,称作well-formatted。但除此之外,一个XML文档因其内容的不同还必须在语义上符合相应的标准,这些标准由相应的DTD文件或者Schema文件来定义,符合了这些定义要求的XML文件,称作valid。
因此,解析器也分为两种,一种是验证的,即会跟据XML文件中的声明,用相应的DTD文件对XML文件进行校验,检查它是否满足DTD文件的要求。另一种是忽略DTD文件,只要基本格式正确,就可以进行解析。
就我所知,验证的解析器通常都是比较重量级的。TinyXml不支持验证,但是体积很小,用在解析格式较为简单的XML文件,比如配置文件时,特别的合适。


二、      TinyXml的构建和使用

1.      获取
TinyXml首页在http://www.grinninglizard.com/tinyxml/index.html,从这里可以找到最新版本的源代码,目前的版本是2.3.4。

2.      构建
TinyXml在构建时可以选择是否支持STL,选择的话,则可以使用std::string,所以通常应该打开这个选项。
在Windows上,TinyXml的源码包里提供了VC6的工程文件,直接用它就可以生成两个静态库(带STL和不带STL),非常容易。唯一需要注意的是,默认生成的库是单线程的,如果用在多线程的项目中,需要改动一下配置,生成相应的多线程库。
在Unix平台上,TinyXml的源码包里只提供了一个Makefile,对于典型的Linux系统,或装了gcc和gmake的其他Unix,这个Makefile足够用了,我在RH9和RHEL4上测试,简单的make就成功了。需要注意的有以下几点:默认的编译是不支持STL的,可以通过编辑Makefile的TINYXML_USE_STL := NO那一行,把NO改成YES就可以支持STL了;还有默认只生成了一个测试程序,没有生成任何库,如果要生成静态库的话,可以用ar命令,将生成的几个目标文件打包就行了,如果要生成动态库,则需要加上-fpic参数重新编译。

3.      使用
构建了相应的库之后,在使用了它们的工程中,只要在连接时把他们连上就行了。需要注意的是,如果需要STL支持,在编译用到了TinyXml的文件时,需要定义一个宏TIXML_USE_STL,对gcc,可以使用参数-DTIXML_USE_STL,对cl.exe(VC),可以使用参数/DTIXML_USE_STL,如果嫌麻烦,可以直接定义在 tinyxml.h文件里。


三、      TinyXml的编程模型

1.      类之间的关系
TinyXml实现的时DOM访问模型,因此提供了一系列的类对应XML文件中的各个节点。主要类间的关系如下图所示:
TiXmlBase:其他类的基类,是个抽象类
TiXmlNode:表示一个节点,包含节点的一般方法,如访问自节点、兄弟节点、编辑自身、编辑子节电
TiXmlDocument:表示整个XML文档,不对应其中某个特定的节点。
TiXmlElement:表示元素节点,可以包含子节点和TiXmlAttribute
TiXmlComment:表示注释
TiXmlDeclaration:表示声明
TiXmlText:表示文本节点
TiXmlUnknown:表示未知节点,通常是出错了
TiXmlAttribute:表示一个元素的属性
下面是一个简单的例子:
<?xml version="1.0" encoding="utf-8" ?>
<!-This is only a sample-->
<book>
       <name>TinyXml How To</name>
       <price unit=”RMB”>20</price>
       <description>Some words…</description>
</ book >
整个文档,对应TiXmlDocument
book,name,price, description,都对应TiXmlElement
第一行对应一个TiXmlDeclaration
第二行对应一个TiXmlComment
“TinyXml How To”对应一个TiXmlText
unit则是price的一个TiXmlAttribute
这些类与XML文件中的相应元素都有很好的对应关系,因此相信参照TinyXml的文档,可以很容易的掌握各个方法的使用。


2.      需要注意的问题

各类之间的转换
由于各个节点类都从TiXmlNode继承,在使用时常常需要将TiXmlNode*类型的指针转换为其派生类的指针,在进行这种转换时,应该首先使用由TiXmlNode类提供的一系列转换函数,如ToElement(void),而不是c++的dynamic_cast


检查返回值
由于TinyXml是一个非校验的解析器,因此当解析一个文件时,很可能文件并不包含我们预期的某个节点,在这种情况下,TinyXml将返回空指针。因此,必须要对返回值进行检查,否则将很容易出现内存访问的错误。


如何重头建立一个XML文件
先建立一个TiXmlDocument对象,然后,载入某个模板,或者直接插入一个节点作为根节点,接着就可以像打开一个已有的XML文件那样对它进行操作了。


四、      总结

TinyXml最大的特点就是它很小,可以很方便的静态连接到程序里。对于像配置文件、简单的数据文件这类文件的解析,它很适合。但是由于它是非验证的,因此需要在程序里做许多检查工做,加重了程序编写的负担。因此对于复杂的XML文件,我觉得最好还是用验证的解析器来处理。

论坛插件加载方法
发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;
如果你在论坛求助问题,并且已经从坛友或者管理的回复中解决了问题,请把帖子标题加上【已解决】;
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【D豆】,加分不会扣除自己的积分,做一个热心并受欢迎的人!

已领礼包: 145个

财富等级: 日进斗金

 楼主| 发表于 2014-10-6 08:31:17 | 显示全部楼层
使用的是开源代码。事实上TinyXml不支持Unicode
       从以下几点说明:
1.  TinyXml的开源代码并不支持Unicode编码格式,而是多字节编码。
2.  TinyXml不能解析Unicode格式的文件。加载失败。
3.  TinyXml另外一种方式是直接解析字符串。但由于Parse函数的参数是char*,所以不能将Unicode格式的字符串传给它,需要先将宽字符转成多字节,然后再传递给Parse函数。而TinyXml解析出来的字符串也是多字节的,所以并不支持多国语言。需要将解析出来的字符串再转换成UTF8或者Unicode等宽字符编码格式。
4.  虽然TinyXml源码是多字节编码,但是它可以解析UTF-8格式的XML文件,因为UTF-8使用可变长度字节来存储Unicode字符,属于多字节的格式。而UTF8也支持多国语言。

论坛插件加载方法
发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;
如果你在论坛求助问题,并且已经从坛友或者管理的回复中解决了问题,请把帖子标题加上【已解决】;
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【D豆】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 支持 反对

使用道具 举报

已领礼包: 145个

财富等级: 日进斗金

 楼主| 发表于 2014-10-6 08:31:55 | 显示全部楼层
删除节点用RemoveChild();
例如:
<day>10</day>
有天数的节点,值为10天,要将值删除,代码如下:
       TiXmlDocument tiDoc;
       tiDoc.LoadFile( XML文件名或路径 );
      
       //initialize root node
       TiXmlNode * node = NULL;
       node = tiDoc.FirstChild( "day" );
       //find day node
TiXmlElement* daysElement = NULL;
       daysElement = node->ToElement();
       //替换
node = daysElement->FirstChild();
daysElement->RemoveChild(node);
tiDoc.SaveFile(); //记得要保存哦

论坛插件加载方法
发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;
如果你在论坛求助问题,并且已经从坛友或者管理的回复中解决了问题,请把帖子标题加上【已解决】;
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【D豆】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 支持 反对

使用道具 举报

已领礼包: 145个

财富等级: 日进斗金

 楼主| 发表于 2014-10-6 08:32:30 | 显示全部楼层
TinyXML中,好像没有类似于SetText的函数来修改文本值,有一种方法可以修改文本值,利用ReplaceChild
例如:
<day>10</day>
有天数的节点,值为10天,要将它修改成20天,代码如下:
       TiXmlDocument tiDoc;
       tiDoc.LoadFile( XML文件名或路径 );
      
       //initialize root node
       TiXmlNode * node = NULL;
       node = tiDoc.FirstChild( "day" );
       //find day node
TiXmlElement* daysElement = NULL;
       daysElement = node->ToElement();
       //替换
node = daysElement->FirstChild();
TiXmlText newText(“20”);
daysElement->ReplaceChild( node, newText );
tiDoc.SaveFile(); //记得要保存哦

论坛插件加载方法
发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;
如果你在论坛求助问题,并且已经从坛友或者管理的回复中解决了问题,请把帖子标题加上【已解决】;
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【D豆】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 支持 反对

使用道具 举报

已领礼包: 145个

财富等级: 日进斗金

 楼主| 发表于 2014-10-6 08:32:57 | 显示全部楼层
本来认为在tinyXML中,用FirstChild("名字")查找节点时,可以从如果调用FirstChild函数的节点不是要查找节点的父节点,也可以查找到(类似于数据结构中的深度优先遍历)。
  但后来经程序测试发现,这样是找不到的,所以调用FirstChild函数的节点与要查找的节点必须成“父子关系”。
  如果FirstChild不带参数,则获取的时第一个子节点。

论坛插件加载方法
发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;
如果你在论坛求助问题,并且已经从坛友或者管理的回复中解决了问题,请把帖子标题加上【已解决】;
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【D豆】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|申请友链|Archiver|手机版|小黑屋|辽公网安备|晓东CAD家园 ( 辽ICP备15016793号 )

GMT+8, 2024-5-12 04:49 , Processed in 0.181206 second(s), 35 queries , Gzip On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表