频道导航

xml 标准字符过滤

2020-05-28 XML 前端之家

前端之家收集整理的这篇文章主要介绍了xml 标准字符过滤，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

今天在代码里面看见一串很奇怪的判断语句

if (c < 0x9 || c > 0x9 && c < 0xA || c > 0xA && c < 0xD || c > 0xD && c
< 0x20 || c > 0xD7FF && c < 0xE000 || c > 0xFFFD)

于是用0xE000和0xFFFD 搜索了一下，发现原来xml还有这些限制。

根据xml spec

http://www.w3.org/TR/xml/#charsets

xml合法的字符范围是

[2] Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF]

然后有网上各种人遇到的问题

“因为字节数组中存在 Unicode: 0x0,而这个字节在Xml中被认为是非法字符。对于一些经过编码或加、解密的字符串中，很容易会出现这个 0x0，特别是在加、解密中，经常会涉及到字符填充，而填充物通常是 0x0，对于0x00-0x20都会引起一定的问题，又因为这些字符不可见，因此用通常的编辑器进行编辑的时候找不到问题所在。

xml中需要过滤的字符分为两类：

一类是不允许出现在xml中的字符，这些字符不在xml的定义范围之内；

另一类是xml自身要使用的字符，如果内容中有这些字符则需被替换成别的字符。

第一类字符：

　　对于第一类字符，我们可以通过W3C的XML文档来查看都有哪些字符不被允许出现在xml文档中。

　　XML允许的字符范围是“#x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF]”。因此我们可以把这个范围之外的字符过滤掉。

第二类字符：

　　对于第二类字符一共有5个，如下：

　　字符 HTML字符字符编码

　　和(and) & & &

　　单引号 ’ ' '

　　双引号 ” " "

　　大于号 > > >

　　小于号 < < <

“

还有

解决openfire中发送某些特殊字符会断开xmpp连接的问题

以及emoji问题http://blog.csdn.net/u014542833/article/details/22954893

这只能用一个非严格标准的xml解析器，或者用cdata包超出范围的字符了？

原文链接：https://www.f2er.com/xml/297676.html

上一篇：XML文件的写入和读取（解析）基于D 下一篇：xml中所有元素转化为map

猜你在找的XML相关文章

10分钟掌握XML、JSON及其解析

引言 NOKIA 有句著名的广告语：“科技以人为本”。任何技术都是为了满足人的生产生活需要而...

作者：前端之家时间：2020-08-12

[CXF REST标准实战系列] 一、JAXB xml与javaBean的转换

Writer：BYSocket（泥沙砖瓦浆木匠）微博：BYSocket 豆瓣：BYSocket Reprint it anywhere...

作者：前端之家时间：2020-08-12

[CXF REST标准实战系列] 一、JAXB xml与javaBean的转换

Writer：BYSocket（泥沙砖瓦浆木匠）微博：BYSocket 豆瓣：BYSocket Reprint it anywhere...

作者：前端之家时间：2020-08-12

10分钟掌握XML、JSON及其解析

http://blog.jobbole.com/79252/ 引言 NOKIA 有句著名的广告语：“科技以人为本”。任何技...

作者：前端之家时间：2020-08-12

自定义圆形控件RoundImageView并认识一下attr.xml

(点击上方公众号，可快速关注) 公众号：smart_android 作者：耿广龙｜loonggg 点击“阅读原...

作者：前端之家时间：2020-08-12

10分钟掌握XML、JSON及其解析

引言 NOKIA 有句著名的广告语：“科技以人为本”。任何技术都是为了满足人的生产生活需要而...

作者：前端之家时间：2020-08-12

10分钟掌握XML、JSON及其解析(上)

(点击上方公众号，可快速关注) 来源： Long Luo 的博客链接：http://longluo.github.i...

作者：前端之家时间：2020-08-12

10分钟掌握XML、JSON及其解析(中)

接上文二、JSON XML很好很强大，但是最近有另外一个时代弄潮儿，这就是JSON。现在JSON的光...

作者：前端之家时间：2020-08-12

10分钟掌握XML、JSON及其解析(下)

接上文 2.4 如何解析JSON？ Android JSON所有相关类，都在org.json包下。包括JSONObject、...

作者：前端之家时间：2020-08-12

10分钟掌握XML、JSON及其解析

原文出处： Long Luo 的博客（@Long_Luo）引言 NOKIA 有句著名的广告语：“科技以人...

作者：前端之家时间：2020-08-12

最新文章