XML无效字符相信用过Xml组件的人大部分都遇到过,不知道在什么时候就会出现一个 Bad character 0x0B 的错误,通过我的不断努力,终于找到一个基本上可以排除所有Xml 无效字符的方法。至今还没有遇到过新的无效字符,而且中文字符也都可以保留。
以下为C#代码
//过滤方法
public static string FilterXmlErrorCode(string xml)
{
foreach (char c in xml)
{
if (!IsLegalXmlChar(c))
{
xml = xml.Replace(c.ToString(),"");
}
}
return xml;
}
//xml 无效字符检查
private static bool IsLegalXmlChar(int character)
{
return
(
character == 0x9 /* == '/t' == 9 */ ||
character == 0xA /* == '/n' == 10 */ ||
character == 0xD /* == '/r' == 13 */ ||
(character >= 0x20 && character <= 0xD7FF) ||
(character >= 0xE000 && character <= 0xFFFD) ||
(character >= 0x10000 && character <= 0x10FFFF)
);
}
string example = "xxxxx";
example = FilterXmlErrorCode(example);
当然,这个方法会占用一些资源,尤其是字符串非常长的时候。如果可以catch到xml报错,也可以在catch住以后再进行过滤。