今天非常的郁闷,用xml做配置文件,出现了无法解析的问题。现把我的配置文件分享出来:
<webs> <web id="rzzl_chinazlxxw" url='http://chinarents.com/corp/company_search.PHP?page=1&firstid=1&twoid=10&threeid=169'> <urls> <url id="child_url"><![CDATA[(?isu)<div[^>]+bgLine[^>]+><a href="\.\.(\/shop\/about.*?contact)"\s+class[^>]+blackLink]]></url> </urls> <events> <event id="url" url="http://chinarents.com/corp/company_search.PHP?page=###&firstid=1&twoid=10&threeid=169" min="2" max="23"></event> </events> </web>
当解析xml的时候,说有特殊的字符,解析失败。我当时第一反应就是可能因为"&"而引起的。于是我打算用<![CDATA]]>来解决,无奈,这个"&" 是放在XMl的属性url中的。
我在网上搜索了一下,有热心的网友说可以用&代替,于是我把"&"替换成了"&",问题终于解决了,差点今天晚上没有办法睡觉啊。。
现在把HTML中常用的特殊字符表贴出来。
部份HTML转码
SYMBOL | CODE | ENTITY NAME |
---|---|---|
™ | ™ | |
€ | € | |
Space |   | |
! | ! | |
" | " | " |
# | # | |
$ | $ | |
% | % | |
& | & | & |
' | ' | |
( | ( | |
) | ) | |
* | * | |
+ | + | |
, | , | |
- | - | |
. | . | |
/ | / | |
0 | 0 | |
1 | 1 | |
2 | 2 | |
3 | 3 | |
4 | 4 | |
5 | 5 | |
6 | 6 | |
7 | 7 | |
8 | 8 | |
9 | 9 | |
: | : | |
[ | [ | |
\ | \ | |
] | ] | |
^ | ^ | |
_ | _ | |
` | ` | |
{ | { | |
| | | | |
} | } | |
~ | ~ | |
¡ | ¡ | ¡ |
¢ | ¢ | ¢ |
£ | £ | £ |
¤ | ¤ | ¤ |
¥ | ¥ | ¥ |
¦ | ¦ | ¦ |
§ | § | § |
¨ | ¨ | ¨ |
© | © | © |
ª | ª | ª |
« | « | |
¬ | ¬ | ¬ |
­ | ­ | |
® | ® | ® |
¯ | ¯ | ¯ |
° | ° | ° |
± | ± | ± |
² | ² | ² |
³ | ³ | ³ |
SYMBOL | CODE | ENTITY NAME |
---|---|---|
< | < | < |
= | = | |
> | > | > |
? | ? | |
@ | @ | |
A | A | |
B | B | |
C | C | |
D | D | |
E | E | |
F | F | |
G | G | |
H | H | |
I | I | |
J | J | |
K | K | |
L | L | |
M | M | |
N | N | |
O | O | |
P | P | |
Q | Q | |
R | R | |
S | S | |
T | T | |
U | U | |
V | V | |
W | W | |
X | X | |
Y | Y | |
Z | Z | |
a | a | |
b | b | |
c | c | |
d | d | |
e | e | |
f | f | |
g | g | |
h | h | |
i | i | |
j | j | |
k | k | |
l | l | |
m | m | |
n | n | |
o | o | |
p | p | |
q | q | |
r | r | |
s | s | |
t | t | |
u | u | |
v | v | |
w | w | |
x | x | |
y | y | |
z | z |