您尝试什么测试文本并输入到Web表单中以检查它们是否正确处理所有边缘情况(尤其是Unicode和XSS样式问题).
我对Unicode字符串特别感兴趣,如果在再次显示时,它们会被错误编码,那么这些字符串可能会有些奇怪.
包含潜在问题字符的文字,如引号,<>等等也很有趣.
解决方法
您对HTML敏感字符的想法是一个好的开始.我也喜欢使用那些可读的字符,但仍然是Unicode.当我对tabblo.com进行这种测试时,我使用了这个字符串:
Testing «ταБЬℓσ»: 1<2 & 4+1>3,now 20% off!
这具有HTML敏感字符,ASCII,上半身ISO字符和多字节Unicode字符.