我正在使用一个名为Jsoup的HTML解析器来加载和解析HTML文件.问题是我正在抓取的网页是用ISO-8859-1字符集编码的,而Android使用的是UTF-8编码(?).这导致一些字符显示为问号.
所以现在我想我应该将字符串转换为UTF-8格式.
现在我在Android SDK中找到了这个名为CharsetEncoder的类,我想这可以帮助我.但我无法弄清楚如何在实践中实现它,所以我想知道是否可以通过一个实际的例子得到som的帮助.
url = new URL("http://www.example.com");
Document doc = Jsoup.parse(url,4000);
最佳答案
您可以让Android为您完成工作,方法是将页面读入byte [],然后使用jSoup方法解析String对象.
当您使用正确的String constructor从服务器读取的数据创建字符串时,请不要忘记指定编码.