我正在读一个包含德语,法语,西班牙语,英语和波兰文的xml文件.
为了处理抛光字母(这导致最麻烦)我试图这样做:
File file = new File(path); InputStream is = new FileInputStream(file); Reader reader = new InputStreamReader(is,charset); InputSource src = new InputSource(reader); src.setEncoding(charset.name()); SAXParserFactory factory = SAXParserFactory.newInstance(); SAXParser saxParser = factory.newSAXParser(); saxParser.parse(src,handler);
我遇到的问题是没有任何默认的字符集正确显示文本.一些有问号,其中一些有其他字符的组合,例如AO ..
为了打破它,我写了另一个片段来测试哪个charset工作:
public static void main(String[] args){ Charset charset = StandardCharsets.UTF_8; String chars = "śłuna długie"; System.out.println(new String(chars.getBytes(charset),charset)); }
再次测试每一个但没有任何作用..
我希望你有个主意.