如何进行HTML到XML转换以生成封闭标签?

前端之家收集整理的这篇文章主要介绍了如何进行HTML到XML转换以生成封闭标签?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
如何进行xml到html转换以生成封闭标签.

这里解释了上下文:Error while generating pdf from Html file in Java using iText

当我尝试使用iText和XML Worker将html转换为pdf时,我被要求给出< hr>的结束标记.和< br>标签.如果我手动执行此操作:转换为pdf工作!但我不想手动添加每个结束标记.我该如何以自动方式完成此操作?

解决方法

您遇到此问题是因为您正在向iText的XML Worker提供HTML. XML Worker需要XML,因此您需要将HTML转换为XHTML.

有关如何在官方iText网站上执行此操作的示例:D00_XHTML

public static void tidyUp(String path) throws IOException {
    File html = new File(path);
    byte[] xhtml = Jsoup.parse(html,"US-ASCII").html().getBytes();
    File dir = new File("results/xml");
    dir.mkdirs();
    FileOutputStream fos = new FileOutputStream(new File(dir,html.getName()));
    fos.write(xhtml);
    fos.close();
}

在这个例子中,我们获得了一个普通HTML文件的路径(类似于你所拥有的).然后,我们使用Jsoup库将HTML解析为XHTML字节数组.在这个例子中,我们使用该字节数组将XHTML文件写入磁盘.您可以直接使用字节数组作为XML Worker的输入.

原文链接:https://www.f2er.com/html/232005.html

猜你在找的HTML相关文章