使用JAVA中的Apache POI和iText从Word(DOC)创建PDF

前端之家收集整理的这篇文章主要介绍了使用JAVA中的Apache POI和iText从Word(DOC)创建PDF前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我试图从* .doc文档生成PDF文档.
直到现在,由于stackoverflow,我已成功生成它但有一些问题.

我的下面的示例代码生成的pdf没有格式和图像,只有文本.
该文档包括未包含在PDF中的空格和图像.

这是代码

  1. in = new FileInputStream(sourceFile.getAbsolutePath());
  2. out = new FileOutputStream(outputFile);
  3.  
  4. WordExtractor wd = new WordExtractor(in);
  5.  
  6. String text = wd.getText();
  7.  
  8. Document pdf= new Document(PageSize.A4);
  9.  
  10. PdfWriter.getInstance(pdf,out);
  11.  
  12. pdf.open();
  13. pdf.add(new Paragraph(text));

解决方法

docx4j包含 code,用于使用iText从docx创建PDF.它还可以使用POI将doc转换为docx.

曾经有一段时间我们平等地支持这两种方法(以及通过XHTML的PDF),但我们决定专注于XSL-FO.

如果它是一个选项,你最好使用docx4j通过XSL-FO和FOP将docx转换为PDF.

像这样使用它:

  1. wordMLPackage = WordprocessingMLPackage.load(new java.io.File(inputfilepath));
  2.  
  3. // Set up font mapper
  4. Mapper fontMapper = new IdentityPlusMapper();
  5. wordMLPackage.setFontMapper(fontMapper);
  6.  
  7. // Example of mapping missing font Algerian to installed font Comic Sans MS
  8. PhysicalFont font
  9. = PhysicalFonts.getPhysicalFonts().get("Comic Sans MS");
  10. fontMapper.getFontMappings().put("Algerian",font);
  11.  
  12. org.docx4j.convert.out.pdf.PdfConversion c
  13. = new org.docx4j.convert.out.pdf.viaXSLFO.Conversion(wordMLPackage);
  14. // = new org.docx4j.convert.out.pdf.viaIText.Conversion(wordMLPackage);
  15.  
  16. OutputStream os = new java.io.FileOutputStream(inputfilepath + ".pdf");
  17. c.output(os);

2016年7月更新

从docx4j 3.3.0开始,Plutext的商业PDF渲染器是docx4j的docx到PDF转换的默认选项.您可以在converter-eval.plutext.com尝试在线演示

如果要使用现有的docx到XSL-FO到PDF(或Apache FOP支持的其他目标)方法,那么只需将docx4j-export-FO jar添加到类路径中.

无论哪种方式,要将docx转换为PDF,您都可以使用Docx4J facade的toPDF方法.

通过iText代码的旧docx到PDF可以在https://github.com/plutext/docx4j-export-FO/…/docx4j-extras/PdfViaIText/找到

猜你在找的Java相关文章