溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

詳解Java生成PDF文檔方法

發(fā)布時間:2020-09-03 00:15:06 來源:腳本之家 閱讀:190 作者:brandonbai 欄目:編程語言

最近項目需要實現(xiàn)PDF下載的功能,由于沒有這方面的經(jīng)驗,從網(wǎng)上花了很長時間才找到相關的資料。整理之后,發(fā)現(xiàn)有如下幾個框架可以實現(xiàn)這個功能。

1. 開源框架支持

  1. iText,生成PDF文檔,還支持將XML、Html文件轉化為PDF文件;
  2. Apache PDFBox,生成、合并PDF文檔;
  3. docx4j,生成docx、pptx、xlsx文檔,支持轉換為PDF格式。

比較:

  1. iText開源協(xié)議為AGPL,而其他兩個框架協(xié)議均為Apache License v2.0。
  2. 使用PDFBox生成PDF就像畫圖似的,文字和圖像根據(jù)頁面坐標畫上去的,需要根據(jù)字數(shù)手動換行。
  3. docx4j用來生成docx文檔,提供了將WORD文檔轉換為PDF文檔的功能,并不能直接生成PDF文檔。

 2. 實現(xiàn)方案

格式復雜 格式簡單
數(shù)據(jù)量大 docx4j+freemarker docx4j或PDFBox
數(shù)據(jù)量小 docx4j PDFBox

2.1 純數(shù)據(jù)生成PDF

1.docx4j,適用于生成格式簡單或格式復雜且數(shù)據(jù)量小的PDF文檔; 2.Apache PDFBox,適用于生成格式簡單且數(shù)據(jù)量小的PDF文檔。

1.docx4j
docx4j是一個開源Java庫,用于創(chuàng)建和操作Microsoft Open XML(Word docx,Powerpoint pptx和Excel xlsx)文件。它類似于Microsoft的OpenXML SDK,但適用于Java。docx4j使用JAXB來創(chuàng)建內(nèi)存中的對象表示,程序員需要花時間了解JAXB和Open XML文件結構 。

// word對象
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage();
// 文檔主體
MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();
// 換行符
Br br = objectFactory.createBr();
// 段落
P p = objectFactory.createP();
// 段落設置
PPr ppr = objectFactory.createPPr();
// 文字位置
Jc jc = new Jc();
jc.setVal(je);
ppr.setJc(jc);
// 行設置
RPr rpr = objectFactory.createRPr();
// 字體設置
RFonts rFonts = objectFactory.createRFonts();
rFonts.setAscii("Times New Roman");
rFonts.setEastAsia("宋體");
rpr.setRFonts(rFonts);
// 行
R r = objectFactory.createR();
// 文本
Text text = objectFactory.createText();
text.setValue("這是一段普通文本");
r.setRPr(rpr);
r.getContent().add(br);
r.getContent().add(text);
p.getContent().add(r);
p.setPPr(ppr);
// 添加到正文中
mainDocumentPart.addObject(p);
// 導出
//..

2.Apache PDFBox Apache PDFBox是處理PDF文檔的一個開源的Java工具。該項目允許創(chuàng)建新的PDF文檔,處理現(xiàn)有文檔以及從文檔中提取內(nèi)容的功能。Apache PDFBox還包括幾個命令行實用程序。

String formTemplate = "/Users/xiaoming/Desktop/test_pdfbox.pdf";
// 定義文檔對象
PDDocument document = new PDDocument();
// 定義一頁,大小A4
PDPage page = new PDPage(PDRectangle.A4);
document.addPage(page);
// 獲取字體
PDType0Font font = PDType0Font.load(document, new File("/Users/xiaoming/work/tmp/simsun.ttf"));
// 定義頁面內(nèi)容流
PDPageContentStream stream = new PDPageContentStream(document, page);
// 設置字體及文字大小
stream.setFont(font, 12);
// 設置畫筆顏色
stream.setNonStrokingColor(Color.BLACK);
// 添加矩形
stream.addRect(29, 797, 100, 14);
// 填充矩形
stream.fill();
stream.setNonStrokingColor(Color.BLACK);
// 文本填充開始
stream.beginText();
// 設置行距
stream.setLeading(18f);
// 設置文字位置
stream.newLineAtOffset(30, 800);
// 填充文字
stream.showText("呵呵");
// 換行
stream.newLine();
stream.showText("哈哈");
stream.newLine();
stream.showText("嘻嘻");
// 文本填充結束
stream.endText();
// 關閉流
stream.close();
// 保存
document.save(formTemplate);
// 釋放資源
document.close();

2.2 模版+數(shù)據(jù)生成PDF

FreeMarker+docx4j,適用于生成格式復雜且數(shù)據(jù)量大的PDF文檔

Apache FreeMarker是一個模板引擎,用于根據(jù)模板和更改數(shù)據(jù)生成文本輸出(HTML網(wǎng)頁,電子郵件,配置文件,源代碼等)。模板是用FreeMarker模板語言(FTL)編寫的,是一種簡單的專用語言。
Office2003以上,Word是可以以XML文本格式存儲的。先將要生成的PDF轉換為Word文檔 ,再將其保存為XML文本,通過模版引擎將數(shù)據(jù)填充到XML文本中,最后再反向轉換為PDF文檔。簡單來說就是PDF->Word->XML->Word->PDF的流程。

步驟 描述 工具
1 word -> xml 手動
2 xml -> ftl 手動,參考《XML格式Word文檔常用標簽介紹》
3 ftl + obj = xml freemarker
4 xml -> pdf docx4j

步驟

1 把pdf文檔對應的word(docx)制作出來

詳解Java生成PDF文檔方法

2 把word文檔另存為xml文件

 詳解Java生成PDF文檔方法

3 將xml文件制作為freemarker模版(ftl)文件

詳解Java生成PDF文檔方法

 4 將數(shù)據(jù)和ftl文件組裝為xml文本

Map<String, Object> map = new HashMap<>();
map.put("name", "小明");
map.put("address", "北京市朝陽區(qū)");
map.put("email", "xiaoming@abc.com");
StringWriter stringWriter = new StringWriter();
BufferedWriter writer = new BufferedWriter(stringWriter);
template.process(map, writer);
String xmlStr = stringWriter.toString();

5 使用docx4j將xml文本加載為word文檔對象

ByteArrayInputStream in = new ByteArrayInputStream(xmlStr.getBytes());
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(in);

6 使用docx4j將word文檔轉存為pdf文檔

String outputfilepath = "/Users/xiaoming/簡歷.pdf";
FileOutputStream os = new FileOutputStream(new File(outputFilePath));
FOSettings foSettings = Docx4J.createFOSettings();
foSettings.setWmlPackage(wordMLPackage);
Docx4J.toFO(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL);
// Docx4J.toPDF(wordMLPackage, new FileOutputStream(new File(outputfilepath)));

2.3 Word轉PDF

docx4j

WordprocessingMLPackage mlPackage = WordprocessingMLPackage.load(new File("abc.docx"));
Mapper fontMapper = new IdentityPlusMapper(); 
// fontMapper.put("華文行楷", PhysicalFonts.get("STXingkai")); 
mlPackage.setFontMapper(fontMapper); 
OutputStream os = new java.io.FileOutputStream("abc.pdf");  
FOSettings foSettings = Docx4J.createFOSettings(); 
foSettings.setWmlPackage(mlPackage); 
Docx4J.toFO(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL); 

2.4 合并多個PDF

Apache PDFBox,將多個PDF文檔合并

String folderName = "/Users/xiaoming/pdfs";
String destPath = "/Users/xiaoming/all.pdf";
PDFMergerUtility mergePdf = new PDFMergerUtility();
String[] filesInFolder = getFiles(folderName);
Arrays.sort(filesInFolder, new Comparator<String>() {
   @Override
   public int compare(String o1, String o2) {
     return o1.compareTo(o2);
   }
});
for (int i = 0; i < filesInFolder.length; i++) {
   mergePdf.addSource(folderName + File.separator + filesInFolder[i]);
}
mergePdf.setDestinationFileName(destPath);
mergePdf.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());

示例代碼

github.com/brandonbai/…

以上所述是小編給大家介紹的Java生成PDF文檔方法詳解整合,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對億速云網(wǎng)站的支持!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI