您好,登錄后才能下訂單哦!
本文實(shí)例為大家分享了java將pdf轉(zhuǎn)換image的具體代碼,供大家參考,具體內(nèi)容如下
首先使用了使用了apache的PDFBox組件1.8.4版本
package pdf; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import java.util.Date; import java.util.List; import javax.imageio.ImageIO; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.pdmodel.PDPage; public class PDFBox { @SuppressWarnings("rawtypes") public static void main(String[] args) throws IOException { String p=System.getProperty("user.dir") + "/"+"zk.pdf"; PDDocument doc = PDDocument.load(p); int pageCount = doc.getNumberOfPages(); System.out.println(pageCount); Date start = new Date(); try { List pages = doc.getDocumentCatalog().getAllPages(); for(int i=0;i<pages.size();i++){ PDPage page = (PDPage) pages.get(i); @SuppressWarnings("unused") int width = new Float(page.getTrimBox().getWidth()).intValue(); @SuppressWarnings("unused") int height = new Float(page.getTrimBox().getHeight()).intValue(); BufferedImage image = page.convertToImage(); ImageIO.write(image, "jpg", new File("img" + File.separator + (i + 1) + ".jpg")); System.out.println("image in the page -->"+(i+1)); } } catch (Exception e) { e.printStackTrace(); }finally{ if(doc != null){ doc.close(); } } Date end = new Date(); System.out.println(end.getTime()-start.getTime()); System.out.println("over"); } }
但是其問題在于問題:
當(dāng)PDF文檔為180M大小時(shí)直接報(bào)解析異常
當(dāng)PDF頁數(shù)為500多頁時(shí)處理非常慢
其后嘗試使用了pdf-renderer 1.0.5 版本
package pdf; import java.awt.Image; import java.awt.Rectangle; import java.awt.image.BufferedImage; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.RandomAccessFile; import java.nio.MappedByteBuffer; import java.nio.channels.FileChannel; import com.sun.image.codec.jpeg.JPEGCodec; import com.sun.image.codec.jpeg.JPEGEncodeParam; import com.sun.image.codec.jpeg.JPEGImageEncoder; import com.sun.pdfview.PDFFile; import com.sun.pdfview.PDFPage; public class PDFRenderer { public static void main(String[] args) throws IOException{ String pdfRealePath=System.getProperty("user.dir") + "/"+"zk.pdf"; File file = new File(pdfRealePath); RandomAccessFile raf = new RandomAccessFile(file, "r"); FileChannel channel = raf.getChannel(); MappedByteBuffer buf = channel.map(FileChannel.MapMode.READ_ONLY, 0, channel.size()); PDFFile pdffile = new PDFFile(buf); for (int i = 1; i <= pdffile.getNumPages(); i++) { PDFPage page = pdffile.getPage(i); Rectangle rect = new Rectangle(0, 0, ((int) page.getBBox() .getWidth()), ((int) page.getBBox().getHeight())); Image img = page.getImage(rect.width, rect.height, rect, null,true,true); BufferedImage tag = new BufferedImage(rect.width, rect.height, BufferedImage.TYPE_INT_RGB); tag.getGraphics().drawImage(img, 0, 0, rect.width, rect.height,null); FileOutputStream out = new FileOutputStream("img" + File.separator + (i + 1) + ".jpg"); // 輸出到文件流 JPEGImageEncoder encoder = JPEGCodec.createJPEGEncoder(out); JPEGEncodeParam param2 = encoder.getDefaultJPEGEncodeParam(tag); param2.setQuality(1f, false);// 1f是提高生成的圖片質(zhì)量 encoder.setJPEGEncodeParam(param2); encoder.encode(tag); // JPEG編碼 out.close(); System.out.println("image in the page -->"+(i+1)); } } }
但是其問題在于問題: 當(dāng)pdf的版本不為1.4時(shí),直接報(bào)錯(cuò):Expected 'xref' at start of table
pdfbox與pdfrenderer相比較來說,轉(zhuǎn)換的效率要低得多。200頁左右的pdf花費(fèi)的時(shí)間是后者的6倍左右。同時(shí),對(duì)于中文字體的支持存在些問題。
但是對(duì)于卻不存在pdf版本不同無法轉(zhuǎn)換的問題。
pdfrenderer 不能轉(zhuǎn)換1.4以上版本,查找了解決辦法但是沒有找到。
以上就是本文的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。