您好,登錄后才能下訂單哦!
利用Java怎么對(duì)PDF中的文本與圖片進(jìn)行讀取?針對(duì)這個(gè)問(wèn)題,這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問(wèn)題的小伙伴找到更簡(jiǎn)單易行的方法。
Jar文件獲取導(dǎo)入:
方法1:通過(guò)官網(wǎng)下載jar文件包。下載后,解壓文件,并將lib文件夾下的Spire.Pdf.jar文件導(dǎo)入java程序。導(dǎo)入后如下圖:
方法2: 可通過(guò)maven倉(cāng)庫(kù)安裝導(dǎo)入。
Java代碼示例
import com.spire.pdf.*; import javax.imageio.ImageIO; import java.awt.image.BufferedImage; import java.io.File; import java.io.FileWriter; import java.io.IOException; public class ExtractText { public static void main(String[]args) throws Exception { //加載測(cè)試文檔 PdfDocument pdf = new PdfDocument("sample.pdf"); //實(shí)例化StringBuilder類(lèi) StringBuilder sb = new StringBuilder(); //定義一個(gè)int型變量 int index = 0; //遍歷PDF文檔中每頁(yè) PdfPageBase page; for (int i= 0; i<pdf.getPages().getCount();i++) { page = pdf.getPages().get(i); //調(diào)用extractText()方法提取文本 sb.append(page.extractText(true)); FileWriter writer; try { //將StringBuilder對(duì)象中的文本寫(xiě)入到txt writer = new FileWriter("ExtractText.txt"); writer.write(sb.toString()); writer.flush(); } catch (IOException e) { e.printStackTrace(); } //調(diào)用extractImages方法獲取圖片 for (BufferedImage image : page.extractImages()) { //指定輸出圖片名,指定圖片格式 File output = new File(String.format("Image_%d.png", index++)); ImageIO.write(image, "PNG", output); } } pdf.close(); } }
關(guān)于利用Java怎么對(duì)PDF中的文本與圖片進(jìn)行讀取問(wèn)題的解答就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,如果你還有很多疑惑沒(méi)有解開(kāi),可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識(shí)。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。