溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

C#提取PPT文本和圖片的實(shí)現(xiàn)方法

發(fā)布時(shí)間:2020-09-14 17:34:08 來(lái)源:腳本之家 閱讀:217 作者:E-iceblue 欄目:編程語(yǔ)言

在圖文混排的文檔中,我們可以根據(jù)需要將文檔中的文字信息或者圖片提取出來(lái),通過(guò)C#代碼可以提取Word和PDF文件中的文本和圖片,那么同樣的,我們也可以提取PPT幻燈片當(dāng)中的文本和圖片。本篇文檔將講述如何使用C#來(lái)實(shí)現(xiàn)提取PPT文本和圖片的操作。首先也是需要安裝組件Spire.Presentation,然后添加引用dll文件到項(xiàng)目中。下面是主要的代碼步驟。

原文檔:

C#提取PPT文本和圖片的實(shí)現(xiàn)方法

1. 提取文本

步驟一:創(chuàng)建一個(gè)Presentation實(shí)例并加載文檔

Presentation presentation = new Presentation(@"C:\Users\Administrator\Desktop\sample.pptx", FileFormat.Pptx2010);

步驟二:創(chuàng)建一個(gè)StringBuilder對(duì)象

StringBuilder sb = new StringBuilder(); 

步驟三:遍歷幻燈片及幻燈片中的圖形,提取文本內(nèi)容

 foreach (ISlide slide in presentation.Slides)
  {
  foreach (IShape shape in slide.Shapes)
  {
   if (shape is IAutoShape)
   {
   foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs)
   {
    sb.Append(tp.Text + Environment.NewLine);
   }
   }
  }
  }

步驟四:寫(xiě)入Txt文檔

 File.WriteAllText("target.txt", sb.ToString());
 Process.Start("target.txt");

C#提取PPT文本和圖片的實(shí)現(xiàn)方法

2. 提取圖片

 這里提取圖片有兩種情況,一種是提取整個(gè)文檔中的所有圖片,另外一種是只提取文檔中某一特定幻燈片中的圖片。

2.1提取所有圖片

步驟一:初始化一個(gè)Presentation類實(shí)例,并加載文檔

Presentation ppt = new Presentation();
 ppt.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");

步驟二:遍歷文檔中圖片,提取圖片并保存

 for (int i = 0; i < ppt.Images.Count; i++)
 {
 Image image = ppt.Images[i].Image;
 image.Save(string.Format(@"..\..\Images{0}.png", i));
 }

C#提取PPT文本和圖片的實(shí)現(xiàn)方法

提取的圖片已保存到項(xiàng)目文件夾下

2.2.提取特定幻燈片中的圖片

步驟一:創(chuàng)建一個(gè)Presentation類實(shí)例,并加載文檔

Presentation PPT = new Presentation();
PPT.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");

步驟二:獲取第三張幻燈片,提取并保存圖片

int i = 0;
foreach (IShape s in PPT.Slides[2].Shapes)
{
 if (s is SlidePicture)
 {
 SlidePicture ps = s as SlidePicture;
 ps.PictureFill.Picture.EmbedImage.Image.Save(string.Format("{0}.png", i));
 i++;
 }
 if (s is PictureShape)
 {
 PictureShape ps = s as PictureShape;
 ps.EmbedImage.Image.Save(string.Format("{0}.png", i));
 i++;
 }
}

提取的第三張幻燈片中的圖片已保存至指定位置

C#提取PPT文本和圖片的實(shí)現(xiàn)方法

上文演示了如何提取文本和圖片,步驟比較簡(jiǎn)單實(shí)用,希望對(duì)你有所幫助,感謝閱讀!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI