为了账号安全,请及时绑定邮箱和手机立即绑定

Java 读取PPT文本和图片

标签:
Java API

本篇文章将介绍通过Java程序来读取PPT幻灯片中的文本及图片的方法。读取图片时,可读取文档中的所有图片,也可以读取指定幻灯片当中的图片。

工具:

  • Free Spire.Presentation for Java(免费版)

  • IntelliJ IDEA

 

Jar文件获取及导入:

方法1官网下载jar文件包。下载后,解压文件,并在java程序中导入lib文件夹下的Spire.Presentation.jar文件。

方法2通过maven仓库导入到maven项目。

 

Java代码示例

测试文档 如下:

https://img1.sycdn.imooc.com//5d48dbba0001ada313530681.jpg

【示例1】读取PPT中的文本

import com.spire.presentation.IAutoShape;
 import com.spire.presentation.ISlide;
 import com.spire.presentation.ParagraphEx;
 import com.spire.presentation.Presentation;
 import java.io.FileWriter;
 
 public class ExtractText {
     public static void main(String[]args) throws Exception{
         //加载测试文档
         Presentation ppt = new Presentation();
         ppt.loadFromFile("test.pptx");
 
         StringBuilder buffer = new StringBuilder();
 
         //遍历文档中的幻灯片,提取文本
         for (Object slide : ppt.getSlides()) {
             for (Object shape : ((ISlide) slide).getShapes()) {
                 if (shape instanceof IAutoShape) {
                     for (Object tp : ((IAutoShape) shape).getTextFrame().getParagraphs()) {
                         buffer.append(((ParagraphEx) tp).getText());
                     }
                 }
             }
         }
         //保存到文本文件
         FileWriter writer = new FileWriter("ExtractText.txt");
         writer.write(buffer.toString());
         writer.flush();
         writer.close();
     }
 }

文本读取结果:

https://img1.sycdn.imooc.com//5d48dc300001e61705620319.jpg

【示例2】读取PPT中的所有图片

import com.spire.presentation.Presentation;
 import javax.imageio.ImageIO;
 import java.awt.image.BufferedImage;
 import java.io.File;
 
 public class ExtractAllImgs {
     public static void main(String[] args) throws Exception {
         //加载文档
         Presentation ppt = new Presentation();
         ppt.loadFromFile("test.pptx");
 
         //提取文档中的所有图片
         for (int i = 0; i < ppt.getImages().getCount(); i++) {
             BufferedImage image = ppt.getImages().get(i).getImage();
             ImageIO.write(image, "PNG", new File(String.format("AllImage-%1$s.png", i)));
         }
     }
 }

【示例3】读取指定幻灯片中的图片

import com.spire.presentation.*;
 import javax.imageio.ImageIO;
 import java.awt.image.BufferedImage;
 import java.io.File;
 
 public class ExtractImgsInSpecifiedSlide {
     public static void main(String[]args) throws  Exception{
         //加载文档
         Presentation ppt = new Presentation();
         ppt.loadFromFile("test.pptx");
 
         //获取第2张幻灯片
         ISlide slide = ppt.getSlides().get(1);
 
         //提取图片
         for(int i = 0; i< slide.getShapes().getCount(); i++)
         {
             IShape shape = slide.getShapes().get(i);
             if(shape instanceof SlidePicture)
             {
                 SlidePicture pic = (SlidePicture) shape;
                 BufferedImage image = pic.getPictureFill().getPicture().getEmbedImage().getImage();
                 ImageIO.write(image, "PNG",  new File(String.format("extractImageinslide-%1$s.png", i)));
             }
             if(shape instanceof PictureShape)
             {
                 PictureShape ps = (PictureShape) shape;
                 BufferedImage image = ps.getEmbedImage().getImage();
                 ImageIO.write(image, "PNG",  new File(String.format("extractImageinslide-%1$s.png", i)));
             }
         }
 
     }
 }

图片读取结果:

https://img1.sycdn.imooc.com//5d48dc7000011bbf09550463.jpg

(本文完)


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消