我有一个项目隐写术,可将docx文档隐藏到jpeg图像中。使用apache POI,我可以运行它并阅读docx文档,但只能读取字母。即使其中有图片。这是代码FileInputStream in = null; try { in = new FileInputStream(directory); XWPFDocument datax = new XWPFDocument(in); XWPFWordExtractor extract = new XWPFWordExtractor(datax); String DataFinal = extract.getText(); BufferedReader reader = new BufferedReader(new InputStreamReader(in)); String line = null; this.isi_file = extract.getText(); } catch (IOException x) {} System.out.println("isi :" + this.isi_file);如何使用Java读取docx文档中的所有组件?请帮助我,谢谢您的帮助。
1 回答
幕布斯6054654
TA贡献1876条经验 获得超7个赞
请查看文档的XWPFDocument
类。它包含一些有用的方法,例如:
getAllPictures()
返回文档中所有图片的列表;getTables()
返回文档中所有表的列表。
在您的代码段中存在line XWPFDocument datax = new XWPFDocument(in);
。因此,在该行之后,您可以编写一些代码,例如:
// process all pictures in document
for (XWPFPictureData picture : datax.getAllPictures()) {
// get each picture as byte array
byte[] pictureData = picture.getData();
// process picture somehow
...
}
添加回答
举报
0/150
提交
取消