我一直在做一些研究,试图了解pptx在浏览器中使用 JavaScript/Typescript 读取内容的标准方法是什么。我发现的很多库主要是针对像textract这样的节点。我发现了一个名为JS-PPTX 的库,但最后一次提交是在 2016 年,所以这不是很有前途。大多数库都是关于创建Power Point演示文稿的,但我真正需要做的是能够读取文件并识别幻灯片的内容。我很高兴阅读原始文件格式并尝试解析它(如果这样更好),但我只需要一种使用 FileReader Api 上传和读取文件的方法。或者如果有一种方法可以将 pptx 转换为另一种更易于阅读的格式,我会喜欢的。我发现一个名为PPTX2HTML 的库,但最后一次提交是 2017 年的。
1 回答
至尊宝的传说
TA贡献1789条经验 获得超10个赞
它是 Microsoft Office Open XML(也称为 OOXML 或 OpenXML)规范的一部分,作为 Microsoft Office 2007 及更高版本的一部分引入。
浏览器可以解析 XML,因此您可能必须:
使用FileReader读取文件,
以某种方式解压它
使用DOMParser解析它
也许用 XSLT 对其进行转换
添加回答
举报
0/150
提交
取消