为了账号安全,请及时绑定邮箱和手机立即绑定

javascript阅读docx文本的问题

javascript阅读docx文本的问题

牛魔王的故事 2022-08-18 10:39:46
我正在上传文件并提取其内容并将其放入文本区域。我可以成功地使用txt文件,但对于docx文件,它不能很好地工作。我的代码: function loadFileAsText(){  var fileToLoad = document.getElementById("fileToLoad").files[0];  var fileReader = new FileReader();  fileReader.onload = function(fileLoadedEvent){      var textFromFileLoaded = fileLoadedEvent.target.result;      document.getElementById("inputTag").value = textFromFileLoaded;  };   fileReader.readAsText(fileToLoad, "ANSI");}当我尝试上传docx文件时,它给出了这样的东西:PK     ! ߤ�lZ      [Content_Types].xml �(�                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 ���n�0E�����Ub袪*�>�-R�{V��Ǽ��QU�l"%3��3Vƃ�ښ我是否缺少解码部分?
查看完整描述

2 回答

?
翻阅古今

TA贡献1780条经验 获得超5个赞

你不能以自己的方式实现它。必须使用专用库来读取文件。如果您在记事本中运行文件,您会看到它不是纯文本,因为此文件中有所有其他数据,元数据等。docxdocx



查看完整回答
反对 回复 2022-08-18
?
慕姐4208626

TA贡献1852条经验 获得超7个赞

.docx粗略地复制了那个常规文本文件,确切地说,是一个XML文件数量的ZIP存档。

可能有一个gotacchas,即使你成功地取消了docx的存档,它仍然不清楚你应该从中解析哪个XML文件并尝试解释为文本。

在所有情况下,当我需要做类似的事情时,我使用服务器解决方案,我自己的或第三方,并且转换总是存在问题。


查看完整回答
反对 回复 2022-08-18
  • 2 回答
  • 0 关注
  • 59 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信