如何读取.doc文件并从中获取特定的单词php
我想读取doc文件并从中获取一些结果。如何读取.doc文件并从中获取特定的单词php
例如: 如果我有一个文件 - FILE.DOC
,它有类似
恢复
名称:约翰·卡特
地址:美国
我作为一名php开发人员工作
然后我想是这样的:
array(
'name' => john carter
'Address' => USA
)
并且还拒绝从该附加信息。
是否有可能?
我已经尝试phpoffice,但我不能得到任何相关的需要。
我们可以很容易地获得整个文件数据,但我无法识别我想要的任何东西。
我需要的是类似于abbyy给图像给文本。
请任何人都帮助我。
PHP docx阅读器:将MS Word Docx文件转换为文本 该类可以将MS Word Docx文件转换为文本。
它可以以docx格式从压缩的Microsoft Word文件中提取文件。
该类可以解析文档XML文件并提取它包含的文本。从问题
你可以在这里找到它:http://www.phpclasses.org/package/7934-PHP-Convert-MS-Word-Docx-files-to-text.html –
谢谢你的回答...但对我没有帮助因为它提供全文而不是分离的数据。所以没有upvoted。 –
好的,你可以请告诉我你在做什么。它更好地将文档转换为文本,然后用逻辑清理 –
为什么没有任何回答这样的反对票或评论? –