社区应用 最新帖子 精华区 社区服务 会员列表 统计排行
  • 624阅读
  • 0回复

如此提取PDF文本内容

楼层直达
级别: 光盘初级
发帖
202
飞翔币
335
威望
141
飞扬币
2155
信誉值
0
手头上有一些PDF文档需要提取里面的文本内容,但机器里并没有安装Adobe Acrobat、Adobe Reader等阅读软件,第三方转换工具转换效果又不是很理想。如果你用过百度硬盘搜索,那么就可以通过它的快照功能快速提取PDF文档的所有文本内容。
百度硬盘搜索可以到下载安装,运行后双击托盘图标打开硬盘搜索,索引完成后进入硬盘搜索首页。这时,查看页面下方的“文档”类别,点击“PDF”文件类型,查看硬盘里所有的PDF文档。找到待处理的PDF文件,点击末尾的“快照”链接,就会显示PDF里的文本内容(如图)。最后,将内容保存为文本文件,还是复制出来保存为DOC文件,就看大家各自的需要了。

此方法同样适用于Word(DOC)、 幻灯片(PPT)等文档的文本提取。
如果“文档”类别没有“PDF”类型,可以直接在关键字文本框里输入PDF文件的文件名或存储的路径,按下回车键开始搜索文件。要注意的是,如果只是纯粹由图片创建的文档,那么这一招就不起作用了。