如何把pdf文件转换成txt文档?
  • 发表时间:2020-01-16 20:43
现在是电子书的时代,许多朋友的电子设备只支持txt文件格式,但找到了一些好的图书pdf格式。怎么把pdf格式转成txt格式呢?最近,总有朋友问我这个问题。这里把我的方法写下来,分享给朋友们,希望能帮到大家。更希望发挥砖的作用,有更好的方法可以分享。

如果是由word文件转成的pdf文件,这个比较简单。
打开pdf文档,选择文件——另存为,如下图:

在弹出的另存为对话框中,保存类型——纯文本。就可以了。如下图:

如果没法直接保存成纯文本,报ASCII码错误的话,可以先保存为microsoft word文档,再由word文档转换成txt格式。

如果pdf文档是由扫描后的图片制作而成的,用上述方法就无法直接转换成txt格式了。需要用以下方法。
打开pdf文档,选择文件——另存为——保存类型选择jpeg图片格式。如下图:

存为jpeg格式的图片之后,需要安装OCR识别软件。推荐使用清华紫光OCR或者汉王OCR软件。软件网上都可以免费下到。我使用的是汉王OCR 8.0 。
安装好软件之后,运行OCR软件。选择文件——打开图像,如下图:
找到图片保存目录,打开从pdf文件转换成的图片。

图片文件打开以后,选择识别——开始识别:

识别完成后界面如下图:

上半部分是识别出来的文字,下半部分是原稿。因为识别软件以及图片清晰度的原因,有些字会与原稿有误,需要校对。校对过程中,如果原稿字太小,看不清楚,可以选择放大原稿操作。如下图:

校对完成,选择输出——到指定格式文件,保存成txt格式就可以了。如下图:

至此,很轻松的,txt格式的文档就转换好了。
 
最后,校对是重要的,因为它需要仔细地与原来的比较。仔细才能做到无误。所以这个过程很花时间的。我希望你能分享其他人从互联网上上传的电子书的txt格式。在享受阅读的乐趣和乐趣的同时,请感谢发件人。因为这也是别人的劳动结晶。