扫描版pdf文字提取 提取图片(扫描版PDF)中的文字

有时候在书上看到一篇好文章用相机拍下来,或是纸质文章需要输入到电脑时,如果数量比较大,手动输入会很慢,下面介绍几中方法将图片中的文字转化为文本,同样适用于影印版PDF。

只要图片中的文字不是很模糊,识别的正确率还是很高的,但是一定要记得进行校正。

下面几个方法各有优劣,可根据个人兴趣选择。

提取图片(扫描版PDF)中的文字――工具/原料

ABBYY FineReader 11软件

Office2003 自带组件Microsoft Office Document Imaging

DoPDF软件和AJViewer

扫描版pdf文字提取 提取图片(扫描版PDF)中的文字

慧眼图像文字识别软件

提取图片(扫描版PDF)中的文字――步骤/方法

提取图片(扫描版PDF)中的文字 1、

首先介绍ABBYY FineReader 11这个软件。

泰比(ABBYY)FineReader提供直观的文件扫描和转换成可编辑、可搜索的电子格式工具。泰比(ABBYY)FineReader可以识别和转换几乎所有打印的文档类型,包括书籍、志上的文章与复杂的布局、表格和电子表格、图片,甚至以准确的精度发传真。

下载地址:网上随便一搜就很多例如:

http://www.xp510.com/soft/Application/Processing/15768.html

破解补丁:

http://down.qiannao.com/space/file/l513980209/share/2011/11/2/ABBYY_FineReader_11_Professional_Edition_-514d-5e8f-5217-53f7-65e0-9650-5236-7834-89e3-7248-7834-89e3-6587-4ef6.rar/.page#

破解方法:将下载的文件替换原安装文件即可。

使用方法:

1 安装后打开软件,选择任务,这里选择图片至microsoft word。

2 打开需要识别的图片,软件会自动识别文字。

3 当然该软件还自带图像简单处理功能,使得识别更加准确。

4 识别后可以设置文字的样式、语言、字体、大小等。

5 对于自动识别的文字可能出现偏差,所以必须手动。

6 校验完毕后发送到word(可选其他格式)。


提取图片(扫描版PDF)中的文字 2、


提取图片(扫描版PDF)中的文字 3、


提取图片(扫描版PDF)中的文字 4、


提取图片(扫描版PDF)中的文字 5、

提取图片(扫描版PDF)中的文字_慧眼图像文字识别


提取图片(扫描版PDF)中的文字 6、


提取图片(扫描版PDF)中的文字 7、


提取图片(扫描版PDF)中的文字 8、

Office2003 自带组件Microsoft Office Document Imaging

如果Office装的是精简版,那么在就没装这个组件,可以自己装一下或是下载完整版。装完后如下图。

1 转换文件格式,将图片转化为tif格式。

用ACDSee打开你的.jpg文件,单击界面上的“浏览器”按钮(或者双击当前图片都可以进入到浏览器界面),在打开的浏览器中,右键这个文件,在右键菜单中选择“工具/转换文件格式”;在转换文件格式对话框中,选择TIFF格式,两次下一步后,就开始转换,结果是将你当前的.jpg文件转换成了.tif文件。

2 将图片转换为文字。

选择:开始/所有程序/Microsoft Office/Microsoft Office工具/Microsoft Office Document Imaging,打开这个工具后,菜单:文件/打开,找到你保存的那个.tif文件,打开它。然后选择菜单:工具/使用OCR识别文本;梢等一会儿,继续菜单:工具/将文本发送到Word。这样,这幅图片就到了Word中成了可以编辑的文字内容了。因为OCR识别并非百分之百成功,所以有些位置可能需要你进行手动修改。


提取图片(扫描版PDF)中的文字 9、

提取图片(扫描版PDF)中的文字_慧眼图像文字识别


提取图片(扫描版PDF)中的文字 10、


提取图片(扫描版PDF)中的文字 11、


提取图片(扫描版PDF)中的文字 12、

通过PDF->文字

也就是先将图片转化为PDF,然后再提取文字。

1 下载DoPDF将word转化为PDF,工具网上多得很,例如下载地址:

http://www.duote.com/soft/1329.html

2 下载AJViewer,地址:

http://www.drv5.cn/sfinfo/7781.html

3 打开AJViewer,选择【工具】-【文字识别】,如下图

4 选择文字后,进行转化,转化效果如下。


提取图片(扫描版PDF)中的文字 13、

提取图片(扫描版PDF)中的文字_慧眼图像文字识别


提取图片(扫描版PDF)中的文字 14、


提取图片(扫描版PDF)中的文字 15、

慧眼图像文字识别软件

可参考

http://jingyan.baidu.com/article/ceb9fb1006ffed8cad2ba01d.html

提取图片(扫描版PDF)中的文字――注意事项

文字图像尽量平整,文字尽量清晰。

进行识别后一定要进行校验。

  

爱华网本文地址 » http://www.aihuau.com/a/8105150103/347403.html

更多阅读

怎样才能提取图片中的文字 怎样提取图片上的文字

现在数码照相技术越来越发达,如果您到图书馆或者新华书店看到了好的文章或者图书,想把书本上需要的内容输入到电脑中,就会想到用手机或相机拍下来,但是拍摄图片中的文字是无法编辑的,怎样才能提取图片中的文字,将图片中的文字转换为可以编

如何识别图片中的文字 怎么识别图片上的文字

如何识别图片中的文字——简介相信很多朋友和我一样都有这样的困扰,经常要将图片或者扫描文件中的文字提取出来,保存在我们的文档中去。但是用了很多软件,效果都不是很理想,还是需要自己人工去核对,大大影响了我们的工作效率,有没有一种简

象形5000高清完整 无水印扫描版 百词斩象形单词5000

优质资源圈 公众圈圈子资料zjwyx云我聊圈子至尊永V上一页123 456 下一页659人浏览 字号设置象形5000高清完整 无水印扫描版《象形5000》此书由美国设计师Toshie和西班牙设计师Enrique将英语单词设计成意型合一的图画,相当于为每个单

小屏幕阅读大书必备:扫描版pdf重排软件介绍

小屏幕阅读大书必备:扫描版pdf重排软件介绍------Kindlepdfviewer & Orion viewer修改版首先,了解下什么叫扫描版pdf重排,如下图下面这个是原始的图书,字比较小设定参数,软件重排得到的(字大了有没有)这种神奇的软件,可以使得我们能在小

声明:《扫描版pdf文字提取 提取图片(扫描版PDF)中的文字》为网友一纸能藏几字慵分享!如侵犯到您的合法权益请联系我们删除