jpg格式转化

2022-10-28 来源：乌哈旅游

用SnagIt工具进行文字提取。

SnagIt是一款功能强大的图片捕捉工具，但是很多朋友可能不知道，它还有文字捕捉的功能，能将文字从图片中提取出来。

SnagIt (屏幕捕捉程序) v8.1 汉化绿色版：http://www.52z.com/soft/6431.Html SnagIt当前版本为7.02，大小为8903KB，下载地址可以在http://www.skycn.com/soft/2290.html找到，汉化补丁可以在http://www.skycn.com/soft/2291.html找到。

启动SnagIt，选择菜单“输入/区域”，选择菜单“工具/文字捕获”，然后我们打开要捕捉的文件窗口，按下捕捉快捷键，选定捕捉区域即可捕捉到文字。在左侧选中“窗口文字”(如图)，在左侧选择输入位置(比如屏幕、区域、窗口等)，输出位置(比如打印机、剪贴板、文件等)。设置完成后，.回到要捕捉文字的文件窗口，按下“捕获”快捷键，即可将文字提取出来。接着用相应工具重排文字。此时我们发现提取的文字可能会有很多空格或段落错乱等现象，而且字号、字体等不合自己的心意。这时我们可以用熟悉的WPS或Word软件进行重新编排。我们以WPSOffice2003为例看看如何对付提取后文章的编排：用WPSOffice2003打开提取文章；然后选择“工具”菜单下的“文字”/“段落重排”，这时你会看到提取文章重新进行排版；接下来选择“工具”菜单下的“文字”/“删除段首空格”命令，使得文章的每段参差不齐的行首空格被删除；再选择“工具”菜单下的“文字”/“增加段首空格”，文章变为正常的书写格式；提取文章一般都留有空段，为删除这些空段，继续选择“工具”菜单下的“文字”/“删除空段”命令，这时文章完全变为我们所要的形式；用你熟悉的界面任意编辑文章吧。

用Office 2003提取图片中的文字后，保存为.jpg格式

[图3] 保存后的.jpg图片

图1、图2、图3是假设在浏览网页时，遇到含有文字的图片，利用腾讯TT截图功能，在Photoshop粘贴生成.jpg文件；当然，也可以使用键盘上的PrintScan键截图后，打开附件里的画图，进行粘贴生成.jpg文件。 2.\"尚书六号\"的界面

3.导入需要提取的图片

[图5] 点击\"文件\"，选择\"打开图象页\"

[图6] 选择刚才保存的sample.jpg并点击\"打开\"

[图7] \"尚书六号\"自动识别的三个选框 4.提取文字并保存文本

[图8] 不修改默认设置，直接点击\"识别\"后，弹出的界面

[图9] 将框内的文字选中，并复制到文本文件或Word文档进行个别错字修正 Free-ORC

是一个非常好的免费在线服务，可以讲图片或者PDF中的文字提取出来，支持的文件有PDF, JPG, GIF, TIFF, BMP or PNG ，可以识别出6种文字：English, German, french, Italian, Dutch and Spanish（英语，德语，法语，荷兰语和西班牙语）

官网介绍：

Free-OCR.com is a free online OCR (Optical Character Recognition) tool. You can use this to perform OCR on any image you supply.

This service is free, no registration necessary. We also do not need your email address. Just upload your image files. Free-OCR takes either PDF, JPG, GIF, TIFF or BMP format.

The only restriction is that the images must not be larger than 2MB, no wider or higher than 5000 pixels and there is a limit of 10 image uploads per hour.

使用方法很简单，打开首页，在 UPLOAD image for OCR下面点Browse选择带有文字的图片。如下图：

OCR是完全免费的，不过有以下限制： 1、图片文件最大限制在2MB

2、只能从图片和扫描文件提取文字

3、只支持PDF, JPG, GIF, TIFF, BMP ，PNG 这几种图片格式

4、只能识别6种语言，还不包括中文，对于中国的朋友是致命的。 5、免费并且不需要注册

【网站地址】http://www.free-ocr.com/

免费资源信息网推荐资源，转载请注明出处http://www.10wbook.cn TH-OCR XP

能够适应超过一百种Windows字体。

TH-OCR XP 能够识别全部简体国标一二级6763个字符，繁体13000多字符。 TH-OCR XP

能够识别彩色图象，并转换成带有彩色图片的RTF格式（WORD可编辑）。 TH-OCR XP

支持多任务，可以在识别一篇文章的同时扫描或编辑其它文档。 TH-OCR XP

中对于每个区域可以设定不同的字体，例如一篇文档中的大段英文可以设为英文识别，以提高识别率。

按住Ctrl键用鼠标拖动，可以移动区域。

按住Shift键用鼠标点取，可以选择多个区域，一起设置字符集和类型。按住Shift键用鼠标右键拉直线可以进行手动倾斜校正。

版面分析前根据实际情况选择“报纸版面”或“杂志版面”可以提高版面分析正确性。对一般文本识别扫描分辨率用300DPI比较合适，识别小于5号的字可选400DPI。

选择“简体全字集”或“繁体全字集”，能够识别更多的字体和全部字符集，但识别速度较慢。电信下载地址一电信下载地址二网通下载地址一迅雷高速下载通道

Perfect PDF Reader 5 | 提取PDF图片/文字 Adobe Reader软件介绍

已经推出了很多的版本，即使现在已经到了9.1，增加了很多的功能，但是我们还是有更加好的选择. Perfect PDF Reader 对于Windows用户来说，可能是个很诱人的选择哦。除了增加了明显的开放接口, Perfect PDF也加入了一些特别有用的功能. 譬如说有三种不同的查看方式：标准, 阅读模式, 全屏模式。

Perfect PDF同样让从文件中提起出图片和文字变得容易. 可以选择，复制，粘贴到任何地方，

甚至用于图形输出. 当然也可以修改你的文件。

当然，对于某些shell，至少说是个小小的图标- 比如“另存为”按钮.虽然不影响功能的使用, 但是却不适合人们日渐提升的审美观。

Perfect PDF Reader 功能：

打开，阅读，显示任何的 PDF 文件打印pdf文件以纯文本输出

输出网页为pdf（Adobe Reader中没有此功能!) 大量的导航放大和显示模式旋转

通过email发送提取文本图像剪切板搜索

填写保存pdf表格(Adobe Reader中没有的功能!) 数字签名在线更新升级

Perfect PDF Reader 是免费的软体，有32位，64位版本. 要求 Visual C++ 2008 runtimes。当然，在安装的时候会提醒你并且自动下载安装。最后，是英文的哦，当然很好用。 Free of charge: quick and easy read and display PDF documents!

Do you want to test the possibilities of PDF Direct & Quick View and PDF Quick Viewer without programming?

Or you need easy and power PDF reader for your PDF documents?

Perfect PDF Reader is a good alternative for Adobe Reader, it has also some more functions.

You can export pages from PDF file as the images (BMP, GIF, JPEG, PNG, Metafile) with different resolution. There is a possibility to fill forms and to save filled file.

从各种图片中提取文字的好软件！绿色！能够适应超过一百种Windows字体。

能够识别全部简体国标一二级6763个字符，繁体13000多字符。

能够识别彩色图象，并转换成带有彩色图片的RTF格式（WORD可编辑）。支持多任务，可以在识别一篇文章的同时扫描或编辑其它文档。中对于每个区域可以设定不同的字体，例如一篇文档中的大段英文可以设为英文识别，以提高识别率。

!!!!!下载地址!!!!!

图片型pdf文字提取方法

你是否在为论文而烦恼?你是否在为下载到了图片型的PDF而烦恼呢? 不用再徘徊了,以下的方法或者可以帮到你. 图片型pdf文字提取方法：

1. Acrobat将pdf存为系列单个tif文件。 2. 汉王文本王OCRtif文件，保存txt。

软件：10/nature/software/Office/OCR/汉王文本王3.0.rar

miniocr(图片文字提取工具)0

不同于商业Ocr软件，本软件是免费的，可以自由使用。第二个不同之处，本软件的识别对象是屏幕出现的“显示汉字”，而不是针对扫描仪扫出来的“打印汉字”。二者有什么不同呢？最重要的一点：扫描出来的打印汉字的高度和宽度一般都在30多个像素点之上，这是我用画图软件，打开某个商业Ocr的samples\\sample1.tif，然后一点一点数出来的。从文件名和目录名的中文含意可以看出，这个点数应该是一个典型值。那么，如果用商业Ocr识别屏幕上出现的小五号字，汉字的高度是12个像素点，会出现什么情况呢？测试方法：用记事本随便写几行汉字，设置字体为小五号字。这大概是看着还算舒服的最小号的汉字字体了（高度是12个像素点），如果再小，字体就很难看了。然后，按拷屏键PrtSc，把屏幕的图像拷贝、粘贴到画图软件中，修剪尺寸后，保存为bmp的格式。然后，我找了两个国内最著名的Ocr软件进行测试，结果让人大吃一惊，识别率几乎为零。把图像放大两倍，再测试，结果仍然很不理想，大概也只有百分之二三十的样子。附件

miniocr.zip (2.69 MB)

如何提取PDF文件中的文字和图片

PDF文件一个弊端就是用户不能直接提取该文档中的文字或图片信息，给大家查找和使用资料带来麻烦。如果你使用了下面的两款小工具，就可以轻松提取PDF文件中的文字和图片信息了。

一、提取文本信息

提取PDF文件中的文本信息时，需先将PDF文件转换为文本文档，随后只要用Word等文本编辑工具将转换的文本文件打开。

“VeryPDF PDF2Word”可以将PDF文件转换为Word文档文件，能用Word打开转换后的PDF文件，即可轻松提取文档中的文字信息。

软件名称 VeryPDF PDF2Word 软件版本 v3.0 软件大小 3.77KB

软件分类应用软件（文件管理）软件语言英文

应用平台 Win9x/NT/2000/XP/2003 软件作者 Intelligent Converters, Co. 高速下载地址

使用PDF2Word转换PDF文件时，在程序主界面中单击“file→Open”（打开）按钮，选择需要打开的PDF文件，随后单击“打开”按钮，弹出文件保存对话框，在此选择转换后文件保存的文件名和路径。

并在下面的“保存类型”项中选择保存方式“Word files（*.rtf）”，这样该文件将会被转换为rtf格式，然后单击“保存”按钮。

还可对选中的PDF文件进行分析，分析后并开始转化，在程序主界面下面弹出一个转换进度条。

分析转换

文件转换后，就可以使用Word打开转换后的文件了。

打开转换后的文件

怎么样文字信息和图片就可以在Word中随便修改了。

二、将PDF中的图片一网打尽

若想提取文档中的图片，在word中非常麻烦，可使用一款名为“PDF Extract TIFF”，将PDF文档中的所有图标提取出来并保存为TIFF图片格式。

软件名称 PDF Extract TIFF

软件版本 V2.0 软件大小 1.36MB

软件分类图形图像（图像其它）软件语言英文

应用平台 windows 95/98/Me/NT/2000/XP 软件作者 Verypdf.com, Inc 高速下载地址

用PDF Extract TIFF提取PDF中图片时，启动PDF Extract TIFF，在主界面中单击“open”（打开）按钮，在弹出的窗口中选择需提取图片的PDF文件。

PDF Extract TIFF主界面

随后打开“另存为”对话框，在此选择好图片文件保存的路径和图片文件名。

通过上面的设置，单击“保存”按钮，对PDF文件中的所有图片进行提取，并保存的指定的文件夹中。怎么样，PDF文档中的图片是不是被一网打尽了。 cajreader6.0 绿色免安装版含文字识别可提取图片型 pdf汉字

软件大小：30 MB 软件语言：简体中文

软件类别：一般软件 / 特别软件 / 电子阅读运行环境：Win2003, WinXP, Win2000, NT, WinME 界面预览：

添加时间：2007-6-11 14:07:20 更新时间：2007-6-11 14:07:20

软件添加：欣岚《电子阅读》栏目组软件评级：会员级别：匿名用户

下载统计：本日：4 本周：20 本月：68 总计：8511

软件简介：

cajreader6.0 绿色免安装版含文字识别可提取图片pdf汉字

有时候遇见了好的PDF文档，想打印出来的时候，就可以直接用这个软件把文字抓出来打印了

CAJ全文浏览器是中国期刊网的专用全文格式阅读器，它支持中国期刊网的CAJ、NH、KDH和PDF格式文件。它可配合网上原文的阅读，也可以阅读下载后的中国期刊网全文，并且它的打印效果与原版的效果一致，当然，您必须具有浏览原文的权限。

主要功能:

页面设置：可通过[放大]、[缩小]、[指定比例]、[适应窗口宽度]、[适应窗口高度]、[设置默认字体]、[设置背景颜色]等功能改变文章原版显示的效果；

浏览页面：可通过[首页]、[末页]、[上下页]、[指定页面]、[鼠标拖动]等功能实现页面跳转；查找文字：对于非扫描文章，提供全文字符串查询功能；

切换显示语言：本软件除了提供简体中文，还提供了繁体中文、英文显示方式，方便海外用户使用；

文本摘录：通过[鼠标选取]、[复制]、[全选]等功能可以实现文本及图像摘录，摘录结果可以粘到WPS、WORD等文本编辑器中进行任意编辑，方便读者摘录和保存（适用于非扫描文章）；

图像摘录：通过[复制位图]等功能可以实现图像摘录，摘录结果可以粘到WPS、WORD等文本编辑器中进行任意编辑，方便读者摘录和保存（适用于非扫描文章）；

打印及保存：可将查询到的文章以*.caj/kdh/nh/pdf文件格式保存，并可将其按照原版显示效果打印；

下载“cajreader6.0 绿色免安装版含文字识别可提取图片型 pdf汉字” · [欣岚08号服务器04下载]-[迅雷专用下载] ·[欣岚08号服务器04下载]-[网页直接下载]

CAJViewer (提取PDF文字)V7.0 绿色版软件简介:

CAJViewer7.0提取图片pdf文字绿色免安装版是在CNKI公司CAJViewer7.0的基础上,去除PDL后绿化而成，可以阅读CAJ、NH、KDH和PDF格式文件，支持ORC文字识别，识别率很高，配合PdfFactory一起使用，效果极佳！为了测试文字识别效果，特选取新浪2007-7-23日新闻，考屏成图片后打印成pdf（演示.pdf），进行文字识别！识别效果见演示.jpg (测试系统为win2K和winXP)。

CAJViewer——CAJ全文浏览器是中国期刊网的专用全文格式阅读器，它支持中国期刊网的CAJ、NH、KDH和PDF格式文件。它可配合网上原文的阅读，也可以阅读下载后的中国期刊网全文，并且它的打印效果与原版的效果一致，当然，您必须具有浏览原文的权限。 CAJViewer 7.0提取图片pdf文字全文浏览器是中国期刊网的专用全文格式阅读器，与CAJViewer 6.0相比，增加（修改）了以下功能：

1.增加页面旋转功能。可以全部或单独旋转某一页面，并能将旋转结果保存。

2.增加两种页面显示方式，即对开显示及连续对开显示，可以设置对开显示时的起始页，可以设置对开显示时是否显示页间空隙。

3.增加了新的标注类型，并能对标注属性进行修改。

4.增强了打印方法，可以实现双面打印，可以以讲义的方法打印，可以根据打印机性能进行优化。

5.增加了屏幕取词软件的支持，可以使用第三方翻译软件进行即时翻译。 6.增加了在多个文件夹搜索功能。 7.增加了用户自定义搜索引擎功能。

8.增加了图像工具，可以快速保存文件中原始图片，也可以进行打印、email、文字识别、发

送到WORD等多种操作。

9.增加（加强）了自动滚动方式，可以使用鼠标中键进行自动滚动及调整滚动速度。

10.增加了浏览状态保存功能，保存用户的浏览信息，在下次打开文件时，可以快速定位到上次阅读状态。

11.增加动态帮助，浏览器可以随机从服务器上取得最新帮助信息。 12.增强了图像处理引擎，提高了图像处理速度，减少了内存占用。 13.更广的缩放范围，实现从25%到6400%的缩放。 ****功能更新****

软件名称 CAJViewer 7.0提取图片pdf文字

CAJViewer 7.0全文浏览器是中国期刊网的专用全文格式阅读器，与CAJViewer 6.0相比，增加（修改）了以下功能：

1.增加页面旋转功能。可以全部或单独旋转某一页面，并能将旋转结果保存。

2.增加两种页面显示方式，即对开显示及连续对开显示，可以设置对开显示时的起始页，可以设置对开显示时是否显示页间空隙。

3.增加了新的标注类型，并能对标注属性进行修改。

4.增强了打印方法，可以实现双面打印，可以以讲义的方法打印，可以根据打印机性能进行优化。

5.增加了屏幕取词软件的支持，可以使用第三方翻译软件进行即时翻译。 6.增加了在多个文件夹搜索功能。 7.增加了用户自定义搜索引擎功能。

8.增加了图像工具，可以快速保存文件中原始图片，也可以进行打印、email、文字识别、发送到WORD等多种操作。

9.增加（加强）了自动滚动方式，可以使用鼠标中键进行自动滚动及调整滚动速度。

10.增加了浏览状态保存功能，保存用户的浏览信息，在下次打开文件时，可以快速定位到上次阅读状态。

11.增加动态帮助，浏览器可以随机从服务器上取得最新帮助信息。 12.增强了图像处理引擎，提高了图像处理速度，减少了内存占用。 13.更广的缩放范围，实现从25%到6400%的缩放。软件名称 CAJViewer 6.0

CAJViewer 6.0全文浏览器是中国期刊网的专用全文格式阅读器截至 2005 年 5 月为止的最新版本,是5.5的升级版本，修改了一些老版本中存在的问题，如：打印、显示乱码，部分KDH文件的浏览问题，同时新增加如下功能:图书管理功能,支持单页\\连续页浏览模式、知识元链接、自动滚动，文字编辑功能可将选择的内容发送到指定的Word文档，页面定位更加方便，支持书签、注释、高亮、直线，曲线、下划线,删除线和自定义知识元等八种标注功能，并有专门的标注窗口对它们进行管理，可对标注信息进行编辑，方便的书架管理让您更易于管理书籍,更加强大的搜索功能让您更加容易查找到感兴趣的文本，并且能迅速定位到文档的相关位置,友好丰富的帮助功能必定使您更容易掌握这款先进的产品。（OCR技术由清华文通授权使用）。

本站提供CAJViewer (提取PDF文字)，版权归该下载资源的合法拥有者所有。

方法一用TH-OCR XP软件，网上有下的。方法二打印后用扫描仪。

方法三（借鉴百度贴吧）用Office 2003提取图片中的文字

第一步我们需要安装“Microsoft Office Document Imaging”的组件，点“开始→程序”，

在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 即可安装运行。

第二步打开带有文字的图片或电子书籍等，找到你希望提取的页面，按下键盘上的打印屏幕键（PrintScreen）进行屏幕取图。

第三步打开Microsoft Office Word 2003 ，将刚才的屏幕截图粘贴进去；点击“文件”菜单中的“打印”，在安装Microsoft Office Document Imaging组件后，系统会自动安装一个名为“Microsoft Office Document Imaging Writer”的打印机。

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

jpg格式转化