天若文字识别软件下载 如何利用ABBYY FineReader识别图片中的文本
摘要由作者通过智能技术生成

一、天若图片vb 部分截屏之后识别图片上的文字文本文字

主要是先要将图片转换为字节数组

'存放格式为(*,*,*),从左下角开始:

'第一维:0-蓝色分量,1-绿色分量,2-红色分量,

'第二维:列;第三维:行

全部步骤如下

1、用DibGet获取图片数据

2、识别识别用ColorToBlackAndWhite(或ColorToGray+OtsuColorToBlackAndWhite)将图片数据转换为黑白数据

3、软件用DibPut将数据恢复到一个PictureBox中

4、下载截取各个数字到单独的何利PictureBox中

5、将数字图片转换为图片数据,天若图片并与标准数据(0-9)对比,文字文本相似度最高的识别识别为准(比如与1的相似度为75%,与2的软件相似度为85%,则此数字为2)

有问题Hi

'图像输出的下载过程:

Public Sub DIBPut(ByVal IdDestination As Long, ByRef ImageData() As Byte)

Dim LineBytes As Long

Dim Width As Long, Height As Long

Width= UBound(ImageData, 2)+ 1

Height= UBound(ImageData, 3)+ 1

On Error GoTo ErrLine

Done= False

With bi24BitInfo.bmiHeader

.biWidth= Width

.biHeight= Height

LineBytes=((Width* Bits+ 31) And&HFFFFFFE0)\ 8

.biSizeImage= LineBytes* Height

End With

SetDIBitsToDevice IdDestination, 0, 0, Width, Height, 0, 0, 0, Height, ImageData(0, 0, 0), bi24BitInfo, 0

Done= True

Exit Sub

ErrLine:

MsgBox Err.Description

End Sub

'灰度处理SrcData(0 to 2, 0 to宽度-1, 0 to高度-1)

Public Sub ColorToGray(ByRef SrcData() As Byte, ByRef DestData() As Byte, _

Optional Left As Long=-1, Optional Top As Long=-1, _

Optional Right As Long=-1, Optional Bottom As Long=-1)

Dim i As Long, j As Long, k As Long

Dim red As Byte, green As Byte, blue As Byte

Dim Color As Long, newcolor As Long

Dim Width As Long, Height As Long

Width= UBound(SrcData, 2)+ 1

Height= UBound(SrcData, 3)+ 1

If Left=-1 Then Left= 0

If Top=-1 Then Top= 0

If Right=-1 Then Right= Width- 1

If Bottom=-1 Then Bottom= Height- 1

For j= Left To Right

For k= Height- Bottom- 1 To Height- Top- 1

blue= SrcData(0, j, k)

green= SrcData(1, j, k)

red= SrcData(2, j, k)

newcolor= CLng(0.299* CDbl(red)+ 0.585* CDbl(green)+ 0.114* CDbl(blue))'

newcolor= newcolor* 65793

red= newcolor Mod 256

green= newcolor/ 256 Mod 256'(9798* RValue+ 19235* GValue+ 3735* BValue)/ 32768

blue= newcolor/ 256/ 256

DestData(0, j, k)= blue

DestData(1, j, k)= green

DestData(2, j, k)= red

Next

Next

End Sub

'黑白处理DestData(0 to 2, 0 to宽度-1, 0 to高度-1)

'图片最下面两行总是无法参与变换????只好将采集的图片区域向下多延伸2个像素

Public Sub ColorToBlackAndWhite(ByRef SrcData() As Byte, ByRef DestData() As Byte)

Dim i As Long, j As Long, k As Long

Dim red As Byte, green As Byte, blue As Byte

Dim Color As Long, newcolor As Long

Dim Width As Long, Height As Long

Width= UBound(SrcData, 2)+ 1

Height= UBound(SrcData, 3)+ 1

For j= 0 To Width- 1

For k= 0 To Height- 1

blue= SrcData(0, j, k)

green= SrcData(1, j, k)

red= SrcData(2, j, k)

newcolor= CLng(0.3* CDbl(red)+ 0.59* CDbl(green)+ 0.11* CDbl(blue))

' newcolor= CLng(0.39* CDbl(red)+ 0.5* CDbl(green)+ 0.11* CDbl(blue))

If newcolor> 127 Then newcolor= 255 Else newcolor= 0

red= newcolor

green= newcolor

blue= newcolor

DestData(0, j, k)= blue

DestData(1, j, k)= green

DestData(2, j, k)= red

Next

Next

End Sub

'黑白处理DestData(0 to 2, 0 to宽度-1, 0 to高度-1)

'图片最下面两行总是无法参与变换????只好将采集的图片区域向下多延伸2个像素

'OSTU算法可以说是自适应计算单阈值(用来转换灰度图像为二值图像)的简单高效方法。

'1978 OTSU年提出的何利最大类间方差法以其计算简单、稳定有效,天若图片一直广为使用。文字文本

Public Sub OtsuColorToBlackAndWhite(ByRef SrcData() As Byte,识别识别 ByRef DestData() As Byte)

On Error Resume Next

Dim i As Long, j As Long, k As Long

Dim red As Byte, green As Byte, blue As Byte

Dim Color As Long, newcolor As Long

Dim Width As Long, Height As Long

Dim AllSum As Long, SumSmall As Long, SumBig As Long, PartSum As Long

Dim AllPixelNumber As Integer, PixelNumberSmall As Long, PixelNumberBig As Long

Dim ProbabilitySmall As Double, ProbabilityBig As Double, Probability As Double, MaxValue As Double

Dim BmpData() As Byte, Threshold As Byte

Dim Histgram(255) As Integer'图像直方图,256个点

Dim PixelNumber As Integer

Width= UBound(SrcData, 2)+ 1

Height= UBound(SrcData, 3)+ 1

PixelNumber= Width* Height

For i= 0 To Width- 1

For j= 0 To Height- 1

Histgram(SrcData(0, i, j))= Histgram(SrcData(0, i, j))+ 1'统计图像的直方图

Next

Next

For i= 0 To 255

AllSum= AllSum+ i* Histgram(i)'质量矩

AllPixelNumber= AllPixelNumber+ Histgram(i)'质量

Next

MaxValue=-1#

For i= 0 To 255

PixelNumberSmall= PixelNumberSmall+ Histgram(i)

PixelNumberBig= AllPixelNumber- PixelNumberSmall

If PixelNumberBig= 0 Then Exit For

SumSmall= SumSmall+ i* Histgram(i)

SumBig= AllSum- SumSmall

ProbabilitySmall= CDbl(SumSmall)/ PixelNumberSmall

ProbabilityBig= CDbl(SumBig)/ PixelNumberBig

' Probability= PixelNumberSmall* PixelNumberBig*(ProbabilityBig- ProbabilitySmall)*(ProbabilityBig- ProbabilitySmall)

Probability= PixelNumberSmall* ProbabilitySmall* ProbabilitySmall+ PixelNumberBig* ProbabilityBig* ProbabilityBig

If Probability> MaxValue Then

MaxValue= Probability

Threshold= i

End If

Next

For j= 0 To Width- 1

For k= 0 To Height- 1

If SrcData(0, j, k)<= Threshold Then

DestData(0, j, k)= 0

DestData(1, j, k)= 0

DestData(2, j, k)= 0

Else

DestData(0, j, k)= 255

DestData(1, j, k)= 255

DestData(2, j, k)= 255

End If

Next

Next

End Sub

'迭代法(最佳阀值法)

'(1)求出图象的最大灰度值和最小灰度值,分别记为Zl和Zk,令初始阈值为:T=(Zl+Zk)/2

'(2)根据阈值TK将图象分割为前景和背景,分别求出两者的平均灰度值Z0和ZB:

'(3)令当前阈值Tk=(Z0+ZB)/2

'(4)若TK=TK+1,则所得即为阈值,否则转2,迭代计算。

Public Sub BestThresholdColorToBlackAndWhite(ByRef SrcData() As Byte, ByRef DestData() As Byte)

Dim i As Long, j As Long, k As Long

Dim red As Byte, green As Byte, blue As Byte

Dim Color As Long, newcolor As Long

Dim Width As Long, Height As Long

Dim PixelNumber As Integer

Dim Threshold As Integer, NewThreshold As Integer, MaxGrayValue As Integer

Dim MinGrayValue As Integer, MeanGrayValue1 As Integer, MeanGrayValue2 As Integer

Dim IP1 As Long, IP2 As Long, IS1 As Long, IS2 As Long

Dim Iteration As Long, Histgram(255) As Integer

Width= UBound(SrcData, 2)+ 1

Height= UBound(SrcData, 3)+ 1

PixelNumber= Width* Height

'求出图像中的最小和最大灰度值,并计算阈值初值为

MaxGrayValue= 0: MinGrayValue= 255

For i= 0 To Width- 1

For j= 0 To Height- 1

Histgram(SrcData(0, i, j))= Histgram(SrcData(0, i, j))+ 1'统计图像的直方图

If MinGrayValue> SrcData(0, i, j) Then MinGrayValue= SrcData(0, i, j)

If MaxGrayValue< SrcData(0, i, j) Then MaxGrayValue= SrcData(0, i, j)

Next

Next

NewThreshold=(MinGrayValue+ MaxGrayValue)/ 2

While Threshold<> NewThreshold And Iteration< 100

Threshold= NewThreshold

'根据阈值将图像分割成目标和背景两部分,求出两部分的平均灰度值

For i= MinGrayValue To Threshold

IP1= IP1+ Histgram(i)* i

IS1= IS1+ Histgram(i)

Next

MeanGrayValue1= CByte(IP1/ IS1)

For i= Threshold+ 1 To MaxGrayValue

IP2= IP2+ Histgram(i)* i

IS2= IS2+ Histgram(i)

Next

MeanGrayValue2= CByte(IP2/ IS2)

'求出新的阈值:

NewThreshold=(MinGrayValue+ MaxGrayValue)/ 2

Iteration= Iteration+ 1

Wend

For j= 0 To Width- 1

For k= 0 To Height- 1

If SrcData(0, j, k)<= Threshold Then

DestData(0, j, k)= 0

DestData(1, j, k)= 0

DestData(2, j, k)= 0

Else

DestData(0, j, k)= 255

DestData(1, j, k)= 255

DestData(2, j, k)= 255

End If

Next

Next

End Sub

二、图片上的文字有什么方法可以识别提取出来吗

图片上的文字有方法可以识别提取出来,具体操作步骤如下:

1、首先做好准备工作,将所需识别的图片在电脑中准备好,接着下载一个OCR文字识别软件,点击左侧导航栏上的图片局部识别这个功能。

2、进入图片局部识别版块后,点击添加文件按钮即可将所需识别的图片添加进来了。

3、接着点击框选工具,拖动鼠标在图片上将所需识别的文字框选出来,软件将会自动执行识别的命令。

4、识别成功后提取出来的文字就会显示在下面的方框中了。

三、如何利用ABBYY FineReader识别图片中的文本

作为一款OCR光学字符识别软件,ABBYY FineReader能够快速方便地将扫描纸质文档、PDF文件和数码相机的图像转换成可编辑、可搜索的文本,让电脑处理更具效率,摆脱从前的烦恼,告别耗时费力的手动输入和文件编辑。今天就给大家分享一篇别人使用ABBYY FineReader识别图片中文本的案例,看别人是如何利用ABBYY FineReader提高效率的:

昨天在微博收藏了几张图片格式的中英文对照的色谱,以后翻译的时候可能会用到,因此想到通过OCR(光学文字识别)识别处理后导入CAT中备用。之前在微博经常看到各位大佬儿推荐ABBYY FineReader,提到它无与伦比的识别效果,今天小试牛刀,兴奋不已,效果确实不错,对中文字符的识别度较高,不啰嗦,上图说明撒。

准备:找到预先保存的两张jpg格式的图片,安装最新版ABBYY FineReader 12软件。

目标:提取图片中的英文和中文栏,导出Excel格式的文本。

原始图片

操作过程1、由于图片中的文本分列显示,因此打开ABBYY FineReader 12后,选择Microsoft Excel项;

注:在这个窗口可以设置要识别的语言(简体中文和英文),以及色彩模式,这里可以选择全彩色和黑白模式,黑白模式的读取速度要稍快一些。

2、然后选择“图像或PDF文件到Microsoft Excel”,添加要识别的两张图片,打开后软件自动开始识别;也可以点击“文件”,新建一个文档,然后直接把要识别的图片拖放到软件左列,同样可以打开进行识别;

3、考虑到图片文字可能会出现模糊,文本歪斜和转向,因此选择取消识别,先对图片进行编辑处理,点击上面工具栏里的“编辑图像”,右侧打开编辑工具列表;

4、首先,要对图像进行歪斜校正,如扫描的图片不规整,在扫描后会提示对需要进行校正的图片进行歪斜校正,这里可以选定“全部页面”,然后点击“歪斜校正”;若图片是旋转90度或倒转后的图片,可在这里将其旋转或翻转处理;

5、接下来,也是最重要的,就是调整图片的分辨率,有些图片模糊不清,会影响软件识别效果,这里可将图片的分辨率设为扫描图像的分辨率,即300dpi,这个值基本上都可以正常识别了,也可以自定义分辨率。通过这个选项,可分别单张设置图片的分辨率,也可以选奇数页或偶数页和全部页面,为了不影响识别,这里可以选择“所有页面”;

6、然后就可以退出图像编辑器;

7、由于我们只需要中英文对照的两列文本,其他无关的内容可以不进行识别,因此,可选择要识别的区域,即点击中间一栏左上角的“A”按钮,可选择两列要识别的文本;

8、选定后的文本呈浅绿色,然后点击选中区域,在弹出的工具栏选择按钮“A”,找到里面的“表格”项,这样识别后的文本就成两列对照的文本了;

9、然后,点击上面工具栏里的“读取”选项,开始识别;

10、下图为识别后的效果图,最右侧一栏是识别的文本内容,在该栏头部,可对识别的文本格式进行设置,如设置字体,字号、倾斜、加粗等;

11、识别后的文本中,绿色显示的是可能存在拼写或识别错误或置信度较低的字符,如果未做处理直接导出,可能会影响以后使用。这时,可选择工具栏里的“验证文本”,对绿色标记部分进行编辑确认;

12、操作过程中,会发现标记为绿色的文本有些并没有拼写错误,可能只是字体设置不当,这种情况下只需要忽略跳过即可,存在识别错误的文字,进行更改替换,FineReader自带的字典会提示可能正确的识别变量,选择正确的文字,点击“替换”或“全部替换”,然后“确认”即可;

13、上图是验证后的文本,是不是美观多了?

14、然后输出文本,点击工具栏内的“保存”,即保存为Excel格式的文件,默认状态下,保存好的文件会自动打开;

15、这是导出后的文件,再次对字体和字号进行调整,使其看起来更加美观。然后就可以把它导入各种CAT(计算机辅助翻译)软件中,以后翻译时,如果出现此类术语,CAT即可自动提示,是不是省去google挨个儿查询的苦恼了?

四、电脑上的学习软件有哪些

一、Word.

大学生需要在大学里面掌握一些word的基本技巧,毕竟这款软件是大学生在大学里面经常需要使用到的。有些专业的大学生需要经常的写一些小论文,这些论文也是他们的平时作业;在写这些小论文的时候,肯定需要对相关的文字资料进行排版,当然还需要掌握一些其他方面的基本技能。

大学生在大学期间使用word的另外一个重要场景,是大家在写毕业论文的时候,在写毕业论文的时候整个论文的规模还是比较庞大的,不仅需要进行打字、排版,而且有时候还需要插入一些图表、公式,所以这个时候如果已经提前掌握了相应的技巧的话,在写毕业论文的时候就能够得心应手了。

二、Excel.

某些专业的学生在大学期间学习专业课的时候,可能需要使用到大量的数据,在处理数据的时候就要需要用到Excel软件。像我们当时在大学里面学习数学课程的时候,就要对相关的数据进行处理,当把所有的数据都统计在Excel表格里面的时候,就通过相应的方法来把这些数据做成对应的表格、圆饼图、柱状图,当然不同专业在使用Excel表格的时候有不同的作用,即使是大学生在大学毕业以后参加工作,也是有可能经常会使用到这些办公用具的。

三、PPT.

大学生在大学里面使用PPT软件也是很频繁的。大学课程里面的很多课程都是在多媒体教室里面上的,那些老师在演示课程的时候都会使用PPT软件来进行课程的讲解,所以这种软件的使用场景也是很频繁的。像我们在大学里面学习英语课的时候,英语老师就给全班的同学进行了不同的分组,大家要提前的准备材料,下节课的时候需要在课堂上进行演示,每当这个时候大家就在一起商讨PPT如何去制作。

四、PS.

可能有的大学生觉得在大学里面学习ps没有什么用,的确在大学里面ps的使用场景并不是特别特别的多,不过这种软件可能在以后工作的时候使用的机会会比较大,如果在这里面能够掌握这门技术的话,在将来找工作的时候肯定也是更加有竞争力的。

五、PDF.

但医生在电脑里面也是需要装上pdf软件的,因为很多学习材料都是这种格式的。

六、CAD.

某些特定专业的大学生需要在大学里面进行工程画图,这个时候就需要使用到CAD软件了。

参考资料:在线ocr证件识别

举报/反馈

评论

发表
一、公认最好的手机OCR文字识别软件有哪些OCROptical Character Recognition,光学字符识别)是指电子设备例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定
2024-10-15 08:00 举报
回复
一、什么手机软件可以实现拍照识别文字好的手机拍照翻译软件推荐:找翻译、拍拍译、有道翻译官、小猿搜题、扫描翻译大师。1、找翻译:找翻译是译云旗下翻译服务平台推出的、提供便捷快速的个人翻译工具,以满足用户
2024-10-15 07:21 举报
回复
一、捷速ocr文字识别软件注册码刚发现有更好用的,推荐给你哈。一款今年新出的App名字叫“猫图鹰”,拍照OCR文字识别效果特别好,平时扫描合同,识别文字都用它,越用越喜欢,团队也特别棒,更新很及时,做
2024-10-15 07:16 举报
回复
一、跳槽入职新公司,虚报了工资,hr要银行流水怎么办因为跳槽,刚通过面试入职一家新公司。因为面试的时候对面试官撒了谎,才拿到现在的工资。现在HR问我上一家公司上班时领工资的银行。这时候我该怎么办?有人
2024-10-15 06:42 举报
回复
一、福昕PDF套件的OCR识别功能。福昕PDF套件效果不怎么样啊,图片转文本工具有不少,也有在线识别的网站,直接上传识别就行了下载安装都省了我经常用的一个是ocrking可以在线识别图片和pdf,英文
2024-10-15 05:49 举报
回复
查看更多评论