CN1734472A - 生成劣化字符图像的方法和装置 - Google Patents

生成劣化字符图像的方法和装置 Download PDF

Info

Publication number
CN1734472A
CN1734472A CNA2004100581716A CN200410058171A CN1734472A CN 1734472 A CN1734472 A CN 1734472A CN A2004100581716 A CNA2004100581716 A CN A2004100581716A CN 200410058171 A CN200410058171 A CN 200410058171A CN 1734472 A CN1734472 A CN 1734472A
Authority
CN
China
Prior art keywords
plane
character picture
delineation
deterioration
scenery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004100581716A
Other languages
English (en)
Other versions
CN100377171C (zh
Inventor
孙俊
胜山裕
直井聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CNB2004100581716A priority Critical patent/CN100377171C/zh
Priority to US11/200,202 priority patent/US7480409B2/en
Priority to JP2005234861A priority patent/JP2006053568A/ja
Publication of CN1734472A publication Critical patent/CN1734472A/zh
Application granted granted Critical
Publication of CN100377171C publication Critical patent/CN100377171C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/133Evaluation of quality of the acquired characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1914Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries, e.g. user dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Processing (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明提供了一种用于在不同劣化水平下自动生成劣化字符图像的方法和装置,在本发明中,首先将字符图像绘制在景物平面上;根据不同的参数对景物平面进行平移和旋转;根据不同的参数确定字符图像在图像平面的投影区域;生成像素区域掩码;并且通过超级采样生成最终的劣化图像。从而可以在不同的劣化条件下生成各种劣化字符图像。所生成的合成字符可用于光学字符识别(OCR)中的性能评定和训练数据的扩充。

Description

生成劣化字符图像的方法和装置
技术领域
本发明涉及自动生成劣化字符图像的方法和装置,更明确地说,涉及一种以视角转换和超级采样为基础的劣化图像生成方法和装置。所生成的劣化字符图像可以用于光学字符识别中的性能评定和训练数据扩充。
背景技术
随着数字成像装置的快速普及,视频字符的识别变得越来越重要。与传统的扫描文件相比,视频文件中的字符通常会出现大幅劣化,不便于识别。自动视频字符图像生成方法对于视频字符的识别非常有用。生成的模式可以用于评估光学字符识别引擎在视频劣化条件下的工作性能。另外,合成的视频字符图像可以加入训练数据中来建立劣化光学字符识别词典,从而改进真实视频字符的识别效果。
关于劣化模式的生成有很多发表过的论文和专利,例如:
P.Sarkar,G.Nagy,J.Zhou,and D.Lopresti.Spatial samplingof printed patterns.IEEE PAMI,20(3):344-351,1998
E.H.Barney Smith,X.H.Qiu,Relating statisticai imagedifferences and degradation features.LNCS 2423:1-12,2002
T.Kanungo,R.M.Haralick,I.Phillips.“Global and LocalDocument Degradation Models,”Proceedings of IAPR 2ndInternational Conference on Document Analysis and Recognition,Tsukuba,Japan,1993pp.730-734
H.S.Baird,“Generation and use of defective images in imageanalysis”.美国专利No.5,796,410。
这些方法可以生成多种类型的劣化字符模式。但是,Sarkar的方法只有在目标图像的分辨率比原始图像低得多的时候才有效。Kanungo的劣化模型缺少一种清晰的自然背景。Baird的发明只集中在扫描过程所导致的劣化上。这些方法都没有解决由视频成像所导致的模式劣化问题。
发明内容
本发明的目的即是解决由视频成像所导致的模式劣化问题。
根据本发明的目的,在本发明的一个方面,提供了一种在不同劣化水平上形成字符图像的方法,该方法包括如下步骤:将字符图像绘制在景物平面上;根据不同的参数对景物平面进行平移和旋转;根据不同的参数确定字符图像在图像平面的投影区域;生成像素区域掩码;以及通过超级采样生成最终的劣化图像。
在本发明的另一个方面,提供了一种在用于不同劣化水平上形成字符图像的劣化字符图像的装置,该装置包括:字符图像绘制部,其将字符图像绘制在景物平面;景物平面变换部,其根据不同的参数对景物平面进行平移和旋转;投影区域确定部,其根据不同的参数确定字符图像在图像平面的投影区域;像素区域掩码生成部,用于生成像素区域掩码;以及劣化图像生成部,其通过超级采样生成最终的劣化图像。
根据本发明的方法,可以在不同的劣化条件下生成劣化字符。
本发明的方法和装置生成的字符图像可以用于劣化图像显示或词典编制。从生成的劣化字符图像得来的词典对于真正的坏损字符识别非常有效。
附图说明
图1是根据本发明一个实施例的劣化图像生成装置所执行的方法的流程图。
图2是根据本发明一个实施例的劣化图像生成处理的图例。
图3示出了原始字符图像的一个例子。
图4示出了字符图像绘制结果的一个示例。
图5示出了景物平面平移结果的一个示例。
图6示出了景物平面旋转结果的一个示例。
图7示出了字符图像在图像平面的投影区域示例。
图8示出了景物平面上的像素区域掩码示例。
图9是所生成的最终劣化字符图像的一个示例。
具体实施方式
下面结合附图对本发明的自动生成劣化字符图像的方法和装置的优选实施例进行说明。
图1示出了本发明的劣化图像生成装置的一个优选实施例所执行的方法的流程图。
本发明的劣化图像生成装置的输入是原始字符图像101,原始字符图像101通常采用二值的格式。首先,字符图像绘制部102将原始图像描绘在一个二维景物平面上。景物平面变换部103对景物平面进行平移和旋转。然后投影区域确定部104确定字符图像在图像平面上的投影区域。接着像素区域掩码生成部105生成像素区域掩码。最后,劣化图像生成部106通过超级采样生成劣化图像,并将所得到的劣化字符图像输出,作为本发明的劣化图像生成装置的输出。
本发明的劣化图像生成装置可以由恰当编程的处理器和相关的存储器构成。根据本发明,本领域普通技术人员可以容易地构造出本发明的劣化图像生成装置。因此,为清楚起见,不再对本发明的劣化图像生成装置的各个构件的结构进行更多说明。
在本发明的劣化图像生成装置和方法中有两个关键问题,即如何确定生成图像在不同参量设定下的区域,以及如何确定生成的字符图像中每一像素点的像素值。
对于第一个问题,需要通过视角转换将原始字符图像的4个顶点映射在图像平面上。这4个投射的顶点所形成的四边形区域就是劣化图像的生成区域。至于第二个问题则是由于劣化字符图像中的像素与原始图像中的像素不存在一对一的对应关系而造成的,劣化图像中的每一个像素实际上都是与景物平面中的一个四边形区域相对应的。因此,图像平面中的像素灰度值应该由景物平面中四边形区域的平均灰度值来确定。
下面结合图2至图9对本发明的劣化图像生成装置和方法的一个优选实施例进行更加详细的说明。
首先,字符图像绘制部102把原始字符图像绘制在景物平面上。图2示出了将原始图像绘制到一个二维景物平面上的一个示例。景物平面是一个二维平面。在图2所示的示例中,景物平面与x-y面重叠,景物平面的原点(0,0)与整体坐标原点(0,0,0)重合。为了简便起见,假设视点P3在z轴上,像素坐标为Ps=(0,0,d)。字符图像绘制部102把原始图像绘制在该景物平面上。由于现实中的视频字符并不总是二值的,可以根据具体需要对笔画像素和后台像素的灰度值进行调整。因此,绘制出的图像就变成了灰度图像。图3示出了一个典型的原始字符图像。字符图像的大小为640×640像素。图4示出了绘制结果的一个例子。图像中后台点的灰度值调整为196。图像中笔画点的灰度值设定为0。
接着,景物平面变换部103对景物平面进行变换。这一变换包括2个部分:平移和旋转。首先在x-y面内对景物平面进行平移,然后再绕坐标原点旋转。平移度由x轴方向的平移量tx和y轴方向的平移量ty确定。旋转度由绕z轴的旋转角度ψ、绕y轴的旋转角度θ和绕x轴的旋转角度φ确定。图5示出了平移的一个例子,其中tx=400,ty=300。图6示出了图5按旋转角度ψ=10度,θ=20度,φ=30度旋转后的结果。
假设P0是初始景物平面上的一点,它的景物坐标为(x0,y0),三维空间中的像素坐标为(x0,y0,0)。P1是景物平面变换后的同一点。P1在三维空间中的像素坐标为(x1,y1,z1)。假设景物平面的平移向量为t=[tx,ty,0]T,将x-y平面变换成景物平面的旋转矩阵是分别对应x轴、y轴和z轴的Rx,Ry和Rz。P0与P1的关系是:
             P1=RzRyRxP0+t                    (1)
其中P1=[x1,y1,z1]T,P0=[x0,y0,0]T R x = 1 0 0 0 cos φ - sin φ 0 sin φ cos φ , R y = cos θ 0 sin θ 0 1 0 - sin θ 0 cos θ , R z = cos ψ - sin ψ 0 sin ψ cos ψ 0 0 0 1 , φ、θ和ψ分别是绕x轴、y轴和z轴的旋转角度。
在景物平面变换部103对景物平面进行变换之后,投影区域确定部104基于一个固定的视点(例如,摄像头的中心)和一个固定的图像平面(即形成最终劣化图像的平面),确定绘制好的字符图像在图像平面上的投影区域。
图像平面是一个与z轴垂直的二维平面。P3到图像平面的距离就是焦距f。图像平面中的所有点都具有相同的z坐标值。在确定视点之后,景物平面上的每一点通过视角转换都会在图像平面上产生一个投影。景物平面上的所有字符图像点在图像平面上的投影就组成了投影字符图像,也就是本发明的装置和方法的输出。
具体来讲,假设TL、TR、BL、BR这4点分别是绘制好的字符图像经景物平面变换之后的左顶点、右顶点、左底点和右底点,图像平面上的4个投射点TL’、TR’、BL’、BR’的像素坐标可以通过下面所述的公式(4)和(5)得出。这4个点会形成一个不规则的四边形,可以视作字符图像投影区域。
下面对将景物平面上的点投影到图像平面上的处理进行详细说明。
假设P2是P1在图像平面上的投射点。P1、P2和P3同在一条直线上。根据三角形的相似性,可以得出如下等式:
(x3-x2)/(x3-x1)=(z3-z2)/(z3-z1)                     (2)
(y3-y2)/(y3-y1)=(z3-z2)/(z3-z1)                     (3)
在(1)~(3)中共有5个等式。已知变量是:x3=0,y3=0,z3=0,z2=d-f。未知变量是x0,y0,x1,y1,z1,x2,y2。给定景物坐标x0,y0,可以通过求解(1)~(3)得出其在图像平面上的对应坐标x2,y2
x 2 = f t x cos θ cos ψ - t y cos φ sin ψ + t y sin φ sin θ cos ψ - y o cos φ sin ψ + x 0 cos θ cos ψ + y 0 sin φ sin θ cos ψ ( d + t x sin θ - t y sin φ cos θ + x 0 sin θ - y 0 sin φ cos θ ) - - - - ( 4 )
y 2 = f t x cos θ sin ψ + t y cos φ cos ψ + t y sin φ sin θ sin ψ + y 0 cos φ cos ψ + x 0 sin θ sin ψ + y 0 sin φ sin θ sin ψ ( d + t x sin θ - t y sin φ cos θ + x 0 sin θ - y 0 sin φ cos θ ) - - - - ( 5 )
给定x2,y2则x0,和y0的计算公式为:
x 0 = - t x - x 2 d cos ψ cos φ + x 2 d sin ψ sin φ sin θ + y 2 d sin ψ cos φ - y 2 d cos ψ sin φ sin θ - f cos ψ cos ψ cos θ cos φ - f sin ψ sin ψ cos θ cos φ + x 2 sin ψ cos θ cos θ sin φ + x 2 cos ψ sin θ cos φ + x 2 sin ψ sin θ sin θ sin φ - y 2 cos ψ cos θ cos θ sin φ + y 2 sin ψ sin θ cos φ - y 2 cos ψ sin θ sin θ sin φ - - - - ( 6 )
y 0 = - t y + ( d cos θ ( x 2 sin ψ - y 2 cos ψ ) ) - f cos ψ cos ψ cos θ cos φ - f sin ψ sin ψ cos θ cos φ + x 2 sin ψ cos θ cos θ sin φ + x 2 cos ψ cos θ cos φ + x 2 sin ψ sin θ sin θ sin φ - y 2 cos ψ cos θ cos θ sin φ + y 2 sin ψ sin θ cos φ - y 2 cos ψ sin θ sin θ sin φ - - - - ( 7 )
由此,字符投影区域确定部104确定了变换后的字符图像在图像平面上的投影区域。图7显示了图像平面上的字符图像投影区域的一个示例。
在确定图像平面上的投影区域之后,由像素区掩码生成部105生成像素区掩码。通常,在景物平面像素与图像平面像素之间并不存在像素到像素的对应关系。图像平面上的一个像素对应着景物平面上的一个多边形区域。图像平面上的像素灰度值由景物平面上多边形区域的平均灰值来确定。在本发明中,假设图像平面上投影区域内的每一像素都用一个单独的正方形来表示。假设正方形的4个顶点分别是PTL、PTR、PBL、PER,这4点通过公式(6)和(7)的计算得出景物平面上的对应点PTL’、PTR’、PBL’、PBR’。这样,图像平面上的单位正方形就被绘制成景物平面上的一个由PTL’、PTR’、PBL’、PBR’四点连结而成的四边形区域。这一区域就被称为像素区域掩码。图8表明了图7在景物平面上的所有像素区域掩码。
最后,由劣化图像生成部106根据相应像素区域掩码中的平均灰度值来计算字符图像投影区域中某一点的像素值。
对于字符图像投影区域中的每一个像素来说,通过像素区域掩码生成部105确定了其在景物平面上的对应区域。劣化图像生成部106将图像平面丄像素的灰度值设定为对应掩码区域的平均灰度值,从而输出最终的劣化字符图像107。图9示出了最终生成劣化字符图像的结果(扩大了4倍)。
至此,本发明的劣化图像生成装置完成了劣化字符图像的生成处理。可见,本发明的劣化图像生成装置和方法可以根据不同的劣化条件生成不同的劣化字符图像。例如,可以通过景物平面的平移量、绕3个轴的旋转量,以及景物平面与图像平面的位置等,确定不同的劣化条件,从而可以得到各种劣化条件下的劣化字符图像。
另外,以上通过本发明的一个优选实施例对本发明进行了说明。但是可以理解,本发明并不限于上述的具体细节。在权利要求所限定的范围之内,可以对本发明的劣化图像生成装置和方法进行各种形式和细节上的变化。

Claims (12)

1.一种在不同的劣化水平上形成劣化字符图像的方法,该方法包括如下步骤:
将字符图像绘制在景物平面上;
根据不同的参数对景物平面进行平移和旋转;
根据不同的参数确定字符图像在图像平面的投影区域;
生成像素区域掩码;以及
通过超级采样生成最终的劣化图像。
2.根据权利要求1所述的方法,其中,所述字符图像绘制步骤包括:
在一个二维平面上绘制字符图像;以及
变换字符笔画和背景的灰度值。
3.根据权利要求1所述的方法,其中,所述景物平面平移和旋转步骤包括:
沿x轴和y轴的方向平移所述景物平面;以及
绕x、y、z轴旋转所述景物平面。
4.根据权利要求1所述的方法,其中,确定字符图像在图像平面上的投影区域这一步骤包括:
确定字符图像在景物图像中的4个顶点;
计算这4个顶点投影在图像平面上的像素坐标;
用这4个投影顶点在图像平面上构建一个四边形的区域,将该四边形围起来的区域作为字符图像的投影区域。
5.根据权利要求1所述的方法,其中,在景物平面生成像素区域掩码这一步骤包括:
将图像平面中字符图像投影区域内的每一个点描绘成一个规则多边形;
将所述规则多边形的各个顶点投影在景物平面上;
将由景物图像中的各个投影顶点形成的多边形区域作为图像平面中像素在景物图像中的像素区域掩码。
6.根据权利要求1所述的方法,其中,生成劣化图像的步骤包括:
针对图像平面上字符图像投影区域中的每一个点,在像素区域掩码限定的区域内部选定景物平面中的所有像素;
计算出所选像素的平均灰度值,将其作为图像平面中的像素值。
7.一种用于在不同的劣化水平上形成劣化字符图像的装置,包括:
字符图像绘制部,其将字符图像绘制在景物平面上;
景物平面变换部,其根据不同的参数对景物平面进行平移和旋转;
投影区域确定部,其根据不同的参数确定字符图像在图像平面的投影区域;
像素区域掩码生成部,其生成像素区域掩码;以及
劣化图像生成部,其通过超级采样生成最终的劣化图像。
8.根据权利要求7所述的装置,其中,所述字符图像绘制部在一个二维平面上描绘字符图像,并变换字符笔画和背景的灰度值。
9.根据权利要求7所述的装置,其中,所述景物平面变换部沿x轴和y轴的方向平移景物平面,并绕x、y、z轴旋转景物平面。
10.根据权利要求7所述的装置,其中,所述投影区域确定部确定字符图像在景物图像中的4个顶点;计算这4个顶点投影到图像平面上的像素坐标;用这4个投影顶点在图像平面上构建一个四边形的区域,将该四边形围起来的区域作为字符图像的投影区域。
11.根据权利要求7所述的装置,其中,像素区域掩码生成部将图像平面中字符图像投影区域内的每一个点描绘成一个规则多边形;将该规则多边形的各个顶点投影在景物平面上;并将由景物图像中的各个投影顶点形成的多边形区域作为图像平面中像素在景物平面中的像素区域掩码。
12.根据权利要求7所述的装置,其中,所述劣化图像生成部针对图像平面上字符图像投影区域中的每一个点,在像素区域掩码限定的区域内部选定景物平面中的所有像素;计算出所选像素的平均灰度值,将其作为图像平面中的像素值。
CNB2004100581716A 2004-08-13 2004-08-13 生成劣化字符图像的方法和装置 Expired - Fee Related CN100377171C (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CNB2004100581716A CN100377171C (zh) 2004-08-13 2004-08-13 生成劣化字符图像的方法和装置
US11/200,202 US7480409B2 (en) 2004-08-13 2005-08-10 Degraded character image generation method and apparatus
JP2005234861A JP2006053568A (ja) 2004-08-13 2005-08-12 劣化文字画像生成プログラム、方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100581716A CN100377171C (zh) 2004-08-13 2004-08-13 生成劣化字符图像的方法和装置

Publications (2)

Publication Number Publication Date
CN1734472A true CN1734472A (zh) 2006-02-15
CN100377171C CN100377171C (zh) 2008-03-26

Family

ID=36031031

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100581716A Expired - Fee Related CN100377171C (zh) 2004-08-13 2004-08-13 生成劣化字符图像的方法和装置

Country Status (3)

Country Link
US (1) US7480409B2 (zh)
JP (1) JP2006053568A (zh)
CN (1) CN100377171C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107274345A (zh) * 2017-06-07 2017-10-20 众安信息技术服务有限公司 一种中文打印字符图像合成方法及装置

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US8369655B2 (en) 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US8276088B2 (en) 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US8600989B2 (en) 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US8335789B2 (en) 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US7970171B2 (en) * 2007-01-18 2011-06-28 Ricoh Co., Ltd. Synthetic image and video generation from ground truth data
US8838591B2 (en) 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US8195659B2 (en) 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US8825682B2 (en) 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US8156427B2 (en) * 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US8144921B2 (en) 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US9373029B2 (en) * 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US8176054B2 (en) 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US10192279B1 (en) 2007-07-11 2019-01-29 Ricoh Co., Ltd. Indexed document modification sharing with mixed media reality
US8385589B2 (en) 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US8510283B2 (en) 2006-07-31 2013-08-13 Ricoh Co., Ltd. Automatic adaption of an image recognition system to image capture devices
US8856108B2 (en) 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US8332401B2 (en) 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US8521737B2 (en) 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US8184155B2 (en) 2007-07-11 2012-05-22 Ricoh Co. Ltd. Recognition and tracking using invisible junctions
US8489987B2 (en) 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US8201076B2 (en) * 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US8676810B2 (en) 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
US9020966B2 (en) 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
US9063952B2 (en) 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US8594384B2 (en) * 2007-11-30 2013-11-26 Hewlett-Packard Development Company, L.P. Method and system for measuring text-rendering quality
US8385660B2 (en) 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
JP2011254240A (ja) * 2010-06-01 2011-12-15 Sony Corp 画像処理装置、画像処理方法およびプログラム
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
US9262694B2 (en) * 2011-12-16 2016-02-16 Nec Corporation Dictionary learning device, pattern matching apparatus, method for learning dictionary and storage medium
HUP1200018A2 (en) 2012-01-11 2013-07-29 77 Elektronika Mueszeripari Kft Method of training a neural network, as well as a neural network
WO2014144306A1 (en) * 2013-03-15 2014-09-18 Arizona Board Of Regents On Behalf Of Arizona State University Ensemble sparse models for image analysis and restoration
CN111626124A (zh) * 2020-04-24 2020-09-04 平安国际智慧城市科技股份有限公司 Ocr图像样本生成、印刷体验证方法、装置、设备及介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5796410A (en) * 1990-06-12 1998-08-18 Lucent Technologies Inc. Generation and use of defective images in image analysis
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
JPH06274641A (ja) * 1993-03-19 1994-09-30 Fujitsu Ltd アンチエイリアシング直線表示装置
DE69431294T2 (de) * 1993-03-25 2003-04-17 Mgi Software Corp Bildverarbeitungsverfahren und -system
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US6389163B1 (en) * 1994-11-18 2002-05-14 Xerox Corporation Method and apparatus for automatic image segmentation using template matching filters
CA2201557A1 (en) * 1996-04-05 1997-10-05 John D. Hobby Degraded character image restoration
US6453069B1 (en) * 1996-11-20 2002-09-17 Canon Kabushiki Kaisha Method of extracting image from input image using reference image
US6671404B1 (en) * 1997-02-14 2003-12-30 Hewlett-Packard Development Company, L.P. Method and apparatus for recognizing patterns
JPH10341330A (ja) * 1997-06-06 1998-12-22 Minolta Co Ltd 画像形成装置
US6782129B1 (en) * 1998-09-23 2004-08-24 Xerox Corporation Image segmentation apparatus and method
CN1210944C (zh) * 1998-10-02 2005-07-13 旺宏电子股份有限公司 用于防止梯形失真的方法和装置
US6493463B1 (en) * 1999-09-09 2002-12-10 Xerox Corporation Segmentation tag cleanup using neighborhood tags
JP2001223885A (ja) * 1999-11-29 2001-08-17 Canon Inc 画像処理装置及びその方法とその記憶媒体
US6735337B2 (en) * 2001-02-02 2004-05-11 Shih-Jong J. Lee Robust method for automatic reading of skewed, rotated or partially obscured characters
US6778700B2 (en) * 2001-03-14 2004-08-17 Electronics For Imaging, Inc. Method and apparatus for text detection
US7079686B2 (en) * 2002-08-20 2006-07-18 Lexmark International, Inc. Systems and methods for content-based document image enhancement

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107274345A (zh) * 2017-06-07 2017-10-20 众安信息技术服务有限公司 一种中文打印字符图像合成方法及装置

Also Published As

Publication number Publication date
US20060056697A1 (en) 2006-03-16
US7480409B2 (en) 2009-01-20
CN100377171C (zh) 2008-03-26
JP2006053568A (ja) 2006-02-23

Similar Documents

Publication Publication Date Title
CN1734472A (zh) 生成劣化字符图像的方法和装置
CN110570429B (zh) 一种基于三维点云的轻量级实时语义分割方法
TWI709107B (zh) 影像特徵提取方法及包含其顯著物體預測方法
CN103325112B (zh) 动态场景中运动目标快速检测方法
EP0701225B1 (en) System for transcribing images on a board using a camera based board scanner
CN1091270C (zh) 零部件检测方法
CN101394573B (zh) 一种基于特征匹配的全景图生成方法及系统
CN105046649A (zh) 一种去除运动视频中运动物体的全景图拼接方法
CN1851555A (zh) 实现二维全景真实成像的方法
CN105389808A (zh) 一种基于二消失点的相机自标定方法
CN1878319A (zh) 基于平面单应矩阵特征线的摄像机标定方法
CN1300503A (zh) 摄像机运动参数估计方法
WO2018219156A1 (zh) 结构光编码方法、装置及终端设备
CN109712071A (zh) 基于航迹约束的无人机图像拼接与定位方法
CN103226828B (zh) 一种水下机器人声视觉三维成像的图像配准方法
CN111126381A (zh) 一种基于r-dfpn算法的绝缘子倾斜定位与识别方法
CN111784587B (zh) 一种基于深度学习网络的发票照片位置矫正方法
CN1411046A (zh) 图形评价装置、图形评价方法及程序
US20220358679A1 (en) Parameter Calibration Method and Apparatus
CN110084743A (zh) 基于多航带起始航迹约束的图像拼接与定位方法
CN108961182A (zh) 针对视频图像的竖直方向灭点检测方法及视频扭正方法
CN115049935B (zh) 一种城市违章建筑分割检测方法
CN1924898A (zh) 畸变qr码图像的扭正方法
CN113358659B (zh) 一种用于高铁箱梁裂缝自动化检测的相机阵列式成像方法
Zhu et al. Research on the Influence of Perspective Angle on Document Image Correction Results

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080326

Termination date: 20120813