CN1420472A - 彩色文献图像的自适应二值化方法和设备 - Google Patents

彩色文献图像的自适应二值化方法和设备 Download PDF

Info

Publication number
CN1420472A
CN1420472A CN02151398A CN02151398A CN1420472A CN 1420472 A CN1420472 A CN 1420472A CN 02151398 A CN02151398 A CN 02151398A CN 02151398 A CN02151398 A CN 02151398A CN 1420472 A CN1420472 A CN 1420472A
Authority
CN
China
Prior art keywords
yiq
image
value
variable
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN02151398A
Other languages
English (en)
Other versions
CN1237475C (zh
Inventor
郭金红
张一春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1420472A publication Critical patent/CN1420472A/zh
Application granted granted Critical
Publication of CN1237475C publication Critical patent/CN1237475C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/01Solutions for problems related to non-uniform document background
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本申请公开了一种彩色文献图像的自适应二值化方法和设备,该方法包括:对于图像的各列,初始化代表局部列低象素值和局部列高象素值的第一组变量,并且对于图像的各行,初始化代表局部行低象素值和局部行高象素值的第二组变量。对每个象素重复下述步骤:确定依赖于当前象素位置的第一组变量和第二组变量的阈值,把代表当前象素位置的图像象素的值和确定的阈值进行比较,根据比较结果,把当前象素位置的二值化象素设置为两个值中的一个,并根据比较结果,调整包含在第一组变量和第二组变量内的值。

Description

彩色文献图像的自适应二值化方法和设备
技术领域
本发明涉及图像的二值化方法和设备,更具体地说涉及复杂背景下的彩色图像或灰度级图像的二值化方法和设备。
背景技术
黑白图像的光学字符识别(OCR)已为人们所知。但是,彩色文献的普及需要通常带有复杂背景的灰度级和/或彩色字符的文本识别。例如,通常在广告和杂志中可找到带有这种背景的文本。有时,遇到的文本位于复杂的织纹背景或者从一种颜色逐渐变成另一种颜色的背景上。传统的全程阈值方法难以处理这种背景。
更具体地说,在目前的至少一种光学字符识别(OCR)软件包中利用全程阈值方法。整个图像的单一全程阈值的产生既快速又简单。但是,只有当图像背景非常均匀时,全程阈值才能提供满意的结果。即使借助用户的介入,利用全程阈值方法的OCR软件也不能处理具有不均匀亮度或复杂背景,例如织纹背景的图像。
发明内容
于是本发明的一个方面提供一种图像的二值化方法,所述图像具有N列×M行象素,并且第一列形成图像的第一边,最后一列形成图像的与第一边相对的第二边,图像的第一行形成图像的第三边,图像的最后一行形成图像的与第三边相对的第四边。产生二值化象素阵列的方法包括:
(a)对于图像的各列,初始化代表局部列低象素值(local columnlowpixel value)的第一变量和代表局部列高象素值的第二变量,对于图像的各行,初始化代表局部行低象素值的第三变量和代表局部行高象素值的第四变量;
(b)从第一列到最后一列,对图像的各列迭代重复步骤(c)-(f);
(c)从第一行到最后一行,对图像的各行迭代重复步骤(d)-(f);
(d)确定和位于位置索引所示列的第一变量和第二变量有关,并且和位于位置索引所示行的第三变量和第四变量相关的阈值,位置索引取决于被迭代的列和被迭代的行;
(e)把代表位于位置索引的图像象素的值和确定的阈值进行比较;
(f)根据比较结果,把位置索引的二值化象素设置为第一值或者第二值,并且根据比较结果,调整第一变量和第三变量的值,或者调整第二变量和第四变量的值。
本发明的另一方面提供一种对图像进行二值化的计算设备,所述图像具有N列×M行象素,并且第一列形成图像的第一边,最后一列形成图像的与第一边相对的第二边,图像的第一行形成图像的第三边,图像的最后一行形成图像的与第三边相对的第四边。所述计算设备包括存储器和操作上与存储器耦接,用于读取存储器中的数值并把数值保存到存储器中的处理器,所述计算设备被配置成:
(a)在存储器中对于图像的各列,初始化代表局部低的第一方向象素值的第一变量和代表局部高的第一方向象素值的第二变量,对于图像的各行,初始化代表局部低的第二方向象素值的第三变量和代表局部高的第二方向象素值的第四变量;
(b)从第一列到最后一列,对图像的各列迭代重复(c)-(f);
(c)从第一行到最后一行,对图像的各行迭代重复(d)-(f);
(d)确定和位于位置索引所示列的第一变量和第二变量有关,并且和位于位置索引所示行的第三变量和第四变量相关的阈值,位置索引取决于被迭代的列和被迭代的行;
(e)把代表位于位置索引的图像象素的值和确定的阈值进行比较;
(f)根据比较结果,在存储器中把位置索引的二值化象素保存为第一值或者第二值,并且根据比较结果,调整第一变量和第三变量的保存值,或者调整第二变量和第四变量的保存值。
其中迭代(b)和(c)产生保存在存储器中的二值化象素阵列。
本发明的另一方面提供一种其上记录有指令的机器可读介质,所述指令被配置成指令计算设备进行下述操作,所述计算设备具有存储器和操作上和存储器耦接,用于读取存储器中的数值并把数值保存到存储器中的处理器:
(a)在存储器中,对具有N列×M行象素,第一列形成图像的第一边,最后一列形成图像的与第一边相对的第二边,第一行形成图像的第三边,最后一行形成图像的与第三边相对的第四边的图像的各列,初始化代表局部低的第一方向象素值的第一变量和代表局部高的第一方向象素值的第二变量,对该图像的各行,初始化代表局部低的第二方向象素值的第三变量和代表局部高的第二方向象素值的第四变量;
(b)从第一列到最后一列,对图像的各列迭代重复(c)-(f);
(c)从第一行到最后一行,对图像的各行迭代重复(d)-(f);
(d)确定和位于位置索引所示列的第一变量和第二变量有关,并且和位于位置索引所示行的第三变量和第四变量相关的阈值,位置索引取决于被迭代的列和被迭代的行;
(e)把代表位于位置索引的图像象素的值和确定的阈值进行比较;
(f)根据比较结果,在存储器中把位置索引的二值化象素保存为第一值或者第二值,并且根据比较结果,调整第一变量和第三变量的保存值,或者调整第二变量和第四变量的保存值。
其中迭代(b)和(c)产生保存于存储器中的二值化象素阵列。
根据下面提供的详细说明,本发明的其它可应用领域将变得显而易见。应明白当简要说明本发明的优选实施例的时候,详细说明和具体例子只是用于举例说明,而不是意图限制本发明的范围。
附图说明
根据详细说明和附图,能够更充分地理解本发明,其中:
图1是图解说明对彩色图像进行二值化的方法的一种方案的流程图。
图2是图像中象素的排列,例如被用作图1中表示的方法的输入的图像中象素排列的表示图。
图3是图解说明适合于执行图1中图解说明的方法的计算系统的一种结构的简化方框图。
具体实施方式
优选实施例的下述说明仅仅是对发明本质的举例说明,而不是本发明、其应用或用途的限制。
参见图1,本发明的一种方案10把自学习程序嵌入各种复杂背景下的彩色或灰度级图像的二值化(binarization)过程中。
已发现对于具有复杂背景的许多文献来说,除了从文本到反相文本(reversed text)的转变,以及从反相文本到文本的转变之外,当扫描文献时,文献的背景一般逐渐变化。如果某一象素位于较暗的区域,则由于周围区域中颜色背景的相关性的结果,随后的象素位于较暗区域的概率相对较高。利用这种假设,如果正在低对比度区域中进行扫描过程,则下一相邻象素的阈值同样被调低。
从而,在一种方案中并参见图1,已被彩色扫描的文献被转化成灰度级图像12。例如,RGB图像(即每个象素由R(红色)值、G(绿色)值和B(蓝色)值表示的图像)被转化成YIQ格式。代表亮度或灰度级的YIQ_Y值被用于二值化。(从NTSC彩色电视标准了解YIQ格式,其中“Y”是感觉的亮度信号,“I”是得自于R-Y的色差信号,“Q”是得自于B-Y的色差信号,这里“R”是红色信号,“R”是蓝色信号。如同这里使用的一样,亮度信号或灰度级信号被表示为YIQ_Y。)
在利用灰度级而不是彩色图像的方案中,由于直接使用象素的灰度值,因此不需要向YIQ的转换12。
对于第一方向N象素×垂直的第二方向M象素的图像来说,分配并初始化用于下述变量的存储单元(步骤14):
Xlow(i),i=0,…,N-1
Xhigh(i),i=0,…,N-1
Ylow(j),j=0,…,M-1              (1)
Yhigh(j),j=0,…,M-1
这里:
i是图像中列的索引,从0~N-1;
j是图像中行的索引,从0~M-1;
Xlow(i)是局部低列值;
Xhigh(i)是局部高列值;
Ylow(j)是局部低行值;
Yhigh(j)是局部高行值。
图2图解说明了矩形图像100的取向,表示出了形成图像100的第一边102的第一列(列号0)和形成与第一边102相对的第二边104的最后一列(列号N-1)。类似地,第一行(行号0)形成图像100的第三边106,最后一行(行号M-1)形成与第三边106相对的第四边108。某种程度上该映射是任意的,因为可按照相反的顺序对行和/或列编号,图像可沿任一方向旋转90度(即,行列可互换),只要在整个方法中始终如一地使用作为结果得到的映射。但是,出于说明的目的,将始终采取图2中所示的映射。
在一种方案中,利用取自被扫描图像的YIQ表示的亮度YIQ_Y的最小值和最大值完成局部变量的初始化14。从而利用下述关系式确定局部变量的初始化14:
Xlow(i)=YIQ_Ymin,i=0,…,N-1
Xhigh(i)=YIQ_Ymax,i=0,…,N-1
Ylow(j)=YIQ_Ymin,j=0,…,M-1               (2)
Yhigh(j)=YIQ_Ymax,j=0,…,M-1
这里:YIQ_Ymia=minimum{YIQ_Y(i,j)},i=0,…,N-1,j=0,…,M-1YIQ_Ymax=maxmum{YIQ_Y(i,j)},i=0,…,N-1,j=0,…,M-1;(3)
即,YIQ_Ymin是N×M图像中的最小亮度,YIQ_Ymax是N×M图像中的最大亮度,YIQ_Y(i,j)是图像的位于索引i和索引j的象素的亮度。
一组嵌套循环被用于对位于被扫描图像的YIQ表示中的位置索引(i,j)的各个象素进行迭代,并且当迭代结束时返回二值化图像(步骤20)。在图l中所示的方案中,变量i和j被设置为16~0,并进行测试以确定i是否已在图像的整个宽度范围内迭代(步骤18)。如果是,则结束迭代,并且返回二值化图像(步骤20)。否则,进行测试以确定在当前索引i下,j是否已在整个图像高度范围内迭代(步骤22)。如果是,则增大i索引(步骤24),并进行关于j的另一循环,只要在图像的整个宽度范围内i尚未完成迭代(步骤18)。
否则,利用下述关系确定位置(i,j)的局部阈值T(i,j):
T(i,j)=(Xlow(i)+Xhigh(i)+Ylow(j)+Yhigh(j))/4    (4)
把对应位置(i,j)的Y值YIQ_Y(i,j)和该局部阈值比较(步骤28)。从而,如果:
YIQ_Y(i,j)<T(i,j)                        (5)
则步骤30:
B(i,j)=0
Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)      (6)
Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)
否则步骤32:
B(i,j)=l
Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)    (7)
Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
这里:
*(星号)代表乘法,
B(i,j)是保存在存储器中的,确定下来的位于位置索引(i,j)处的二值化图像象素;
w是一个参数。
在一种方案中,为0的B(i,j)值被映射为黑色,为1的值被映射为白色。但是,在另一种方案中,应用一种不同但是前后一致的映射。
通过观察在Xlow(i)和Ylow(j)或者在Xhigh(i)和Yhigh(j)中发生的变化,会发现,当图像被扫描时,阈值T(i,j)自适应地变化,这种变化取决于各个阈值比较(步骤28)的结果(步骤30、32)。另外,由于在图像的二值化过程中对Xlow(i)、Ylow(j)、Xhigh(i)和Yhigh(j)所做的更新,它们在任意特定(i,j)象素位置的值不一定代表实际的全程或者局部的最小和最大亮度值。
在一种方案中参数w是用户可调整的参数,所述参数可被看作确定Xlow(i)、Ylow(j)、Xhigh(i)和Yhigh(j)的“局部化区”。但是,并不要求参数w在本发明的所有方案中都是可调整的。在一种方案中,根据图像分辨率产生参数w。本领域的技术人员将认识到Xlow(i)、Ylow(j)、Xhigh(i)和Yhigh(j)的变化代表利用计算内核(computational kernel)的运算。上述等式描述的内核只取决于i和j的当前位置索引值,但是在其它方案中,使用包括关于其它各行或各列,例如相邻各行和各列的Xlow(i)、Ylow(j)、Xhigh(i)和Yhigh(j)的加权值的相关性在内的其它内核。
处理的象素越多,对于二值化来说,阈值T(i,j)就变得越可靠。同样增大了用于确定各个T(i,j)值的Xlow(i)、Ylow(j)、Xhigh(i)和Yhigh(j)的数值的可靠性。
在本发明的一种方案中,为了进一步提高性能,在局部变量的初始化(步骤14)之后,但是在循环迭代之前(例如在图1中的步骤14和16之间),对变量Xlow(i)和Xhigh(i)及变量Ylow(j)和Yhigh(j)应用预训练程序。下述伪码描述了四种独立的预训练程序,这四种程序分别被标记为A_1、A_2、A_3和A_4:
  A_1:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)

  A_2:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2
        <!-- SIPO <DP n="7"> -->
        <dp n="d7"/>
                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)

  A_3:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)

  A_4:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
在本发明的一种方案中,通过执行所有四种预训练程序A_1、A_2、A_3和A_4完成预训练。在其它方案中,执行两种预训练程序,即选自程序A_1和A_2的一种程序和选自A_3和A_4的另一种程序。(例如,在这样的一种方案中,执行预训练程序A_1和A_3)。这种方案可以向用户(但是不是必需的)提供选择执行预训练程序的四种不同组合中的哪一种。在另一种方案中,不执行预训练程序A_1、A_2、A_3和A_4中的任何一种。
M_1、N_1、M_2和N_2确定其中进行初始训练的区域的大小,并且
0≤M_1≤M_2≤(M-1)且
0≤N_1≤N_2≤(N-1)                  (8)
(按照惯例,对于上下限M_1和M_2或者N_1和N_2相等的循环,执行一次循环)。
在使用任意预训练程序A_1、A_2、A_3和A_4的方案中,在图像的矩形子集内进行预训练,所述图像可以是(但是不必是)整个图像。当子集较大时,实现关于参数Xlow(i)、Ylow(j)、Xhigh(i)和Yhigh(j)的更多训练或学习。在本发明的一种方案中,根据所需的计算速度选择M_1、N_1、M_2和N_2的值,因为越大的预训练区需要越多的计算时间。
在本发明的一种方案中,并参见图3,提供适合于执行这里描述的方法的计算设备200。计算设备200包括处理器和在操作上与处理器耦合的存储器。图3中既没有表示存储器也没有表示处理器,但是本领域的技术人员对它们都十分了解,同样,对操作上使处理器和存储器耦接的技术,本领域的技术人员也十分了解。处理器作用于存储器中的图像和变量(或者变量阵列),并且能够把变量(或者变量阵列)保存到存储器中或者从存储器读取变量(或者变量阵列)。计算设备200还具有被配置成从外部的机器可读介质206和扫描图像的扫描仪204读取指令的装置。在一种方案中,配置成指令计算设备200执行这里公开的方法的一种或多种方案的指令被记录在介质206上。
不同于具有预定阈值的方法,当图像的背景变化时,本发明的方案使用自学习。在自学习过程内,现有的知识被积累并被重复使用。在一种方案中,当自学习过程继续通过象素化图像的各行和各列时,阈值调整它自身。于是,即使对于不均匀或者织纹背景,本发明的构形也能够满意地工作。在一种方案中,通过利用已经经过的图像的象素,自学习过程训练它自己。所得到的二值化图像特别适合于光学字符识别(OCR),并且在本发明的至少一种方案中由OCR加以处理。
在本发明的另一种方案中,“实时地”即在图像的扫描过程中完成二值化。除了不是如同上述等式2和3中那样初始化Xlow(i)、Ylow(j)、Xhigh(i)和Yhigh(j)之外,该方案类似于图1中所示及上面所述的方案,Xlow(i)和Ylow(j)被初始化为最小的可能象素亮度值,Xhigh(i)和Yhigh(j)被初始化为最大的可能象素亮度值。(例如,其中8位整数值范围内的所有亮度值都可能的一种方案具有为0的最小可能亮度值和为255的最大可能亮度值)。另外,当获得图像的每条扫描线时,进行开始于图1的步骤18的关于变量i的循环。但是不进行任何预训练,因为在已发生二值化之前,图像不适合于进行预训练。
在上面描述的本发明的方案中,各个图像象素的亮度或灰度值被用于进行二值化。但是,在适合于特殊用途的方案中,也可始终如一地用另一值(例如,来自于象素的RGB表示的R值,或者来自于象素的YIQ表示的Q值)代替亮度或灰度值。
本发明的描述仅仅是发明本质的举例说明,因此,不脱离本发明要旨的各种变化限定在本发明的范围之内。这样的变化不应被看成脱离本发明的精神和范围。

Claims (30)

1、一种图像的二值化方法,所述图像具有N列×M行象素,并且第一列形成图像的第一边,最后一列形成图像的与第一边相对的第二边,图像的第一行形成图像的第三边,图像的最后一行形成图像的与第三边相对的第四边,所述方法产生二值化象素阵列;所述方法包括:
(a)对于图像的各列,初始化代表局部列低象素值的第一变量和代表局部列高象素值的第二变量,对于图像的各行,初始化代表局部行低象素值的第三变量和代表局部行高象素值的第四变量;
(b)从第一列到最后一列,对图像的各列迭代重复步骤(c)-(f);
(c)从第一行到最后一行,对图像的各行迭代重复步骤(d)-(f);
(d)确定和位于位置索引所示列的第一变量和第二变量有关,并且和位于位置索引所示行的第三变量和第四变量相关的阈值,位置索引取决于被迭代的列和被迭代的行;
(e)把代表位于位置索引的图像象素的值和确定的阈值进行比较;
(f)根据比较结果,把位置索引的二值化象素设置为第一值或者第二值,并且根据比较结果,调整第一变量和第三变量的值,或者调整第二变量和第四变量的值。
2、按照权利要求1所述的方法,其中所述图像是彩色图像,代表图像象素的所述值是代表图像象素的灰度级值,所述方法还包括把彩色图像转换成灰度级图像。
3、按照权利要求2所述的方法,其中把彩色图像转换成灰度级图像的步骤包含把由RGB表示所代表的图像转换成由YIQ表示所代表的图像,所述灰度级值是YIQ_Y(亮度)值。
4、按照权利要求2所述的方法,还包括扫描彩色图像,获得N列×M行象素。
5、按照权利要求1所述的方法,还包括对二值化象素阵列进行光学字符识别。
6、按照权利要求1所述的方法,其中所述第一变量被表示为Xlow(i),i=0,…,N-1,所述第二变量被表示为Xhigh(i),i=0,…N-1,所述第三变量被表示为Ylow(j),j=0,…,M-1,所述第四变量被表示为Yhigh(j),j=0,…N-1,并且其中根据比较结果调整第一变量和第三变量的值或者调整第二变量和第四变量的值的步骤包括根据比较结果调整:
Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)
Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)
或者:
Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
这里:
w是一个参数,
*(星号)代表乘法,
i是位置索引的列,
j是位置索引的行,
YIQ_Y(i,j)是位于位置索引的图像的象素的亮度值。
7、按照权利要求6所述的方法,其中阈值被表示为:
T(i,j)=(Xlow(i)+Xhigh(i)+Ylow(j)+Yhigh(j))/4。
8、按照权利要求7所述的方法,其中初始化所述第一变量、第二变量、第三变量和第四变量的步骤包括设置:
Xlow(i)=YIQ_Ymin,i=0,…,N-1
Xhigh(i)=YIQ_Ymax,i=0,…,N-1
Ylow(j)=YIQ_Ymin,j=0,…,M-1
Yhigh(j)=YIQ_Ymax,j=0,…,M-1
这里:
YIQ_Ymin=minimum{YIQ_Y(i,j)},i=0,…,N-1,j=0,…,M-1
YIQ_Ymax=maxmum{YIQ_Y(i,j)},i=0,…,N-1,j=0,…,M-1。
9、按照权利要求8所述的方法,还包括利用选自A_1和A_2的第一预训练程序和选自A_3和A_4的第二预训练程序预训练Xlow(i)、Xhigh(i)、Ylow(j)和Yhigh(j)的值,其中预训练程序A_1被写为:
  A_1:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_2被写为:
  A_2:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_3被写为:
  A_3:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_4被写为:
  A_4:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
其中:
0≤M_1≤M_2≤(M-1)且
0≤N_1≤N_2≤(N-1)。
10、按照权利要求8所述的方法,还包括利用四种预训练程序A_1、A_2、A_3和A_4预训练Xlow(i)、Xhigh(i)、Ylow(i)和Yhigh(j)的值,其中预训练程序A_1被写为:
  A_1:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_2被写为:
  A_2:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_3被写为:
  A_3:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_4被写为:
  A_4:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

                if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                else Yhih(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
其中:
0≤M_1≤M_2≤(M-1)且
0≤N_1≤N_2≤(N-1)。
11、一种对图像进行二值化的计算设备,所述图像具有N列×M行象素,并且第一列形成图像的第一边,最后一列形成图像的与第一边相对的第二边,图像的第一行形成图像的第三边,图像的最后一行形成图像的第四边,
所述计算设备包括存储器和操作上与存储器耦接,用于读取存储器中的数值并把数值保存到存储器中的处理器;
所述计算设备被配置成:
(a)在存储器中对于图像的各列,初始化代表局部低的第一方向象素值的第一变量和代表局部高的第一方向象素值的第二变量,对于图像的各行,初始化代表局部低的第二方向象素值的第三变量和代表局部高的第二方向象素值的第四变量;
(b)从第一列到最后一列,对图像的各列迭代重复(c)-(f);
(c)从第一行到最后一行,对图像的各行迭代重复(d)-(f);
(d)确定和位于位置索引所示列的第一变量和第二变量有关,并且和位于位置索引所示行的第三变量和第四变量相关的阈值,位置索引取决于被迭代的列和被迭代的行;
(e)把代表位于位置索引的图像象素的值和确定的阈值进行比较;
(f)根据比较结果,在存储器中把位置索引的二值化象素保存为第一值或者第二值,并且根据比较结果,调整第一变量和第三变量的保存值,或者调整第二变量和第四变量的保存值,
其中所述迭代(b)和(c)产生保存在存储器中的二值化象素阵列。
12、按照权利要求11所述的设备,其中所述图像是彩色图像,代表图像象素的所述值是代表图像象素的灰度级值,所述设备还被配置成把彩色图像转换成灰度级图像。
13、按照权利要求12所述的设备,其中为了把彩色图像转换成灰度级图像,所述设备被配置成把由RGB表示所代表的图像转换成由YIQ表示所代表的图像,所述灰度级值是YIQ_Y(亮度)值。
14、按照权利要求12所述的设备,还包括扫描仪,其中所述设备还被配置成扫描彩色图像,获得彩色图像的N列×M行象素。
15、按照权利要求11所述的设备,还被配置成对所述二值化象素阵列进行光学字符识别。
16、按照权利要求11所述的设备,其中所述第一变量被表示为Xlow(i),i=0,…,N-1,所述第二变量被表示为Xhigh(i),i=0,…N-1,所述第三变量被表示为Ylow(j),j=0,…,M-1,所述第四变量被表示为Yhigh(j),j=0,…N-1,并且其中为了根据比较结果调整第一变量和第三变量的值或者调整第二变量和第四变量的值,所述设备被配置成根据比较结果调整:
Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)
Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)
或者:
Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
这里:
w是一个参数,
*(星号)代表乘法,
i是位置索引的列,
j是位置索引的行,
YIQ_Y(i,j)是位于位置索引的图像的象素的亮度值。
17、按照权利要求16所述的设备,其中阈值被表示为:
T(i,j)=(Xlow(i)+Xhigh(i)+Ylow(j)+Yhigh(j))/4。
18、按照权利要求17所述的设备,其中为了初始化所述第一变量Xlow(i)、所述第二变量Xhigh(i)、所述第三变量Ylow(j)和所述第四变量Yhigh(j),所述设备被配置成在所述存储器中保存下述值:
Xlow(i)=YIQ_Ymin,i=0,…,N-1
Xhigh(i)=YIQ_Ymax,i=0,…,N-1
Ylow(j)=YIQ_Ymin,j=0,…,M-1
Yhigh(j)=YIQ_Ymax,j=0,…,M-1
这里:
YIQ_Ymin=minimum{YIQ_Y(i,j)},i=0,…,N-1,j=0,…,M-1
YIQ_Ymax=maxmum{YIQ_Y(i,j)},i=0,…,N-1,j=0,…,M-1。
19、按照权利要求18所述的设备,还被配置成利用选自A_1和A_2的第一预训练程序和选自A_3和A_4的第二预训练程序预训练保存在所述存储器中的Xlow(i)、Xhigh(i)、Ylow(j)和Yhigh(j)的值,其中预训练程序A_1被写为:
  A_1:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_2被写为:
  A_2:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_3被写为:
  A_3:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_4被写为:
  A_4:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
其中:
0≤M_1≤M_2≤(M-1)且
0≤N_1≤N_2≤(N-1)。
20、按照权利要求18所述的设备,还被配置成利用四种预训练程序A_1、A_2、A_3和A_4预训练保存在所述存储器中的Xlow(i)、Xhigh(i)、Ylow(j)和Yhigh(j),其中预训练程序A_1被写为:
  A_1:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_2被写为:
  A_2:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_3被写为:
  A_3:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_4被写为:
  A_4:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                 then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
其中:
0≤M_1≤M_2≤(M-1)且
0≤N_1≤N_2≤(N-1)。
21、一种其上记录有指令的机器可读介质,所述指令被配置成指令计算设备进行下述操作,所述计算设备具有存储器和操作上和存储器耦接,用于读取存储器中的数值并把数值保存到存储器中的处理器:
(a)在存储器中,对具有N列×M行象素,并且第一列形成图像的第一边,最后一列形成图像的与第一边相对的第二边,第一行形成图像的第三边,最后一行形成图像的第四边的图像的各列,初始化代表局部低的第一方向象素值的第一变量和代表局部高的第一方向象素值的第二变量,并且对该图像的各行,初始化代表局部低的第二方向象素值的第三变量和代表局部高的第二方向象素值的第四变量;
(b)从第一列到最后一列,对图像的各列迭代重复(c)-(f);
(c)从第一行到最后一行,对图像的各行迭代重复(d)-(f);
(d)确定和位于位置索引所示列的第一变量和第二变量有关,并且和位于位置索引所示行的第三变量和第四变量相关的阈值,位置索引取决于被迭代的列和被迭代的行;
(e)把代表位于位置索引的图像象素的值和确定的阈值进行比较;
(f)根据比较结果,在存储器中把位置索引的二值化象素保存为第一值或者第二值,并且根据比较结果,调整第一变量和第三变量的保存值,或者调整第二变量和第四变量的保存值,
其中迭代(b)和(c)产生保存于存储器中的二值化象素阵列。
22、按照权利要求21所述的介质,其中所述图像是彩色图像,代表图像象素的所述值是代表图像象素的灰度级值,所述介质还具有记录于其上并被配置成命令计算设备把彩色图像转换成灰度级图像的指令。
23、按照权利要求22所述的介质,其中为了把彩色图像转换成灰度级图像,所述介质具有记录于其上并被配置成命令计算设备把由RGB表示所代表的图像转换成由YIQ表示所代表的图像的指令,其中所述灰度级值是YIQ_Y(亮度)值。
24、按照权利要求22所述的介质,还具有记录于其上并被配置成利用扫描仪扫描彩色图像,以便获得彩色图像的N列×M行象素的指令。
25、按照权利要求21所述的介质,还具有记录于其上并被配置成命令计算设备对所述二值化象素阵列进行光学字符识别的指令。
26、按照权利要求21所述的介质,其中所述第一变量被表示为Xlow(i),i=0,…,N-1,所述第二变量被表示为Xhigh(i),i=0,…N-1,所述第三变量被表示为Ylow(j),j=0,…,M-1,所述第四变量被表示为Yhigh(j),j=0,…N-1,并且其中为了根据比较结果调整第一变量和第三变量的值或者调整第二变量和第四变量的值,所述介质具有记录于其上并被配置成命令计算设备根据比较结果进行下述调整的指令:
Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)
Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)
或者:
Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
这里:
w是一个参数,
*(星号)代表乘法,
i是位置索引的列,
j是位置索引的行,
YIQ_Y(i,j)是位于位置索引的图像的象素的亮度值。
27、按照权利要求26所述的介质,其中阈值被表示为:
T(i,j)=(Xlow(i)+Xhigh(i)+Ylow(j)+Yhigh(j))/4。
28、按照权利要求27所述的介质,其中为了初始化所述第一变量Xlow(i)、所述第二变量Xhigh(i)、所述第三变量Ylow(j)和所述第四变量Yhigh(j),所述介质具有记录于其上并被配置成命令计算设备在存储器中保存下述值的指令:
Xlow(i)=YIQ_Ymin,i=0,…,N-1
Xhigh(i)=YIQ_Ymax,i=0,…,N-1
Ylow(j)=YIQ_Ymin,j=0,…,M-1
Yhigh(j)=YIQ Ymax,j=0,…,M-1
这里:
YIQ_Ymin=minimum{YIQ_Y(i,j)},i=0,…,N-1,j=0,…,M-1
YIQ_Ymax=maxmum{YIQ_Y(i,j)},i=0,…,N-1,j=0,…,M-1。
29、按照权利要求28所述的介质,还具有记录于其上并被配置成命令计算设备利用选自A_1和A_2的第一预训练程序和选自A_3和A_4的第二预训练程序预训练保存在存储器中的Xlow(i)、Xhigh(i)、Ylow(j)和Yhigh(j)的值的指令,其中预训练程序A_1被写为:
  A_1:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_2被写为:
  A_2:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YiQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_3被写为:
  A_3:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_4被写为:
  A_4:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
其中:
0≤M_1≤M_2≤(M-1)且
0≤N_1≤N_2≤(N-1)。
30、按照权利要求28所述的介质,还具有记录于其上并被配置成命令计算设备利用四种预训练程序A_1、A_2、A_3和A_4预训练保存在所述存储器中的Xlow(i)、Xhigh(i)、Ylow(j)和Yhigh(j)的值的指令,其中预训练程序A_1被写为:
  A_1:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_2被写为:
  A_2:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2

                  then Xlow(i)=(Xlow(i)*w+YIQ_Y(i,j))/(w+1)

                  else Xhigh(i)=(Xhigh(i)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_3被写为:
  A_3:for i=N_1 to i=N_2

          for j=M_1 to j=M_2

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
预训练程序A_4被写为:
  A_4:for i=N_2 down to i=N_1

          for j=M_2 down to j=M_1

               if YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2

                  then Ylow(j)=(Ylow(j)*w+YIQ_Y(i,j))/(w+1)

                  else Yhigh(j)=(Yhigh(j)*w+YIQ_Y(i,j))/(w+1)
其中:
0≤M_1≤M_2≤(M-1)且
0≤N_1≤N_2≤(N-1)。
CNB021513988A 2001-11-21 2002-11-20 彩色文献图像的自适应二值化方法和设备 Expired - Fee Related CN1237475C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/990,096 US6950210B2 (en) 2001-11-21 2001-11-21 Method and apparatus for adaptively binarizing color document images
US09/990,096 2001-11-21

Publications (2)

Publication Number Publication Date
CN1420472A true CN1420472A (zh) 2003-05-28
CN1237475C CN1237475C (zh) 2006-01-18

Family

ID=25535754

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021513988A Expired - Fee Related CN1237475C (zh) 2001-11-21 2002-11-20 彩色文献图像的自适应二值化方法和设备

Country Status (3)

Country Link
US (1) US6950210B2 (zh)
JP (1) JP3833993B2 (zh)
CN (1) CN1237475C (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101042735B (zh) * 2006-03-23 2010-11-17 株式会社理光 图像二值化方法和装置
CN102270340A (zh) * 2011-09-05 2011-12-07 上海果壳电子有限公司 基于笔画算子的文本图像增强方法及系统
CN101727583B (zh) * 2008-10-22 2013-03-20 富士通株式会社 用于文档图像的自适应二值化方法和设备

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4834603B2 (ja) * 2007-05-09 2011-12-14 京セラミタ株式会社 画像処理装置、画像形成装置
US8761511B2 (en) * 2009-09-30 2014-06-24 F. Scott Deaver Preprocessing of grayscale images for optical character recognition
KR101996917B1 (ko) * 2012-07-20 2019-10-02 삼성디스플레이 주식회사 평판 검사 방법 및 장치
US9542736B2 (en) * 2013-06-04 2017-01-10 Paypal, Inc. Evaluating image sharpness
US9652817B2 (en) * 2015-03-12 2017-05-16 Samsung Electronics Co., Ltd. Automated compute kernel fusion, resizing, and interleave
CN105180732B (zh) * 2015-07-24 2018-07-27 成都市计量检定测试院 钢卷尺刻度误差测量方法
CN105809715B (zh) * 2016-03-07 2018-07-27 南京航空航天大学 一种基于帧间累计变化矩阵的视觉运动目标检测方法
US20180122079A1 (en) * 2016-10-27 2018-05-03 Qualcomm Incorporated Systems and methods for determining histograms
US10922801B2 (en) 2017-07-19 2021-02-16 Lockheed Martin Corporation Channel-based binarization of color
US11508172B2 (en) * 2017-12-28 2022-11-22 Dst Technologies, Inc. Identifying location of shreds on an imaged form

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4823194A (en) * 1986-08-01 1989-04-18 Hitachi, Ltd. Method for processing gray scale images and an apparatus thereof
US5184213A (en) * 1989-09-20 1993-02-02 Toyo Ink Mfg. Co., Ltd. Binarizing method for color image using modified error diffusion method
JPH07104921B2 (ja) * 1989-11-17 1995-11-13 松下電器産業株式会社 画像閾値決定方法
US5268773A (en) * 1990-03-30 1993-12-07 Samsung Electronics Co., Ltd. Document image signal processor having an adaptive threshold
US5200841A (en) * 1990-05-25 1993-04-06 Nikon Corporation Apparatus for binarizing images
JPH04227581A (ja) * 1990-06-08 1992-08-17 Omron Corp 画像の2値化閾値算出装置
US5915049A (en) * 1992-02-25 1999-06-22 Pfu Limited Binarization system for an image scanner
JP3313447B2 (ja) * 1993-03-19 2002-08-12 株式会社リコー 画像処理装置
KR0136067B1 (ko) * 1994-08-12 1998-04-27 김광호 이치화상 프로세서
US5621815A (en) * 1994-09-23 1997-04-15 The Research Foundation Of State University Of New York Global threshold method and apparatus
JPH096957A (ja) * 1995-06-23 1997-01-10 Toshiba Corp 濃度画像の2値化方法および画像2値化装置
US5949901A (en) * 1996-03-21 1999-09-07 Nichani; Sanjay Semiconductor device image inspection utilizing image subtraction and threshold imaging
US6192163B1 (en) * 1996-10-29 2001-02-20 Seiko Epson Corporation Image processing method and image processing apparatus
US6055336A (en) * 1996-11-18 2000-04-25 Canon Kabushiki Kaisha Image processing system which converts multi-value image data into binary image data
GB9711024D0 (en) * 1997-05-28 1997-07-23 Rank Xerox Ltd Image enhancement and thresholding of images
US6061476A (en) * 1997-11-24 2000-05-09 Cognex Corporation Method and apparatus using image subtraction and dynamic thresholding
US6195467B1 (en) * 1999-03-25 2001-02-27 Image Processing Technologies, Inc. Method and apparatus for sharpening a grayscale image
US6498660B2 (en) * 2001-02-16 2002-12-24 Oak Technology, Inc. System and method for the dynamic thresholding of grayscale image data

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101042735B (zh) * 2006-03-23 2010-11-17 株式会社理光 图像二值化方法和装置
CN101727583B (zh) * 2008-10-22 2013-03-20 富士通株式会社 用于文档图像的自适应二值化方法和设备
CN102270340A (zh) * 2011-09-05 2011-12-07 上海果壳电子有限公司 基于笔画算子的文本图像增强方法及系统

Also Published As

Publication number Publication date
JP2003198861A (ja) 2003-07-11
JP3833993B2 (ja) 2006-10-18
US6950210B2 (en) 2005-09-27
US20030095270A1 (en) 2003-05-22
CN1237475C (zh) 2006-01-18

Similar Documents

Publication Publication Date Title
CN1954339B (zh) 用于将图像从低动态范围转换为高动态范围的方法和系统
CN1237475C (zh) 彩色文献图像的自适应二值化方法和设备
CN1147810C (zh) 色彩色泽色度色调色空间及用其和色扩散量化颜色的方法
CN1615029A (zh) 用于增强图像的局部亮度的方法、装置及记录介质
CN1207924C (zh) 取决于图像的面部检测方法
CN1708137A (zh) 饱和度自适应图像改善装置和方法
CN1867963A (zh) 色域转换系统和方法
CN1674628A (zh) 图像处理设备
CN1731451A (zh) 增强图像颜色的方法
CN100352259C (zh) 图像处理设备、图像处理方法及其程序产品
Wan et al. A novel framework for optimal RGB to grayscale image conversion
CN1886758A (zh) 按比例缩小数字矩阵图像的方法及装置
CN1790378A (zh) 一种图像的二值化方法及系统
CN1711558A (zh) 相似图像提取装置、相似图像提取方法以及相似图像提取程序
US20030123722A1 (en) Sparse representation of extended gamut images
CN1151468C (zh) 考虑图象和打印机特征的半色调表示
CN101051117A (zh) 一种校正透镜成像不均一性、提取透镜参数的方法及装置
US8712161B2 (en) Image manipulating system and method
CN1157930C (zh) 彩色图像读取装置
CN1220960C (zh) 有效存储颜色色域的彩色信号处理装置及其方法
Buzzelli et al. Consensus-driven illuminant estimation with GANs
US11394853B2 (en) Image representation method, image representation device, and computer readable storage medium
CN1406052A (zh) 扫描灰度图像方法及系统
CN108665434B (zh) 图像合成方法及装置
CN1089924C (zh) 影像的资料与背景分离的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060118