CN1420472A

CN1420472A - 彩色文献图像的自适应二值化方法和设备

Info

Publication number: CN1420472A
Application number: CN02151398A
Authority: CN
Inventors: 郭金红; 张一春
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2001-11-21
Filing date: 2002-11-20
Publication date: 2003-05-28
Anticipated expiration: 2022-11-20
Also published as: JP2003198861A; JP3833993B2; US6950210B2; US20030095270A1; CN1237475C

Abstract

本申请公开了一种彩色文献图像的自适应二值化方法和设备，该方法包括：对于图像的各列，初始化代表局部列低象素值和局部列高象素值的第一组变量，并且对于图像的各行，初始化代表局部行低象素值和局部行高象素值的第二组变量。对每个象素重复下述步骤：确定依赖于当前象素位置的第一组变量和第二组变量的阈值，把代表当前象素位置的图像象素的值和确定的阈值进行比较，根据比较结果，把当前象素位置的二值化象素设置为两个值中的一个，并根据比较结果，调整包含在第一组变量和第二组变量内的值。

Description

彩色文献图像的自适应二值化方法和设备

技术领域

本发明涉及图像的二值化方法和设备，更具体地说涉及复杂背景下的彩色图像或灰度级图像的二值化方法和设备。

背景技术

黑白图像的光学字符识别(OCR)已为人们所知。但是，彩色文献的普及需要通常带有复杂背景的灰度级和/或彩色字符的文本识别。例如，通常在广告和杂志中可找到带有这种背景的文本。有时，遇到的文本位于复杂的织纹背景或者从一种颜色逐渐变成另一种颜色的背景上。传统的全程阈值方法难以处理这种背景。

更具体地说，在目前的至少一种光学字符识别(OCR)软件包中利用全程阈值方法。整个图像的单一全程阈值的产生既快速又简单。但是，只有当图像背景非常均匀时，全程阈值才能提供满意的结果。即使借助用户的介入，利用全程阈值方法的OCR软件也不能处理具有不均匀亮度或复杂背景，例如织纹背景的图像。

发明内容

于是本发明的一个方面提供一种图像的二值化方法，所述图像具有N列×M行象素，并且第一列形成图像的第一边，最后一列形成图像的与第一边相对的第二边，图像的第一行形成图像的第三边，图像的最后一行形成图像的与第三边相对的第四边。产生二值化象素阵列的方法包括：

(a)对于图像的各列，初始化代表局部列低象素值(local columnlowpixel value)的第一变量和代表局部列高象素值的第二变量，对于图像的各行，初始化代表局部行低象素值的第三变量和代表局部行高象素值的第四变量；

(b)从第一列到最后一列，对图像的各列迭代重复步骤(c)-(f)；

(c)从第一行到最后一行，对图像的各行迭代重复步骤(d)-(f)；

(d)确定和位于位置索引所示列的第一变量和第二变量有关，并且和位于位置索引所示行的第三变量和第四变量相关的阈值，位置索引取决于被迭代的列和被迭代的行；

(e)把代表位于位置索引的图像象素的值和确定的阈值进行比较；

(f)根据比较结果，把位置索引的二值化象素设置为第一值或者第二值，并且根据比较结果，调整第一变量和第三变量的值，或者调整第二变量和第四变量的值。

本发明的另一方面提供一种对图像进行二值化的计算设备，所述图像具有N列×M行象素，并且第一列形成图像的第一边，最后一列形成图像的与第一边相对的第二边，图像的第一行形成图像的第三边，图像的最后一行形成图像的与第三边相对的第四边。所述计算设备包括存储器和操作上与存储器耦接，用于读取存储器中的数值并把数值保存到存储器中的处理器，所述计算设备被配置成：

(a)在存储器中对于图像的各列，初始化代表局部低的第一方向象素值的第一变量和代表局部高的第一方向象素值的第二变量，对于图像的各行，初始化代表局部低的第二方向象素值的第三变量和代表局部高的第二方向象素值的第四变量；

(b)从第一列到最后一列，对图像的各列迭代重复(c)-(f)；

(c)从第一行到最后一行，对图像的各行迭代重复(d)-(f)；

(f)根据比较结果，在存储器中把位置索引的二值化象素保存为第一值或者第二值，并且根据比较结果，调整第一变量和第三变量的保存值，或者调整第二变量和第四变量的保存值。

其中迭代(b)和(c)产生保存在存储器中的二值化象素阵列。

本发明的另一方面提供一种其上记录有指令的机器可读介质，所述指令被配置成指令计算设备进行下述操作，所述计算设备具有存储器和操作上和存储器耦接，用于读取存储器中的数值并把数值保存到存储器中的处理器：

(a)在存储器中，对具有N列×M行象素，第一列形成图像的第一边，最后一列形成图像的与第一边相对的第二边，第一行形成图像的第三边，最后一行形成图像的与第三边相对的第四边的图像的各列，初始化代表局部低的第一方向象素值的第一变量和代表局部高的第一方向象素值的第二变量，对该图像的各行，初始化代表局部低的第二方向象素值的第三变量和代表局部高的第二方向象素值的第四变量；

(b)从第一列到最后一列，对图像的各列迭代重复(c)-(f)；

(c)从第一行到最后一行，对图像的各行迭代重复(d)-(f)；

其中迭代(b)和(c)产生保存于存储器中的二值化象素阵列。

根据下面提供的详细说明，本发明的其它可应用领域将变得显而易见。应明白当简要说明本发明的优选实施例的时候，详细说明和具体例子只是用于举例说明，而不是意图限制本发明的范围。

附图说明

根据详细说明和附图，能够更充分地理解本发明，其中：

图1是图解说明对彩色图像进行二值化的方法的一种方案的流程图。

图2是图像中象素的排列，例如被用作图1中表示的方法的输入的图像中象素排列的表示图。

图3是图解说明适合于执行图1中图解说明的方法的计算系统的一种结构的简化方框图。

具体实施方式

优选实施例的下述说明仅仅是对发明本质的举例说明，而不是本发明、其应用或用途的限制。

参见图1，本发明的一种方案10把自学习程序嵌入各种复杂背景下的彩色或灰度级图像的二值化(binarization)过程中。

已发现对于具有复杂背景的许多文献来说，除了从文本到反相文本(reversed text)的转变，以及从反相文本到文本的转变之外，当扫描文献时，文献的背景一般逐渐变化。如果某一象素位于较暗的区域，则由于周围区域中颜色背景的相关性的结果，随后的象素位于较暗区域的概率相对较高。利用这种假设，如果正在低对比度区域中进行扫描过程，则下一相邻象素的阈值同样被调低。

从而，在一种方案中并参见图1，已被彩色扫描的文献被转化成灰度级图像12。例如，RGB图像(即每个象素由R(红色)值、G(绿色)值和B(蓝色)值表示的图像)被转化成YIQ格式。代表亮度或灰度级的YIQ_Y值被用于二值化。(从NTSC彩色电视标准了解YIQ格式，其中“Y”是感觉的亮度信号，“I”是得自于R-Y的色差信号，“Q”是得自于B-Y的色差信号，这里“R”是红色信号，“R”是蓝色信号。如同这里使用的一样，亮度信号或灰度级信号被表示为YIQ_Y。)

在利用灰度级而不是彩色图像的方案中，由于直接使用象素的灰度值，因此不需要向YIQ的转换12。

对于第一方向N象素×垂直的第二方向M象素的图像来说，分配并初始化用于下述变量的存储单元(步骤14)：

X_low(i)，i＝0，…，N-1

X_high(i)，i＝0，…，N-1

Y_low(j)，j＝0，…，M-1 (1)

Y_high(j)，j＝0，…，M-1

这里：

i是图像中列的索引，从0～N-1；

j是图像中行的索引，从0～M-1；

X_low(i)是局部低列值；

X_high(i)是局部高列值；

Y_low(j)是局部低行值；

Y_high(j)是局部高行值。

图2图解说明了矩形图像100的取向，表示出了形成图像100的第一边102的第一列(列号0)和形成与第一边102相对的第二边104的最后一列(列号N-1)。类似地，第一行(行号0)形成图像100的第三边106，最后一行(行号M-1)形成与第三边106相对的第四边108。某种程度上该映射是任意的，因为可按照相反的顺序对行和/或列编号，图像可沿任一方向旋转90度(即，行列可互换)，只要在整个方法中始终如一地使用作为结果得到的映射。但是，出于说明的目的，将始终采取图2中所示的映射。

在一种方案中，利用取自被扫描图像的YIQ表示的亮度YIQ_Y的最小值和最大值完成局部变量的初始化14。从而利用下述关系式确定局部变量的初始化14：

X_low(i)＝YIQ_Y_min，i＝0，…，N-1

X_high(i)＝YIQ_Y_max，i＝0，…，N-1

Y_low(j)＝YIQ_Y_min，j＝0，…，M-1 (2)

Y_high(j)＝YIQ_Y_max，j＝0，…，M-1

这里：YIQ_Y_mia＝minimum{YIQ_Y(i，j)}，i＝0，…，N-1，j＝0，…，M-1YIQ_Y_max＝maxmum{YIQ_Y(i，j)}，i＝0，…，N-1，j＝0，…，M-1；(3)

即，YIQ_Y_min是N×M图像中的最小亮度，YIQ_Y_max是N×M图像中的最大亮度，YIQ_Y(i，j)是图像的位于索引i和索引j的象素的亮度。

一组嵌套循环被用于对位于被扫描图像的YIQ表示中的位置索引(i，j)的各个象素进行迭代，并且当迭代结束时返回二值化图像(步骤20)。在图l中所示的方案中，变量i和j被设置为16～0，并进行测试以确定i是否已在图像的整个宽度范围内迭代(步骤18)。如果是，则结束迭代，并且返回二值化图像(步骤20)。否则，进行测试以确定在当前索引i下，j是否已在整个图像高度范围内迭代(步骤22)。如果是，则增大i索引(步骤24)，并进行关于j的另一循环，只要在图像的整个宽度范围内i尚未完成迭代(步骤18)。

否则，利用下述关系确定位置(i，j)的局部阈值T(i，j)：

T(i，j)＝(X_low(i)+X_high(i)+Y_low(j)+Y_high(j))/4 (4)

把对应位置(i，j)的Y值YIQ_Y(i，j)和该局部阈值比较(步骤28)。从而，如果：

YIQ_Y(i，j)＜T(i，j) (5)

则步骤30：

B(i，j)＝0

X_low(i)＝(X_low(i)*w+YIQ_Y(i，j))/(w+1) (6)

Y_low(j)＝(Y_low(j)*w+YIQ_Y(i，j))/(w+1)

否则步骤32：

B(i，j)＝l

X_high(i)＝(X_high(i)*w+YIQ_Y(i，j))/(w+1) (7)

Y_high(j)＝(Y_high(j)*w+YIQ_Y(i，j))/(w+1)

这里：

*(星号)代表乘法，

B(i，j)是保存在存储器中的，确定下来的位于位置索引(i，j)处的二值化图像象素；

w是一个参数。

在一种方案中，为0的B(i，j)值被映射为黑色，为1的值被映射为白色。但是，在另一种方案中，应用一种不同但是前后一致的映射。

通过观察在X_low(i)和Y_low(j)或者在X_high(i)和Y_high(j)中发生的变化，会发现，当图像被扫描时，阈值T(i，j)自适应地变化，这种变化取决于各个阈值比较(步骤28)的结果(步骤30、32)。另外，由于在图像的二值化过程中对X_low(i)、Y_low(j)、X_high(i)和Y_high(j)所做的更新，它们在任意特定(i，j)象素位置的值不一定代表实际的全程或者局部的最小和最大亮度值。

在一种方案中参数w是用户可调整的参数，所述参数可被看作确定X_low(i)、Y_low(j)、X_high(i)和Y_high(j)的“局部化区”。但是，并不要求参数w在本发明的所有方案中都是可调整的。在一种方案中，根据图像分辨率产生参数w。本领域的技术人员将认识到X_low(i)、Y_low(j)、X_high(i)和Y_high(j)的变化代表利用计算内核(computational kernel)的运算。上述等式描述的内核只取决于i和j的当前位置索引值，但是在其它方案中，使用包括关于其它各行或各列，例如相邻各行和各列的X_low(i)、Y_low(j)、X_high(i)和Y_high(j)的加权值的相关性在内的其它内核。

处理的象素越多，对于二值化来说，阈值T(i，j)就变得越可靠。同样增大了用于确定各个T(i，j)值的X_low(i)、Y_low(j)、X_high(i)和Y_high(j)的数值的可靠性。

在本发明的一种方案中，为了进一步提高性能，在局部变量的初始化(步骤14)之后，但是在循环迭代之前(例如在图1中的步骤14和16之间)，对变量X_low(i)和X_high(i)及变量Y_low(j)和Y_high(j)应用预训练程序。下述伪码描述了四种独立的预训练程序，这四种程序分别被标记为A_1、A_2、A_3和A_4：

　　A_1：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

　　A_2：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2
        <!-- SIPO <DP n="7"> -->
        <dp n="d7"/>
　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

　　A_3：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

　　A_4：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

在本发明的一种方案中，通过执行所有四种预训练程序A_1、A_2、A_3和A_4完成预训练。在其它方案中，执行两种预训练程序，即选自程序A_1和A_2的一种程序和选自A_3和A_4的另一种程序。(例如，在这样的一种方案中，执行预训练程序A_1和A_3)。这种方案可以向用户(但是不是必需的)提供选择执行预训练程序的四种不同组合中的哪一种。在另一种方案中，不执行预训练程序A_1、A_2、A_3和A_4中的任何一种。

M_1、N_1、M_2和N_2确定其中进行初始训练的区域的大小，并且

0≤M_1≤M_2≤(M-1)且

0≤N_1≤N_2≤(N-1) (8)

(按照惯例，对于上下限M_1和M_2或者N_1和N_2相等的循环，执行一次循环)。

在使用任意预训练程序A_1、A_2、A_3和A_4的方案中，在图像的矩形子集内进行预训练，所述图像可以是(但是不必是)整个图像。当子集较大时，实现关于参数X_low(i)、Y_low(j)、X_high(i)和Y_high(j)的更多训练或学习。在本发明的一种方案中，根据所需的计算速度选择M_1、N_1、M_2和N_2的值，因为越大的预训练区需要越多的计算时间。

在本发明的一种方案中，并参见图3，提供适合于执行这里描述的方法的计算设备200。计算设备200包括处理器和在操作上与处理器耦合的存储器。图3中既没有表示存储器也没有表示处理器，但是本领域的技术人员对它们都十分了解，同样，对操作上使处理器和存储器耦接的技术，本领域的技术人员也十分了解。处理器作用于存储器中的图像和变量(或者变量阵列)，并且能够把变量(或者变量阵列)保存到存储器中或者从存储器读取变量(或者变量阵列)。计算设备200还具有被配置成从外部的机器可读介质206和扫描图像的扫描仪204读取指令的装置。在一种方案中，配置成指令计算设备200执行这里公开的方法的一种或多种方案的指令被记录在介质206上。

不同于具有预定阈值的方法，当图像的背景变化时，本发明的方案使用自学习。在自学习过程内，现有的知识被积累并被重复使用。在一种方案中，当自学习过程继续通过象素化图像的各行和各列时，阈值调整它自身。于是，即使对于不均匀或者织纹背景，本发明的构形也能够满意地工作。在一种方案中，通过利用已经经过的图像的象素，自学习过程训练它自己。所得到的二值化图像特别适合于光学字符识别(OCR)，并且在本发明的至少一种方案中由OCR加以处理。

在本发明的另一种方案中，“实时地”即在图像的扫描过程中完成二值化。除了不是如同上述等式2和3中那样初始化X_low(i)、Y_low(j)、X_high(i)和Y_high(j)之外，该方案类似于图1中所示及上面所述的方案，X_low(i)和Y_low(j)被初始化为最小的可能象素亮度值，X_high(i)和Y_high(j)被初始化为最大的可能象素亮度值。(例如，其中8位整数值范围内的所有亮度值都可能的一种方案具有为0的最小可能亮度值和为255的最大可能亮度值)。另外，当获得图像的每条扫描线时，进行开始于图1的步骤18的关于变量i的循环。但是不进行任何预训练，因为在已发生二值化之前，图像不适合于进行预训练。

在上面描述的本发明的方案中，各个图像象素的亮度或灰度值被用于进行二值化。但是，在适合于特殊用途的方案中，也可始终如一地用另一值(例如，来自于象素的RGB表示的R值，或者来自于象素的YIQ表示的Q值)代替亮度或灰度值。

本发明的描述仅仅是发明本质的举例说明，因此，不脱离本发明要旨的各种变化限定在本发明的范围之内。这样的变化不应被看成脱离本发明的精神和范围。

Claims

1、一种图像的二值化方法，所述图像具有N列×M行象素，并且第一列形成图像的第一边，最后一列形成图像的与第一边相对的第二边，图像的第一行形成图像的第三边，图像的最后一行形成图像的与第三边相对的第四边，所述方法产生二值化象素阵列；所述方法包括：

(a)对于图像的各列，初始化代表局部列低象素值的第一变量和代表局部列高象素值的第二变量，对于图像的各行，初始化代表局部行低象素值的第三变量和代表局部行高象素值的第四变量；

(b)从第一列到最后一列，对图像的各列迭代重复步骤(c)-(f)；

(c)从第一行到最后一行，对图像的各行迭代重复步骤(d)-(f)；

2、按照权利要求1所述的方法，其中所述图像是彩色图像，代表图像象素的所述值是代表图像象素的灰度级值，所述方法还包括把彩色图像转换成灰度级图像。

3、按照权利要求2所述的方法，其中把彩色图像转换成灰度级图像的步骤包含把由RGB表示所代表的图像转换成由YIQ表示所代表的图像，所述灰度级值是YIQ_Y(亮度)值。

4、按照权利要求2所述的方法，还包括扫描彩色图像，获得N列×M行象素。

5、按照权利要求1所述的方法，还包括对二值化象素阵列进行光学字符识别。

6、按照权利要求1所述的方法，其中所述第一变量被表示为X_low(i)，i＝0，…，N-1，所述第二变量被表示为X_high(i)，i＝0，…N-1，所述第三变量被表示为Y_low(j)，j＝0，…，M-1，所述第四变量被表示为Y_high(j)，j＝0，…N-1，并且其中根据比较结果调整第一变量和第三变量的值或者调整第二变量和第四变量的值的步骤包括根据比较结果调整：

X_low(i)＝(X_low(i)*w+YIQ_Y(i，j))/(w+1)

Y_low(j)＝(Y_low(j)*w+YIQ_Y(i，j))/(w+1)

或者：

X_high(i)＝(X_high(i)*w+YIQ_Y(i，j))/(w+1)

Y_high(j)＝(Y_high(j)*w+YIQ_Y(i，j))/(w+1)

这里：

w是一个参数，

*(星号)代表乘法，

i是位置索引的列，

j是位置索引的行，

YIQ_Y(i，j)是位于位置索引的图像的象素的亮度值。

7、按照权利要求6所述的方法，其中阈值被表示为：

T(i，j)＝(X_low(i)+X_high(i)+Y_low(j)+Y_high(j))/4。

8、按照权利要求7所述的方法，其中初始化所述第一变量、第二变量、第三变量和第四变量的步骤包括设置：

X_low(i)＝YIQ_Y_min，i＝0，…，N-1

X_high(i)＝YIQ_Y_max，i＝0，…，N-1

Y_low(j)＝YIQ_Y_min，j＝0，…，M-1

Y_high(j)＝YIQ_Y_max，j＝0，…，M-1

这里：

YIQ_Y_min＝minimum{YIQ_Y(i，j)}，i＝0，…，N-1，j＝0，…，M-1

YIQ_Y_max＝maxmum{YIQ_Y(i，j)}，i＝0，…，N-1，j＝0，…，M-1。

9、按照权利要求8所述的方法，还包括利用选自A_1和A_2的第一预训练程序和选自A_3和A_4的第二预训练程序预训练X_low(i)、X_high(i)、Y_low(j)和Y_high(j)的值，其中预训练程序A_1被写为：

　　A_1：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_2被写为：

　　A_2：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_3被写为：

　　A_3：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_4被写为：

　　A_4：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

其中：

0≤M_1≤M_2≤(M-1)且

0≤N_1≤N_2≤(N-1)。

10、按照权利要求8所述的方法，还包括利用四种预训练程序A_1、A_2、A_3和A_4预训练X_low(i)、X_high(i)、Y_low(i)和Y_high(j)的值，其中预训练程序A_1被写为：

　　A_1：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_2被写为：

　　A_2：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_3被写为：

　　A_3：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_4被写为：

　　A_4：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　              then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　              else Yhih(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

其中：

0≤M_1≤M_2≤(M-1)且

0≤N_1≤N_2≤(N-1)。

11、一种对图像进行二值化的计算设备，所述图像具有N列×M行象素，并且第一列形成图像的第一边，最后一列形成图像的与第一边相对的第二边，图像的第一行形成图像的第三边，图像的最后一行形成图像的第四边，

所述计算设备包括存储器和操作上与存储器耦接，用于读取存储器中的数值并把数值保存到存储器中的处理器；

所述计算设备被配置成：

(b)从第一列到最后一列，对图像的各列迭代重复(c)-(f)；

(c)从第一行到最后一行，对图像的各行迭代重复(d)-(f)；

(f)根据比较结果，在存储器中把位置索引的二值化象素保存为第一值或者第二值，并且根据比较结果，调整第一变量和第三变量的保存值，或者调整第二变量和第四变量的保存值，

其中所述迭代(b)和(c)产生保存在存储器中的二值化象素阵列。

12、按照权利要求11所述的设备，其中所述图像是彩色图像，代表图像象素的所述值是代表图像象素的灰度级值，所述设备还被配置成把彩色图像转换成灰度级图像。

13、按照权利要求12所述的设备，其中为了把彩色图像转换成灰度级图像，所述设备被配置成把由RGB表示所代表的图像转换成由YIQ表示所代表的图像，所述灰度级值是YIQ_Y(亮度)值。

14、按照权利要求12所述的设备，还包括扫描仪，其中所述设备还被配置成扫描彩色图像，获得彩色图像的N列×M行象素。

15、按照权利要求11所述的设备，还被配置成对所述二值化象素阵列进行光学字符识别。

16、按照权利要求11所述的设备，其中所述第一变量被表示为X_low(i)，i＝0，…，N-1，所述第二变量被表示为X_high(i)，i＝0，…N-1，所述第三变量被表示为Y_low(j)，j＝0，…，M-1，所述第四变量被表示为Y_high(j)，j＝0，…N-1，并且其中为了根据比较结果调整第一变量和第三变量的值或者调整第二变量和第四变量的值，所述设备被配置成根据比较结果调整：

X_low(i)＝(X_low(i)*w+YIQ_Y(i，j))/(w+1)

Y_low(j)＝(Y_low(j)*w+YIQ_Y(i，j))/(w+1)

或者：

X_high(i)＝(X_high(i)*w+YIQ_Y(i，j))/(w+1)

Y_high(j)＝(Y_high(j)*w+YIQ_Y(i，j))/(w+1)

这里：

w是一个参数，

*(星号)代表乘法，

i是位置索引的列，

j是位置索引的行，

YIQ_Y(i，j)是位于位置索引的图像的象素的亮度值。

17、按照权利要求16所述的设备，其中阈值被表示为：

T(i，j)＝(X_low(i)+X_high(i)+Y_low(j)+Y_high(j))/4。

18、按照权利要求17所述的设备，其中为了初始化所述第一变量X_low(i)、所述第二变量X_high(i)、所述第三变量Y_low(j)和所述第四变量Y_high(j)，所述设备被配置成在所述存储器中保存下述值：

X_low(i)＝YIQ_Y_min，i＝0，…，N-1

X_high(i)＝YIQ_Y_max，i＝0，…，N-1

Y_low(j)＝YIQ_Y_min，j＝0，…，M-1

Y_high(j)＝YIQ_Y_max，j＝0，…，M-1

这里：

YIQ_Y_min＝minimum{YIQ_Y(i，j)}，i＝0，…，N-1，j＝0，…，M-1

YIQ_Y_max＝maxmum{YIQ_Y(i，j)}，i＝0，…，N-1，j＝0，…，M-1。

19、按照权利要求18所述的设备，还被配置成利用选自A_1和A_2的第一预训练程序和选自A_3和A_4的第二预训练程序预训练保存在所述存储器中的X_low(i)、X_high(i)、Y_low(j)和Y_high(j)的值，其中预训练程序A_1被写为：

　　A_1：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_2被写为：

　　A_2：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_3被写为：

　　A_3：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_4被写为：

　　A_4：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

其中：

0≤M_1≤M_2≤(M-1)且

0≤N_1≤N_2≤(N-1)。

20、按照权利要求18所述的设备，还被配置成利用四种预训练程序A_1、A_2、A_3和A_4预训练保存在所述存储器中的X_low(i)、X_high(i)、Y_low(j)和Y_high(j)，其中预训练程序A_1被写为：

　　A_1：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_2被写为：

　　A_2：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_3被写为：

　　A_3：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_4被写为：

　　A_4：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　               then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

其中：

0≤M_1≤M_2≤(M-1)且

0≤N_1≤N_2≤(N-1)。

21、一种其上记录有指令的机器可读介质，所述指令被配置成指令计算设备进行下述操作，所述计算设备具有存储器和操作上和存储器耦接，用于读取存储器中的数值并把数值保存到存储器中的处理器：

(a)在存储器中，对具有N列×M行象素，并且第一列形成图像的第一边，最后一列形成图像的与第一边相对的第二边，第一行形成图像的第三边，最后一行形成图像的第四边的图像的各列，初始化代表局部低的第一方向象素值的第一变量和代表局部高的第一方向象素值的第二变量，并且对该图像的各行，初始化代表局部低的第二方向象素值的第三变量和代表局部高的第二方向象素值的第四变量；

(b)从第一列到最后一列，对图像的各列迭代重复(c)-(f)；

(c)从第一行到最后一行，对图像的各行迭代重复(d)-(f)；

其中迭代(b)和(c)产生保存于存储器中的二值化象素阵列。

22、按照权利要求21所述的介质，其中所述图像是彩色图像，代表图像象素的所述值是代表图像象素的灰度级值，所述介质还具有记录于其上并被配置成命令计算设备把彩色图像转换成灰度级图像的指令。

23、按照权利要求22所述的介质，其中为了把彩色图像转换成灰度级图像，所述介质具有记录于其上并被配置成命令计算设备把由RGB表示所代表的图像转换成由YIQ表示所代表的图像的指令，其中所述灰度级值是YIQ_Y(亮度)值。

24、按照权利要求22所述的介质，还具有记录于其上并被配置成利用扫描仪扫描彩色图像，以便获得彩色图像的N列×M行象素的指令。

25、按照权利要求21所述的介质，还具有记录于其上并被配置成命令计算设备对所述二值化象素阵列进行光学字符识别的指令。

26、按照权利要求21所述的介质，其中所述第一变量被表示为X_low(i)，i＝0，…，N-1，所述第二变量被表示为X_high(i)，i＝0，…N-1，所述第三变量被表示为Y_low(j)，j＝0，…，M-1，所述第四变量被表示为Y_high(j)，j＝0，…N-1，并且其中为了根据比较结果调整第一变量和第三变量的值或者调整第二变量和第四变量的值，所述介质具有记录于其上并被配置成命令计算设备根据比较结果进行下述调整的指令：

X_low(i)＝(X_low(i)*w+YIQ_Y(i，j))/(w+1)

Y_low(j)＝(Y_low(j)*w+YIQ_Y(i，j))/(w+1)

或者：

X_high(i)＝(X_high(i)*w+YIQ_Y(i，j))/(w+1)

Y_high(j)＝(Y_high(j)*w+YIQ_Y(i，j))/(w+1)

这里：

w是一个参数，

*(星号)代表乘法，

i是位置索引的列，

j是位置索引的行，

YIQ_Y(i，j)是位于位置索引的图像的象素的亮度值。

27、按照权利要求26所述的介质，其中阈值被表示为：

T(i，j)＝(X_low(i)+X_high(i)+Y_low(j)+Y_high(j))/4。

28、按照权利要求27所述的介质，其中为了初始化所述第一变量X_low(i)、所述第二变量X_high(i)、所述第三变量Y_low(j)和所述第四变量Y_high(j)，所述介质具有记录于其上并被配置成命令计算设备在存储器中保存下述值的指令：

X_low(i)＝YIQ_Y_min，i＝0，…，N-1

X_high(i)＝YIQ_Y_max，i＝0，…，N-1

Y_low(j)＝YIQ_Y_min，j＝0，…，M-1

Y_high(j)＝YIQ Y_max，j＝0，…，M-1

这里：

YIQ_Y_min＝minimum{YIQ_Y(i，j)}，i＝0，…，N-1，j＝0，…，M-1

YIQ_Y_max＝maxmum{YIQ_Y(i，j)}，i＝0，…，N-1，j＝0，…，M-1。

29、按照权利要求28所述的介质，还具有记录于其上并被配置成命令计算设备利用选自A_1和A_2的第一预训练程序和选自A_3和A_4的第二预训练程序预训练保存在存储器中的X_low(i)、X_high(i)、Y_low(j)和Y_high(j)的值的指令，其中预训练程序A_1被写为：

　　A_1：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_2被写为：

　　A_2：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YiQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　              else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_3被写为：

　　A_3：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_4被写为：

　　A_4：for i＝N_2 down to i＝N_1

 　　       for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

其中：

0≤M_1≤M_2≤(M-1)且

0≤N_1≤N_2≤(N-1)。

30、按照权利要求28所述的介质，还具有记录于其上并被配置成命令计算设备利用四种预训练程序A_1、A_2、A_3和A_4预训练保存在所述存储器中的X_low(i)、X_high(i)、Y_low(j)和Y_high(j)的值的指令，其中预训练程序A_1被写为：

　　A_1：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_2被写为：

　　A_2：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Xlow(i)+Xhigh(i))/2

　　                then Xlow(i)＝(Xlow(i)*w+YIQ_Y(i，j))/(w+1)

　　                else Xhigh(i)＝(Xhigh(i)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_3被写为：

　　A_3：for i＝N_1 to i＝N_2

　　        for j＝M_1 to j＝M_2

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

预训练程序A_4被写为：

　　A_4：for i＝N_2 down to i＝N_1

　　        for j＝M_2 down to j＝M_1

　　             if YIQ_Y(i，j)＜(Ylow(i)+Yhigh(i))/2

　　                then Ylow(j)＝(Ylow(j)*w+YIQ_Y(i，j))/(w+1)

　　                else Yhigh(j)＝(Yhigh(j)*w+YIQ_Y(i，j))/(w+1)

其中：

0≤M_1≤M_2≤(M-1)且

0≤N_1≤N_2≤(N-1)。