CN1585956A - 数字笔迹压缩方法 - Google Patents

数字笔迹压缩方法 Download PDF

Info

Publication number
CN1585956A
CN1585956A CNA028224299A CN02822429A CN1585956A CN 1585956 A CN1585956 A CN 1585956A CN A028224299 A CNA028224299 A CN A028224299A CN 02822429 A CN02822429 A CN 02822429A CN 1585956 A CN1585956 A CN 1585956A
Authority
CN
China
Prior art keywords
handwriting
delta
axle
stroke
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA028224299A
Other languages
English (en)
Other versions
CN1287320C (zh
Inventor
乔纳森·利·纳珀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Silverbrook Research Pty Ltd
Original Assignee
Silverbrook Research Pty Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Silverbrook Research Pty Ltd filed Critical Silverbrook Research Pty Ltd
Publication of CN1585956A publication Critical patent/CN1585956A/zh
Application granted granted Critical
Publication of CN1287320C publication Critical patent/CN1287320C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Abstract

本发明公开一种数字笔迹输入的压缩方法。数字笔迹包括一系列笔划,每个笔划被表示成一系列代表x和y坐标的数字字,对于每个笔划的压缩数字笔迹数据包括至少在绝对项中表示的一个参考坐标,随后的坐标以坐标的偏移表示,使用线性预测评估,这样给定坐标可以基于先前的m坐标值确定:其中ci是为数字笔迹的模型特征选出的系数,α代表x或者y轴坐标值。

Description

数字笔迹压缩方法
技术领域
本发明涉及压缩数字笔迹方法,尤指一种线性预编码模式压缩方法。
背景技术
随着可笔写便携式计算设备使用率的增加,例如掌上电脑PDA,对输入笔划的及时处理和高效存储提出了更高的要求。现有技术涉及输入笔划数据转化,就是通过触笔在触摸屏上描绘出字符,将描绘出的字符转化成计算机可识别的文本或者ASCII。
用这种方式,如果使用者输入手写数据,通常该手写数据会以ASCII文本的形式存储在设备的数据存储器中。如果使用者想在数据中查询一个单词,他必须输入手写单词,通过字符识别技术把该手写单词再次被转换成简单的ASCII文本使计算机能定位到已存储的单词,然后将该单词以计算机生成的字体或字型显示。
渐渐的感觉将手写数据输入转化成ASCII文本是一个不必要的步骤。但是,这是当前存储大量数据的最有效的方式。这是因为把手写数据储存成图像文件是要占用更多的内存的。即使把笔划存储成x-y坐标也会占用大量内存。
通常,数据笔迹是由一连串的笔划构成,笔划起始于笔式设备接触绘图表面,结束于笔式设备的抬起。当笔接触到绘图表面时,每个笔划包含定义笔移动的采样坐标集。
如上所述,笔式计算的增加和网络计算资源的纸式界面的出现使得压缩数字笔迹技术的需求更加突出了。这在2000年4月6日Anoto的新闻稿“Anoto,Ericsson,and Time Manager Take Pen and Paper into theDigital Age with the Anoto Technology”中已经被阐述。因为手写笔迹具有比文本更加易于表式和灵活的格式,所以急需能够支持存储、检索和复制未加工的数字笔迹的笔式计算系统。但是,因为代表信息的数字笔迹比对应的传统表达所占的内存要大的很多(即代表手写笔迹的数字笔迹要比对应的ASCII文本大很多),所以需要用数字笔迹压缩来确保这种数据类型的高效传送和存储。
在电话领域里,delta编码技术是压缩电话语音信号的已知技术。差分脉冲编码调制技术(DPCM)利用语音信号的大多数能量产生于低频的事实,给定的足够高的采样率,抽样间差异的范围远小于单个抽样的范围。一种更加精确的压缩方法,自适应差分脉冲编码调制方法将64Kb/s的语音信号压缩成低于16Kb/s的信号。ITU标准G726定义(国际电信联盟(ITU),“40,32,24,16Kbit/s自适应脉冲编码调制(ADPCM)”,ITU-T建议G.726),这种技术匹配了基于对短周期帧的统计分析的delta步长的范围。
类似的,线性预测编码(LPC)可以将电话语音压缩到低比特率。通常LPC音频压缩是有损耗的且能引入畸变的,一个采用LPC-10e标准的例子,对合成语音以2.4Kb/s进行语音压缩后的话音质量很不好。现在提出的基于LPC的更加复杂的算法以相应的更高比特率产生更高质量的信号(例如ITU标准的G.723.1(国际电信联盟(ITU),ITU-T建议G.723.1中的“Dual Rate Speech Coder for Multimedia TelecommunicationTransmitting at 5.3 and 6.3Kbit/s”))中描述的码激励线性预测(CELP)压缩算法。
美国专利号为6,212,295公开了一个手写动力的重建过程通过“累计原始数据的函数的增量值”。这种技术使用非线性函数加强用于手写签名验证系统的原始信号的速度成分。
许多商业经销商已经开发了一些损耗数字笔迹压缩的产品。Communications Intelligence Corporation已经提供了名为INKShrINK的产品,该产品能够“储存高分辨率电子笔迹远小于存储一幅压缩图像”。该产品提供了六级优化方法,是范围和重建图像质量间的折中。另外一种基于贝塞尔(Bezier)曲线的笔迹压缩模式在JOT标准中有所描述:1993年5月,Slate Corporation的“JOT-A Specification for an InkStorage and Interchange Format”。
现有的资料表明为了利用数字笔迹的潜力,需要一种高效直接的压缩模式。本发明的目的就是解决该问题。
发明内容
本发明涉及连续的低消耗的数字笔迹压缩技术。本发明提出该领域的相关的工作,和一些数字笔迹的delta编码和线性预编码算法。算法的压缩结果和对最优压缩模式的最坏情况特性的讨论将一并给出。
本发明的重点是数字笔迹的压缩。此外,压缩技术将被设计成连续的,利用最小的内存和处理器资源,使得该技术适用于低代价嵌入环境。本发明的具体实施例考虑到低消耗或者损耗压缩,其差别在于一个实现特性。
根据本发明的一项实施例,提供了一种压缩数字笔迹输入的方法,该输入包括一系列笔划,每个笔划被表示成一系列代表x和y坐标的数字字,对于每个笔划的压缩数字笔迹数据包括至少在绝对项中表示的一个参考坐标,随后的坐标以坐标的偏移表示,使用线性预测评估,这样给定坐标可以基于先前的m坐标值确定:
α ~ n = Σ i = 1 m c i α n - i
其中ci是为数字笔迹的模型特征选出的系数,α代表x或者y轴坐标值。
x或者y轴坐标值参考一个平面空间,在该空间内,x代表笔迹的方向。
更好的,m可以是2,坐标可被定义为:
        αn=C1αn-1+C2αn-2
更好的,C1>0且C2<0。根据经验得出的这些条件能够提供可接受的性能。
更好的,1≤C1≤3且-2≤C2≤1。这些缩小的范围比前面所述的范围能得到更好的性能
更好的,C1=2且C2=-1。这些值提供可接受的性能,并且因为它们都是整数,因而能更加快速简单的实现。
或者,x轴与y轴的系数(Ci)取不同的值。因为大多数笔迹是非对称的,所以x和y轴取不同的系数值编码是更可取得。例如,由于在一些字母的尾部如‘y’、‘g’和一些字母如‘k’、‘l’和‘d’相对来说有着较长的垂直元素,所以在y轴上的笔划比在x轴的长。
更好的,对于x轴C1=1.857,C2=-0.856,对于y轴:C1=1.912,C2=-0.913。由经验获得的这些值具有最优性能。
更好的,m为3,坐标值可以被定义为:
α ~ n = c 1 α n - 1 + c 2 α n - 2 + c 3 α n - 3
使用3个先前的坐标值可以提高预测性能,改进编码效果。
更好的,C1>0且C2<0且C3<1。
更好的,x轴与y轴的系数(Ci)取不同的值。
更好的,对于x轴:C1=1.799,C2=-0.722,C3=-0.078,对于y轴:C1=2.009,C2=-1.107,C3=-0.098。
附图说明
通过下面结合附图对优选的但并非限制性的实施例的描述,本发明将变得非常明显,其中:
图1是适用于本发明的具体实施例的方法执行的处理器;
图2是本发明的具体实施例的delta编码器的信号流图;
图3是本发明的具体实施例的自适应Huffman Delta编码器的信号流图;
图4是本发明的具体实施例的线性预测编码器的信号流图;
图5是来自于训练数据库中数字笔迹的deltas的直方图和相对应的熵值;
图6是来自于训练数据库中数字笔迹的x deltas的直方图和相对应的熵值;
图7是来自于训练数据库中数字笔迹的y deltas的直方图和相对应的熵值;
图8使用线性预测的x剩余的直方图相对应的熵值;
图9使用线性预测的y剩余的直方图相对应的熵值。
具体实施方式
为了更好地理解本发明的主题,通过以下的适于书面描述的方式和附加的权利要求方式来阐述本发明。
本发明提供了几个数字笔迹压缩的具体实施例。图中合并阐述了本发明的特征,使用数字编号来表示图中不同的部分。
优选的,但不是限定的,图1表示本发明的具体实施例。
图1中的处理系统是实施本发明的一个例子。处理系统10通常至少包括一个处理器20,存储器21,输入装置22例如图形输入板和/或键盘,输出装置23例如显示器,所述各个部分通过总线24连接。用于将处理系统和存储器11比如说数据库连接起来外部接口25。
在使用中,处理系统10可以存储数据和/或从数字笔迹数据库11中检索。处理器通过输入接收数据,使用储存在存储器中的数据处理数据。处理系统可以产生一个输入数字笔迹数据的压缩版。从中我们可以理解为处理系统10可以是任何处理系统或终端的形式,如一台计算机,便携式电脑,服务器,专用硬件设备或者类似的其他形式。
下面的例子对本发明实施的更详细的描述。这些例子仅仅是为了举例,并不限制本发明。
在下面的描述中,数字笔迹以笔划的阵列形式出现,每个数字笔迹开始于下笔事件,持续到对应的抬笔事件。笔划中的点以100Hz的采样率采样存储成32比特的X和Y轴坐标。其它的分辨率和采样率当然也是可以的,这些值只是示范的。在实验中通过Wacom数字转换器搜集数字笔迹,包括连笔字、印刷文本和手绘图像的混合。采样后的数字笔迹被分到两个不相连的数据库中,一个用于训练(如果需要的话),另一个用于测试。
除非有其它的指定,否则将X和Y坐标值用同样的步骤编码。所以对Y轴坐标的编码和解码的方程可以由对X轴坐标的编码和解码所给出的方程导出。注意其它的笔迹表示包括附加的关于笔划的力学信息,例如笔压和方向。可以预测用下述的相同或者相似的技术可以将此类信息成功的压缩。
Delta编码
这部分详细介绍使用delta编码的数字笔迹压缩的算法和实验结果,并且讨论为delta码压缩编码的熵的作用。
简单的delta编码
经过观察发现在数字笔划中的连续点间的差值要远小于坐标点自己的大小。因此传送储存单个采样的差值而不是采样点本身,可以达到对数字笔迹流的压缩。为了对数据编码,第一个点将以全精度(即32比特)传送,每个连续点被编码成与该点的前一点的一对X和Y的偏移(即Xdelta和Y delta)
             Δxn=xn-xn-1
既然采样delta值比采样点本身小得多,他们可以用较少的比特来编码。解码压缩流:
              xn=xn-1+Δxn
图2给出了delta编码的信号流图。用16比特delta编码,测试数据库以系数1.97压缩(49.24%),能够得出近似期望值,表示阵列大小和初始点的传送。
自适应Delta编码
在压缩过程中导出的delta的检查揭示了可以用比上述方法少得多的比特数编码。然而,包括高速度部分(即,采样点间的位置的大变化,因此会有大的delta值)的笔划会需要更多的比特数进行编码。通过在一个笔划中测量delta的动态范围,可以为delta编码选择最优的比特数:
Figure A0282242900101
Δxn=xn-xn-1-Δxmin
其中,Δxmin和Δxmax是流量中的最小最大采样delta值,Δxbits包括在Δxmax和Δxmin范围内编码所需要的比特数量。对信号编码,第一个采样用全精度,遵循Δxbits(这样解码器会知道每个delta中有多少个比特需要接收)和Δxmin(这样解码器可以重新创造的xn值)。将Δxn采样delta用Δxbits限定的比特数量编码并传送。
将传送来的内容解码,获得Δxbits和Δxmin值,笔划用下面的公式重新构造:
                  xn=xn-1+Δxn+Δxmin
使用这种方案,数据库以系数7.43(86.54%)被压缩。注意,这种压缩方案要求所有笔划的点在进行压缩前都是可以计算动态范围,因而不能没有缓冲就压缩一连串的点。用短周期统计来估计delta编码的最优的比特数可以实现自适应delta编码方案。
改进的自适应delta编码
在上面详述的压缩方法中,每个笔划的初始点的全精度编码和传送阵列大小的附加(overhead)构成了位流的标志位。为了减少附加,可以基于该点与前面笔划的最后点的偏移,对初始笔划点进行delta编码。因为大多数的偏移量是很小的(因为临近笔划倾向于在同一个空间),但是大的偏移就必须调整成没有标识附加,所以需要使用变化的数值对其进行编码。
实现上面所述,传送数值n比特,后面是一个位标志,用来表示数值是否结束(即,用n比特就可以完全定义数值)或者需要更多的比特来表示数值。如果这样,传输又一个n比特,接着是结束标志。使用这种方法,小的数值可以用少的比特数编码,大的数值的表示合理而有效率。用同样的方法传送笔划阵列和点阵大小。除非特别指出,否则下面所述的压缩模式都是使用这种技术对初始点和阵列大小编码。使用这种方法,测试数据库以系数8.20(87.80%)进行压缩。
自适应Huffman Delta编码
通过使用对全部动态范围编码所需的最小比特数编码delta,使得自适应delta编码显著的改善了压缩,与此同时,笔划中所有的delta都使用相同的比特数,不管他们在流中的频率。图5是训练数据库中的数字笔迹的delta的直方图,和对应的熵值,使用如下公式进行离散计算:
entropy = - Σ x ∈ X p ( x ) log 2 p ( x )
显然,既然delta值不是随机分布的,使用熵编码delta值获得近一步的压缩增益是有可能的。使用不同长度源码,例如通过Huffman编码方式构造的源码常常比使用如上所述的固定长度代码更少的比特数。自适应Huffman编码方法(参考J.Vitter 1987年著的《Journal of theACM》的第825-845页第34卷的“Design and Analysis of Dynamic HuffmanCodes”)被用来对点delta进行编码。自适应delta编码确定从源信息到基于源信息概率估计的码字的映射。被选择的码字不断的更新来保持对于目前概率估计是最优的。
为了对数字笔迹流编码,huffman编码的字母表被定义成在-16到16的范围内的一系列delta,扩展码代表超出这个范围的值,结束码表示一个笔划的结束。用自适应Huffman编码器计算、编码每个点的X和Y delta,并传送出去。如果一个delta的绝对值大于16,发送扩展码,后面跟着发送16比特值的delta.。当所有的点都发送出去后,发送结束码表示一个笔划的结束。图3给出了编码delta压缩的熵的信号流图。使用这种方案的数据库以系数9.66压缩(89.65%)。
静态Huffman Delta编码
用自适应Huffman编码的码字在编码过程中动态产生。因此,位流必须包括未压缩的字母词条。因为不需要发送表词条,用预先定义的产生于训练数据集的静态Huffman表压缩delta可以减少开销。但是,当把压缩训练数据库作为一个整体来考虑,生成的码字是最优的,可是对任意一个单个笔划可能不是最优的,可能会导致低于delta优化压缩。
为了编码数字笔迹,通过训练数据库计算出一个delta值的Huffman表,如下表1所示。使用这种方案,数据库以系数9.69压缩(89.68%),比自适应Huffman编码方案稍微有所提高。
-16  10110100011011011110
-15  1011010001101100
-14  1011010001101111
-13  10110100011010
-12  101101000111
-11  1011010000
-10  1101010000
-9  101101001
-8  110101001
-7  11010101
-6  1101011
-5  111010
-4  10111
-3  11100
-2  1010
-1  010
0  00
1  100
2  011
3  1111
4  1100
5  11011
6  111011
7  101100
8  1011011
9  10110101
10  1101010001
11  10110100010
12  1011010001100
13  1011010001101110
14  101101000110110110
15  10110100011011011111
16  1011010001101101110
出口  10110100011011010
结束  110100
             表1 Huffman编码点的delta值
线性预编码
线性预编码(如J.Stein著,John Whiley & Sons Inc.2000年出版的《Digital Signal Processing-A Computer Science Perspective》中描述的那样)是基于先前采样点的线性插值估计所观察的信号的下个采样点的过程。任何非随机信号都可以基于先前的采样点m进行线性预测:
x ~ n = Σ i = 1 m c i x n - i
剩余误差表示估计的采样值与实际观察的采样值的差。
e n = x ~ n - x n = Σ i = 1 m c i x n - i - x n
在压缩中使用线性预测,下一点的估计可以用预测模型和先前的采样点得到,并且发送估计的剩余误差。因此,估计越精确,剩余误差越小,发送所需的比特数就越少。
简单的线性预测
为了进行线性预测,必须确定系数集{c1,…,cm}。m=2(即,下一个采样点是基于前两个采样点预测的),假设下一个采样等于前一个采样加上前一个delta xn-1-xn-2,可以产生一个简单的系数集:
xn=xn-1+(xn-1-xn-2)=2xn-1-xn-2
这样,选择系数{c1=2,c2=-1}。为了检验和比较这些系数的预测能力,训练数据库中数字笔迹的X和Y的均方剩余误差可以被计算出,如下表2所示。
X和Y剩余部分的线性预测直方图由图8和图9给出,这些分布的熵也一并给出。当和产生于相同数据库的X和Y delta的直方图相比(如图6和7),剩余值的熵的减少是显而易见的,这说明用线性预测进行进一步压缩是可能的。
用训练数据库中数字笔迹的线性预测估计的剩余误差可以生成静态Huffman表。为了编码数字笔迹,发送初始点后,跟着发送随后点的预测值的Huffman编码的剩余误差。这一步骤的信号流图在图4中给出。使用这种方案,测试数据库以系数14.30压缩(93.01%),在最好的delta编码方法的基础上有了相当大的改进。
改进的线性预测
上面使用的LP系数是通过假定下一个采样等于前一个采样加上前一个delta产生的。然而,潜在的较好的系数可以从训练数据中得出,这样更准确的效仿了笔迹产生过程的固有偏差。
已知采样集{x1,…,xn},我们需要找出系数c1和c2,用最小二乘中的最小误差从前面的点xi-2和xi-1预测xi。为了实现这一过程,我们找出使得预测值的均方误差和最小的系数。
S = Σ i = 3 i = n e i 2
其中预测误差可由下面公式计算:
ei=c1xn-2+c2xn-1-xn
理想情况是S为0(也就是,每一点都是无误差的预测)。如果c是2维系数向量:
c = c 1 c 2
x是观察信号值的n-2维向量:
x = x 3 x 4 . . . x n
A是预测采样的2×(n-2)维矩阵:
A = x 1 x 2 x 2 x 3 . . . . . . x n - 2 x n - 1
那么当S=0时,解方程得:
Ac=x
传统解法
c=A-1x
显然是不可能的,因为当n≠4时A-1是不存在的。对于n>4,当方程的数量大于未知数的数量时,矩阵A是多维的。通过A的伪转换A+,(如R.Penrose著,1955年出版的《Proceedings of the CambridgePhilosophical Society》第406-413页第51卷的“A GeneralizedInverse for Matrices”中所述),我们可以找到一个解,可以使最小二乘法的误差最小。
c=A+x
伪转换A+总是存在的,即使A中行与列间具有线性相关性或者A不是平方的。计算结果是基于奇值分解得到的,并且小于特定门限值δ的奇值可以看作0:
δ=n×norm(A)×ε
其中norm(A)是A的最大奇值,ε是小数值(在下面的计算中,被设为1e-16)。
用这种方法,X的系数{c1=1.856534,c2=-0.856130}和Y的系数{c1=1.912482,c2=-0.912907}产生了。使用这些系数,得出的均方剩余误差要低于用原始的系数得到的误差,参看下表2,说明使用最优系数可以使点预测的更准确。使用这种方案,测试数据库以系数14.35压缩(93.03%),在原始线性预测方法的基础上有了少量改进。
三点线性预测
这里描述的线性预测技术在计算下一个点的估计时,大多使用两个前面的采样点。然而,使用更多的采样点预测下一点可以产生更精确的估计。基于前三点的线性预测,对下一个点的估计如下:
x ~ n = c 1 x n - 1 + c 2 x n - 2 + c 3 x n - 3
用上述技术计算最优系数,导出X的系数{c1=1.799363,c2=-0.721519,c3=-0.077570}和Y的系数{c1=2.008523,c2=-1.106576,c3=0.097674}。用该方法得到的均方剩余误差低于用前面的方法得到的剩余误差(参见表2),但是由于对delta的量化,用这种方案并不能给压缩系数带来任何的改进。
预测方案 ex  ey  ex+ey
3.1简单的线性预测 0.795010  1.150542  1.945552
3.2改进的线性预测 0.736885  1.094879  1.831764
3.3三点线性预测 0.707117  1.057198  1.764315
                  表2线性预测均方剩余误差
最坏情况特性
对于线性预测系统,当信号的方向快速改变时,是最坏情况特性,因为估计步骤不能预测方向的改变并且可能在方向改变的点上溢出。对于数字笔迹,相当于以高频率和尖锐方向变化的快速涂写的潦草笔迹(举个例子,在某一区域用大量快速来回的移动的单一笔划填写)。
为了测试最坏情况下的线性压缩的特性,将大量数字连体字用改进线性预测模式压缩,得到系数1.92(91.61%)。虽然这个压缩率比起用更普通的数字采样压缩得到的压缩率要低,但是它仍然代表相当高水平的压缩。这很大程度是因为笔划通常在改变方向之前会将速度降低到0,因为速度(和对下一个采样点的delta估计)低,所以在方向改变的点上的预测误差小。
本发明包括大量实施例,并且其性能已经被估计。下表3给出了结果的总结。最好的压缩技术达到了大型数字笔迹数据库中14.35的压缩系数(93.03%),该技术基于线性预测编码。为了生成可接受的结果,异常条件下的压缩方案被估计和提出。
压缩方案 压缩系数
2.1简单的delta编码 1.97 49.24
 2.2自适应Delta编码 7.43  86.54
 2.3改进的自适应delta编码 8.20  87.80
 2.4自适应Huffman Delta编码 9.66  89.65
 2.5静态Huffman Delta编码 9.69  89.68
 3.1简单的线性预测 14.30  93.01
 3.2改进的线性预测 14.35  93.03
 3.3三点线性预测 14.35  93.03
 3.4最坏情况特性 11.92  91.61
                    表3结果总结
广义上说,在应用的说明书中引用或者表示的本发明包括部分、元素和特征,逐个地或者全体地,两个或者多个所述部分、元素或者特征的一些或者所有组合,在此提到的特定数字在与本发明相关的领域是已知的,这些已知知识与本发明是融为一体的,即使是分别提出的。
尽管上面对优选实施方式进行了详细地描述,但本领域的普通技术人员仍然可以在不脱离上述描述的和下述请求保护的本发明范围的情况下,做出各种改变、替换和更改。

Claims (11)

1、一种压缩数字笔迹输入的方法,该输入包括一系列笔划,每个笔划被表示成一系列代表x和y坐标的数字字,对于每个笔划的压缩数字笔迹数据包括至少在绝对项中表示的一个参考坐标,随后的坐标以坐标的偏移表示,使用线性预测评估,这样给定坐标可以基于先前的m坐标值确定:
α ~ n = Σ i = 1 m c i α n - i
其中ci是为数字笔迹的模型特征选出的系数,α代表x或者y轴坐标值。
2、如权利要求1所述的方法,其特征在于,m是2,给定坐标定义为:
                 αn=C1αn-1+C2αn-2
3、如权利要求2所述的方法,其特征在于,C1>0且C2<0。
4、如权利要求3所述的方法,其特征在于,
        1≤C1≤3且
        -2 ≤C2≤1。
5、如权利要求4所述的方法,其特征在于,C1=2且C2=-1。
6、如权利要求1到4任何一项所述的方法,其特征在于,x轴与y轴的系数Ci取不同的值。
7、如权利要求6所述的方法,其特征在于,对于x轴:
C1=1.857
C2=-0.856,且
对于y轴:
C1=1.912
C2=-0.913。
8、如权利要求1所述的方法,其特征在于,m是3,给定坐标定义为:
α ~ n = c 1 α n - 1 + c 2 α n - 2 + c 3 α n - 3 .
9、如权利要求8所述的方法,其特征在于,C1>0且C2<0且C3<1。
10、如权利要求8或9所述的方法,其特征在于,x轴与y轴的系数Ci取不同的值。
11、如权利要求10所述的方法,其特征在于,对于x轴:
C1=1.799
C2=-0.722
C3=-0.078,且
对于y轴:
C1=2.009
C2=-1.107
C3=-0.098。
CNB028224299A 2001-11-16 2002-10-15 数字墨压缩方法 Expired - Fee Related CN1287320C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AUPR8902 2001-11-16
AUPR8902A AUPR890201A0 (en) 2001-11-16 2001-11-16 Methods and systems (npw005)

Publications (2)

Publication Number Publication Date
CN1585956A true CN1585956A (zh) 2005-02-23
CN1287320C CN1287320C (zh) 2006-11-29

Family

ID=3832719

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028224299A Expired - Fee Related CN1287320C (zh) 2001-11-16 2002-10-15 数字墨压缩方法

Country Status (10)

Country Link
US (5) US7308148B2 (zh)
EP (1) EP1444641A4 (zh)
JP (1) JP2005509385A (zh)
KR (1) KR100612759B1 (zh)
CN (1) CN1287320C (zh)
AU (1) AUPR890201A0 (zh)
CA (1) CA2463324C (zh)
IL (1) IL161749A0 (zh)
WO (1) WO2003044723A1 (zh)
ZA (1) ZA200402927B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636715A (zh) * 2013-11-14 2015-05-20 株式会社和冠 动态手写验证和基于手写的用户认证
CN112040562A (zh) * 2020-08-03 2020-12-04 华中科技大学 一种智能笔终端的通信方法、智能笔终端及通信系统

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPR890201A0 (en) 2001-11-16 2001-12-06 Silverbrook Research Pty. Ltd. Methods and systems (npw005)
US7474770B2 (en) * 2005-06-28 2009-01-06 Beigi Homayoon S M Method and apparatus for aggressive compression, storage and verification of the dynamics of handwritten signature signals
JP4869149B2 (ja) * 2007-05-16 2012-02-08 オリンパスイメージング株式会社 画像データ圧縮装置、画像データ圧縮方法およびプログラム
US8644171B2 (en) * 2007-08-09 2014-02-04 The Boeing Company Method and computer program product for compressing time-multiplexed data and for estimating a frame structure of time-multiplexed data
CN102299718A (zh) * 2010-06-25 2011-12-28 汉王科技股份有限公司 手写终端轨迹的压缩和解压方法
GB2483282B (en) * 2010-09-03 2017-09-13 Advanced Risc Mach Ltd Data compression and decompression using relative and absolute delta values
TWI486837B (zh) * 2012-09-18 2015-06-01 Egalax Empia Technology Inc 基於預測的位置追蹤方法
GB2511355B (en) * 2013-03-01 2015-06-03 Gurulogic Microsystems Oy Encoder, decoder and method
US9535646B2 (en) 2013-06-18 2017-01-03 Microsoft Technology Licensing, Llc Methods and systems for electronic ink projection
EP3061067B1 (en) * 2013-10-25 2023-11-29 Wacom Co., Ltd. Dynamic handwriting verification, handwriting-baseduser authentication, handwriting data generation, and handwriting data preservation
US10032065B2 (en) 2013-10-25 2018-07-24 Wacom Co., Ltd. Dynamic handwriting verification, handwriting-based user authentication, handwriting data generation, and handwriting data preservation
EP3107300A1 (en) * 2015-06-15 2016-12-21 Thomson Licensing Method and device for encoding both a high-dynamic range frame and an imposed low-dynamic range frame
US10338807B2 (en) 2016-02-23 2019-07-02 Microsoft Technology Licensing, Llc Adaptive ink prediction

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5856913B2 (ja) 1980-10-28 1983-12-17 日本電信電話株式会社 手書き信号符号化方式
US4509150A (en) * 1980-12-31 1985-04-02 Mobil Oil Corporation Linear prediction coding for compressing of seismic data
US4542412A (en) * 1982-02-04 1985-09-17 Shaken Co., Ltd. Method for compressing character or pictorial image data
US4781096A (en) * 1984-10-09 1988-11-01 Nippon Gakki Seizo Kabushiki Kaisha Musical tone generating apparatus
US4864618A (en) * 1986-11-26 1989-09-05 Wright Technologies, L.P. Automated transaction system with modular printhead having print authentication feature
US5051736A (en) * 1989-06-28 1991-09-24 International Business Machines Corporation Optical stylus and passive digitizing tablet data input system
US5245679A (en) * 1990-05-11 1993-09-14 Hewlett-Packard Company Data field image compression
WO1991018479A1 (en) * 1990-05-14 1991-11-28 Eastman Kodak Company Block adaptive linear predictive coding with adaptive gain and bias
US5852434A (en) * 1992-04-03 1998-12-22 Sekendur; Oral F. Absolute optical position determination
US5477012A (en) * 1992-04-03 1995-12-19 Sekendur; Oral F. Optical position determination
WO1994003853A1 (en) * 1992-07-29 1994-02-17 Communication Intelligence Corporation A method and apparatus for compression of electronic ink
WO1994004992A1 (en) * 1992-08-20 1994-03-03 Communication Intelligence Corporation A method for dynamic reconstruction of handwritten data
DE69425412T2 (de) * 1993-11-23 2001-03-08 Ibm Anlage und Verfahren zur automatischen Handschrifterkennung mittels eines benutzerunabhängigen chirographischen Labelalphabets
US5687254A (en) 1994-06-06 1997-11-11 Xerox Corporation Searching and Matching unrecognized handwriting
US6101280A (en) * 1994-07-04 2000-08-08 Hewlett-Packard Company Method and apparatus for compression of electronic ink
EP0691623B1 (en) 1994-07-04 2001-10-04 Hewlett-Packard Company, A Delaware Corporation Scribble matching
US5652412A (en) * 1994-07-11 1997-07-29 Sia Technology Corp. Pen and paper information recording system
US5661506A (en) * 1994-11-10 1997-08-26 Sia Technology Corporation Pen and paper information recording system using an imaging pen
US5528003A (en) * 1994-12-14 1996-06-18 International Business Machines Corporation Data compression for pen stroke input
US6125207A (en) * 1995-06-05 2000-09-26 Motorola, Inc. Encoded facsimile communication with a selective system and method therefor
US6278445B1 (en) * 1995-08-31 2001-08-21 Canon Kabushiki Kaisha Coordinate input device and method having first and second sampling devices which sample input data at staggered intervals
US6081261A (en) 1995-11-01 2000-06-27 Ricoh Corporation Manual entry interactive paper and electronic document handling and processing system
US6295378B1 (en) * 1996-02-29 2001-09-25 Sanyo Electric Co., Ltd. Handwriting stroke information encoder which encodes handwriting stroke information by sampling
US5692073A (en) * 1996-05-03 1997-11-25 Xerox Corporation Formless forms and paper web using a reference-based mark extraction technique
JPH1011208A (ja) * 1996-06-24 1998-01-16 Sharp Corp 座標入力装置
GB9625661D0 (en) * 1996-12-11 1997-01-29 Hewlett Packard Co A method and apparatus for compression of electronic ink
US6518950B1 (en) 1997-10-07 2003-02-11 Interval Research Corporation Methods and systems for providing human/computer interfaces
JP2882404B1 (ja) * 1997-12-17 1999-04-12 日本電気株式会社 手書き符号処理装置
WO1999050751A1 (en) 1998-04-01 1999-10-07 Xerox Corporation Routing document identifiers
US6333966B1 (en) * 1998-08-18 2001-12-25 Neil Charles Schoen Laser accelerator femtosecond X-ray source
US6964374B1 (en) * 1998-10-02 2005-11-15 Lucent Technologies Inc. Retrieval and manipulation of electronically stored information via pointers embedded in the associated printed material
US6549675B2 (en) * 2000-12-20 2003-04-15 Motorola, Inc. Compression of digital ink
AUPR890201A0 (en) 2001-11-16 2001-12-06 Silverbrook Research Pty. Ltd. Methods and systems (npw005)
US7162087B2 (en) * 2001-12-28 2007-01-09 Anoto Ab Method and apparatus for recording of electronic handwriting
US20030123745A1 (en) * 2001-12-28 2003-07-03 Mattias Bryborn Method and apparatus for compression and reconstruction of electronic handwriting
US7312898B2 (en) * 2002-10-31 2007-12-25 Hewlett-Packard Development Company, L.P. Transformation of an input image to produce an output image
US7302106B2 (en) * 2003-05-19 2007-11-27 Microsoft Corp. System and method for ink or handwriting compression
US20050089237A1 (en) * 2003-10-24 2005-04-28 Jaehwa Park Method and apparatus for bezier curve approximation data compression

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636715A (zh) * 2013-11-14 2015-05-20 株式会社和冠 动态手写验证和基于手写的用户认证
CN104636715B (zh) * 2013-11-14 2020-01-03 株式会社和冠 动态手写验证和基于手写的用户认证
CN112040562A (zh) * 2020-08-03 2020-12-04 华中科技大学 一种智能笔终端的通信方法、智能笔终端及通信系统
CN112040562B (zh) * 2020-08-03 2022-04-29 华中科技大学 一种智能笔终端的通信方法、智能笔终端及通信系统

Also Published As

Publication number Publication date
US8345997B2 (en) 2013-01-01
EP1444641A1 (en) 2004-08-11
US7463779B2 (en) 2008-12-09
ZA200402927B (en) 2005-04-26
KR100612759B1 (ko) 2006-08-21
US8121426B2 (en) 2012-02-21
US7308148B2 (en) 2007-12-11
CN1287320C (zh) 2006-11-29
JP2005509385A (ja) 2005-04-07
US20090046936A1 (en) 2009-02-19
CA2463324C (en) 2011-01-18
US20040247191A1 (en) 2004-12-09
US20080056595A1 (en) 2008-03-06
IL161749A0 (en) 2005-11-20
US20120141040A1 (en) 2012-06-07
WO2003044723A1 (en) 2003-05-30
CA2463324A1 (en) 2003-05-30
AUPR890201A0 (en) 2001-12-06
KR20050036894A (ko) 2005-04-20
US20110007978A1 (en) 2011-01-13
EP1444641A4 (en) 2006-03-22
US7650033B2 (en) 2010-01-19

Similar Documents

Publication Publication Date Title
CN1287320C (zh) 数字墨压缩方法
US7302106B2 (en) System and method for ink or handwriting compression
US20050089237A1 (en) Method and apparatus for bezier curve approximation data compression
CN101038303A (zh) 一种电力波形记录数据的压缩方法
CN1703089A (zh) 一种数字信号的二值算术编码方法
CN110442711B (zh) 文本智能化清洗方法、装置及计算机可读存储介质
WO2021081913A1 (zh) 向量查询方法、装置、电子设备及存储介质
CN1868127A (zh) 数据压缩系统和方法
CN1254921C (zh) 改进的哈夫曼译码方法和装置
CN114239798A (zh) 基于奇偶性对数量化的无乘法深度神经网络模型压缩方法
CN102299718A (zh) 手写终端轨迹的压缩和解压方法
CN1134895C (zh) 压缩电子墨迹的方法和装置
CN102622359A (zh) 搜索数据库中字符串的方法和装置
CN109582654B (zh) Pdf文档压缩方法、装置、计算机设备及存储介质
WO2018124209A1 (ja) デジタルインクの符号化方法、復号化方法
CN1302010A (zh) 高度压缩的基于笔划的手写文字处理技术
AU2002333062B2 (en) Method of compressing digital ink
CN1275127C (zh) 按笔顺输入的汉字输入法及其键盘
CN109698704B (zh) 比对型基因测序数据解压方法、系统及计算机可读介质
ZA200507770B (en) Method of compressing digital ink
CN1504863A (zh) 简明数码韩文输入方法
CN1051996A (zh) 计算机通用汉字系统
CN1201220C (zh) 核心码计算机输入法
CN1598743A (zh) 按规范笔顺输入汉字的输入法及其键盘
WO2017187244A1 (en) Method of data compression and decompression

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20061129

Termination date: 20121015