英语原文共 7 页
邮件的物理布局分割
专用于自动邮政分拣系统的应用
摘要
邮政分拣系统每天都会传播数吨邮件。值得注意的是,邮件拒绝的主要来源与地址块定位任务的失败有关,特别是物理布局分割阶段。自下而上和自上而下的分割方法带来了不同的知识,在我们需要时不应忽略增加稳健性。混合方法结合了两种策略,以利用一个战略损害他人。从这些开始备注,我们的提议使用混合动力细分策略更适应邮政邮件。高级阶段是基于层次图着色,允许管理通过金字塔数据组织,复杂引导对连词的解释的规则利益区的组成分解。今天不在这种情况下的其他工作已经利用了个工具的强大之处。绩效评估我们的方法在10000的语料库上进行了测试信封图像。处理时间和拒绝率大大降低
- 简介
最近的自动邮件分拣机系统每秒处理大约17个邮件。那需要快速而精确的基于OCR的识别块地址。这种认可主要是由正确的地址线组织决定。获取信封图像后通过线性CCD相机,三个主要模块有助于地址块本地化的任务:包络图像的物理布局分割,特征提取和地址块识别(见图1)。物理布局分割的阶段有一个对整理排序的影响很大系统。通常,此分段表示
将包络图像分解成不相交的包含均匀的组成元素组件,以便分别识别它们。这些元素通常是间隔的并且形成基本的几何块,基于大的矩形大多数情况。分割的定义字面意义与“分析”这个词非常相似。模块化排序架构系统,物理布局分割阶段由模块a,b和c表示。当构成时说出过分割当几个构成组件时,组件是碎片化的,并且是关于欠分裂的无法孤立。从效果的角度来看,我们注意到了传统的分割技术遇到了几个限制因素(图2):降级图像(折叠信封),非常大的邮件品种(质量,颜色和不同纸纹理),实时约束(有限的处理时间),信封上的文字线偏斜,字符,线条和字符之间的间距不均匀文本块,结果的义务,图像的高空间分辨率(300 dpi),地址块附近存在寄生元素(邮票,邮局标记,印刷标识......),叠加信息层(邮票,手写笔记......)。考虑到这些限制,我们在此提出建议纸张原始物理布局方法邮件图像的分割。使用图论,我们的技术原理是基于数据的金字塔形表示。根本目标在于提高每个人的表现分割阶段及其与另一阶段的一致性阶段,以减少邮件拒绝和时间处理到最大。开发的方法将被集成到自动邮件系统中排序。本文的其余部分安排如下:引用了各种分割方法第2节,其中以前的作品和集合提出限制。在第三节,正式图表着色的方面是详细的。第四个部分描述了着色的应用分割问题。然后获得结果评论和讨论。
- 各种细分策略
分割方法分析包络图像以提取文本块分为线条和字符。它主要基于
线性结构的层次揭示物理组件。文本区域代表之一必要的主要信息来源自动排序邮件。很明显,一个巨大的约束量使这些分割重要地区非常困难。文献一般指三种分割策略。自下而上和自上而下的分割方法带来了不同我们需要时不应忽视的知识增加稳健性。混合方法(或混合方法)结合这两种策略(自下而上并且自上而下)以便从中受益一种策略来填补另一方的缺点。这种组合可以减少由此引起的几个错误传统的分割方法[4]。这些观察结果使我们能够制定一份清单各种分段错误:这些观察使我们能够制定一份清单各种分段错误:水平或垂直合并或分割文本块或线,文字融合或混淆图形或噪音,错误检测文本块或行,文字融合或混淆图形或噪音。合并分割方法(渐进式)重组连通组件,RLSA,通过累积法进行分割自下而上的策略更多地使用渐变[5] [6],而分割方法由分裂(轮廓投影[19] [4],分割空间分析,霍夫变换[17])进行了改编自上而下的策略。其他方法,称为混合型,同时受益于这两种策略[7]。基于投影轮廓的技术检测到通过在每个可能的位置创建直方图来显示文本行位置[4]。 Hough变换通常用于找到倾斜的文本行。它适用于一组沿着每个角度的直线选择的角度是
通过测量拟合来确定。最合适对于线条给出了倾斜角度和位置线条。 Hough变换可以应用于所有黑色像素,来自水平和垂直的减少的数据游程长度计算[18]或仅在重力上计算连通组件的中心[17]。另一个方法使用最近邻聚类连通组件。它通过分组小工作满足几个启发式约束的组件然后连续更大的组件形成线文本块。基于这个原则,Deacute;forges和Barba [6]提出了一种自下而上的通用方法关于文档的多分辨率描述用于地址块本地化的图像。一个差不多王[8]使用类似的结构来区分文本块来自图形块,并代表他们在结构模型中。施和Govindaraju [12]提出了一种基于应用的算法“模糊定向游程”。邮政信封二维直方图与二维直方图相结合的分割方法分水岭变换形态聚类Yonekura和Facon [19]提出了概念。分段任务包括检测2-D与均匀相关的直方图模式信封区域。 2-D中的齐次模式直方图通过形态学分割分水岭变换。所有物理布局分割方法,上面提到的使用复杂的数据结构。管理标准和知识变得更加困难,因此无法控制伟大要分类的信封的可变性。从...开始这些评论,我们的提案使用了混合策略细分更适合邮政邮件。该高级阶段基于分层图着色,允许通过金字塔数据进行管理组织,管理的复合规则解释分解为连通兴趣区的组成部分。今天,没有其他工作这种背景利用了这一点的强大功能工具。
3. 图着色的形式方面
各种实际的分类问题都可以由图形着色建模。一般形式这些应用程序需要通过形成图形表示对象的节点(顶点)兴趣和定义关系的边(弧)这些对象之间。一个自然的问题是确定:什么是拆分一组所需的最小类数对象(连接组件,线和块)进入几个同类子集。这个问题可以根据图形着色建模如下:一想要例如将几个连接起来组件成均匀的文本行没有知道他们的先验数字。这样做,确实如此足以通过节点vi表示每个分量c(i)并在每对之间添加边E(vi,vj)充分不同的组件。有限图G =(V,E)由有限集V = {v1,v2,...,vn}定义(| V | = n)其元素称为节点,并由有限集E = {e1,e2,...,em}(| E | = m)其元素被称为边缘。图G(V,E)节点的着色包括为所有节点分配一个颜色,使其为两个相邻(不相似)节点不携带相同的颜色。这些颜色将对应于各种文本行。因此,具有k种颜色的着色是该组的分区k个齐次子集中的节点。颜色数量用于着色图n的n个节点的颜色被调用色数(G)n代表存在V分区的最小整数k到k个齐次子集[9]。在图3的曲线图G上,11的各组的V值形状由节点{v1,...,v11},四个表示需要颜色来为11个节点着色,以便两个相邻节点不能具有相同的颜色。大多数(G)评估来自着色算法。其中许多存在,所以不要淹没这个问题,我们将限制我们自己引用了Paschos的比较研究[9]。在我们的研究中,我们对此特别感兴趣分布式图着色算法。
4. 图形着色在我们的应用
问题分割技术的目标是基于其决策策略定义了最佳块提取方式以便通过块地址识别模块识别它。细分技术不能系统地产生均匀和在复杂环境中定位良好的区块(困难的信封)。因此,知识由非同质的描述符提供块(包含寄生元素)较少鉴别。图5的图表代表了我们的物理布局分割方法的阶段。为了提高的鲁棒性和准确性分割,有必要选择一个偶数更高级的工具。这个想法是使用混合动力利用丰富性进行细分的策略金字塔结构。我们的方法主要是基于重新组合图形着色的强大功能正确地将连接的组件转换为文本行线条成块。AMSM的详细操作如下:当RST = 1时,工厂重置。重置控制后
字节1和2是显而易见的。控制字节3是必需的仅适用于OBR或TEST模式。当RST = 1时,接下来字节应该被视为控制字节2.如果是OBR或测试模式,第3个字节必须被视为控制字节3.如果传感器/定时器必须检查第4个字节被视为要检查的传感器/定时器编号。如果宾找到设置(在控制字节2或3中)下一个字节应该被视为bin地址和下一个字节应被视为已分配的邮政编码。必须按下输入控制字节和输入字节从键盘“输入”。对于正常操作,RST = 0。例如RST = 0在OCR或操作中操作两个控制字节后操作时视频模式或三个控制字节后在OBR模式下..当RST = 0微处理器检查时只控制字节1,其中M0,M1(第6和7位)不在乎。微处理器控制工厂取决于控制字节1的位1-5,何时RST = 0。这些位来自传感器,放置在植物。因此,当RST = 1时,这些字节是不关心的。剩余的位是从键盘给出的控制室(未在设计中显示)。签到测试模式可以通过以下方式执行:传感器检查:传感器伴随机械。
4.1。阈值和连接组件
发现文本区域与文本区域之间的分离位置阶段大大增加了计算量时间并导致过度分割噪音和在图像的空区域上的纸张纹理。确实,没有传统的方法(无论是全球的[12]还是全球的本地[13])有效地满足所有必要条件,特别是,对所有图像都有一定的效率在有限的计算时间内。我们成功了通过仅应用本地阈值来优化此阶段靠近文本区域(图6),可以通过累积梯度法与多分辨率和数学形态学[14]。在二值化步骤之后,我们检测到连接块卡上的组件(标注为CC)然后用于指导前景CC的检测[15]。使用的方法灵感来自Pavlidis#39;s关于线邻接图结构的研究[16]。它包括连接两个黑色像素的运行二进制图像的连续行。在下一节的文章中,我们使用以下内容符号:集合
表示CC,行和中的组件列表阻止是边界每个组件的框坐标。首先然后由组C的元素形成金字塔形水平和B. Bc和Nb的元素的最后一级每个级别的连接组件数量。
4.2。物理结构提取
设G是三层次的非定向图水平独立但由水平定义以下关系如下:其中Vk = 1,2和3是图G的有限集合节点。这些节点由组件表示每个k金字塔等级的描述符(见图4)。该然后以他们可以的方式选择特征显示不相交组件之间的差异。ELkgt; Sk是由对表示的有限边集相邻节点然后将两个节点视为当且仅当他们的分歧d(vi,vj)时相邻(两个描述符之间的距离)是严格的大于阈值S(优化机制阈值Sk的详细描述见[3]。这个定义是由以下关系给出:否则,此处使用图G的分层着色将每个级别K的节点集拆分为同质子集。它侧重于分离在组件之间(由节点表示)数据金字塔中的相同级别。该过程使用了进入等级制的混合策略图表:一个关卡的颜色参与编队和下一级节点的描述(见figure7)。我们可以总结一下着色阶段图Gk = 1,2和3通过以下算法[11]:我们的物理布局分割方法是一开始,基于G1的建设
它代表第一个金字塔形的组成部分等级(Formule1)。应该使用这种结构
最后金字塔水平的原始块加速着色过程。当图表G1着色时“着色()”算法和文本颜色的节点保存在V1text中,图形G V E 1 1 1 1(,)文本S被着色。获得的颜色代表文本行和构成图G V E 2 2 2 2(,)S。 G2的着色是
然后应用以构成G V E 3 3 3 3(,)S代表文本块。因此,最后一个为了合并块,G3的着色是必要的具有相同的对齐标准并组成a最后一级均匀校正块。下图总结了不同之处细分阶段。
5.实验
评估我们的方法的表现已经在10000个信封的语料库上实现了图像(被认为是困难和嘈杂)。 多于95%的地址块被我们正确分割方法,与RLSA方法和60%相反通过轮廓投影方法30%。 分析这些结果表明,有几个错误超过或低于由RLSA和简介引入的细分投影方法可以大大减少使用基于图着色的方法(图9和图10)。 这些表演可以证明是合理的我们的方法有效提取或分隔文本组件(字符,行和文本块),并允许容易拒绝寄生虫组件。各种之间的连贯性增加细分阶段导致了相当大的减少处理时间。 算法实现是同时考虑的曲线下图显示了实时的可行性解。
6.总结
我们提出了一种新的物理布局分割基于分层图着色的方法。 这个项目的
方法使用混合分割策略和金字塔结构的数据。 我们已经看到了分层图着色显示出高稳健性寄生虫成分排斥。这些寄生虫可以被视为传统的主要错误原因分割方法。谢谢限制数量规则,这种新技术适用于大型邮件品种。 而且,我们可以增加一致性在各个细分阶段之间减少计算时代。这项工作由CESA公司授予
参考文献
[1] Wang Ching-Huei,P.W。 Palumbo,S.N。 斯里哈里,对象在视觉复杂环境中的认可:用于在邮件上定位地址块的体系结构,模式识别,1988年,第9届国际会议,IEEE,1988,vol.1,Pages:365 - 367。
[2] C Viard-Gaudin,D Barba,一种多分辨率方法提取平板邮件上的地址块,ICASSP-91,国际会议,第4卷,页数:2701 - 2704。
[3] DJ。 Gaceb,V。Eglin,F Lebourgeois,H。Emptoz。 地址基于图论的块定位。 文献识别和检索XIV,SPIE Int。SOC。 选择。 Eng ed。圣何塞(美国,加利福尼亚州)。页。 12. 2008年。
[4]Reacute;myMullot,Livre:Lesdocumentseacute;critsdelanumeacute;risationagrave;l#39;indexation parle contenu,Editeur:Hermes科学出版,2006年11月,365页,ISBN-10:2746211432。
[5] D. Drivas,A。Amin,页面分割和利用自下而上的方法进行分类,文档
分析和识别,ICDAR.1995,页数:610 - 614册。
[6]OlivierDeacute;forges和Dominique Barba,A fast多分辨率文本行和非文本行结构文档图像的提取和识别方案分析,ICPR 94,页数:134-138。
[7] Z. Shi; Venu Govindaraju,复杂的线分离使用模糊游程文档图像文档图像图书馆分析,DIAL 2004,会议论文集,第一版2004年国际研讨
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。