字符预处理及分割算法实现大连民族学院毕业设计论文.docx

资源描述

字符预处理及分割算法实现大连民族学院毕业设计论文.docx

《字符预处理及分割算法实现大连民族学院毕业设计论文.docx》由会员分享，可在线阅读，更多相关《字符预处理及分割算法实现大连民族学院毕业设计论文.docx（26页珍藏版）》请在冰点文库上搜索。

字符预处理及分割算法实现大连民族学院毕业设计论文.docx

字符预处理及分割算法实现大连民族学院毕业设计论文

大连民族学院本科毕业设计（论文）

字符预处理及分割算法实现

学院（系）：

计算机科学与工程

专业：

软件工程

学生姓名：

学号：

2010082210

指导教师：

评阅教师：

完成日期：

2014年6月12日

大连民族学院

摘要

傣文是傣族人民的传统文字，也是一种具有悠久历史的古文字。

最初是伴随着佛教的传入而产生,属于古印度字母系统的一种拼音文字。

在中国的云南省，由于使用的地区不同，有四种文字的形式:

四双版纳傣文，金平傣文，傣绷文，德宏傣文，他们与老挝，柬埔寨和缅甸的语言同属一个系统。

一直以来，傣族人民通过自己的民族文字，写了许多美丽的故事，神话，传说和诗歌，记载了他们过去的生活，自己的佛经，和农田水利，还记录天文学，医学，政治历史，语言学的等研究内容方面，这些有助于科学技术的发展，文学，艺术的传播。

本文主要从事傣文字分割及样本库构建研究，并西傣文的作为研究对象。

因为书籍保存时间较长且在传输和保存过程中难免会被各类噪声的污染，使得字迹变得模糊，需要运用现代电子信息科学技术将图片文档进行去噪，平滑，二值化，倾斜矫正等预处理，从而形成满足人们需要的特性图像，然后通过阈值法将字符图像分割成单个字符。

最后将这些分割出来的单个字符按照字号的大小,进行归一化分类处理。

西傣文是我国少数民族语言的一种，从事这方面的研究对于我国发掘和保存少数民族文化具有重要的意义。

关键词：

字符预处理；字符分割；西傣文

ImplementationofCharacterPreprocessingandSegmentationMethod

Abstract

DaicharactersisthetraditionalscriptofDaipeopleandalsoanancientscriptwithalonghistory.ItcomesintobeingwiththeincomingofBuddhismanditbelongstoaalphabeticwritingofthealphabetancientIndia.InYunnanprovinceofChina，therearefourwordformatoftheXishuangbannaDaiindifferentregionoftheprovince:

xishuangbannadaiwen,jindai,daistretched,dehongdaiwen，whichbelongstothesamelanguagesystemsasLaos，CambodiaandMyanmar.InthelonghistoryofDaipeople,theywritealotofbeautifulstoriesmythologiesandpoemswithDaiscripttorecordtheirlife,Sutra，Irrigation，Astronomy，Medicine，Politicalhistory，Researchandlinguisticsandotheraspects，whichadvancesthedevelopmentofscienceandtechnologyaswellasthespreadofliteratureandart.

ThispaperismainlyengagedintheresearchoftheDaitextsegmentationandsamplelibrary,regardedtheWestDaiastheresearchsubjects.Thebookshadbeensavedforalongtimeanditwillinevitablybecontaminatedbyallkindsofnoiseinthetransmissionandpreservationprocess,whichmadethewritingblurred,requiredusingthemodernelectronicinformationscienceandtechnologytode-noising,smoothing,binarization,tiltcorrectionpreprocessingaboutthedocumentimage,formingtheimageofpropertiestomeettheneedsofpeople,thenchangethecharacterimageintoindividualcharactersbythethresholdmethod.Finally,accordingtothefontsize,normalizedclassificationthesesplitupindividualcharacters.WestDaiisoneofourcountry’sminoritylanguage,soengagedinresearchinthisareaisofgreatsignificancefortheexcavationandpreservationofminoritycultures.

KeyWords：

JPretreatmentcharacters；Charactersegmentation；WestDai

摘要I

AbstractII

1.绪论1

1.1图像预处理概述1

1.2图像分割概述1

2.系统分析2

2.1研究现状2

2.2本论文主要研究内容和解决的问题2

3.字符预处理及分割算法实现4

3.1系统开发环境4

3.2中值滤波去噪4

3.2.1中值滤波器简介4

3.2.2中值滤波器的基本理论4

3.3灰度图像二值化6

3.3.1图像二值化概念6

3.3.2全局阈值法8

3.4图像的倾斜校正11

3.4.1图像的倾斜角度矫正概述11

3.4.2Radon变换法 11

3.5字符阀值分割技术研究13

3.6分割字符的归一化处理18

4.系统测试20

4.1预处理集成测试20

4.2系统集成测试20

结论23

参考文献25

致谢26

1.绪论

1.1图像预处理概述

图像预处理技术是在图像处理之前，所需要做了一系列的修正操作，这是由于图像在传输过程和保存过程中总难免会遭到各类程度的破损以及许许多多的噪声的污染，致使目标图片偏离了人们的需求。

图像预处理技术可分为图像增强和图像还原技术。

在图像预处理中，图像增强技术占有一大比例，是图像处理一个必要的步骤，和图像还原是不同的，它通常是用于图像的原始自然恢复，字符图像增强是突出的是人需要的特征和弱化一些非必要为原则的。

图像增强的方法有许多种，通常有图像的平滑去噪、倾斜校正、灰度变换、图形增强、直方图修复等等。

直方图修复通过灰度变换而得的，可以使图像得到不错的处理和显示。

而灰度变换是图像增强技术中比较单一的点运算处理技术，不过上述两种去噪功效比较弱,通常只能够处理一些要求不高的图像，图像增强的主要通过图像平滑减噪实现的，这使得其成为比较普遍的预处理方法，例如用于图像平滑和去噪，是现代社会图像预处理研究中非常重要的实现形式。

1.2图像分割概述

作为一个整体的图像，包括色彩丰富的内容，我们将需要的目标、背景和整个网络的混合在一起，不利于图像的处理，所以，应当是将图像先划分为多个区域，并和物体目标相对应的，然后对选中图像的目标和背景运用预先的知识进行定位、标识。

使目标图像离开背景或其他虚假的目标，这种方法就称为图像分割。

分割出来的图像区域和包所含的信息要包括了区分,每个分区的描述，另外还有一些局部特征，并且使用这些特征，例如灰度差、局部纹理、颜色差异、不同的局部统计特征或局部差谱特性，通过这些来区分整幅图像中有差别的目标物体，该区域可叫做感兴趣区域。

因为我们是将要使用的图像信息的局部特征分割，因此这样的分割方法具有通用性。

2.系统分析

2.1研究现状

当前人类已步入一个飞快发展的信息时代。

大部分的讯息来自图像，科研探索和技术应用中，图像处理技术现已成为一种非常的重要手段。

数字图像处理技术最早出现在二十世纪50年代的发达国家，如美国和欧洲，当时电子计算机技术已经有了一定水平的发展，人们开始用它来处理信息图像。

从二十世纪六十年代开始，数字图像处理开始一门独立的学科的出现。

最初的图像处理是以改善图像的质量为主，赢得了第一次真正的成功的是美国喷气推进实验室的应用。

他们使用空间探测器发回了月球的相片，然后将这些照片的图像进行几何校正，灰度变换，去噪，直方图修正。

然后通过这些处理好的相片试着绘制出月球表面的外观地图，并取得成功。

为人类的登月梦想提供良好的现实基础，同时也推进数字图像处理该学科的发展。

此后越来越多的机构也开始对图像处理技术的进行深入研究，因而它的应用范围开始从空间研究扩展到各个领域，特别是在字符分割，太空探测上取得了巨大的成就。

2.2本论文主要研究内容和解决的问题

字符图像预处理技术是为了从原始图像中得到效果良好的图像所需要做的一系列修正操作。

因为这过程中噪声的污染，一定程度的破坏，字符图像在传输过程和保存过程中产生的图像丢失了原来的本质或背离人们的需要，因而需要一系列的预处理操作来完成图像修复损失有用的信息。

图像预处理技术分为图像增强技术和图像复原技术两大方面。

在图像预处理中，图像增强技术占据越来越重要的位置，并是已发展为不可忽视的步骤，以人为因素为主，突出人们需要的特征，弱化那些不是很重要的特征。

图像复原主要是用来还原图像最初的本质。

图像增强是强调的是人们需要的特征和弱化不需要的特征为原则的。

字符分割是一种重要的图像分析技术。

字符类型图像分割是图像分割的一个重要应用领域，也具有很大的应用，至今已有很多种的切割方法。

本文主要研究和结合现有字符分割的算法，并在此基础上进行改进和进行整合形成新的算法用于实现西傣文预处理及文字分割，首先对傣文字符图片进行预处理，接着对西傣文字符图片进行分割，然后再对切割后的字符做归一化处理，从而形成新的样本库。

具体地说,就是将扫描进来的西傣族文图像使用图像中值去噪理论算法将图片去噪。

目前大多数的滤波方法可以产生模糊的边缘，边缘失真，细节废弃等后果，因此还必须采用二值化操作，可进一步对图像进行处理，获得图像或者其他更多功能的一些几何特征。

在将字符扫描成图像的过程中，难免会出现字体倾斜的状况，所以还需最后一项处理——实现对图像的倾斜校正。

将预处理的图像运用阀值分割技术将字符分割出来，并将分割出来的图片安照字号的大小进行归一化处理，最后形成样本库。

如图2.1所示为主要流

流程图。

图2.1系统主要流程图

3.字符预处理及分割算法实现

3.1系统开发环境

仿真程序是在matlab12.0集成开发环境运行,matlab具有强大的绘制图形功能。

本身提供了能够绘画出很多各种二维和多维图形的库函数。

这些图形可以在计算机打印设备上打印出来,使技术数据可视化。

在其他语言的使用程序，往往会在算法的选择上很麻烦，但是，MATLAB本身带有许多函数提供了有自适应能力的算法，它会依据情行选择最合适的算法，如此，当使用其他语言编写时，因为算法上的选择不恰当。

设计复杂，运行效率低甚至会出现一些不可预知的错误，可是MATLAB本身就还有很多图像处理高效算法，直接调用即可。

所以用MATLAB在字符预处理及分割算法实现会达到事半功倍的效果。

3.2中值滤波去噪

3.2.1中值滤波器简介

目前，图像滤波可分为线性滤波技术和非线性滤波技术两种。

线性滤波因以完善的理论基础、数学处理简单等长处，使其在图像滤波范畴中一直占据重要的地位，也是源于此使在那些低频分量加性高斯噪声的平滑中能取得令人满意的结果。

相反在抑制脉冲信号及高频分量的未能发挥很好的作用。

非线性滤波是一种非线性映射关系，主要是基于对输入信号序列的，在处理过程中往往可以将特定的噪声近似地映射为零，继而保留信号的重要特性，从而在一定程度上可以弥补线性滤波器的一些不足之处。

由于图像的很多噪声是高斯噪声及椒盐噪声，通过中值滤波器可实现图像降噪。

3.2.2中值滤波器的基本理论

中值滤波属于非线性平滑滤波技术。

该方法不仅可以保护图像的细节信息，可以有效地过滤图像处理领域中的噪声，所以深受欢迎。

中值滤波是图像处理中的一个步前提，它主要用于散斑噪声和椒盐噪声。

保留边沿的特征使它在不希望出现边缘模糊的情景也能发挥作用。

在图像处理中，在进行如边缘检测这样的进一步处理之前，首先往往需要进行一定程度的降噪。

中值滤波是一种非线性滤波技术，已被广泛应用于在图像或其他信号的噪声去除。

该设计原理是通过检查输入信号中的采样并检查其是不是信号，采用技术个采样组成的观察窗实现这项功能。

观察窗口中的数值进行排序，处于观察窗中间的中值作为输出。

然后，丢弃最早的计算值，取出了新的采样，计算并重复上述过程。

邻域平均算法去消除噪声的同时往往会模糊掉图像中的一些细节。

那么如果有必要消除噪声和保留图像细节，你可以使用中值滤波。

中值滤波是一种可以很好地抑制图像中噪声的非线性信号处理技术。

中值滤波算法的设计原理是通过计算图像像素点的邻域内的灰度值中值来代替该邻域像素点的灰度值。

因为它与邻域内的那些与典型值差别很大的值并不存在依赖关系。

使其不仅去除了脉冲噪声、椒盐噪声，还能很好的保留图像边缘细节。

中值滤波消除孤立的噪声点的主要方式是先找出周围像素灰度差值比较大的像素点，接着将这些的像素改为与周围像素值接近的值。

中值滤波的算法描述：

设

是输入图像在坐标

处的像素，在其周围开一个

的矩形窗口。

假设窗口从第一行开始由左向右水平扫描，接着跳到下一行重复扫描。

将每一个窗口得到的全部像素按其灰度值的大小进行排序，求出中值

替换

。

（1）matlab仿真程序---对有椒盐噪声的图像处理

functionquzhao（）

[I,map]=imread（'011.bmp'）;

J=rgb2gray（I）;%变为二维灰度图像

figure;

subplot（2,2,1）;

imshow（I）;

title（'原始图像'）;

J2=imnoise（J,'salt&pepper',0.05）;%叠加密度为0.05的椒盐噪声

subplot（2,2,2）;

imshow（J2）;

title（'加有椒盐噪声图像'）;

h2=fspecial（'average',[3,3]）;%生成一个3*3邻域平均窗函数

B2=filter2（h2,J2）;%邻域平均

subplot（2,2,3）;

imshow（B2,[]）;

title（'邻域平均法滤波'）;

K=medfilt2（J2）;

subplot（2,2,4）;

imshow（K）;

效果图如图3.1所示

（2）matlab仿真程序---对有高斯噪声的图像处理

functionquzhao2（）

[I,map]=imread（'011.bmp'）;

J=rgb2gray（I）;%变为二维灰度图像

figure;

subplot（2,2,1）;

imshow（J）;

title（'原始图像'）;

J1=imnoise（J,'gaussian',0,0.04）;%叠加密度为0.04的高斯噪声

subplot（2,2,2）;

imshow（J1）;

title（'加高斯噪声图像'）;

h2=fspecial（'average',[5,5]）;%生成一个5*5邻域平均窗函数

B2=filter2（h2,J1）;%邻域平均

subplot（2,2,3）;

imshow（B2,[]）;

title（'邻域平均法滤波'）;

K=medfilt2（J1）;

subplot（2,2,4）;

imshow（K）;

title（'中值滤波'）;

3.3灰度图像二值化

3.3.1图像二值化概念

二值化是图像处理中的预处理过程的一个基本技术。

图像平滑去噪过程中难免会出现损失原图像的许多有用信息的状况，因此在进行二值化预处理过程中，十分关键就是保留好原图的主要特征。

在不同的目标背景下，对图像二值化时阈值选择是有差别的。

人为选择是比较困难和难以把握的，由此我们选择自适应图像阈值的选取方法。

进行图像二值化操作包括彩色图像灰化和增强两部分。

因为选定的阈值需要参考直方图，因此在图像处理中,我们可以参考得到的直方图来选取阈值。

整个流程如下所示：

读取图像→灰度图像→图像增强→图像直方图→二值化处理

图像二值化是图像预处理中一个重要技术，如果再选择过程中阈值选择不当将大量的有用原始信息损失掉。

图像二值化处理的方法包括全局阈值法、局部阈值法。

图3.1对有椒盐噪声的图像处理图

图3.2对有高斯噪声的图像处理

3.3.2全局阈值法

全局阈值法是指在二值化过程在二值化过程中，运用全局阈值法设定一个全局阈值T,将图像的各个点像素的灰度值与T进行比较，若小于T，则取为背景色；否则，取为前景色。

阈值T依据图像的直方图或灰度空间分布来确定，通过该阈值实现灰度文本图像到二值图像的转化。

阈值分割法主要以阈值的选择为主，它很大程度上绝对决定着图像的分割效果。

算法容易理解，对于Otsu方法、最大熵方法为常用的全局阈值法。

全局阈值法能在直方图分布呈双峰、目标和背景明显分离的图像能取得良好效果。

但因噪声干扰较大、光照不均匀等原因破坏的图像，并由此造成直方图分布未呈双峰的，二值化效果明显变差。

Otsu方法是一种全局化的动态二值化方法，它是基于整幅图像的统计征，实现阈值的自动选取。

其设计原理是通过某一灰度值将图像直方图分割成两类，各自计算这两类的像素点数以及灰度平均值，然后计算两者的类间方差。

当被分割成的两类间方差最大时，此灰度值就作为图像二值化处理的阈值。

对图像Image，设

为目标与背景的分割阈值，

为目标像素数占图像比例值，

设为平均灰度；背景像素数占图像比例为

，平均灰度为

。

图像的总平均灰度为：

。

从最小灰度值到最大灰度值遍历

，当

使得值

最大时

即为分割的最佳阈值。

设

图像

点处的灰度值为

，

设为灰度级，不妨假定

取值

。

记

为灰度值为k的频率，则有：

（1）

假定用灰度值t为阈值分割出的目标与背景分别为：

和

，于是目标部分比例：

，

（2）

目标部分点数：

（3）

背景部分比例：

（4）

背景部分点数：

（5）

目标均值：

（6）

背景均值：

（7）

总均值：

（8）

大津法指出求图像最佳阈值g的公式为：

（9）

从上式子可知类间方差值是通过（9）的右侧中括号的算式计算的，整幅图像分别阈值g分割出的背景和目标两部分构成，而概率为

，目标值

，概率为

，背景取值

，总均值为

，这是通过方差的定义得到的。

因方差是灰度分布均匀性的一种度量，方差值的大小直接反应构成图像的两部分的差别，其成正比的关系，当部分目标被错分为背景时或部分背景错被错分分为目标时都会导致两部分差别变小，所以如果你想错分概率最小，那么你就该使类间方差最大的分割。

如图3.3为读入的原始图,图3.4为灰度图像由Otsu方法得到的二值图像。

图3.3原始图像

图3.4Otsu方法得到的二值图像

3.4图像的倾斜校正

3.4.1图像的倾斜角度矫正概述

倾斜图像的校正是图像预处理的一部分，一个字符正确被分割重要的前提。

通过扫描得来的印刷字体图像将不可避免一定程度的倾斜。

这种倾斜会对后面字符分割带来严重的困难，因此为了后面工作的顺利进行需要提前给倾斜的图像给予纠正,这一节主要讨论的是图像倾斜角度矫正的算法，包括算法的原理，算法步骤，具体的程序实现过程，仿真结果。

在此之前先讨论一下常用的矫正倾角的方法：

Hough变换法、Radon变化法、线性回归法和两点法。

Hough变换法和Radon变化法相似，其抗干扰能力比较强且进行倾角检测的最大精度为1度，因而运算量大，程序执行较慢。

其优点是直线倾角可以断点计算。

最小二乘法容易受到噪声的污染，且其干扰能力很很差，但是它的运算量小，但。

两点法采样点比较多并且这些点需要服从随机分布，不仅理论简单，而且计算均值后能有效抑制干扰。

故，综合现实条件和自己水平出发比较适合本人的是Radon变化法。

3.4.2Radon变换法

定义：

设二元函数f（x,y）的投影为在某一方向上的线积分，投影可沿任意角度进行。

例如f（x,y）沿y方向上的投影是其水平方向上的线积分，f（x,y）沿x方向上的投影是其在垂直方向上的线积分，沿y'方向的线积分是沿x'方向上的投影。

通常f（x,y）的Radon变换是f（x,y）平行于y’轴的线积分.。

图3.5矩形函数在水平垂直方向和沿角方向的投影

一幅图像在任意点

上的相对线性衰减系数

与该点灰度值的成正比关系的。

因而，可以将重建算法为基础的理论称为“由投影重建图像”。

所谓投影

是测量值，是吸收系数

沿着射线经过直线的积。

事实上，

是沿着若干条直线的积分估算值来计算值。

在某种意义上说，Radon在1917年就已经解决了这个问题。

通常所说的Radon变换式是一种投影表达式。

也就是说，函数

的Radon变换定义为：

即

在

角的

射线的一维投影信号。

如图3.4倾斜校正前原始图，图3.7为倾斜校正后的图像。

图3.6倾斜校正前原始图

图3.7倾斜校正的图像

3.5字符阀值分割技术研究

字符分割是一种重要的图像处理技术，已广泛应用于各个领域。

图像分割是把图像中人们需要的特征区域提取出来。

阈值分割是一种简单有效的图像分割方法。

区分物体和背景是通过确定一个或多个灰度值来完成的，用像素的灰度值同门限值进行比较来划分像素到物体区或背景区。

该分割法能够在物体与背景之间存在明显区别的景物取得很好的效果。

但近些年随着对阈值法的不断探索，以及不少的新方法的出现，使得图像中的物体与背景之间差异并不是十分明显的分割也取得很好的效果。

事实上，在许多的实用图像处理系统中，最后都会用到阈值化技术。

设给定的灰度图像为f（x,y）∈[t1,t2]，用某种确定的方法得到一个或多个阈值子集t

[t1,t2]。

为了说明图像阈值化分割，现以子集 t为例，由于利用一个或多个阈值的原理跟它是等同的。

根据个像素是否属于t将其进行分类，即：

（1）

其中，axy,bxy分别为指定的灰度值或原灰度值。

若取axy=1,bxy=0，图像分割成二值图像。

背景和目标具有最大的对比度。

如果取axy=f（x,y）,bxy=0,则图像分割后的背景为0，目标保留原灰度，且目标图像的背景是干净的。

由图像二值话可知，阈值法的难点是对阈值的选取，所以对阈值化方法的研究，选取阈值的方法的探索是关键。

为了加深阈值法的理解,我们需要看看几个不同的

展开阅读全文