图像分割英文资料及翻译.docx

上传人:wj 文档编号:233569 上传时间:2023-04-28 格式:DOCX 页数:13 大小:225.04KB
下载 相关 举报
图像分割英文资料及翻译.docx_第1页
第1页 / 共13页
图像分割英文资料及翻译.docx_第2页
第2页 / 共13页
图像分割英文资料及翻译.docx_第3页
第3页 / 共13页
图像分割英文资料及翻译.docx_第4页
第4页 / 共13页
图像分割英文资料及翻译.docx_第5页
第5页 / 共13页
图像分割英文资料及翻译.docx_第6页
第6页 / 共13页
图像分割英文资料及翻译.docx_第7页
第7页 / 共13页
图像分割英文资料及翻译.docx_第8页
第8页 / 共13页
图像分割英文资料及翻译.docx_第9页
第9页 / 共13页
图像分割英文资料及翻译.docx_第10页
第10页 / 共13页
图像分割英文资料及翻译.docx_第11页
第11页 / 共13页
图像分割英文资料及翻译.docx_第12页
第12页 / 共13页
图像分割英文资料及翻译.docx_第13页
第13页 / 共13页
亲,该文档总共13页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

图像分割英文资料及翻译.docx

《图像分割英文资料及翻译.docx》由会员分享,可在线阅读,更多相关《图像分割英文资料及翻译.docx(13页珍藏版)》请在冰点文库上搜索。

图像分割英文资料及翻译.docx

图像分割英文资料及翻译

一种在线图像编码识别系统的设计

摘要:

本文介绍了在线图像编码字符识别系统的设计与实现过程,对其中

重点环节进行了分析与研究,给出了主要环节问题的解决方法,在识别算法上,结合模板匹配与特征识别,提出了基于特征加权的模板匹配算法,该算法对提高字符识别率提到了较好的作用。

关键词:

图像处理;模式识别;特征加权;软件设计

0引言

图像编码字符识别的研究目前仍是国内外一个重点研究课题,它具有广泛的应用背景,比如车牌号码自动识别、邮政编码的自动识别、试卷自动阅读、报表自动处理等,由于这种在线图像编码字符的识别都具有一些共性,本文结合在线轮胎编码字符识别系统的设计,对一般图像编码字符识别系统进行了阐述,对关键环节进行了研究与分析,该方法对其它在线图像编码字符系统的开发具有一定指导意义。

1在线图像编码识别系统流程

在线图像编码字符识别系统主要包括数字图像的采集、存储、图像预处理、编码图像提取、编码特征提取、编码识别和后续处理等一些环节,其流程图如图1所示。

图1在线图像编码字符识别系统流程图在线轮胎图像编码字符识别系统要求对通过生产流水线上每一个轮胎采集含有轮胎编码的图像,然后通过对图像的处理,提取出轮胎编码特征,采用合适的识别算法将每一位编码字符进行识别。

由于轮胎编码字符在轮胎上有一定变形,且摄像角度不同,得到的编码图像差异也很大,规律性差,所以编码图像的预处理和识别算法的选取显得尤为重要。

2图像采集与存储

在线编码图像通常使用数码摄像机、数码照相机、数码摄像头等设备采集并输入计算机进行处理,本系统采用QuickCamPro4000数码摄像头采集轮胎编码图像,直接按JPG格式存储。

编码图像一般都要先转成BMP图像格式,因为BMP格式己经成为PC领域事实上的标准

—几乎所有为Windows操作系统设计的图像处理软件都支持这种格式的图像。

BMP是Windows的原始位图格式,它可以用于保存任意类型的位图数据,可以支持所有的屏幕分辨率和Windows所支持的颜色组合。

一般情况下,为了保证显示的高效率,它对图像数据没有任何的压缩,所以一幅很小的位图就可能占据相当大的空间。

BMP位图文件包括位图文件头、位图信息头、调色板、位图数据区四个部分,位图文件头由14个字节构成,位图信息头由40个字节构成,调色板的大小取决于色彩数,单色图像调色

板占8个字节,16色图像调色板占64个字节,256色图像调色板占10241个字节,224色图像没有调色板,位图数据区内数据按行顺序自下而上、自左而右排列。

3图像预处理

图像预处理主要包括有:

图像灰度化、图像降噪与增强、编码区边缘检测、图像几何校正、编码区图像提取、编码图像二值化、字符分割、字符归一化等。

下面介绍几个关键环节的处理过程。

3.1图像灰度化处理

编码图像通常是彩色的,实际识别用的图像是灰度图,所在需要先将彩色编码图像转换为灰度图像。

在RGB颜色模型中,如果R=G=B,则颜色(R,G,B)表示一种黑白颜色,其中R=G=B的值叫灰度值,灰度化处理就是使彩色的R、G、B分量值相等的过程。

常用灰度化处理方法是加权平均值法,即

R=G=B=(WRR+WGG+WBB)/3

其中,WR、WG、WB分别是R、G、B的权值,实验和理论证明,当WR=0.3,WG=0.59,WB=0.11时,即当R=G=B=0.30R+0.59G+0.11B时,能得到最合理的灰度图像。

3.2图像增强处理

3.2.1直接灰度变换

①线性灰度变换:

假设图像灰度是线性变化的,如原图像f(x,y)灰度范围为[a,b],要求变换后图像灰度范围达到[c,d],根据线性规律,则变换后

(1)高灰度区时使用对数变换,当需要扩展高灰度区时使用指数变换。

3.2.2平滑滤波一降噪

由于噪声对应图像中的区域边缘等灰度值具有较大较快变化的部分,属高频分量,所以使用低通滤波器(即平滑滤波器)降噪。

同时平滑还可以使图像模糊,有利于在提取较大的目标前去除较小的细节或将目标内的小间断连接起来。

平滑降噪的方法是使用模板对图像进行卷积运算,线性平滑滤波器最常用的模板是如图2所示的3义3模板,将此模板与图像中像素按如下方法进行卷积运算,可得到平滑降噪的图像。

①将模板在图中漫游,并将模板中心与图中每个像素位置重合;②将模板上系数与模板下对应像素相乘;

③将所有乘积相加;

④将和赋给图中对应模板中心位置的像素。

非线性平滑滤波器最常用的是中值滤波器,它将区域中所有的值按大小进行排序,将排序后位于中间的像素值赋予中心像素。

中值滤波可有效地去除随机噪声,能得到较好的视觉效果。

3.3编码区边缘检测

边缘是灰度值不连续的结果,可利用求一阶和二阶导数的方法检测到。

因为在边缘地带导数值大,而非边缘的地方导数值小。

由于数字图像是离2散的,不能求导数,可以通过卷积的方法用差分近似代替微分。

效果较好的边缘检测算法是

FDE235698140527

Sobel算子。

Sobel算子是一种梯度幅值

分别利用垂直算子Sx、水平算子Sy来获取编码区垂直边缘

和水平边缘,即在水平和垂直方向上使用如图3所示的两个不同的卷积模板,得到如图

4所示的边缘检测结果。

M22sxsy

图2平滑滤波器模板图3Sobel边缘检测模板图4Sobel算子边缘检测结果

3.4图像几何校正

Hough变换可以检测出编码区图像倾斜角度,根据此角度进行旋转变换可使编码区图像得到校正。

Hough变换可以将图像空间XY中的直线(y=px+q)检测问题转换到参数空间PQ中点的检测问题,在参数空间PQ里,建立一个累加数组Sum(p,q),对每一个图像空间中给定边缘点,让P取遍所有可能值,根据直线方程q=-xp+y计算出对应的q,对Sum(p,q)进行累加,得到Sum(p,q)的值就是在(p,q)处共线的点的个数,(p,q)的值就是图像空间中直线的斜率和截距,由斜率得到图像编码区水平边缘角度。

3.5字符切割

通过对编码字符区直接进行水平扫描,由字符间距一般可以将字符区域分割出来。

也可以通过对编码字符区做垂直方向投影运算,根据字符大致宽度与字符总数,对字符进行切割。

如图5所示是编码字符区及对应垂直投影图。

图5编码字符及对应垂直投影图6线性插值示意图

3.6字符归一化处理

对分割出的字符从四个方向扫描,确定字符边界,然后采用线性插值方法对每个字符作归一化处理,使每个字符归一为32X16点阵。

图6为线性

(2)字符识别一般采取特征判别或模板匹配的方法,特征判别是根据特征抽取的程度分阶段的、用结构分析的办法完成字符的识别。

模板匹配即是3根据字符的知识采取按形匹配的方法,模板匹配一般分为两类:

一类是直接利用输入的二维平面图像与字典中记忆的图形进行匹配;另一类是抽出部分特征与字典进行匹配。

轮胎编码图像中字符仅涉及部分英文字符和10个阿拉伯数字,字符较少,结构相对简单,因此具体识别时,既可以采用图形匹配的方法,也可以采用结构分析的方法。

但由于轮胎上编码字符有一定变形,且有断裂现象,所以直接模板匹配与直接特征抽取方法识别率都不理想,本系统使用了模板匹配与特征识别相结合的基于特征加权的模板匹配识别算法,其字符识别率比简单模板匹配算法和特征识别算法识别率都有不同程度的提高。

基于特征加权的模板匹配识别算法基本思路是:

给模板中有字符笔画的点分配不同的权重,位于笔画中心的点权重最高,位于笔画边缘的点权重最低,然后将样本模板与标准模板逐点模糊匹配,按模糊识别规则识别。

5结论

本文结合轮胎编码识别系统的实现对在线图像字符编码识别系统的设计进行了阐述,提出了一种模板匹配与特征匹配相结合的识别算法,该方法对传统的模板匹配算法进行了改进,提高了变形、断裂等字符的识别率。

这种方法在试验中得到了验证,取得了令人满意的效果。

TheDevelopmentofAKindofOnlineImageCode

RecognitionSystem

Abstract:

Thispaperdescribesthedesignandtheimplementofonlineimage

codingcharrecognitionsystem.Itanalysesandresearchestheimportantcontentsaboutthesystem.Thenitprovidesthesolutionsofmainproblems.Inrecognitionalgorithm,combiningtemplatematchingwithfeaturerecognition,itputforwordanimprovedtemplatematchingalgorithmbasedonfeatureweights.ThealgorithmcanobviouslyimprovethecharRecognitionratio.

Keyword:

imageprocessing;patternrecognition;featureweights;software

design

0Introduction

Characterrecognitionofimagecodingisstillthesubjectofintensestudy

athomeandabroad,ithasbroadapplications,suchasAutomaticnumberplaterecognition,postalcodeoftheautomaticidentification,automaticreadingpapers,reports,automaticprocessing,becauseofthisonlineimagecodedcharacterrecognitionhassomecommon,thispaperonlinetirecodingcharacterrecognitionsystemforthegeneralimagecodingcharacterrecognitionsystemhasbeenelaboratedonthekeylinkoftheresearchandanalysis,themethodoftheotheronlineimagecodedcharactersystemDevelopmentofguidingsignificance.

1Anonlineimagecodingidentificationsystemprocesses

Onlineimagecodingcharacterrecognitionsystemincludesdigitalimage

capture,storage,imagepreprocessing,encodingtheimageextraction,featureextractioncoding,codingidentificationandfollow-uptreatmentofsomeaspectsofitsflowchartshowninFigure1.

Figure1-linecharacterrecognitionimagecodingsystemflowchart

Onlinetireimagecodingcharacterrecognitionsystemrequiresthe

productionpipelinethroughtheacquisitionofeachtirewithtireencodedimage,andthenthroughimageprocessing,codingtoextractfeaturesofthetire,usingtheappropriaterecognitionalgorithmtoidentifyeachcodedcharacter.Tirecodingcharactersasacertaindeformationinthetires,anddifferentcameraangles,arealsogreatdifferencesinthecodingimages,regularityispoor,socodedimagepreprocessingandrecognitionalgorithmsofselectionisveryimportant.

2ImageAcquisitionandStorage

Linecodingcommonlyuseddigitalcameraimages,digitalcameras,

digitalvideocamerascaptureandprocessedincomputer,thesystemusesQuickCamPro4000tirecodingdigitalcameraimagecapture,directlyfromJPGformat.

CodedimagesgenerallymustfirstconvertBMPimageformat,because

theBMPformathasbecomethedefactostandardPCinthefield-almostalloftheWindowsoperatingsystemdesignedforimageprocessingsoftwareto

supportthisformatoftheimage.BMPistheoriginalWindowsbitmapformat,whichcanbeusedtosaveanytypeofdigitalmapdata,cansupportall

Windowssupportedscreenresolutionandcolorcombination.Undernormal

circumstances,inordertoensurethedisplayofhighefficiency,itdoesnothaveanycompressedimagedata,soasmallbitmapmayoccupyconsiderablespace.5BMPbitmapfileincludesthebitmapfileheader,bitmapinformation

header,palette,bitmapdataareaoffourparts,bitmapfileheaderfrom14bytesconstitutethebitmapheaderfrom40bytescomposition,tonecolorpalettedependsonthenumberofmonochromecolorimages.

Boardaccountedfor8bytes,16-colorpaletteimagesaccountedfor64bytes,256-colorpaletteimage1024bytestotal,224-colorimageswithoutcolorpalette,thebitmapdatafromtheregionundertheorderofthedatabyrowandonthearrangementfromlefttoright.

3Preprocessing

Imagepreprocessingincludesare:

grayimage,imagenoisereductionandenhancement,coding,edgedetection,imagegeometrycorrection,imagecodingregionofextraction,encodingimagebinarization,charactersegmentation,characternormalizationandsoon.Herearesomekeyaspectsoftheprocess.

3.1grayimageprocessing

Imagesareusuallycolorcoded,theactualidentificationwiththeimageisgrayscale,wheretheneedtoconvertfirstcolor-codedimagestograyscale.IntheRGBcolormodel,ifR二G二B,thencolor(R,G,B)indicatesaBlackwhitecolor,inwhichR=G二Biscalledthevalueofgrayvalue,graylevelprocessingistomakethecoloroftheR,G,Bcomponentvalueequaltotheprocess.Gray-scaleprocessingmethodsarecommonlyusedweightedaveragemethod,thatis,

R二G二B二(WRR+WGG+WBB)/3

Which,WR,WG,WBaretheR,G,Btheweightofexperimentalandtheoreticalproof,whenWR=0.3,WG=0.59,WB=0.11,thatiswhenR二G二

B=0.30R+0.59G+0.11B,canbethemostreasonablegrayscale.

3.2imageenhancementprocessing

3.2.1Directgray-scaletransformation

①lineargrayleveltransformation:

iftheimagegrayscaleislinear,asintheoriginalimagef(x,y)gray-scalerangeof[a,b],askedthetransformedimageintensityrangeofupto[c,d],Accordingtothelinearlaw,thetransformed

(1)②nonlineartransformation--logtransformationandexponentialtransformation:

Whentheneedtoexpandlowgrayzone,grayzoneofhigh6compressionusedonthelogtransformation,whentheneedtoexpandtheuseofhighgrayareaindextransformation.

3.2.2smoothingfilter-NoiseReduction

Asthenoiseintheareacorrespondingtotheedgeoftheimagegrayvalueofsuchrapidchangewithalargerpartisahighfrequency,sotheuseoflow-passfilter(ie,smoothingfilter)noise.Atthesametimecanmaketheimagefuzzysmoothingisbeneficialtothelargergoaloftheextractionpriortoremovalofthesmallerdetailsortotargetthesmallinterruptionlink.Smoothingnoisereductionmethodistousethetemplateontheimageconvolutionoperation,linearsmoothingfilteristhemostcommonlyusedtemplateisshowninFigure2ofthe3X3template,thistemplateandimageinpixelsbythefollowingmethodofconvolution,getsmoothimagenoisereduction.

①Inthefigure,roamingthetemplateandthetemplatecenterandmaplocationofeachpixeloverlap;

②thetemplateonthecoefficientmultipliedwiththetemplateunderthecorrespondingpixel;

(3)addalltheproduct;

④Itwillassignthefigurecorrespondstothetemplateandthecenterofthe

pixel.

Themostcommonlyusednon-linearsmoothingfilterismedianfilter,itwillallofthevaluesoftheregionaresortedaccordingtosize,willbesortedinthemiddleofthepixelvaluesgiventothecenterpixel.Medianfiltercaneffectivelyremovetherandomnoise,cangetabettervisualeffect.

3.3Edgedetectioncoding

Edgeisthe

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2