本科毕业论文图像识别系统的设计管理资料.docx
《本科毕业论文图像识别系统的设计管理资料.docx》由会员分享,可在线阅读,更多相关《本科毕业论文图像识别系统的设计管理资料.docx(48页珍藏版)》请在冰豆网上搜索。
本科毕业论文图像识别系统的设计管理资料
摘要
随着计算机软硬件技术的高速发展,计算机数字图像处理技术在各个领域得到了广泛的应用,如计算机图像识别、图像检索、图像工业化应用等。
尤其是计算机识别技术,通过数字图像处理中的模式识别技术,可以将人眼无法识别的图像进行分类处理,可以快速准确的检索、匹配和识别出各种东西。
虽然某些处理也可以用光学方法或模拟技术实现,但它们远不及数字图像处理那样灵活和方便,因而数字图像处理成为图像处理的主要方面。
图形辨别是图像识别技术的一个重要分支,图形辨别指通过对图形的图像采用特定算法,从而辨别该图形,例如,辨别三角形、矩形、圆形、六边形等。
本系统使用摄像头对图像进行采集图像,~,对采集图像进行图像分割,得到二值化图像,然后通过轮廓跟踪获得图形轮廓信息,最后使用基于轮廓跟踪的图像辨别算法在空域上辨别三角形、矩形、圆形,并在特定的区域上显示相应信息。
关键词:
图形辨别角度判别轮廓跟踪
ABSTRACT
Withtherapiddevelopmentofcomputerhardwareandsoftwaretechnology,computerdigitalimageprocessingtechnologyhavebeenwidelyappliedinmanyfields,Suchasimagerecognition,imageretrieval,andimageindustrialcomputersrecognitiontechnology,bythepatternofrecognitiontechniques,itcanrecognizetheimageclassificationwhathumaneyecannotrecognize,itcanbefastandaccuratesearch,matchandidentifyallsortsofsometreatmentmethodscanalsouseopticaloranalogtechnology,buttheyarenowherenearasflexibledigitalimageprocessingandconvenience,digitalimageprocessing,andthusdigitalimageprocessingbecomethemainaspectsofimageprocessing.
Graphicdistinguishisanimportantbranchofimagerecognition,graphicdistinguishmeansgraphicimagesbyusingaspecificalgorithm,toidentifythegraphics,forexample,identifythetriangle,rectangle,round,hexagonandsoon.Thesystemusestheimagecapturecameraimagesfromthecamerascaptureimages,andthecamerratotheintheimageinrangeofthe~isProcessthecollectedimage,getthebinaryimage,andthencontourtrackingaccesstographics,theoutlinesofthefinalimage-basedcontourtrackingalgorithmtoidentifytheairspaceontheidentificationtriangle,rectangle,circle,andinparticulartodisplaythecorrespondingregioninformation.
Keywords:
graphicdistinguishanglejudgementcontourtracking
第一章绪论
1.1研究内容
图形辨别是图像识别技术中一个重要分支,图形辨别指通过对图形的图像采用特定算法,从而辨别该图形,例如,辨别三角形、矩形、圆形、六边形等。
通过对采集到的图形图像进行图像预处理和图像分割,并采用轮廓跟踪法获取图形轮廓信息,最后通过角度判别实现空域图形辨别。
图像采集,采用连接摄像设备,采集图形图像;图像预处理,采用图像平滑去除或减小图像中的噪声;图像分割,将图形部分从图像中分割出来;本选题研究的空域图形辨别算法包括模板匹配法和轮廓跟踪法,模板匹配,即通过将模板和图形匹配,根据匹配结果进行图形辨别;轮廓跟踪,即根据轮廓跟踪算法获取图形轮廓信息,通过对轮廓信息进行角度辨别实现图形辨别。
其中重点研究轮廓跟踪法,主要针对三角形、矩形、圆形进行。
由于该选题的基本要求是利用C语言在MFC模块中编写相应程序,最终生成一个可执行文件,根据摄像头采取不同图像,如:
三角形、矩形、圆形,然后将不同的图形在PC机上进行辨别,实现图形的分辨,最后将生成图形保存。
研究目的
数字图像处理在各个领域都有着非常重要的应用,随着数字时代的到来,视频领域的数字化也必将到来,视频图像的处理技术也将会发生日新月异的变化。
在多媒体技术的各个领域中,视频处理技术占有非常重要的地位,被广泛的应用于智能交通、汽车电子、网络多媒体通信、实时监视系统、高清晰度数字电视等诸多方面。
因此,现今对该技术领域的应用研究已日趋活跃和繁荣。
而这其中的图像辨别更是有着重要的应用。
研究此课题,不仅可以明白VC++在图像处理中的应用,而且还可以明确图像辨别的重要应用意义。
实现方案
模式识别是现今使用非常广泛的图像辨别方法,基于模式识别的相关算法也很多,而且每种算法都有各自特点,要根据不同的实际图形的特点选择恰当的算法。
本设计所采用的是基于图形边缘特征的角度判别得算法,此种算法是通过对图形轮廓进行跟踪、提取边缘的特征,判断图形角度的大小,来分辨不同图像。
在系统实现过程中,研究的核心是图形辨别算法的实现,即寻找并实现一种满足系统要求的,可以分辨出三角形、矩形、圆形的图形辨别算法。
实现步骤如下:
(1)MFC中的操作界面和基本功能。
包括:
对话框程序界面,图像打开与保存,窗口控件等。
(2)VC++图像处理程序设计方面的一些算法实例。
利用VC语言进行编程实现,进行视频图像的采集,图像的预处理,图像分割,轮廓跟踪,计算轮廓夹角等内容。
(3)最终生成一个可执行文件,根据摄像头采取不同图像,如:
三角形、矩形、圆形,然后将不同的图形在PC机上进行辨别,实现图形的分辨,最后将生成图形保存。
第二章数字图像处理知识及系统要求
数字图像处理就是利用计算机对图像信息进行加工,以满足人的视觉心理或者应用需求的行为。
实质上它是一段能够被计算机还原显示和输出为一幅图像的数字码。
当今是一个充满信息的时代,图像作为人类感知世界的视觉基础,是人类获取信息、表达信息和传递信息的重要手段。
图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描述和识别3个部分。
常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。
图像处理一般指数字图像处理,虽然某些处理也可以用光学方法或模拟技术实现,但它们远不及数字图像处理那样灵活和方便,因而数字图像处理成为图像处理的主要方面。
以图片分析和理解为目的的分割、描述和识别将用于各种自动化的系统,如字符和图形识别、用机器人进行产品的装配和检验、自动军事目标识别和跟踪、指纹识别、X光照片和血样的自动处理等。
在这类应用中,往往需综合应用模式识别和计算机视觉等技术,图像处理更多的是作为前置处理而出现的。
随着计算机的高速发展,处理器的处理速度的提高和存储器存储容量的增大,图像处理系统的发展十分迅速,图像处理技术也得到了空前的发展和应用。
目前,图像处理技术已经广泛应用于工业、农业、医学、交通、军事等各个领域。
因此,可以说图像处理技术正逐渐成为其他科学技术领域中不可缺少的一项重要工具,它已经成为了信息技术相关领域的核心。
图像处理在各个方面都有着很重要的应用,而图像识别技术在基于图像处理的基础上可以应用于农业上,如用计算机视觉的方法进行果形识别;基于数学形态学和神经网络的方法对番茄病害果进行识别;采用机器视觉的方法辨别黄花梨果形识别;当然还可以加以改进应用于视频监控的物体辨别等等。
图像格式介绍
数字化图像数据有两种存储方式:
位图存储(Bitmap)和矢量存储(Vector)。
我们平常是以图像分辨率(即象素点)和颜色数来描述数字图象的。
1.位图方式
位图方式是将图像的每一个象素点转换为一个数据,比如:
8个象素点的数据就占据一个字节(一个字节就是8个二进制数,1个二进制数存放象素点)。
位图方式能够制作出色彩和色调变化丰富的图像,可以逼真地表现自然界的景象,同时也可以很容易地在不同软件之间交换文件,这就是位图图像的优点;而其缺点则是它无法制作真正的3D图像,并且图像缩放和旋转时会产生失真的现象,同时文件较大,对内存和硬盘空间容量的需求也较高。
2.矢量图像
矢量图像存储的是图像信息的轮廓部分,而不是图像的每一个象素点。
该存储方式的缺点是经常耗费大量的时间做一些复杂的分析演算工作,图像的显示速度较慢;但图像缩放不会失真;图像的存储空间也要小得多。
所以,矢量图比较适合存储各种图表和工程设计图。
数字图像处理中的基本图像类型
在计算机中,按照颜色和灰度的多少可以将图像分为:
二值图像、灰度图像、索引图像和真彩色RGB图像四种基本类型。
目前,大多数图像处理软件都支持这四种类型的图像。
1.二值图像
一幅二值图像的二维矩阵仅由0、1两个值构成,“0”代表黑色,“1”代白色。
由于每一像素(矩阵中每一元素)取值仅有0、1两种可能,所以计算机中二值图像的数据类型通常为1个二进制位。
二值图像通常用于文字、线条图的扫描识别(OCR)和掩膜图像的存储。
2.灰度图像
灰度图像矩阵元素的取值范围通常为[0,255]。
因此其数据类型一般为8位无符号整数的,这就是人们经常提到的256灰度图像。
“0”表示纯黑色,“255”表示纯白色,中间的数字从小到大表示由黑到白的过渡色。
二值图像可以看成是灰度图像的一个特例。
3.索引图像
索引图像的文件结构比较复杂,除了存放图像的二维矩阵外,还包括一个称之为颜色索引矩阵MAP的二维数组。
MAP的大小由存放图像的矩阵元素值域决定,它的每一行的三个元素分别指定该行对应颜色的红、绿、蓝单色值。
索引图像一般用于存放色彩要求比较简单的图像。
4.真彩色RGB图像
RGB图像分别用红(R)、绿(G)、蓝(B)三原色的组合来表示每个像素的颜色。
RGB图像每一个像素的颜色值(由RGB三原色表示)直接存放在图像矩阵中。
RGB图像的数据类型一般为8位无符号整形,通常用于表示和存放真彩色图像,当然也可以存放灰度图像。
1.图像增强
图像增强的主要目的有两个:
一是改善图像的视觉效果,提高图像成分的清晰度;二是使图像变得更利于计算机的处理,如锐化处理可突出图像边缘轮廓线,编程控制计算机进行跟踪,便可作特征分析。
2.图像分割
图像分割就是将图像分成若干有意义的区域(部分)的处理技术。
在实际图像中往往存在一些具有某种均匀一致性的区域,如灰度、纹理等分布的均匀一致性。
这种一致性构成的特征向量可用于区分图像的各个区域。
图像分割就是利用这些特征向量来检测区域的一