计算机视觉课程报告.docx
《计算机视觉课程报告.docx》由会员分享,可在线阅读,更多相关《计算机视觉课程报告.docx(10页珍藏版)》请在冰豆网上搜索。
计算机视觉课程报告
重庆邮电大学研究生堂下考试答卷
2015-2016学年第2学期
考试科目计算机视觉
姓名
学号
年级
专业计算机科学与技术
2016年6月28日
关于图像增强技术的综述
摘要:
图像增强是指以满足特定应用需求为目的,突出图像中感兴趣区域信息,抑制或去除其他信息,针对不同的应用而异的图像分析识别预处理,其目标是变换原图像信息为更加适合人机辨识的系列方法。
对图像质量的要求也随着多媒体技术和产品的不断发展和在各领域的广泛应用而不断提高。
而通常图像在获取过程中受成像设备、场景动态范围、光照条件等因素影响,使得图像质量下降,甚至于影响后续的人机图像分析识别。
为此,需要对图像进行动态范围调整、对比度增强、彩色图像增强处理及视觉感知一致性等方面的处理来获得高质量的图像。
论文以具体应用目标要求为基准,通过对图像的视觉效果增强相关理论和技术方法的深入研究,分析其在实际应用中存在的问题和缺点,进一步提出相应的改进增强算法。
主要包括对彩色图像本身的增强、基于图像域的多曝光图像融合增强以及基于频率域的多传感器图像融合增强。
关键字:
图像增强高动态范围成像多曝光融合色调映射
课程体会.......................................................................................................................9
前言
现代人类对图像应用和质量提出了越来越高的要求,因此,与具体需求相适
应的图像增强方法随之而产生。
课题以图像增强的相关技术和具体应用需求为研究出发点和归宿,以算法在视觉感知和处理效率方面的改进为导向,将单一图像
增强处理到多幅图像融合增强相关方法和应用需求有机地结合在一起。
在这一章
中,将分析和介绍与本课题图像增强研究密切相关的研究背景与意义、国内外此
领域的研究现状、课题研究的基本内容,最后,指明论文的课题来源及整篇组织。
图像已经广泛深入应用到人们生产、生活的方方面面,而人们对图像质量的
要求也越来越高。
而图像增强技术正顺应人们的需求,经过几十年的沉积,仍有
许多尚待研究和解决的问题。
本文将针对不同的具体应用,研究改善图像视觉质
量和感知效果的几类图像增强相关算法和理论,提出了新的优化改进方法。
第1章图像增强的研究背景与意义
在人类的五观感知信息中,由眼睛即视觉感知所带来的信息在人类信息获取
中占据着非常重要的地位[1]。
而图像正是人们在日常生活、科学研究、生产与消费领域最直接和最直观地可接触到的信息,图像的应用已经渗透到人类活动的各个领域。
而为了达到人类对图像应用各领域特定需求的目的,又需要对原始捕获的图像作相应的处理,在一系列的数字化图像处理中,图像增强成为了整个图像处理中非常引人注目的一个研究点。
图像增强作为图像处理的一个古老而重要的分支,在不断地应用需求变化面
前,也在不断更新其研究目标和发展其增强处理方法技术。
通常,由于场景本身
所包含的动态范围、光照条件、图像捕获设备如数码相机的局限,以及摄影者本
身的技术问题等多种因素影响,多数情况下,会使得拍摄的图像达不到人们预期
的目标,如场景中的运动目标产生的运动模糊、由于曝光不恰当引起的场景细节
损失或是弱小目标辨识不清等,都会对后期的图像前后景分割、目标识别、目标
跟踪和最终的图像理解以及预测分析等带来困难。
而图像增强本身的目标就是为
了突出图像中感兴趣的区域、降低或去除不需要的图像信息,以此来加强和获取
用户觉得有用的信息,进而得到更加适合于人/机器对图像进行理解和分析处理的表现形式或是富含更多细节信息的图像的相应处理方法[1]。
由于各行各业都拥有各自特有类型的图像也使得图像增强处理方法有其共性也有其特殊性。
如用数码相机采集的图像,通过增强单幅彩色图像,可以有效减少由于光照不均、实际场景在成像过程中的动态范围压缩不恰当所造成的细节损失、彩色失真等造成的图像退化问题。
而通过连续多次曝光同一场景获取图像序列,通过图像融合处理可以弥补单一曝光度图像所不能捕获的动态信息,最终形成一幅具有更丰富细节的增强图像。
在医学领域,MRI、CT等成像技术的大量使用,使得人们对脑部、胸部、肺部等内脏器官及其他人体机构中病变的检测和定位提供了更精准的信息。
而在军事和其他公共安防监控中,可通过红外成像提取出感兴趣的目标,同时借助可见光成像来对提取的目标环境进行准确定位。
在智能交通中,随着天气愈加恶劣,雾霾、沙尘暴,以及受夜间光照影响等,使得监控成像后需要对图像进行增强,以增进对车辆、行人、车牌号及道路标识等进行更好的识别。
而在卫星遥感成像中,增强处理遥感图像可以加强对森林火灾防控、作物分布虫害防治以及金属矿产探测方面更好的应用等。
通常从两个方面实现图像增强,一是对比度拉伸处理,二细节保持与再现[2]。
将在非良好照明条件下获取到的视觉效果较差的低对比度图像,通过图像灰度变
换,调整其对比度,可实现原图像的对比度增强。
为了使得图像中感兴趣的信息
或是有用的信息变得更加突显,而这些细节信息通常被遮盖或剪除,此时通过相
应的变换,必然达到增强图像细节的目标[3]。
而在实际应用中,通常会需要对退化图像进行对比度和细节两方面的增强处理,以达到最终的图像增强效果。
图像增强的结果通常具有主观性,大多靠经验性累积方法,对实际应用中的图像进行交互处理以达到增强的目的,这也为图像增强量化标准带来困难。
由于图像增强处理在许多实际应用领域中都非常必要,因此,其研究始终处于图像处理的前沿。
第2章图像增强研究现状及存在的问题
图像增强技术按其变换处理所在的作用域不同而被分为空域方法和频域方法两大类。
而由于具体的应用目的不同,其图像实际增强处理所用到的方法和增强的内容有一定的差异,但图像增强处理的各目标和方法并不互相排斥,某些应用中需要同时联合几种方法来实现最好的增强效果。
2.1空域增强
空域增强通常包含图像灰度级变换、图像直方变换、直方均衡以及使用模糊
逻辑和基于优化的增强算法,如使用遗传算法和细菌觅食等算法进行优化处理以
达到图像增强的目的。
空域图像增强方法的一般定义[1,2-3]如下公式1:
(1)
其中,f(x,y)为输入的待增强的图像g(x,y)为处理后的增强图像,T为空间域变换函数,表示对原图像f(x,y)在像素空间所进行的各种变换操作。
当T操作定义在单个像素点(x,y)上时,称该操作为点操作;而空间滤波指T操作作用于像素点(x,y)的邻域上时的相应处理。
2.2基于频域的增强
基于频域的图像增强算法基础为卷积理论,该方法把图像视为波,然后再利
用信号处理手段来处理图像。
其通用的数学表示[1]如下公式2所示:
(2)
g(x,y)为增强后的图像,F(x,y)为原图像的傅立叶变换,H(x,y)为滤波变换函数,通过大量的实验研究,发现增强处理后的图像具有比原图像更加清晰的细节。
常用的滤波方法有低通、高通、带阻及同态滤波等。
频域图像增强方法从本质上讲是一种间接对图像进行变换处理的方法。
其最
早的变换理论,由傅立叶的《热分析理论》指出的周期函数表达可由不同频率和不同倍乘系数表达的正/余弦和形式表征[1]。
随着图像处理应用不断发展,频率域变换方法近年来发展了在小波变换基础上发展起来的具有更高精度以及更的稀疏表达特性,更加适合于表达图像的边缘轮廓信息的Curvelet和Contourl-et变换。
这些超小波变换都是基于变换域的新型的多尺度分析方法,在图像对比度增强、降噪、图像融合与分割等方面得到了广泛地应用[4-8]。
2.3基于融合的增强
上述方法主要从图像自身的处理来完成单一图像的增强,但对于原始图像本
身蕴含信息量不够,特别是由于光照、曝光度等原因造成的部分区域信息损失时,
单靠唯一一幅原始图像本身不足以实现整幅图像增强[4,10]。
近年来,许多学者对融合多图像增强提出了许多新的方法和思路。
主要可以分为:
基于多传感器图像融合增强[10-14],如Stathaki分析总结了图像融合的相关算法及应用领域[10]。
Shah等提出四种红外图像与可见光图像融合以增强图像背景信息的方法[12]。
其中基于直接图像域的权值调整方法取得了较明显的增强效果,但在总体细节有模糊化痕迹,且其强烈依赖于图像精确校准和场景完全静态的假设;而基于小波、Curvelet变换以及Contourlet变换等频率域多尺度方法融合增强后细节保留得更好。
Pohl等分析了遥感图像中多传感器图像融合技术的相关概念、技术方法及其应用[13]。
Li等人提出一种基于区域的脉冲耦合神经网络图像融合方法[14]。
2.4图像增强的评价方法
图像增强算法本身在不同的应用过程中,其增强的结果随着增强的目的不同
而存在差异,因此,没有一个统一的增强算法能适合于所有类型的增强处理。
同
样,对于增强后的结果评价也因主观性和客观需求不同而有所侧重。
图像增强评
价方法总体可分为两大类:
即主观评价和客观评价[9]。
主观评价具有较强的经验性,从人眼视觉感知的角度进行评判,而对于人类视觉系统(HumanVisualSystem,HVS)的精确模拟仍是困难的问题,因此,真正意义上的基于HVS的主观评价系统只能定性描述并未能起到实际定量量化评估的作用。
2.5图像增强算法综述
随着成像技术和计算机技术的不断发展,数字图像已经成为人们日常生活中
必不可少的组成部分,各种成像手段和设备大量用于数字娱乐、身份识别、智能
交通、医疗病症检测、军事监管等。
由于夜间光照不足、大雾、沙尘等影响,捕
获图像中突发事件如相机运动、或是场景中目标运动等,都会使采集的图像或是
图像序列遭受损失,存在成像模糊、噪声污染及曝光不均等问题,为此,图像增
强显得尤为重要。
综合分析相关文献,图像增强技术可归为空域方法[1-3]和频域方法[1]。
在第一章绪论中已完成对空域图像增强的具体总结分析,直接对像素值施用相应的操作以获得增强效果,如灰度变换、直方均衡、直方匹配等方法;而频域方法中,图像首先被转换到频率域,也就是说第一步先要进行傅立叶变换。
频率增强方法中,所有的增强算子都是在进行傅立叶变换之后进行的,然后再进行傅立叶逆变换以得到增强后的图像。
这些增强算子通常用于调整图像亮度、对比度或是灰度级分布,作为结果的输出图像的像素值根据所应用的变换函数得以改观。
空域方法具有理论简单,算法复杂度低,可广泛应用于实时领域图像增强,缺点是缺少很强的自适应能力。
而频域图像增强方法依赖于频域信息变换处理,其作用于相应的变换系数。
这些频域的图像增强方法[4-8],具有算法的复杂性较低,相应变换及特性应用性好等优点,其主要缺点是不能满足对图像的所有部分都能较好增强,且算法难于应付自适应的图像增强。
随着各领域人们对高质量图像需求的不断增加,对图像色彩及图像中场景各
部分细节要求越来越高,如何获取高质量图像以及如何将低质量退化图像进行增
强以达到更好的应用目标需求,越来越成为研究者们关注的焦点,而带给人们更
多视觉感知信息的彩色图像和具有更高图像细节质量的高动态范围图像带给人们更多的研究兴趣。
而本文的研究也正是基于此,因此,本论文将着重从单一彩色图像增强和高动态范围成像两个方面进行研究。
参考文献
1.R.C.Gonzalez,R.E.Woods.DigitalImageProcessing[M],PersonPrenticeHall,NewJersey,2008
2.Y.B.Rao,L.T.Chen.Asurveyofvideoenhancementtechniques[J].
InternationalJournalonElectricalEngineeringandInformatics,2012,3
(1):
71-99
3.饶云波.夜间视频增强的关键技术研究[D].成都:
电子科技大学,2012
4.P.Ganzalop,M.Jesus.Wavelet-basedimagefusiontutorial[J].PatternRecognition.2004,8(37):
1855-1872
5.S.Li,B.Yang.Multifocusimagefusionbycombiningcurveletandwavelettransform[J].PatternRecognitionLetters,2008,29:
295-301
6.A.Borsdorf,R.Raupach,T.Flohr,etal.WaveletbasednoisereductioninCT-imagesusingcorrelationanalysis[J].IEEETransactionsonMedicalImaging,2008,27(12):
1685-1703
7.K.Tsai,J.W.Ma,D.T.Ye,etal.CurveletprocessingofMRIforlocalimageenhancement[J].InternationalJournalforNumericalMethodsinBiomedicalEngineering,2012,28(6):
661-670
8.M.H.Asmare,V.S.Asirvadam,L.Iznita.Imageenhancementbyfusionincontourlettransform[J].InternationalJournalonElectricalEngineeringandInformatics,2010,2
(1):
29-42
9.E.Reinhard,G.Ward,S.Pattanaik,etal.HighDynamicRangeImaging:
Acquisition,DisplayandImage-basedLighting[M](2ndEdition).MorganKau_man,2010
10.T.Stathaki.ImageFusionAlgorithmsandApplications[M].AcademicPressisanimprintofElsevier,2008
11.A.Toet.Naturalcolormappingformultibandnight-visionimagery[J].InformationFusion,2003,4:
155-166
12.P.Shah,B.C.S.Reddy,S.N.Merchant,etal.Contextenhancementtorevealacamouflagedtargetandtoassisttargetlocalizationbyfusionmultispectralsurveillancevideos[J].Signal,ImageandVideoProcessing,2011,8:
1-16
13.C.Pohl,J.L.V.Genderen.Multisensorimagefusioninremotesensing:
concepts,methodsandapplications[J].InternationalJournalofRemoteSensing,1998,19(5):
823-854
14.M.Li,W.Cai,Z.Tan.Aregion-basedmulti-sensorimagefusionschemeusingpulse-coupledneuralnetwork[J].PatternRecognitionLetters,2006,27(16):
1948-1956
15.T.Mertens,J.Kautz,T.V.Reeth.Exposurefusion:
asimpleandpracticalalternativetohighdynamicrangephotography[J].ComputerGraphicsforum,2009,28:
161-171
课程体会
这学期我选了计算机视觉这门课,总的来说收获比较大,了解了与自己研究生阶段研究方向不同的知识点。
作为计算机专业的研究生,我本身比较喜欢计算机这个专业,而计算机视觉是一门研究如何使机器“看”的科学,更进一步说,就是指用摄影机和和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并做进一步的图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
首先在这门课上,我们了解了该领域的基本研究现状和一些研究方法,扩大了我们的视野。
而且老师在上课时候也给我们提供了一些自学的资料和网址,方便对这方面感兴趣的同学可以深入的去学习一下该领域。
因此在这学期的课程中,我对教学比较满意,能够学到这门课的知识点,也具有自己学习的自由度。
同时老师在这门课的教学上,让我们分成小组,选取课程相关的高质量论文,来做最后的课程报告,我本来的研究方向不是图像领域,因此,最初拿到小组成员给的一个图像增强方面的报告,看了几遍,发现看不懂。
其中可能也有是英文的原因,自己英语不是很好,另外就是对该领域的基本方法了解不够,导致看论文存在问题。
所幸,我们小组有一个同学就是做图像增强方向的,因此我们决定进行一次讨论,由那位比较了解该方向的同学,给我们讲解一下论文。
经过这次讨论会,我们该方向的基本方法也了解了,再看起论文,就比较容易了。
后来我们又进行了几次讨论,完成了小组的报告内容和演讲PPT。
在这个过程中也是我提高比较多的地方。
希望在以后的课程中,老师可以加强课堂教学管理,这样在平时成绩管理上能够更加真实的反应平时状况。
总的来说,作为研究生的一门课程,计算机视觉这门课,我个人觉得还是比较满意的。