人工神经网络在图像处理中的应用.docx

上传人:b****5 文档编号:7436539 上传时间:2023-01-23 格式:DOCX 页数:9 大小:27.13KB
下载 相关 举报
人工神经网络在图像处理中的应用.docx_第1页
第1页 / 共9页
人工神经网络在图像处理中的应用.docx_第2页
第2页 / 共9页
人工神经网络在图像处理中的应用.docx_第3页
第3页 / 共9页
人工神经网络在图像处理中的应用.docx_第4页
第4页 / 共9页
人工神经网络在图像处理中的应用.docx_第5页
第5页 / 共9页
点击查看更多>>
下载资源
资源描述

人工神经网络在图像处理中的应用.docx

《人工神经网络在图像处理中的应用.docx》由会员分享,可在线阅读,更多相关《人工神经网络在图像处理中的应用.docx(9页珍藏版)》请在冰豆网上搜索。

人工神经网络在图像处理中的应用.docx

人工神经网络在图像处理中的应用

人工神经网络在图像处理中的应用

王国雷

(山东大学控制科学与工程学院生物医学工程2008级)

摘要:

图像处理可以看作一大类图像技术,着重强调在图像之间的变换,图像处理是包含丰富内容和具有广阔应用领域的研究学科。

近几年来,作为具有自组织、自学习和联想功能的人工神经网络理论已成功地应用于图像处理的许多方面,如图像压缩、图像分割、边缘检测、图像增强、图像识别等。

概括得说,神经网络应用于图像处理的主要思路是:

把原始图像或经过适当预处理的图像作为网络的输入信号,在网络的输出端得到处理后的图像信号或分类结果。

关键词:

图像处理,人工神经网络,图像压缩、图像分割、边缘检测、图像增强、图像识别。

TheApplicationOfArtificialNeuralNetworkInTheAreaOfImageProcessing

WangGuolei

(BiomedicalEngineering,2008Grade,CollegeofControlScienceandEngineering,ShandongUniversity)

Abstract:

Imageprocessingcanbeseenasalargeclassofimagingtechnology,emphasizingonthetransformationbetweentheimages,imageprocessingisa

subjectwithrichcontentandbroadapplicationareas.Inrecentyears,asaself-organizing,self-studyandassociatefunctionartificialneuralnetworktheoryhasbeensuccessfullyappliedtomanyaspectsofimageprocessingsuchasimagecompression,imagesegmentation,edgedetection,imageenhancement,imagerecognitionandsoon.Ingeneral,themainideaofneuralnetworkapplicationinimageprocessingisasbelow:

puttheoriginalimageoranappropriatepre-processingimageastheinputsignalofnetwork,thenetworkoutputistheresult:

processedimagesignalorclassificationresults.

Keywords:

Imageprocessing,artificialneuralnetwork,imagecompression,imagesegmentation,edgedetection,imageenhancement,imagerecognition.

1.引言

图像是用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼进而产生视觉的实体。

图像技术在广义上是各种与图像有关的技术的总称。

包括利用计算机和其他电子设备进行和完成的一系列工作。

例如图像的采集、获取、编码、存储和传输,图像的合成和产生,图像水印的嵌入和输出,图像的变换、增强、恢复和重建,图像的分割,目标的检测、跟踪、表达和描述,目标特征的提取和测量。

因此,为了对各种图像技术进行综合研究、集成应用、有必要建立一个整体框架——图像工程。

图像工程根据抽象程度和研究方法等的不同可分为3个层次:

图像处理、图像分析和图像理解。

随着科学技术,特别是信息技术的发展,图像处理技术已经成为科学研究不可缺少的强有力工具,传统的图像处理方法已经无法满足需要,研究人员开始探索新的更有效的方法,其中利用神经网络进行图像处理是最活跃的方向.神经网络算法比起传统的算法表现出了很大的优越性,这主要表现在:

(1)高度并行处理能力,处理的速度远远高于传统的序列处理算法;

(2)具有自适应功能,能够根据学习提供的数据样本找出和输出数据的内在联系;(3)非线性映射功能,图像处理很多问题是非线性问题,神经网络为处理这些问题提供了有用的工具;(4)具有泛化功能,能够处理带有噪声的或不完全的数据。

最初,人工神经网络是作为模式识别分类器和聚类技术在图像处理领域中得到应用的。

然后随着神经网络理论的进一步研究,神经网络的特点得到人们充分的认识,在图像处理的各个领域得到了充分的应用,如印刷体和手写字符识别、语音识别、指纹、人脸识别、图像压缩复原等。

2.图像处理的知识

2.1图像处理的定义

图像处理可以看作一大类图像技术,着重强调在图像之间的变换。

狭义的图像处理技术的主要目标是要对图像进行各种加工以改善图像的视觉效果并为其后的目标自动识别打基础,或对图像进行压缩编码以减少图像存储所需的空间或图像传输所需的时间。

图像处理(imageprocessing),是用计算机对图像进行分析,以达到所需结果的技术,又称影像处理,一般指数字图像处理。

数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组,该数组的元素称为像素,其值为一整数,称为灰度值。

图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描述和识别3个部分。

2.2图像压缩,增强和复原,图像匹配、描述和识别

图像压缩是由数字化得到的一幅图像的数据量十分巨大,一幅典型的数字图像通常由500×500或1000×1000个像素组成。

如果是动态图像,是其数据量更大。

因此图像压缩对于图像的存储和传输都十分必要。

主要有两类压缩算法,即不失真的方法和近似的方法。

最常用的不失真压缩取空间或时间上相邻像素值的差,再进行编码。

近似压缩算法大都采用图像交换的途径,例如对图像进行快速傅里叶变换或离散的余弦变换。

著名的、已作为图像压缩国际标准的JPEG和MPEG均属于近似压缩算法。

前者用于静态图像,后者用于动态图像。

它们已由芯片实现。

图像增强的目标是改进图片的质量,例如增加对比度,去掉模糊和噪声,修正几何畸变等;图像复原是在假定已知模糊或噪声的模型时,试图估计原图像的一种技术。

图像增强按所用方法可分成频率域法和空间域法。

前者把图像看成一种二维信号,对其进行基于二维傅里叶变换的信号增强。

采用低通滤波(即只让低频信号通过)法,可去掉图中的噪声;采用高通滤波法,则可增强边缘等高频信号,使模糊的图片变得清晰。

具有代表性的空间域算法有局部求平均值法和中值滤波(取局部邻域中的中间像素值)法等,它们可用于去除或减弱噪声。

早期的数字图像复原亦来自频率域的概念。

现代采取的是一种代数的方法,即通过解一个大的方程组来复原理想的图片。

图像匹配、描述和识别对图像进行比较和配准,通过分制提取图像的特征及相互关系,得到图像符号化的描述,再把它同模型比较,以确定其分类。

图像匹配试图建立两张图片之间的几何对应关系,度量其类似或不同的程度。

匹配用于图片之间或图片与地图之间的配准,例如检测不同时间所拍图片之间景物的变化,找出运动物体的轨迹。

3.人工神经网络

3.1人工神经网络的定义和原理。

人工神经网络是运用生物神经网络的机理,即通过大量相对简单的非线性神经元之间复杂而又灵活的联接来模仿人脑的智能化信息处理过程。

人工神经网络并没有完全地真正反映大脑的功能,它只是对生物神经网络进行某种抽象、简化和模拟。

采用大量简单的处理单元即神经元并行连接而构成一种复杂的信息处理系统,整个系统通常是高度非线性的。

并且这种系统是可以训练的,即可以随着经验的积累而改善自身的性能。

同时由于高度的并行性,它们能够进行快速判决并具有容错性。

利用神经元构造的各种人工神经网络,用来模拟生物神经网络实现各种信息的处理。

神经网络目前在图像处理技术,语音识别,字符识别,图案识别和分类,信号过程,过程控制和优化等领域得到许多应用。

其中,数字图像处理是神经网络目前较新的和最重要的应用领域。

尽管对生物神经网络的研究因为手段的限制显得非常有限,但目前已经应用这种人工神经网模型取得了很大的成功。

例如:

常见的传统神经网络有:

BP、Hopfield、Kohonen等。

还有些特殊的神经网络模型如:

细胞神经网络、协同神经网络、模糊神经网络等,还有上世纪90年代开始正在研究的PCNN脉冲耦合神经网络。

3.2BP网络

BP(BackPropagation)神经网络是一种采用误差反向传播算法的多层前馈网络。

典型的BP网络是一个三层前馈的阶层网络,即:

输入层、隐含层(也称中间层)、输出层。

相邻层之间的各神经元实现全连接,而且每层各神经元之间无连接。

它以一种有教师示教的方式进行学习。

随着“模式顺传播”和“误差逆传播”过程的交替反复进行。

网络的实际输出逐渐向各自所对应的期望输出逼近,网络对输入模式的响应的正确率也不断上升。

通过此学习过程,确定各层间的连接权值之后,就可以对图像进行相应的处理了。

由于BP网及误差逆传播算法具有中间隐含层并有相应的学习规则可寻,使得它能够逼近任意的非线性映射关系,而且有很好的泛化能力。

特别是其数学意义明确、步骤分明的学习算法,更使其具有广泛的应用前景。

BP网络所擅长的是处理那种规律隐含在一大堆数据中的映像逼近问题,特别是处理那种通过学习自适应可调的是实时性问题,像图像分割、模式识别、自适应模糊控制等。

在图像处理领域中,作为一种非自适应的神经网络技术应用非常广泛。

但BP网并不是十分的完善,它存在以下一些主要缺陷:

学习收敛速度太慢、网络的学习记忆具有不稳定性,容易陷入局部极小点。

3.3Hopfield网络

Hopfield网络是由JohnHopfield在1982年提出来的。

这是一个具有自反馈的动态网络。

每个单元只能有两种输出:

−1(表示抑制)或+1(表示兴奋)。

但每个单元具有多个输入,每个连接均被指派一个特定的强度。

在每个时刻单元把来自它的全部连接的效果总和起来。

每个输入对单元的影响是将当前的输入信号(−1或+1)与其相对应的权重相乘而得到的,如果这个总和大于0则置输出状态为+1(平均而言,当单元兴奋性输人大于抑制性输入时,则输出为正),否则就输出-1。

这意味着一个单元的输出会因为来自其它单元的输人发生变化而产生变化。

计算将被一遍遍地反复进行,直到所有单元的输出都稳定为止。

所有单元的状态并不是同时改变的,而是按随机次序一个接一个进行的。

Hopfield从理论上证明了,给定一组权重(连接强度)以及任何输入,网络将不会无限制地处于漫游状态,也不会进入振荡,而是迅速达到一个稳态。

Hopfield网络中使用所谓的“赫布规则”来调节神经元之间的连接权重,即如果两个单元具有相同的输出,则它们之间的相互连接权重都设为+1。

如果它们具有相反的输出,则两个权重均设为-1。

大致地说,每个单元激励它的"朋友"并试图削弱它的"敌人"。

Hopfield神经网络主要用于联想记忆和优化计算。

如果我们能把某个待研究解决的问题化成一个Hopfield计算能量函数,且使这个计算能量函数的最小极值正好对应于一定约束条件下的问题解答时,那么这个问题就可以利用Hopfield网络来求解了。

Hopfield网络在图像边缘检测、图像模式匹配和识别等图像处理方面应用比较多。

3.4Kohonen自组织特征映射网络(SelforganizingFeatureMap,SOFM)

除了前面介绍的BP网络等有监督的人工神经网络外,还有一种无监督的Kohonen网络,它是一种无监督自学习的、自组织的人工神经网络。

竞争型神经网络是基于人的视网膜及大脑皮层对剌激的反应而引出的。

神经生物学的研究结果表明:

生物视网膜中,有许多特定的细胞,对特定的图形(输入模式)比较敏感,并使得大脑皮层中的特定细胞产生大的兴奋,而其相邻的神经细胞的兴奋程度被抑制。

对于某一个输入模式,通过竞争在输出层中只激活一个相应的输出神经元。

许多输入模式,在输出层中将激活许多个神经元,从而形成一个反映输入数据的“特征图形”。

竞争型神经网络是一种以无教师方式进行网络训练的网络。

这种网络的学习目的是从一组数据中提取有意思的特征或某种内在的规律性(分布特征或按某种目的聚类)。

它通过自身训练,自动对输入模式进行分类。

竞争型神经网络及其学习规则与其它类型的神经网络和学习规则相比,有其自己的鲜明特点。

在网络结构上,它既不象阶层型神经网络那样各层神经元之间只有单向连接,也不象全连接型网络那样在网络结构上没有明显的层次界限。

它一般是由输入层(模拟视网膜神经元)和竞争层(模拟大脑皮层神经元,也叫输出层)构成的两层网络。

两层之间的各神经元实现双向全连接,而且网络中没有隐含层。

有时竞争层各神经元之间还存在横向连接。

竞争型神经网络的基本思想是网络竞争层各神经元竞争对输入模式的响应机会,最后仅有一个神经元成为竞争的胜者,并且只将与获胜神经元有关的各连接权值进行修正,使之朝着更有利于它竞争的方向调整。

神经网络工作时,对于某一输入模式,网络中与该模式最相近的学习输入模式相对应的竞争层神经元将有最大的输出值,即以竞争层获胜神经元来表示分类结果。

这是通过竞争得以实现的,实际上也就是网络回忆联想的过程。

除了竞争的方法外,还有通过抑制手段获取胜利的方法,即网络竞争层各神经元抑制所有其它神经元对输入模式的响应机会,从而使自己“脱颖而出”,成为获胜神经元。

除此之外还有一种称为侧抑制的方法,即每个神经元只抑制与自己邻近的神经元,而对远离自己的神经元不抑制。

这种方法常常用于图象边缘处理,解决图象边缘的缺陷问题。

Kohonen网络对输人的数据有“聚类”作用,可起到数据压缩的作用,同时又具有特征抽取的作用,同样应用于图像压缩和特征提取。

3.5脉冲耦合神经网络PCNN模型

从上世纪90年代开始,由Eckhorn等对猫的视觉皮层神经元脉冲串同步振荡现象的研究,得到了哺乳动物神经元模型[1,2],并由此发展形成了脉冲耦合神经网络PCNN模型,该模型具有对图像二维空间相似、灰度相似的像素进行分组的特点,并能减小图像局部灰度差值,弥补图像局部微小间断特点,这是其它图像分割方法无法比拟的特点,PCNN主要用于特征提取、边缘信息分析、图像分割、目标识别,其应用研究正在逐步深入。

目前基于该PCNN模型的大型图像诊断系统、军事目标识别系统、图像分割和目标分类系统等正在进行研制中。

3.6人工神经网络的特点和互连模式

人工神经网络的主要特征有

(1)并行处理性。

(2)分布式存储与容错性。

(3)信息处理与存储的合二为一性。

(4)自组织、自学习性。

(5)实时性。

(6)鲁棒性与模糊性。

人工神经网络的互联模式主要有以下几种:

(1)前向网络

(2)有反馈的前向网络(3)层内有互连结合的前向网络(4)相互结合型网络。

4.人工神经网络在图形处理中的应用

4.1图像数据压缩

为减小存储容量很大的图片在存储和传输的过程中带来的不便,我们常常希望通过某种变换手段,将数量巨大的图像信息进行压缩,以压缩后的图像数据信号就行存储和传输。

当需要提取图像或在传输终端接收图像时,按一定规则将图像恢复,这就是图像数据压缩。

神经网络图像数据压缩系统主要由压缩网络(输入层/中间层)、传输通道(中间层/中间层)和再生网络(中间层/输出层)组成。

输入层和输出层由相同的N个单元组成。

在网络学习过程中,输入层的学习模式及输出层的教师模式使用同一图像信号。

由于中间层单元数可以大大少于输入层、输出层的单元数,所以学习后的网络将以较少的中间层单元有效地表示输入图像模式,并以此进行存储和传输,在输出层将输入图像模式再现出来。

在这一过程中,输入层\中间层的变换可以看作是压缩编码过程,中间层/输出层的变换可以看作是解码的过程。

4.2图像分割

在任何人工视觉系统中,分割是早期视觉中最重要、最困难的一步。

分割时将图像划分为互不相交部分的过程;通过分割,将我们感兴趣的部分(如物体)提取出来,将不感兴趣的部分(如背景)滤除掉。

目前,神经网络在图像分割方面也有很多应用。

Blanz和Gish使用一个三层前馈网络进行图像分割。

输入层神经元数取决于每个像素的输入特征数,输出层等于类别数。

Babaguchi等使用一个多层BP网络对图像取阈值。

网络的输入是图像的直方图,输出是期望的阈值。

学习过程采用的样本是大量已知阈值的图像,这些阈值经验证能产生具有良好视觉效果的二值化图像。

最近,Ghosh等人用一个巨量连接的神经网络在噪声环境中提取物体。

4.3图像分类与识别

在前面提到的图像分割问题中,有时也会涉及划分属于多个不同类别的区域,这实际上已经包含了图像分类的任务。

如果图像中的类别不多,模式不复杂,类之间的区别明显,当分割任务完成时,分类任务也就完成了。

这里主要是指那些类别众多,模式复杂、类之间区别细微的图像分类问题,如手写体字符识别、人脸识别、指纹识别、染色体识别等。

图像分类也许是神经网络应用最多的一个领域。

具体实现时,可以用原始图像作为输入,用中间隐层进行特征提取。

这样做虽然简单、直观,但存在很大的缺陷。

一是图像的分辨率不宜太高,否则会导致网络输入单元剧增,计算量也随之成倍增加;而降低图像分辨率又导致相近模式间的差异不明显,给识别带来困难。

二是原始图像包含了大量冗余信息,且信息量分散,特征隐蔽较深,所以大大增加了模式特征提取的难度,降低了网络的学习效率。

因此,大多数情况下需要对原始图像进行一定的预处理。

如何抽取有效的特征,是图像分类问题的关键。

由于各类图像的特点各不相同,相应的特征提取方法也千差万别,专用性非常强。

将提取出的特征输入合适的网络模型,最后得到分类结果。

J.Cao等人用一个主分量分析(PCA)神经网络提取输入图像的10个主特征,再将提取出的特征输入后一级网络——贝叶斯增长聚类神经网络(BICNN)。

这两个网络是以级联的形式串接起来的,分别以不同的学习规则训练,其性能略优于三层BP网络。

根据传统的误差BP原理进行学习,有时显得效率较低,因为中间隐层抽取特征的过程很难,未必能如我们所期望的那样抽取有效特征。

前一层网络还未充分学习并对输入模式形成正确的特征映射前,后一层网络的权值调整不具有明显效果。

采取级联形式的网络能克服这个问题,各层网络任务单一、目标明确,极大地提高了学习效率,并减少了陷于局部极小值的概率。

B.Lerner等人在人体染色体分类的问题中,采用染色体的中轴密度投影以及染色体长度和着丝粒指数作为特征。

中轴密度投影将二维图像用一维形式表达出来,其幅度被归一化到[-0.5,0.5]区间,长度被修为64,染色体长度和着丝粒指数也被归一到[-0.5,0.5]区间。

采用的网络是一个三层BP网络,共有66个输入单元。

输出层单元数等于类别数。

中间隐含层单元数用PCA方法确定,事先规定一个阈值,若最大的n个特征值之和占所有特征值总和的百分比大于该阈值,则隐单元数就设为n。

利用多分辨率信息进行识别是近来的一个热点。

文献提出了一个新方法,用小波变换和一个简易的多层聚类神经网络(MCNN)进行手写体数字的多分辨率识别,将字符图像与Haar小波卷积得到小波系数作为多分辨率特征向量输入MCNN。

与传统的全连接型网络不同,MCNN是一种局部连接型网络。

对于全连接型BP网络来说,由于输入层各单元与担负特征提取任务的中间层单元实行全连接,学习模式的整体相关特征被分布记忆在网络的各连接中。

手写体文字的特点是其模式整体相关性变化大,而各笔划之间的相关系数较稳定,所以在网络运行时,当遇到未学习过的输入模式,由于整体相关性的差别造成网络输出模式的振荡,降低了网络的识别率,网络的泛化能力不强。

虽然减少连接权数量能避免振荡,但是过少的连接权甚至对训练集也不能精确学习。

因此,有必要将输入层单元分成若干区域,每个区域的单元仅与部分中间层单元连接,目的是使网络对学习模式的特征分解记忆,淡化对其整体特征的记忆。

MCNN的输入层由8个聚类组成,每个聚类都与隐层中对应的聚类进行全连接,这样构成8个子网。

每个子网都从随机的初始值开始,学习不同的特征映射。

学习完后,每个子网都有不同的内部表示。

而输出层是与所有隐层单元全连接的,这样当一个子网辨认不出某一给定输入时,依靠其他子网仍能得到正确输出。

很多图像识别问题要求算法具有不变性、旋转不变性,缩放不变性等。

对于特定一些问题,存在某种特征提取方法或变换,其本身就具有不变性。

对于较为通用的方法。

JeffreyWood作了一个详尽的总结。

神经网络当然也是其中必不可少的一种方法。

最简单(但效率最低)的方法就是给网络提供每一模式许多形态的样本,使其充分学习。

利用网络的内插能力,能识别其他各种形态的样本。

Simard等通过修改BP算法,使得网络经训练后其输出不受输入微小变化的影响。

很多方法利用权值共享的原理实现不变性识别,其基本原理是:

强迫网络中的某些连接权具有相同权值,这样就能有地对网络输出施加约束,例如在某些给定的集合下执行不变性输出。

这种结构化网络自由参数的数目少于具有相同连接形式的同类网络,因此训练过程加快,且由于这种受约束网络在其结构中包含了先验知识,它的推广能力将优于未受约束的网络。

还有很多很多学者采用高阶神经网络解决不变性识别的问题。

高阶神经网络中的每个神经元不仅将它的输入进行加权求和,还对输入之间的组合乘积进行加权求和,也就是引入了高次项。

这使计算复杂度大为增加,因此在高阶神经网络解决不变性识别问题时,通常只采用一个神经元。

这样一个单结点网络的学习算法类似于感知机收敛算法,因而学习速成度快,容易收敛。

Fukushima提出的新认知机模型是不变性识别方面最成功的应用之一,它对于输入样本的位移、畸变和噪声干扰等都有较强的抵抗能力。

网络是由若干结构相同的神经元模块加上输入层而构成的,由于处理的视觉信息,所以每个模块都是由一些不同的二维阵列的神经元层所组成。

各神经元层以级联的形式组织起来,第一层(或前面几层)能够抽取局部特征;后面几层通过对它们前一层中性平面的组合,能够形成整体特征。

经过这样一个从局部到整体,从低级到综合的过程,最后在输出层得到决策,并且不受位置和畸变的影响。

网络采用自组织竞争算法进行学习,自动调节一些神经元的可变连接权,并对学习样本集进行分类。

4.4图像增强

图像增强的主要目的是使图像处理后达到特定的效果。

不同的图像,其处理方法也各不相同,使我们很难找到一个标准的公式或函数,因此可利用神经网络的学习特性和自组织能力帮助我们完成这任务。

此外,神经网络在图像恢复、目标识别、计算机视觉中的体式匹配等方面也有应用。

神经网络的引入极大丰富了图像处理的手段。

5.应用举例和发展前景

鉴于以上提及的优势,近些年来,人工神经网络在图像处理中的应用十分广泛,领域也比较宽。

在车牌识别、字符识别、红外图像识别、遥感图像识别中发挥了举足轻重的作用。

不仅如此,作为人工神经网络在医学图像处理中,意义也是十分重大的。

举例说明,通过对医学影片获取的图像,如CT、核磁共振成像等,进行特征纹理提取,然后输入训练好的神经网络,从得到的输出判别出相应的病症,在临床上可作为医师治疗和诊断的辅助。

鉴于神经网络的强大功能和处理解决问题强大的优势,我们相信,它将会在图像处理这个领域发挥越来越大的作用。

当然,有些问题也是需要我们去考虑的,比如说,哲学上的具体问题具体对待,对于什么样的要求和目的,我们采用什么样的模型,建立何种神经网络,如何使学习效果最好,这需要我们进一步去探索和追究,我们将拭目以待。

6.结束语

人工神经网络应用在图像处理方面案例比比皆是,如图像压缩、图

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1