BP神经网络的基本原理+很清楚复习进程Word文档下载推荐.docx

上传人:b****3 文档编号:13644167 上传时间:2022-10-12 格式:DOCX 页数:12 大小:112.46KB
下载 相关 举报
BP神经网络的基本原理+很清楚复习进程Word文档下载推荐.docx_第1页
第1页 / 共12页
BP神经网络的基本原理+很清楚复习进程Word文档下载推荐.docx_第2页
第2页 / 共12页
BP神经网络的基本原理+很清楚复习进程Word文档下载推荐.docx_第3页
第3页 / 共12页
BP神经网络的基本原理+很清楚复习进程Word文档下载推荐.docx_第4页
第4页 / 共12页
BP神经网络的基本原理+很清楚复习进程Word文档下载推荐.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

BP神经网络的基本原理+很清楚复习进程Word文档下载推荐.docx

《BP神经网络的基本原理+很清楚复习进程Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《BP神经网络的基本原理+很清楚复习进程Word文档下载推荐.docx(12页珍藏版)》请在冰豆网上搜索。

BP神经网络的基本原理+很清楚复习进程Word文档下载推荐.docx

其中:

 

若视,,即令及包括及,则

于是节点j的净输入可表示为:

(5.13)

净输入通过传递函数(TransferFunction)f(·

)后,便得到第j个神经元的输出:

(5.14)

式中f(·

)是单调上升函数,而且必须是有界函数,因为细胞传递的信号不可能无限增加,必有一最大值。

5.4.2BP网络

BP算法由数据流的前向计算(正向传播)和误差信号的反向传播两个过程构成。

正向传播时,传播方向为输入层→隐层→输出层,每层神经元的状态只影响下一层神经元。

若在输出层得不到期望的输出,则转向误差信号的反向传播流程。

通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程。

5.4.2.1正向传播

设BP网络的输入层有n个节点,隐层有q个节点,输出层有m个节点,输入层与隐层之间的权值为,隐层与输出层之间的权值为,如图5.4所示。

隐层的传递函数为f1(·

),输出层的传递函数为f2(·

),则隐层节点的输出为(将阈值写入求和项中):

k=1,2,……q 

(5.15)

输出层节点的输出为:

j=1,2,……m 

(5.16)

至此B-P网络就完成了n维空间向量对m维空间的近似映射。

5.4.2.2反向传播

1) 

定义误差函数

输入个学习样本,用来表示。

第个样本输入到网络后得到输出(j=1,2,…m)。

采用平方型误差函数,于是得到第p个样本的误差Ep:

(5.17)

式中:

为期望输出。

对于个样本,全局误差为:

(5.18)

2)输出层权值的变化

采用累计误差BP算法调整,使全局误差变小,即

(5.19)

—学习率

定义误差信号为:

(5.20)

其中第一项:

(5.21)

第二项:

(5.22)

是输出层传递函数的偏微分。

于是:

(5.23)

由链定理得:

(5.24)

于是输出层各神经元的权值调整公式为:

(5.25)

3)隐层权值的变化

(5.26)

(5.27)

(5.28)

依链定理有:

(5.29)

(5.30)

是隐层传递函数的偏微分。

(5.31)

(5.32)

从而得到隐层各神经元的权值调整公式为:

(5.33)

5.4.3BP算法的改进

BP算法理论具有依据可靠、推导过程严谨、精度较高、通用性较好等优点,但标准BP算法存在以下缺点:

收敛速度缓慢;

容易陷入局部极小值;

难以确定隐层数和隐层节点个数。

在实际应用中,BP算法很难胜任,因此出现了很多改进算法。

利用动量法改进BP算法

标准BP算法实质上是一种简单的最速下降静态寻优方法,在修正W(K)时,只按照第K步的负梯度方向进行修正,而没有考虑到以前积累的经验,即以前时刻的梯度方向,从而常常使学习过程发生振荡,收敛缓慢。

动量法权值调整算法的具体做法是:

将上一次权值调整量的一部分迭加到按本次误差计算所得的权值调整量上,作为本次的实际权值调整量,即:

(5.34)

α为动量系数,通常0<α<0.9;

η—学习率,范围在0.001~10之间。

这种方法所加的动量因子实际上相当于阻尼项,它减小了学习过程中的振荡趋势,从而改善了收敛性。

动量法降低了网络对于误差曲面局部细节的敏感性,有效的抑制了网络陷入局部极小。

2) 

自适应调整学习速率

标准BP算法收敛速度缓慢的一个重要原因是学习率选择不当,学习率选得太小,收敛太慢;

学习率选得太大,则有可能修正过头,导致振荡甚至发散。

可采用图5.5所示的自适应方法调整学习率。

调整的基本指导思想是:

在学习收敛的情况下,增大η,以缩短学习时间;

当η偏大致使不能收敛时,要及时减小η,直到收敛为止。

3) 

动量-自适应学习速率调整算法

采用动量法时,BP算法可以找到更优的解;

采用自适应学习速率法时,BP算法可以缩短训练时间。

将以上两种方法结合起来,就得到动量-自适应学习速率调整算法。

4) 

L-M学习规则

L-M(Levenberg-Marquardt)算法比前述几种使用梯度下降法的BP算法要快得多,但对于复杂问题,这种方法需要相当大的存储空间。

L-M(Levenberg-Marquardt)优化方法的权值调整率选为:

(5.35)

e—误差向量;

J—网络误差对权值导数的雅可比(Jacobian)矩阵;

μ—标量,当μ很大时上式接近于梯度法,当μ很小时上式变成了Gauss-Newton法,在这种方法中,μ也是自适应调整的。

综合考虑,拟采用L-M学习规则和动量法分别作为神经网络的训练函数和学习函数。

5.5BP神经网络的训练策略及结果

本文借助于MATLAB神经网络工具箱来实现多层前馈BP网络(Multi-layerfeed-forwardbackpropagationnetwork)的颜色空间转换,免去了许多编写计算机程序的烦恼。

神经网络的实际输出值与输入值以及各权值和阈值有关,为了使实际输出值与网络期望输出值相吻合,可用含有一定数量学习样本的样本集和相应期望输出值的集合来训练网络。

训练时仍然使用本章5.2节中所述的实测样本数据。

另外,目前尚未找到较好的网络构造方法。

确定神经网络的结构和权系数来描述给定的映射或逼近一个未知的映射,只能通过学习方式得到满足要求的网络模型。

神经网络的学习可以理解为:

对确定的网络结构,寻找一组满足要求的权系数,使给定的误差函数最小。

设计多层前馈网络时,主要侧重试验、探讨多种模型方案,在实验中改进,直到选取一个满意方案为止,可按下列步骤进行:

对任何实际问题先都只选用一个隐层;

使用很少的隐层节点数;

不断增加隐层节点数,直到获得满意性能为止;

否则再采用两个隐层重复上述过程。

训练过程实际上是根据目标值与网络输出值之间误差的大小反复调整权值和阈值,直到此误差达到预定值为止。

5.5.1确定BP网络的结构

确定了网络层数、每层节点数、传递函数、初始权系数、学习算法等也就确定了BP网络。

确定这些选项时有一定的指导原则,但更多的是靠经验和试凑。

1)隐层数的确定:

1998年RobertHecht-Nielson证明了对任何在闭区间内的连续函数,都可以用一个隐层的BP网络来逼近,因而一个三层的BP网络可以完成任意的n维到m维的映照。

因此我们从含有一个隐层的网络开始进行训练。

2)BP网络常用传递函数:

BP网络的传递函数有多种。

Log-sigmoid型函数的输入值可取任意值,输出值在0和1之间;

tan-sigmod型传递函数tansig的输入值可取任意值,输出值在-1到+1之间;

线性传递函数purelin的输入与输出值可取任意值。

BP网络通常有一个或多个隐层,该层中的神经元均采用sigmoid型传递函数,输出层的神经元则采用线性传递函数,整个网络的输出可以取任意值。

各种传递函数如图5.6所示。

只改变传递函数而其余参数均固定,用本章5.2节所述的样本集训练BP网络时发现,传递函数使用tansig函数时要比logsig函数的误差小。

于是在以后的训练中隐层传递函数改用tansig函数,输出层传递函数仍选用purelin函数。

3)每层节点数的确定:

使用神经网络的目的是实现摄像机输出RGB颜色空间与CIE-XYZ色空间转换,因此BP网络的输入层和输出层的节点个数分别为3。

下面主要介绍隐层节点数量的确定。

对于多层前馈网络来说,隐层节点数的确定是成败的关键。

若数量太少,则网络所能获取的用以解决问题的信息太少;

若数量太多,不仅增加训练时间,更重要的是隐层节点过多还可能出现所谓“过渡吻合”(Overfitting)问题,即测试误差增大导致泛化能力下降,因此合理选择隐层节点数非常重要。

关于隐层数及其节点数的选择比较复杂,一般原则是:

在能正确反映输入输出关系的基础上,应选用较少的隐层节点数,以使网络结构尽量简单。

本论文中采用网络结构增长型方法,即先设置较少的节点数,对网络进行训练,并测试学习误差,然后逐渐增加节点数,直到学习误差不再有明显减少为止。

5.5.2误差的选取

在神经网络训练过程中选择均方误差MSE较为合理,原因如下:

① 

标准BP算法中,误差定义为:

(5.36)

每个样本作用时,都对权矩阵进行了一次修改。

由于每次权矩阵的修改都没有考虑权值修改后其它样本作用的输出误差是否也减小,因此将导致迭代次数增加。

② 

累计误差BP算法的全局误差定义为:

(5.37)

这种算法是为了减小整个训练集的全局误差,而不针对某一特定样本,因此如果作某种修改能使全局误差减小,并不等于说每一个特定样本的误差也都能同时减小。

它不能用来比较P和m不同的网络性能。

因为对于同一网络来说,P越大,E也越大;

P值相同,m越大E也越大。

③ 

均方误差MSE:

(5.38)

其中:

—输出节点的个数,—训练样本数目,—网络期望输出值,—网络实际输出值。

均方误差克服了上述两种算法的缺点,所以选用均方误差算法较合理。

十字绣□编制类□银饰制品类□串珠首饰类□5.5.3训练结果

体现市民生活质量状况的指标---恩格尔系数,上海也从1995年的53.4%下降到了2003年的37.2%,虽然与恩格尔系数多在20%以下的发达国家相比仍有差距,但按照联合国粮农组织的划分,表明上海消费已开始进入富裕状态(联合国粮农组织曾依据恩格尔系数,将恩格尔系数在40%-50%定为小康水平的消费,20%-40%定为富裕状态的消费)。

训练一个单隐

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 成人教育 > 成考

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1