如果前提P满足了t,则可以以一定的真度退出结论Q,规则的可信度是CF。
模糊框架是普通框架的推广,其特点是:
槽的值允许是模糊数据、模糊动作或模糊过程,这使得很多模糊现象可以标示在框架中,从而大大丰富了框架的表达能力。
框架之间的各种关联是模糊的。
允许用各种模糊逻辑公式来表示判断条件或约束条件,从而条件是否满足也得使用一个阈值来控制,条件真值大于等于该阈值时算满足,否则算不满足。
模糊语义网络
~
C是一个矩阵,代表结点之间的语义联系,当中的元素也是介于[0,1]之间的模糊度
模糊过程通常用来描述不精确(即模糊)的“过程”性知识。
一个模糊过程通常是一段模糊程序,包括三类基本可执行语句:
完成模糊动作的语句,完成模糊判断从而产生两个或两个以上分支的语句,完成模糊循环的语句。
不同在于,普通知识表示方法只能表示具体而精确的知识,而模糊知识表示方法可以表示模糊的不确定的知识,表示的范围更加广泛。
5模糊控制的基本思想是什么?
模糊控制为什么能够得到广泛应用?
有些复杂的系统过程难于运用现代控制理论来解决他们的控制问题。
但是它们由人来控制却往往工作得很好一般来说,操作人员的控制方式建立在直觉与经验之上,这种方法可看成一组探索式的判定规则。
广泛应用的原因:
算法简单,实现也简单,通过工作经验或者实验建表,最后查表的方法来实现控制,实际控制效果很好地接近人类控制的效果。
6去模糊机制的一般形式说明了什么问题?
去模糊机制一般形式:
模糊结果实际上就是有限论域Z中元素zi的加权和,而权系数wi则是模糊向量C的某种非线性函数。
由去模糊策略的一般形式,为了得到合理有效的去模糊结果,我们知道关键在于选取合适的权系数。
这启发我们可以采取某种优化手段,如人工神经网络自组织自学习技术来解决权系数获取的问题。
换而言之,去模糊策略的一般形式的启迪下,可以开阔思路,建立新的有效的去模糊方法,从而得到更理想的去模糊结果。
7模糊一致矩阵的特点与重要性质有哪些?
8模糊识别原则有哪些?
最大隶属原则
择近原则
最大关联隶属原则
第四章
1人工神经网络的学习准则有哪些?
其基本原理是什么?
误差修正性学习:
根据系统的期望输出和实际输出之间的误差作为连接权调整的参考,最后减小这种误差。
随机型学习:
结合随机过程、概率和能量的概率来调整网络的连接权,从而使网络的能量达到最小。
赫布型学习:
如果两个神经元同时兴奋,则它们之间的突出联系应该得以加强。
竞争性学习:
一种无教师学习。
最简单的学习形式是“胜者为王”。
2与传统人工智能(即符号智能)相比,人工神经网络有哪些特点?
大规模并行分布信息处理
分布式信息存储,信息存储体现在神经元互连的分布上,并以并行分布式处理
高度的鲁棒性和容错性,善于联想、概括、类比和推广,任何局部损伤不会影响整体结果
很强的自学习能力,系统可在学习过程中不断完善,具有创新特点
具有集体运算能力
3BP算法有哪些缺陷?
如何克服?
缺陷:
(1)全局代价函数(误差平方和)存在多个极小点,梯度下降不能保证求出全局最小
(2)只要学习率充分小,BP算法可实现与真正梯度下降非常近似的速度下降,然而,小的学习率需要较长的收敛时间,即收敛速度慢
(3)对于训练好的网络,如果要增加训练样本,此时网络的训练就要从头开始(前功尽废),即缺少记忆能力。
克服:
(1)给梯度加上惯性量(前次连接权的变化量),避免学习过程的震荡,使学习率可取较大的值,从而加速收敛
(2)分段训练,即训练初期用梯度法,训练后期用牛顿法精确地调整连接权
(3)连续几次重复使用梯度的方法实现有效的学习
(4)用双曲正切函数作为节点的激活函数(代替S型函数),改善学习速度
(5)适当选取初始权矩阵的值以及合适的隐节点数,可以加速收敛
4如何用BP网络解决分类问题?
(这个问题的答案我没有在PPT里面找到。
下面是从数据挖掘的课本翻译的原话,仅做参考。
)
BP网络通过迭代地处理训练集的数据并对比每一次网络的预测的类标签和实际的类标签来学习的。
对于训练集的每一条数据,BP网络里面的权值都会作一定修改,以实现网络的预测值和实际值之间的均方误差最小化。
这些修改都是反向进行的,也就是先从最后输出层开始,反向逐层修改直到第一个隐藏层。
因此,这个网络叫做Backpropagation网络。
网络的权重最终都会收敛,学习的过程最终还是会结束的。
这是BP网络的分类学习过程。
5如何Hopfield网络解决组合优化问题?
用HNN(HopfieldNeuralNetwork)解决最优化问题,就是要根据问题的性质将目标函数与能量函数联系在一起,把问题的变量对应于网络单元的状态,通过网络运行时固有的能量函数最小化,从而得到问题的最优解。
6设计一个解决某一问题(自定)的模糊神经网络系统
(这个题目应该不会考吧……)
第五章
1什么是基于范例的推理?
基于范例的推理通过联想(或类比),将解决过去问题的经验(解答、解答过程)用于解决当前问题。
2基于范例的推理的关键技术是什么?
范例检索、解答改编、解答辩证。
3基于范例的推理与基于规则的推理如何实现优势互补?
规则和范例可以视为经验知识的两种重要表示形式。
规则便于描述通用的行为准则,从而用来定义领域理论;而范例则描述已经解决的特别问题,可以包括任何例外情况和特别处理的描述。
规则和范例表示的知识具有较好的互补性。
以规则表示泛化(通用)的领域理论,可以免去建立大型范例库。
而范例库的存在又使理论的建立不会陷入考虑各种例外情况和特别处理的困境。
所以,领域理论不必是完备的,从而可以免除知识获取瓶颈问题。
此外,随着范例库中范例的累积,也可以归纳出泛化的概念——行为准则。
第六章
1基于时间和空间的推理的主要特征是什么?
时间推理与各种物理过程或关于信息处理的工作流程是紧密相关的。
而空间推理从另一个方面拓宽人推理能力的广度。
2时态算子有哪些常用性质?
时态算子:
表示任意语句A与过去或将来时态关联的真值。
F(A):
A在某个将来时间为真。
P(A):
A在某个过去时间为真。
G(A):
A在所有将来时间为真。
H(A):
A在所有过去时间为真。
(注:
第一条只是蕴含不是等价,因为未来时间可能一阵子A是真一阵子B是真,所以不能反推。
最后两条,因为A→B等价于非A∨B)
3基于四叉树的最近优先搜索有什么特点?
在二维空间,将平面有规则地递归分解为同等大小的四个区域,直到满足不再分割的准则(即一区域中容纳的对象不超过规定的数量)为止。
从而克服了对象分布不均匀情况下处理稀疏和群集的矛盾,改进了时间和空间的权衡关系。
四叉树结点的路径地址是变长的,长度随节点在树中的深度而增加。
第七章
1试述机器学习的基本模型?
机器学习就是从给定的函数集f(x,w)(w是参数向量),选择出能够最好地逼近训练器相应的函数。
根据n个独立同分布的观测样本,(x1,y1),(x2,y2),……,(xn,yn)
在一组函数{f(x,w)}中求出一个最优函数f(x,w0)对训练器的响应进行估计,使期望风险最小
2什么是经验风险最小化原则?
经验风险最小化原则ERM:
用对参数w求经验风险的最小值代替求期望风险的最小值。
3什么是结构风险最小化?
统计学习理论的策略,把函数集构造为一个函数子集序列,使各个子集按照VC维大小排列,在每个子集中寻找最小经验风险,在子集间折衷考虑经验风险和置信范围,取得实际风险的最小。
这种思想成为结构风险最小化,即SRM准则。
4什么是支持向量?
试述支持向量机的基本原理
过两类样本中离分类面最近的点且平行于最优分类面的超平面H1、H2上的训练样本叫做支持向量。
支持向量机的基本原理:
SVM是从线性可分情况下的最优分类面发展而来。
SVM考虑寻找一个满足分类要求的超平面,并且使训练集中的点距离分类面尽可能地远,也就是寻找一个分类面使它两侧的空白区域(margin)最大。
5什么是最优分类平面?
最优分类平面满足如下三个条件:
1)是分类平面
2)经验风险最小(即错分最小)
3)推广能力最大(空白最大,即训练集的点离分类面最远,等价于||w||2最小)
6SVM如何解决非线性分类问题?
非线性可分的数据样本在高维空间有可能转化为线性可分,可通过非线性变换将它转化为某个高维空间中的线性问题,在这个高维空间中寻找最优分类面。
7试比较支持向量机与人工神经网络
SVM的理论基础比NN更坚实,更像一门严谨的“科学”(三要素:
问题的表示、问题的解决、证明)
SVM是基于严格的数学推理,NN是强烈依赖于工程技巧
在推广能力上,SVM取决于“经验风险值”和“置信范围值”,NN则不能控制两者中的任何一个
另一方面,NN设计者可以用高超的工程技巧弥补了数学上的缺陷——设计特殊的结构,利用启发式算法,有时能得到出人意料的好结果。
第八章
1为什么说数据挖掘是多学科的交叉汇合?
数据挖掘汇合了数据库系统、机器学习、统计与数据分析方法、可视化、信息科学、数学规划、高性能计算等学科,因此是多学科的交叉汇合。
2数据挖掘的功能有哪些?
概念/类描述:
特征化和区分、关联分析、分类和预测、聚类分析、孤立点分析、演变分析、偏差分析
3列举数据挖掘的应用。
针对生物医学和DNA数据分析的数据挖掘
针对金融数据分析的数据挖掘
零售业中的数据挖掘
电信业中的数据挖掘
交通运输业中的数据挖掘
IT行业中的数据挖掘
4WEB挖掘有哪几类?
各类的特点是什么?
Web内容挖掘、Web结构挖掘、Web日志挖掘
Web内容挖掘是从文档内容或其描述中抽取知识的过程,一般用数据库技术、统计方法、机器学习和自然语言理解的处理方法,进行分类、聚类、模式发现等等。
Web结构挖掘研究的是Web文档的连接结构,揭示蕴含在这些文档结构中的有用模式,处理的数据是Web结构数据。
是从WWW的组织结构和链接关系中推导知识。
由于文档之间的互连,WWW能够提供除文档内容之外的有用信息。
利用这些信息,可以对页面进行排序,发现重要的页面。
一般用机器学习等方法,对页面权重计算、分类聚类或者模式发现。
Web日志挖掘是从Web的访问记录中(Web服务器的log日志)抽取感兴趣的模式,理解用户的行为,改进站点的结构,或为用户提供个性化的服务。
一般使用统计方法、机器学习的方法或者关联规则,进行商业决策或者Web站点重建的帮助。
5数据挖掘的十大算法有哪些?
C4.5
K-Means
SVM
Apriori
EM
PageRank
AdaBoost
kNN
NaiveBayes
CART