数学建模教材31第三十一章支持向量机.docx
《数学建模教材31第三十一章支持向量机.docx》由会员分享,可在线阅读,更多相关《数学建模教材31第三十一章支持向量机.docx(15页珍藏版)》请在冰豆网上搜索。
数学建模教材31第三十一章支持向量机
支持向量机是数据挖掘中的一项新技术,是借助于最优化方法来解决机器学习问
题的新工具,最初由V.Vapnik等人提出,近几年来在其理论研究和算法实现等方面都取得了很大的进展,开始成为克服“维数灾难”和过学习等困难的强有力的手段,它的理论基础和实现途径的基本框架都已形成。
证明:
①必要性
-762-
-763-
-764-
-768-
-769-
-770-
-771-
§3乳腺癌的诊断
3.1问题的提出乳腺肿瘤通过穿刺采样进行分析可以确定其为良性的或为恶性的。
医学研究发现
乳腺肿瘤病灶组织的细胞核显微图像的10个量化特征:
细胞核直径、质地、周长、面积、光滑度、紧密度、凹陷度、凹陷点数、对称度、断裂度与该肿瘤的性质有密切的关系。
现试图根据已获得的实验数据建立起一种诊断乳腺肿瘤是良性还是恶性的方法。
数据来自已确诊的500个病例,每个病例的一组数据包括采样组织中各细胞核的这10个
特征量的平均值、标准差和最坏值共30个数据,并将这种方法用于另外69名已做穿刺采样分析的患者。
这个问题实际上属于模式识别问题。
什么是模式呢?
广义地说,在自然界中可以观察的事物,如果我们能够区别它们是否相同或是否相似,都可以称之为模式。
人们为
了掌握客观事物,按事物相似的程度组成类别。
模式识别的作用和目的就在于面对某一具体事物时将其正确地归入某一类别。
模式识别的方法很多,如数理统计方法、聚类分析方法等。
3.2支持向量机的分类模型
-773-
-774-
-775-
模型2的Matlab计算程序如下:
functionsvm1clc,clearglobalN
loadcancerdata.txt;can=cancerdata;
can(:
1)=[];%删除第一列病例号
gdb=find(can(:
1)==1);%读出良性肿瘤的序号n1=length(gdb);%计算良性肿瘤样本点的个数bdb=find(can(:
1)==-1);%读出恶性肿瘤的序号n2=length(bdb);%计算恶性肿瘤样本点的个数gd=can(gdb,2:
end);%提出良性肿瘤的数据
-777-
模型2和模型3的Matlab程序计算时间很长,必须寻找一些更好的算法。
习题三十一
1.蠓虫分类问题:
生物学家试图对两种蠓虫(Af与Apf)进行鉴别,依据的资料是触角和翅膀的长度,已经测得了9支Af和6支Apf的数据如下:
Af:
(1.24,1.27),(1.36,1.74),(1.38,1.64),(1.38,1.82),(1.38,1.90),(1.40,1.70),(1.48,1.82),(1.54,1.82),(1.56,2.08)
Apf:
(1.14,1.82),(1.18,1.96),(1.20,1.86),(1.26,2.00),(1.28,2.00),(1.30,1.96)
-778-
-779-