数据分析答案梅长林.docx
《数据分析答案梅长林.docx》由会员分享,可在线阅读,更多相关《数据分析答案梅长林.docx(12页珍藏版)》请在冰豆网上搜索。
数据分析答案梅长林
数据分析答案梅长林
【篇一:
1.1一维数据数字特征】
013学年第一学期
主讲教师李晓燕
课程名称数据分析
课程类别专业限选课
学时及学分68;4
授课班级信息101102
使用教材《数据分析方法》
系(院.部)数理系
教研室(实验室)信息和计算科学教研室
数据分析
总学时:
68理论38.上机28适用专业:
信息和计算科学内容:
?
sas软件介绍3学时?
数据的描述性分析10学时?
线性回归分析13学时?
方差分析10学时?
主成分分析和典型相关分析8学时
?
判别分析8学时?
聚类分析8学时?
学生报告8学时教材:
《数据分析方法》,梅长林、范金城编,高等教育出版社.2006.参考资料:
《实用统计方法》,梅长林编,科学出版社;
《使用多元统计分析》,高惠璇编,北京大学出版社,2005;《使用统计方法和sas系统》,高惠璇编,北京大学出版社,2001;《多元统计分析》(二版),何晓群编,中国人民大学出版社,2008;《使用回归分析》(二版),何晓群编,中国人民大学出版社,2007;《统计建模和r软件》,薛毅编著,清华大学出版社,2007.考核:
期末成绩(闭卷测试+上机测试):
70%。
平时成绩(平时作业+考勤+大报告):
30%。
课程作业
(1)作业题目在网络教学平台公布,按格式要求,以电子版方式通过平台提交。
(2)大报告:
2-3人一组,每组一个选题,成员按相同的成绩计分。
收集数据,撰写小论文,做ppt讲解。
每组讲10-20分钟,提问环节。
同学打分。
课时授课计划
课次序号:
01
一、课题:
1.1一维数据的数字特征及相关系数
二、课型:
新授课
三、目的要求:
1.掌握数据的数字特征(均值、方差等);
2.掌握几种描述性分析的sas过程和作图过程计算这些数字特征及进行描述性分析.
四、教学重点:
均值、方差等数字特征.
教学难点:
基本概念的理解.
五、教学方法及手段:
传统教学和上机实验相结合.
六、参考资料:
1.《实用统计方法》,梅长林,周家良编,科学出版社;
2.《sas统计分析使用》,董大钧主编,电子工业出版社.
七、作业:
1.1
八、授课记录:
九、授课效果分析:
0绪论
0.1课程内涵
数据分析(即多元统计学statistics):
是以数据为依据,以统计方法为理论、计算机及软为工具,研究多变量问题、挖掘数据的统计规律的学科.通过收集数据、整理数据、分析数据和由数据得出结论的一组概念、原则和方法。
例如下表给出某年级随机抽取的7名学生5门课程期末测试的成绩:
序号政治语文外语数学物理1999493100100
29988969997
3100988196100
49388889996
510091729678
69078827596
77573889789
如何根据抽样数据研究该年级学生的学习成绩?
用各科成绩总和作为综合指标,比较学生成绩的好坏;
根据各科成绩的近似程度对学生进行分类(成绩好的和成绩差的,文科成绩好的和理科成绩好的);研究各科成绩之间的关系(物理和数学成绩的关系,文科成绩和理科成绩的关系)等.
综上所述,多元统计分析是以各变量的n次观测数据所组成的数据矩阵
?
x11?
x21x?
?
?
?
?
?
xn1?
x12x22?
xn2?
x1p?
?
x2p?
?
?
?
?
?
xnp?
?
为依据的,根据实际问题的需要,给出种种方法.
0.2课程体系及使用
?
研究内容和方法:
英统计学家肯德尔(kendall)概括多元统计分析研究内容和方法为以下几方面:
1.多元统计的理论基础
包括多维随机向量及多维正态随机向量及由此定义的各种多元统计量,推导其分布并研究性质、抽样分布理论——概率统计、数据描述性分析.
2.多元数据的统计推断
3.变量间的相互关系
(1)相互依赖关系:
分析一个或几个变量的变化是否依赖于另一些变量的变化,建立变量间的定量关系式,并用于预测或控制——回归分析.
(2)变量间的相互关系:
分析两组变量间的相互关系——典型相关分析.飓风和蝴蝶.
4.简化数据结构(降维问题)
通过变换将相关的变量变为不相关的;高维数据投影到低维空间,简化问题又损失信息不太多.如主成分分析、因子分析、相关分析、对应分析等方法.
5.分类和判别(归类问题)
将考察的变量按相似程度分类——聚类分析、判别分析.
?
多元统计分析的使用
由于大部分学科都涉及数据分析工作,因此统计学几乎可以和任何一个学科结合起来。
有些学科已经有其特有的方法和特点;如生物统计(biostatistics)、经济计量学(econometrics)计量地理、及热门的生物信息(bioinformation)和数据挖掘(datamining)的方法主体都是统计。
1.教育学
学生成绩分析和预测.如高考成绩和高中成绩的关系,以此预测高考成绩;给出考生成绩次序排队的最佳方案;利用高中成绩进行分类(按文理科、总成绩).
2.医学
根据检查数据或病例资料建立诊断准则,诊断病例.
3.气象学
根据各地气象站的气象指标资料(降雨量、气温、气压、湿度、风速、风向等)做统计分析,进行天气预报等.
4.环境科学
分析污染气体浓度,布局监测点,污染治理.
5.地质学
处理地质观测数据,进行矿产预测、矿产构造解释、部署勘探工程等.
6.考古学
对发现的文物通过测得各类数据,判断出现的年代、种族等.
7.服装工业
抽样调查人体几十个部位的尺寸数据,进行统计分析,决定服装各型号及比例.使生产地成衣适应大多数顾客的需要.
8.经济学
宏观经济、微观经济的使用.
9.农业
农业灌区分类,农机分类等.
10.社会科学
通过调查研究青少年犯罪各因素间的相互关系及变化规律,进行预防.
11.文学
如复旦大学统计系李贤平使用聚类、主成分、相关分析,选定10个和情节无关的虚词为变量,统计每一回虚词出现的频数,进行统计分析,证明前80回为曹雪芹所写,而后40回是他人所写.
12.其他
体育科研、军事科学、生物学、心理学、生态学、保险、火警预报、地震预报、中医阴阳学说研究等.
【篇二:
1.1一维数据数字特征】
012学年第一学期
主讲教师李晓燕课程名称数据分析课程类别专业限选课学时及学分68;4授课班级信息091
使用教材《数据分析方法》系(院.部)数理系
教研室(实验室)信息和计算科学教研室
数据分析
总学时:
68适用专业:
信息和计算科学内容:
1.数据的描述性分析10学时2.线性回归分析13学时3.方差分析10学时4.主成分分析和典型相关分析8学时5.判别分析8学时6.聚类分析8学时7.bayes统计分析8学时8.sas软件介绍3学时教材:
《数据分析方法》,梅长林、范金城编,高等教育出版社.参考资料:
《实用统计方法》,梅长林、周家良编,科学出版社;
《sas统计分析使用》,董大钧编,电子工业出版社;《使用多元统计分析》,高惠璇编,北京大学出版社.
作业:
每周一次,以上机操作为主,通过网络平台布置和提交,批1/2.
课时授课计划
课次序号:
01
一、课题:
1.1一维数据的数字特征及相关系数二、课型:
新授课
三、目的要求:
1.掌握数据的数字特征(均值、方差等);
2.掌握几种描述性分析的sas过程和作图过程计算这些数字特征及进行描述性分析.
四、教学重点:
均值、方差等数字特征.
教学难点:
基本概念的理解.
五、教学方法及手段:
传统教学和上机实验相结合.
六、参考资料:
1.《实用统计方法》,梅长林,周家良编,科学出版社;
2.《sas统计分析使用》,董大钧主编,电子工业出版社.
七、作业:
1.1
八、授课记录:
九、授课效果分析:
0绪论
一.数据分析(也即多元统计分析)研究的内容和方法
数据分析:
是以数据为依据,以统计方法为理论、计算机及软为工具,研究多变量问题、挖掘数据的统计规律的学科.
例如下表给出某年级随机抽取的7名学生5门课程期末测试的成绩:
序号政治语文外语数学物理1999493100100299889699973100988196100493888899965100917296786907882759677573889789如何根据抽样数据研究该年级学生的学习成绩?
用各科成绩总和作为综合指标,比较学生成绩的好坏;根据各科成绩的近似程度对学生进行分类(成绩好的和成绩差的,文科成绩好的和理科成绩好的);研究各科成绩之间的关系(物理和数学成绩的关系,文科成绩和理科成绩的关系)等.
综上所述,多元统计分析是以各变量的n次观测数据所组成的数据矩阵
?
x11?
x21
x?
?
?
?
?
?
?
xn1
x12x22?
xn2
?
x1p?
?
x2p?
?
?
?
?
?
xnp?
?
为依据的,根据实际问题的需要,给出种种方法.
英统计学家肯德尔(kendall)概括多元统计分析研究内容和方法为以下几方面:
1.多元统计的理论基础
包括多维随机向量及多维正态随机向量及由此定义的各种多元统计量,推导其分布
并研究性质、抽样分布理论——概率统计、数据描述性分析.
2.多元数据的统计推断
参数估计和假设检验问题.特别是多元正态分布的均值向量及协方差阵的估计和假设检验等问题——数据描述性分析、方差分析、bayses统计推断.
3.变量间的相互关系
(1)相互依赖关系:
分析一个或几个变量的变化是否依赖于另一些变量的变化,建立变量间的定量关系式,并用于预测或控制——回归分析.
(2)变量间的相互关系:
分析两组变量间的相互关系——典型相关分析.飓风和蝴蝶.
4.简化数据结构(降维问题)
通过变换将相关的变量变为不相关的;高维数据投影到低维空间,简化问题又损失信息不太多.如主成分分析、因子分析、相关分析、对应分析等方法.
5.分类和判别(归类问题)
将考察的变量按相似程度分类——聚类分析、判别分析.
多元统计分析的起源:
20世纪初,以1928年威沙特(wishart)发表的论文《多元正态总体样本协方差矩阵的精确分布》为开端,之后费希尔(fisher)、霍特林(hotelling)、罗伊(roy)、许宝騄等做了一系列奠基性的工作.20世纪50年代中期,电子计算机的出现和发展,使得多元统计分析在地质、气象、医学、社会学等方面得到广泛的使用.
二.多元统计分析的使用
1.教育学
学生成绩分析和预测.如高考成绩和高中成绩的关系,以此预测高考成绩;给出考生成绩次序排队的最佳方案;利用高中成绩进行分类(按文理科、总成绩).
2.医学
根据检查数据或病例资料建立诊断准则,诊断病例.
3.气象学
根据各地气象站的气象指标资料(降雨量、气温、气压、湿度、风速、风向等)做统计分析,进行天气预报等.
4.环境科学
分析污染气体浓度,布局监测点,污染治理.
5.地质学
处理地质观测数据,进行矿产预测、矿产构造解释、部署勘探工程等.
6.考古学
对发现的文物通过测得各类数据,判断出现的年代、种族等.
7.服装工业
抽样调查人体几十个部位的尺寸数据,进行统计分析,决定服装各型号及比例.使生产地成衣适应大多数顾客的需要.
8.经济学
宏观经济、微观经济的使用.
9.农业
农业灌区分类,农机分类等.
10.社会科学
通过调查研究青少年犯罪各因素间的相互关系及变化规律,进行预防.
11.文学
如复旦大学统计系李贤平使用聚类、主成分、相关分析,选定10个和情节无关的虚词为变量,统计每一回虚词出现的频数,进行统计分析,证明前80回为曹雪芹所写,而后40回是他人所写.
12.其他
体育科研、军事科学、生物学、心理学、生态学、保险、火警预报、地震预报、中医阴阳学说研究等.
【篇三:
《现代多元数据分析入门》全英语课程教学大纲--司鹏超】
08039050英文名称:
accesstomultivariatedataanalysis
开课单位:
材料加工任课教师:
司鹏超副教授开课学院:
材料科学和工程学院开课时间:
第二学期学时:
32学分:
2
面向专业:
材料学、材料加工工程适用对象:
博士生+硕士生教学方式:
本课程将采用全英语教学方式,并使用国际上公认的优秀软件unscrambler(camo,norway)进行多媒体教学。
同时,在课程设计上,将采用国际上较为流行的教学模式——现场教学配合课后分组作业,并结合我们现有的教学平台,鼓励和指导学生结合其专业背景进行大胆的实践,从而将所学的多组元分析方法实际使用到他们正在从事的科研项目中,最终达到学以致用的目的。
教学要求:
本课程学完后,要求能掌握多元数据分析的基础知识和分析方法,顺利的使用unscrambler软件正确的处理科研项目中的数据。
同时,通过接受全英语教学的训练,全面提高自身的英语能力,特别是专业英语的能力。
课程主要内容:
ioverviewformultivariatedataanalysis(6hrs)
1overview
2.anintroductionofmultivariatemethods
3.areviewofstatisticalconceptsandmethods
iipreparingforamvanalysis(6hrs)
4.examiningyourdata
5.principalcomponentsanalysis
6.factoranalysis
iiidependencetechniques(12hrs)
7.multipleregressionanalysis
8.principlecomponentregression(pcr)
9.partialleastsquaresregression(pls)
ivintroductionfordataanalysissoftware(8hrs)
10.briefforstatisticsoftware
11.introductionforunstrambler
12.experimentalwork
课程教材:
1.《多元数据分析(英文版)》analyzingmultivariatedatajameslattin,
douglascarroll,paulgreen机械工业出版社;2003;第1版
参考书目:
1.《多元统计分析和使用》余锦华、杨维权中山大学出版社;2005年;第1版
2.《数据分析》(第二版)范金城、梅长林科学出版社;2010年;第2版
3.《多元数据分析(英文版)(第7版)》multivariatedataanalysis(7thedition)josephf.hair,williamc.black(author),barryj.babin,rolphe.anderson机械工业出版社;第1版
4.multivariatedataanalysis-inpracticekimh.esbensen(author),dominiqueguyot(editor),frankwestad(editor),larsp.houm?
ller(editor)camoprocessas(5thedition)