统计分析方法概述Word文档格式.docx

上传人:b****8 文档编号:22417016 上传时间:2023-02-04 格式:DOCX 页数:5 大小:20.53KB
下载 相关 举报
统计分析方法概述Word文档格式.docx_第1页
第1页 / 共5页
统计分析方法概述Word文档格式.docx_第2页
第2页 / 共5页
统计分析方法概述Word文档格式.docx_第3页
第3页 / 共5页
统计分析方法概述Word文档格式.docx_第4页
第4页 / 共5页
统计分析方法概述Word文档格式.docx_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

统计分析方法概述Word文档格式.docx

《统计分析方法概述Word文档格式.docx》由会员分享,可在线阅读,更多相关《统计分析方法概述Word文档格式.docx(5页珍藏版)》请在冰豆网上搜索。

统计分析方法概述Word文档格式.docx

样本是指从统计总体中抽取出来作为代表这一总体的部分单位组成的集合体。

样本有下列4个特点1、代表性样本代表总体的程度越高样本计算的抽样指标与总体指标的误差就越小2、客观性从总体中抽取样本时必须排除主观因素的影响保证样本的中选或不中选不受调查者或被调查者的主观影响3、随机性一个统计总体可以抽取不同的许多样本至于到底抽取样本是哪一个完全取决于样本的随机性4、排他性样本单位必须抽取自总体内部而不能抽取总体外部的单位二、统计数据收集方案统计数据收集方案也称为统计调查方案。

它是在收集统计数据之前制定出一个周密、完整的调查方案用以指导这个调查工作使调查得以顺利实施和完成的计划。

一个完整的统计数据收集方案通常包括以下积分方面的内容调查目的、调查对象和调查单位、调查项目和调查表、调查时间和期限、调查的组织工作等。

1、调查目的调查研究所要解决的问题它所回答的是“为什么调查”、“调查要解决什么样的问题”。

调查的目的应该尽可能规定得具体明确突出中心它是确定调查对象、调查项目等的基础。

2、调查对象和调查单位调查对象是根据调查目的确定的调查研究的总体和调查范围。

调查单位是构成调查对象中的每一个单位它是调查项目和调查内容的承担者和载体也是我们收集数据、分析数据的基本单位。

3、调查项目调查项目要解决的问题是“调查什么”也就是调查的具体内容。

通俗地说调查项目就是一份在调查过程中应该获得答案的各种问题的清单。

4、调查时间和时限调查时间是调查资料所属的时间即所谓的客观时间。

如果所要调查的是时期现象调查时间就是资料所反映的起止时间如果所调查的对象是时点现象调查时间就是规定的统一标准时间。

调查时限是进行调查工作的期限包括搜集资料和保送资料的整个工作所需要的时间即所谓的主观时间。

5、调查的组织工作调查的工作组织计划使调查工作在业务组织上、措施上得到有力的保证。

组织工作计划包括明确调查机构、调查地点和选择调查方法等问题。

一种重要的调查方法问卷调查是以书面提出问题的方式搜集资料的一种研究方法即调查者就调查项目编制成表式分发或邮寄给有关人员请示填写答案然后回收整理、统计和研究。

它是根据调查目的将所需调查的同题具体化使调查者能顺利地获取必要的信息资料并便于统计分析。

问卷是用来收集调查数据的一种工具问卷设计是其中的关键问卷设计的过程一般包括1、确定所需信息。

调查者必须在问卷设计之前就要把握所有达到研究目的和验证研究假设所需要的信息并决定所有用于分析使用这些信息的方法比如频率分布、统计检验等并按这些分析方法所要求的形式来收集资料把握信息。

2、确定问卷的类型。

根据市场调查中使用问卷方法的不同可将问卷分成自填式问卷和访问式问卷根据问卷发放方式不同可将问卷分为送发式问卷、邮寄式问卷、报刊式问卷、人员访问式问卷、电话访问式问卷和网上访问式问卷六种。

在确定问卷类型时先必须综合考虑这些制约因素调研费用、时效性要求、被调查对象和调查内容。

3、确定问卷内容。

确定问题的内容最好与被调查对象联系起来4、确定问题类型问题的类型归纳起来分为四种自由问答题、两项选择题、多项选择题和顺位式问答题其中后三类均可以称为封闭式问题。

5、确定问题的措辞为保证问卷的质量一般要遵循以下几条法则1问题的陈述应尽量简洁2避免提带有双重或多重含义的问题3最好不用反义疑问句避免否定句4注意避免问题的从众效应和权威效应6、确定问题的顺序一般而言开头部分安排比较容易的问题中间部分安排一些核心问题结尾部分安排一些背景资料还有就是注意问题的逻辑顺序7、问卷的排版和布局问卷排版布局总的要求是整齐、美观便于阅读、作答和统计。

8、问卷的测试问卷初稿设计工作基本完成之后不要急于投入使用特别是对于一些规模的问卷调查最好的办法是先组织问卷的测试如果发现问题再及时修改。

9、问卷的定稿当问卷测试工作完成确定没有必要再进一步修改后可以考虑定稿问卷定稿后就可以交付打印。

正式投入使用10、问卷的评价问卷的评价实际上是对问卷的设计质量进行一次总体性评估三、常用统计分析方法统计分析是帮助人们提高控制数字的能力透过这些庞杂的数字和复杂的关系揭示事物的本质、特点和发展变化的内在规律的一种有利的工具。

常用统计分析方法有1、方差分析方差分析是20世纪20年代发展起来的一种统计分析方法目前它在心理学、生物学、医学等试验数据分析中被广泛使用。

从形式上看它是检验多个总体均值是否相等的一种统计分析方法从内容上看它却是研究多个变量之间关系的一种实用、有效的统计分析方法。

2、相关与回归分析在自然界和社会现象中任何现象都不是孤立的而是普遍联系和相互制约的。

现象间的普遍联系、相互制约往往表现为相互依存的关系这种依存关系通常由函数关系和相关关系两种类型。

函数是指现象之间是一种严格的确定性的依存关系表现为某一现象发生变化另一现象也随之发生变化而且有确定的值与之对应。

这种关系可通过精确的数学表达式来反映相关关系是指客观现象之间确实存在的但数量上不是严格对应的依存关系。

函数关系往往通过相关关系表现出来而当对现象之间的内在联系和规律性了解更加清楚的时候相关关系又可能转化为函数关系。

回归分析通过一个变量或一些变量的变化解释另一变量的变化。

其主要内容和步骤是首先根据理论和对问题的分析判断将变量分为自变量和因变量其次设法找出合适的数学方程式即回归模型描述变量间的关系由于涉及到变量具有不确定性接着还要对回归模型进行统计检验统计检验过后最后是利用回归模型根据自变量去估计、预测因变量。

3、时间数列分析时间数列亦称为动态数列或时间序列就是把反映某一现象的同一指标在不同时间上的取值按时间的先后顺序排列所形成的一个动态数列。

它反映社会经济现象发展变化的过程和特点是研究现象发展变化的趋势和规律以及对未来状态进行科学预测的重要依据。

时间数列分析最常用的方法有两种一是指标分析法二是构成因素分析法。

所谓指标分析法是指通过计算一系列时间数列分析指标包括发展水平、平均发展水平、增减量、平均增减量、发展速度、平均发展速度、增减速度和平均增减速度等来揭示现象的发展状况和发展变化程度的分析方法。

构成因素分析法是将时间数列看作是由长期趋势、季节变动、循环变动和不规则变动集中因素所构成的通过对这些因素的分解分析揭示现象随时间变化而演变的规律并在揭示这些规律的基础上假定事物今后的发展趋势遵循这些规律从而对事物的未来发展做出预测。

四、常用统计软件1、SPSSstatisticalpackageforthesocialscience社会科学统计软件包SPSSforWindows是一个组合式软件包它集数据整理、分析功能于一身基本功能包括数据管理、统计分析、图表分析、输出管理等等。

SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析和多重响应等几大类它的分析结果清晰、直观、易学易用而且可以直接读取Excel及DBF数据文件现已推广到多种操作系统的计算机上利用SPSS进行统计处理的基本过程如下1数据的录入将数据以电子表格的方式输入到SPSS中也可以从其他可转换的数据文件中读出数据。

数据录入的工作分两个步骤一是定义变量二是录入变量值。

2数据的预分析在原始数据录入完成后要对数据进行必要的预分析如数据分组、排序、分布图、平均数、标准差的描述等以掌握数据的基本特点和基本情况保证后续工作的有效性也为确定应采用的统计检验方法提供依据。

3统计分析按研究的要求和数据的情况确定统计分析方法然后对数据进行统计分析。

4统计结果可视化在统计过程进行完后SPSS会自动生成一系列数据表其中包含了统计处理产生的整套数据。

为了能更形象地呈现数据需要利用SPSS提供的图形生成工具将所得数据可视化。

如前所述SPSS提供了许多图形来进行数据的可视化处理使用时可根据数据的特点和研究的需求来进行选择。

5保存和导出分析结果数据结果生成完之后则可将它以SPSS自带的数据格式进行存贮同时也可利用SPSS的输出功能以常见的数据格式进行输出以供其他系统使用。

2、SASstatisticalanalysissystem统计分析系统SAS是美国SAS软件研究院所研制的一套大型集成应用软件系统具有完备的数据存取、数据管理、数据分析和数据展现功能。

SAS系统的特点1使用灵活方便数据处理功能齐全2SAS语言是编程能力强且简单易学的非过程语言3SAS系统把数据处理与统计分析融为一体4适用性强应用面广最简单的区分SPSS主要是菜单式操作所有分析直接利用软件自带模块进行你需要做的就是点击鼠标选菜单。

傻瓜式操作不需要了解一种分析方法的始末就能做分析还可以做不错的图表。

SAS需要从头到尾自己写程序。

可以实现很多自己需要的算法。

由于是非过程语言第四代语言近乎自然英语的非过程语言表达其特点是用户不必告诉SAS“怎么做”只需告诉它要“做什么”就行了例子用统计软件进行主成分分析主成分分析是利用降维的思想在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。

通常把转化后的综合指标称之为主成分其中每个主成分都是原始变量的线性组合且各个主成分之间互不相关这就使得主成分比原始变量具有某些更优越的性能。

这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息从而更容易抓住主要矛盾揭示事物内部变量之间的规律性同时使问题得到简化提高分析效率。

实际问题中遇到指标较多且各指标相关关系较大时人们常考虑应用主成分分析的方法主成分分析法的一般步骤第一步首先需要判断待分析的原始变量是否适合做主成分分析同样的需要判定指标之间的相关性可以使用SPSS中的“CorrelationMatrix相关系数矩阵”判定。

第二步规范指标值如果指标的单位不同则需要消除指标间不同量纲的影响即对原始数据进行标准化处理将原始数据处理成均值为0、方差为1的归一化分析数据。

使用SPSS时因子分析和主成分分析中的标准化处理都是自动进行的第三步确定主成分如果数据是标准化后的则从相关系数矩阵出发求得特征值与对应的特征向量而对同度量或是取值范围在同量级而不需要标准化的数据则直接从协方差矩阵求特征值与特征向量如果使用SPSS则其会自动对指标数据进行标准化处理因此通常用的是相关系数矩阵。

主成分个数的确定有两个标准1累计贡献率即前k个主成分保留原观测变量信息的比重达到85以上这通常可以保证样本排序的稳定。

每个主成分yk的贡献率等于它的特征值λk除以原始指标个数p累计贡献率等于各主成分贡献率顺序相加2特征值在特征值的均值以上由于由标准化数据的相关矩阵求得的特征值均值1因此只要取特征值1的前k个主成分即可。

确定主成分个数m用SPSS软件中表“TotalVarianceExplained总方差解释”的主成分方差累计贡献率≥85、结合表“ComponentMatrix初始因子载荷阵”中变量不出现丢失确定主成分个数m。

第四步建立主成分方程可以利用SPSS建立“ComponentMatrix”载荷矩阵它给出了标准化原始变量用公因子线性表示的近似表达式然后将第i列向量除以第i个特征根的开根后就得到第i个主成分的变量系数。

得到每个主成分系数后就可以写出主成分表达式。

在因子分析中建立的是“RotatedComponentMatrix”旋转后因子载荷阵它直接给出了因子分析中需要的因子表达式给了在因子分出了第五步解释各主成分的意义根据载荷矩阵中各列系数的绝对值大的变量对该列对应的主成分命名。

主成分分析的重点放在从观测变量到主成分的变换上因子分析重点放在从基本因子到观测变量的变换上主成分变换是可逆的因子分析则不要求。

因子分析有回归过程用因子得分函数判断主成分分析无回归过程当特殊因子的变差为0时主成分分析和因子分析是完全等价的。

主成分分析和因子分析在应用上的侧重不同通常因子分析侧重成因清晰性的综合评价要求对影响因子的命名较清晰主成分分析侧重信息贡献影响力综合评价对主成分命名的清晰度较低。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1