管理定量分析整理Word下载.docx
《管理定量分析整理Word下载.docx》由会员分享,可在线阅读,更多相关《管理定量分析整理Word下载.docx(19页珍藏版)》请在冰豆网上搜索。
典型调查:
是从众多的调查研究对象中,有意识的选择若干个具有代表性的典型单位进行深入、周密系统的调查研究。
典型调查的作用:
a、在特定的条件下用于对数据的质量检查
b、了解与数字相关的生动具体情况
随机抽样调查:
根据调查的目的,从研究对象的总体中抽取一部分单位作为样本进行调查,据此推断有关总体的数字特征。
调查误差
误差的类型:
1)工作误差——有调查工作本身造成的误差
2)代表性误差——有调查的“样本”推断“全体”而引入的误差
调查步骤:
(以问卷调查为例)
1、确定问题:
明确调查的主题——围绕什么中心搜集资料
2、列出调查大纲、细化主题(设计问卷)
3、确定取样数量、范围、被调查对象的条件选择被调查对象的原则
4、有指导地发放、填写问卷
5、回收问卷
6、初步分析整理问卷,在整理数据之前对资料的有效性进行初步分析
7、资料归类,初步数据整理
8、清点样本总数,输入设计的计算机表格
用列表法将所搜集到得资料分类整理,常用的有:
定类法:
按分类登记如营业税,个人所得税等
定序法:
同类项目下按照一定的数量顺序登记如按年龄登记相应的人数
定距法:
按一定的距离变化登记观察值,一般以公认的标准为基础,对变量属性间实际意义的标准间距作出表达,结果可以进行加减运算(工资水平,分段统计年龄等)
定比法:
按一定的比例登记观察值例按不同“市盈率”,登记该季度相应的股票市值
总体与样本
总体:
在统计分析中,把被调查的对象全体称为总体
样本:
在总体数量非常大的时候,从中抽取某些个体进行调查分析,这些个体的集合称为样本。
随机抽样的类型(选什么方法,用该方法该怎么做)
1)简单随机抽样:
将总体中所有对象编上不重复的号码之后,经由随机数进行抽样
2)机械抽样:
在时间或空间范围内等距离选取样本
3)类型抽样:
在抽样前先把总体中的个体按需要的类型分类,大体按照各类元素数量在总体中所占的比例分配在该类的抽样数,按随机抽样原则在每一类对象中抽样
4)整群抽样:
把整体分为许多组,然后随机选取一组,作为调查研究的对象
例某局下属50个单位,按照职工人数多少,可以分为5档。
要求:
抽选10个单位调查职工文化水平,给出抽样水平简单随机抽样、类型抽样
抽取500个职工作为代表,了解工龄状况,给出抽样原则简单随机抽样、机械抽样、类型抽样
最小型的单位类型E中,选取100人就子女就读情况进行调查,给出每一个单位都有样本条件下的随机抽样原则简单随机抽样、机械抽样、类型抽样
抽样误差:
对同一个总体抽样,各次抽样的统计量并不相同、某个样本的统计量和总体参数之间的差异,称为抽样误差。
中心极限定理
1.考察例子中的总体频率分布图,显然呈现非对称分布
2.考察平均抽样分布图,可以看出,平均抽样分布基本对称。
当总体容量N很大时,其容量为n的样本平均数分布柱状形图顶端连线接近正态分布曲线,样本容量越大,这种趋势越明显
中心极限定理——无论总体如何分布,随着样本容量的增加,平均数的抽样分布趋于正态分布
由此定理,只需要掌握一个样本的资料就可以根据样本统计量推断总体参数
评价估计量的标准
(1)无偏性
如果一个估计量所估计得总体参数以上或以下的可能性(出现的频率或取值范围)相同,就认为这个统计量是一个无偏估计量。
(2)有效性
无偏估计不是唯一的,假设有2个容量相等的抽样分布,应该选用平均误差比较小的那个作为估计量,称为有效估计量。
根据有效估计量推演出接近总体参数值的机会越大。
(3)一致性
统计量x1。
。
xn是与样本容量n有关的,n越大,对θ的估计越精确,即统计量的值越接近总体参数值,这样的统计量是与总参数一致的估计量。
(4)充分性
如果一个估计量能够为总体带来大量的有用信息,而设有其他的估计量能带来比它更多的有用信息,则称这个估计量是充分的。
例如:
在二项分布中,样本中成功的次数比例是成功概率p的充分统计量。
其他的信息(比如这几个试验中,哪几次成功,哪几次失败)是无法用来帮助估计成功概率的
假设检验:
又称统计检验,是统计假设检验的简称。
检验的基本方法是:
先假设总体具有某些统计特性,再跟据样本统计特征,验证总体是否具有这些特征。
两类错误
第一类:
以真当假的错误——拒绝了原本为真的原假设(显著性水平选择太小)
第二类:
以假当真的错误——接受了原本该拒绝的元假设。
规避方法:
1.选用经验积累的结果作为原假设,一旦原假设被拒绝,可以即使采取调换样本的方法再检验。
2.采用不同的显著水平做检验,当结果不同时,增加样本容量再检验。
关系——描述两个或者两个以上变量(或参数)之间的联系
预测——事先根据对象以往的历史资料、通过科学的方法和逻辑推理对其未来作出估计
预测类型(有几个,是什么)
1、判断预测:
此类预测试图把主观的见解变成能够运用的定量预测。
2、趋势预测:
立足于“将来是过去和现在的延续”这一基本原则
3、因果预测:
根据预测的目的,用已经掌握的资料、数据、建立有关变量间的函数关系,进行预测。
时间序列模型
概念:
按照时间顺序记录的一组观察数据称为时间序列模型,又叫动态数列,它反映了观察值随时间变化而变化的状况。
时间序列有两个要素:
一是研究对象所属的时间范围和采样单位;
二是与各个时间相匹配的,关于研究的观察数据。
时间序列模型本质上是一种复合型的模型,特点是把一个原始数列分解为若干个分量,并用这些分量从不同的方面反映时间序列的性质,用数学描述时间序列模型特征:
Y=T·
S·
C·
I
1、T——长期趋势分量
反映时间序列的总体趋势,能够预测对象在长时间上的总的平滑向上或者向下的趋势,可以利用它通过最小二乘法求出回归直线。
2、S——季节变动分量
是指在每年会重复出现的周期性变动,在实际使用中,可以设法排除它在时间序列中的影响、用于研究非季节性的变动问题。
3、C——周期变动分量
通常以数年作为一个周期的变动量,而且它是一个循环式的变动,比季节性变动周期长
4、I——随机变动分量
是指无法事先预测的,偶然的随机因素引起的波动
西蒙的理论认为决策包含四个阶段:
情报活动、设计活动、决策活动、审查活动
不肯定条件下的决策
面对不肯定的条件,决策只知道哪些状态可能发生,但是不知道每一种状态发生的概率是多少,对于这类决策,可以根据追求的类型,制定或者选择决策的原则和标准。
需求(状态)
单位:
(万元)
高
中
低
失败
备选方案
扩充原生产线
5000
2500
-2500
-4500
建立新生产线
7000
3000
-4000
-8000
转包
1500
-100
-1000
一、合理性标准
前提:
各种状态在未来的出现是等可能的。
决策原则:
选择数学期望值最大的方案。
5000*1/4+2500*1/4+(-2500)*1/4+(-4500)*1/4=125
7000*1/4+3000*1/4+(-4000)*1/4+(-8000)*1/4=-500
3000*1/4+1500*1/4+(-100)*1/4+(-1000)*1/4=850
其中1/4为期望值
二、“最大最大”标准
又称为乐观标准,这个标准的出发点就是以获取最大利润(效益)为目的。
7000(每行的最大值最赚钱)
三、“最小最大”标准
这是一种悲观标准,决策者选择使“最小可能盈利”最大方案。
-1000M0(-4500,-8000,-1000)=-1000
四、“最大最小”遗憾标准
该标准选用“遗憾值”(后悔值)作为衡量标准,选择备选方案中“最大遗憾值”最小的对应方案。
遗憾矩阵:
min(3500,7000,4000)=3500
五、“现实主义”标准
此标准是在“乐观”和“悲观”之间进行折中。
折中给出一个乐观系数α。
决策过程的图解表示——决策树
课堂例子:
决策过程划分为两个阶段:
前2年和后8年。
第一个决策点方框1的问题是建一个大型工厂还是建一个小工厂?
第二个决策点的问题是小型工厂是否需要扩建?
获利情况:
1、大工厂,需求量大,获利1000万/年
2、大工厂,需求量小,获利100万/年
3、小工厂,不扩建,需求量小,10年内获利200万/年
4、小工厂,需求量大2年内获利450万/年;
需求持续增加,不扩建,后8年利润300万/年
5、小工厂,扩建,2年后适应大需求量,后8年获利700万/年
6、小工厂,扩建,2年后需求量下降,后8年获利50万/年
7、大工厂从动工到投产,需要经费3000万
8、小工厂,从动工到投产,需要经费1300万
三种决策:
最短路问题
一个典型的选优决策问题,采用“逆向算法”,即从问题的最后阶段开始进行规划,逐步上溯到第一阶段,达到对问题的每一个阶段做出最优决策
1、案例:
有一批急救物资,从1号地点发出,运到某地区(10号地区)。
图中表示从1号地点到10号地点的公路网和该路段的里程数,找出从1号到10号最短路径。
(计算此题必考,重点掌握)
300
②⑥
275200
100⑨
200400100
①150④175⑤⑩
275250150
175⑧
200125
③⑦
350
第一阶段最短路程计算:
输入节点
输出节点
路线
最短路程
8
10
8--10
150
9
9--10
100
第二阶段最短路程计算:
6
6--9
300
7
7--8
275
5
5--8
400
第三阶段最短路程计算:
2
2--6
600
4
4--6
500
3
3--5
第四阶段最短路程计算:
1
1--4
650
最短路径是:
1——4——6——9 650
例题2:
6
322
74
25
376
3
最优路线选择
输入点
输出点
到目的地距离
第三阶段
E
Z
E-Z
F
F-Z
G
G-Z
第二阶段
B
B-F
C
C-E
D
D-G
第一阶段
A
A-B
A——B——F——Z9
2、出口某产品,存在竞争的概率是0.7,无竞争的概率是0.3,有关条件概率和相应收益见表:
用决策树觉得最佳方案。
(计算)
未来状况
方案
存在竞争0.7=P
无竞争P=0.3得利
高价竞争
中价竞争
低价竞争
概率
0.4
0.5
0.1
65
利润
15
-5
-25
中价
0.6
0.3
45
20
-10
0.2
0.7
25
高价竞争0.4
○中价竞争0.5
高价出口低价竞争0.1
有0.7中高价竞争0.1
○中价竞争0.6
低低价竞争0.3
高价竞争0.1
无竞争0.3○中价竞争0.2
低价竞争0.7
高价竞争65
中价竞争45
低价竞争25
高价出口期望收益=[0.4×
15﹢0.5×
(-5)﹢0.1×
(-25)]×
0.7﹢65×
0.3=20.2
中价出口期望收益=[0.1×
20﹢0.6×
5﹢0.3×
(-10)]×
0.7﹢45×
0.3=14.9
低价出口期望收益=[0.1×
15﹢0.2×
5﹢0.7×
(-5)]×
0.7﹢25×
0.3=6.8
高价出口的利润期望最大,选择高价出口
补充知识:
1、条件概率
在事件A发生的条件下,求事件B的概率P(B/A)=P(AB)/P(A)
2、事件的独立性
3、乘法公式
4、全概率公式(相关公式看自己笔记)
5、贝叶斯公式(相关公式看自己笔记)
积事件概率P(AB)与条件概率P(B|A)的区别:
1.从样本空间上看,积事件概率P(AB)是在原样本空间内考虑,而条件概率P(B|A)是在一个缩小的样本空间A内考虑。
2.积事件概率P(AB)指A,B同时发生的概率,而条件概率P(B|A)指已知A发生的条件下B发生的概率,A、B在时间上有先后关系或者逻辑上有主从关系。
例:
1.某种动物由出生活到20岁的概率为0.8,活到25岁的概率为0.4,问现在20岁的这种动物活到25岁的概率。
2.甲乙两班共有70名同学,其中女生40名,设甲班有30名同学,其中女生15名,问在碰到甲班同学时,正好碰到一名女同学的概率。
全概率与bayes的区别:
1.全概率公式用来计算复杂事件概率,而复杂事件是由若干“原因”所引起
2.Bayes公式用来计算复杂事件已经发生的条件下,某一种原因发生的条件概率
1、某种动物的出生活到20岁的概率为0.8,活到25岁的概率为0.4,问现在20岁的这种动物活到25岁的概率?
解:
设A为活到20岁,B为活到25岁
P(A)=0.8,P(B)=0.4,P(AB)=0.4
P(BIA)=P(AB)/P(A)=04/0.8=1/2
2、甲乙两班共有70名同学,其中女生40名,设甲班有30名同学,其中女生15名,问在碰到甲班同学时,正好碰到一名女同学的概率。
设A为碰到甲班同学,B为碰到一名女同学
P(A)=30/70=3/7P(AB)=15/70
P(BIA)=P(AB)P(A)=1/2
3、三个箱子中,第一箱装有4个黑球1个白球,第二箱装有3个黑球3个白球,第三箱装有3个黑球5个白球。
现在任取一个箱子,在从该箱中任取一球。
求:
(1)取出的球是白球的概率;
(2)若取出的为白球,则该球属于第二箱的概率。
设Ai为抽取到第i个箱子,i=1.2.3;
B为取到白球
P(A1)=P(A2)=P(A3)=1/3
P(B)=∑P(BIAi)·
P(Ai)=1/5·
1/3+3/6·
1/3+5/8·
1/3=53/120
P(A2IB)=P(BIA2)·
P(A2)/P(B)=20/53
4、发报台分别以概率0.6和0.4发出信号0和1,由于通讯系统受到干扰,当发出0时,收报台未必收到信号0,而是分别以0.8和0.2收到信号0和1;
同样,当发出信号1时,收报台分别以概率0.9和0.1收到信号1和0;
求
(1)收报台收到0的概率;
(2)当收报台收到信号0时,发报台是发出信号0的概率。
设B表示收到0的概率,A1发出0,A2发出1
P(A1)=0.6,P(A2)=0.4,P(BIA1)=0.8,P(BIA2)=0.1
(1)P(B)=P(A1)·
P(BIA1)+P(A2)·
P(BIA2)=0.6*0.8+0.4*0.1=0.52
(2)P(A1IB)=P(A1)P(BIA1)/P(B)=12/13
6、二项分布(伯努利分布)
二项分布描述离散的随机变量,符合下列特性的随机变量为伯努利变量:
1.每次试验的结果只有两种可能且互相对立
2.在每次试验中任何一种结果出现的概率不变
3.试验是独立的,与其它各次试验结果无关
5、在今年1-6月销售的轿车中,有25%的进口轿车,现在随机调查6个购买轿车的人,问
(1)没有人买进口轿车的概率;
(2)都买进口轿车的概率;
(3)2人买进口轿车的概率;
(4)至少2人买进口轿车的概率。
(1)P(0)=C06(1/4)0(3/4)6=
(2)P(6)=C66(1/4)6(3/4)0=
(3)P
(2)=C26(1/4)2(3/4)4=
(4)P(>
=2)=1-P(<
2)=1-[P
(1)+P(0)]=
6、某人的一个旧空调经常发生故障,已知开机1小时故障率为0.3,各小时间发生故障时独立的,假设发生故障后,修复时间不计,现在连续开机5小时。
求
(1)不出现故障的概率
(2)出项2次故障的概率(3)连续2小时出现故障的概率(4)每小时都出现故障的概率。
(1)P(0)=C05(0.3)0(0.7)5=
(2)P
(2)=C25(0.3)2(0.7)3=
(3)P=C14(0.3)2(0.7)3=
(4)P(5)=C55(0.3)5(0.7)0=
7、在3次独立试验中,事件A出现的概率均相等,且至少出现一次的概率为19/27,求在一次试验中,事件A出现的概率。
P=1/3
P(>
=1)=1-P(0)=1-C03(1/3)0(2/3)3=
8、某柜台上有4为售货员,并预备了两个台秤,若每位售货员在一小时内平均有15分钟时间使用台秤,求一天10小时内,平均有多少时间台秤不够用。
在1小时内有3个或4个人要用秤时,台秤不够
P(3)=C34(0.25)3(0.75)=
P(4)=C44(0.25)4(0.75)0=
一天10小时不够用时间10*[P(3)+P(4)]=
9、过去的记录表明某一个高速公路收费站,在早上6点到7点每分钟交费通过的轿车平均数是5辆,轿车通过数量服从泊松分布;
在理想状态下,问每分钟通过轿车数量是0,1,2,3,4的概率是多少?
10、一批产品的废品率为0.001,服从泊松分布,求800件产品中废品为2件的概率。
K=2,λ=np=800*0.001=0.8
P(x=2)=0.82/2!
·
e-2
频率分布的概率度量法
了解一组观察值的分布规律是量化分析的重要内容,在做频率分析的概率度量中,首先需要知道的是一组观察值的“中心”所在
一、算术平均数
用算术平均数代表全部数据,缺点:
1、算术平均数是根据相关的全部数据计算的,容易受到资料中那些没有代表性、特殊的数据影响。
2、存在无下限或无上限的开口组的时候,无法计算组中值,也无法计算算术平均数
二、加权平均数(数学期望)
加权平均法考虑频率分布的情况,使得数量大的数据在计算平均值时占比较大的比重,数量小的数据占有比重相应较小。
衡量数量多少的标准时频率——有关数据在总体资料中所占的比重
三、几何平均值
四、中位数Me
中位数是一个位于一组观察值的中心位置的参数,位于数列中心,大于Me和小于Me的观察值数量相等
与平均数相比,中位数的优点在于:
1、不会受到特殊数据的影响,比如工资收入特高或者特低的值会影响平均数,但不会影响中位数
2、无论在分组还是不分组的资料中都可以计算中位数,且结果直观易解
五、众数Mo
众数是指资料中重复出现次数最多的数,也是频率最高的数
计算:
1.积事件概率、条件概率、全概率、bayes出一道
2、不肯定条件下决策
3、二项分布
绘图:
最短路径
带概率的决策树
(请同学们结合自己的笔记复习。
)