数学建模牙膏销售量的研究.docx
《数学建模牙膏销售量的研究.docx》由会员分享,可在线阅读,更多相关《数学建模牙膏销售量的研究.docx(15页珍藏版)》请在冰豆网上搜索。
数学建模牙膏销售量的研究
牙膏销售量的研究
摘要
本文从收集有关牙膏销售量数据开始,从牙膏销售量和价格、广告投入之间的关系出发,分别通过对这三个方面的深入研究从而制定出各自的最佳方案,最后再综合考虑这三个主要因素,进一步深入并细化,从而求得最优解。
模块Ⅰ中,我们假设在
和
对y的影响独立,从而得到了方程:
在模块Ⅱ中,我们假设
和
对y的影响有交互作用,进一步得到新的方程:
[关键字]线性回归模型相关系数
一、问题提出
由于客观事物部规律的复杂与人们认识程度的限制,无法分析实际对象在的因果关系,建立合乎机理规律的数学模型。
通过对数据的统计分析,找出与数据拟合最好的模型,回归模型是用统计分析方法建立的最常用的一类模型。
建立牙膏销售量与价格、广告投入之间的模型,预测在不同价格和广告费用下的牙膏销售量
二、问题分析
某大型牙膏制造企业为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格、广告投入等之间的关系,从而预测出在不同价格和广告费用下的销售量。
为此,销售部的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏的销售量、销售价格、投入的广告费用,以与同期其它厂家生产的同类牙膏的市场平均销售价格,见表1-1(其中价格差指其它厂家平均价格与公司销售价格之差)。
试根据这些数据建立一个数学模型,分析牙膏销售量与其它因素的关系,为制订价格策略和广告投入策略提供数量依据。
表1-1牙膏销售量与销售价格、广告费用等数据
销售
周期
公司销售价格
(元)
其他厂家平均价格(元)
价格差
(元)
广告费用
(百万元)
销售量
(百万支)
1
3.85
3.80
-0.05
5.5
7.38
2
3.75
4.00
0.25
6.75
8.51
3
3.70
4.30
0.60
7.25
9.52
4
3.60
3.70
0.00
5.50
7.50
5
3.60
3.85
0.25
7.00
9.33
6
3.6
3.80
0.20
6.50
8.28
7
3.6
3.75
0.15
6.75
8.75
8
3.8
3.85
0.05
5.25
7.87
9
3.8
3.65
-0.15
5.25
7.10
10
3.85
4.00
0.15
6.00
8.00
11
3.90
4.10
0.20
6.50
7.89
12
3.90
4.00
0.10
6.25
8.15
13
3.70
4.10
0.40
7.00
9.10
14
3.75
4.20
0.45
6.90
8.86
15
3.75
4.10
0.35
6.80
8.90
16
3.80
4.10
0.30
6.80
8.87
17
3.70
4.20
0.50
7.10
9.26
18
3.80
4.30
0.50
7.00
9.00
19
3.70
4.10
0.40
6.80
8.75
20
3.80
3.75
-0.05
6.50
7.95
21
3.80
3.75
-0.05
6.25
7.65
22
3.75
3.65
-0.10
6.00
7.27
23
3.70
3.90
0.20
6.50
8.00
24
3.55
3.65
0.10
7.00
8.50
25
3.60
4.10
0.50
6.80
8.75
26
3.70
4.25
0.60
6.80
9.21
27
3.75
3.65
-0.05
6.50
8.27
28
3.75
3.75
0.00
5.75
7.67
29
3.80
3.85
0.05
5.80
7.93
30
3.70
4.25
0.55
6.80
9.26
MATLAB作图得到2.1如下所示(相关程序代码见附录1);
图2.1牙膏销售量与销售价格、广告费用的关系图
三、模型假设
假设收集的数据均真实有效。
四、定义与符号说明
y~公司牙膏销售量
~其它厂家与本公司价格差
~公司广告费用
y~被解释变量(因变量)
~解释变量(回归变量,自变量)
~回归系数
ε~随机误差(均值为零的正态分布随机变量)
五、模型的建立与求解
(一)基于
和
对y的影响独立----模型Ⅰ
1、作出图形,如下图:
由数据y,x1,x2估计β[b,bint,r,rint,stats]=regress(y,x,alpha)
输入y~n维数据向量x=[1x1x2x22]~n⨯4数据矩阵,第1列为全1向量,alpha(置信水平,0.05)
输出b~β的估计值,bint~b的置信区间,r~残差向量y-xb,rint~r的置信区间
Stats~检验统计量R2,F,p
参数
参数估计值
置信区间
β0
17.3244
[5.728228.9206]
β1
1.3070
[0.68291.9311]
β2
-3.6956
[-7.49890.1077]
β3
0.3486
[0.03790.6594]
R2=0.9054F=82.9409p=0.0000
y的90.54%可由模型确定p远小于α=0.05,β2的置信区间包含零点(右端点距零点很近),x22项显著。
F远超过F检验的临界值,模型从整体上看成立,x2对因变量y的影响不太显著,可将x2保留在模型中。
销售量预测
价格差x1=其它厂家价格x3-本公司价格x4。
估计x3→控制x1→通过x1、x2预测y。
控制价格差x1=0.2元,投入广告费x2=650万元。
(百万支)
销售量预测区间为[7.8230,8.7636](置信度95%)。
上限用作库存管理的目标值,下限用来把握公司的现金流。
若估计x3=3.9,设定x4=3.7,则可以95%的把握知道销售额在7.8320⨯3.7≈29(百万元)以上。
(二)基于
和
对y的影响有交互作用----模型Ⅱ
参数
参数估计值
置信区间
β0
29.1133
[13.701344.5252]
β1
11.1342
[1.977820.2906]
β2
-7.6080
[-12.6932-2.5228]
β3
0.6712
[0.25381.0887]
β4
-1.4777
[-2.8518-0.1037]
R2=0.9209F=72.777p=0.0000
交互作用影响的讨论
价格差x1=0.1
价格差x1=0.3
→
价格优势会使销售量增加
加大广告投入使销售量增加(x2大于6百万元)
价格差较小时增加的速率更大→价格差较小时更需要靠广告来吸引顾客的眼球
六、模型的评价
两模型销售量预测比较
控制价格差x1=0.2元,投入广告费x2=6.5百万元。
,
(百万支),区间[7.8230,8.7636]
,
(百万支),区间[7.8953,8.7592]
略有增加,预测区间长度更短
七、附录
附录:
“图2.1各年度学费占教育经费的比例的情况”的程序代码
x1=[-0.050.250.600.000.250.200.150.05-0.150.150.200.100.400.450.350.300.500.500.40-0.05-0.05-0.010.200.100.500.60-0.050.000.050.55];
x2=[5.56.757.255.507.006.506.755.255.256.006.506.257.006.906.806.807.107.006.806.506.256.006.507.006.806.806.505.755.806.80];
y=[7.388.519.527.509.338.288.757.877.108.007.898.159.108.868.908.879.269.008.757.957.657.278.008.508.759.218.277.677.939.26]';
X=[ones(30,1)x1'x2'(x2.^2)'];
[b,bint,r,rint,stats]=regress(y,X);
rcoplot(r,rint)
软件开发人员的薪金的研究
摘要
本文从收集有关软件开发人员薪金与资历、管理责任、教育程度的关系的数据开始,分析软件开发人员薪金和资历、管理责任、教育程度之间的关系出发,分别通过对这四个方面的深入研究从而制定出各自的最佳方案,最后在综合考虑这三个主要因素,进一步深入并细化,从而求得最优解。
模块Ⅰ中,我们假设x1、x2、x3、x4对y的影响独立,从而得到了方程:
模块二中,我们假设x1、x2、x3、x4对y的影响有交互作用,进一步得到新方程:
[关键字]线性回归模型相关系数
一、问题提出
由于客观事物部规律的复杂与人们认识程度的限制,无法分析实际对象在的因果关系,建立合乎机理规律的数学模型。
通过对数据的统计分析,找出与数据拟合最好的模型,回归模型是用统计分析方法建立的最常用的一类模型。
建立软件开发人员的薪金与资历、管理责任和教育程度之间的模型,认识策略的合理性。
二、问题分析
一家技术公司人事部门欲建立模型研究薪金与资历、管理责任、教育程度的关系,分析人事策略的合理性,作为新聘用人员薪金的参考。
为此,研究人员收集了46名软件开发人员的档案资料,如表1-2,其中资历一列指从事专业工作的年数,管理一列中1表示管理人员,0表示非管理人员,教育一列中1表示中学程度,2表示大学程度,3表示更高程度(研究生)
表1-2软件开发人员的薪金与资历、管理责任、教育程度的关系
编号
薪金
资历
管理
教育
01
13876
1
1
1
02
11608
1
0
3
03
18701
1
1
3
04
11283
1
0
2
05
11767
1
0
3
06
20872
2
1
2
07
11772
2
0
2
08
10535
2
0
1
09
12195
2
0
3
10
12313
3
0
2
11
14975
3
1
1
12
21371
3
1
2
13
19800
3
1
3
14
11417
4
0
1
15
20263
4
1
3
16
13231
4
0
3
17
12884
4
0
2
18
13245
5
0
2
19
13677
5
0
3
20
15965
5
1
1
21
12366
6
0
1
22
21352
6
1
3
23
13839
6
0
2
24
22884
6
1
2
25
16978
7
1
1
26
14803
8
0
2
27
17404
8
1
1
28
22184
8
1
3
29
13548
8
0
1
30
14467
10
0
1
31
15942
10
0
2
32
23174
10
1
3
33
23780
10
1
2
34
25410
11
1
2
35
14861
11
0
1
36
16882
12
0
2
37
24170
12
1
3
38
15990
13
0
1
39
26330
13
1
2
40
17949
14
0
2
41
25685
15
1
3
42
27837
16
1
2
43
18838
16
0
2
44
17483
16
0
1
45
19207
17
0
2
46
19364
20
0
1
MATLAB作图得到图2.1如下所示(相关程序代码见附录1):
图2.1软件开发人员的薪金与资历、管理责任、教育程度的关系图
三、模型假设
1.、假设资历每加一年薪金的增长是常数;
2、假设管理、教育、资历之间无交互作用。
四、定义与符号说明
y~薪金
x1~资历(年)
x2~
x3~
x4~
a0,a1,a2,a3,a4~是待估计的回归系数
ε~是随机误差
五、模型的建立与求解
(一)基于x1、x2、x3和x4对y的影响独立,得到模型
参数
参数估计值
置信区间
a0
11032
[1025811807]
a1
546
[484608]
a2
6883
[62487517]
a3
-2994
[-3826-2162]
a4
148
[636931]
R2=0.957F=226p=0.000
R2,F,p→模型整体上可用
资历增加1年薪金增长546,管理人员薪金多6883,中学程度薪金比更高的少2994,大学程度薪金比更高的多148,a4置信区间包含零点,解释不可靠!
残差分析方法
管理与教育的组合
组合
1
2
3
4
5
6
管理
0
1
0
1
0
1
教育
1
1
2
2
3
3
e与资历x1的关系
残差大概分成3个水平,6种管理—驾驭组合混合在一起,为正确反映。
e与管理—教育组合的关系
残差为正,或全为负,管理—教育组合处理不当,应在模型中增加管理x2与教育x3,x4的交互项
(二)基于x1、x2、x3和x4对y的影响有交互作用,进一步得到新的方程:
参数
参数估计值
置信区间
a0
11204
[1104411363]
a1
497
[486508]
a2
7048
[68417255]
a3
-1727
[-1939-1514]
a4
-348
[-545-152]
a5
-3071
[-3372-2769]
a6
1836
[15712101]
R2=0.999F=554p=0.000
R2,F有改进,所有回归系数置信区间都不含零点,模型完全可用
出现了异常数据(33号),为了消除不正常现象,应该去掉异常数据。
去掉异常数据后的结果:
参数
参数估计值
置信区间
a0
11200
[1113911261]
a1
497
[494503]
a2
7041
[68627120]
a3
-1737
[-1818-1656]
a4
-356
[-431-281]
a5
-3056
[-3171-2942]
a6
1997
[18942100]
R2=0.9998F=36701p=0.0000
R2:
0.957→0.999→0.9998,F:
226→554→36701,置信区间长度
残插图十分正常。
最终模型的结果可以应用。
六、模型的评价
制订6种管理—教育组合人员的“基础”薪金(资历为0)
x1=0;x2=1~管理,x2=0~非管理,中学:
x3=1,x4=0;大学:
x3=0,x4=1;更高:
x3=0,x4=0
组合
管理
教育
系数
“基础”薪金
1
0
1
a0+a3
9436
2
1
1
a0+a2+a3+a5
13448
3
0
2
a0+a4
10844
4
1
2
a0+a2+a4+a6
19882
5
0
3
a0
11200
6
1
3
a0+a2
18241
大学程度管理人员比更高程度管理人员的薪金高,大学程度非管理人员比更高程度非管理人员的薪金略低。
对定性因素(如管理、教育),可以引入0-1变量处理,0-1变量的个数应比定性因素的水平少1。
剔除异常数据,有助于得到更好的结果。
可以直接对6种管理—教育组合引入5个0-1变量。
七、附录
附录:
“图2.1软件开发人员的薪金与资历、管理责任、教育程度的关系图”的程序代码:
x1=[111112222333344445556666788881010101011111212131314151616161720];
x2=[1010010000111010000101011011000111001010110000];
x3=[1000000100100100000110001010110000100100000100];
x4=[0001011001010000110000110100001011010011011010];
y=[13867116081870111283117672087211772105361219512313149752137119800114172026313231128841324513677159651236621352138392288416978148031740422184135481446715942231742378025410148621688224170159902633017949256852783718838174831920719346]';
x=[ones(46,1)x1'x2'x3'x4'];
[b,bint,r,rint,stats]=regress(y,x)
rcoplot(r,rint)