数学建模牙膏销售量的研究.docx

资源描述

数学建模牙膏销售量的研究.docx

《数学建模牙膏销售量的研究.docx》由会员分享，可在线阅读，更多相关《数学建模牙膏销售量的研究.docx（15页珍藏版）》请在冰豆网上搜索。

数学建模牙膏销售量的研究.docx

数学建模牙膏销售量的研究

牙膏销售量的研究

摘要

本文从收集有关牙膏销售量数据开始，从牙膏销售量和价格、广告投入之间的关系出发，分别通过对这三个方面的深入研究从而制定出各自的最佳方案，最后再综合考虑这三个主要因素，进一步深入并细化，从而求得最优解。

模块Ⅰ中，我们假设在

和

对y的影响独立，从而得到了方程：

在模块Ⅱ中，我们假设

和

对y的影响有交互作用，进一步得到新的方程：

[关键字]线性回归模型相关系数

一、问题提出

由于客观事物部规律的复杂与人们认识程度的限制,无法分析实际对象在的因果关系，建立合乎机理规律的数学模型。

通过对数据的统计分析，找出与数据拟合最好的模型，回归模型是用统计分析方法建立的最常用的一类模型。

建立牙膏销售量与价格、广告投入之间的模型，预测在不同价格和广告费用下的牙膏销售量

二、问题分析

某大型牙膏制造企业为了更好地拓展产品市场，有效地管理库存，公司董事会要求销售部门根据市场调查，找出公司生产的牙膏销售量与销售价格、广告投入等之间的关系，从而预测出在不同价格和广告费用下的销售量。

为此，销售部的研究人员收集了过去30个销售周期（每个销售周期为4周）公司生产的牙膏的销售量、销售价格、投入的广告费用，以与同期其它厂家生产的同类牙膏的市场平均销售价格，见表1-1（其中价格差指其它厂家平均价格与公司销售价格之差）。

试根据这些数据建立一个数学模型，分析牙膏销售量与其它因素的关系，为制订价格策略和广告投入策略提供数量依据。

表1-1牙膏销售量与销售价格、广告费用等数据

销售

周期

公司销售价格

（元）

其他厂家平均价格（元）

价格差

（元）

广告费用

（百万元）

销售量

（百万支）

3.85

3.80

-0.05

5.5

7.38

3.75

4.00

0.25

6.75

8.51

3.70

4.30

0.60

7.25

9.52

3.60

3.70

0.00

5.50

7.50

3.60

3.85

0.25

7.00

9.33

3.6

3.80

0.20

6.50

8.28

3.6

3.75

0.15

6.75

8.75

3.8

3.85

0.05

5.25

7.87

3.8

3.65

-0.15

5.25

7.10

3.85

4.00

0.15

6.00

8.00

3.90

4.10

0.20

6.50

7.89

3.90

4.00

0.10

6.25

8.15

3.70

4.10

0.40

7.00

9.10

3.75

4.20

0.45

6.90

8.86

3.75

4.10

0.35

6.80

8.90

3.80

4.10

0.30

6.80

8.87

3.70

4.20

0.50

7.10

9.26

3.80

4.30

0.50

7.00

9.00

3.70

4.10

0.40

6.80

8.75

3.80

3.75

-0.05

6.50

7.95

3.80

3.75

-0.05

6.25

7.65

3.75

3.65

-0.10

6.00

7.27

3.70

3.90

0.20

6.50

8.00

3.55

3.65

0.10

7.00

8.50

3.60

4.10

0.50

6.80

8.75

3.70

4.25

0.60

6.80

9.21

3.75

3.65

-0.05

6.50

8.27

3.75

0.00

5.75

7.67

3.80

3.85

0.05

5.80

7.93

3.70

4.25

0.55

6.80

9.26

MATLAB作图得到2.1如下所示（相关程序代码见附录1）；

图2.1牙膏销售量与销售价格、广告费用的关系图

三、模型假设

假设收集的数据均真实有效。

四、定义与符号说明

y~公司牙膏销售量

~其它厂家与本公司价格差

~公司广告费用

y~被解释变量（因变量）

~解释变量（回归变量,自变量）

~回归系数

ε~随机误差（均值为零的正态分布随机变量）

五、模型的建立与求解

（一）基于

和

对y的影响独立----模型Ⅰ

1、作出图形，如下图：

由数据y,x1,x2估计β[b,bint,r,rint,stats]=regress（y,x,alpha）

输入y~n维数据向量x=[1x1x2x22]~n⨯4数据矩阵,第1列为全1向量,alpha（置信水平,0.05）

输出b~β的估计值，bint~b的置信区间，r~残差向量y-xb，rint~r的置信区间

Stats~检验统计量R2,F,p

参数

参数估计值

置信区间

β0

17.3244

[5.728228.9206]

β1

1.3070

[0.68291.9311]

β2

-3.6956

[-7.49890.1077]

β3

0.3486

[0.03790.6594]

R2=0.9054F=82.9409p=0.0000

y的90.54%可由模型确定p远小于α=0.05，β2的置信区间包含零点（右端点距零点很近），x22项显著。

F远超过F检验的临界值，模型从整体上看成立，x2对因变量y的影响不太显著，可将x2保留在模型中。

销售量预测

价格差x1=其它厂家价格x3-本公司价格x4。

估计x3→控制x1→通过x1、x2预测y。

控制价格差x1=0.2元，投入广告费x2=650万元。

（百万支）

销售量预测区间为[7.8230，8.7636]（置信度95%）。

上限用作库存管理的目标值，下限用来把握公司的现金流。

若估计x3=3.9，设定x4=3.7，则可以95%的把握知道销售额在7.8320⨯3.7≈29（百万元）以上。

（二）基于

和

对y的影响有交互作用----模型Ⅱ

参数

参数估计值

置信区间

β0

29.1133

[13.701344.5252]

β1

11.1342

[1.977820.2906]

β2

-7.6080

[-12.6932-2.5228]

β3

0.6712

[0.25381.0887]

β4

-1.4777

[-2.8518-0.1037]

R2=0.9209F=72.777p=0.0000

交互作用影响的讨论

价格差x1=0.1

价格差x1=0.3

→

价格优势会使销售量增加

加大广告投入使销售量增加（x2大于6百万元）

价格差较小时增加的速率更大→价格差较小时更需要靠广告来吸引顾客的眼球

六、模型的评价

两模型销售量预测比较

控制价格差x1=0.2元，投入广告费x2=6.5百万元。

，

（百万支），区间[7.8230，8.7636]

，

（百万支），区间[7.8953，8.7592]

略有增加，预测区间长度更短

七、附录

附录：

“图2.1各年度学费占教育经费的比例的情况”的程序代码

x1=[-0.050.250.600.000.250.200.150.05-0.150.150.200.100.400.450.350.300.500.500.40-0.05-0.05-0.010.200.100.500.60-0.050.000.050.55];

x2=[5.56.757.255.507.006.506.755.255.256.006.506.257.006.906.806.807.107.006.806.506.256.006.507.006.806.806.505.755.806.80];

y=[7.388.519.527.509.338.288.757.877.108.007.898.159.108.868.908.879.269.008.757.957.657.278.008.508.759.218.277.677.939.26]';

X=[ones（30,1）x1'x2'（x2.^2）'];

[b,bint,r,rint,stats]=regress（y,X）;

rcoplot（r,rint）

软件开发人员的薪金的研究

摘要

本文从收集有关软件开发人员薪金与资历、管理责任、教育程度的关系的数据开始，分析软件开发人员薪金和资历、管理责任、教育程度之间的关系出发，分别通过对这四个方面的深入研究从而制定出各自的最佳方案，最后在综合考虑这三个主要因素，进一步深入并细化，从而求得最优解。

模块Ⅰ中，我们假设x1、x2、x3、x4对y的影响独立，从而得到了方程：

模块二中，我们假设x1、x2、x3、x4对y的影响有交互作用，进一步得到新方程：

[关键字]线性回归模型相关系数

一、问题提出

由于客观事物部规律的复杂与人们认识程度的限制,无法分析实际对象在的因果关系，建立合乎机理规律的数学模型。

通过对数据的统计分析，找出与数据拟合最好的模型，回归模型是用统计分析方法建立的最常用的一类模型。

建立软件开发人员的薪金与资历、管理责任和教育程度之间的模型，认识策略的合理性。

二、问题分析

一家技术公司人事部门欲建立模型研究薪金与资历、管理责任、教育程度的关系，分析人事策略的合理性，作为新聘用人员薪金的参考。

为此，研究人员收集了46名软件开发人员的档案资料，如表1-2，其中资历一列指从事专业工作的年数，管理一列中1表示管理人员，0表示非管理人员，教育一列中1表示中学程度，2表示大学程度，3表示更高程度（研究生）

表1-2软件开发人员的薪金与资历、管理责任、教育程度的关系

编号

薪金

资历

管理

教育

13876

11608

18701

11283

11767

20872

11772

10535

12195

12313

14975

21371

19800

11417

20263

13231

12884

13245

13677

15965

12366

21352

13839

22884

16978

14803

17404

22184

13548

14467

15942

23174

23780

25410

14861

16882

24170

15990

26330

17949

25685

27837

18838

17483

19207

19364

MATLAB作图得到图2.1如下所示（相关程序代码见附录1）：

图2.1软件开发人员的薪金与资历、管理责任、教育程度的关系图

三、模型假设

1.、假设资历每加一年薪金的增长是常数；

2、假设管理、教育、资历之间无交互作用。

四、定义与符号说明

y~薪金

x1~资历（年）

x2~

x3~

x4~

a0，a1，a2，a3，a4~是待估计的回归系数

ε~是随机误差

五、模型的建立与求解

（一）基于x1、x2、x3和x4对y的影响独立，得到模型

参数

参数估计值

置信区间

11032

[1025811807]

546

[484608]

6883

[62487517]

-2994

[-3826-2162]

148

[636931]

R2=0.957F=226p=0.000

R2,F,p→模型整体上可用

资历增加1年薪金增长546，管理人员薪金多6883，中学程度薪金比更高的少2994，大学程度薪金比更高的多148，a4置信区间包含零点，解释不可靠!

残差分析方法

管理与教育的组合

组合

管理

教育

e与资历x1的关系

残差大概分成3个水平，6种管理—驾驭组合混合在一起，为正确反映。

e与管理—教育组合的关系

残差为正，或全为负，管理—教育组合处理不当，应在模型中增加管理x2与教育x3，x4的交互项

（二）基于x1、x2、x3和x4对y的影响有交互作用，进一步得到新的方程：

参数

参数估计值

置信区间

11204

[1104411363]

497

[486508]

7048

[68417255]

-1727

[-1939-1514]

-348

[-545-152]

-3071

[-3372-2769]

1836

[15712101]

R2=0.999F=554p=0.000

R2,F有改进，所有回归系数置信区间都不含零点，模型完全可用

出现了异常数据（33号），为了消除不正常现象，应该去掉异常数据。

去掉异常数据后的结果：

参数

参数估计值

置信区间

11200

[1113911261]

497

[494503]

7041

[68627120]

-1737

[-1818-1656]

-356

[-431-281]

-3056

[-3171-2942]

1997

[18942100]

R2=0.9998F=36701p=0.0000

R2：

0.957→0.999→0.9998，F：

226→554→36701，置信区间长度

残插图十分正常。

最终模型的结果可以应用。

六、模型的评价

制订6种管理—教育组合人员的“基础”薪金（资历为0）

x1=0；x2=1~管理，x2=0~非管理，中学：

x3=1,x4=0；大学：

x3=0,x4=1；更高：

x3=0,x4=0

组合

管理

教育

系数

“基础”薪金

a0+a3

9436

a0+a2+a3+a5

13448

a0+a4

10844

a0+a2+a4+a6

19882

11200

a0+a2

18241

大学程度管理人员比更高程度管理人员的薪金高,大学程度非管理人员比更高程度非管理人员的薪金略低。

对定性因素（如管理、教育），可以引入0-1变量处理，0-1变量的个数应比定性因素的水平少1。

剔除异常数据，有助于得到更好的结果。

可以直接对6种管理—教育组合引入5个0-1变量。

七、附录

附录：

“图2.1软件开发人员的薪金与资历、管理责任、教育程度的关系图”的程序代码：

x1=[111112222333344445556666788881010101011111212131314151616161720];

x2=[1010010000111010000101011011000111001010110000];

x3=[1000000100100100000110001010110000100100000100];

x4=[0001011001010000110000110100001011010011011010];

y=[13867116081870111283117672087211772105361219512313149752137119800114172026313231128841324513677159651236621352138392288416978148031740422184135481446715942231742378025410148621688224170159902633017949256852783718838174831920719346]';

x=[ones（46,1）x1'x2'x3'x4'];

[b,bint,r,rint,stats]=regress（y,x）

rcoplot（r,rint）

展开阅读全文