搜索引擎广告收益数学模型.docx

上传人:b****7 文档编号:11104449 上传时间:2023-02-25 格式:DOCX 页数:24 大小:615.71KB
下载 相关 举报
搜索引擎广告收益数学模型.docx_第1页
第1页 / 共24页
搜索引擎广告收益数学模型.docx_第2页
第2页 / 共24页
搜索引擎广告收益数学模型.docx_第3页
第3页 / 共24页
搜索引擎广告收益数学模型.docx_第4页
第4页 / 共24页
搜索引擎广告收益数学模型.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

搜索引擎广告收益数学模型.docx

《搜索引擎广告收益数学模型.docx》由会员分享,可在线阅读,更多相关《搜索引擎广告收益数学模型.docx(24页珍藏版)》请在冰豆网上搜索。

搜索引擎广告收益数学模型.docx

搜索引擎广告收益数学模型

数模模拟试题

 

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):

A

我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):

湖北师范学院

参赛队员(打印并签名):

1.郑升林

2.张琴

3.刘玲

指导教师或指导教师组负责人(打印并签名):

教练组

日期:

2012年8月27日

 

赛区评阅编号(由赛区组委会评阅前进行编号):

 

数学模拟试题

 

编号专用页

 

赛区评阅编号(由赛区组委会评阅前进行编号):

 

赛区评阅记录(可供赛区评阅时使用):

 

 

全国统一编号(由赛区组委会送交全国前编号):

 

全国评阅编号(由全国组委会评阅前进行编号):

 

搜索引擎广告收益

摘要

本文研究的是多种因素对Google引擎广告收益的评估问题和对于广告收益最大化的影响因素的范围优化问题。

根据这些特点,我们对问题1用主成分分析法解决;对问题2优化用正态分布的方法解决

对于问题1我们用MATLAB线性处理直接求出七个元素对于收益的系数首先建立了线性规划模型一。

在对线性规划模型的基础上建立了主成分分析模型二。

对模型进行做合理的理论证明和推导,所给出的理论结果大约为:

然后借助于主成分分析法和SPSS,MATLAB软件,对附件中所提供的数据进行了筛选,去除异常数据,对残缺数据进行适当补充,并从中随机抽取了3组数据对理论结果进行了数据模拟,结果显示,理论结果与数据模拟结果吻合。

对于问题2我们用SPSS进行Q-Q正态检验处理,首先建立了正态分布模型三。

在对模型改进的基础上建立了正态分布优化模型四。

对模型进行了合理的理论证明和推导,所给出的理论证明结果大约为:

CPC每次点击成本

CTR点击率

平均广告排名

CPM每千次成本

转化率

每次转换费用

无效点击

优化上限

1.45

0.01

4.45

8.64

0.09

20.17

0.12

优化下限

0.07

0

3.03

0.00

0.03

1.75

0

如果在数据和时间允许的条件下,模型可以进行适当修改,可以进一步进行偏相关分析,使得这七种因素的影响更加显著。

 

关键字:

主成分分析MATLAB软件 SPSS软件 正态优化

 

一、问题重述

由于网络社会的飞速发展,网络广告也呈现了多种形式。

与其它网站的广告推广方式相比,搜索引擎推广方式最为有效(上图展示了部分搜索引擎标识)。

搜索引擎广告可以向那些对广告产品感兴趣的人展示广告,尽量避免无效展示。

搜索引擎广告收益评估指标通常考虑以下几个方面的影响因素;广告显示次数、点击次数与点击率、每点击广告费用、转化次数与转化率、广告投资收益等几个方面。

问题:

以某一搜索引擎为例。

1.建立搜索引擎网络广告收益评估的数学模型;

2.为使得广告收益控制在某一范围或最大化,建立数学模型确定相应影响因素的范围。

二、问题分析

针对问题一,如今广告种类是多种多样的,我们将广告范围限制为一支,一个关键字。

对于大量的多指标数据的综合评价,已经有了很多成型的算法,它能充分体现影响收益的主要因素,得到较为精确的结论。

广告收益情况是由诸多因素影响所决定的,包括广告显示次数、点击次数与点击率、每点击广告费用、转化次数与转化率、广告投资收益。

考虑到各个因素间的相关性,所以做出两两因素相关性图及表格来分析数据是必须的;而各类因素对其影响力的大小也是各不相同,这时我们可以利用MATLAB软件对其因素进行主成分分析,找出基本上能够代替其他成分的主成分,便可以得到广告收益的评估模型。

针对问题二,我们用SPSS进行Q-Q正态检验处理,首先建立了正态分布模型三。

在对模型改进的基础上建立了正态分布优化模型四。

三、模型假设

1、假设表中数据真实可靠,不存在人为因素。

2、假设表中数据具有时效性,短时间内没有波动性。

3、短期类不会出现其他特殊因素

四、符号说明

CPC每次点击的成本(

CTR点击率(

R平均广告排名(

CPM每千次成本(就是广告投放过程中比如说一个广告一条的单价是1元/CPM的话,意味着每一千个人次看到这个广告的话就收1元)(

转化率(

CPM每次转换的费用(

无效点击(

五、模型的建立与求解

问题一的建立

1)初步分析数据,得到7个影响因素,依次是每次点击成本、点击率、平均广告排名、每千次成本、转化率、每次转换费用、无效点击,对其数据进行相关提取得到下表一:

年份

CPC每次点击成本

CTR点击率

平均广告排名

CPM每千次成本

转化率

每次转换费用

无效点击

年度广告收益

2,005

0.38

0.0150

4.00

5.56

0.0380

10.18

0.0032

3,377,060.00

2,006

0.32

0.0070

4.00

2.38

0.0400

7.63

0.0350

6,322,797.00

2,007

0.62

0.0030

3.90

1.95

0.0700

6.41

0.0650

10,624,705.00

2,008

0.71

0.0030

4.00

2.16

0.0750

7.02

0.0490

14,413,826.00

2,009

1.03

0.0030

3.60

3.34

0.0600

12.60

0.0550

15,722,486.00

2,010

1.24

0.0070

3.70

8.55

0.0680

13.14

0.0670

19,444,000.00

2,011

1.04

0.0040

3.00

3.97

0.0530

19.74

0.1090

26,145,000.00

为了找出因素间的联系,我们以CPC、CPM、CPW为因变量,平均广告排名,转化率,每次转换费用,无效点击四个因素为自变量,运用SPSS软件做出因素间的相关性图。

以下是CPC与其他四个因素的关系图(CPC、CPM与其他四个因素的关系图见附录):

表1各因素数据统计表

从图中可以很明显的看到都是零散的点,说明CPC与其他四个因素是没有直接的关系,从而可以用综合变量代替其他变量来进行主成分分析。

依靠上面的图像,我们运用MATLAB软件计算两两因素的相关性,得到如下表格

说明:

每个框里面除开与自身相比的1和标志因素的7之外,有两组数值,其中person相关性越大,说明这两个因素越相关,下面的显著性,越大,就说明相关性越弱

就是你否定一个原假设时所犯的错误的概率,即p越小,你否定一个原假设时所犯的错误的概率就越小,如p=0,说明你否定一个原假设时所犯的错误的概率为0,你可以有100%的把握否定原假设。

在做相关性分析时,我们的原假设是没有相关性,p=0,就否认了没有相关性,于是就可以讨论他们的相关性。

2)主成分分析法,通过提取主成分的方法对数据进行综合评价,将主要影响收益因素作为评估指标,计算指标的相关系数矩阵的特征值和特征向量来寻求主成分,最终通过主成分进行综合评估。

问题一的求解

首先,运用MATLAB软件对原始数据进行标准化处理。

得到标准化后的矩阵:

0.07120.35710.15270.19920.09410.13270.0084

0.05990.16670.15270.08530.09900.09950.0913

0.11610.07140.14890.06990.17330.08360.1696

0.13300.07140.15270.07740.18560.09150.1279

0.19290.07140.13740.11970.14850.16420.1435

0.23220.16670.14120.30630.16830.17130.1748

0.19480.09520.11450.14220.13120.25730.2844

再计算特征值、方差贡献率以及各指标的相关系数矩阵。

对于给定的七个因素,求因素间的相关系数。

相关矩阵中的每一个元素由相应的相关系数所表示。

由于

,故

,从而

由此可得

的相关系数为

即可得到相关系数矩阵:

1.0000-0.4546-0.66700.49870.54850.66010.7073

-0.45461.00000.33570.4944-0.7079-0.0422-0.7023

-0.66700.33571.0000-0.1713-0.0161-0.9377-0.8349

0.49870.4944-0.17131.0000-0.06530.4384-0.0107

0.5485-0.7079-0.0161-0.06531.0000-0.15720.4447

0.6601-0.0422-0.93770.4384-0.15721.00000.6419

0.7073-0.7023-0.8349-0.01070.44470.64191.0000

再求相关矩阵为

特征值和特征向量

求解特征方程:

    

即解七元一次方程组,其系数矩阵为:

A=

0.38000.01504.00005.56000.038010.18000.0032

0.32000.00704.00002.38000.04007.63000.0350

0.62000.00303.90001.95000.07006.41000.0650

0.71000.00304.00002.16000.07507.02000.0490

1.03000.00303.60003.34000.060012.60000.0550

1.24000.00703.70008.55000.068013.14000.0670

1.04000.00403.00003.97000.053019.74000.1090

  通过求解特征方程,可得到

个特征值

,和对应于每一个特征值的特征向量。

的协方差矩阵,

的特征值及相应的正交单位化特征向量分别为

的第

个主成分为

(3)

此时

用MATLAB软件,可解得的特征向量及特征值:

特征向量:

-0.48320.34130.11050.5210-0.3792-0.05720.4683

-0.41810.2711-0.5039-0.3123-0.1042-0.5398-0.3131

-0.5067-0.54430.26640.0091-0.35250.2000-0.4601

0.4025-0.09900.3616-0.2397-0.6031-0.51230.1179

0.1438-0.1191-0.6056-0.2025-0.52480.47540.2365

-0.0827-0.6998-0.29830.19860.2224-0.40180.4051

-0.3815-0.00430.2763-0.70220.18050.12430.4869

特征值val:

-0.0000000000

00.004200000

000.07670000

0000.1167000

00001.083500

000002.05050

0000003.6683

以上特征值、方差贡献率的结果如表2所示,各指标的相关系数矩阵的特征值如表3所示,

解释的总方差

成份

初始特征值

提取平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

1

4.642

58.025

58.025

4.642

58.025

58.025

2

2.051

25.632

83.656

2.051

25.632

83.656

3

1.084

13.545

97.201

1.084

13.545

97.201

4

.118

1.471

98.672

5

.078

.980

99.652

6

.028

.348

100.000

7

2.532E-16

3.165E-15

100.000

8

2.042E-17

2.552E-16

100.000

表2方差分析表

 

成份矩阵a

成份

1

2

3

CPC每次点击成本

.895

.082

.392

每次转换费用

.777

.575

-.233

CTR点击率

-.597

.773

.110

平均广告排名

-.879

-.286

.369

CPM每千次成本

.227

.734

.627

转化率

.456

-.681

.545

无效点击

.932

-.178

-.190

年度广告收益

.990

.001

.007

 

表3相关系数矩阵的特征量

年份

综合排序

2005

22.2902

2006

16.1241

2007

14.387

2008

15.5535

2009

24.1223

2010

29.5527

2011

33.9381

 

表4综合排名

最后提取主成分,如表2所示提取前三个特征值为主要成分,这三个累计贡献率达到

,基本上反映了全部7个因素所具有的信息,能在一定程度上对广告收益进行综合评估。

利用SPSS统计软件进行数据的处理,得出相关系数矩阵的特征量(见表3)。

荷载主成分载荷是反映主成分

在SPSS软件中主成分分析后的分析结果中,“成分矩阵”反应的就是主成分载荷矩阵。

进而得到主成分的表达式可以表述为,也是我们所要求得的广告收益评估模型:

提取主成分。

如表3所示,提取前3个特征值的主成分,这两个主成分的累计方差贡献率达到97.201%,表明提取的前3个主成分可以基本反映全部8个指标所具有的信息,能在一定程度上说明搜索引擎广告收益的综合因素。

笔者利用SPSS统计软件进行数据的处理,得出相关系数矩阵的特征值(见表3),并进而用MATLAB来检验(程序见附录),进而得到主成分的表达式可以表述为:

 其中各因素的比例系数只是代表影响能力的强弱,CPC每次点击成本,平均广告排名,和无效点击在第一主成分中占得比例突出的很明显,说明CPC每次点击成本,,平均广告排名,和无效点击对于搜索引擎利益的影响很大,处在第一梯队,而平均广告排名,转化率,每次转换的费用处在第二梯队,CPM每千次成本处在第三梯队,所以未来Google的发展应该更注中第一梯队中的CTR点击率,平均广告排名,和无效点击,按重要性给予各个梯队的关注,因为它们的改善更加能够影响搜索引擎利益。

问题二的模型与求解

对原始数据进行标准化处理计算出各地区的综合得分(见表4),不表示搜索引擎广告获得能力差,评价分值只是反映了搜索引擎广告获得利益能力的相对强弱。

 从表4的综合排名可以看出,所有的年份得分都为正值,这种代表着Google一直在发展。

经过分析2005-2007年这一阶段,Google的评价分值一直在降低,并在2007年达到了极点,这说明了Google在这一段时期没有科学的调配好资源,使得资金没有合理的分配到影响它利益的相关方面,在2007-2011年间,恰恰相反,评价分值在高速增长,所以通过比较这影响两个区间段的各种因素,为我们可以给出合理的控制影响因素方案提供了基础。

七个因素的描述统计量

N

极小值

极大值

均值

标准差

CPC每次点击成本

7

.32

1.24

.7629

.35160

CTR点击率

7

.0030

.0150

.006000

.0043589

平均广告排名

7

3

4

3.74

.364

CPM每千次成本

7

1.95

8.55

3.9871

2.37290

转化率

7

.0380

.0750

.057714

.0146369

每次转换费用

7

6.41

19.74

10.9600

4.69847

无效点击

7

.0032

.1090

.054743

.0323491

有效的N(列表状态)

7

联合第一问的分析,适当的缩小CPC每次点击成本的范围,能使得获得利益能力稳定,也就是确保利益的最大化,以下就是CPC每次点击成本的正态分布Q-Q图,和CPC每次点击成本的趋势正态Q-Q图

经研究发现CPC每次点击成本满足正态分布条件。

正态曲线下,横轴区间(

)内的面积为68.268949%,横轴区间如果是(

)内的面积为95.449974%,横轴区间(

)内的面积为99.730020%

所以对范围进行优化处理,将上表中的CPC每次点击成本的均值和标准值进行

那么这个就是优化之后的范围了:

优化上限

优化下限

1.452036

0.073764

 

在这个范围里面能够确保利益的最大化

接着对剩余的6个因素进行同样的分析得到

 

均值

标准差

优化上限

优化下限

CPC每次点击成本

0.7629

0.3516

1.45

0.07

CTR点击率

0.006

0.0043589

0.01

0.00

平均广告排名

3.74

0.364

4.45

3.03

CPM每千次成本

3.9871

2.3729

8.64

0.00

转化率

0.057714

0.0146369

0.09

0.03

每次转换费用

10.96

4.69847

20.17

1.75

无效点击

0.054743

0.0323491

0.12

0.00

注:

优化上限和优化下限保留两位小数

解出来的优化上限和优化下限就是使得Google广告收益最大化时候,7种因素应该控制的范围。

六、模型评价与推广

模型的优点:

1、主成分分析法集中了原始变量的大部分信息,通过计算综合主成分函数得分,对客观经济现象进行了科学评价!

2、模型的结果是以方程的形式给出来的,简介明了,且模型原理简单易懂,便于推广用于现实生活中。

3、用MATLAB计算最大特征根及对应的特征向量,和SPSS处理数据加快了计算速度,处理速度,减少了计算量;

模型的缺点:

1、因为矩阵经过标准化处理,可能在处理过程中精度没有达到最高,在这方面还需要改进。

2、在考虑影响广告收益因素时,只考虑了其中的一些方面,有一定的局限性,导致了精确度不是太高。

模型的推广

本文中给出的评价标准总体比较合理,但判定指标有限,对其进行的正态缺乏论证。

主成分分析对于广告收益问题准确而合理,不仅解决了各个因素对于收益的影响程度,也指导了公司应该如何更快的发展。

但运用模型解决问题时,仅有每年的数据具有一定的局限性。

 

参考文献

[1]姜启源、谢金星、叶俊(第三版),数学模型,北京:

高等教育出版社,2003;

[2]汪晓银、周保平,数学建模与数学实验,北京:

科学出版社,2010;

[3]何晓群(第二版),多元统计分析,北京:

中国人民大学出版社,2008;

[4].韩中庚,数学建模方法及其应用,北京:

高等教育出版社,2005;

附录

 

程序1:

>>a=[0.380.01545.560.03810.180.0032;0.320.00742.380.047.630.035;

0.620.0033.91.950.076.410.065;0.710.00342.160.0757.020.049;

1.030.0033.63.340.0612.600.055;1.240.0073.78.550.06813.140.067;

1.040.00433.970.05319.740.109]

a=

0.38000.01504.00005.56000.038010.18000.0032

0.32000.00704.00002.38000.04007.63000.0350

0.62000.00303.90001.95000.07006.41000.0650

0.71000.00304.00002.16000.07507.02000.0490

1.03000.00303.60003.34000.060012.60000.0550

1.24000.00703.70008.55000.068013.14000.0670

1.04000.00403.00003.97000.053019.74000.1090

>>cwstd(a)

标准化后的矩阵为:

ans=

0.07120.35710.15270.19920.09410.13270.0084

0.05990.16670.15270.08530.09900.09950.0913

0.11610.07140.14890.06990.17330.08360.1696

0.13300.07140.15270.07740.18560.09150.1279

0.19290.07140.13740.11970.14850.16420.1435

0.23220.16670.14120.30630.16830.17130.1748

0.19480.09520.11450.14220.13120.25730.2844

>>

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 生产经营管理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1