合工大商业研究方法复习资料.docx

资源描述

合工大商业研究方法复习资料.docx

《合工大商业研究方法复习资料.docx》由会员分享，可在线阅读，更多相关《合工大商业研究方法复习资料.docx（21页珍藏版）》请在冰豆网上搜索。

合工大商业研究方法复习资料.docx

合工大商业研究方法复习资料

第一章

课程引例

数据支撑

商业嗅觉

数据分析

商业研究定义

利用科学方法，找出企业经营中遇到的问题，并制定应对策略的系统过程

特征：

1商业研究的基础是科学的方法。

2商业研究的目的是帮助决策者认识并解决企业的特定问题。

3商业研究是一个系统的过程，而非问题描述、数据收集、数据分析、决策建议等一个个的孤立阶段。

1科学方法是指：

人们在认识和改造世界中遵循或运用的、符合科学一般原则的各种途径和手段，包括在理论研究、应用研究、开发推广等科学活动过程中采用的思路、程序、规则、技巧和模式

获得知识的非科学方法：

惯常法，权威法，直觉法，推理法。

2理解：

认识问题是解决问题的基础，认识问题是为了更好的解决问题

认识问题比解决问题更重要

商业研究的问题并不总是显而易见

认识和解决问题都需要运用科学的方法

发现问题的科学方法：

探索性调研、描述性调研、扎根理论、焦点小组访谈、数据挖掘方法

解决问题的科学方法：

问卷调研、运筹学方法、统计学方法、人工智能方法、数据挖掘方法

3描述→预测→解释→控制（由下至上,认识问题到解释问题，努力低到高）

商业研究的类型

应用商业研究（appliedresearch）：

为解决特定的问题或是在采取某项行动或政策前所做的研究。

它要求解决现实的管理问题，并为社会、组织或群体带来实际利益。

基础商业研究（basicresearch）：

通过对企业现实问题的观察、概括和抽象，探讨有关管理学科规律性的知识，对管理行为和现象作出机理性的解释，证实或证伪现有理论并提出新理论。

先探讨某些特定问题如何被解决，以增加知识，然后再利用这些知识来帮助管理者解决问题

探索性研究、描述性研究、因果性研究

探索性研究主要用来理清不明的状况，或发掘潜在的商业机会。

探索性研究并不能给我们一个做决策的确证，但是却有助于我们避免商业研究中常犯的错误（可口可乐、教学质量、新产品开发）

描述性研究主要用来描述物体、人物、组织或环境的特征。

在给定的情况下，通过描述Who、What、Where、Why、How，给研究人员一个图景。

（人口普查、就业趋势调查、消费者特征）

因果性研究的目的就是确定因果关系。

如果决策者能够知道导致销量、股价、员工满意度变化的原因，他们就可以做出正确且有利的决策。

举例理解

1哪些因素会影响消费者购买Thinkpad笔记本

2购买Thinkpad笔记本的消费者和没有购买Thinkpad笔记本的消费者分别具有怎样的特征

3消费者特征与购买决策有什么关联关系？

商业研究的方法与过程（重要）

方法论（methodology）：

是较高层次的概念，指探求事物的真相、性质、规律等的一般途径，它构成了我们完成一项任务的一般途径或路线，而不是告诉我们如何完成任务的具体细节。

研究方法论是研究的逻辑，所涉及的是规范一门学科的原理、原则和方法的体系。

方法（method）：

是较低层次的概念，指为实现研究目标在研究过程中的某些特定环节所采用的具体技术、工具或程序。

具体方法和技术→研究方法→方法论

商业研究的推理方式：

归纳法与演绎法

归纳法：

指根据所观察到的事实，逻辑性地建立一般性命题。

具体事实→抽象理论

例：

我们观察到张三、李四等许多人本科学的都是电子商务，进而发现他们工作后升职都很快，所以我们提出一个命题：

本科学电子商务有利于以后工作升职。

演绎法：

指通过逻辑性地推广已知事实，从而获得结论的过程。

抽象理论→具体事实

例：

本科学电子商务有利于以后工作升职，段舜禹现在是电子商务专业的学生，我们便可推知段同学工作后也可能很快升职

社会研究的方法体系2——研究方法

调查法：

☐抽样

☐问卷

☐统计分析

☐相关关系等

用来描述一个大的总体状况，或者探讨不同变量之间的相关关系

实验法

☐实验操控

☐实验操控的检验

☐统计分析

☐因果关系等

探索和证明两个变量之间的因果关系

实地研究

☐参与观察

☐个案研究

☐访谈

☐资料的归纳整理

深入理解社会现实，提炼和建构理论

文献研究

☐内容分析

☐编码与解码

☐二次分析

☐现有统计分析等

关注那些既不会引起研究对象的任何反应、又是其他方式在时间上和空间上无法达到的社会现象

加上运筹统计人工智能数据挖掘

研究过程中所使用的各种特定的操作程序和技术。

资料收集方法：

自填问卷的方法；结构访谈和非结构访谈；局外观察与参与观察的方法；随机抽样的方

资料分析方法：

问卷资料的编码方法；数据的统计分析方法

特定的技术：

量表制作技术；变量测量技术；实验控制技术

运筹学：

线性规划、非线性规划、动态规划

统计学：

回归、参数估计、Probit模型

人工智能：

遗传算法、蚁群算法、鱼群算法

数据挖掘：

关联、分类、聚类、时序

商业研究的过程

开始时有观察，文献查询，制定计划前有理论框架与衍生假设

1、观察

2、通过非正式访谈搜集信息

3、通过文献查阅以获得更多信息

4、形成理论

5、提出假设

6、资料搜集

7、资料分析

8、演绎

商业研究的伦理与道德

研究主题确定阶段

伪研究问题

数据收集阶段

非法途径

隐私保护

知情权和退出权

数据处理阶段

严谨科学的处理过程

研究报告

研究结果的如实呈现

参与者身份推断（研究结果的隐私保护问题）

伪研究主要是指那些目的不是为了收集信息支持决策，而是为了支持某种既定观点或满足其他需要的研究。

研究结果的隐私保护问题

第二章

问题的界定

问题：

指实际现象与预期之间有偏差的情形

判断：

员工离职率高、产品线利润下降、市场份额降低这些情形都不是问题。

在现实生活中，我们观察到的往往是症状，问题与症状的区别在于：

症状是外在的现象，是管理者想要解决的东西；而问题才是造成这些症状的内在原因，才是研究者应该去探究的东西

借助观察、访谈、文献阅读等手段界定研究问题

问题界定中容易出现的两类错误：

过宽——得到很多无用的信息；

过窄——不能全面解决问题

理论框架构建（重要）

又称为概念模型（conceptualmodel），是描述变量及变量之间关系的一种直观的图形。

通过它可以建立理论，并找出研究问题中几个变量间的合理关系

理论框架的重要性

理论框架如同一张“研究地图”，按图索骥，可以使我们思路更加清晰，提高研究效率。

整个研究都是建立在理论框架的基础上，即使有时在某些应用性研究中无需发展可检验的假设，开发良好的理论框架对检验研究问题而言也是相当重要的。

变量：

指具有可测性的概念，其属性在幅度上和强度上的变化程度可以加以度量。

如产量、工作满意度、学习动机等。

属性：

指变量的某种特征。

变量和属性的区别：

变量包含若干属性，是按逻辑归类的一组属性；而属性总是依附某个变量而言的

理论框架的构建

1变量

2变量之间的关系：

相关，因果，中介，调节

变量的类型1——因变量（dependentvariable）

是研究者主要关心的变量。

研究者的目标在于理解及描述因变量，并解释或预测其变化。

变量的类型2——自变量（independentvariable）

自变量：

指以正向或负向方式影响因变量的变量。

自变量与因变量同时存在，且自变量每增加1单位，因变量也会因此而增加或减少。

因变量的改变，源自自变量的改变。

变量的类型3——调节变量（moderatingvariable）

指伴随自变量与因变量的关系，具有附带影响的变量。

调节变量的存在，改变了自变量与因变量间原有的关系。

从统计学上看，当调节变量和自变量的乘积项（调节变量×自变量）对因变量有显著影响时，调节变量即存在

构建理论框架需要注意的问题：

与研究有关的变量均需清楚地加以界定并归类。

应说明两个或两个以上的变量有何关系以及为何有关。

可依据过去的理论和研究发现，也可依据问题界定过程中的访谈或观察进行逻辑推理。

如果可以依据过去的研究或逻辑推理确定变量关系的方向或性质，则应说明变量之间是正相关还是负相关，是大于还是小于。

应该提供描述理论框架的系统图，以便利读者形象地了解理论化的变量关系

数据收集方法

二手数据：

为其他目的，而不是为当前进行的研究所收集的数据。

网络爬虫是一种按照一定的规则，自动的抓取互联网信息的程序或者脚本。

利用网络爬虫，企业可以获得特定网站的拓扑结构、页面内容等数据。

问卷调查法是调查者运用统一设计的问卷搜集数据的一种研究方法。

研究者将所要研究的问题编制成问题表格，以邮寄方式、当面作答等方式填答，从而了解被试对某一现象或问题的看法和意见

网络爬虫的基本原理与应用

从一个或若干初始网页的URL开始

获得初始网页上的内容和URL

将当前页面上的URL放入抓取队列

直到满足停止条件

问卷调查法

问卷调查法是商业研究数据来源的主要方式

拦截调查，入户调查，电话调查

问卷设计流程

界定问题理论框架设计问卷测试问卷修改问卷

问卷调查法

内容结构设计技巧版式要求问卷分析

问卷调查法-内容结构

1标题

主要是用来概括说明本次调查的研究主题，使被访者对所要回答的问题有一个大致的了解

应该尽可能得简明扼要，一目了然，最好是能够激发被访者的兴趣度和责任感

2.说明词

主要是用来说明调查的目的、需要了解的问题及调查结果的用途等。

有些问卷还要有问候语，以引起被访者的重视。

同时还要向被访者介绍调查组织单位、请求被访者合作、向被访者表示感谢等

用词语气必须礼貌、热情、诚恳、大方；内容主要是简要介绍调查的目的、需了解的问题及调查结果的用途等；还需对涉及被访者的隐私信息或商业机密作保密承诺，以争取被访者的积极参与。

3.填表说明

主要是用来规范和帮助被访者准确回答问卷问题。

填表说明可以集中放在问卷前面，也可以分散到各有关问题之前。

尤其对自填式问卷，填表说明一定要详细清楚，而且格式位置要醒目

由于填表说明是为了帮助和规范被访者准确回答问卷问题，所以在设计时必须要做到格式位置醒目、内容详细清楚；语言表述要求通俗易懂，忌用生僻的、过于专业的词语或是语句。

4.正文

正文是问卷的核心部分。

它主要是以提问的方式提供给被访者，让被访者进行选择和回答。

这部分内容设计得好坏关系到整个问卷的成败，也关系到调查者能否很好地完成信息收集、实现调查目标。

市场调查问卷正文部分的设计需遵守“目的性原则”、“可接受原则”、“顺序性原则”、“逻辑性原则”、“简明性原则”和“匹配性原则”

5.作业记录

主要是用来收集问卷调查实施过程信息，从而核实问卷调查作业的执行情况和完成情况，以便对问卷调查人员的工作进行有效监督和及时检查。

内容主要是记录调查人员姓名、访问日期、访问时间、访问地点等；有些调查还需记录调查过程中的特殊事件以及被访者的配合情况等

问卷调查法-设计技巧

问题内容：

事实型，意见型，困窘型

结构型问卷（封闭性问题，适合于规模较大、内容较多的市场调查）

开放式问卷（开放式问题，适合于小规模的深层访谈或试探性调查）

问题类型-封闭式问题

复选式问题

复选单选式

复选限选式

复选任选式

排序式问题

确定相关变量的顺序

是否式问题

是/否

评级问题

非常同意，同意，不同意，非常不同意

矩阵式问题

或栅格问题，同时记录两个或两个以上类似问题的答复。

问卷调查法-设计技巧

1.避免一句多问现象

2.避免作出假设前提

3.避免使用专业词汇

4.避免提一般性问题

5.避免使用不确切的词

6.避免提诱导性问题

7.避免存在过多计算

8.避免提时间久远问题

9.避免直问敏感问题

问题次序

先封闭性问题，后开放性问题

先一般性问题，后敏感性问题

先简单后复杂

现总结后特定

版式要求4略

问卷调查法-编码（重要）

根据一定的规则将调研结果转换为可进行统计分析的数据资料的过程。

矩阵式数据数据要求每一横行为一个个案（Case），纵列按变量排列，形成矩阵格式

数据预处理

现实数据通常是不完整的、不准确的、不一致的

不完整—删除或补齐—缺失值处理

不准确—找出并矫正—噪音数据检测

缺失值处理

人工填充、忽略元组（删除存在缺失值的元组（记录））、全局常量填充、中心趋势度量填充（均值、中位数、众数、中列数）、同类样本的中心趋势度量填充、最可能的值填充

噪音数据检测

可视化、统计描述技术、聚类技术、分箱技术（将数据排序，放入“等深”或者“等宽”的箱子中，将同一箱子中的数据，利用均值、中位数、箱边界等指标进行平滑）、回归、离群点分析

噪音数据：

被测量变量的随机错误或偏差

问卷调查法-分析

v频数分析

v描述性分析

v交叉分析

v探索性分析

描述集中趋势的统计量

v均值（Mean）

v众数（Mode）

v中位数（Median）

v总和（Sum）

v百分位数（PercentileValue）

离散

样本方差（Variance）

样本标准差（Std.deviation）

极差（Range）

第三章

定性研究方法

定性研究是指研究者不使用数字测度，仅根据研究目标对研究对象做详尽描述。

这类研究重在挖掘真实的内在逻辑，提出新的创见。

定性研究一般选定较小的样本对象进行深度的的访谈和观察，以进一步弄清问题，发掘内涵，为随后的定量分析作准备。

观察法

研究者有目的、有计划地在自然情景下，通过感官或借助于一定的科学仪器，对人们行为的各种资料进行搜集的系统过程

自然，设计，掩饰，机器观察法

访谈法

由访谈员根据研究所确定的要求与目的，按照访谈提纲，通过个别面谈或集体交谈的方式系统而有计划地收集资料的一种方法

访谈与日常交谈的区别：

目的性和计划性

访谈提纲的引领性

单向性

访谈方式直接间接

访谈人数个体集体

访谈控制结构化和非结构化

结构化访谈又称标准化访谈、问卷访谈。

其特点就是要求对整个访谈过程严格控制和标准化

又称非标准化访谈、深度访谈、自由访谈，他是一种半控制和无控制的访谈

焦点小组访谈

自由联想技巧或填空法

句子故事完成法

词语联想测试法

投射法

第五章

运筹学方法

运筹学的主要方法

线性规划与非线性规划

整数规划与非整数规划

动态规划

图与网络分析

单目标决策和多目标决策

排队论

在线动态捆绑模型

不仅要推荐消费者满意的产品，还要制定有效的价格策略吸引消费者购买推荐的产品。

提出一种动态捆绑定价模型（OnlineDynamicBundlePricingmodel，简称ODBP模型），对消费者在线购物的决策过程进行建模：

当消费者更新购物车后，首先利用个性化产品推荐策略帮助消费者找到需要的产品；然后，将每一件推荐产品与购物车中的产品进行捆绑，计算推荐产品的捆绑价格。

由于产品的捆绑价格低于目前的销售价格，消费者总是可以从后续购物过程中得到额外的节省

促销推荐优化模型

v促销产品

☐促销前不会购买该产品的消费者

☐促销前可能购买该产品的消费者

v互补品和独立品

☐促销前不会购买该产品的消费者

☐促销前可能购买该产品的消费者

v替代品

☐促销前可能购买替代品的消费者

☐由于企业推荐，意识到替代品存在的消费者

☐如果企业不推荐，不会购买替代品的消费者

1）PNR策略（PromotionwithNoRecommendation）：

假设企业以本文得到的最优价格折扣进行促销，但是不进行相关产品的推荐；

（2）MCR策略（RecommendproductswiththeMinimumCostRatios）：

假设企业以本文获得的最优价格折扣进行促销，同时从SUB，COM和IND中选择成本率最低（成本/销售价格）的10件产品进行推荐。

在线运费规划模型

模型求解方法

遗传算法

第六章数据挖掘方法（重要）

数据挖掘方法

数据挖掘是从大量的数据中抽取出潜在的、不为人知的有用信息、模式和趋势

Ø数据选择：

从数据库中提取与分析任务相关的数据

Ø数据预处理：

数据变换或统一成适合挖掘的形式，包括标准化、离散化和属性约简等操作

Ø数据挖掘：

基本步骤，使用智能方法提取数据模式

Ø模式评估：

根据某种兴趣度度量，识别提供知识的真正有用的模式

Ø知识表示：

使用可视化和知识表示技术，向用户提供挖掘的知识

v数据预处理方法

☐离散化、属性选择、主成分分析

v关联分析

☐Apriori、FP树

v数据分类

☐贝叶斯分类、KNN、决策树

v数据聚类

☐K-Means、层次聚类、基于密度的聚类

v时序分析

☐改进的Apriori

数据挖掘方法概述

☐数据选择：

从数据库中提取与分析任务相关的数据。

☐数据预处理：

数据变换或统一成适合挖掘的形式，包括标准化、离散化和属性约简等操作

☐数据挖掘：

基本步骤，使用智能方法提取数据模式

☐模式评估：

根据某种兴趣度度量，识别提供知识的真正有用的模式

☐知识表示：

使用可视化和知识表示技术，向用户提供挖掘的知

个性化推荐方法（重要）

Item-to-Item方法

1将用户购买信息排序

2选择购买b产品的用户排序

3对于2的用户去掉b产品再排序

4计算各产品与b的相关性

或者总排序用向量计算

Sim

文本分析方法

文本检索是指根据文本内容，如关键字、语意等对文本集合进行检索、分类、过滤等

文本检索方法（PageRank方法）

Google排名运算法则（排名公式）的一部分，是Google用于用来标识网页的等级/重要性的一种方法，是Google用来衡量一个网站的好坏的唯一标准。

将从网页A指向网页B的链接解释为由网页A对网页B所投的一票。

PageRank根据网页B所收到的投票数量来评估该页的重要性

无论j有多少个超链接，只要j指向i，i都将得到与j一样的重要性。

当j有多个超链接时，这个思想就会造成不合理的情况。

例如：

一个新开的网站X只有两个指向它的超链接，一个来自著名并且历史悠久的门户网站F，另一个来自不为人知的网站U。

根据公式，就会得到X比F更优质的结论。

弥补上述缺陷的一个简单方法是当j有多个超链接（假设个数为N），每个链接得到的重要性为R（j）/N。

先假定所有网页的排名是相同的，或者给所有网页一个初始PR值，并且根据这个初始值，算出各个网页的第一次迭代排名，然后再根据第一次迭代排名算出第二次的排名。

从理论上证明了不论初始值如何选取，这种算法都保证了网页排名的估计值能收敛到他们的真实值。

总值是一要做归一化

文本检索方法（TF-IDF方法）

TF-IDF根据词频（TermFrequency）和反文档频率（InverseDocumentFrequency）来度量一个文档与关键词的匹配程度。

如果一个查询包含关键词w1,w2,...,wN,它们在一篇特定网页中的词频分别是:

TF1,TF2,...,TFN。

（TF:

termfrequency）。

那么，这个查询和该网页的相关性就是:

TF1+TF2+...+TFN。

一个词预测检索主题的能力越强，权重就越大，反之，权重越小

假定一个关键词w在Dw个网页中出现过，那么Dw越大，w的权重越小，反之亦然

log（D/Dw）其中D是全部网页数。

网页重要性=0.002×log（100000）+0.005×log

（2）

关联分类方法（复杂）

关联分类（Associativeclassification）是一种建立在关联规则挖掘基础上的新的分类技术

关联分类的核心思想是利用关联规则挖掘技术，通过频繁项集挖掘、分类规则生成以及规则剪枝等过程获取条件属性与类别属性的关联关系，并利用生成的分类关联规则构建分类系统

覆盖训练数据（Databasecoverage）的方法删除冗余

首先将规则按照一定指标进行优劣排序；

然后，从最优规则开始扫描训练数据集，如果存在与规则匹配的实例，则在规则集合中保留该规则，而将其覆盖的实例从训练集中删除；

直至训练集为空

研究报告写作

摘要三段论

商业研究解决的是什么问题，解决这些问题是多么的有意义

为了解决这些问题，做了哪几方面的工作（工作的步骤或解决的思路）

得到了哪些结论，这些结论对改进企业运营有什么重要的作用

引言是摘要的扩充

展开阅读全文