ImageVerifierCode 换一换
格式:DOCX , 页数:12 ,大小:17.85KB ,
资源ID:556735      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/556735.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(奥鹏南开20春学期《数据科学导论》在线作业标准答案.docx)为本站会员(b****0)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

奥鹏南开20春学期《数据科学导论》在线作业标准答案.docx

1、奥鹏南开20春学期数据科学导论在线作业标准答案南开大学(本部)数据科学导论在线作业参考答案20春学期(1709、1803、1809、1903、1909、2003)数据科学导论在线作业1. 实体识别的常见形式()【选项】:A 同名异义B 异名同义C 单位不统一D 属性不同【答案】:D2. 例如将工资收入属性值映射到-1,1或者0,1内属于数据变换中的()【选项】:A 简单函数变换B 规范化C 属性构造D 连续属性离散化【答案】:B3. 单层感知机模型属于()模型。【选项】:A 二分类的线性分类模型B 二分类的非线性分类模型C 多分类的线性分类模型D 多分类的非线性分类模型【答案】:A4. 通过变

2、量标准化计算得到的回归方程称为()。【选项】:A 标准化回归方程B 标准化偏回归方程C 标准化自回归方程D 标准化多回归方程【答案】:A5. 数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()【选项】:A 异常值B 缺失值C 不一致的值D 重复值【答案】:C6. 以下哪些不是缺失值的影响()【选项】:A 数据建模将丢失大量有用信息B 数据建模的不确定性更加显著C 对整体总是不产生什么作用D 包含空值的数据可能会使建模过程陷入混乱,导致异常的输出【答案】:C7. 层次聚类适合规模较()的数据集【选项】:A

3、大B 中C 小D 所有【答案】:C8. 以下哪个不是处理缺失值的方法()【选项】:A 删除记录B 按照一定原则补充C 不处理D 随意填写【答案】:D9. 聚类的最简单最基本方法是()。【选项】:A 划分聚类B 层次聚类C 密度聚类D 距离聚类【答案】:A10. 具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。【选项】:A 1,线性B 2,线性C 1,非线性D 2,非线性【答案】:A11. 考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用 合并策略,由候选产生过程得到

4、4-项集不包含()【选项】:A 1,2,3,4B 1,2,3,5C 1,2,4,5D 1,3,4,5【答案】:C12. 在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。【选项】:A 减小,减小B 减小,增大C 增大,减小D 增大,增大【答案】:B13. 手肘法的核心指标是()。【选项】:A SESB SSEC RMSED MSE【答案】:B14. 变量之间的关系一般可以分为确定性关系与()。【选项】:A 非确定性关系B 线性关系C 函数关系D 相关关系【答案】:A15. 以下哪一项不属于数据变换()【选项】:A 简单函数变换B 规范化C 属性合并D 连续属性离散化

5、【答案】:C16. 以下哪一项不是特征选择常见的方法()【选项】:A 过滤式B 封装式C 嵌入式D 开放式【答案】:D17. 通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()【选项】:A 简单函数变换B 规范化C 属性构造D 连续属性离散化【答案】:C18. 比如一张表,从业务上讲,一个用户应该只会有一条记录, 那么如果某个用户出现了超过一条的记录,这就产生了()【选项】:A 异常值B 不一致的值C 重复值D 缺失值【答案】:C19. 某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说

6、明()。【选项】:A 产量每增加一台,单位成本增加100元B 产量每增加一台,单位成本减少1.2元C 产量每增加一台,单位成本平均减少1.2元D 产量每增加一台,单位平均增加100元【答案】:C20. 层次聚类对给定的数据进行()的分解。【选项】:A 聚合B 层次C 分拆D 复制【答案】:B21. K-means聚类中K值选取的方法是()。【选项】:A 密度分类法B 手肘法C 大腿法D 随机选取【答案】:A.B22. 数据科学具有哪些性质()【选项】:A 有效性B 可用性C 未预料D 可理解【答案】:A.B.C.D23. 多层感知机的学习过程包含()。【选项】:A 信号的正向传播B 信号的反向

7、传播C 误差的正向传播D 误差的反向传播【答案】:A.D24. 系统日志收集的基本特征有()【选项】:A 高可用性B 高可靠性C 可扩展性D 高效率【答案】:A.B.C25. 层次聚类的方法是()【选项】:A 聚合方法B 分拆方法C 组合方法D 比较方法【答案】:A.B26. 距离度量中的距离可以是()【选项】:A 欧式距离B 曼哈顿距离C Lp距离D Minkowski距离【答案】:A.B.C.D27. 聚类的主要方法有()。【选项】:A 划分聚类B 层次聚类C 密度聚类D 距离聚类【答案】:A.B.C28. 相关性的分类,按照相关的方向可以分为()。【选项】:A 正相关B 负相关C 左相关

8、D 右相关【答案】:A.B29. 对于多层感知机,()层拥有激活函数的功能神经元。【选项】:A 输入层B 隐含层C 输出层【答案】:B.C30. 什么情况下结点不用划分()【选项】:A 当前结点所包含的样本全属于同一类别B 当前属性集为空,或是所有样本在所有属性上取值相同C 当前结点包含的样本集为空D 还有子集不能被基本正确分类【答案】:A.B.C31. 信息熵越大,数据信息的不确定性越小。【选项】:T 对F 错【答案】:B32. K-means算法采用贪心策略,通过迭代优化来近似求解。【选项】:T 对F 错【答案】:A33. K-means聚类是发现给定数据集的K个簇的算法。【选项】:T 对

9、F 错【答案】:A34. 特征的信息增益越大,则其越不重要。【选项】:T 对F 错【答案】:B35. 决策树的输入为训练集,输出为以node为根结点的一棵决策树【选项】:T 对F 错【答案】:A36. 探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。【选项】:T 对F 错【答案】:A37. sigmoid函数属于阶跃函数,是神经网络中常见的激活函数。【选项】:T 对F 错【答案】:B38. 在数据预处理时,无论什么情况,都可以直接将异常值删除【选项】:T 对F 错【答案】:B39. 一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增

10、益来进行决策树的最优特征选择。【选项】:T 对F 错【答案】:A40. 当特征为离散型时,可以使用信息增益作为评价统计量。【选项】:T 对F 错【答案】:A41. 支持度是衡量关联规则重要性的一个指标。【选项】:T 对F 错【答案】:A42. 交叉表被广泛用于调查研究,商业智能,工程和科学研究【选项】:T 对F 错【答案】:A43. BFR聚类簇的坐标可以与空间的坐标保持一致。【选项】:T 对F 错【答案】:B44. 在树的结构中,特征越重要,就越远离根节点。【选项】:T 对F 错【答案】:B45. 神经网络中误差精度的提高可以通过增加隐含层中的神经元数目来实现。【选项】:T 对F 错【答案】:A46. 多元线性回归模型中,标准化偏回归系数没有单位。【选项】:T 对F 错【答案】:A47. 单层感知机对于线性不可分的数据,学习过程也可以收敛。【选项】:T 对F 错【答案】:B48. 利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。【选项】:T 对F 错【答案】:B49. EDA可以最大化数据分析者对数据集和数据集底层结构的洞察力,并且为分析者提供数据集中包含的各类信息。【选项】:T 对F 错【答案】:A50. 对于项集来说,置信度没有意义。【选项】:T 对F 错【答案】:A

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1