1、南开大学春季学期数据科学导论在线作业附参考答案南开大学2021年春季学期(1709、1803、1809、1903、1909、2003、2009、2103)数据科学导论 在线作业附参考答案试卷总分:100 得分:100一、单选题 (共 20 道试题,共 40 分)1.单层感知机是由()层神经元组成。A.一B.二C.三D.四答案:B2.K-means聚类适用的数据类型是()。A.数值型数据B.字符型数据C.语音数据D.所有数据答案:A3.在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或()。A.最优回归线B.最优分布线C.最优预测线D.最佳分布线答案:A4.例如将工资收入属性值映射到-1,
2、1或者0,1内属于数据变换中的()A.简单函数变换B.规范化C.属性构造D.连续属性离散化答案:B更多加微boge306195.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。A.减小,减小B.减小,增大C.增大,减小D.增大,增大答案:B6.聚类的最简单最基本方法是()。A.划分聚类B.层次聚类C.密度聚类D.距离聚类答案:A7.设X=1,2,3是频繁项集,则可由X产生()个关联规则。A.4B.5C.6D.7答案:C8.在回归分析中,自变量为(),因变量为()。A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量D.连续型变量,连续型变量答案:D9.哪一项不属于规范化的方法()A.最小-最大规范化B.零-均值规范化C.小数定标规范化D.中位数规范化答案:D10.单层感知机模型属于()模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型D.多分类的非线性分类模型答案:A11.以下哪个不是处理缺失值的方法()A.删除记录B.按照一定原则补充C.不处理D.随意填写答案:D12.我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。