1、21春学期南开大学数据科学导论在线作业及答案21春学期(1709、1803、1809、1903、1909、2003、2009、2103)数据科学导论在线作业1:通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()A、简单函数变换B、规范化C、属性构造D、连续属性离散化答案:C2:聚类的最简单最基本方法是()。A、划分聚类B、层次聚类C、密度聚类D、距离聚类答案:A3:在回归分析中,自变量为(),因变量为()。A、离散型变量,离散型变量B、连续型变量,离散型变量C、离散型变量,连续型变量D、连续型变量,连续型变量答案:D4:以下
2、哪一项不是特征工程的子问题()A、特征创建B、特征提取C、特征选择D、特征识别答案:D5:对于k近邻法,下列说法错误的是()。A、不具有显式的学习过程B、适用于多分类任务C、k值越大,分类效果越好D、通常采用多数表决的分类决策规则答案:C6:通过变量标准化计算得到的回归方程称为()。A、标准化回归方程B、标准化偏回归方程C、标准化自回归方程D、标准化多回归方程答案:A7:在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。A、减小,减小B、减小,增大C、增大,减小D、增大,增大答案:B8:Apriori算法的加速过程依赖于以下哪个策略( )A、抽样B、剪枝C、缓冲D、并行答案:B9:下列两个变量之间的关系中,哪个是函数关系()。A、人的性别和他的身高B、人的工资与年龄C、正方形的面积和边长D、温度与湿度答案:C10:考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用 合并策略,由候选产生过程得到4-项集不包含()A、1,2,3,4B、1,2,3,5C、1,2,4,5