1、南开大学21春学期数据科学导论在线作业921春学期(1709、1803、1809、1903、1909、2003、2009、2103)数据科学导论在线作业BFR聚类是用于处理数据集()的k-means变体。A:大B:中C:小D:所有答案:A考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用 合并策略,由候选产生过程得到4-项集不包含()A:1,2,3,4B:1,2,3,5C:1,2,4,5D:1,3,4,5答案:C以下哪一项不是特征选择常见的方法()A:过滤式B:封装式C:嵌入式D:开放式答案:
2、D例如将工资收入属性值映射到-1,1或者0,1内属于数据变换中的()A:简单函数变换B:规范化C:属性构造D:连续属性离散化答案:B对于k近邻法,下列说法错误的是()。A:不具有显式的学习过程B:适用于多分类任务C:k值越大,分类效果越好D:通常采用多数表决的分类决策规则答案:C手肘法的核心指标是()。A:SESB:SSEC:RMSED:MSE答案:B在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。A:减小,减小B:减小,增大C:增大,减小D:增大,增大答案:B变量之间的关系一般可以分为确定性关系与()。A:非确定性关系B:线性关系C:函数关系D:相关关系答案:A某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明()。A:产量每增加一台,单位成本增加100元B:产量每增加一台,单位成本减少1.2元C:产量每增加一台,单位成本平均减少1.2元D:产量每增加一台,单位平均增加100元答案:C层次聚类对给定的数据进行()的分解。A:聚合B:层次C:分拆D:复制答案:B下列两个变量之间的关系中,哪个是函数关系()。A:人的性别和他的身高