南开20秋学期《数据科学导论》在线作业.docx
《南开20秋学期《数据科学导论》在线作业.docx》由会员分享,可在线阅读,更多相关《南开20秋学期《数据科学导论》在线作业.docx(4页珍藏版)》请在冰点文库上搜索。
南开20秋学期《数据科学导论》在线作业
20秋学期(1709、1803、1809、1903、1909、2003、2009)《数据科学导论》在线作业
对于k近邻法,下列说法错误的是()。
A:
不具有显式的学习过程
B:
适用于多分类任务
C:
k值越大,分类效果越好
D:
通常采用多数表决的分类决策规则
答案:
C
以下哪个不是处理缺失值的方法()
A:
删除记录
B:
按照一定原则补充
C:
不处理
D:
随意填写
答案:
D
在一元线性回归模型中,残差项服从()分布。
A:
泊松
B:
正态
C:
线性
D:
非线性
答案:
B
一元线性回归中,真实值与预测值的差称为样本的()。
A:
误差
B:
方差
C:
测差
D:
残差
答案:
D
Apriori算法的加速过程依赖于以下哪个策略()
A:
抽样
B:
剪枝
C:
缓冲
D:
并行
答案:
B
数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()
A:
异常值
B:
缺失值
C:
不一致的值
D:
重复值
答案:
C
单层感知机模型属于()模型。
A:
二分类的线性分类模型
B:
二分类的非线性分类模型
C:
多分类的线性分类模型
D:
多分类的非线性分类模型
答案:
A
层次聚类适合规模较()的数据集
A:
大
B:
中
C:
小
D:
所有
答案:
C
通过构造新的指标-线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()
A:
简单函数变换
B:
规范化
C:
属性构造
D:
连续属性离散化
答案:
C
例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()
A:
简单函数变换
B:
规范化
C:
属性构造
D:
连续属性离散化
答案:
B
在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用()。
A:
越小
B:
越大
C:
无关
D:
不确定
答案:
B
考虑下面的频繁3-项集的集合:
{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()