首页>>平时在线

南开大学20秋学期《数据科学导论》在线作业【标准答案】

发布时间:2020-11-30 09:40:09来源admin阅读数(28)

答案请添加微信:opzy100或QQ:519688598
可做奥鹏全部院校平台作业论文!!!
单选题 多选题 判断题
一、单选题
共20题,40分
 
1
2分
 
某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。
A产量每增加一台,单位成本增加100元
B产量每增加一台,单位成本减少1.2元
C产量每增加一台,单位成本平均减少1.2元
D产量每增加一台,单位平均增加100元
2
2分
 
置信度(confidence)是衡量兴趣度度量( )的指标。
A简洁性
B确定性
C实用性
D新颖性
3
2分
答案请添加 微信:opzy100或QQ:519688598
实体识别属于以下哪个过程()
A数据清洗
B数据集成
C数据规约
D数据变换
4
2分
 
在一元线性回归模型中,残差项服从()分布。
A泊松
B正态
C线性
D非线性
5
2分
 
手肘法的核心指标是()。
ASES
BSSE
CRMSE
DMSE
6
2分
 
单层感知机模型属于()模型。
A二分类的线性分类模型
B二分类的非线性分类模型
C多分类的线性分类模型
D多分类的非线性分类模型
7
2分
 
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()
A关联规则发现
B聚类
C分类
D自然语言处理
8
2分
 
下列两个变量之间的关系中,哪个是函数关系()。
A人的性别和他的身高
B人的工资与年龄
C正方形的面积和边长
D温度与湿度
9
2分
 
聚类是一种()。
A有监督学习
B无监督学习
C强化学习
D半监督学习
10
2分
 
以下哪些不是缺失值的影响()
A数据建模将丢失大量有用信息
B数据建模的不确定性更加显著
C对整体总是不产生什么作用
D包含空值的数据可能会使建模过程陷入混乱,导致异常的输出
11
2分
 
多层感知机是由()层神经元组成。
A二
B三
C大于等于二层
D大于等于三层
12
2分
 
以下哪一项不属于数据变换()
A简单函数变换
B规范化
C属性合并
D连续属性离散化
13
2分
 
以下哪一项不是特征工程的子问题()
A特征创建
B特征提取
C特征选择
D特征识别
14
2分
 
哪一项不属于规范化的方法()
A最小-最大规范化
B零-均值规范化
C小数定标规范化
D中位数规范化
15
2分
 
在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。
A减小,减小
B减小,增大
C增大,减小
D增大,增大
16
2分
 
在回归分析中,自变量为(),因变量为()。
A离散型变量,离散型变量
B连续型变量,离散型变量
C离散型变量,连续型变量
D连续型变量,连续型变量
17
2分
 
具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。
A1,线性
B2,线性
C1,非线性
D2,非线性
18
2分
 
以下属于关联分析的是( )
ACPU性能预测
B购物篮分析
C自动判断鸢尾花类别
D股票趋势建模
19
2分
 
通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()
A简单函数变换
B规范化
C属性构造
D连续属性离散化
20
2分
 
我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。
A自上而下
B自下而上
C自左而右
D自右而左
二、多选题
共10题,20分
 
1
2分
 
多层感知机的学习过程包含()。
A信号的正向传播
B信号的反向传播
C误差的正向传播
D误差的反向传播
2
2分
 
下面例子属于分类的是()
A检测图像中是否有人脸出现
B对客户按照贷款风险大小进行分类
C识别手写的数字
D估计商场客流量
3
2分
 
距离度量中的距离可以是()
A欧式距离
B曼哈顿距离
CLp距离
DMinkowski距离
4
2分
 
Apriori算法的计算复杂度受()影响。
A支持度阈值
B项数
C事务数
D事务平均宽度
5
2分
 
下列选项是BFR的对象是()
A废弃集
B临时集
C压缩集
D留存集
6
2分
 
系统日志收集的基本特征有()
A高可用性
B高可靠性
C可扩展性
D高效率
7
2分
 
一元回归参数估计的参数求解方法有()。
A最大似然法
B距估计法
C最小二乘法
D欧式距离法
8
2分
 
k近邻法的基本要素包括()。
A距离度量
Bk值的选择
C样本大小
D分类决策规则
9
2分
 
K-means聚类中K值选取的方法是()。
A密度分类法
B手肘法
C大腿法
D随机选取
10
2分
 
聚类的主要方法有()。
A划分聚类
B层次聚类
C密度聚类
D距离聚类
三、判断题
共20题,40分
 
1
2分
 
决策树分类时将该结点的实例强行分到条件概率大的那一类去
A对
B错
2
2分
 
获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。
A对
B错
3
2分
 
阶跃函数具有不光滑、不连续的特点。
A对
B错
4
2分
 
sigmoid函数属于阶跃函数,是神经网络中常见的激活函数。
A对
B错
5
2分
答案请添加 微信:opzy100或QQ:519688598
选择较小的k值,相当于用较小的邻域中的训练实例进行预测,学习的“近似误差”会减小,“估计误差”会增大,预测结果会对近邻的点实例点非常敏感。
A对
B错
6
2分
 
子集产生本质上是一个搜索过程,该过程可以从空集、随机产生的一个特征子集或者整个特征集开始。
A对
B错
7
2分
 
决策树内部结点表示一个类,叶结点表示一个特征或属性
A对
B错
8
2分
 
朴素贝叶斯分类器有简单、高效、健壮的特点,但某些属性可能会降低分类器的性能
A对
B错
9
2分
 
信息熵越小,样本结合的纯度越低
A对
B错
10
2分
 
决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得各个子数据集有一个最好的分类的过程,这一过程对应着特征空间的划分,也对应着决策树的构建
A对
B错
11
2分
 
当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。
A对
B错
12
2分
 
数据分析师的任务:用模型来回答具体问题,了解数据,其来源和结构
A对
B错
13
2分
 
集中趋势能够表明在一定条件下数据的独特性质与差异
A对
B错
14
2分
 
对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。
A对
B错
15
2分
 
一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。
A对
B错
16
2分
 
关联规则可以被广泛地应用于通信、金融、交通、健康医疗和Web用户行为分析等领域。
A对
B错
17
2分
 
当训练集较大的时候,标准BP算法通常会更快的获得更好的解。
A对
B错
18
2分
 
增加神经元的个数,无法提高神经网络的训练精度。
A对
B错
19
2分
 
K-means算法采用贪心策略,通过迭代优化来近似求解。
A对
B错
20
2分
答案请添加 微信:opzy100或QQ:519688598
使用SVD方法进行图像压缩不可以保留图像的重要特征。
A对
B错
 

奥鹏作业辅导、国开作业辅导、毕业论文辅导、需要的请联系客服QQ或微信:519688598

微信订阅

QQ订阅

版权声明:本站文章和资源均来源于互联网, 按照 CCBY-NC-SA 3.0 CN协议 发布和共享,如有侵犯版权的资源 请邮件至519688598@qq.com 我们会在24h内删除

备案号:鲁ICP备2020044172号-1收藏本站 - 网站地图 - 平时在线 - 平时离线 - 毕业论文