1
您的位置: 线上活动  >  在线答题  >  答题题库

数据挖掘 90

2026-01-12 12:00:09.226.0.71003

数据挖掘 90 在线考试 答题题目
1、(多选题) 决策树剪枝策略包括:
  • A、预剪枝
  • B、后剪枝
  • C、随机剪枝
  • D、完全剪枝


  • 2、 概念描述方法包括:
  • A、特征性描述和区别性描述
  • B、聚类和分类
  • C、清洗和变换
  • D、关联和序列


  • 3、(填空题) 数据挖掘的根本目的是______。


  • 4、(判断题) KDD 与 Data Mining 含义完全相同。( )
  • A、正确
  • B、错误


  • 5、(多选题) 数据预处理的方法包括:
  • A、数据清洗
  • B、数据变换
  • C、数据归约
  • D、数据挖掘


  • 6、 聚类分析不能用于:
  • A、数据预处理
  • B、孤立点检测
  • C、分类标签生成
  • D、数据分布分析


  • 7、 决策树剪枝的目的是:
  • A、提高训练速度
  • B、防止过拟合
  • C、降低计算成本
  • D、增加节点数


  • 8、 若 X 是频繁项集,则:
  • A、所有子集都是频繁的
  • B、所有超集都是频繁的
  • C、所有子集都不是频繁的
  • D、所有超集都不是频繁的


  • 9、 KDD 与 Data Mining 的关系中,以下说法正确的是:
  • A、KDD 是数据挖掘的子集
  • B、KDD 仅适用于数据库
  • C、数据挖掘是 KDD 的一个步骤
  • D、两者完全无关


  • 10、(判断题) ID3 算法可以处理连续值。( )
  • A、正确
  • B、错误


  • 11、(判断题) 决策树剪枝是为了防止欠拟合。( )
  • A、正确
  • B、错误


  • 12、(判断题) 知识发现过程中不需要业务人员参与。( )
  • A、正确
  • B、错误


  • 13、(填空题) 知识发现的五个步骤中,工作量最大的是______。


  • 14、 以下哪种距离不属于常见距离函数?
  • A、欧氏距离
  • B、曼哈顿距离
  • C、余弦距离
  • D、汉明距离


  • 15、(判断题) 关联规则挖掘的两个子问题是频繁项集发现和规则生成。( )
  • A、正确
  • B、错误


  • 16、(判断题) 聚类分析可以作为数据预处理的步骤。( )
  • A、正确
  • B、错误


  • 17、(多选题) 距离函数包括:
  • A、明可夫斯基距离
  • B、二次型距离
  • C、余弦距离
  • D、汉明距离


  • 18、 知识发现过程模型不包括:
  • A、阶梯模型
  • B、螺旋模型
  • C、瀑布模型
  • D、以用户为中心模型


  • 19、(多选题) 数据挖掘中“频繁项集”的性质包括:
  • A、子集也是频繁的
  • B、超集也是频繁的
  • C、子集不一定频繁
  • D、超集不一定频繁


  • 20、(判断题) 数据挖掘的三大任务是分类、聚类和回归。( )
  • A、正确
  • B、错误


  • 21、(多选题) 类间距离计算方法包括:
  • A、最短距离法
  • B、最长距离法
  • C、中心法
  • D、离差平方和法


  • 22、 Apriori 算法的两个阈值是:
  • A、最小支持度和最小置信度
  • B、最大支持度和最大置信度
  • C、最小误差和最大误差
  • D、最小距离和最大距离


  • 23、 数据归约的目的是:
  • A、提高数据质量
  • B、减少数据量
  • C、增加数据维度
  • D、提高数据速度


  • 24、(判断题) 缺失值可以用最值填充。( )
  • A、正确
  • B、错误


  • 25、 数据可视化属于:
  • A、数据预处理
  • B、数据挖掘
  • C、知识表示
  • D、模式评估


  • 26、(填空题) 决策树剪枝的目的是防止______。


  • 27、 数据挖掘的根本目的是什么?
  • A、提高数据存储效率
  • B、获取知识
  • C、优化数据结构
  • D、加快数据检索速度


  • 28、 以下不属于数据挖掘语言的是:
  • A、数据挖掘查询语言
  • B、数据挖掘建模语言
  • C、SQL 语言
  • D、通用数据挖掘语言


  • 29、 决策树算法中,ID3 使用:
  • A、信息增益
  • B、基尼系数
  • C、卡方检验
  • D、信息增益比


  • 30、(填空题) 数据预处理包括数据清洗、数据变换和______。


  • 31、(填空题) 关联规则挖掘中,满足最小支持度和最小置信度的规则称为______。


  • 32、(判断题) 数据挖掘工具分为通用和专用两类。( )
  • A、正确
  • B、错误


  • 33、(判断题) 余弦距离常用于文本相似度计算。( )
  • A、正确
  • B、错误


  • 34、(填空题) 聚类分析中,基于密度的方法典型代表是______。


  • 35、(判断题) 数据可视化不属于数据挖掘范畴。( )
  • A、正确
  • B、错误


  • 36、 数据挖掘的三大任务不包括:
  • A、分类
  • B、聚类
  • C、回归
  • D、关联规则发现


  • 37、 知识发现软件发展的第一阶段是:
  • A、独立算法
  • B、横向工具集
  • C、纵向解决方案
  • D、集成平台


  • 38、(多选题) 知识发现过程中的三类人员包括:
  • A、业务分析人员
  • B、数据分析人员
  • C、数据管理人员
  • D、算法工程师


  • 39、(判断题) 概念描述分为特征性描述和区别性描述。( )
  • A、正确
  • B、错误


  • 40、 以下哪种方法不属于数据清洗内容?
  • A、缺失值处理
  • B、异常值处理
  • C、数据标准化
  • D、数据采样


  • 41、 数据挖掘中“闭合项集”是指:
  • A、频繁项集
  • B、无子集的项集
  • C、支持度闭包
  • D、最大频繁项集


  • 42、(判断题) Apriori 算法没有性能瓶颈。( )
  • A、正确
  • B、错误


  • 43、(填空题) Apriori 算法的两个阈值是最小支持度和最小______。


  • 44、 强关联规则是指满足:
  • A、最小支持度和最小置信度
  • B、最大支持度和最大置信度
  • C、最小误差
  • D、最大覆盖率


  • 45、 关联规则挖掘的两个子问题是:
  • A、频繁项集发现与规则生成
  • B、数据清洗与数据变换
  • C、分类与聚类
  • D、建模与预测


  • 46、 知识发现过程中不包括以下哪类人员?
  • A、业务分析人员
  • B、数据分析人员
  • C、数据管理人员
  • D、系统架构师


  • 47、(多选题) 聚类分析的应用包括:
  • A、数据预处理
  • B、孤立点挖掘
  • C、数据分布分析
  • D、分类标签生成


  • 48、(多选题) 知识发现步骤包括:
  • A、问题定义
  • B、数据抽取
  • C、数据预处理
  • D、数据挖掘


  • 49、(判断题) 数据预处理是 KDD 过程中工作量最小的步骤。( )
  • A、正确
  • B、错误


  • 50、 数据挖掘出现的主要原因是:
  • A、算法成熟
  • B、需求和技术推动
  • C、硬件便宜
  • D、软件普及


  • 51、 OLAP 的全称是:
  • A、在线分析处理
  • B、在线事务处理
  • C、对象链接处理
  • D、对象分析处理


  • 52、(多选题) K-Means 算法的缺点包括:
  • A、需指定 k
  • B、对异常值敏感
  • C、不能处理分类属性
  • D、计算复杂度高


  • 53、(判断题) 模型验证方法包括留出法和交叉验证法。( )
  • A、正确
  • B、错误


  • 54、(判断题) 知识发现软件发展的第三阶段是横向工具集。( )
  • A、正确
  • B、错误


  • 55、 分类模型的验证方法不包括:
  • A、留出法
  • B、交叉验证法
  • C、自助法
  • D、抽样法


  • 56、 聚类算法中,基于密度的方法是:
  • A、K-Means
  • B、DBSCAN
  • C、层次聚类
  • D、SOM


  • 57、 在 KDD 过程中,工作量最大的步骤是:
  • A、数据抽取
  • B、数据预处理
  • C、数据挖掘
  • D、模式评估


  • 58、 K-Means 算法必须事先指定:
  • A、初始中心点
  • B、距离函数
  • C、簇的数量 k
  • D、最大迭代次数


  • 59、(多选题) 知识发现过程模型包括:
  • A、阶梯模型
  • B、螺旋模型
  • C、以用户为中心模型
  • D、瀑布模型


  • 60、(填空题) K-Means 算法必须事先指定______。


  • 61、 以下哪种数据挖掘任务属于无监督学习?
  • A、分类
  • B、聚类
  • C、回归
  • D、决策树


  • 62、(多选题) 数据挖掘工具软件包括:
  • A、Weka
  • B、RapidMiner
  • C、KNIME
  • D、Excel


  • 63、 以下不属于数据挖掘对象的是:
  • A、关系型数据库
  • B、空间数据库
  • C、文本文件
  • D、操作系统


  • 64、(判断题) 类间距离计算方法包括最短距离法和最长距离法。( )
  • A、正确
  • B、错误


  • 65、(填空题) 数据挖掘的三大任务是分类、聚类和______。


  • 66、(填空题) KDD 与 Data Mining 的关系中,数据挖掘是 KDD 的一个______。


  • 67、 类间距离计算方法不包括:
  • A、最短距离法
  • B、最长距离法
  • C、中心法
  • D、标准差法


  • 68、(多选题) 关联规则挖掘中,强规则满足:
  • A、最小支持度
  • B、最大支持度
  • C、最小置信度
  • D、最大置信度


  • 69、 知识发现中“模式评估”是指:
  • A、评估数据质量
  • B、评估挖掘结果的可用性
  • C、评估算法效率
  • D、评估硬件性能


  • 70、 以下不属于数据预处理方法的是:
  • A、数据清洗
  • B、数据变换
  • C、数据挖掘
  • D、数据归约


  • 71、(多选题) 数据挖掘根据挖掘对象可分为:
  • A、关系型数据库挖掘
  • B、空间数据库挖掘
  • C、时态数据库挖掘
  • D、异质数据库挖掘


  • 72、(多选题) 关联规则挖掘算法包括:
  • A、Apriori
  • B、FP-Growth
  • C、Close
  • D、K-Means


  • 73、 知识发现软件发展的第二阶段是:
  • A、独立算法
  • B、横向工具集
  • C、纵向解决方案
  • D、自动化平台


  • 74、(判断题) K-Means 算法不需要指定 k 值。( )
  • A、正确
  • B、错误


  • 75、 ID3 算法的主要缺点是:
  • A、不能处理连续值
  • B、不能处理分类数据
  • C、计算复杂度低
  • D、不容易陷入局部最优


  • 76、(判断题) 若 X 是非频繁项集,则其所有子集也是非频繁的。( )
  • A、正确
  • B、错误


  • 77、(多选题) 广义数据表现形式包括:
  • A、数据
  • B、信息
  • C、知识
  • D、智慧


  • 78、 Apriori 算法的性能瓶颈不包括:
  • A、多次扫描数据库
  • B、产生庞大候选集
  • C、计算复杂度高
  • D、内存占用小


  • 79、(多选题) 分类模型的验证方法包括:
  • A、留出法
  • B、交叉验证法
  • C、自助法
  • D、抽样法


  • 80、 模型验证常用方法不包括:
  • A、留出法
  • B、交叉验证法
  • C、自助法
  • D、抽样法


  • 81、 关联规则挖掘算法不包括:
  • A、Apriori
  • B、K-Means
  • C、FP-Growth
  • D、Close


  • 82、 信息增益的缺点是:
  • A、偏向取值多的属性
  • B、偏向取值少的属性
  • C、无法用于分类
  • D、计算复杂


  • 83、(多选题) 数据挖掘语言包括:
  • A、数据挖掘查询语言
  • B、数据挖掘建模语言
  • C、通用数据挖掘语言
  • D、SQL


  • 84、(多选题) 数据挖掘的三大任务包括:
  • A、分类
  • B、聚类
  • C、关联规则
  • D、回归


  • 85、 数据挖掘工具不包括:
  • A、Weka
  • B、RapidMiner
  • C、Excel
  • D、KNIME


  • 86、 以下哪种不属于聚类算法类型?
  • A、划分法
  • B、层次法
  • C、密度法
  • D、回归法


  • 87、 数据清洗中,缺失值不能使用以下哪种方式填充?
  • A、均值
  • B、中位数
  • C、最值
  • D、众数


  • 88、(判断题) 数据挖掘是面向应用的。( )
  • A、正确
  • B、错误


  • 89、(多选题) 聚类算法按思路可分为:
  • A、划分法
  • B、层次法
  • C、密度法
  • D、网格法


  • 90、(多选题) 数据清洗中缺失值处理方法包括:
  • A、删除
  • B、均值填充
  • C、中位数填充
  • D、众数填充


  • 微信扫一扫 在线答题 在线出卷 随机出题小程序 闯关答题软件 出题答题小程序