大数据 在线考试 答题题目
1、(填空题) 收集、处理数据并获取数据中隐含的信息的过程被称为 。
2、 下列情况不能用于处理欠拟合的方法是
3、 下列说法错误的是
4、 关于CART算法,下列说法错误的是
5、 某超市研究销售记录数据后发现,买啤酒的人大概率也会购买尿布,这种属于数据挖掘中的
6、 有关数据挖掘预处理的说法,不正确的是
7、 假设属性income的最大值、最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为
8、 当不知道数据所带标签时,为促使带同类标签的数据与带其他标签的数据分离,可以使用的技术是
9、 下列选项不属于大数据的特点的是
10、 下列属于半结构化数据形式的是
11、 下列关于大数据思维的描述错误的是
12、 Python爬虫程序中最常用的HTTP请求库是
13、 数据清洗一般遵循的原则是
14、(填空题) 大数据诞生的技术基础是;
15、 下列算法不需要数据归一化的是
16、(填空题) ECharts是 的缩写,是百度公司旗下的一款开源可视化图表工具。
17、(填空题) 使用词云进行文本分析的第三方库是 、matplotlib和scipy。
18、(填空题) 机器学习风险预警模型主要包括 、SVM风险预警模型、随机森林风险预警模型。
19、(填空题) 以结构化、语义化的知识库来描述客观世界中的概念、属性及其相互关系的方法称为 ;
20、(填空题) 大数据平台整体业务框架是由 、业务分析层、基础数据层搭建而成;
21、(填空题) 一个好的数据分析平台的角色有 、模型精细分析、管理场景可视化、业务数据共享等。
22、(填空题) 大数据平台整体业务框架是由 、业务分析层、综合分析层搭建而成。
23、(填空题) 实现分类和预测的常用算法有回归分析-决策树、人工神经网络、 和支持向量机。
24、(填空题) 数据抽样的标准包括:可靠性、有效性、
25、(填空题) python中包含的4中内建的数据结构是字典、元组、 集合
26、(填空题) 数据的不一致主要是数据的矛盾性和
27、(填空题) 处理缺失值常用的三种方法是删除记录、数据插补和
28、 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值。此种任务是
29、 Python中如果用户要自己定义函数,需要使用的关键字是
30、 以下代码的输出结果是def Foo(x): if(x==1): return 1 else: return x+Foo(x-1)printf(F00(4))
31、 以下关于分类问题的说法,错误的是
32、 关于第第三方库,下列说法不正确的是
33、 提供了数组支持以及相应的高效的处理函数的是
34、 下列有关数据质量的说法中,正确的是
35、 假设有三类数据,用OVR(One V Rest)方法进行分类的次数是
36、 下列情况不属于二分类问题的是
37、 以下不属于集中趋势统计量的是
38、 置信度度量的指标特征是
39、 以下不属于聚类算法类型的是
40、 以下关于回归分析的说法,正确的是
41、 以下不属于属性规约常用的处理技术的是
42、 衡量取样数据的质量的标准不包括
43、 全面预算管理的一个难点是
44、 在HDFS文件操作中,上传文件的命令是
45、 hadoop2.0与hadoop1.0的区别是
46、 在HBase组件中,负责日志记录的是
47、 大数据平台架构设计的思想是
48、 在进行数据抽样时候的标准,不包括的是
49、 下列代码的运行结果是 def InputInt(a): a=15 b=2InputInt(a)print(b)
50、 对于数据挖掘中的原始数据,不需要考虑的问题包括
51、 对于不服从正态分布的变量、分类或等级变量之间的关联性常采用
52、 在进行数据探索时能够一次查看数据的基本情况的方法是
53、 由于研究目的和对比基础不同,在进行相对数比较时采用的方法不包括
54、 以下不属于数据处理中经常使用的缺失值填充的方法是

微信扫一扫 在线答题 在线出卷 随机出题小程序 闯关答题软件 出题答题小程序