小曹 选择题 在线考试 答题题目
1、 13. (单选题)使用“val rdd: RDD[String]= sc.makeRDD(List("Hello Scala","Hello Spark"))”创建了一个RDD,以下选项中,不能使该RDD实现单词计数的是( )。
2、(填空题) 11. (填空题)进入spark-shell操作界面的命令为
3、 13. (单选题)以下关于Scala的类和单例对象之间的差别描述正确的是( )
4、(判断题) 36. (判断题)Scala有两种类型的变量,一种是使用关键字var声明的常量,值是不可变的;另一种是使用关键字val声明的变量,值是可变的。
5、 4. (单选题)DataFrame可以将数据保存成持久化的表,使用的方法是( )。
6、(填空题) 23. (填空题)spark-submit常用配置项中 --name Name主要用于
7、(填空题) 10. (填空题)在Spark MLlib库中,经常用于将对象分到高度相似的类中的一种无监督学习算法的是
8、 3. Spark支持的运行模式不包括( )
9、 1. (单选题)机器学习可以分为( )。
10、(判断题) 16. (判断题)在Spark SQL中,若想要使用SQL风格操作,则需要提前将DataFrame注册成一张临时表
11、(判断题) 25. (判断题)RDD是一个可变、不可分区、里面的元素不可并行计算的集合
12、 3. (单选题)下列选项中( )算法不属于有监督学习算法。
13、 7. (单选题)下列方法中,哪个方法可以正确计算数组arr的长度( )
14、 9. (单选题)关于mllib.feature中创建特征向量的方法,下列说法错误的是( )。
15、 4. (单选题)以下关于数组a的定义,最终数组a的数据与其他选项不一致的是
16、(填空题) 14. (填空题)在DataFrame的操作中,_____用于对记录进行分组。
17、(填空题) 25. (填空题)方法可对集合中的元素进行分组操作,返回的结果是一个映射。
18、 20. (单选题)下列方法中,用于计算数组长度的是()。
19、 11. (单选题)saveAsTextFile()方法用于将( )以文本文件的格式存储到文件系统中。
20、 5. (单选题)DataFrame的show()方法默认输出( )条数据。
21、(判断题) 30. (判断题)在Scala中,使用关键字bar声明的变量,值是不可变的。
22、 2. 以下关于Scala的特性说法错误的是( )
23、 6. (单选题)关于sortBy(方法的三个可输入参数,以下选项中描述错误的是 ( )
24、 1. 以下关于Scala解释器(REPL)交互的基本方式说法错误的是( )
25、(判断题) 22. (判断题)Spark SQL为Spark框架在结构化数据分析方面提供重要技术支持。
26、(填空题) 10. (填空题)停止Spark集群的命令为
27、(填空题) 18. (填空题)在RDD操作中,可使用___ 方法收集查询数据
28、 16. (单选题)以下选项符合Scala编程规范的是( )。
①"spark".equals("spark") ②"spark".contains(spark)
③val a:String="spark"④val a=List{1,2,3,4}
29、(判断题) 14. (判断题)Spark诞生于洛桑联邦理工学院(EPEL)的编程方法实验室
30、(判断题) 16. (判断题)Spark Master HA主从切换过程不会影响集群已有的作业运行
31、(判断题) 18. (判断题)Hadoop的MapReduce进行计算时,每次产生的中间结果都是存储在内存中;而Spark在计算时产生的中间结果存储在本地磁盘中。
32、(判断题) 26. (判断题)RDD采用了惰性调用,即在RDD的处理过程中,真正的计算发生在RDD的“行动”操作
33、(判断题) 13. (判断题)标注点是一种带有标签的本地向量,通常用于无监督学习算法中
34、(判断题) 21. (判断题)Spark SQL与Hive相互不兼容。
35、 7. (单选题)下列选项中,( )不属于数据标准化或归一化方法。
36、 16. (单选题)提交Spark程序时,通常需要设置一些配置项,关于配置项,下列说法错误的是( )
37、 6. (单选题)下列选项中,哪个是Scala编译后文件的扩展名( )
38、(填空题) 26. (填空题)在Scala中,获取元组中的值是通过 来获取的
39、 10. (单选题)在Spark中,调用RDD的()方法,可以将RDD转换为DataFrame对象。
40、 5. (单选题)以下是行动操作的方法是()
41、(填空题) 9. (填空题)启动Spark集群的命令为
42、 8. (单选题)关于键值对RDD的连接操作,以下选项中描述正确的是
43、(判断题) 18. (判断题)Spark SQL不仅能够查询MySQL数据库中的数据,还可以向表中插入新的数据
44、 5. 关于SparkRDD,下列说法不正确的是( )
45、 3. (单选题)以下关于Scala的变量定义、赋值的代码,运行后一定会报错的是( )
46、 8. (单选题)以下选项中不能对DataFrame列名进行重命名的方法是( )。
47、(填空题) 23. (填空题)方法和map()方法类似,但是该方法没有返回值,只用于对参数的结果进行输出。
48、(判断题) 34. (判断题)Scala中,使用关键字var或val声明变量时,后面紧跟的变量名称可以和Scala中的保留字重名,而且变量名不可以以字母或下划线开头,且变量名是不区分大小写的。
49、(判断题) 15. (判断题)Spark SQL与Hive不兼容
50、 7. (单选题)以下选项中,关于Spark SQL优点描述正确的是( )。 ①将SQL查询与Spark程序无缝混合,可以使用Java、Scala、Python、R等语言的API操作 ②兼容Hive ③统一的数据访问 ④标准的数据连接
51、 10. (单选题)对于RDD1((a,1),(b, 2),(c,3))和RDD2((b,4),(b,5),(a,6)),使用“RDD1.join (RDD2)”,得到的结果是( )。
52、 5. (单选题)下列选项中不属于MLlib中常用的数据类型的是( )。
53、(填空题) 22. (填空题)方法用于对具有相同键的值进行分组,可以对同一组的数据进行计数、求和等操作。
54、(填空题) 28. (填空题)在Scala中,使用___关键字来定义的类被称为样例类。
55、 9. (单选题)关于Spark SQL的DataFrame基础操作,以下选项中说法错误的是( )。
56、 15. (单选题)以下程序的输出结果是( )。 val alphabet = List("A","B","C") val nums = List(1,2)
print(alphabet.zip(nums))
57、(判断题) 15. (判断题)部署Spark高可用集群不需要用到Zookeeper服务
58、 4. (单选题)以下是转换操作的方法是()
59、 7. Spark与Hadoop在基于内存的运算中,说法正确的是()。
60、 6. 下列选项中,可以支持Scala和Python编程的交互式解释器是()。
61、 1. (单选题)以下不属于Spark架构中的组件的是( )
62、 12. (单选题)Spark中的SparkContext是( )。
63、(填空题) 12. (填空题)在spark-shell下进入粘贴模式的命令为
64、(填空题) 19. (填空题)方法用于获取RDD的前N个元素,返回数据为数组
65、 14. (单选题)以下选项中使用spark-submit指定在YARN框架上运行程序的是( )。
微信扫一扫 在线答题 在线出卷 随机出题小程序 闯关答题软件 出题答题小程序