62 在线考试 答题题目
1、 15. (单选题)以下程序的输出结果是( )。 val alphabet = List("A","B","C") val nums = List(1,2)
print(alphabet.zip(nums))
2、 8. (单选题)以下选项中不能对DataFrame列名进行重命名的方法是( )。
3、 5. (单选题)下列选项中不属于MLlib中常用的数据类型的是( )。
4、(判断题) 35. (判断题)Scala中声明变量时,可以不给出变量的类型,因为在初始化的时候,Scala的类型推断机制能够根据变量初始化的值自动推算出来。
5、(判断题) 17. (判断题)集群上的任务是由执行器来调度的
6、 12. (单选题)映射的示例代码如下,运行后res的正确结果是val data=Map(1->"Chinese"),2->"Math",3->"English" val res=for(k,v)<-data;if(k>1)) yield v
7、(判断题) 25. (判断题)RDD是一个可变、不可分区、里面的元素不可并行计算的集合
8、(判断题) 18. (判断题)Spark SQL不仅能够查询MySQL数据库中的数据,还可以向表中插入新的数据
9、(判断题) 16. (判断题)在Spark SQL中,若想要使用SQL风格操作,则需要提前将DataFrame注册成一张临时表
10、(判断题) 30. (判断题)在Scala中,使用关键字bar声明的变量,值是不可变的。
11、(填空题) 23. (填空题)方法和map()方法类似,但是该方法没有返回值,只用于对参数的结果进行输出。
12、 10. (单选题)对于RDD1((a,1),(b, 2),(c,3))和RDD2((b,4),(b,5),(a,6)),使用“RDD1.join (RDD2)”,得到的结果是( )。
13、 14. (单选题)以下选项中使用spark-submit指定在YARN框架上运行程序的是( )。
14、 1. (单选题)下面哪个端口不是Spark自带服务的端口
15、 4. (单选题)以下是转换操作的方法是()
16、 10. (单选题)表达式for(i<-1 to 3;for(j<-1 to 3;if i!=j))print((10*i+j))+"",输出结果正确的是( )
17、 6. (单选题)关于Spark MLlib的mllib.stat.Statistics类中的方法,描述错误的是( )。
18、(填空题) 14. (填空题)在DataFrame的操作中,_____用于对记录进行分组。
19、(填空题) 11. (填空题)是一个用于处理结构化数据的框架,可被视为一个分布式的SQL查询引擎,提供了一个抽象的可编程数据模型DataFrame
20、(填空题) 13. (填空题)Spark SQL作为分布式SQL查询引擎,让用户可以通过 、DataFrames API和Datasets API3种方式实现对结构化数据的处理。
21、(判断题) 15. (判断题)部署Spark高可用集群不需要用到Zookeeper服务
22、 9. (单选题)关于Spark SQL的DataFrame基础操作,以下选项中说法错误的是( )。
23、 5. (单选题)以下是行动操作的方法是()
24、 2. 以下关于Scala的特性说法错误的是( )
25、 1. 以下关于Scala解释器(REPL)交互的基本方式说法错误的是( )
26、(填空题) 12. (填空题)Spark SQL是Spark用来 的一个模块
27、 4. (单选题)DataFrame可以将数据保存成持久化的表,使用的方法是( )。
28、 9. (单选题)对于RDD(a,1),(a,2),(a,3)),使用“reduceByKey(_+_)”进行合并,得到的结果 是( )
29、 7. (单选题)下列方法中,哪个方法可以正确计算数组arr的长度( )
30、(判断题) 14. (判断题)Spark诞生于洛桑联邦理工学院(EPEL)的编程方法实验室
31、 8. (单选题)下列关于List的定义,哪个是错误的( )
32、(填空题) 18. (填空题)在RDD操作中,可使用___ 方法收集查询数据
33、(填空题) 21. (填空题)方法用于合并具有相同键的值,作用对象是键值对,并且只对键的值进行处理。
34、(填空题) 10. (填空题)在Spark MLlib库中,经常用于将对象分到高度相似的类中的一种无监督学习算法的是
35、(填空题) 27. (填空题)在Scala中,模式匹配是由关键字 和 组成的
36、 8. Spark于2009年诞生于()。
37、(填空题) 10. (填空题)停止Spark集群的命令为
38、 3. (单选题)下列选项中( )算法不属于有监督学习算法。
39、 4. (单选题)以下关于数组a的定义,最终数组a的数据与其他选项不一致的是
40、 6. (单选题)下列选项中,哪个是Scala编译后文件的扩展名( )
41、(填空题) 19. (填空题)方法用于获取RDD的前N个元素,返回数据为数组
42、 2. (单选题)下列方法中,不可用于创建RDD的方法的是( )
43、(判断题) 15. (判断题)Spark SQL与Hive不兼容
44、(填空题) 24. (填空题)使用____方法可以实现数据过滤
45、 6. (单选题)获取DataFrame中所有数据,并返回一个数组对象,使用的方法是( )。
46、 8. (单选题)关于键值对RDD的连接操作,以下选项中描述正确的是
47、(判断题) 19. (判断题)DataFrame可以从很多数据源中创建,例如结构化文件、外部数据库、Hive表等数据源。
48、 3. (单选题)以下关于Scala的变量定义、赋值的代码,运行后一定会报错的是( )
49、(判断题) 16. (判断题)Spark Master HA主从切换过程不会影响集群已有的作业运行
50、(填空题) 12. (填空题)在spark-shell下进入粘贴模式的命令为
51、 7. Spark与Hadoop在基于内存的运算中,说法正确的是()。
52、(填空题) 28. (填空题)在Scala中,使用___关键字来定义的类被称为样例类。
53、 5. (单选题)DataFrame的show()方法默认输出( )条数据。
54、 3. (单选题)以下方法中,从外部存储系统中创建RDD使用的方法是( )
55、(判断题) 13. (判断题)标注点是一种带有标签的本地向量,通常用于无监督学习算法中
56、(判断题) 29. (判断题)Scala语言是一种面向过程编程的语言。
57、 19. (单选题)
定义类Counter,并通过new关键字实例化出counter对象,代码如下,以下选项的操作正确的是( )。
class Counter(name:String)(
val a = 1
var b ="counter”
}
val counter = new Counter("computer")
58、 5. (单选题)以元组pair为例,以下关于元组说法错误的是( )
59、 18. (单选题)以下关于Scala的类和单例对象之间的差别描述正确的是( )。
60、(填空题) 23. (填空题)spark-submit常用配置项中 --name Name主要用于
61、 8. (单选题)ALS是MLlib的一个实现推荐算法的包,需要输入的数据类型是( )。
62、 13. (单选题)使用“val rdd: RDD[String]= sc.makeRDD(List("Hello Scala","Hello Spark"))”创建了一个RDD,以下选项中,不能使该RDD实现单词计数的是( )。

微信扫一扫 在线答题 在线出卷 随机出题小程序 闯关答题软件 出题答题小程序