自己 在线考试 答题题目
1、 2. (单选题)下列属于关联规则算法是( )。
2、 2. Spark是Hadoop生态下( )组件的替代方案
3、(判断题) 19. (判断题)DataFrame可以从很多数据源中创建,例如结构化文件、外部数据库、Hive表等数据源。
4、 8. (单选题)关于键值对RDD的连接操作,以下选项中描述正确的是
5、 10. (单选题)在Spark中,调用RDD的()方法,可以将RDD转换为DataFrame对象。
6、(填空题) 24. (填空题)RDD的操作主要分为____和____
7、 8. Spark于2009年诞生于()。
8、 6. (单选题)关于sortBy(方法的三个可输入参数,以下选项中描述错误的是 ( )
9、 6. 下列选项中,可以支持Scala和Python编程的交互式解释器是()。
10、(填空题) 13. (填空题)spark-shell下清屏的快捷方式为
11、(判断题) 15. (判断题)Spark SQL与Hive不兼容
12、(判断题) 33. (判断题)在Scala中,集合有三大类分别是List、Set以及Map。
13、 6. (单选题)下列选项中,哪个是Scala编译后文件的扩展名( )
14、 9. (单选题)对于RDD(a,1),(a,2),(a,3)),使用“reduceByKey(_+_)”进行合并,得到的结果 是( )
15、(判断题) 20. (判断题)Spark SQL提供了一个编程抽象结构叫做DataFrame的数据模型。
16、 3. Spark支持的运行模式不包括( )
17、(判断题) 21. (判断题)Spark SQL与Hive相互不兼容。
18、(判断题) 25. (判断题)RDD是一个可变、不可分区、里面的元素不可并行计算的集合
19、(判断题) 32. (判断题)Scala语言和Java语言一样,都有静态方法或静态字段。
20、(判断题) 14. (判断题)Spark诞生于洛桑联邦理工学院(EPEL)的编程方法实验室
21、 1. (单选题)下列说法正确的是哪一项?( )
22、(填空题) 22. (填空题)方法可以通过一个函数重新计算列表中的所有元素,并且返回一个包含相同数目元素的新列表。
23、 15. (单选题)以下程序的输出结果是( )。 val alphabet = List("A","B","C") val nums = List(1,2)
print(alphabet.zip(nums))
24、 5. (单选题)以下是行动操作的方法是()
25、 10. (单选题)表达式for(i<-1 to 3;for(j<-1 to 3;if i!=j))print((10*i+j))+"",输出结果正确的是( )
26、(填空题) 25. (填空题)方法可对集合中的元素进行分组操作,返回的结果是一个映射。
27、 5. 关于SparkRDD,下列说法不正确的是( )
28、(判断题) 35. (判断题)Scala中声明变量时,可以不给出变量的类型,因为在初始化的时候,Scala的类型推断机制能够根据变量初始化的值自动推算出来。
29、(判断题) 13. (判断题)标注点是一种带有标签的本地向量,通常用于无监督学习算法中
30、(判断题) 31. (判断题)在Scala中定义变长数组时,需要导入可变数组包。
31、 6. (单选题)获取DataFrame中所有数据,并返回一个数组对象,使用的方法是( )。
32、(填空题) 18. (填空题)在RDD操作中,可使用___ 方法收集查询数据
33、 1. (单选题)以下不属于Spark架构中的组件的是( )
34、 5. (单选题)以元组pair为例,以下关于元组说法错误的是( )
35、(判断题) 36. (判断题)Scala有两种类型的变量,一种是使用关键字var声明的常量,值是不可变的;另一种是使用关键字val声明的变量,值是可变的。
36、 1. (单选题)下面哪个端口不是Spark自带服务的端口
37、 4. (单选题)DataFrame可以将数据保存成持久化的表,使用的方法是( )。
38、(填空题) 24. (填空题)使用____方法可以实现数据过滤
39、 16. (单选题)以下选项符合Scala编程规范的是( )。
①"spark".equals("spark") ②"spark".contains(spark)
③val a:String="spark"④val a=List{1,2,3,4}
40、 8. (单选题)下列关于List的定义,哪个是错误的( )
41、 1. 以下关于Scala解释器(REPL)交互的基本方式说法错误的是( )
42、(填空题) 10. (填空题)停止Spark集群的命令为
43、(填空题) 13. (填空题)Spark SQL作为分布式SQL查询引擎,让用户可以通过 、DataFrames API和Datasets API3种方式实现对结构化数据的处理。
44、 13. (单选题)使用“val rdd: RDD[String]= sc.makeRDD(List("Hello Scala","Hello Spark"))”创建了一个RDD,以下选项中,不能使该RDD实现单词计数的是( )。
45、 8. (单选题)ALS是MLlib的一个实现推荐算法的包,需要输入的数据类型是( )。
46、 12. (单选题)Spark中的SparkContext是( )。
47、 15. (单选题)以下选项中不是spark-submit的指定参数的是( )
48、 6. (单选题)关于Spark MLlib的mllib.stat.Statistics类中的方法,描述错误的是( )。
49、 1. (单选题)机器学习可以分为( )。
50、(判断题) 30. (判断题)在Scala中,使用关键字bar声明的变量,值是不可变的。
51、 19. (单选题)
定义类Counter,并通过new关键字实例化出counter对象,代码如下,以下选项的操作正确的是( )。
class Counter(name:String)(
val a = 1
var b ="counter”
}
val counter = new Counter("computer")
52、 9. (单选题)下列选项中,哪个不是Spark生态系统中的组件?
53、(填空题) 12. (填空题)推荐算法有两个主要的类别:一种是_____ ,另一种是____
54、(填空题) 12. (填空题)在spark-shell下进入粘贴模式的命令为
55、 7. (单选题)以下选项中,关于Spark SQL优点描述正确的是( )。 ①将SQL查询与Spark程序无缝混合,可以使用Java、Scala、Python、R等语言的API操作 ②兼容Hive ③统一的数据访问 ④标准的数据连接
56、(判断题) 18. (判断题)Hadoop的MapReduce进行计算时,每次产生的中间结果都是存储在内存中;而Spark在计算时产生的中间结果存储在本地磁盘中。
57、(判断题) 16. (判断题)在Spark SQL中,若想要使用SQL风格操作,则需要提前将DataFrame注册成一张临时表
58、 2. (单选题)现有一个DataFrame数据命名为data,而在Spark SQL的DataFrame API中有众多方法可以对其数据进行查看。查看data数据的前10条数,以下写法错误是( )。
59、(填空题) 20. (填空题)使用 ___方法可以合并多个RDD
60、(填空题) 23. (填空题)spark-submit常用配置项中 --name Name主要用于
61、 9. (单选题)关于Spark SQL的DataFrame基础操作,以下选项中说法错误的是( )。
62、(填空题) 12. (填空题)Spark SQL是Spark用来 的一个模块

微信扫一扫 在线答题 在线出卷 随机出题小程序 闯关答题软件 出题答题小程序