填空-在线答题-在线出题考试深圳市新微云科技官网

1、（填空题） 13. (填空题)spark-shell下清屏的快捷方式为

2、（填空题） 19. (填空题)方法用于获取RDD的前N个元素，返回数据为数组

3、（填空题） 22. (填空题)方法用于对具有相同键的值进行分组，可以对同一组的数据进行计数、求和等操作。

4、（填空题） 12. (填空题)推荐算法有两个主要的类别：一种是_____ ，另一种是____

5、（填空题） 14. (填空题)在DataFrame的操作中，_____用于对记录进行分组。

6、（填空题） 18. (填空题)在RDD操作中，可使用___ 方法收集查询数据

7、（填空题） 22. (填空题)方法可以通过一个函数重新计算列表中的所有元素，并且返回一个包含相同数目元素的新列表。

8、（填空题） 10. (填空题)停止Spark集群的命令为

9、（填空题） 13. (填空题)Spark SQL作为分布式SQL查询引擎，让用户可以通过、DataFrames API和Datasets API3种方式实现对结构化数据的处理。

10、（填空题） 27. (填空题)在Scala中，模式匹配是由关键字和组成的

11、（填空题） 23. (填空题)spark-submit常用配置项中 --name Name主要用于

12、（填空题） 9. (填空题)启动Spark集群的命令为

13、（填空题） 25. (填空题)方法可对集合中的元素进行分组操作，返回的结果是一个映射。

14、（填空题） 12. (填空题)在spark-shell下进入粘贴模式的命令为

15、（填空题） 11. (填空题)是一个用于处理结构化数据的框架，可被视为一个分布式的SQL查询引擎，提供了一个抽象的可编程数据模型DataFrame

16、（填空题） 10. (填空题)在Spark MLlib库中，经常用于将对象分到高度相似的类中的一种无监督学习算法的是

17、（填空题） 11. (填空题)进入spark-shell操作界面的命令为

18、（填空题） 23. (填空题)方法和map()方法类似，但是该方法没有返回值，只用于对参数的结果进行输出。

19、（填空题） 11. (填空题)协同过滤推荐算法有两种形式，分别是_____和_____

20、（填空题） 24. (填空题)RDD的操作主要分为____和____

21、（填空题） 24. (填空题)使用____方法可以实现数据过滤

22、（填空题） 12. (填空题)Spark SQL是Spark用来的一个模块

23、（填空题） 28. (填空题)在Scala中，使用___关键字来定义的类被称为样例类。

24、（填空题） 20. (填空题)使用 ___方法可以合并多个RDD

25、（填空题） 26. (填空题)在Scala中，获取元组中的值是通过来获取的

26、（填空题） 21. (填空题)方法用于合并具有相同键的值，作用对象是键值对，并且只对键的值进行处理。

微信扫一扫在线答题在线出卷随机出题小程序闯关答题软件出题答题小程序

填空