填空 在线考试 答题题目
1、(填空题) 12. (填空题)Spark SQL是Spark用来 的一个模块
2、(填空题) 20. (填空题)使用 ___方法可以合并多个RDD
3、(填空题) 10. (填空题)在Spark MLlib库中,经常用于将对象分到高度相似的类中的一种无监督学习算法的是
4、(填空题) 22. (填空题)方法用于对具有相同键的值进行分组,可以对同一组的数据进行计数、求和等操作。
5、(填空题) 19. (填空题)方法用于获取RDD的前N个元素,返回数据为数组
6、(填空题) 23. (填空题)spark-submit常用配置项中 --name Name主要用于
7、(填空题) 11. (填空题)协同过滤推荐算法有两种形式,分别是_____和_____
8、(填空题) 10. (填空题)停止Spark集群的命令为
9、(填空题) 22. (填空题)方法可以通过一个函数重新计算列表中的所有元素,并且返回一个包含相同数目元素的新列表。
10、(填空题) 23. (填空题)方法和map()方法类似,但是该方法没有返回值,只用于对参数的结果进行输出。
11、(填空题) 9. (填空题)启动Spark集群的命令为
12、(填空题) 11. (填空题)是一个用于处理结构化数据的框架,可被视为一个分布式的SQL查询引擎,提供了一个抽象的可编程数据模型DataFrame
13、(填空题) 13. (填空题)spark-shell下清屏的快捷方式为
14、(填空题) 12. (填空题)在spark-shell下进入粘贴模式的命令为
15、(填空题) 26. (填空题)在Scala中,获取元组中的值是通过 来获取的
16、(填空题) 24. (填空题)RDD的操作主要分为____和____
17、(填空题) 12. (填空题)推荐算法有两个主要的类别:一种是_____ ,另一种是____
18、(填空题) 28. (填空题)在Scala中,使用___关键字来定义的类被称为样例类。
19、(填空题) 25. (填空题)方法可对集合中的元素进行分组操作,返回的结果是一个映射。
20、(填空题) 14. (填空题)在DataFrame的操作中,_____用于对记录进行分组。
21、(填空题) 13. (填空题)Spark SQL作为分布式SQL查询引擎,让用户可以通过 、DataFrames API和Datasets API3种方式实现对结构化数据的处理。
22、(填空题) 18. (填空题)在RDD操作中,可使用___ 方法收集查询数据
23、(填空题) 11. (填空题)进入spark-shell操作界面的命令为
24、(填空题) 21. (填空题)方法用于合并具有相同键的值,作用对象是键值对,并且只对键的值进行处理。
25、(填空题) 24. (填空题)使用____方法可以实现数据过滤
26、(填空题) 27. (填空题)在Scala中,模式匹配是由关键字 和 组成的

微信扫一扫 在线答题 在线出卷 随机出题小程序 闯关答题软件 出题答题小程序