证书 在线考试 答题题目
1、(填空题) 12. (填空题)在spark-shell下进入粘贴模式的命令为
2、 10. (单选题)表达式for(i<-1 to 3;for(j<-1 to 3;if i!=j))print((10*i+j))+"",输出结果正确的是( )
3、(判断题) 16. (判断题)在Spark SQL中,若想要使用SQL风格操作,则需要提前将DataFrame注册成一张临时表
4、 17. (单选题)映射的示例代码如下,运行后res的正确结果是( )。
val data = Map(1 ->"Chinese",2 ->"Math",3 ->"English")
val res = for((k,v)<- data; if(k>1))yield v
5、(判断题) 35. (判断题)Scala中声明变量时,可以不给出变量的类型,因为在初始化的时候,Scala的类型推断机制能够根据变量初始化的值自动推算出来。
6、 6. (单选题)关于sortBy(方法的三个可输入参数,以下选项中描述错误的是 ( )
7、 20. (单选题)下列方法中,用于计算数组长度的是()。
8、 7. (单选题)下列方法中,哪个方法可以正确计算数组arr的长度( )
9、(填空题) 10. (填空题)在Spark MLlib库中,经常用于将对象分到高度相似的类中的一种无监督学习算法的是
10、 16. (单选题)提交Spark程序时,通常需要设置一些配置项,关于配置项,下列说法错误的是( )
11、 8. (单选题)下列关于List的定义,哪个是错误的( )
12、(判断题) 16. (判断题)Spark Master HA主从切换过程不会影响集群已有的作业运行
13、(判断题) 36. (判断题)Scala有两种类型的变量,一种是使用关键字var声明的常量,值是不可变的;另一种是使用关键字val声明的变量,值是可变的。
14、 13. (单选题)使用“val rdd: RDD[String]= sc.makeRDD(List("Hello Scala","Hello Spark"))”创建了一个RDD,以下选项中,不能使该RDD实现单词计数的是( )。
15、(判断题) 20. (判断题)Spark SQL提供了一个编程抽象结构叫做DataFrame的数据模型。
16、 1. (单选题)下列说法正确的是哪一项?( )
17、(填空题) 23. (填空题)方法和map()方法类似,但是该方法没有返回值,只用于对参数的结果进行输出。
18、(填空题) 11. (填空题)协同过滤推荐算法有两种形式,分别是_____和_____
19、(填空题) 26. (填空题)在Scala中,获取元组中的值是通过 来获取的
20、(填空题) 24. (填空题)使用____方法可以实现数据过滤
21、(填空题) 28. (填空题)在Scala中,使用___关键字来定义的类被称为样例类。
22、 8. (单选题)以下选项中不能对DataFrame列名进行重命名的方法是( )。
23、(填空题) 22. (填空题)方法可以通过一个函数重新计算列表中的所有元素,并且返回一个包含相同数目元素的新列表。
24、(判断题) 26. (判断题)RDD采用了惰性调用,即在RDD的处理过程中,真正的计算发生在RDD的“行动”操作
25、 2. 以下关于Scala的特性说法错误的是( )
26、 11. (单选题)saveAsTextFile()方法用于将( )以文本文件的格式存储到文件系统中。
27、 9. (单选题)对于RDD(a,1),(a,2),(a,3)),使用“reduceByKey(_+_)”进行合并,得到的结果 是( )
28、 1. (单选题)机器学习可以分为( )。
29、 8. Spark于2009年诞生于()。
30、 6. 下列选项中,可以支持Scala和Python编程的交互式解释器是()。
31、 9. (单选题)下列选项中,哪个不是Spark生态系统中的组件?
32、(判断题) 15. (判断题)Spark SQL与Hive不兼容
33、 9. (单选题)关于Spark SQL的DataFrame基础操作,以下选项中说法错误的是( )。
34、 11. (单选题)在Scala语言中,关于列表的定义,不正确的是( )
35、 19. (单选题)
定义类Counter,并通过new关键字实例化出counter对象,代码如下,以下选项的操作正确的是( )。
class Counter(name:String)(
val a = 1
var b ="counter”
}
val counter = new Counter("computer")
36、 7. (单选题)关于RDD集合操作方法,以下选项中描述错误的是
37、 4. (单选题)下列选项中( )算法属于分类算法。
38、(填空题) 24. (填空题)RDD的操作主要分为____和____
39、(填空题) 20. (填空题)使用 ___方法可以合并多个RDD
40、 12. (单选题)映射的示例代码如下,运行后res的正确结果是val data=Map(1->"Chinese"),2->"Math",3->"English" val res=for(k,v)<-data;if(k>1)) yield v
41、(填空题) 22. (填空题)方法用于对具有相同键的值进行分组,可以对同一组的数据进行计数、求和等操作。
42、 4.在Spark中,如果需要对实时数据进行流式计算,那么使用的子框架是( )
43、 14. (单选题)以下选项中使用spark-submit指定在YARN框架上运行程序的是( )。
44、 3. (单选题)以下方法中,从外部存储系统中创建RDD使用的方法是( )
45、 1. 以下关于Scala解释器(REPL)交互的基本方式说法错误的是( )
46、(填空题) 25. (填空题)方法可对集合中的元素进行分组操作,返回的结果是一个映射。
47、 21. (单选题)Scala中,用于创建单例对象的关键字是()。
48、 6. (单选题)关于Spark MLlib的mllib.stat.Statistics类中的方法,描述错误的是( )。
49、(填空题) 18. (填空题)在RDD操作中,可使用___ 方法收集查询数据
50、(填空题) 12. (填空题)Spark SQL是Spark用来 的一个模块
51、 8. (单选题)关于键值对RDD的连接操作,以下选项中描述正确的是
52、 15. (单选题)以下选项中不是spark-submit的指定参数的是( )
53、(判断题) 22. (判断题)Spark SQL为Spark框架在结构化数据分析方面提供重要技术支持。
54、 2. (单选题)现有一个DataFrame数据命名为data,而在Spark SQL的DataFrame API中有众多方法可以对其数据进行查看。查看data数据的前10条数,以下写法错误是( )。
55、(判断题) 32. (判断题)Scala语言和Java语言一样,都有静态方法或静态字段。
56、 8. (单选题)ALS是MLlib的一个实现推荐算法的包,需要输入的数据类型是( )。
57、 14. (单选题)定义类Counter,并通过new关键字实例化出counter对象,代码如下,以下选项的操作正确的是( )。 class Counter(name:String){val a = 1var b ="counter" } val counter = new Counter("computer")
58、 9. (单选题)关于mllib.feature中创建特征向量的方法,下列说法错误的是( )。
59、 18. (单选题)以下关于Scala的类和单例对象之间的差别描述正确的是( )。
60、(判断题) 29. (判断题)Scala语言是一种面向过程编程的语言。
61、(填空题) 12. (填空题)推荐算法有两个主要的类别:一种是_____ ,另一种是____
62、(判断题) 17. (判断题)Spark SQL可以通过JDBC从关系数据库中读取数据的方式创建DataFrame,通过对DataFrame进行一系列的操作后,不可以将数据重新写入到关系数据库中。
微信扫一扫 在线答题 在线出卷 随机出题小程序 闯关答题软件 出题答题小程序