证书 在线考试 答题题目
1、 8. (单选题)ALS是MLlib的一个实现推荐算法的包,需要输入的数据类型是( )。
2、 3. Spark支持的运行模式不包括( )
3、 6. (单选题)下列选项中,哪个是Scala编译后文件的扩展名( )
4、 14. (单选题)以下选项中使用spark-submit指定在YARN框架上运行程序的是( )。
5、(判断题) 32. (判断题)Scala语言和Java语言一样,都有静态方法或静态字段。
6、 4. (单选题)下列选项中( )算法属于分类算法。
7、(填空题) 11. (填空题)是一个用于处理结构化数据的框架,可被视为一个分布式的SQL查询引擎,提供了一个抽象的可编程数据模型DataFrame
8、 6. 下列选项中,可以支持Scala和Python编程的交互式解释器是()。
9、 1. (单选题)下列说法正确的是哪一项?( )
10、 2. 以下关于Scala的特性说法错误的是( )
11、(填空题) 9. (填空题)启动Spark集群的命令为
12、(填空题) 21. (填空题)方法用于合并具有相同键的值,作用对象是键值对,并且只对键的值进行处理。
13、 5. (单选题)以元组pair为例,以下关于元组说法错误的是( )
14、 14. (单选题)定义类Counter,并通过new关键字实例化出counter对象,代码如下,以下选项的操作正确的是( )。 class Counter(name:String){val a = 1var b ="counter" } val counter = new Counter("computer")
15、 18. (单选题)以下关于Scala的类和单例对象之间的差别描述正确的是( )。
16、(填空题) 14. (填空题)在DataFrame的操作中,_____用于对记录进行分组。
17、 1. (单选题)机器学习可以分为( )。
18、 9. (单选题)对于RDD(a,1),(a,2),(a,3)),使用“reduceByKey(_+_)”进行合并,得到的结果 是( )
19、 21. (单选题)Scala中,用于创建单例对象的关键字是()。
20、 11. (单选题)在Scala语言中,关于列表的定义,不正确的是( )
21、 12. (单选题)映射的示例代码如下,运行后res的正确结果是val data=Map(1->"Chinese"),2->"Math",3->"English" val res=for(k,v)<-data;if(k>1)) yield v
22、(判断题) 36. (判断题)Scala有两种类型的变量,一种是使用关键字var声明的常量,值是不可变的;另一种是使用关键字val声明的变量,值是可变的。
23、 13. (单选题)使用“val rdd: RDD[String]= sc.makeRDD(List("Hello Scala","Hello Spark"))”创建了一个RDD,以下选项中,不能使该RDD实现单词计数的是( )。
24、 20. (单选题)下列方法中,用于计算数组长度的是()。
25、 5. (单选题)DataFrame的show()方法默认输出( )条数据。
26、(判断题) 19. (判断题)DataFrame可以从很多数据源中创建,例如结构化文件、外部数据库、Hive表等数据源。
27、 10. (单选题)对于RDD1((a,1),(b, 2),(c,3))和RDD2((b,4),(b,5),(a,6)),使用“RDD1.join (RDD2)”,得到的结果是( )。
28、 1. (单选题)下面哪个端口不是Spark自带服务的端口
29、(填空题) 22. (填空题)方法用于对具有相同键的值进行分组,可以对同一组的数据进行计数、求和等操作。
30、 4. (单选题)以下关于数组a的定义,最终数组a的数据与其他选项不一致的是
31、(填空题) 22. (填空题)方法可以通过一个函数重新计算列表中的所有元素,并且返回一个包含相同数目元素的新列表。
32、(判断题) 21. (判断题)Spark SQL与Hive相互不兼容。
33、(填空题) 12. (填空题)Spark SQL是Spark用来 的一个模块
34、 8. Spark于2009年诞生于()。
35、(填空题) 11. (填空题)协同过滤推荐算法有两种形式,分别是_____和_____
36、 2. (单选题)下列属于关联规则算法是( )。
37、 9. (单选题)关于Spark SQL的DataFrame基础操作,以下选项中说法错误的是( )。
38、(判断题) 17. (判断题)Spark SQL可以通过JDBC从关系数据库中读取数据的方式创建DataFrame,通过对DataFrame进行一系列的操作后,不可以将数据重新写入到关系数据库中。
39、 3. (单选题)以下关于Scala的变量定义、赋值的代码,运行后一定会报错的是( )
40、 7. Spark与Hadoop在基于内存的运算中,说法正确的是()。
41、 5. (单选题)下列选项中不属于MLlib中常用的数据类型的是( )。
42、(判断题) 15. (判断题)部署Spark高可用集群不需要用到Zookeeper服务
43、 5. (单选题)以下是行动操作的方法是()
44、(填空题) 13. (填空题)spark-shell下清屏的快捷方式为
45、(判断题) 14. (判断题)Spark诞生于洛桑联邦理工学院(EPEL)的编程方法实验室
46、(填空题) 28. (填空题)在Scala中,使用___关键字来定义的类被称为样例类。
47、 13. (单选题)以下关于Scala的类和单例对象之间的差别描述正确的是( )
48、 6. (单选题)关于Spark MLlib的mllib.stat.Statistics类中的方法,描述错误的是( )。
49、(判断题) 13. (判断题)标注点是一种带有标签的本地向量,通常用于无监督学习算法中
50、 5. 关于SparkRDD,下列说法不正确的是( )
51、 1. 以下关于Scala解释器(REPL)交互的基本方式说法错误的是( )
52、 2. (单选题)现有一个DataFrame数据命名为data,而在Spark SQL的DataFrame API中有众多方法可以对其数据进行查看。查看data数据的前10条数,以下写法错误是( )。
53、 2. Spark是Hadoop生态下( )组件的替代方案
54、(判断题) 22. (判断题)Spark SQL为Spark框架在结构化数据分析方面提供重要技术支持。
55、(判断题) 25. (判断题)RDD是一个可变、不可分区、里面的元素不可并行计算的集合
56、(判断题) 18. (判断题)Spark SQL不仅能够查询MySQL数据库中的数据,还可以向表中插入新的数据
57、(判断题) 34. (判断题)Scala中,使用关键字var或val声明变量时,后面紧跟的变量名称可以和Scala中的保留字重名,而且变量名不可以以字母或下划线开头,且变量名是不区分大小写的。
58、 6. (单选题)获取DataFrame中所有数据,并返回一个数组对象,使用的方法是( )。
59、(填空题) 19. (填空题)方法用于获取RDD的前N个元素,返回数据为数组
60、(判断题) 29. (判断题)Scala语言是一种面向过程编程的语言。
61、 4. (单选题)DataFrame可以将数据保存成持久化的表,使用的方法是( )。
62、(填空题) 23. (填空题)spark-submit常用配置项中 --name Name主要用于

微信扫一扫 在线答题 在线出卷 随机出题小程序 闯关答题软件 出题答题小程序