小曹选择题 在线考试 答题题目
1、(判断题) 31. (判断题)在Scala中定义变长数组时,需要导入可变数组包。
2、 2. (单选题)下列属于关联规则算法是( )。
3、 7. (单选题)下列方法中,哪个方法可以正确计算数组arr的长度( )
4、(判断题) 15. (判断题)部署Spark高可用集群不需要用到Zookeeper服务
5、 16. (单选题)提交Spark程序时,通常需要设置一些配置项,关于配置项,下列说法错误的是( )
6、(判断题) 18. (判断题)Hadoop的MapReduce进行计算时,每次产生的中间结果都是存储在内存中;而Spark在计算时产生的中间结果存储在本地磁盘中。
7、 12. (单选题)Spark中的SparkContext是( )。
8、 8. Spark于2009年诞生于()。
9、(填空题) 22. (填空题)方法用于对具有相同键的值进行分组,可以对同一组的数据进行计数、求和等操作。
10、(填空题) 23. (填空题)spark-submit常用配置项中 --name Name主要用于
11、(填空题) 13. (填空题)spark-shell下清屏的快捷方式为
12、 1. (单选题)下面哪个端口不是Spark自带服务的端口
13、 3. (单选题)关于Spark SQL的说法,以下选项错误的是( )。
14、 8. (单选题)下列关于List的定义,哪个是错误的( )
15、(填空题) 11. (填空题)协同过滤推荐算法有两种形式,分别是_____和_____
16、(填空题) 9. (填空题)启动Spark集群的命令为
17、 13. (单选题)使用“val rdd: RDD[String]= sc.makeRDD(List("Hello Scala","Hello Spark"))”创建了一个RDD,以下选项中,不能使该RDD实现单词计数的是( )。
18、 8. (单选题)以下选项中不能对DataFrame列名进行重命名的方法是( )。
19、(判断题) 20. (判断题)Spark SQL提供了一个编程抽象结构叫做DataFrame的数据模型。
20、(填空题) 24. (填空题)使用____方法可以实现数据过滤
21、 9. (单选题)关于Spark SQL的DataFrame基础操作,以下选项中说法错误的是( )。
22、 6. (单选题)获取DataFrame中所有数据,并返回一个数组对象,使用的方法是( )。
23、 13. (单选题)以下关于Scala的类和单例对象之间的差别描述正确的是( )
24、(判断题) 19. (判断题)DataFrame可以从很多数据源中创建,例如结构化文件、外部数据库、Hive表等数据源。
25、(填空题) 18. (填空题)在RDD操作中,可使用___ 方法收集查询数据
26、 15. (单选题)以下选项中不是spark-submit的指定参数的是( )
27、(判断题) 22. (判断题)Spark SQL为Spark框架在结构化数据分析方面提供重要技术支持。
28、 11. (单选题)在Scala语言中,关于列表的定义,不正确的是( )
29、(判断题) 35. (判断题)Scala中声明变量时,可以不给出变量的类型,因为在初始化的时候,Scala的类型推断机制能够根据变量初始化的值自动推算出来。
30、 5. (单选题)以元组pair为例,以下关于元组说法错误的是( )
31、(填空题) 11. (填空题)是一个用于处理结构化数据的框架,可被视为一个分布式的SQL查询引擎,提供了一个抽象的可编程数据模型DataFrame
32、 3. (单选题)下列选项中( )算法不属于有监督学习算法。
33、(判断题) 21. (判断题)Spark SQL与Hive相互不兼容。
34、 7. Spark与Hadoop在基于内存的运算中,说法正确的是()。
35、 1. 以下关于Scala解释器(REPL)交互的基本方式说法错误的是( )
36、(判断题) 34. (判断题)Scala中,使用关键字var或val声明变量时,后面紧跟的变量名称可以和Scala中的保留字重名,而且变量名不可以以字母或下划线开头,且变量名是不区分大小写的。
37、 1. (单选题)下列说法正确的是哪一项?( )
38、 11. (单选题)saveAsTextFile()方法用于将( )以文本文件的格式存储到文件系统中。
39、 8. (单选题)ALS是MLlib的一个实现推荐算法的包,需要输入的数据类型是( )。
40、 2. (单选题)下列方法中,不可用于创建RDD的方法的是( )
41、 21. (单选题)Scala中,用于创建单例对象的关键字是()。
42、 3. (单选题)以下关于Scala的变量定义、赋值的代码,运行后一定会报错的是( )
43、(判断题) 15. (判断题)Spark SQL与Hive不兼容
44、 17. (单选题)映射的示例代码如下,运行后res的正确结果是( )。
val data = Map(1 ->"Chinese",2 ->"Math",3 ->"English")
val res = for((k,v)<- data; if(k>1))yield v
45、(判断题) 25. (判断题)RDD是一个可变、不可分区、里面的元素不可并行计算的集合
46、(填空题) 10. (填空题)停止Spark集群的命令为
47、 19. (单选题)
定义类Counter,并通过new关键字实例化出counter对象,代码如下,以下选项的操作正确的是( )。
class Counter(name:String)(
val a = 1
var b ="counter”
}
val counter = new Counter("computer")
48、 16. (单选题)以下选项符合Scala编程规范的是( )。
①"spark".equals("spark") ②"spark".contains(spark)
③val a:String="spark"④val a=List{1,2,3,4}
49、(填空题) 24. (填空题)RDD的操作主要分为____和____
50、 9. (单选题)关于mllib.feature中创建特征向量的方法,下列说法错误的是( )。
51、(判断题) 13. (判断题)标注点是一种带有标签的本地向量,通常用于无监督学习算法中
52、 7. (单选题)下列选项中,( )不属于数据标准化或归一化方法。
53、 2. 以下关于Scala的特性说法错误的是( )
54、 4. (单选题)下列选项中( )算法属于分类算法。
55、(填空题) 19. (填空题)方法用于获取RDD的前N个元素,返回数据为数组
56、(填空题) 23. (填空题)方法和map()方法类似,但是该方法没有返回值,只用于对参数的结果进行输出。
57、 5. (单选题)下列选项中不属于MLlib中常用的数据类型的是( )。
58、 4. (单选题)以下关于数组a的定义,最终数组a的数据与其他选项不一致的是
59、 10. (单选题)在Spark中,调用RDD的()方法,可以将RDD转换为DataFrame对象。
60、 5. (单选题)DataFrame的show()方法默认输出( )条数据。
61、 3. (单选题)以下方法中,从外部存储系统中创建RDD使用的方法是( )
62、(填空题) 21. (填空题)方法用于合并具有相同键的值,作用对象是键值对,并且只对键的值进行处理。
63、(判断题) 26. (判断题)RDD采用了惰性调用,即在RDD的处理过程中,真正的计算发生在RDD的“行动”操作
64、(判断题) 30. (判断题)在Scala中,使用关键字bar声明的变量,值是不可变的。
65、(填空题) 25. (填空题)方法可对集合中的元素进行分组操作,返回的结果是一个映射。
微信扫一扫 在线答题 在线出卷 随机出题小程序 闯关答题软件 出题答题小程序