选择 在线考试 答题题目
1、 2. Spark是Hadoop生态下( )组件的替代方案
2、 1. 以下关于Scala解释器(REPL)交互的基本方式说法错误的是( )
3、 5. (单选题)下列选项中不属于MLlib中常用的数据类型的是( )。
4、 8. Spark于2009年诞生于()。
5、 3. Spark支持的运行模式不包括( )
6、 6. (单选题)关于sortBy(方法的三个可输入参数,以下选项中描述错误的是 ( )
7、 4. (单选题)以下是转换操作的方法是()
8、 12. (单选题)映射的示例代码如下,运行后res的正确结果是val data=Map(1->"Chinese"),2->"Math",3->"English" val res=for(k,v)<-data;if(k>1)) yield v
9、 12. (单选题)Spark中的SparkContext是( )。
10、 6. (单选题)关于Spark MLlib的mllib.stat.Statistics类中的方法,描述错误的是( )。
11、 14. (单选题)以下选项中使用spark-submit指定在YARN框架上运行程序的是( )。
12、 3. (单选题)关于Spark SQL的说法,以下选项错误的是( )。
13、 11. (单选题)在Scala语言中,关于列表的定义,不正确的是( )
14、 7. (单选题)以下选项中,关于Spark SQL优点描述正确的是( )。 ①将SQL查询与Spark程序无缝混合,可以使用Java、Scala、Python、R等语言的API操作 ②兼容Hive ③统一的数据访问 ④标准的数据连接
15、 21. (单选题)Scala中,用于创建单例对象的关键字是()。
16、 3. (单选题)下列选项中( )算法不属于有监督学习算法。
17、 8. (单选题)以下选项中不能对DataFrame列名进行重命名的方法是( )。
18、 13. (单选题)使用“val rdd: RDD[String]= sc.makeRDD(List("Hello Scala","Hello Spark"))”创建了一个RDD,以下选项中,不能使该RDD实现单词计数的是( )。
19、 6. (单选题)下列选项中,哪个是Scala编译后文件的扩展名( )
20、 15. (单选题)以下程序的输出结果是( )。 val alphabet = List("A","B","C") val nums = List(1,2)
print(alphabet.zip(nums))
21、 10. (单选题)表达式for(i<-1 to 3;for(j<-1 to 3;if i!=j))print((10*i+j))+"",输出结果正确的是( )
22、 1. (单选题)下面哪个端口不是Spark自带服务的端口
23、 1. (单选题)以下不属于Spark架构中的组件的是( )
24、 3. (单选题)以下方法中,从外部存储系统中创建RDD使用的方法是( )
25、 4.在Spark中,如果需要对实时数据进行流式计算,那么使用的子框架是( )
26、 5. (单选题)以元组pair为例,以下关于元组说法错误的是( )
27、 19. (单选题)
定义类Counter,并通过new关键字实例化出counter对象,代码如下,以下选项的操作正确的是( )。
class Counter(name:String)(
val a = 1
var b ="counter”
}
val counter = new Counter("computer")
28、 18. (单选题)以下关于Scala的类和单例对象之间的差别描述正确的是( )。
29、 4. (单选题)下列选项中( )算法属于分类算法。
30、 6. 下列选项中,可以支持Scala和Python编程的交互式解释器是()。
31、 10. (单选题)对于RDD1((a,1),(b, 2),(c,3))和RDD2((b,4),(b,5),(a,6)),使用“RDD1.join (RDD2)”,得到的结果是( )。
32、 1. (单选题)下列说法正确的是哪一项?( )
33、 7. Spark与Hadoop在基于内存的运算中,说法正确的是()。
34、 11. (单选题)saveAsTextFile()方法用于将( )以文本文件的格式存储到文件系统中。
35、 8. (单选题)ALS是MLlib的一个实现推荐算法的包,需要输入的数据类型是( )。
36、 4. (单选题)以下关于数组a的定义,最终数组a的数据与其他选项不一致的是
37、 5. (单选题)以下是行动操作的方法是()
38、 5. 关于SparkRDD,下列说法不正确的是( )
39、 17. (单选题)映射的示例代码如下,运行后res的正确结果是( )。
val data = Map(1 ->"Chinese",2 ->"Math",3 ->"English")
val res = for((k,v)<- data; if(k>1))yield v
40、 9. (单选题)对于RDD(a,1),(a,2),(a,3)),使用“reduceByKey(_+_)”进行合并,得到的结果 是( )
41、 7. (单选题)下列方法中,哪个方法可以正确计算数组arr的长度( )
42、 7. (单选题)下列选项中,( )不属于数据标准化或归一化方法。
43、 9. (单选题)关于mllib.feature中创建特征向量的方法,下列说法错误的是( )。
44、 6. (单选题)获取DataFrame中所有数据,并返回一个数组对象,使用的方法是( )。
45、 5. (单选题)DataFrame的show()方法默认输出( )条数据。
46、 20. (单选题)下列方法中,用于计算数组长度的是()。
47、 3. (单选题)以下关于Scala的变量定义、赋值的代码,运行后一定会报错的是( )
48、 2. (单选题)现有一个DataFrame数据命名为data,而在Spark SQL的DataFrame API中有众多方法可以对其数据进行查看。查看data数据的前10条数,以下写法错误是( )。
49、 8. (单选题)关于键值对RDD的连接操作,以下选项中描述正确的是
50、 16. (单选题)以下选项符合Scala编程规范的是( )。
①"spark".equals("spark") ②"spark".contains(spark)
③val a:String="spark"④val a=List{1,2,3,4}
51、 9. (单选题)关于Spark SQL的DataFrame基础操作,以下选项中说法错误的是( )。
52、 16. (单选题)提交Spark程序时,通常需要设置一些配置项,关于配置项,下列说法错误的是( )
53、 9. (单选题)下列选项中,哪个不是Spark生态系统中的组件?
54、 10. (单选题)在Spark中,调用RDD的()方法,可以将RDD转换为DataFrame对象。
55、 4. (单选题)DataFrame可以将数据保存成持久化的表,使用的方法是( )。
56、 15. (单选题)以下选项中不是spark-submit的指定参数的是( )
57、 13. (单选题)以下关于Scala的类和单例对象之间的差别描述正确的是( )
58、 2. (单选题)下列方法中,不可用于创建RDD的方法的是( )
59、 1. (单选题)机器学习可以分为( )。
60、 8. (单选题)下列关于List的定义,哪个是错误的( )
61、 2. 以下关于Scala的特性说法错误的是( )
62、 14. (单选题)定义类Counter,并通过new关键字实例化出counter对象,代码如下,以下选项的操作正确的是( )。 class Counter(name:String){val a = 1var b ="counter" } val counter = new Counter("computer")
63、 2. (单选题)下列属于关联规则算法是( )。
64、 7. (单选题)关于RDD集合操作方法,以下选项中描述错误的是

微信扫一扫 在线答题 在线出卷 随机出题小程序 闯关答题软件 出题答题小程序