spark编程基础python版期末考试题库

佚名 · 0905

考试，试题

文件大小13.96 KB

文件格式docx

分享时间2024-09-18

更多此类文档

立即下载

还剩6页未读，继续阅读

文本内容:

spark编程基础python版期末考试题库一.选择判断

1.下面哪个不是RDD的特点A.可分区B.可序列化C.可修改D.可持久化

2.关于累加器，下面哪个是错误的A.支持加法B.支持数值类型C.可并行D.不支持自定义类型

3.Scala语言中，以下说法正确的是A.常量和变量都可以不用赋初始值B.常量需要赋初始值，变量可以不用赋初始值C.常量和变量都需要赋初始值D.常量不需要赋初始值，变量必须赋初始值

4.下面对MapReduce描述错误的是A.适合离线批处理B.具有很好的容错性和扩展性C.启动开销小、可以使用很少的磁盘到时效率提高D.Shuffle连接Map和Reduce

6.下列哪一项是yarn的一级调度管理A.计算资源管理B.Schedule的周期管理C.application内部计算模型管理D.多样化计算模型管理

7.Scala里，final修饰符的描述正确的是A.类的声明上添加final修饰符确保成员不被子类重载B.类的声明上添加final修饰符把整个类声明为final,这个类不能被继承C.类的声明上添加final修饰符确保成员只能被子类重载一次D.以上说法都是错误的

8.调用函数时指定，参数顺序可以跟函数定义时的顺序不同A.参数名B.参数值C.默认值D.变量值

9.scala中，类和它的伴生对象说法错误的是0A.类和它的伴生对象定义在同一个文件中B.类和它的伴生对象可以有不同的名称C.类和它的伴生对象可以互相访问私有特性D.类和它的伴生对象可以实现既有实例方法又有静态方法

10.以下可以实现类似java中的break跳出方式A.使用一个Boolean类型的控制变量，合适的时候returnB.使用嵌套函数一从函数当中returnC.使用Breaks对象中的break方法D.使用continueABC

11.Spark可以实现哪些形式的分布式计算A.内存式运算B.机器学习C.交互式查询D.流式计算ABCD

12.Spark的算子类型A.转换算子B.迭代算子C.动作算子D.核心算子AC

13.下列哪些是spark的特点A.运行快B.基于内存C.底层是mr运算D.速度快ABD

14.spark的存储级别包含A.MEMORY ONLYB.MEMORY ONLYSERC.MEMORYD.MEMORY_AND_DISK_SERABD

15.以下是Spark中executor的作用是A.保存计算的RDD分区数据B.向Driver反向注册C.接受Driver端发送来的任务Task,作用在RDD上进行执行D.做资源调度任务ABC

16.关于累加器，下面哪个是正确的A.支持加法B.支持数值类型C.可并行D.不支持自定义类型ABC

17.关于广播变量，下面哪个是正确的A.任何函数调用B.是只读的C.存储在各个节点D.存储在磁盘或HDFSABC

18.spark的特点有哪些A.快速性B.通用性C.兼容性D.持续性ABC

19.下列选项有哪些是spark优化A.复用同一个rddB.创建重复的rddC.尽量使用shuffle算子D.使用map-side预聚合的shuffle操作AD

20.关于累加器，下面哪个是正确的的A.支持加法B.支持数值类型C.不可并行D.不支持自定义类型AB

21.spark的特点包括A.快速B.通用C.可延伸D.兼容性ABD

22.容错的级别有A.最多一次B.至少一次C.一次仅一次D.只能一次ABC

23.关于广播变量，下面哪个是错误的A.任何函数调用B.是只读的C.存储在各个节点D.存储在磁盘或HDFSABC

24.Spark的数据本地性有哪几种A.PROCESS_LOCAL是指读取缓存在本地节点的数据B.NODE_LOCAL是指读取本地节点硬盘数据C.ANY是指读取非本地节点数据D.B和C对ABC

25.关于master的作用，下面正确的是A.接受driver端注册请求B.启动任务的容器ExecutorC.任务资源的调度D.监控集群ACD

26.如何解决数据倾斜A.增大分区B.增加前缀或后缀C.减少分区D.根据需要找keyABD

27.Spark的资源分配方式包括A.尽量集中B.尽量打散C.全部集中D.全部打散AB

28.下面哪些端口是spark自带服务的端口A.8080B.4040C.8090D.18080ABD

29.下面属于HDFS设计目标的是A.自动快速检测应对硬件错误B.流式访问数据C.移动计算比移动数据本身更划算D.简单一致性模型ABCD

30.下面描述正确的是A.HDFS将数量众多的廉价机器使得硬件错误成为常态B.HDFS支持多种软硬件平台中的可移植性C.HDFS上的一个文件大小是G或T数量级的，支持一个云中文件数量达到千万数量级D.HDFS上的文件可以任意修改ABC。

更多此类文档

关于文档

个人认证

优秀文档

获得点赞 0

文件大小13.96 KB

文件格式docx

分享时间2024-09-18

更多此类文档

立即下载