还剩6页未读,继续阅读
文本内容:
spark编程基础python版期末考试题库一.选择判断
1.下面哪个不是RDD的特点A.可分区B.可序列化C.可修改D.可持久化
2.关于累加器,下面哪个是错误的A.支持加法B.支持数值类型C.可并行D.不支持自定义类型
3.Scala语言中,以下说法正确的是A.常量和变量都可以不用赋初始值B.常量需要赋初始值,变量可以不用赋初始值C.常量和变量都需要赋初始值D.常量不需要赋初始值,变量必须赋初始值
4.下面对MapReduce描述错误的是A.适合离线批处理B.具有很好的容错性和扩展性C.启动开销小、可以使用很少的磁盘到时效率提高D.Shuffle连接Map和Reduce
6.下列哪一项是yarn的一级调度管理A.计算资源管理B.Schedule的周期管理C.application内部计算模型管理D.多样化计算模型管理
7.Scala里,final修饰符的描述正确的是A.类的声明上添加final修饰符确保成员不被子类重载B.类的声明上添加final修饰符把整个类声明为final,这个类不能被继承C.类的声明上添加final修饰符确保成员只能被子类重载一次D.以上说法都是错误的
8.调用函数时指定,参数顺序可以跟函数定义时的顺序不同A.参数名B.参数值C.默认值D.变量值
9.scala中,类和它的伴生对象说法错误的是0A.类和它的伴生对象定义在同一个文件中B.类和它的伴生对象可以有不同的名称C.类和它的伴生对象可以互相访问私有特性D.类和它的伴生对象可以实现既有实例方法又有静态方法
10.以下可以实现类似java中的break跳出方式A.使用一个Boolean类型的控制变量,合适的时候returnB.使用嵌套函数一从函数当中returnC.使用Breaks对象中的break方法D.使用continueABC
11.Spark可以实现哪些形式的分布式计算A.内存式运算B.机器学习C.交互式查询D.流式计算ABCD
12.Spark的算子类型A.转换算子B.迭代算子C.动作算子D.核心算子AC
13.下列哪些是spark的特点A.运行快B.基于内存C.底层是mr运算D.速度快ABD
14.spark的存储级别包含A.MEMORY ONLYB.MEMORY ONLYSERC.MEMORYD.MEMORY_AND_DISK_SERABD
15.以下是Spark中executor的作用是A.保存计算的RDD分区数据B.向Driver反向注册C.接受Driver端发送来的任务Task,作用在RDD上进行执行D.做资源调度任务ABC
16.关于累加器,下面哪个是正确的A.支持加法B.支持数值类型C.可并行D.不支持自定义类型ABC
17.关于广播变量,下面哪个是正确的A.任何函数调用B.是只读的C.存储在各个节点D.存储在磁盘或HDFSABC
18.spark的特点有哪些A.快速性B.通用性C.兼容性D.持续性ABC
19.下列选项有哪些是spark优化A.复用同一个rddB.创建重复的rddC.尽量使用shuffle算子D.使用map-side预聚合的shuffle操作AD
20.关于累加器,下面哪个是正确的的A.支持加法B.支持数值类型C.不可并行D.不支持自定义类型AB
21.spark的特点包括A.快速B.通用C.可延伸D.兼容性ABD
22.容错的级别有A.最多一次B.至少一次C.一次仅一次D.只能一次ABC
23.关于广播变量,下面哪个是错误的A.任何函数调用B.是只读的C.存储在各个节点D.存储在磁盘或HDFSABC
24.Spark的数据本地性有哪几种A.PROCESS_LOCAL是指读取缓存在本地节点的数据B.NODE_LOCAL是指读取本地节点硬盘数据C.ANY是指读取非本地节点数据D.B和C对ABC
25.关于master的作用,下面正确的是A.接受driver端注册请求B.启动任务的容器ExecutorC.任务资源的调度D.监控集群ACD
26.如何解决数据倾斜A.增大分区B.增加前缀或后缀C.减少分区D.根据需要找keyABD
27.Spark的资源分配方式包括A.尽量集中B.尽量打散C.全部集中D.全部打散AB
28.下面哪些端口是spark自带服务的端口A.8080B.4040C.8090D.18080ABD
29.下面属于HDFS设计目标的是A.自动快速检测应对硬件错误B.流式访问数据C.移动计算比移动数据本身更划算D.简单一致性模型ABCD
30.下面描述正确的是A.HDFS将数量众多的廉价机器使得硬件错误成为常态B.HDFS支持多种软硬件平台中的可移植性C.HDFS上的一个文件大小是G或T数量级的,支持一个云中文件数量达到千万数量级D.HDFS上的文件可以任意修改ABC。
个人认证
优秀文档
获得点赞 0