还剩18页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
大数据复习题与参考答案ict
一、单选题(共题,每题分,共分)
621621.StructuredStreaming中以下哪项计划的执行顺序是正确的?A、物理计划------逻辑计划-------优化的逻辑计划B、优化的逻辑计划——逻辑计划——物理计划C、逻辑计划------物理计划-------优化的逻辑计划D、逻辑计划——优化的逻辑计划——物理计划正确答案D
2.下面关于pod的描述不正确的是?A、一^个pod可以包含一个或多个容器B、同一个pod里面的容器不能共享一个存储卷的空间C、pod是kubernetes的基本调度单元D、每个pod都拥有一个唯一的IP地址正确答案B
3.不是EIP加入共享带宽好处的是()A、方便管理B、提升性能C、多个IP共用一条带宽D、节约成本正确答案B
4.以下()用户向VDC管理员提供内资源的运维A、VDC业务员B、VDC只读管理员C、代维管理员D、运维管理员正确答案C
5.日志管理的作用不包括下列哪项()A、攻击溯源B、日志存储C、审计用户行为D、运维故障分析正确答案C
6.关于Python语言的特点,以下选项中描述错误的是
(一)A、Python语言是跨平台语言B、Python语言是脚本语言A、微服务运维生命周期管理B、微服务上线生命周期管理C、微服务开发生命周期管理D、微服务全生命周期管理正确答案D
49.Fusionlnsiht HD中,Oozie客户端的JAVA API在运行任务时会调用OozieClient类的()方法A、suspendB、getJob InfoC、submitD、run正确答案D
50.对象存储服务中单个租户支持创建的桶的最大数量()A、50B、90C、100D、80正确答案C
51.CCE集群支持的应用升级方式有()A、滚动升级B、静默升级C、补丁升级D、提示升级正确答案A
52.(—)的目的就是给定学习器选择最有利于其性能的特征子集A、过滤式选择B、包裹式选择C、稀疏表示D、嵌入式选择正确答案B
53.微服务CSE的流程与工具、自组织团队、技术实践三者相辅相成.下述哪项不属于流程与工具的范畴?()A、积极引入外部工具同时不断优化内部工具B、保障持续集成、持续部署流水线的稳定目高效C、通过高度成熟的自动化体系建立可靠且可重复的交付过程D、加强基础设施的构建与管理加快监控、告警、日志聚合等反馈效率正确答案C
54.以下不属于运营管理员的权限A、资源池对接B、租户管理C、VDC自运维D、系统配置正确答案C
55.CVS日志放在A、/var/1og/fus ionsphere/component/eIb-v3-controI Ier/B、/usr/1oca I/NSP/ng inx/1ogs/C、/var/1og/fus ionsphere/component/cvs-agent/D、/var/1og/fus ionsphere/component/正确答案B
56.在Fusioninsight LibrA中,下面对analyze使用的描述错误的是oA、ana Iyze语句可收集与数据库中表内容相关的统计信息,统计结果存储在系统表PG_STATISTIC中B、建议对一个刚执行过大批量插入操作的表执行ana Iyze语句,以便使LibrA内的优化器模块根据这些统计数据获得更优的输出,进而影响业务性能C、执行计划生成器会使用PG_STAT IST IC表中的统计数据,以生成最有效的查询执行计划D、ana Iyze语句中使用-pop选项,可避免当数据库中数据量过大时内存紧张正确答案D
57.K-摇臂赌博机属于一算法A、深度学习B、强化学习C、机器学习D、有监督学习正确答案B
58.以下不属于网关框架的是A、Edge Servi ceB、ZuuIC Spri ngBootD、Spr ingCloud Gateway正确答案c
59.—的基本想法是适当考虑一部分属性间的相互依赖信息,从而既不需要进行完全联合概率计算,又不至于彻底忽略了比较强的属性依赖关系A、贝叶斯决策论B、贝叶斯判定准则C、朴素贝叶斯分类器D、半朴素贝叶斯分类器正确答案D
60.HDFS中的主备仲裁,是由组件控制的A、Zookeeper Fai Iover ControII erB、NodeManagerC ResourceManagerD、HDFS Client正确答案A
61.在安全整体部署中,以下关于IPS部署与WAF部署说法正确的是哪项A、IPS产品一般采用直路部署模式部署在服务器前端,为服务器提供实时防护B、IPS设备与WAF设备均能对HTTP漏洞进行防护,因此任意选择其一部署在网络中即可C、WAF产品能在事前、事中、事后三个阶段进行防御,而IPS产品一般只能在事前进行防御D、企业中如果有关键业务服务器,建议在服务器之间采用透明代理模式部署WAF产品正确答案D
62.通过云硬盘ID查找对应在FusionStorage里的Lun ID的步骤是:0A、登录Fus ionSphereOpenStack控制节点,通过ci ndershowvolume-id搜索lun_id信息B、通过登陆FusionStorage,搜索云硬盘id查找对应的lun_idC、通过登陆CPS查找云硬盘id查找对应的lun idD、无法查找正确答案A
二、多选题(共题,每题分,共分)
271271.在产品选型时,数据中台逻辑架构中分析层要重点关注产品的特点包含()方面A、批量删除能力B、强大的OLTP能力C、高并发的查询能力D、强资源隔离能力正确答案CD
2.下列关于聚集算子的说法正确的是()A、Hashagg性能最佳,一般聚集算子尽量都用HashaggB、通过设置enab Ie-sort-off,可以关闭sort+GroupAggC、聚集算子需要所有聚集列都支持排序D、当聚集缩减率较大时使用Hashagg正确答案BD
3.ka珠a消息在()情况下被删除A、超过数据保存最大容量B、永远不会被删除C、被消费完就立即删除D、超过老化时间会被删除正确答案AD
4.创建数据库可以指定兼容()参数A、MySQLB、OraC、TDD、SQL Server正确答案BC
5.弹性IP的带宽支持0的方式A、独占带宽B、公有带宽C、共享带宽D、私有带宽正确答案AC
6.以下关于数据服务说法错误的是()A、数据服务采用Server Iess架构B、支持弹性扩展C、数据服务的功能包括API生成、API注册、API调用和API运营D、数据服务api接口发布成功后,可以实现在线修改正确答案ABC
7.以下哪些选项是ElasticSearch主节点EsMaster功能?A、参与删除索引B、参与文档数据搜索C、参与文档数据变更D、参与新建索引正确答案AD
8.和弹性IP相关的操作有A、释放B、绑定C、延期D、解绑正确答案ABCD
9.弹性负载均衡支持协议A、TCPB、UDPC、HTTPSD、HTTP正确答案ABCD
10.基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有A、MRB、SparkC、HDFSD、HBase正确答案CD
11.Spark有特点A、快B、巧C、轻D、灵正确答案ABCD
12.Spark适用于以下场景A、交互式查询B、图计算C、批处理D、实时流处理正确答案ABCD
13.Fusioninsight HD中,在使用Streaming的ACK机制时,说法正确的是A、启用了Acker之后,Streami ng会识别发送失败的Tup Ie并自动重发,无需人为干预B、Acker会标识处理超时或者处理失败的消息为faiLC、从spout开始,形成的Tuple树中任何一^个环节失败都会标记整棵树失败D、应用需要在spout的fa iI接口方法中实现消息重发逻辑正确答案BCD
14.以下属于Hive SQL中DDL的是A、修改表B、删除表C、数据导入D、建表正确答案ABD
15.在公安领域的大数据批量高线处理平台中,以下描述准确的是A、经过整理后的原始数据可以根据业务主题,分为基本信息、交往圈信息,轨迹信息,行为信息等存储B、数据来源包括公安系统、社会系统互联网系统、其他如运营商系统等C、数据来源可以按照结构或类型分为视频/图像数据,文本数据数据库中数据等D、不同的数据来源可以整理后划分实时微据、增量文件、全量文件数据库等正确答案ABCD
16.对象存储服务Object StorageService,OBS是基于对象的海量存储服务,为客户提供的数据存储能力A、海量B、安全C、高可靠D、低成本正确答案ABCD
17.Fusioninsight LibrA中的DM工具可以提供()功能A、数据库安装管理B、配置管理C、对象管理D、集群管理正确答案ABCD
18.以下哪些选项属子实时检索的特点?A、处理时间要求不高B、全文检索功能C、查询响应要求较高D、高并发正确答案BCD
19.关于Fusioninsight HD的Spark,()编程语言可以用来开发Spark应用oA、CB、Sea IaC、JavaD、Python正确答案BCD
20.Fusioninsight HD的Loader在创建作业时,连接器有()作业A、配置作业与内部数据连接方式B、配置作业与外部数据连接方式C、确定有转换D、提供优化参数,提高数据导入导出性能正确答案ABCD
21.HDFS不适用于以下()场景A、流式数据访问B、大量小文件存储C、大文件存储与访问D、随机写入正确答案BD
22.云硬盘扩容后,在Linux环境中()替换原有分区A、resize2fs/dev/xvdb1调整”/dev/xvdb1”的大小,重新挂载分区B、fd isk/dev/xvdb输入n输入和删除一样的分区编号创建分区C、卸载磁盘umount/dev/vxdb1D、fd isk/dev/xvdb输入d输入分区编号删除分区正确答案ABCD
23.两阶段事务提交包含()步骤A、事务预提交阶段B、事务回滚阶段C、事务验证阶段D、事务全局提交阶段正确答案AD
24.在DRS的标签管理服务中,下列存在的功能有()A、添加标签B、编辑标签C、备份标签D、删除标签正确答案ABD
25.以下()属于HCS
8.0私有云平台交换机虚拟化技术A、L inux Bri dgeB、OpenSwitchC、CE6810D、CE5855正确答案AB
26.数据质量定义模块包括()A、质量维度定义B、检核方法管理C、检验类别管理D、度量规则管理正确答案ABCD
27.分布式数据库中间件支持()功能A、读写分离B、水平拆分C、平滑扩容D、分布式高可用正确答案ABCD
三、判断题(共题,每题分,共分)
161161.Flume可以在系统中定制各类数据发送方,用于数据收集,同时提供简单的数据处理,并将简单处理的数据写入各种数据接收方,如文本、HDFS、Kafka和HBase、正确AB、错误正确答案A
2.Oracle数据库根据它自身的发布形态,既可以做OLAP也可以做OLTPo、正确AB、错误正确答案A
3.Hive是一种数据仓库处理工具,使用类似SQL的HiveSQL语言实现数据查询功能,所有Hice的数据存储都存储在HDFS中、正确AB、错误正确答案A
4.Fusioninsight HD中,Streaming打包工具用于将业务代码jar包和其他所依赖的jar包等,打成一个完整的Streaming应用的jar包、正确AB、错误正确答案A
5.DAYU实时作业启动过后不能暂停、正确AB、错误正确答案B
6.数据库架构设计Shared-Everying是指服务器的所有资源(包含键盘CPU、显卡、网络)都共享、正确AB、错误正确答案A
7.裸金属服务器具备物理机的一切特性和优势,您的应用可以直接访问裸金属服务器的处理器和内存,无任何虚拟化开销、正确AB、错误正确答案A
8.如果伸缩策略已经被触发,且伸缩活动正在进行,该伸缩策略可以被删除A、正确B、错误正确答案A
9.Fusioninsight HD平台中,HBase暂不支持二级索引A、正确B、错误正确答案B
10.Fusioninsight HD的Hive中,用户自定义的UDF可以和Hive内置的UDF重名,这种情况下,将使用用户自定义的UDFO、正确AB、错误正确答案B
11.对高价值高度聚合的信息和知识的批次处理是大数据行业主要商业诉求、正确AB、错误正确答案A
12.同一机房内不同机柜内的计算资源可以划分到不同的AZ中A、正确B、错误正确答案A
13.可以通过申请弹性公网IP并将弹性公网IP绑定到弹性云服务器上,实现弹性云服务器访问公网的目的A、正确B、错误正确答案A
14.一个弹性公网IP只能绑定一个云资源使用,且弹性公网IP和云资源必须在同一个区域A、正确B、错误正确答案B
15.Yarn-client和Yarn-Cluster主要区别时Application Master进程的区别C、Python语言是非开源语言D、$;$Python语言是多模型语言正确答案C
7.若上传镜像过大,上传时长超过系统限定时间分钟且没有任何页面交互,平台会自动注销而导致上传镜像失败A、45B、20C、15D、35正确答案A
8.Hive常被用来处理场景A、批量计算B、实时性计算C、流计算D、事务性处理正确答案A
9.在Spark中,假设lines是一个DStream对象,filter语句可以过滤掉80%的数据,针对以下两个语句说法正确的是Xlines,filtero....groupByKey...Ylines.groupByKey....filter...、X比Y的性能更高AB、X比Y的性能更低C、X和Y和性能一样D、无法确性X和Y的性能差异正确答案A
10.以下哪种不是iSula的部署模式?A、安全容器B、通用容器C、系统容器D、应用容器正确答案B
11.HBase中一个Region进行Split操作时,将一个HFile文件真正分开到两个Region的过程发生在以下阶段、Split过程中AB、Flush过程中A、正确B、错误正确答案A
16.Kettle中有两种脚本文件transformation(转换ktr结尾)和job(任务kjb结尾)A、正确B、错误正确答案AC、Compact ion过程中D、HFi Ie分开过程中正确答案C
12.以下关于Hive内置函效描述正确的是?A、trim去除空字符B、substr():求字符串长度C、descfunct ionsupper:查看系统自带的函效D、to_data():获取当前日期正确答案A
13.Fusioninsight HD中,如果需要查看当前登录HBase的用户和权限组,可以在HBase shell中执行()命令A、user_permissionB、whoamiC、whoD、get_user正确答案B
14.网站在运过程中,会有用户访问并产生行为数据,要想对这些数据进行处理挖掘,如果是高线批处理下的方案配置,描述不正确的是、球据存储:HDFS或MySqlAB、数据导入导出LoaderC、数据采集传输FlumeD、数据计算:Storm正确答案D
15.以下关于Zookeeper的Leader节点在接收到数据变更请求后的读写流程说法正确的是()A、先写入硬盘再写入内存B、仅写入内存C、同时写入硬盘和内存D、先写入内存再写入硬盘正确答案A
16.Insert事务使用的锁模式是()A、AccessShareLockB、RowExcI us i veLockC、SharellpdateExc Iusi veLockD、ExcI usiveLock正确答案B
17.通过公网连接MySQL实例的使用流程顺序是
1、绑定弹性公网IP
2、创建实例
3、设置安全组
4、连接实例A、2-3-1-4B、1-3-2-4C、1-2-3-4D、2-1-3-4正确答案D
18.自动作业AutoOps不支持哪种操作系统、Wi ndowsServer2012AB、AIX
5.3C、Centos
7.3D、Suse12SP3正确答案B
19.当修改时,会触发弹性伸缩活动系统自动增加或减少实例已达到期望实例数的数量、最小实例数AB、最大实例数C、冷却时间D、期望实例数正确答案D
20.在DRS中,以下迁移任务命名错误的是oA、ABCedB、ab-cdC、abcdOOID、abcd#001正确答案D
21.构造了一个词表{
1.“小明”
2.“喜欢”
3.“踢”
4.“看”
5.“足球”
6.“篮球”
7.“电影”},利用上述词表的索引号,文档{小明喜欢踢足球}可以用一个7维向量表示[]oA.1111100B.1110100C.1101001D.1111111正确答案B
22.当租户使用的资源超过配额时会出现下列情形A、资源被删除B、可以正常申请资源C、已发放资源正常运行无法申请新的资源D、资源被冻结正确答案C
23.在做CNN时,输入图片大小为37X37,经过第一层卷积层(有25个卷积核,每个卷积核的大小为5X5,不做填充,步长为1),与池化层(Maxpooling大小为3X3,不做填充,步长为1),输出图片再通过一次卷积层(有100个卷积核,每个卷积核的大小为4X4,不做填充,步长为1),与池化层max pooling(Max pooling大小为2X2,不做填充,步长为1),最终输出特征图大小为(—)oA、2X2B、3X3C、4X4D、5X5正确答案C
24.以下哪个选项属于大数据消息系统?A、ZookeeperB、HBaseC、KafkaD、Spark正确答案C
25.在Fusion InsightManager界面中、对Loader的操作不包括:()选项A、切换Leader主各节点B、查看Loader服务状态C、启动Loader实例D、配置Leader参数正确答案A
26.以下哪种机制使Flink能够实现窗口中无序数据的有序处理?A、检查点B、窗口C、有状态处D、事件时间正确答案D
27.HDFS的副本放置策略中,同一机架不同的服务器之间的距离是:()A、3B、2C、1D、4正确答案B
28.以下()组件负责控制系统资源的分配,防止过量业务负载对系统的冲击而导致业务拥塞A、GTMB、WLMC、CND、DN正确答案B
29.一般情况下,若要提高Elasticsearch检索效率,可以采取什么操作?A、调整索引分片数B、使用Hive做底层存储C、增加EsMaster节点D、压缩索引正确答案A
30.距离超平面最近的几个训练样本称为支持向量,两个异类支持向量到超平面的距离之和为
(一)oA、距离B、偏差C、间隔D、误差正确答案C
31.以下哪个选项不是容器引擎的底层关键技术?A、CgroupB、KVMC、NamespaceD、Un ion FileSystem正确答案B
32.Spark是用以下()编程语言实现的、CAB、C++C、JAVAD、Sea Ia正确答案D
33.下列关于存储过程的特点说法正确的是()A、创建时编译,执行时调用,因此开发效率高B、通过指定存储过程的访问权限,因此安全系数高C、用户创建的存储过程或自定义函数可以重复调用,因此数据传输量少D、编写的SOL存储在数据库中,因此执行速度快正确答案B
34.Kubernetes无状态工作负载指的是0A、DepIoymentB、JobC、StatefuI SetD、DaemonSet正确答案A
35.DRS查看迁移任务中的迁移日志,不能看到的是()A、创建用户B、时间C、级别D、描述正确答案A
36.一幅大小为512X512的8比特图像,则该图像大小为()A、32KBB、128KBC、16KBD、256KB正确答案D
37.用户修改物理专线时,可以修改以下哪些参数?、带宽AB、对端地址C、区域D、名称正确答案D
38.Docker的资源隔离使用的是Linux的以下哪种特性?A、CgroupB、SELi nuxC、aufsD、namespace正确答案D
39.在线迁移新建任务配置时,在“场景选择”页面,不属于源数据库来源的是oA、本地自建库B、本云云数据库C、本云ECS自建库D、本地云上数据库正确答案D
40.弹性伸缩告警策略不支持以下类型的告警信息监控A、CPU利用率B、内存利用率C、网络流入速率D、磁盘容量使用率正确答案D
41.Apriori是一种算法A、关联分析B、聚类分析C、决策树D、强化学习正确答案A
42.对ElasticSearch检索流程描述正确的是?A、检索节点不需要汇总结果直接把结果发送给客户端B、分片节点不需要汇总结果直接把结果发送给客户端C、分片节点汇总结果发送给客户端D、检索节点汇总结果发送给客户端正确答案D
43.考虑以下场景,Hbase中有列簇CF1,列Cl,C2当读取Hbase表时,只要求返回C1的列值,使用下列那个选项可以实现该功能?A、ColumeFiIterB、Qua IifierFI iterC、VaIueFiIterD、RowFiIter正确答案c
44.在配置微服务灰度发布的“发布任务”时,必须要配置的参数不包括、任务名称AB、微服务引擎C、发布环境D、微服务应用名正确答案D
45.负载均衡的访问地址,通过该地址可以访问对应的负载均衡每个ELB都必须有一个,是ELB的地址信息A、服务ipB、弹性ipC、服务链接D、对外端口正确答案A
46.在分类问题中,经常会遇到正负样本数据量不等的情况,比如正样本为100万条数据,负样本只有1万条数据,以下最合适的处理方法是一A、将负样本重复100次,生成100万样本量,打乱顺序参与分类B、将负样本每个权重设置为100,正样本权重为1,参与训练过程C、直接进行分类,可以最大限度利用数据D、从100万正样本中随机抽取1万参与分类正确答案B
47.关于HIVE的描述不正确的是□A、Hive查询操作过程严格遵循Hadoop MapReduce的作用执行模型,Hive将用户的HiveSQL语句通过解释器转换为MapReduce Hadoop集群上B、Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在提交作业和调度的时候需要大量的开销C、Hive最佳使用场景是大数据集的批处理作业D、Hive可以实现在大规模集群上实现低延迟快速查询正确答案D
48.下述哪项是微服务引擎CSE的目标?。
个人认证
优秀文档
获得点赞 0