还剩18页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
大数据练习题库及参考答案HCIA
一、单选题(共题,每题分,共分)41141I.Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?A、客户端的文件数据经过NameNode传递给DataNodeB、客户端将文件划分为多个Block,根据DataNode的地址信息,按顺序写入每一^个DataNode中C、客户端根据DataNode的地址信息,按顺序将整个文件写入每一个DataNode中,然;后由DataNode将文件划分为多个BIockD、客户端只上传数据到一个DataNode,然后由NameNode负责Block复制正确答案B
2.HDFS中Namenode的主备仲裁,是由哪个组件控制的A、HDFSCIientB、NodeManagerC、ResourceManagerD、ZooKeeperFaiI overControlI er正确答案D
3.Fl ink是流计算处理和批处理平台,()是数据批处理和流处理的核心引擎()A、RuntimeB、DataStreamC DataSetDFIi nkCore正确答案A
4.在Fus i on I ns ight产品中,关于kafka的top ic,以下描述不正确的有?A、每条发布到kafka的消息都有一个类别,这个类别被称为topic,也可以理解为一个存储消息的队列B、每个topic只能分成一^个partition(区)C、top ic的part it i on的数量可以在创建时配置D、每个part it ion在存储层面对应一个Iog文件,I og文件中记录了所有的消息数据正确答案B
5.Hadoop系统中YARN资源的抽象是用什么表示?
5.MapReduce过程中,以下属于shuff Ie机制的是?()A、comb ineB、copyC sort/mergeD、partition正确答案BC
6.以下哪些是Spark服务的常驻进程?A、JobH istoryB、JDBCServerC、SparkResourceD、NodeManaaer正确答案AB
7.以下关于华为大数据解决方案说法正确的是()A、Farmer是数据服务框架B、GaussDB是一款开源数据库产品C、Fus ion I ns ightManager是一^个分布式系统管理框架,管理员可以通过多接入点操控分布式集群D、Fus ion Ins ightHD是基于开源大数据软件Hadoop的增强版本正确答案ABCD
8.关于大数据的主要特征理解和描述正确的有?A、来源多,格式多B、存储量大,计算量大C、增长速度快,处理速度快D、数据的价值密度较低正确答案ABCD
9.采用Flume传输数据过程中,为了防止因Flume进程重启而丢失数据,可以使用以下哪种Channel类型?A、MemoryChanneIB、JDBCChanneIC、Fi leChanneID、HDFSChanneI正确答案BC
10.HDFS不适用于以下哪些场景?A、流式数据访问B、大量小文件存储C、大文件存储与访问D、随机写入正确答案BD
11..在Streami ng的处理节点Bo11中,可以完成以下哪些操作、业务处理AB、连接数据库C、过滤(filter)D、连接运算正确答案ABCD
12.下面关于Fl ink窗口的描述错误的是()A、滑动窗口之间时间点不存在重叠B、滚动窗口在时间上是重叠的C、滚动窗口在时间上是不重叠的D、滑动窗口之间时间点存在重叠正确答案AB
13.Fl ink可以基于以下哪些窗口进行统计?A、时间窗口B、滑动窗口C、会话窗口D、countWindow正确答案ABCD
14.Hadoop系统中YARN支持哪些资源类型的管理?、内存AB、CPUC、网络D、磁盘空间正确答案AB
15.HBase的主要特点有哪些?、高可靠性AB、高性能C、面向列D、可伸缩正确答案ABCD
16.以下属于Streaming特点的是?A、延迟低B、数据先存储再计算C、属于事件驱动D、可做连续查询正确答案ACD
17.HBase中以下哪种场景会出发FI ush操作?A、HBase定期刷新Memstore,默认周期为1小时B、当WALs中文件数量达到阈值时C、Regi on中MemStore的总大小,达到了预设的FI ushS i ze阈值D、MemStore占用内存的总量和RegionServer总内存比值超出了预设的阈值大小正确答案ABCD
18.Fus ion Ins ightManager与外部平台对接时,支持哪些接口?A、SNMPB、VPNC、BGPD、Sys Iog正确答案AD
19.Hadoop集群规模很大时,数据的分布情况会非常关键,用户需要根据数据分布情况,决定集群是否扩容,数据是否需要做均衡等以下关于Fus ionInsight资源分布监控说法正确的有?()A、帮助用户迅速找到资源消耗最高的节点,采取适当的措施B、通过每个服务主业的资源分布查看页面,查看到关键的资源分布情况C、可以帮助用户快速聚焦在最关键的资源消耗上D、通过DashBoard界面,可以查看到主机资源分布情况,例如内存占有率在50%~70%的主机列表,并提供连接跳转正确答案ABCD
20.下列关于HBase存储模型的描述正确的是A、同一个Key值可以关联多个ValueB、KeyValue中拥有时间戳,类型等关键信息C、即使是Key值相同,Qua Iif ier也相同的多个KeyValue,也可能有多个,此时使用时间戳来区分D、每一^个KeyVa Iue都拥有一^个Qua Ii f i er标识正确答案ABCD
21..以下关于Hadoop分布式文件系统HDFS联邦描述正确的有?A、一^个Namespace使用一^个blockpool管理数据块B、一^个Namespace可使用多个blockpool管理数据块C、每个blockpool的磁盘空间是物理共享的,逻辑空间是隔离的D、支持NameNode/Namespace水平扩展正确答案ACD
22.Fus ion Ins ightHD的HBase服务包含哪些进程A、HMasterB、SIaveC HRegionServerD、DataNode正确答案AC
23.以下说法正确的有A、作业运行了一段时间后失败了,不会残留原始文件B、脏数据是指不符合转换规则的数据C、Loader客户端脚本只能提交作业D、创建了一个人机账号,就可以操作所有Loader作业正确答案AB
24.HBase中包含的一些典型的Filter有哪些?A、Sing IeCoIumnVaIueFiIterB、F iIterLi stC、RowFiIterD、KeyOnIyF iIter正确答案ABCD
25.以下属于Streaming的特点的是?A、延迟低B、属于事件驱动C、数据先存储在计算D、可做连续查询正确答案ABD
26.下面那些组件依赖ZooKeeperA^StreamingB、HDFSC、YARND、HBase正确答案ABCD
27.以下关于KafkaPartition说法正确的有A、每个Partition都是有序且不可变的消息队列B、每个Part it ion在存储层面对应一个log文件C、Part it ion数量决定了每个consumergroup中并发消费者的最大数量D、引入Partition机制,保证了Kafka的高吞吐能力正确答案ABCD
28.Fl ink的兼容性体现在以下哪些方面?A、能够使用Hadoop的格式化输入和输出B、YARN能够作为Fl ink集群的资源调度管理器C、能够从本地获取数据D、能够与Hadoop原有的Mappers和Reducers混合使用正确答案ABD
29.在Loader历史作业记录中,可以查看以下哪些内容?A、错误行/文件数量B、作业开始/运行时间C、作业状态D、脏数据连接正确答案ABCD
30.Fus ion Ins ightManager可以对哪些项目进行健康检查?A、主机B、服务C、角色D、实例正确答案ABCD
三、判断题(共题,每题分,共分)
321321.flume传输数据的可靠性是指flume在传输数据过程中,当下一跳的flume节点故障或者数据接收异常时,可以自动切换到另外一路上继续传输()A、正确B、错误正确答案A
2.Zookeeper的增强特性包括在审计日志中添加ephemera Inode被删除的审计日志()A、正确B、错误正确答案A
3.Fl ink是一个批处理和流处理结合的计算框架,其核心是一个数据分类以及并行化计算的流数据处理引擎()A、正确B、错误正确答案A
4.Fus ion Ins ightHDLoader进行数据导入和导出,必须经过Reduce阶段进行数据处理、正确AB、错误正确答案B
5.Hive中“UNI0NALL”操作符用于合并两个过多个SELECT语句的结果集,结果集中,不允许有重复的值()、正确AB、错误正确答案B
6.Fus ion Ins ightHD平台中,HBase暂不支持二级索引A、正确B、错误正确答案B
7.在Zookeeper的服务模型中,Leader节点以主备模式存在,其他节点都属于FoI Iower节点、正确AB、错误正确答案B
8.topology的处理逻辑都在bolt中、正确AB、错误正确答案A
9.Kafka是一个高吞吐,分布式,基于发布订阅的消息系统,利用Kafka技术可在廉价PCServer上搭建起大规模消息系统、正确AB、错误正确答案A
10.SparkonYarn-c Ii ent适合用于生产环境是因为可以更快的看到APP的输出A、正确B、错误正确答案B
11.在YARN的任务调度中,一^旦AppI icationMaster申请到资源后,便与对应的ResourceManager通信,要求它启动任务A、正确B、错误正确答案B
12.ResourecManager采用鬲可用方案,当Act iveResourceManager发现故障时,只能通过内置的Zookeeper来启动Standby的ResourceManager将其状态切换为Act iveoA、正确B、错误正确答案B
13.Loader的作业执行失败,则此作业运行过程中导入的数据不会被自动删除,必须手动删除A、正确B、错误正确答案B
14.Fl ink中的TaskSlot主要用于资源隔离,其中包含内存资源和CPU资源A、正确B、错误正确答案B
15.FusionlnsightManger对外支持REST接口、SNMP接口、SYSL0G接口A、正确B、错误正确答案A
16.SparkSOL表中,经常会存在很多小文件(大小远小于DFS块大小),在这种情况下,Spark会启动更多的Task来处理这些小文件,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,从而严重影响性能()A、正确B、错误正确答案A
17.Hive是一种数据仓库处理工具,使用类SQL的HiveQL语言实现数据查询功能,所有Hive的数据都存储在HDFS中A、正确B、错误正确答案A
18.Fus ion Ins ightHD的Streaming对于Zookeeper弱依赖,即使Zookeeper故障Streaming也可以正常提供服务A、正确B、错误正确答案B
19.Kafka是一个分布式的消息发布订阅系统,它只是进行消息的转发,不会保存消息A、正确B、错误正确答案B
20.Fus ion Ins ightHD中使用HBase进行数据读取服务时需要连接HMasterA、正确B、错误正确答案B
21.在ZooKeeper的服务模型中,Leader节点以主备模式存在,其他节点都属于Fol lower节点A、正确B、错误正确答案B
22.HDFS机制中NameNode负责管理元数据,Cl ient端每次读请求都需要从NameNode的元数据磁盘中读取元数据信息以此获取所读文件在DataNode的位置A、正确B、错误正确答案B
23.Fus ion Ins ighttoo I是为技术支持工程师和维护工程师提供的一套健康检测工具,能够检查集群相关节点、服务的健康状态,提前发现集群中潜在的问题,并生成健康检查报告方便技术支持工程师各维护工程师快速了解系统的健康状况()A、正确B、错误正确答案A
24.HDFS机制中NameNode负责管理元数据,Cl ient端每次读请求都需要从NameNode的元数据磁盘中读取元数据信息,以此获取所读文件在DataNode中的位置A、正确B、错误正确答案A
25.FIume的properties,properties配置文件中可以配置多个Channe I来传输数据?A、正确B、错误正确答案A
26.Kerberos只能对集群内的服务提供安全认证A、正确B、错误正确答案B
27.Hi ve在Ioad是不检索数据是否符合schema的,hi ve遵循的是schemaonread(读时模式)只有在读时模式的时候才检查hive的数据字段,schema oA、正确B、错误正确答案A
28.Kafka中Part it ionrep Ii cation之间同步数据,从Part ition的Leader复制数据至I FoI Iower需要线程(Rep IicaFetcherThread),实际上是复制FoI Iower(一个Fol lower相当于consumer)主动从Leader■批量拉取消息的,这极大提高了吞吐量A、正确B、错误正确答案A
29.Fus ion Ins ight中H ive包含2个角色,HiveServer和MetaStore.、正确AB、错误正确答案A
30.FusionlnsightHD管理节点提供双机HA机制,主节点故障之后,主备节点需要手动实现Fai loveroA、正确B、错误正确答案B
31.Spark是基于内存的计算,所有Spark程序运行过程中的数据只能存储在内存中A、正确B、错误正确答案B
32.华为Fus ion Ins ightHD系统中,对存储副本为3个的数据块,当有一个节点上该数据块丢失时,需要手动复制一个副本到该节点BA、正确B、错误正确答案BA、内存B、CPUC Contai nerD、磁盘空间正确答案C6•哪个不是FI ume的channe I类型?A、MemoryChanneIB、Fi IeChanneICJDBCChanneID、HDFSChanneI正确答案D
7.以下哪个不属于Hadoop中MapReduce组件的特点?A、良好的拓展性B、易于编程C、实时计算D、高容错性正确答案C
8.通过Fus ion Ins ightManager不能完成以下哪个操作?A、性能监控B、安装部署C、虚拟机分配D、权限管理正确答案C
9.在Fl ink技术架构中,()是流处理和批处理的计算引擎A、StandaI oneB、Runt imeC、DataStreamD、FIi nkCore正确答案B
10.FusionlnsightHD中Loader从SFTP服务器导入文件,如果不需要做编码转换和数据转换且速度最快,选择下面哪个文件类型?A、textfiIeB、sequence_f iIeCbinary_fiIeD、graph_fiIe正确答案C
11.SolrCloud模式是集群模式,在此模式下Solr服务器强依赖于以下哪个服务?A、HBaseB、HDFSC、ZooKeeperD、Yarn正确答案C
12.在很多小文件场景下,Spark会起很多Task当SQL逻辑中存在Shuff Ie操作时,会大大增加hash分桶数,严重影响性能Fus ion Ins ight中,针对小文件的场景通常采用()算子,来对Tab Ie中的小文件生成的part ition进行合并,减少part ition数,从而避免再shuff Ie的时候,生成过多的hash分桶,提高性能A、groupbyB、connectC、coaIesceD、join正确答案C
13.kafka集群在运行期间,直接依赖于下面那些组件?()A、ZookeeperB、HDFSC SparkD、HBase正确答案A
14.HBase的某张表的RowKey划分SpI itKey为9,E,a,z,请问该表有几个Reg ion、3AB、4C、5D、6正确答案C
15.关于Hive与传统数据仓库的对比,以下描述错误的是?()A、由于Hive的数据存储在HDFS中,所以可以保证数据的高容错、高可靠B、由于Hive基于大数据平台,所以查询效率比传统数据仓库快C、Hive基于HDFS存储,理论上存储量可以无限扩展,而传统的数据仓库存储量会有上限D、Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,而传统数据仓库数据应用单一,灵活性低正确答案B
16.关于Fus ion Ins ightHD中Loader作业描述正确的是?A、Loader将作业提交到Yam执行后,如果此时Loader服务异常,则此作业执行失败B、Loader将作业提交到Yam执行后,如果某个Mapper任务执行失败,能够自动进行重试C、Loadet作业执行失败后将会产生垃坝数据,需要用户手动清除D、Loader将一个作业提交至Yam执行后,该作业执行完成前,不能再提交其他作业正确答案B
17.以下哪类数据不属于半结构化数据?A、二维表B、JS0NC、XMLD、HTML正确答案A
18.下列关于Fl inkbarrier描述错误的是?A、一个barrier将本周起快照的数据与下一个周期快照的数据分隔开来B、bar ri er是FI ink快照的核心C、在插入barr ier的时候,会暂时阻断数据流D、barrier周期性插入到数据流中,并作为数据流的一部分随之流动正确答案C
19.可以通过以下哪个命令创建节点数据?A、set/nodedataB、Ls/nodeC、get/nodeD、Create/node正确答案D
20.华为FusionlnsightHD系统中关于HDFS的DataNode说法正确的是?A、不会检查数据的有效性B、周期性地将本节点的BI ock发送给NameNodeC、不同的DataNode存储的Block一定是不同的D、一^个DataNode上的BI ock可以是相同的正确答案D
21.Fus ion Ins ightHD系统中HDFS默认BI ockSi ze是多少?A、32MBB、64MBC、128MBD、256MB正确答案C
22.HBase中一个Region进行SpI it操作时,将一个HFi Ie文件真正分开到两个Region的过程发生在以下什么阶段?A、Split过程中B、Flush过程中C、Compact ion过程中D、HFi Ie分开过程中正确答案C
23.关于DataSet,下列说法不正确的是?A、DataSet与RDD高度类似,性能比RDD好B、DataSet是一个由特定域的对象组成的强类型集合C、DataSet不需要反序列化就可以执行大部分操作D、DataSet执行sort,filter,shuff Ie等操作需要执行反序列化正确答案D
24.下列关于HBase的BloomFi Iter特性理解不正确的是?A、用来过滤数据B、用来优化随机读取的性能C、会增加存储的消耗D、可以准确判断某条数据不存在S正确答案C
25.Fus ion Ins ightHDLoader作业运行前后,需要哪些节点与外部数据源通讯?A、Loader服务主节点B、运行Yarn服务作业的节点C、前面两个都需要D、前面两个都不需要正确答案C
26.Fus ion Ins ightHDHBase默认使用什么作为其底层文件存储系统?0A、HadoopB、MapReduceC、MemoryD、HDFS正确答案D
27.创建loader作业中,可以在以下哪个步骤中设置过滤器类型?A、输出B、基本信息C、转换D、输入设置正确答案D
28.在Fus ion Ins ight集群规划部署时,建议管理节点最好部署个,控制节点最少需要部署数据节点最少需要部署个A、2,3,1B、1,3,2C、2,3,3D、1,2,2正确答案C
29.下面关于zookeeper特性的描述错误的是A、消息更新只能成功或者失败,没有中间状态B、zookeeper节点数必须为奇数个C、客户端所发送的更新会按照他们被发送的顺序进行应用D、一条消息要被超过半数的Server接受,它将可以成功写入磁盘正确答案B
30.以下关于Hbase中HregionServer的功能描述哪些是不正确的A、RegionServer一^殳与HDFS集群的NameNode部署在一^起,实现数据的存储功能B、Hbase的数据处理和计算单元C、RegionServer是Hbase的数据服务进程,负责处理用户数据的读写请求D、管理所有的Region,Region可以在RegionServer之间迁移正确答案B
31.fus ion ins ightmanager不能够管理哪个对象A、sparkB、主机OSC yarnD、HDFS正确答案B
32.哪个不是FI ume的channe I类型A、MemoryChanneIB、Fi IeChanneICJDBCChanneID、HDFSChanneI正确答案D
33.关于Hive建表的基本操作,描述正确的是?A、一旦表创建好,不可再增加新列B、一旦表创建好,不可再修改表名C、创建外部表的时需要指定external关键字D、一旦表创建好,不可再修改列名正确答案C
34.Spark是以下哪种编程语言实现的?A、CB、C++C、JAVAD、Sea Ia正确答案D
35.FusionlnsightHD系统中HDFS的Block默认保存几份?A、3份B、2份C、1份D、不确定正确答案A
36.hbase的底层数据以O的形式存在的?、实时存储AB、列存储c、行存储D、keyvaIue正确答案D
37.FusionlnsightHD集群组网设计中,有一种机架可以按照业务需求线性扩展,这种机架被称为()A、基本框B、扩展框C、管理框D、数据框正确答案B
38.关于Fus ion Ins ightManager说法错误的是?A、NTPServer/CI ient负责集群内各节点的时钟同步B、通过Fus ion Ins ightManager可以对HDFS进行启停控制、配置参数C、Fus ion Ins ightManager所有维护操作只能通过WebU I来完成,没有提供She II维护命令D、通过Fus ion Ins ightManager可以向导式安装集群,缩短集群部署时间正确答案C
39.硬件故障被认为是常态,为了解决这个问题,HDFS设计了副本机制默认情况下,一份文件,HDFS会存()份?、2AB、4C、3D、5正确答案C
40.以下关于Hive的描述不正确的是?A、Hive构建在基于静态批处理的Hadoop之上,Hadoop通常都有较高的延迟并且在作业提交和调度的时候需要大量的开销B、Hive可以实现在大规模数据集上实现低延迟快速的查询C、Hive的最佳使用场合是大数据集的批处理作业D、Hive查询操作过程严格遵守HadoopMapReduce的作业执行模型,Hive将用户的HiveQL语句通过解释器转为MapReduce作业提交到Hadoop集群上正确答案B
41.安装Fus ion Ins ightHD的Streaming组件时,Nimbus角色要求安装几个节点()、3AB、2C、1D、4正确答案B
二、多选题(共题,每题分,共分)
301301.以下关于Fus ion Insight网络安全可靠性,说法正确的有()、Fus ionInsight支持将网络划分为三级集群业务平面、集群管理平A面和集群外维护网络,彼此之间实施物理隔离B、网络平面隔离,避免管理与业务宽带抢占、互相干扰C、阻止外部攻击者通过管理通道入侵实际业务数据D、避免业务平面的高负载阻塞集群管理通道正确答案ABCD
2.以下哪些数据源可以通过Loader实现与Fus ionInghtHD的数据交换?A、SFTPServerB、MySQLC、NoSQLD、FTPServer正确答案ABD
3.Fus ionInsightManager的主要功能有以下哪些?A、数据集成B、系统管理C、安全管理D、服务治理正确答案BCD
4.下列选项中,哪些是MapReduce一定会有的过程、MapAB、Part itionC、Comb ineD、Reduce正确答案AD。
个人认证
优秀文档
获得点赞 0