还剩20页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
大数据试题库及答案1+x
一、单选题(共90题,每题1分,共90分)
1、名称节点(NameNode)是HDFS的管理者,它的职责有3个方面,下面哪个选项不是NamdeNode的职责?()A、负责保存数据块B、负责管理和维护HDFS的命名空间(NameSpace)C、接收客户端的请求D、管理DataNode上的数据块(Block)正确答案A
2、Sqoop的底层实现是()A、HDFSB、HbaseC、MapReduceD、Hadoop正确答案c
3、下面哪个程序负责HDFS数据存储?()A、tasktrackerB NameNodeC、JobtrackerD、secondaryNameNodeE Datanode正确答案E
4、对于HDFS文件读取过程,描述不正确的是?()A、通过对数据流反复调用read(.方法,把数据从数据节点传输到客户端B HDFS客户端通过Configuration对象的open(.方法打开要读取的文件C、当客户端读取完数据时,调用FSDatalnputStream对象的close(.方法关闭输入流D、DistributedFileSystem负责向远程的名称节点(NameNode)发起RPC调用,得到文件的数据块信息,返回数据块列表正确答案B
5、大数据分析平台的实施流程顺序是()A与甲方确定总体计划B组建项目团队C部署环境准备D应用集成及数据集成E系统安装和调试A、BACEDB ifupteamOC、nmcli conshD、nmcli dev正确答案A
49、下面哪个不属于YARN的架构的组成部分?()A、ResourceManagerB、Application MasterC、JobTrackerD NodeManager正确答案c
50、建立在Hadoop文件系统之上的分布式的列式数据库?()A、MahoutB、HiveC、YARND HBase正确答案D
51、关于培训的总体目标、定制培训课程和内容和培训形式,以下说法正确的是()A、系统使用人员的培训目的是使其可以独立完成大数据平台的日常维护,解决一般问题B、培训过程中将针对不同的用户和不同的培训内容采用相同的培训方案,以达到最佳的培训效果C、培训形式包括集中培训、现场培训、针对性培训D、实践培训主要针对于技术开发人员及系统维护和客户正确答案C
52、日志消息的级别中哪个是比较严重的情况()A、CRITB、ERRC、DEBUGD、ALEKKT正确答案A
53、HDFS默认Block Size的大小是()A、64MBB、128MBC、32MBD、256M正确答案B
54、Hadoop的生态系统组件之一Sqoop的功能是?A、负责集群资源调度管理的组件B、用来在Hadoop和关系数据库之间的交换数据,改进数据的互操作性C、提供高可靠性、高可用、分布式的海量日志采集D、用来存储非结构化和半结构化的松散数据正确答案B
55、关于Sqoop数据的导入导出描述不正确的是?A、实现从HDFS到Oracle的导入导出B、实现从MySQL到Oracle的导入导出C、实现从MySQL到Hive的导入导出D、实现从HDFS到MySQL的导入导出正确答案B
56、大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的A、新一代信息技术和服务业态B、新一代服务业态C、新一代信息技术D、新一代技术平台正确答案A
57、下面哪个选项不属于DataNode的职责?A、启动DataNode线程,向NameNode定期汇报数据块信息B、定期向NameNode发送心跳信息保持联系C、保存数据块D、管理数据块正确答案D
58、Sqoop的底层实现是A、HBaseB、HDFSC、HadoopD、MapReduce正确答案D
59、Hadoop的配置目录在哪里?()A、$HAD00P_H0ME/confB、$HAD00P_H0ME/etc/hadoopC/etc/hadoopD、/etc/hosts正确答案B
60、YARN哪种调度器采用的是单队列?()A、以上都不是B、Capacity SchedulerC、FIFO SchedulerDFair Scheduler正确答案C
61、在Centos7系统中,查看和修改IP信息需要用到()文件A、/etc/resolv.confB/etc/sysconfig/network-script/ifcfg-ensOC、/etc/sysconfig/network/ifcfg-ensOD、/etc/sysconfig/ifcfg-ensO正确答案B
62、多用户的情况下,哪个YARN调度器可以最大化集群的吞吐和利用率()A、Fair SchedulerBCapacity SchedulerC、FIFO SchedulerD、以上都不是正确答案B
63、Hadoop的安装部署的模式属于伪分布模式()A、完全分布模式的守护进程运行在由多台主机搭建的集群上,是真正的生产环境B、默认的模式,无需运行任何守护进程(daemon),所有程序都在单个JVM上执行C、高容错全分布模式的守护进程运行在多台主机搭建的集群上D、在一台主机模拟多主机即,Hadoop的守护程序在本地计算机上运行,模拟集群环境,并且是相互独立的Java进程正确答案D
64、使用java-api访问hdfs时,数据块副本数由下面那个决定?()A、secondarynodeB、namenodeC、datanodeD、client正确答案D
65、关于HDFS回收站描述正确的是?()A、HDFS为每一个用户都创建了回收站,这个类似操作系统的回收站位置是/user/用户名/.Trash/B、用户不能手动清空回收站中的内容C、HDFS回收站默认开启D、HDFS回收站中的文件文件像Windows回收站一样,如果不清空回收站,文件会一直保留在回收站正确答案A
66、HDFS的是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是()A、多次写入,多次读写B、一次写入,少次读写C、多次写入,少次读写D、一次写入,多次读写正确答案D
67、大数据的特点不包括下面哪一项()oA、增长速度快B、巨大的数据量C、价值密度高D、多结构化数据正确答案C
68、对Sqoop描述不正确的是?()A、Sqoop主要采集关系型数据库中数据,常用于离线计算批量处理B、Sqoop只支持从关系型数据库导入到HDFS,不支持从HDFS导入到关系型数据库C、Sqoop的底层实现是MapReduceD、Sqoop脚本最终会变成提交到YARN上的一个个map任务正确答案B
69、当NameNode出错时,下面哪个方案描述正确,且是最佳故障恢复和容错方案?A、多增加DataNodeB、采用SecondaryName定时备份NameNode的fsimage和editsC、采用NameNode Fedaration,多个Namenode一起工作D采用NameNode HA,当一个NameNode出错时,另一个NameNode接管它的工作正确答案D
70、以前在传统数据库与Hadoop之间,数据传输没有专门的工具,两者数据的互导是比较困难的,的出现解决了这个问题?A、SqoopB、HiveC、FlumeD、Zookeeper正确答案A
71、下面哪个目录保存了Hadoop集群的命令比如启动Hadoop A、shareB sbinCetcD bin正确答案B
72、HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是oA、多次写入,少次读B、一次写入,少次读C、多次写入,多次读D、一次写入,多次读正确答案D
73、用于检查节点自身的健康状态的进程是A、NameNodeB、ResourceManagerC DataNodeD、NodeManager正确答案D
74、下列是关于flume和sqoop对比的描述,不正确的是A、flume主要用于采集多数据源小数据而sqoop用来迁移单数据源数据B、flume和sqoop都是分布式处理任务C、flume主要用来采集日志而sqoop主要用来做数据迁移D、flume主要采集流式数据而sqoop主要用来迁移规范化数据正确答案B
75、以下选项哪个可以修改文件或目录的访问权限A、suB、passwdC、useraddD、chmod正确答案D
76、在ZooKeeper中有三种角色,下列选项中不属于ZooKeeper中的角色A、LeaderB、ObserverC FollowerD、Obeyer正确答案D
77、整个大数据平台按其职能划分为五个模块层次,运行环境层是A、运行环境层为基础设施层提供运行时环境,它由2部分构成,即操作系统和运行时环境B、基础设施层由2部分组成Zookeeper集群和Hadoop集群它为基础平台层提供基础设施服务C、基础平台层由3个部分组成任务调度控制台、HBase和Hive它为用户网关层提供基础服务调用接口D、用户网关层用于为终端客户提供个性化的调用接口以及用户的身份认证,是用户唯一可见的大数据平台操作入口正确答案A
78、日志消息的级别中那个是不会影响系统但值得注意A、CRITB、ALEKKTC、DEBUGD、NOTICE正确答案D79HBase分布式模式最好需要()个节点A、1B、4C、3D、2正确答案C
80、大数据解决方案确认需求分析准备工作不包括()A、编制确定客户实施计划B、根据事先了解的初步用户需求,列出这些难点C、和客户负责人沟通,确定客户需求小组成员D、充分了解客户的要求,客户的业务,客户的关注重点正确答案A
81、以下选项哪个命令可以查看主机信息()A、ifup teamOB、nmcli conshC teamdctlteamO stD、nmcli dev正确答案D
82、2006年,Google公司发表了用来处理海量数据的一种非关系型数据库的论文是?()A、“Bigtable:A DistributedStorage Systemfor StructuredData”B、uMapReduce:Simplified DataProcessing onLarge Clusters”C、“The HadoopFile System”D、“The GoogleFile System”正确答案A
83、Hadoop的安装部署的模式属于本地模式()A、完全分布模式的守护进程运行在由多台主机搭建的集群上,是真正的生产环境B、在一台主机模拟多主机即,Hadoop的守护程序在本地计算机上运行,模拟集群环境,并且是相互独立的Java进程C、默认的模式,无需运行任何守护进程daemon,所有程序都在单个JVM上执行D、高容错全分布模式的守护进程运行在多台主机搭建的集群上正确答案C
84、下面哪个YARN的描述不正确的是?A、YARN指Yet AnotherResource Negotiator,是另一种资源协调者B、YARN只支持MapReduce一种分布式计算模式C、YARN的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处D、YARN最初是为了改善MapReduce的实现正确答案B
85、Hadoop官方真正支持的操作系统是A、WindowsB、LinuxC、UNIXD、DOS正确答案B86>下列不属于NameNode的功能A、保存Block信息,汇报Block信息B、保存metadata信息C、提供名称查询服务D、metadata信息在启动后会加载到内存正确答案A
87、Sqoop的作用是A、是一个建立在HDFS之上,面向列的针对结构化和半结构化数据的动态数据库B、用于传统关系型数据库和Hadoop之间传输数据C、提供对日志数据进行简单处理的能力D、是Hadoop体系中数据存储管理的基础正确答案B
88、报告hdfs使用情况采用命令A、hdfs dfsadmin-clrSpaceQuota/user/testnameB、hdfs dfsadmin-setSpaceQuota500g/path/xxx/C、hdfs dfsadmin-reportD、hdfs dfs-getfacl/user/testname正确答案C
89、哪个不是HDFS默认Block SizeA、64MBB、128MB旧版本用64M当前新版本用128MC、32MB正确答案C
90、从Vi编辑模式下保存配置返回到Centos7系统使用A、按“Esc”键,然后按“shift”+“”组合B、按“Esc”键,然后按“shift+“”,输入wq回车C、直接输入“exit”D、按“shift”+“”组合正确答案B
二、多选题(共20题,每题1分,共20分)
1、HDFS只设置一个名称节点带来的局限性包括()A、集群的可用性B、命名空间的限制C、隔离问题D、性能的瓶颈正确答案ABCD
2、ZooKeeper角色选举角色包括()A、客户端(client)B、跟随者(follower)C、观察者(observer)D、领导者(leader)正确答案ABCD
3、以下选项中哪些是常用的ss命令()A、ifconfigB、scpC、ssh-copy-idD、sftp正确答案BCD
4、Hadoop优点是以下()种A、扩容能力强B、高效率C、高可靠性D、成本低正确答案ABCD
5、Hadoop平台的主要配置文件是()A、hdfs-site.xmlB、core-site,xmlC、slaves,xmlD mapred-site.xml正确答案ABD
6、Hive优点是()A、容错行强B、提供统一的元数据管理C、提供了类SQL的查询语言HQLoD、可扩展强正确答案ABCD
7、Hadoop集群验证步骤包括()A、初始化集群,使用Hadoop命令启动集群B、使用HDFS命令查看文件系统“/”路径下是否存在文件C、用Hadoop自带的WordCount程序去测试MapReduceD、使用Hadoop命令,创建HDFS文件夹正确答案ABCD
8、以下哪条命令能退出mysql状态()A、quitB、Ctrl+cC、Ctrl+zD、exit正确答案AD
9、验证SSH无密码登录需要()步骤A、验证Master到每个Slave节点无密码登录B、验证两个Slave节点到Master节点无密码登录C、修改Slave节点authorized keys文件D、修改Master节点authorized keys文件正确答案ABCDB、DABCEC、CABEDD、ADCBE正确答案A
6、HDfS中的block默认保存几份?A、3份B、2份C、1份D、不确定正确答案A
7、以下选项哪个是YARN中动态创建的资源容器()A、ApplicationMasterB、NodeManagerC、ResourceManagerD Container正确答案D
8、以下对数据节点理解错误的是(.A、数据节点的数据保存在磁盘中B、数据节点通常只有一个C、数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作D、数据节点用来存储具体的文件内容正确答案B
9、2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?()A、“The GoogleFile System”B、uMapReduce:Simplified DataProcessing onLarge Clusters”C、“The HadoopFile System”D“Bigtable:A DistributedStorage Systemfor StructuredData”正确答案A
10、列出mysql数据库中的所有数据库sqoop命令是?()A、sqoop create-hive-table-connectB sqoop list-databases-connectC sqooplist-tables-connect
10、Linux版本分为以下哪几类A、开发版B、测试版C、内核版D、发行版正确答案CD
11、大数据运维中的日志分类为A、用户日志记录系统用户登录及退出系统的相关信息B、内核及系统日志由系统服务syslog统一进行管理,日志格式基本相似C、错误日志由各种错误信息组成的日志信息D、程序日志由各种应用程序抽立管理的日志文件,记录格式不统一正确答案ABD
12、下面的命令描述正确的是A、创建一个名称为test组的命令groupadd testB、删除用户名为Tom的命令userdel TomC、切换当前用户帐户为admin的命令su adminD、改用户Tom设置密码命令passwd Tom正确答案ABD
13、Hive有哪些方式保存元数据A、multiuser modeBsingle usermodeC remoteuser modeDtelnet usermode正确答案ABC
14、Hadoop核心主要由部分组成A、DFSB、HDFSC、MapReduceD、RDD正确答案BC
15、下面描述正确的是A、HDFS将数量众多的廉价机器使得硬件错误成为常态B、HDFS上的一个文件大小是G或T数量级的,支持的文件数量达到千万数量级C、HDFS上的文件可以任意修改D、HDFS支持多种软硬件平台中的可移植性正确答案ABD
16、YARN架构的几个组成部分有哪些?A、ContainerB、Application MasterC、NodeManagerD ResourceManager正确答案ABCD
17、MapReduce是Hadoop中集群数据处理的核心,分为A、分为映射,映射为Reduce阶段B、分为减速,减速为Map阶段C、分为映射,映射为Map阶段D、分为减速,减速为Reduce阶段正确答案CD
18、Linux的特点是以下方面A、开放源代码的程序软件,可自由修改B、与Unix系统不兼容,具备几乎所有Unix的优秀特性C、适合Intel等x86CPU系列架构的计算机D、可自由传播,免费使用,无任何商业化版权制约正确答案ACD
19、大数据培训形式分A、集中培训B、现场培训C、专业性培训D、针对性培训正确答案ABD
20、以下哪些是Linux操作系统组成部分A、Linux内核B、必要的应用程序C、GNU软件及系统软件D、CPU正确答案ABCD、sqoop import-connect正确答案B
11、Hadoop完全分布模式配置免密登录是要?()A、实现主节点到其他节点免密登录B、以上都不是C、实现从节点到主节点的免密登录D、主节点和从节点任意两个节点之间免密登录正确答案D
12、列出mysql数据库中的所有数据库sqoop命令是?A、sqooplist-tables-connectB、sqoop import-connectC sqooplist-databases-connectD sqoopcreate-hive—table-connect正确答案c
13、典型的NoSQL数据库是()A、HbaseB OracleC、MySQLD、Hive正确答案A
14、在HDFS分布式文件系统中,一般采用冗余存储,冗余因子通常设置为()A、4B、2C、3D、1正确答案C
15、关于ZooKeeper顺序节点的说法正确的是?()A、通过顺序节点,可以创建分布式系统唯一IDB、创建顺序节点的命令为create/test valuelC、创建顺序节点时不能连续执行创建命令,否者报错节点已存在D、顺序节点的序号能无限增加正确答案A
16、把公钥追加到授权文件的命令是?()A、ssh-copy-idB、ssh-keygenC、sshD ssh-add正确答案A
17、下列哪些不是ZooKeeper的特点()A、可靠性B、顺序一致性C、多样系统映像D、原子性正确答案C
18、下面就Zookeeper的配置文件zoo.cfg的一部分,请问initLimit表示的含义是?()TickTime=2000InitLimit=10SyncLimit=5A、Leader-Follower初始通信时限B、Client-Server初始通信时限C、Leader-Follower同步通信时限D、Client-Server通信心跳时间正确答案A
19、在确认客户需求,进行确认需求调研的时候,以下说法正确的是()A、按计划有步骤的确定客户需求调研B、确定客户需求调研的过程中,不可避免的会出现客户提出一些现有条件下根本无法实现或者即使实现也非常困难的要求,我们要无条件去满足客户的需求C、将客户的想法记录下来,就能解决客户的实际问题D、先了解细节需求,再了解宏观需求正确答案A
20、Hadoop作者A、Doug cuttingB、Kent BeckC、Martin Fowler正确答案A
21、采用多副本冗余存储的优势不包含(.A、保证数据可靠性B、节约存储空间C、加快数据传输速度D、容易检查数据错误正确答案B
22、大数据平台操作演示不包括A、准备好演示环境B、实现呈现技巧提升C、在大数据平台操作演示前需要做好准备工作D、分析本次演示的目的和听众群体正确答案B
23、查看HDFS的报告命令是A、bin/hdfs dfs-reportB、bin/hdfs-reportC、bin/hdfs dfsadmin-reportD、bin/hdfs deadmin-report正确答案C
24、下面哪个选项不属于Google的三驾马车?A、HDFSB、GFSC、BigTableD、MapReduce正确答案A25HMaster的主要作用是A、最终保存HBase数据行的文件B、负责响应用户I/O请求,向HDFS文件系统读写数据C、用于启动任务管理多个HRegionServerD、负责协调集群中的分布式组件正确答案C
26、以下关于日志采集工具Flume的说法不正确的是?A、Flume的数据源和目标都是可定制、可扩展的B、Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的日志收集系统C、Flume适用于大量数据的实时数据采集D、Flume支持多级级联和多路复制正确答案D
27、以下选项哪个命令是用hadoop用户登录,通过scp命令实现密钥拷贝到slavel节点上A、scp.ssh/id_rsa.pub hadoop@slavelC/B scp^/.ssh/id_rsa.pub root@slavelC/C、scp^/.ssh/id rsa.pub slavel@root:^/D、scp/,ssh/id_rsa pubhadoop@slave2:/〜・〜正确答案A
28、Hive默认的元存储是保存在内嵌的数据库中A、MySQLB、DerbyC、SqlServerD Oracle正确答案B
29、关于HDFS的文件写入,正确的是A、支持多用户对同一文件的写操作B、默认将文件块复制成三份存放C、用户可以在文件任意位置进行修改D、复制的文件块默认都存在同一机架上正确答案B30关于SecondaryNameNode哪项是正确的?A、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间B、它是NameNode的热备,对内存有严格要求C、它是NameNode的热备D、它对内存没有要求正确答案A
31、大数据平台Hadoop的组件中,提供分布式协作服务的组件是A、HiveB、ZooKeeperC、SqoopD HBase正确答案B
32、ZooKeeper树中节点叫做什么?A、ZknodeB、ZnodeC、ZxidD inode正确答案B
33、在文件属性中,文件的权限用第列字符表示A、1-8B、1-5C、2-10D、3-9正确答案C
34、查看当前yarn运行任务列表采用()命令A、HDFS application-listB、yarn application-logC、yarn application-listD、yarn application-kill正确答案c35Hadoop安装在一台计算机上,需修改相应的配置文件,用一台计算机模拟多台主机的集群是()模式A、全分布HA模式B、全分布模式C、单机模式D、伪分布模式正确答案D
36、在Hadoop配置文件中,以下属于core-site.xml文件主要内容的是()A、配置ResourceManager,NodeManager的通信端口,web监控端口等B、名称节点和数据节点的存放位置、文件副本的个数、文件读取权限等C、包括JobHistory Server和应用程序参数两部分,如reduce任务的默认个数、任务所能够使用内存的默认上下限等D、用于定义系统级别的参数,如HDFS URL、Hadoop的临时目录等正确答案D
37、关于ZooKeeper的说法错误的是?()A、ZooKeeper是一个高可用的分布式数据管理和协调框架B、Hadoop的高可用不需要用到ZooKeeperC、越来越多的分布式系统(Hadoop HBaseKafka)中使用ZooKeeperD、能够很好的保证分布式环境中数据的一致性正确答案B
38、在本次项目实施中,需求调研前的准备不包括()A、接到调研任务,将计划写好,立即就开始和用户沟通B、和客户负责人沟通,确定客户需求小组成员C、充分了解客户的要求,客户的业务,客户的关注重点D、编制确定客户需求调研计划和调研提纲正确答案A
39、下列哪些不是HBase的特点()A、面向列B、高可靠性C、高性能D、紧密性正确答案D
40、YARN中,任务进度监控是向哪个组件汇报的?()A、NodeManagerB ContainerC、ApplicationMasterD ResourceManager正确答案c
41、HDFS能够在出错的情况下保证数据存储的可靠性,常见的出错情况不包括?()A、数据节点(DataNode)出错B、名称节点(NameNode)出错C、数据本身出错D、以上选项都不包括正确答案D
42、安装Hadoop时,发现50070对应的页面无法打开,可以通过下面哪个命令查看某个端口(TCP或UDP)是否在监听?()A、psB、pingC、netstatD、ifconfig正确答案C
43、HBase依赖提供消息通信机制A、ZookeeperB、SocketC、RPCD、Chubby正确答案A
44、MySQL数据库驱动文件放置于hive哪个目录下A、sbinB binC、libD jar正确答案C
45、以下文件中主要用来配置ResourceManager,NodeManager的通信端口,web监控端口等A、yarn-site,xmlB core-site,xmlC hdfs-site.xmlD mapred-site.xml正确答案A
46、HBase依赖_存储底层数据A、MemoryB HadoopC、HDFSD、MapReduce正确答案c
47、下列哪个程序通常与NameNode在一个节点启动?A、DataNodeB、JobtrackerC、SecondaryNameNodeD TaskTracker正确答案B
48、以下选项哪个命令可以生成公钥A、ssh-keygen。
个人认证
优秀文档
获得点赞 0