还剩28页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
大数据考试模拟题(附答案)l+x
一、单选题(共题,每题分,共分)
931931.使用HDFSFederat i on的优点不包括下面哪个选项?()A、NameSpace具有可扩展性B、DataNode具有可扩展性C、性能提升多个NameNode可以提高读写时的数据吞吐量D、隔离性使用联邦可隔离不同类型的程序,一定程度上可控制资源的分配正确答案B
2.以下哪个文件是能够修改HDFS的副本保存数量参数()、修改mapred-site.xml配置文件AB、修改core-site,xml配置文件C、修改yarn-site,xml配置文件D、修改hdfs-site.xml配置文件正确答案D
3.下面哪个选项不是HDFS架构的组成部分?()A^NameNodeB、DataNodeC、SecondaryNameNodeD、GFS正确答案D
4.当NameNode出错时,下面哪个方案描述正确,且是最佳故障恢复和容错方案?()
32.将数据从关系型数据库中导出到HDFS上,应当使用命令0A、importB、exportC、listD、以上都不对正确答案A
33.下列不属于NameNode的功能A、提供名称查询服务B、保存Block信息,汇报Block信息C、保存metadata信息D、metadata信息在启动后会加载到内存正确答案B
34.HDfS中的block默认保存几份?A、3份B、2份C、1份D、不确定正确答案A
35.下列哪个程序通常与NameNode在一个节点启动?A、SecondaryNameNodeB、DataNodeC、TaskTrackerD Jobtracker正确答案D
36.flume有哪个组件用于采集数据()A、sinkB、channelC、webserverD、source正确答案D
37.Flume在什么地方将事件转换为数据输出?、拦截器AB、槽C、通道D、源正确答案C
38.2006年,GoogIe公司发表了用来处理海量数据的一种非关系型数据库的论文是?()A、TheGoogleFileSystemvB、uMapReduce:SimplifiedDataProcessingonLargeClustersvC、Bigtable:ADistributedStorageSystemforStructuredDatavD、“TheHadoopFileSystem^正确答案c
39.HDFS有一个LZO(withindex)文件大小75MB,客户端设置Block大小为64MB当运行mapreduce任务读取该文件时i nputspI it大0小为?A、64MBB、75MBC、一个map读取64MB,另外一个map读取11MB正确答案C
40.使用java-api访问hdfs时,数据块副本数由下面那个决定?()A、clientB datanodeCsecondarynodeD namenode正确答案A
41.启动Hadoop和HBase之后,执行jps命令,已经看到有HMaster的进程,但是进入到监控界面查看,没有节点信息最有可能原因()A、HADOOP服务未启动B、HBase服务未启动C、HBase处于安全模式D、HBase服务未安装正确答案C
42.对Sqoop描述不正确的是?()A、Sqoop的底层实现是MapReduceB、Sqoop主要采集关系型数据库中数据,常用于离线计算批量处理C、Sqoop只支持从关系型数据库导入到HDFS,不支持从HDFS导入到关系型数据库D、Sqoop脚本最终会变成提交到YARN上的一个个map任务正确答案C
43.在MapReduce中Shuff Ie的主要作用是A、通过实现自定义的Partitioner来指定哪些数据进入哪个ReducerB、将数据进行拆分C、经过映射后的输出数据会被排序,然后每个映射器会进行分区D、对映射后的数据进行排序,然后输入到Reducer正确答案D
44.hadoop
2.0与hadoopl.0区别0A、增加MapReduce2B、增力口YARNC、增加HDFS2D、增加容错机制正确答案B
45.以下选项哪个命令可以查看主机信息A、teamdctlteamOstB、nmclidevC、nmcliconshD、ifupteamO正确答案B
46.报告hdfs使用情况采用命令A、hdfsdfs-getfacl/user/testnameB、hdfsdfsadmin-reportC、hdfsdfsadmin-setSpaceQuota500g/path/xxx/D、hdfsdfsadmin-clrSpaceQuota/user/testname正确答案B
47.HBase分布式模式最好需要()个节点、1AB、2C、3D、4正确答案C
48.Hadoop官方真正支持的操作系统是()A、UNIXB WindowsC、DOSD Linux正确答案D
49.HDFS启动成功的标识是()A、jps显示NameNodeB jps显示DataNodeC、jps显示SecondaryNameNodeD jps显示NameNode\DataNode\SecondaryNameNode正确答案D
50.下面哪个目录保存了Hadoop集群的命令比如启动HadoopA、shareB、sbinC、binD、etc正确答案B
51.下面哪个选项不属于Google的三驾马车?A、HDFSB、MapReduceC、BigTableD、GFS正确答案A
52.在h ive中已知表test name的记录如下,tomTom_greentomlyLi ly代石马se Iect*fromtestwherenamer Ii ketom.*的结果有条记录A、2B、0C、3D、1正确答案C
53.安装Hadoop集群时,在哪个文件指定从机是哪些机器?A、yarn-site,xmlB core-site,xmlC、slavesD、datanode正确答案c
54.Hadoop作者A、MartinFowlerB KentBeckCDougcutting正确答案c
55.哪个不是HDFS默认BI ockSi zeA、32MBB、64MBC、128MB旧版本用64M当前新版本用128M正确答案A
56.若不针对MapReduce编程模型中的key和vaIue值进行特别设置,下列哪一项是MapReduce不适宜的运算A、MaxB、MinC、CountD、Average正确答案D
57.YARN中,任务进度监控是向哪个组件汇报的?A、ResourceManagerB NodeManagerC、ApplicationMasterD、Container正确答案c
58.以下选项哪个是MapReduce正确的运行模型()A、Shuff1e-Map-ReduceB.Map-Shuff1e-ReduceC Map-Reduce-ShuffieD Reduce-Map-Shuffle正确答案B
59.下列有关flume的描述不正确的是A、flume是Apache的一个子项目B、flume主要是一个日志采集,传输系统C、flume和sqoop功能相似,因此可以相互替代D、flume可以同时采集集群内部和集群外部的日志数据正确答案C
60.整个大数据平台按其职能划分为五个模块层次,运行环境层是A、运行环境层为基础设施层提供运行时环境,它由2部分构成,即操作系统和运行时环境B、基础设施层由2部分组成Zookeeper集群和Hadoop集群它为基础平台层提供基础设施服务C、基础平台层由3个部分组成任务调度控制台、HBase和Hive它为用户网关层提供基础服务调用接口D、用户网关层用于为终端客户提供个性化的调用接口以及用户的身份认证,是用户唯一可见的大数据平台操作入口正确答案A
61.从Vi编辑模式下保存配置返回到Centos7系统使用A、按“shift”+“”组合B、按“Esc”键,然后按“shift”+“”组合C、按“Esc”键,然后按“shift+“”,输入wq回车D、直接输入“exit”正确答案C
62.查看当前yarn运行任务列表采用()命令A、yarnapplication-logB、HDFSapplication-listC、yarnapp1i cation-killD、yarnapplication-list正确答案D
63.大数据分析平台的实施流程顺序是()A与甲方确定总体计划B组建项目团队C部署环境准备D应用集成及数据集成E系统安装和调试A、BACEDB、CABEDC、ADCBED、DABCE正确答案A
64.名称节点NameNode是HDFS的管理者,它的职责有3个方面,下面哪个选项不是NamdeNode的职责?A、负责管理和维护HDFS的命名空间NameSpaceB、管理DataNode上的数据块BlockC、接收客户端的请求D、负责保存数据块正确答案D
65.在进行Hive组件配置时,JAR包冲突导致异常,出现以下错误信息A、FailedtosetsetXIncludeAwaretrueforparserB mkdir:input’:NosuchfileordirectoryC、E45:readonly optionissetadd!tooverrideD、ERRORtool.ImportTool:ImportedFailed:Character8216isanout-of-rangedelimiter正确答案A
66.下面哪个程序负责HDFS数据存储?A、NameNodeB、JobtrackerC DatanodeD、secondaryNameNodeE、tasktracker正确答案C、采用SecondaryName定时备份NameNode的fsimage和editsAB采用NameNodeHA,当一个NameNode出错时,另一个NameNode接管它的工作C、采用NameNodeFedaration,多个Namenode一起工作D、多增加DataNode正确答案B
5.YARN哪种调度器采用的是单队列?()A、FIFOSchedulerB CapacitySchedulerC、FairSchedulerD ResourceManager正确答案A
6.HDFS首先把大数据文件切分成若干个小的数据块,再把这些数据块分别写入不同的节点,这些负责保存文件数据的节点被称为?()A、NameNodeB、DataNodeC SecondaryNameNodeDBlock正确答案B
7.关于SecondaryNameNode下面哪项是正确的()A、SecondaryNameNode应与NameNode部署到一个节点B、它是NameNode的热备C、它对内存没有要求
67.与Hadoopl.x相比,Hadoop
2.x采用全新的架构,最明显的变化就是增加了哪个组件?()A、MapReduceB、PigC、HBaseD、Yarn正确答案D
68.大数据处理中数据应用层不包括()、数据建模AB、数据可视化C、数据挖掘D、数据分析正确答案B
69.大数据平台项目实施计划不包括()A、用户环境准备B、基础平台部署C、完成大数据平台的安装调试D、完成大数据平台操作开发正确答案D
70.狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下面哪个组件?()A、HDFSB、MapReduceC YarnD、HBase正确答案D
71.Hadoop的配置目录在哪里?()A、/etc/hostsB、/etc/hadoopC、$HAD00P_H0ME/confD、$HAD00P_H0ME/etc/hadoop正确答案D
72.HDFS的是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是()A、一次写入,少次读写B、多次写入,少次读写C、一次写入,多次读写D、多次写入,多次读写正确答案C
73.典型的NoSQL数据库是()A、OracleB、MySQLC、HiveD Hbase正确答案D
74.有关使用sqoop抽取数据的原理的描述不正确的是A、sqoop任务的切分是根据split字段的(最大值-最小值)/map数B、sqoop抽取数据的时候需要保证执行当前用户有权限执行相应的操作C^sqoop在抽取数据的时候可以指定map的个数,map的个数决定在hdfs生成的D、sqoop抽取数据是个多节点并行抽取的过程,因此map的个数设置的越多性越好正确答案D
75.以下哪个不是HDFS的进程()A、SecondaryNodeB、NameNodeC ResourceManagerDDataNode正确答案c
76.下列哪项通常是集群的最主要的性能瓶颈A、CPUB、网络C、磁盘D、内存正确答案C
77.下面关于分布式文件系统HDFS的描述正确的是()A、分布式文件系统HDFS是谷歌分布式文件系统GFS(GoogleFileSystem)的一种开源实现B、分布式文件系统HDFS比较适合存储大量零碎的小文件C、分布式文件系统HDFS是GoogleBigtable的一种开源实现D、分布式文件系统HDFS是一种关系型数据库正确答案A
78.下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是()A、FSDatalnputStream扩展了DatalnputStream以支持随机读B、为实现细粒度并行,输入分片(InputSplit.应该越小越好C、一台机器可能被指派从输入文件的任意位置开始处理一个分片D、输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割正确答案B
79.在HDFS文件操作中,上传文件的命令是()A、putB、inputC、getD、up正确答案A
80.以下选项哪个是HDFS的名称节点()A、DataNodeB SecondaryNodeCNodeD、NameNode正确答案D
81.下列描述中,哪项不属于Sqoop的缺点()A、无法控制任务的并发度B、格式紧耦合C、安全机制不够完善D、connector必须符合JDBC模型正确答案A
82.下面就Zookeeper的配置文件zoo.cfg的一部分,请问initLimit表示的含义是?()TickTime=2000lnitLimit=10SyncLimit=5A、Leader-Follower初始通信时限B、Leader-Follower同步通信时限C、Client-Server通信心跳时间D、Client-Server初始通信时限正确答案A
83.在文件属性中,文件的权限用第列字符表示A、3-9B、1-8C、2-10D、1-5正确答案C
84.在hadoop配置中core-site.xml的配置是()参数A、集群全局参数B、HDFS参数C、Mapreduce参数D、集群资源管理系统参数正确答案A
85.关于培训的总体目标、定制培训课程和内容和培训形式,以下说法正确的是()A、系统使用人员的培训目的是使其可以独立完成大数据平台的日常维护,解决一般问题B、培训过程中将针对不同的用户和不同的培训内容采用相同的培训方案,以达到最佳的培训效果C、实践培训主要针对于技术开发人员及系统维护和客户D、培训形式包括集中培训、现场培训、针对性培训正确答案D
86.关于Sqoop数据的导入导出描述不正确的是?()A、实现从MySQL到Hive的导入导出B、实现从MySQL到Oracle的导入导出C、实现从HDFS到Oracle的导入导出D、实现从HDFS到MySQL的导入导出正确答案B
87.HBase与下列哪个选项属于同一种类型的数据库()A、MongoDBB MariaDBC、MySQLD、Oracle正确答案A
88.数据节点(DataNode)负责存储数据,一个数据块会在多个DataNode中进行冗余备份,那么HDFS默认存储几份?()、1AB、2C、3D、5正确答案C
89.以下选项哪个是YARN的组成部分?()A、Container、ResourceManager、NodeManager、ApplicationMasterB、Container、ResourceManager、NodeManager、App1icationManagerC、Container ResourceManagerScheduler、ApplicationMasterD、Container、App1i cati onManager、NodeManager、ApplicationMaster正确答案A
90.下列哪一种命令格式是不正确的()A、get表行健列族B、alter表列族C、scan表时间戳起始行健结束行健D、put表行键列族:列值正确答案C
91.对Sqoop描述不正确的是?A、Sqoop的底层实现是MapReduceB、Sqoop主要采集关系型数据库中数据,常用于离线计算批量处理C、Sqoop只支持从关系型数据库导入到HDFS,不支持从HDFS导入到关系型数据库D、Sqoop脚本最终会变成提交到YARN上的一个个map任务正确答案
092.下面哪个选项不属于DataNode的职责?()A、保存数据块B、启动DataNode线程,向NameNode定期汇报数据块信息C、管理数据块D、定期向NameNode发送心跳信息保持联系正确答案C
93.关于HDFS的文件写入,正确的是()A、支持多用户对同一文件的写操作B、用户可以在文件任意位置进行修改C、默认将文件块复制成三份存放D、复制的文件块默认都存在同一机架上正确答案C
二、多选题(共题,每题分,共分)
7171..下列关于HDFS对文件分块存储的作用描述正确的是()A、有利于负载均衡B、便于并行处理C、最小化寻址开销D、支持大规模文件存储正确答案ABCD
2.Flume将采集到的数据输出到()A、HDFSB、HbaseC、HiveD、Kafka正确答案ABCD
3.Hadoop能够使用户轻松开发和运行处理大数据的应用程序,那它主要有下面哪些特点()A、高效性B、高容错性C、高可靠性D、高扩展性正确答案ABCD
4.YARN架构的几个组成部分有哪些?()A、ContainerB、ResourceManagerC NodeManagerDApplicationMaster正确答案ABCD
5.Hadoop的优点有哪些A、扩容能力强B、高可靠性C、高效率D、成本低正确答案ABCD
6.下列属于hadoop的发行版本的是A、ApacheB、ClouderaC、RedhatD、Centos正确答案ABC
7.master启动Hadoop相关进程包含A、jpsB ResourceManagerC、NameNodeD、SecondaryNameNode正确答案BCDD、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间正确答案D
8.在确认客户需求,进行确认需求调研的时候,以下说法正确的是oA、将客户的想法记录下来,就能解决客户的实际问题B、按计划有步骤的确定客户需求调研C、确定客户需求调研的过程中,不可避免的会出现客户提出一些现有条件下根本无法实现或者即使实现也非常困难的要求,我们要无条件去满足客户的需求D、先了解细节需求,再了解宏观需求正确答案B9,下列s ink中哪些是f Iume不支持的s inkA、HDFSsinkB、kafkasinkC、memorysinkD filerollsink正确答案C答案解析Flume支持的sinks类型有HDFSSink HiveSink、LoggerSink、AvroSinkThriftSink、IRCSink、FileRollSink、NullSink、HBaseSink、KafkaSink、HTTPSink、CustomSink、ElasticSearchSink MorphlineSolrSink
10.配置Hadoop环境变量修改文件A、vi/etc/profilesB、vi/etc/profileC vi/input/data〜D、vi/etc/hosts正确答案B
11.显示当前所在目录的命令是A、pwdB mkdirC、IsD cd正确答案A
12.Sqoop的作用是A、用于传统关系型数据库和Hadoop之间传输数据B、提供对日志数据进行简单处理的能力C、是Hadoop体系中数据存储管理的基础D、是一个建立在HDFS之上,面向列的针对结构化和半结构化数据的动态数据库正确答案A
13.大数据平台架构设计0的思想、分层模块化设计AB、统一结构化设计C、高集合化设计D、全分布设计正确答案A
14.大数据的数据量现在已经达到了哪个级别?(C)A、GBB、TBC、PBD、ZB正确答案C
15.MySQL数据库驱动文件放置于h ive哪个目录下()A、sbinB、binC、jarD、lib正确答案D
16.HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是0A、一次写入,少次读B、多次写入,少次读C、多次写入,多次读D、一次写入,多次读正确答案D
17.把公钥追加到授权文件的命令是?()A、ssh-keygenB sshC、ssh-addD、ssh-copy-id正确答案D
18.以下选项哪个命令可以生成公钥()A、ifupteamOB、nmcliconshC ssh-keygenD nmclidev正确答案cHive默认的元存储是保存在内嵌的()数据库中A、MySQLB、DerbyC OracleDSqlServer正确答案B
20.列出mysql数据库中的所有数据库sqoop命令是?()A、sqooplist-databases-connectB、sqoopcreate-hive-table-connectC、sqoopimport-connectD、sqooplist-tables-connect正确答案A
21.关于Sqoop数据的导入导出描述不正确的是、实现从MySQL到Hive的导入导出AB、实现从MySQL到Oracle的导入导出C、实现从HDFS到Oracle的导入导出D、实现从HDFS到MySQL的导入导出正确答案B
22.大数据处理中数据处理层不包括()A、数据规约B、数据提取C、数据清洗D、数据分析正确答案D
23.HDFS默认BlockSize的大小是0A、32MBB、64MBC、128MBD、256M正确答案C
24.下列命令中(在zookeeper安装文件夹的bin目录下执行),哪项是停止ZooKeeper的正确命令()A、zkServer.shstopB、zkServer.shstartC、start-all.shD、start-stop,sh正确答案A
25.在HBase的组件中,哪一个负责日志记录()A、HRegionB、HFileC、MemStoreD、WAL正确答案D
26.Centos中修改文件或目录的访问权限命令A、chownB、passwdC chmodDclear正确答案c
27.在HDFS分布式文件系统中,一般采用冗余存储,冗余因子通常设置为()、1AB、2C、3D、4正确答案C
28.大数据解决方案确认需求分析准备工作不包括()A、充分了解客户的要求,客户的业务,客户的关注重点B、和客户负责人沟通,确定客户需求小组成员C、编制确定客户实施计划D、根据事先了解的初步用户需求,列出这些难点正确答案C
29.在ZooKeeper中有三种角色,下列选项中不属于ZooKeeper中的角色()A、FollowerB ObeyerCLeaderD Observer正确答案B
30.hadoop平台下检查h3cu目录的健康状态采用()命令A、hdfsfsck/h3cuB、find/h3cuC hadoopfs-lsr/h3cuD list/h3cu正确答案A31,Sqoop是Hadoop和关系数据库服务器之间传送数据的工具,下列哪种数据库是不支持使用Sqoop直接进行数据传送()A、RedisB、PostgresC OracleD、MySQL正确答案A。
个人认证
优秀文档
获得点赞 0