还剩37页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
大数据模拟练习题含参考答案1+X
一、单选题(共93题,每题1分,共93分)
1.下列选项哪个不是ZooKeeper的应用场景?()A、存储非关系型数据B、分布式锁C、Master选举D、分布式协调/通知正确答案A
2.大数据的数据量现在已经达到了哪个级别?(C)、GBAB、TBC、PBD、ZB正确答案C
3.下面哪个选项不是HDFS架构的组成部分?()A、NameNodeB、DataNodeC、SecondaryNameNodeD、GFS
28.日志消息的级别中那个是不会影响系统但值得注意()A、ALEKKTB、CRITC、NOT ICED、DEBUG正确答案C
29.在文件属性中,文件的权限用第列字符表示、1-8AB、3-9C、2-10D、1-5正确答案C
30.安装Hadoop集群时,在哪个文件指定从机是哪些机器?()A、datanodeB、core-site.xmlC、sIavesD、yarn-site.xml正确答案C
31.大数据处理中数据应用层不包括()B、数据建模C、数据可视化D、数据分析正确答案C
32.以下()文件中主要用来配置ResourceManager,NodeManager的通信端口,web监控端口等Ax yarn-site.xmlB、mapred-site.xmlCx hdfs-site.xmlD\core-site.xml正确答案A
33.多用户的情况下,哪个YARN调度器可以最大化集群的吞吐和利用率?()A、Capac ityScheduI erB、FIFOScheduI erCxFa irScheduI erD、以上都不是正确答案A
34.在hadoop配置中core-site,xml的配置是()参数、集群全局参数AB、HDFS参数C、Mapreduce参数D、集群资源管理系统参数正确答案A
35.大数据平台实施方案流程中,建议整个项目过程顺序是A与客户确认实施方案B确认客户需求C系统测试D编写实施方案E用户培训F执行实施方案G项目验收A、BDAFCEGB、ABDFCEGC、DEABCFGD、BDAFEGC正确答案A
36.用于检查节点自身的健康状态的进程是A、ResourceManagerB、NodeManagerC、NameNodeD、DataNode正确答案B
37.HDFS的是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是()A、一次写入,少次读写B、多次写入,少次读写C、一次写入,多次读写D、多次写入,多次读写正确答案C
38.下列哪一种命令格式是不正确的()、alter表列族AB、get表行健列族C、scan表时间戳起始行健结束行健D、put表行键列族:列值正确答案C
39.下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是()A、FSData InputStream扩展了Data InputStream以支持随机读B、为实现细粒度并行,输入分片(InputSpI it.应该越小越好C、一台机器可能被指派从输入文件的任意位置开始处理一个分片D、输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割
40.Hive适合()环境A、提供实时查询功能B、适合应用在大量不可变数据的批处理作业C\Hive适合用于联机(on I i ne)事务处理D、Hive适合关系型数据环境正确答案B
41.以下选项哪个命令可以生成公钥()A、nmcI idevB、ssh-keygenC、nmcI iconshD、i fupteamO正确答案B
42.若不针对MapReduce编程模型中的key和value值进行特别设置,下列哪一项是MapReduce不适宜的运算()、MaxAB、MinC、CountD、Average正确答案D
43.关于SecondsryNameNode哪项是正确的?A、它是NameNode的热备B、它对内存没有要求Cx SecondaryNameNode应与NameNode部署到一个节点D、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间正确答案D
44.MapReduce编程模型,键值对<key,va Iue>的key必须实现哪个接口?()Ax Wri tab IeComparabIeB、ComparabIeC、Wr itabIeD\LongWr itabIe正确答案A
45.一个gzip文件大小75MB,客户端设置Block大小为64MB,请我其占用几个Block、1AB、2C、3D、
446.查看当前yarn运行任务列表采用()命令A、yarnappI icat ion-1ogB HDFSappI i cat ion-listxC、yarnappI icat ion-k iI ID、yarnappI icat ion-1i st正确答案D
47.HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是()A、一次写入,少次读B、多次写入,少次读C、多次写入,多次读D、一次写入,多次读正确答案D
48.大数据的特点不包括下面哪一项()、增长速度快AB、价值密度高C、巨大的数据量D、多结构化数据
49.Hadoop作者A、Mart inFowlerB\KentBeckC、Dougcutt ing正确答案c
50.向HDFS上传文件,正确的she II命令是?()Ax hdfsdfs-getB、hdfsdfs-putCx hdfsdfs-appendToFi IeD、hdfsdfs-copyToLocaI正确答案B
51.HDfS中的block默认保存几份?、3份AB、2份C、1份D、不确定正确答案A
52.从Vi编辑模式下保存配置返回到Centos7系统使用、按“shift”+“”组合AB、按“Esc”键,然后按“shift+“”组合C、按“Esc”键,然后按“shift+“”,输入wq回车D、直接输入“exit”正确答案C
53.HBase与下列哪个选项属于同一种类型的数据库()A、MongoDBB、Mar iaDBC、MySQLD、OracIe正确答案A
54.大数据平台操作演示不包括()A、分析本次演示的目的和听众群体B、实现呈现技巧提升C、准备好演示环境D、在大数据平台操作演示前需要做好准备工作正确答案B
55.tar命令用于对文件进行打包压缩或解压,T参数含义()A、解开压缩文件B、向压缩归档末尾追加文件C、查看压缩包内有哪些文件D、创建压缩文件
56.大数据平台Hadoop的组件中,提供分布式协作服务的组件是()A、HBaseB、ZooKeeperC SqoopxD、Hive正确答案B
57.以下关于日志采集工具Flume的说法不正确的是?、Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传A输的日志收集系统B、Flume的数据源和目标都是可定制、可扩展的C、Flume支持多级级联和多路复制D、Flume适用于大量数据的实时数据采集正确答案C
58.MySQL数据库驱动文件放置于hive哪个目录下()A、sbi nB、I ibC、b inD、jar正确答案B
59.配置Hadoop环境变量修改()文件
4.Flume用于收集数据,其传输的数据基本单位是?、SplitAB\BIockC、EventD、Packet正确答案c
5.关于ZooKeeper的说法错误的是?()、ZooKeeper是一个高可用的分布式数据管理和协调框架AB、能够很好的保证分布式环境中数据的一致性C s越来越多的分布式系统(Hadoop、HBase、Kafka)中使用ZooKeeperD、Hadoop的高可用不需要用到ZooKeeper正确答案D
6.在HBase的组件中,哪一^Is*负责日志记录()、HRegionAB、HFiIeC、MemStoreD、WAL正确答案D
7.下列哪个程序通常与NameNode在一个节点启动A、vi/etc/prof iIeB、vi/etc/prof iIesC、viVinput/dataD、v i/etc/hosts正确答案A
60.HDFS默认BlockSize的大小是A、32MBB、64MBC、128MBD、256M正确答案C
61.ZooKeeper的特点不包括、可靠性AB、顺序一致性C、复合系统映像D、原子性正确答案C
62.关于ZooKeeper的特性说法错误的是?、能改变ZooKeeper服务器状态的操作称为事务操作AB、watch能触发多次C、是版本机制有效避免了数据更新时出现的先后顺序问题D、当节点发生变化时,通过watcher机制,可以让客户端得到通知正确答案B
63.对于GFS架构,下面哪个说法是错误的?()A.GFSMaster节点管理所有的文件系统所有数据块B、GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务器上(可靠性)块的冗余度默认为3Cx GFSMaster还管理着系统范围内的活动,比如块服务器之间的数据迁移等D、GFSMaster与每个块服务器通信(发送心跳包),发送指令,获取状态正确答案A
64.关于SecondaryNameNode下面哪项是正确的()A、它对内存没有要求B、它是NameNode的热备C、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间D、SecondaryNameNode应与NameNode部署到一个节点正确答案C
65.以下选项哪个是MapReduce正确的运行模型()A、.Map-ShuffIe-ReduceB、Reduce-Map-ShuffIeCx ShuffIe-Map-ReduceD、Map-Reduce-ShuffIe正确答案A
66.ZooKeeper树中节点叫做什么?A、ZxidB、i nodeC、ZnodeD、Zknode正确答案C
67.在HDFS分布式文件系统中,一般采用冗余存储,冗余因子通常设置为、1AB、2C、3D、4正确答案C
68.哪个不是HDFS默认BlockSizeA、32MBB、64MBCx128MB旧版本用64M当前新版本用128M正确答案A
69.整个大数据平台按其职能划分为五个模块层次,运行环境层是A、运行环境层为基础设施层提供运行时环境,它由2部分构成,即操作系统和运行时环境B、基础设施层由2部分组成Zookeeper集群和Hadoop集群它为基础平台层提供基础设施服务C、基础平台层由3个部分组成任务调度控制台、HBase和Hive它为用户网关层提供基础服务调用接口D、用户网关层用于为终端客户提供个性化的调用接口以及用户的身份认证,是用户唯一可见的大数据平台操作入口正确答案A
70.下列描述中,哪项不属于Sqoop的缺点A、无法控制任务的并发度B、格式紧耦合C、安全机制不够完善D、connector必须符合JDBC模型正确答案A
71.考虑到安全和效率,Hadoop设计了机架感知rack-aware功能,下面关于机架感知说法正确的是?()A、三个冗余备份可在同一个机架上B、三个冗余备份在不同的机架上C、三个冗余备份其中有两个在同一个架构上,另外一个备份在不同的机架上D、上述说法都不对正确答案C
72.Hadoop完全分布模式配置免密登录是要()A、实现主节点到其他节点免密登录B、实现从节点到主节点的免密登录C、主节点和从节点任意两个节点之间免密登录D、以上都不是正确答案C
73.下列关于调度器的描述不正确的是?()A、先进先出调度器可以是多队列B、容器调度器其实是多个FIFO队列C、公平调度器不允许管理员为每个队列单独设置调度策略D、先进先出调度器以集群资源独占的方式运行作业正确答案A
74.以前在传统数据库与Hadoop之间,数据传输没有专门的工具,两者数据的互导是比较困难的,的出现解决了这个问题?()A、SqoopB\FIumeC、ZookeeperD、Hive正确答案A
75.Hadoop的安装部署的模式属于本地模式A、默认的模式,无需运行任何守护进程(daemon),所有程序都在单个JVM上执行B、在一台主机模拟多主机即,Hadoop的守护程序在本地计算机上运行,模拟集群环境,并且是相互独立的Java进程C、完全分布模式的守护进程运行在由多台主机搭建的集群上,是真正的生产环境D、高容错全分布模式的守护进程运行在多台主机搭建的集群上正确答案A
76.以下对数据节点理解错误的是(.A、数据节点的数据保存在磁盘中B、数据节点通常只有一个C、数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作D、数据节点用来存储具体的文件内容正确答案B
77.下面哪个选项不属于Google的三驾马车?A、HDFSB、MapReduceC、B igTabIeD、GFS正确答案A
78.在hadoop配置中yarn-s ite.xml作用是A、用于配置JobH i storyServer和应用程序参数B、用于定义系统级别的参数C、配置ResourceManager,NodeManager的通信端口D、用于名称节点和数据节点的存放位置正确答案C
79.Centos中修改文件或目录的访问权限命令A、chownB、passwdC、chmodD clearx正确答案CA、ZooKeeper不存在单点故障的情况B、ZooKeeper服务端有两种重要的角色是Leader和Fol lowerC、ZooKeeperLeader■挂掉之后会自动在其他机器选出新的LeaderD、客户端可以连接到ZooKeeper集群中任一台机器正确答案A
81.HBase依赖()提供消息通信机制Ax ZookeeperB、ChubbyC、RPCD、Socket正确答案A
82.下面哪个程序负责HDFS数据存储Ax NameNodeB、JobtrackerC、DatanodeD\secondaryNameNodeEx tasktracker正确答案c
83.下列是关于flume和sqoop对比的描述,不正确的是
0、flume主要用于采集多数据源小数据而sqoop用来迁移单数据源数A据B、flume主要用来采集日志而sqoop主要用来做数据迁移C、flume主要采集流式数据而sqoop主要用来迁移规范化数据D、fl ume和sqoop都是分布式处理任务正确答案D
84.对Sqoop描述不正确的是?()Ax Sqoop的底层实现是MapReduceB、Sqoop主要采集关系型数据库中数据,常用于离线计算批量处理C、Sqoop只支持从关系型数据库导入到HDFS,不支持从HDFS导入到关系型数据库D、Sqoop脚本最终会变成提交到YARN上的一个个map任务正确答案C
85.在导入开始之前,Sqoop检索出表中所有的列以及列的SQL数据类型,这些SQL类型被映射什么类型(C)A、CB\C++C、JavaD、Python正确答案C
86.关于Flume的三大组件以下说法正确的是()Ax channe I可以和任意数量的source和s i nk链接B、channeI只能链接单一的source和s i nkoC、sink在三大组件之间起着桥梁的作用D、sink从channel消费数据并将其传递给目标地,目标地只能是hdfso正确答案A
87.以下哪个文件是能够修改HDFS的副本保存数量参数()Ax修改mapred-site.xml配置文件B、修改core-s ite.xml配置文件C、修改yarn-s ite.xml配置文件D、修改hdfs-site.xml配置文件正确答案D
88.大数据平台项目实施计划不包括()A、基础平台部署B、完成大数据平台操作开发C、用户环境准备D、完成大数据平台的安装调试正确答案B
89.下面关于分布式文件系统HDFS的描述正确的是()、分布式文件系统HDFS是谷歌分布式文件系统GFSAA、SecondaryNameNodeB、DataNodeC\TaskTrackerD、Jobtracker正确答案D
8.配置SSH服务需配置()文件Ax vi/etc/ssh/sshd
8、vi/etc/sysconf ig/network-scr ipts/ifcfg-ethOCx vi/.bash_prof iIe〜D、vi/etc/ssh/sshd_conf ig正确答案D
9、Hadoop的配置目录在哪里?()A\/etc/hostsB、/etc/hadoopC\$HAD00P_H0ME/confD、$HAD00P_H0ME/etc/hadoop正确答案D
10.HDFS启动成功的标识是()Ax jps显示NameNodeB jps显示DataNodex(GoogleFi I eSystem)的一种开源实现B、分布式文件系统HDFS比较适合存储大量零碎的小文件C、分布式文件系统HDFS是GoogleBigtab Ie的一种开源实现D、分布式文件系统HDFS是一种关系型数据库正确答案A
90.使用java-api访问hdfs时,数据块副本数由下面那个决定?()Ax datanodeBcIientxC、namenodeD secondarynodex正确答案B
91.列出mysql数据库中的所有数据库sqoop命令是?A、sqoopI ist-tabIes-connectB、sqoopcreate-h ive-tabIe-connectC、sqoop import-connectDx sqoopIist-databases-connect正确答案D
92.下列不属于NameNode的功能()A、提供名称查询服务B、保存Block信息,汇报Block信息C、保存metadata信息D、metadata信息在启动后会加载到内存正确答案B
93.下列s ink中哪些是f Iume不支持的s inkA、HDFSsinkB\kafkas inkC\memorys inkD fi IeroIIs inkx正确答案c答案解析FI ume支持的s inks类型有HDFSSink、HiveSink、LoggerS ink、AvroS inkThr iftS ink、IRCS ink、Fi IeRo IIS ink、NuI ISink、HBaseSink、KafkaSi nk、HTTPSi nk、CustomSink、EIast icSearchSink、Morph Ii neSoIrSink
二、多选题共7题,每题1分,共7分
1.以下是HTools工具特点A、友善的向导式操作流程B、支持系统配置文件的推送和同步C、支持同时管理多个Hadoop集群和节点D、无需安装HTool s客户端正确答案ACD
2.下面描述正确的是、HDFS将数量众多的廉价机器使得硬件错误成为常态AB、HDFS支持多种软硬件平台中的可移植性C、HDFS上的一个文件大小是G或T数量级的,支持的文件数量达到千万数量级D、HDFS上的文件可以任意修改正确答案ABC
3.验证SSH无密码登录需要()步骤、验证Master到每个SI ave节点无密码登录AB、验证两个Slave节点到Master节点无密码登录C、修改Master节点author ized_keys文件D、修改SI ave节点author ized_keys文件正确答案ABCD
4.MapReduce是Hadoop中集群数据处理的核心,分为
0、分为映射,映射为Reduce阶段AB、分为减速,减速为Reduce阶段C、分为映射,映射为Map阶段D、分为减速,减速为Map阶段正确答案BC
5.Linux的特点是以下()方面A、开放源代码的程序软件,可自由修改B、与Unix系统不兼容,具备几乎所有Unix的优秀特性C、可自由传播,免费使用,无任何商业化版权制约D、适合Intel等x86CPU系列架构的计算机正确答案ACD
6.Hadoop能够使用户轻松开发和运行处理大数据的应用程序,那它主要有下面哪些特点()A、高效性B、高容错性C、高可靠性D、高扩展性正确答案ABCD
7.HDFS保障可靠性的措施()A、数据冗余机制B、数据节点心跳包C、数据节点块报告D、数据完整性检测正确答案ABDC、jps显示SecondaryNameNodeD jps显示NameNode\DataNode\SecondaryNameNodex正确答案D
11.以下选项哪个是YARN中动态创建的资源容器()A ResourceManagerxB、NodeManagerCx AppI icat ionMasterD、Conta iner正确答案D
12.Sqoop的底层实现是()A、HDFSB、MapReduceC\HBaseD、Hadoop正确答案B
13.Zookeeper生产环境一般采用多少台机器组成集群?(D)、1AB、3C、5D、奇数台(且大于1)E、偶数台且大于1正确答案D
14.在h ive中已知表test name的记录如下,tomTom_greentomIyL iIy代石马se Iect*f romtestwherenamerIike tom.*的结果有条记录、1AB、0C、2D、3正确答案D
15.hadoop
2.0与hadoopl.0区别A\增加MapReduce2B、增加YARNCx增加HDFS2D、增加容错机制正确答案B
16.日志消息的级别中哪个是比较严重的情况A、ALEKKTB、CRITC、ERRD、DEBUG正确答案B
17.把公钥追加到授权文件的命令是?()A、ssh-keygenB、sshC\ssh-addD、ssh-copy-id正确答案D
18.对于HDFS文件读取过程,描述不正确的是?()A、HDFS客户端通过Configuration对象的open(.方法打开要读取的文件B、D istr ibutedF iIeSystem负责向远程的名称节点(NameNode)发起RPC调用,得到文件的数据块信息,返回数据块列表C、通过对数据流反复调用read(.方法,把数据从数据节点传输到客户端D、当客户端读取完数据时,调用FSDataInputStream对象的close(.方法关闭输入流正确答案A
19.在本次项目实施中,需求调研前的准备不包括()A、接到调研任务,将计划写好,立即就开始和用户沟通B、编制确定客户需求调研计划和调研提纲C、充分了解客户的要求,客户的业务,客户的关注重点D、和客户负责人沟通,确定客户需求小组成员正确答案A
20.HBase分布式模式最好需要个节点、1AB、2C、3D、4正确答案C
21.名称节点NameNode是HDFS的管理者,它的职责有3个方面,下面哪个选项不是NamdeNode的职责?A、负责管理和维护HDFS的命名空间NameSpaceB、管理DataNode上的数据块BlockC、接收客户端的请求D、负责保存数据块正确答案D
22.ResourceManager对web服务提供地址,用户可通过i p地址在浏览器中查看集群各类信息、8088AB、8033C、8080D、8032正确答案A
23.在Centos7系统中,查看和修改IP信息需要用到()文件Ax/etc/sysconfi g/network/i fcfg-ensOB、/etc/sysconf ig/network-scr ipt/i fcfg-ensOCx/etc/sysconfig/ifcfg-ensOD、/etc/resolv.conf正确答案B
24.以下选项哪个是YARN的组成部分?()A\Conta iner、ResourceManager、NodeManager、AppI icat ionMasterB、Conta iner、ResourceManager、NodeManager、AppI icat ionManagerCx Container、ResourceManager ScheduIer AppI icat i onMasterxxD、Conta iner、AppIicationManager、NodeManager、AppIicationMaster正确答案A
25.2006年,GoogIe公司发表了用来处理海量数据的一种非关系型数据库的论文是?()A、“TheGoogleFi IeSystem55B“MapReduce:SimpI ifiedDataProcessingonLargeCIusters”xC、“Bi gtabIe:ADi stri butedStorageSystemforStructuredDatanD、uTheHadoopFi IeSystem”正确答案C
26.Sqoop是Hadoop和关系数据库服务器之间传送数据的工具,下列哪种数据库是不支持使用Sqoop直接进行数据传送0A PostgresxB、MySQLC、OracleD、Red is正确答案D
27.对Sqoop描述不正确的是?A、Sqoop的底层实现是MapReduceB、Sqoop主要采集关系型数据库中数据,常用于离线计算批量处理C、Sqoop只支持从关系型数据库导入到HDFS,不支持从HDFS导入到关系型数据库D、Sqoop脚本最终会变成提交到YARN上的一个个map任务。
个人认证
优秀文档
获得点赞 0