还剩23页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
大数据模拟试题(含参考答案)i Ct
一、单选题(共62题,每题1分,共62分)
1.以下不是EXPLAIN命令选项的是()0Av performanceBprettyxCx anaIyzeD、verbose正确答案B
2.微服务开发生命周期管理中,流水线发挥了重要的作用请问应用开发流水线不支持微服务生命周期哪些坏节?A、测试B、构建C、部署D、编码正确答案D
3.从数据库架构设计来看,主要有以下哪些设计思路?A、Shared-D iskB、Shared-Every ingC、shared-Noth ingD、以上全都正确正确答案D
4.以下哪些算法是基于规则的分类器(—)A、C
4.5B、KNNBayesD、ANN正确答案A
5.随着互联网业务的极速增长,应用架构也随之不断变迁,请问以下哪种在应用架构的变迁中未提及?、kafka集群数据同步方案AB、kafka单集群内数据备份C、kafka单集群内数据恢复D、以全部不对正确答案A
41.MapReduce任务map输出结果将被写入、HDFS文件系统AB、新的记录文件C、磁盘Linux文件系统D、主数据库正确答案C
42.keepa lived的配置文件中使用什么表示主服务器?A、BACKUPB、MAINC、SLAVED、MASTER正确答案D
43.关于数据库内核小版本升级,以下说法正确的是A、升级数据库内核小版本不会重启MySQL实例B、如果主备实例在同一个AZ,升级内核小版本会触发两次主备倒换C、升级主实例小版本时,如有只读实例,也会同步升级只读实例的小版本D、小版本升级过程中可行执行event的ddl操作,如create eventdropvevent和alter event正确答案C
44.Elasticsearch可以通过什么命令发起Http请求来对数据进行查询操作?Ax netstatB、wgetC\getD、cur I正确答案c
45.应用架构变迁己经发展到了什么阶段?、单体架构AB、SOA架构C、微服务架构D、雾技术架构正确答案C
46.交叉验证的目的是
(一)oA、得到更稳定的模型B、增大分类的误差C、验证结果的准确性D、提高分类准确率正确答案A
47.关于Streaming的拓扑(Topology),下面描述错误的是()、一个TopoIogy是由一组Spout组件和Bolt组件通过Stream GroupiAngs进行连接的有向无环图(DAG)B、Topology会一直运行,直到它被显式ki IIC、业务逻辑都被封装Topology中D、一个Topology只可以指定启动一^Worker进程正确答案D
48.()将请求的源IP地址进行一致性Hash运算,得到一个具体的数值,同时对后端服务器进行编号,按照运算结果将请求分发到对应编号的服务器上、加权轮询算法AB、加权最少连接C、源IP算法D、连接ID算法正确答案C
49.ROMA的ABCD能力中的D是指、应用到应用间、数据、消息、API、流程集成AB、公有云到私有云、多云之间的协同C、设备到设备、0T和IT间的融合D、企业到企业,跨企业数据交换正确答案C
50.如果本地域名服务无缓存,当采用递归方法解析某域名时,用户主机、本地域名服务器、发送的域名请求消息数分别为?A、2条,2条B、1条,2条C、2条,1条D、1条,1条正确答案B
51.关于应用改造上云对应用改造量的评估,以下说法正确的是、无法评估AB、应用应完全基于微服务架构开发、测试、部署;改造工作量较大C、无需应用改造D、应用需实现本地持久化数据转存、代码与配置分离、日志输出标准化;改造工作量较小正确答案B
52.M icrosoft SQLSer ver默认可创建个数据库•、300AB、100C、200D、500正确答案B
53.Dockerf iI e中RUN指令的意思是?、指定基础镜像AB、为镜像指定标签C、容器启动时要运行的命令D、运行指定的命令正确答案D54,下列0用户可以创建用户角色A、超级管理员B、业务管理员C、普通业务员D、VDC只读管理员正确答案A
55.词袋模型中文本向量的每个元素表示该词的一o、语义关系AB、顺序C、含义D、频率正确答案D
56.以下关于HDPS适合做什么描述不正确的是?、低延迟读取AB、大文件存储与访问C、流式数据读取D、大数据量吞吐正确答案A
57.CSN的推进和分配在管理、GTMAB、CNC、DND、CM_SERVER正确答案A
58.Hive中的解释器comp Ii er优化器opt imi zer、执行器executor组件用于HOL语句从词法分析、语法分析、编译、优化以及查询计划生成生成的查询计划将存储在在中,并在随后由调用执行A、HDFS、MapReduceB\内存、MapReduceCx HBaseYarnxD、HDFS、Yarn正确答案A
59.关于虚拟负载均衡,正确的?A、只支持硬件虚拟负载均衡B、只支持软件虚拟负载均衡C、支持软硬件虚拟负载均衡D、无法虚拟正确答案A
60.关于Hive与Hadoop其他组件的关系,以下描述错误的是、AHive最终将数据存储在HDFS中B、Hi ve是Hadoop平台的数据仓库工具C\HQL可以通过Map Reduce执行任务D、Hive对HBase有强依赖正确答案D
61.HDFS基本系统架构中,副本配置通常存储份?、3AB、4C、1D、2正确答案A
62.Hadoop中Reducer执行阶段,同一时间执行阶段Ax shuffle、sortB、sorts reducec、都不是同时进行Dv shffIereducex正确答案A
二、多选题(共27题,每题1分,共27分)
1.关于HDFS中NameNode的作用描述的正确的是?A、管理HDFS的名称空间(NameSpace)B、执行数据块的读/写操作C、配置副本策略通常为3份D、处理客户端读写请求正确答案AD
2.在产品选型时,数据中台逻辑架构中贴源层要重点关注产品的特点包含()方面A、低廉的存储能力,以供海量数据存储B、数据访问以支持海量数据审计和高可靠C、具备审计能力,可提供给共享层做数据恢复D、高并发数据写入能力,支撑数据高效写入正确答案ABCD
3.长期有效的docker login指令与临时docker login指令的区别是:OoA、长期有效的docker login指令代指一年不会过期的登录指令B、临时的docker login指令代指48个小时后会过期失效,不能再被使用的登录指令C、获取了长期有效的docker login后,在有效期内的临时docker login仍然可以使用D、临时的docker login指令代指24个小时后会过期失效,不能再被使用的登录指令正确答案ACD
4.以下哪些组件属于大数据采集传输工具?Av SqoopB、LoaderCv FlumeD、Kafka正确答案ABCD
5.HDFS不适用于以下()场景A、流式数据访问B、大量小文件存储C、大文件存储与访问D、随机写入正确答案BD
6.数据质量定义模块包括()、度量规则管理AB、质量维度定义C、检核方法管理D、检验类别管理正确答案ABCD
7.创建CCE集群时创建()安全组、集群名称-cce-master-随机数AB、集群名称-cce-node-随机数C、集群名称-cce-control-随机数D、cce-contro I-随机数正确答案BC
8.SparkSQL使用场景丰富,可以处理的数据源包括、文本文件AB、RDDC、HiveD JsonX正确答案ABCD
9.账号登录策略有()、用户启用策略AB、会话超时策略C、用户锁定统计周期D、用户锁定时长正确答案BCD
10.当发现与kafka实例连接出现异常时,可从()方面排查、检查网络AB、检查Consumer的配置C、检查Producer的配置D、检查客户端连接问题正确答案ABCD
11.下列关于Fusion Insight LibrA行存储和列存储的使用场景描述正确的有()、列存储适用于统计分析类查询(group,join多的场景)AB、行存储适用于点查询(返回记录少,基于索引的简单查询)C、列存储适用于点查询(返回记录少,基于索引的简单查询)D、行存储适用于即席查询(查询条件列不确定,行存无法确定索弓I)正确答案AB
12.基于Python语言的数据分析中常用于数据可视化的第三方包是
(一)oA\SeabornB、NumpyC、Matplot IibD、Pandas正确答案ACD
13.弹性ip的价值是()o、用户可以将弹性IP绑定到ECS或BMS上,绑定后的ECS或BMS即可A连接外网B、用户可以为虚拟IP地址绑定一个弹性IP,从外网可以访问后端绑定了同一个虚拟IP地址的多个主备部署的弹性云服务器,增强容灾性能C、用户可以为管理后台虚拟机绑定弹性ip,可以接收来自外网的数据交互D、用户可以为负载均衡器绑定弹性IP,可以接收来自外网的访问请求并将请求自动分发到添加的多台弹性云服务器正确答案ABD
14.以下关于Fusion Insight网路安全可靠性,说法正确的是()A、阻止外部攻击者通过管理通道入侵实际业务数据B、Fusionlnight支持网路划分为三级集群业务平面、集群管理平面和集群外维护网路彼此之间实施物理隔离C、避免业务平面的高负载阻塞集群管理通道D、网路平面隔离,避免管理与业务贷款抢占,相互干扰正确答案ABCD
15.应用运维管理(App Ii cati onOperat ions Management)是云上应用的一站式立体化运维管理平台,实时监控用户的应用及相关云资源,采集并关联资源的各项指标、日志及事件等数据共同分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况其中监控主要包含()方面的监控、应用监控AB、组件监控C、主机监控D、容器监控正确答案ABCD
16.下列哪些情况下可以采用数据分区操作()?A、当表中数据量比较多(千万级别以上)的时候B、需要执行大量的数据删除操作的时候C、需要执行大量的数据更新操作的时候D、需要执行大量的热点数据查询操作的时候正确答案ABCD
17.裸金属服务器支持挂载()类型的磁盘、本地硬盘AB、nfsC、云硬盘D、对象存储正确答案AC
18.以下属于控制算子的有()、HashJoinAB、AppendC、AggD、Recurs ivellno in正确答案BD
19.Fus ion Ins ight HD中系统使用Streaming客户端she II命令查看拓扑或者提交拓扑失败,以下()定为手段是正确的、查看Superv isor运行日志,判断是否Superv isor异常AB、查看worker运行日志C、查看Ni imbus的运行日志,判断是否Nimbus服务异常D、查看客户端异常堆栈,判断是否是客户端使用问题正确答案ABCD
20.以下关于ElasticSearch描述正确的是?A、可作为关系型数据库使用B、一个高性能,基于Lucene的全文检索服务C、可作为NoSQL数据库使用D、一个分布式的RestFul风格的搜索和数据分析引擎正确答案BCD
21.Loader提供了()方式或接口实现作业管理、SOA架构AB、单体架构C、微服务架构D、原子架构正确答案D
6.极速型SSD云盘,结合25GE网络和RDMA技术,能够提供单盘高达的随机读写能力和单路低时延性能Ax10万B、50万C、100万D、200万正确答案C
7.以下组件负责接收来自应用的访问请求,并向客户端返回执彳丁Z吉果A、GTMB、WLMC、CND、DN正确答案C
8.StructuredStreaming中以下哪项计划的执行顺序是正确的?A、物理计划——逻辑计划——优化的逻辑计划B、逻辑计划——优化的逻辑计划——物理计划C、优化的逻辑计划——逻辑计划——物理计划D、逻辑计划——物理计划——优化的逻辑计划正确答案B
9.如下对SR-IOV模式网卡的基本概念描述不正确的是?、PF包含SR70V功能结构,用于管理SRT0V功能AB、PF拥有完全配置资源,可以用于配置或控制PCIe设备C、VF是一种轻量级PCIe功能,可以与物理功能以及与同物理功、Web UIAB、L inux命令行C\Rest接口D、Java API正确答案ABCD
22.弹性云服务器实现HA需要满足的条件是()A、全局HA功能开关开启B、云服务器所在的主机组HA开关开启或处于未配置状态C、云服务器的HA开关开启D、云服务器所在的主机组HA开关关闭正确答案ABC
23.Fus ion Ins ight HD中,一个完整的Stream ing CQL应用程序至少包含()部分A、创建输入流B、创建输出流C、业务操作语句(例如SELECT、INSERT、JION等)D、应用提交语句正确答案ABC
24.在产品选型时,数据中台逻辑架构中共享层要重点关注产品的特点包含()方面A、支持高效的数据更新、删除能力B、高效的访问能力C、智能的资源回收能力D、支持数据发放能力正确答案ABD
25.下面关于Fus ionInsightLibrADM的支持平台描述正确的有()oA、可以运行在SUSE
11.3系统上B、需要运行在Internet Explorer
9.0及以上版本C、JDK需要
1.6及以上版本D、操作系统需要预留2G内存,10G磁盘空间正确答案ABD
26.关于Hbase存储模型的描述正确的是()A、同一个key值可以关联多个valueB、keyvalue中期有时间戳,类型等关键信息C、即使是key值相同,qual ifier也相同的多个KeyValue也可能有多个,此时使用时间戳来区分D、每一个keyvalue都有一个qua Ii fi er标识•正确答案ABCD
27.弹性云服务器创建镜像,可以通过()方式创建、外挂ISO设备镜像AB、系统盘镜像C、整机镜像D、数据盘镜像正确答案BCD
三、判断题(共16题,每题1分,共16分)
1.创建Elasticsearch索引前,要先判断索引是否存在A、正确B、错误正确答案A
2.INSERT语句在数据导入时效率比较低,因此不要使用INSERT的方式来对数据表的写入、正确AB、错误正确答案B
3.同一个region中的存储资源池可以提供给该region所属的其它多个AZ共享使用A、正确B、错误正确答案B
4.Spark是基于内存的计算引擎,所有Spark程序运行过程中的数据只能存储在内存中、正确AB、错误正确答案B
5.Flink中无界流的数据都可以被排序,所以并不需要有序读取、正确AB、错误正确答案B
6.物联网也将成为云计算最大的用户、正确AB、错误正确答案A
7.ElasticSearch作为全文检索的引擎,其功能强大,也可以作为NoSQL数据库使用,能满足海量数据存储的需要,也满足主键和多级索引的实时查询A、正确B、错误正确答案A
8.Spark OnYarn模式下的dr iver只能运行在客户端、正确AB、错误正确答案B
9.Elast ioSearch倒排索引是通过关键词查询对应的文档编号,再通过文档编号找文档、正确AB、错误正确答案A
10.Oracle数据库根据它自身的发布形态,既可以做OLAP也可以做OLTPoA、正确B、错误正确答案A
11.Flume不支持多级联操作、正确AB、错误正确答案B
12.在线迁移中可能因外部因素导致迁移暂时故障,用户根据迁移日志信息解决问题后,可以通过续传功能继续迁移、正确AB、错误正确答案A
13.Yarn-c Ii ent和Yarn-C Iuster主要区别时App Ii cati onMaster进程的区别、正确AB、错误正确答案A
14.伸缩组在冷却时间内,会拒绝由告警策略触发的伸缩活动A、正确B、错误正确答案A
15.Flume传输数据的过程中,Sink取走数据并写入目的地后,会将events从channe I中删除、正确AB、错误正确答案A
16.裸金属服务器只支持挂载SCSI模式的云硬盘磁盘、正确AB、错误正确答案A能关联的其他VF共享一个或多个物理资源D、每个VF都是从PF中分离出来的,每个物理硬件都可以虚拟出无限个VFo正确答案D
10.关于弹性IP,下列说法错误的是?()、只有路由网络可以绑定弹性IPAB、一个弹性IP只能绑定到一个实例接口C、只有主网卡可以绑定弹性IPD、弹性IP的绑定和解绑都不影响实例的运行正确答案C
11.对ElasticSearch检索流程描述正确的是B、检索节点不需要汇总结果直接把结果发送给客户端A、分片节点不需要汇总结果直接把结果发送给客户端C、分片节点汇总结果发送给客户端D、检索节点汇总结果发送给客户端正确答案D
12.在“当前告警”页面,运维人员可以查看0的当前告警,以便掌握最新告警动态、Top100告警AB、实时更新C、Top10告警D、已处理正确答案B
13.下列关于基于源目的IP和端口负荷分担算法是描述正确的是?A、该模式可靠性高,但网络流量只会由一个网卡分担,另一个网卡作为备份B、当报文中有IP和端口时,使用源目的IP端口和MAC进行负担负荷分担;当报文仅有IP地址时,使用IP地址和MAC进行负担负荷分担;当报文仅有MAC地址时,使用MAC地址进行负荷分担C、该模式一般用于网络流量大部分在二层网络内部的场景,此网络流量可以通过MAC均匀散列D、该模式使用网络流量完全均匀地发送给各个端口,但可能产生大量的报文乱序正确答案B
14.Fusioninsight HD系统中HDFS默认Block Size是()A、32MBB、64MBC、128MBD、256MB正确答案C
15.Flink的数据转换操作在()环节中完成A、sourceB、channeIC、s inkD、Transformat ion正确答案D
16.下面关于DNS的描述,不正确的是?A、在Internet_t,域名和IP地址之间的对应关系可以是一对一,也可以多对一,无论哪种对应关系,DNS均可以进行解析B、域控制器会将它的主机名,IP地址和所扮演的角色等信息注册到DNS服务期内,以便其他计算机可以通过DNS服务器找到这台域控制器C、DNS反向解析需要建立反向查找区域,将IP地址解析成域名D、DNS提供了域名和IP地址之间转换的服务正确答案A
17.以下关于分布式交换机,说法正确的是?、当端口类型选择普通时,允许多个VLAN通过AB、一^^端口组只能对应一个分布式交换机,一个分布式交换机可以对应多个端口组C、上行链路是SR-IOV设备时端口类型应选用普通D、虚拟机一块网卡可以加入多个安全组中正确答案B
18.Streaming主要通过zookeeper提供以下的实现事件侦听A、分布式锁机制B、WatcherCx CheckpointD、ACK正确答案B
19.下面关于pod的描述不正确的是?、同一个pod里面的容器不能共享一个存储卷的空间AB、每个pod都拥有一个唯一的IP地址C、一个pod可以包含一个或多个容器D\pod是kubernetes的基本调度单元正确答案A
20.ElasticSearch中构建—query需要用到下列哪个代码?A、QueryBui Iders.putQueryOB、QueryBu iI ders.matchQuery C、QueryBui IdersgetQuery0D、QueryBui IderscreateQuery正确答案B
21.当机器学习把训练样本自身特点当作所有潜在样本特点,导致泛化性能下降,这种现象在机器学习中称为A、过拟合B、偏差C、欠拟合D、误差正确答案A
22.传统处理数据的数据规模的单位是()
0、TBAB、EBC、PBD、GB正确答案D
23.核主成分分析是一种
(一)方法、线性降维AB、分类C、非线性降维D、回归正确答案C
24.以下哪顶云硬盘可以通过云硬盘控制台直接创建A、系统盘B、镜像盘C、差分盘D、数据盘正确答案D
25.Kafka中每种消息类别称为什么A\SubjectB\ObjectC\TopicD、Theze正确答案c
26.当ElasticSearch集群有节点加入或退出时,集群数据会发生什么操作?A、数据重分布B、数据重建C、数据重载D、数据更新正确答案A
27.ELB不支持()调度算法、加权轮询算法AB、加权最少连接C、源IP算法D、随机正确答案D
28.Kafka集群在运行期间,直接依赖于下列()组件A、hbaseB、zookeeperC sparkxD、hdfs正确答案B
29.Hive常被用来处理()场景、批量计算AB、实时性计算C、流计算D、事务性处理正确答案A
30.Hbase中的Region是由()服务进程来管理的A、HRegionServerB、ZookeeperC、HmasterD、DataNode正确答案A
31.以下哪个类型的云硬盘的最大吞吐量可以达到350MB/S、普通I0AB、优化10C\演j10D、超导j10正确答案D
32.一般情况下,若要提高Elasticsearch检索效率,可以采取什么操作?A、使用Hive做底层存储B、压缩索引G增加EsMaster节点D、调整索引分片数正确答案D
33.LVS、Nginx节点服务正常时,每隔秒会对ETCD节点连接,如果连续三次所有的ETCD节点都连接失败,产生集群健康检查告警、1AB、2C、3D、5正确答案D
34.下列哪一种不是访问容器应用的方式?、ELBAB、Node PortCServicexD、VPC正确答案B
35.对于访问量波动明显的场景如视频类、电商网站等无法预估业务拓展空间场景,可通过0的方式进行业务部署,为业务提供扩展空间可以将后端云服务器组与弹性伸缩服务配合使用,在保障业务正常运作的同时最大程度降低成本、弹性负载均衡AB、弹性伸缩C、弹性ipD、自动扩展正确答案A
36.在回归模型中,在权衡欠拟合和过拟合中影响最大、多项式阶数AB、更新权重w时,使用的是矩阵求逆还是梯度下降C、训练样本数量D、使用常数项正确答案A
37.将闵可夫斯基距离和结合即可处理混合属性A、VaIue Di fferenceMectr icB、k-meansC\k近邻D、SVM正确答案A
38.关于租户的描述不正确的是A、租户是进行资源分配的单位B、租户只能是企业C、租户可以是个人D、如果企业不需要多级运营,只需创建一个租户和一级VDC正确答案B
39.kNN最近邻方法在情况下效果较好、样本呈链状分布AB、样本较多但典型性不好C、样本较少但典型性好D、样本呈团状分布正确答案C
40.kafka-cIuster mirror ing工具可以实现功能。
个人认证
优秀文档
获得点赞 0