还剩18页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
数据采集中级习题库及答案1+x
一、单选题(共题,每题分,共分)
63163.在计算机网络中,能将异种网络互连起来,实现不同网络协议相互1转换的网络互连设备是()、网关A、中继器B、路由器C、交换机D正确答案C.操作系统中,系统管理员常用的二进制命令文件,一般放置在()目2录下、A/root、B/boot、C/sb i nD/usr/sb inx正确答案c.数据采集相关法律中明确数据信息收集主体的资格与责任是哪个法3律()、《中华人民共和国安全法》A、《互联网用户个人信息保护规定》B、《民法总则》C、《中华人民共和国网络安全法》D正确答案D.使用浏览器访问时4Web FTP、既能上传文件,也能下载文件A、用浏览根本无法访问B bTP、只能下载文件,不能上传文件C、只能上传文件,不能下载文件D正确答案C哪个轴可以选取当前节点的所有子元素?
5.、A child、B parentC\chi Ids、以上都不对D正确答案A、A/div[@id]、B/d i v[i d]、C//div[@id]、D//div[id]正确答案C以下的表达式中,哪一个是选取值以开头的节点
51.xpath id co div()Av//div[starts-with@id.co]、〃
(二二)B d iv[end-wi thi dco]、〃二二C div[idco]、
(55)D//div[startsWi th@i d.co]正确答案A.以下不属于用户数据报协议特点的是()52UDP、发送数据前,需要首先建立连接,它是有连接服务A UDP、使用尽最大努力交付,即不保证可靠交付,同时也不使用拥塞B UDP控制、是面向报文的C UDP、支持一对
一、一对多、多对一和多对多的交互通信D UDP正确答案A.以下关于数据采集特点的描述,不正确的是
53、编写程序可以爬取任意网站的任意数据A python、采集方式多样化、内容丰富化B、涵盖了全量采集、增量采集,不对数据进行采样C、以自动化手段为主,摆脱人工录入的方式D正确答案A中,用于运行项目中的爬虫的命令是()
54.ScrapyAx runspider、B genspiderCvcrawl、以上全是D正确答案C.以下可用于日志数据数据分析和存储的工具是()55Ax Iogstash、B Wi reshark、C f i Iebeat、八爪鱼采集器D正确答案A.在中,选取当前节点的所有先辈父、祖父等通过哪个轴56xpath来实现?A\ancestor、B ancestor-or-seIfC\ancestor-or、以上都可以D正确答案A.网络层上信息传输的基本单位称为
57、数据报A、帧B、段C、位D正确答案A.以下选项中,不符合语言变量命名规则的是58PythonAx33_keyword、B keyword_33C_33keywordx、D keyword33_正确答案A下列叙述中哪一项不是计算机硬件
59.、A CPU、显示器B、键盘C、D Wi ndowslO正确答案D中通过哪个属性设定元素的背景图像
60.CSSAx image、B background-i mageC\background-pos it ionD background-attachmentx正确答案B.下列哪个可以匹配腾讯号腾讯号从开始?61QQ QQ
10000、A[1-9][0-9]{4}、B[1-9]]{
4.}、C[0-9][4}、以上都不对D正确答案D.轴可定义相对于当的节点集?
62、节点A、前节点B、子节点C、父节点D正确答案B网站进行友情链接多少个为适中
63.、个A1〜5B、20〜30个C、30〜40个、个以上D40正确答案B
二、多选题共题,每题分,共分17117下列命令是主机信息类查询命令的是
1.Ax hostname、B cpunameCvhost、D uname正确答案AD.关于语言的浮点数类型,以下选项中描述错误的是2Python、语言要求所有浮点数必须带有小数部分A Python、浮点数类型与数学中实数的概念是不一致的B、小数部分不可以为C
0、浮点数类型表示带有小数的类型D正确答案BC.下面对方法描述错误的是3count,index.find、方法用于统计字符串里某个字符出现的次数A count、方法检测字符串中是否包含子字符串如果包含子字符串返B findstr回开始的索引值,否则会报一个异常、方法检测字符串中是否包含子字符串如果不在返回TC indexstr,str、以上都错误D正确答案BC.关于组合数据类型,以下选项中描述错误的是4Python、组合数据类型能够将多个同类型或不同类型的数据组织起来,A Python通过单一的表示使数据操作更有序、更容易的、和类型不都属于序列类型B\Python strtup Ie Ii st、组合数据类型可以分为类序列类型、集合类型和映射类型C
3、序列类型是二维元素向量,元素之间存在先后关系,通过序号访问D正确答案BD下列哪些函数属于聚合函数
5.、A str、B min、C sum
0、正确答案D countBCD.在中,节点是通过沿着或者来选取的6xpath、属性A、谓语B、路径C、步D正确答案CD.业务系统中产生的数据会有两种保存方式和_7_1_2_、文本快照A、数据库数据B、图像数据C、日志数据D正确答案BD架构中,中间件包括
8.ScrapyAx DownIoaderM i ddI ewares、B ScheduIerMi ddIewares、C Spi derMi ddIewares、正确答案D Pi peIi neMiddIewares AC正则表达式的特点?
9.、复杂性A、逻辑性B、功能性c、灵活性D正确答案BCD.数据库操作中,针对模糊查询正确的是
10、使用关键字A Iike、匹配多个字符使用”」B、匹配单个字符使用C、匹配多个字符使用“%”D正确答案ACD是一个开源的小型的轻量级应用服务,且具有特点
11.Tomcat、邮件服务A、支持负载平衡B、占用系统资源少C、扩展性好D正确答案ABCD中安装软件可使用命令
12.linux、A yumi nstaII、源代码安装B、C setup、D rpm正确答案ABD用于在文档中通过和进行导航?
13.XPath XML、元素A、属性B节点C\、属性值D正确答案AB.以下关于数据采集方式的描述,正确的有
14、采集系统A、采集工具B、采集编程C、采集框架D正确答案ABCD.关于形参和实参的描述,以下选项中错误的是
15、程序在调用时,将形参复制给函数的实参A、函数定义中参数列表里面的参数是实际参数,简称实参B、参数列表中给出要传入函数内部的参数,这类参数称为形式参数,简C称形参、函数调用时,实参默认采用按照位置顺序的方式传递给函数,D Python也提供了按照形参名称输入实参的方式正确答案ABC.根据数据所属主体不同,以下属于数据采集范畴的是16系统日志采集A\、网络数据采集B、数据库采集C、感知设备数据采集D正确答案ABCD.关于正则表达式的元字符?,以下描述正确的是
17、匹配前面的子表达式零次或一次A、匹配或B doesdo does、表示重复次C0~
1、当“?”紧跟在任何一个其他限制符后时,匹配模式是非贪婪的正D确答案ABD
三、判断题共题,每题分,共分
27127.数据库操作中,创建表用语句1createtable、正确A、错误B正确答案A是一种免费的开源语言,因易用性常常与相提并论
2.Python R、正确A、错误B正确答案A.错误日志是提供的另一种标准日志,该日志文件记录了3Apache服务器运行过程所发生的错误信息Apache、正确A、错误正确答案B A.在关系和中,的主键是的主键是4AS,SN,D BD,CN,NM AS,B D,则在中称为外键D S、正确A、错误B正确答案A将文档存储在集合中,文档类似关系数据库中的表
5.MongoDB、正确A、错误B正确答案A中命令的选项和参数是必须设置的
6.Linux、正确A、错误B正确答案B.数据报是面向无连接服务,而虚电路作为面向连接的服务
7、正确A、错误B正确答案A的消息的作用是告知服务器是从哪个资源转到当
8.HTTP head“referer”前资源上来的、正确A、错误B正确答案A关系数据库中,实体之间的联系是通过表与表之间的公共元组实现的
9.、正确A、错误B正确答案B国家支持网络运营者之间在网络安全信息收集、分析、通报和应急
10.处置等方面进行合作,提高网络运营者的安全保障能力、正确A、错误B正确答案A使用需要从库中导入模块,并使用类对需要
11.Xpath Ixmletree HTML匹配的对象进行初始化HTML、正确A、错误B正确答案A.正则表达式相当于12[0-9a-zA-Z]w、正确A、错误B正确答案B选取名为的一些属性
13.//@lang lang、正确A、错误B正确答案B.定义要求把第一个字母大写,其他字母小写,执行语句14x=python,可以实现print x[l].upper+x
[2]、正确A、错误B正确答案B.搜索引擎分为全文搜索、目录索引、元搜索引擎三类
15、正确A、错误B正确答案A下有两个应用比较多的框架,分别是和
16.JavaEE SSHSSDO、正确A、错误B正确答案B的执行结果为
17.1istmapstr,[1,2,3]
[1],
[2],
[3]、正确A、错误B正确答案B能够删除一列
18.altertableempremoveaddcolumn、正确A、错误B正确答案B.操作系统是裸机之上的第一层软件,与硬件关系尤为密切
19、正确A、错误B正确答案A假如路径起始于正斜杠/,则此路径始终代表到某元素的相对路径
20.、正确A、错误B正确答案B•一个网站获取的反向链接越多越好,说明被认同的范围越广,所以21反向链接追求高数量,对质量要求低、正确A、错误B正确答案B标准库中的模块提供正则表达式的全部功能,可以直接引
22.Python re入、正确A、错误B正确答案A不是一个真正的日志实现,而是一个抽象层,它允许你在后
23.SLF4J台使用任意一个日志类库、正确A、错误B正确答案A作为独立服务器请求来自于浏览器
24.Tomcat web、正确A、错误B正确答案A将地址转换到物理地址,而相反
25.RARP IPARP、正确A、错误B正确答案B语言具有跨平台性、使用复杂、面向对象、安全性差等特点
26.Java、正确A、错误B正确答案B数据导入工具的是
27.HBase Inporto、正确A、错误B正确答案A.数据包丢失一般是由网络引起的
6、死机A、安全B、拥塞C、断线D正确答案C.关于的复数类型,以下选项中描述错误的是7Python、复数类型表示数学中的复数A、对于复数可以用获得它的实数部分B z,z.imag、复数的虚数部分通过后缀或者”广来表示C“J”、对于复数可以用获得它的实数部分D z,z.real正确答案B以下关于浏览器与服务器之间进行消息传递的描述正确的是
8.、浏览器请求的所有资源会在一个请求和响应过程内完成A、浏览器请求的所有资源可能会在多个请求和响应过程内完成B、浏览器的一个请求对应多个服务器的响应C、浏览器的多个请求对应一个服务器的响应D正确答案B.查找根目录下的文件,命令的写法是9sudoersAv f i ndsudoers、B f i nd-namesudoers/C\f ind/-namesudoersD find/sudoersx正确答案c关于语言的浮点数类型,以下选项中描述错误的是
10.Python、浮点数类型表示带有小数的类型A、语言要求所有浮点数必须带有小数部分B Python、小数部分不可以为C
0、浮点数类型与数学中实数的概念一致D正确答案C如何在文件中查找显示所有以*打头的行?
11.、A grep0*fi Ie、B find*fi Ie、C wc-1*fiIe、D grep-n*fiIe正确答案A中,导入模块的方式错误的是
12.python、A importmfrommo、B importmoC\importmoasm、D frommoimport*正确答案A.以下数据库中,不是关系数据库的为13A SqIServerx、B Redi s、C MysqID\OracIe正确答案B在环境下的容器数据的采集中,启动容器的
14.Linux TomcatTomcat代码是、A IogstashBstartup.shxCv httpd、D fiIebeat正确答案B下面代码实现的功能描述的是
15.deffactn ifn==0returnlelsereturnn*factn-请输入一个整1num=eval input数:print factabs intnum、接受用户输入的整数判断是否是水仙花数A n,n、接受用户输入的整数判断是否是素数并输出结论B n,n、接受用户输入的整数判断是否是完数并输出结论C n,n、接受用户输入的整数输出的阶乘值D n,n正确答案D网页前端设计中,语言作用是浏览器端组织和显示网页信息文本、
16.图片、视频等、A CSS、B JavaScri pt、C HTML、D JSP正确答案C以下关于网络层次与主要设备对应关系的描述中,配对正确的是
17.、会话层防火墙A、网络层——集线器B传输层—路由器C\、数据链路层——网桥D正确答案D地址由位二进制数值组成
18.IPv
4、A
32、B
16、C
128、D64正确答案A.下列哪种说法是错误的
19、除字典类型外,所有标准对象均可以用于布尔测试A、空字符串的布尔值是B False、空列表对象的布尔值是C Fa Ise、值为的任何数字对象的布尔值是D0FaIse正确答案A保障信息安全最基本、最核心的技术措施是
20.、信息加密技术A、网络控制技术B、信息确认技术C、反病毒技术D正确答案A数据清洗是针对不符合要求的数据进行处理,以下不属于数据清洗
21.范围的是、错误的数据A、重复的数据B、无缺失数据C、不完整的数据D正确答案C是一种数据库,具体的说,是存储数据库
22.MongoDB NoSQL、键值A、文档B、图形C、D XML正确答案B用命令添加一个用户,这个用户的主目录是
23.useraddstdA\/var/std、B/b in/stdC\/etc/std、D/home/std正确答案D哪个命令可以将普通用户转换为超级用户
24.A\tarB passwdxC\super、D su正确答案D.关于开发,无法将应用程序的日志信息发送到中的25Android LogCat方法是、A Log.v、B Log.send、C Log.i、D Log.w正确答案B.关于的结果是26Python,type1+2L*
3.
14、A typeIong、B typestr、C typeint、D typefIoat正确答案D服务器运行后会生成两个日志文件,其中,是记录
27.Apache Web服务器的所有访问活动的文件、」错误日志A errorog、B/usr/1oca I/tomcat/1ogs、」访问日志C accessog、D logs正确答案C理论是理论的基础,下列性质不属于的是
28.CAP NoSqlCAP、分区容错性A、原子性B可用性C\、一致性D正确答案B.以下不属于样式表特点的是()29CSS
3、精确的控制网页中各元素的位置A、不能与脚本语言结合B、更好的控制页面的布局C、表现和内容分离D正确答案B启动服务命令为()
30.ApacheAv Servicehttpdstart、B Servicestart、C Servi ceHttpstartDHttpdstartx正确答案A.以下哪种类型的网络容易遭受攻击()
31、无线网络A、宽带网络B、租用专线网络C、拨号网络D正确答案A哪个轴可以选取文档中当前节点的开始标签之前的所有节点?
32.、A ancestor、B chiIdCx parent、D precedi ng正确答案D.对于某个公司的业务系统,希望查看系统登录和操作情况,可通过33()进行数据采集和分析、业务日志采集A、网页爬虫采集B、设备数据采集C、数据库采集D正确答案A.匹配帐号是否合法字母开头,允许字节,允许字母数字下划345T6线?、A^[a-zA-Z][a-zA-Z0-9_]{
4.15]、B[a-zA-Z][a-zA-Z0-9_]{
4.15$、C^[a-zA-Z][a-zA-Z0-9_]{
4.15$、D[a-zA-Z][a-zA-ZO-9]{
4.15$正确答案C与网络和系统相关的选项中,设置监听端口号为代码为
35.Apache
80、A Li stener
80、B Li sten
80、C Lis
80、D Li stene80正确答案B依靠存储底层数据
36.HBase、A HDFS、B HadoopCMemoryx、D MapReduce正确答案A.有关行业组织建立健全本行业的网络安全保护规范和协作机制,加37强对网络安全风险的分析评估,是哪个法律中规定的、《中华人民共和国网络安全法》A、《互联网用户个人信息保护规定》B、《电信和互联网用户个人信息保护规定》C、《民法总则》D正确答案A.在数据库中,产生数据不一致的根本原因是
38、没有严格保护数据A、数据存储量太大B、未对数据进行完整性控制C、数据冗余D正确答案D法律中说明“国家支持网络运营者之间在网络安全信息收集、分
39.析、通报和应急处置等方面进行合作,提高网络运营者的安全保障能力”、《电信和互联网用户个人信息保护规定》A、《中华人民共和国网络安全法》B、《民法总则》C、《中华人民共和国安全法》D正确答案B.用于解析域名的协议是
40、A HTTP、B DNS、C FTP、D SMTP正确答案B服务利用什么定位站点
41.WWW、A FTP、文件传输服务器B、C URL、邮箱号D正确答案C虚拟分布式模式须要个节点?
42.HBase、A
1、B
2、C
3、最少个D3正确答案A正则表达式]表示的含义是
43.“0-
9.、匹配所有的数字,”.中的任意一个A、匹配所有的数字,.”中的任意多个B、匹配所有的数字,““、二”中的任意一个C、匹配所有的数字,“、二”中的任意多个D正确答案A以下选项中,语言中代码注释使用的符号是
44.Python、#A、!B、//C、/……/D正确答案A.在权限允许的前提下,一次性删除多级目录目录不确定是否为空45的命令是A rmx、B rmdi r-pCx rm-rf、D rmdir-R正确答案C哪个表达式可以验证输入只能是汉字?
46.、A[u4e00-u9fa5]{0}$、B[u4e00-u9fa5]{
0.}、C[u4e00-u9fa5]
0.$、以上都不对D正确答案C以下哪种爬虫又称为主题网络爬虫,是指选择性的爬行那些与预先
47.定义好的主题相关页面的网络爬虫、聚焦网络爬虫A、深层页面爬虫B、增量式网络爬虫C、通用网络爬虫D正确答案A.使用获取一篇文档中所有超链接的属性,48Xpath HTMLhref Xpath代码为、A/a/@href、B//@hrefC\//a/@href、D/a/href正确答案C数据采集是数据分析前的重要且首要环节,数据采集需要符合哪些
49.特性、低维度、高并发、高速率A、多维性、灵活性、高延迟B、全面性、多维性、高效性C、单一化、低维度、低并发D正确答案C获取页面中的所有含有属性的标签,代码为
50.html iddiv xpath。
个人认证
优秀文档
获得点赞 0