还剩36页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
2022数据采集与处理■题库带答案、()是指对1客观事件记录的符号,是对客观事物的性质、状态及相互关系等进行记载的物理符号或这些物理符号的组合、数据、字段A B、记录、大数据C D答案、在数据表中,表的“列”称为()A
2、数据、字段A B、记录、大数据C D答案、在数据表中,表的“行”称为()B
3、数据、字段A B、记录、大数据C D答案、数据表是由行(记录)和列(字段)构成,因此也称(C4A、数据B、二维表、表格、大数据C D答案、大数据具有以下特征B
5、登录采集分登录采集和登录采集72答案账号密码;Cookie
9、使用登录采集时,输入账号密码需要用到模块73答案输入文字*
749、采集器无法识别验证码答案错误、登录利用浏览器中的缓存设置,缓存了当前的一75个网页状态,可以快速进入当前状态的页面答案Cookie
9、登录的方式不需要输入账号和密码,直接打开网页就是登录状态76Cookie答案正确登录中长期存在,所以是登录采集中,最方便的采集方式77Cookie Cookie答案错误、使用简易模式采集任意网站数据78要求叙述采集步骤或使用采集器采集数据截图答案解析、使用单页采集模式,采集任意一个网页的数据要求叙述采集步骤79或使用采集器采集数据截图答案解析、即、异步更新的一种脚本技术80ajax答案延时加载
9、可以通过在后台与服务器进行少量数据交换,可以重新加载整个网页答案错误、81ajax82使用技术的网页,点击网页中某个按钮或下拉页面,网址一般不发生改变,网址ajax栏不出现加载状态,但网页局部有新的数据加载出来,有所变化答案正确、技术包括()83AjaxA、ajax点击B、ajax翻页、滚动、定位C ajaxD答案、点击可以对一个按钮进行多次点击ABC84Ajax答案错误、如果设置了技术的网页,在采集设置时,没有勾选加载,则不能进行采85ajax ajax集答案错误、滚动包括()86AjaxA、直接滚动到底部B、动到下一行、滚动到下一页、向下滚动一屏C D答案AD、语言是网页内容定位语言,它可以帮助采集工具查找网页内容在网页中的位置87XPath答案正确、语言,也称为路径语言88XPath HTML答案错误
89、XPath语言由、、、内容构成答案名称;位置;属性
9、被设计用来显示网页数据,就是用来在中定位元素的90HTML答案HTML;XPath
9、称为超文本标记语言91HTML答案正确、是构成网页的基本元素92答案节点
9、节点有多种类型,分别是()、元素、属性、文本93A、命名空间、处理指令、注释、文档节点B C、属性值答案ABCD、节点关系是指节点与节点之间的关系,通过包含与被包含关系区分94答案正确、是对于节点的描述性语句,用来选取指定节点95答案路径表达式XPath中,表示不论该元素在中的任何位置,均选取该元素Html答案//・、中,用于选择某一元素的子元素,不能跨多层关系进行选择97XPath答案、中,用来表示属性,需写在属性前方答案98XPath@*99XPath
9、中,选取父元素,其中表示父元素选取元素自身,其中“.”表示元素自身答案*9中,选取某元素下的所有子元素答案100XPath、中,选取某元素下的所有后代元素101XPath答案://*、中,用来查找某个特定的节点或包含某个指定的值的节点答案102XPath谓语
9、中,谓语对元素的、及做限制,只要符合限制的元素,使用中括号“[]”表示103XPath答案位置;属性;内容中,函数,主要功能为选中指定文本内容的元素答案正确104XPath Text、中,参数参数主要功能为选中参数中包含参数中内容的元素105XPath contains1,2,12答案正确、中,主要功能为选中同胞元素中最后一位的元素106XPath last,答案正确、中,主要功能为描述元素在同胞元素中的位置107XPath position,答案正确、哪些行业需要用到数据采集
108、企业、政府A B、金融、教育C D答案、使用采集器采集需要大量的专业知识ABCD109答案错误、个人进行数据采集是,主要用于()
110、网页信息收集、商务数据采集A B、市场数据采集、社会公开信息C D答案、在公安经侦领域通过对网络敏感信息监控比对管理,帮助公安经济侦查工AB111作的开展和提供数据层面的支持答案正确、商务数据采集多用于采购分析、市场分析、项目运行和论文编写112答案正确、数据的质量因素包113括可信性和可解释性答案准确性浣整性;一致性;时效性湘关性
9114、数据的质量问题从采集的角度划分,可分为()A、准确性、完整性、一致性B C、时效性答案ABCD
115、数据的质量问题从应用的角度划分,可分为()A、准确性、相关性、时效性B C、可信性D答案、数据的质量问题从用户使用的角度划分,可分为()BC
116、准确性、完整性A B、可信性、可解释性C D答案、准确性是指数据是否正确的,数据存储在数据库中的值是否对应于真实世界的值CD117答案正确、某用户在使用支付宝绑定银行卡时,网站要求验证用户的真实姓名和身份证号码118这时要求采集的数据必须有()、准确性A、完整性、一致性B C、相关性答案D A、数据质量完整性是指信息具有一个实体描述的所有必需的部分答案正确
119、空值是指缺失或不知道具体的值,可能是一条记录中的某个属性缺失,也可能是整条记录都120丢失答案正确、数据质量的数据一致性是指在数据库中,不同表中存储和使用的同一数据应当是121等价的,表示数据有相等的值和相同的含义答案正确、数据质量的数据相关性是指数据与特定的应用和领域有关122答案正确、数据质量的时效性是指有些数据会随时间而变化的123答案正确、数据质量的可信性由三个因素决定数据来源的权威性、数据的规范性、124数据产生的时间答案正确、数据质量的可解释性,也称为可读性,是指数据被人理解的难易程度125答案正确、数据处理的大流程步骤中的一个大体流向图,就是()
1264、数据清理、数据集成A B、数据变换、数据归约C D答案、由于操作员重复录入,并发处理等不规范的操作,导致产生不完整,不准确的,ABCD127无效的数据也可以用在数据分析里答案错误、数据的缺失值是指现有数据集中某个或某些属性的值时不完整的128答案正确、处理空缺值的基本方法有种,包括忽略元组、人工填写空缺值、使用全局常量1296替换空缺值、使用属性的中心度量填充空缺值、使用与给定元组属同一类的所有样本的平均值来填充空缺值、使用最可能的值填充空缺值答案正确、若一条记录中有多个属性值被遗漏了,则可将该记录排除在数据挖掘之外答案130正确、噪声数据是指一个测量变量中的随机错误或偏差答案正确
131、噪声数据也可以用于数据挖掘进行分析132答案错误、孤立点的是不符合数据模型的数据133答案正确、孤立点并不真实存在,是人们无意中弄出的偏差比较大的数据134答案错误、处理噪声数据可以使用()方法
135、分箱法、回归法A B、聚类、忽略元组C D答案、数据集成是指将互相关联的分布式异构数据源集成到一起,使用户能够以ABC136透明的方式访问这些数据源答案正确、数据集成的方法有()
137、联邦数据库、中间件集成A B、数据仓库、聚类C D答案、数据仓库是数据集成最常用的方法ABC138答案正确、数据仓库来集成数据时需要处理的问题包括()
139、实体识别、冗余A B、相关分析、数据冲突和检测C D答案、实体识别,它所解决的问题是如何匹配多个信息源在现实世界中的实体事物ABCD140答案正确、数据规约就是为了压缩数据量,帮助从原有庞大数据集中获得一个精简的数据集141合,并使这一精简数据集保持原有数据集的完整性答案正确、数据规约的策略有()142A、维归约B、数量归约、数据压缩、实体识别C D答案、主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合ABC143指标答案正确、属性子集选择,主要用于检测并删除不相关、弱相关或冗余的属性目的是找出最小属性集,144使得数据类的概率分布尽可能地接近使用所有属性得到的原分布答案正确、数量规约中有参数的方法一般使用()、回归145A、对数的线性模型、直方图B C、聚类D)、大容量、多种类、高速度A、复杂性、高价值、可变性、真实性B C、以上都是答案D D、数据的获取途径有()、产品自有数据6A、调查问卷、互联网数据导入B C、从别人数据库窃取答案ABCD、产品自有数据就是自身产品销售过程中产生的数据7答案正确、调查问卷是以问题的形式系统的记载调查内容的一种印件8答案正确、互联网数据分布在网页的不同位置,我们很难采集下来9答案错误、是按照数据结构来组织,存储和管理数据的仓库10Excel答案错误、商务数据指用户在电子商务网站购买商品的过程中,网站记录用户行为的大量数11据答案正确、商务数据包括()
12、电子商务平台的基础数据、电子商务专业网站的研究数据A B、电子商务媒体报道、评论数据C D答案ABCD答案、数量规约中无参数的方法一般使用()AB
146、直方图、聚类A B、抽样、数据立方体聚集C D答案、数据变换是将数据转换或统一成易于进行数据挖掘的数据存储形式,使得挖掘过ABCD147程可能更有效答案正确、数据变换的方法有很多种,包括光滑、属性构造、聚集、数据规范化、数据离散148化、概念分层等答案正确、数据规范化包括()149A、最大-最小规范化B、零-均值规范化、小数定标规范化、数据离散化C D答案使用简易模式采集任意网站数据ABC要求叙述采集步骤或使用采集器采集数据截图答案全称为中文名为数据抽取、转换和加载151ETL,Extraction-Transformation-Loading,答案正确
152、安装kettle,必须先安装jdk(java的运行环境)答案正确、安装之后需要配置环境变量才能使用153jdk答案正确
154、ETL是Kettle的一种工具答案错误、()是转换里的基本组成部分它是一个图形化的组件,可以通过配置步骤的参155数,使得它完成相应的功能、步骤、跳A B、注释、转换C D答案、中的()定义了一个单向通道,允许数据从一个步骤向另一个步骤流动A156KettleA、步骤B、跳、注释、转换C D答案、、文件等都属于文本文件B157csv txt答案正确的数据可分为结构化的表格数据和非结构化的表格数据
158.Excel答案正确
159、Excel是一种()A、办公软件B、开发软件、操作系统软件、数据库C D答案、文件在中可使用()步骤,进行的输入输出A160Excel kettleexcel、输入、输出A excelB excel、输出、代输入C Microsoft Excel DMicros Excel答案、输出”步骤则可以设置文件或版本的文件的ABC161“Microsoft Excel Excel97Excel2007输出答案正确、输出”步骤,仅能输出版本的文件162“Excel Excel97答案正确
163、JSON(JavaScript ObjectNotation,JS对象简谱)是一种轻量级的数据交换格式答案正确、核心概念包括()164JSONA、数组B、对象、属性、路径C D答案、表达式通常是用来路径检索或设置的ABC165JsonPath Json答案正确、表达式有两种表示方法,分别是()166JsonPath、点记法、括号记法A B、逗号记法、操作符记法C D答案AB指可扩展标记语言被设计用来传输和存储数据167XML Extensible Markup Language,XML答案正确168XPath即为XML路径语言XML PathLanguage,它是一种用来确定XML文档中某部分位置的语言答案正确、数据库分为关系型数据库和非关系型数据库169答案正确、数据的连接参数与的连接参数是完全相同的170MySQL Oracle答案错误连接名称是设定一个在作业或转换范围内唯一的名称171答案正确、数据库连接步骤中在列表里可以选择可用的访问方式有172A、JDBC连接B、ODBC数据源、数据源D、Oracle的0CI连接C JNDI答案、数据库连接时,一般连接参数包括ABCD173A、主机名B、数据库名、端口号、用户名和密码C D答案、数据清理,就是试图检测和去除数据集中的噪声数据和无关数据,处理遗漏数据,ABCD174去除空白数据域和知识背景下的白噪声,解决数据的一致性、唯一性问题,从而达到提高数据质量的目的答案正确、只能用单一的清洗步骤清洗工作,所以比较麻烦5Kettle答案错误、常用的转换步骤一般在()176A、转换目录B、脚本目录、校验目录、输出目录C D答案字符串做剪切的功能,该步骤需要在剪切字符串版面添加需要剪切的(ABC
177.、字符串字段(输入流字段)、输出字段(输出流字段)A B、剪切的起始位置、剪切的结束位置C D答案、字符串替换()步骤对字符串做查找替换ABCD178Replace instring答案正确、字符串操作功能包括()
179、首尾去除空白字符、大小写A B、数字移除/提取、删除特殊字符C D答案)ABCD、能使用正则表达式的是()、字符串剪切180A、字符串替换B、字符串操作、以上都不行C D答案、拆分字段成多行可将一行记录拆分成多行记录,新的记录里有一个B181Split filedto rows新的字段,由拆分后的子字符串填充答案正确、拆分字段根据分隔符将输入的一个字段拆分成多个字段182Split Fields答案正确、合并字段将多个字段用分隔符连接起来输出到一个新的字段183Concat Fields答案正确、字段选择可以对输入流的字段做选择、删除、重命名等操作,还184Select values可以更改字段的数据类型和精度等答案正确
185、字段选择Selectvalues有3个选项卡A、选择和修改B、移除、元数据、替换C D答案、计算器步骤是一个函数集合来创建新的字段,还可以设置字段是否移除临时字段ABC186答案正确、流查询在查询前把数据都加载到内存中,并且只能进行等值查询187答案正确、过滤记录让数据流从一路到两路188答案正确、重复数据产生原因有189A、录入出错B、数据不完整、数据缩写、硬件设备出错C D答案、不完全重复数据,客观上表示现实世界中的同一实体,但由于表达方式不同或拼写ABC190错误等原因,导致数据存在了多条重复记录答案正确、“唯一行(哈希值)”步骤可以附加比较存储在内存中的记录值,防止哈希碰撞191冲突答案正确、”唯一行(哈希值)”步骤必须先使用排序,不然无法去重192答案错误、“去除重复记录”步骤要求输入的数据是事先排好序的,因为它是通过比较相邻193记录的值来判断是否重复的答案正确、一个作业包括一个或多个作业项,这些作业项以某种顺序来执行194答案正确、作业的组成包括()195A、作业项B、作业跳、注释、输入C D答案、作业项结果有两个作用,一是决定作业的执行路径,二是向下一个作业项传递一个ABC196结果对象答案正确、作业跳是作业项之间的连接线,定义了作业的执行路径197答案正确、在里,作业是使用一种回溯算法来执行作业里所有作业项的198Kettle答案正确、作业的执行结果是唯一的199答案错误、作业中的变量代表一个任意长度的字符串值200答案正确、变量的格式是${变量名}或者%%变量名%%201答案正确、数据的质量因素包202括、、、、可信性和可解释性答案准确性;完整性;一致性;时效性;相关性、数据的质量问题从采集的角度划分,可分为()
203、准确性、完整性A B、一致性、时效性C D答案、数据的质量问题从应用的角度划分,可分为()ABC
204、准确性、相关性A B、时效性、可信性C D答案、数据的质量问题从用户使用的角度划分,可分为()BC
205、A、准确性B、完整性、可信性、可解释性C D答案、准确性是指数据是否正确的,数据存储在数据库中的值是否对应于真实世CD206界的值答案正确、某用户在使用支付宝绑定银行卡时,网站要求验证用户的真实姓名和身份207证号码这时要求采集的数据必须有()A、准确性B、完整性、一致性、相关性C D答案、数据质量完整性是指信息具有一个实体描述的所有必需的部分A208答案正确、空值是指缺失或不知道具体的值,可能是一条记录中的某个属性缺失,也209可能是整条记录都丢失答案正确、数据质量的数据一致性是指在数据库中,不同表中存储和使用的同一数据210应当是等价的,表示数据有相等的值和相同的含义答案正确、数据质量的数据相关性是指数据与特定的应用和领域有关211答案正确、数据质量的时效性是指有些数据会随时间而变化的212答案正确、数据质量的可信性由三个因素决定数据来源的权威性、数据的规范性、数据产213生的时间答案正确、数据质量的可解释性,也称为可读性,是指数据被人理解的难易程度答案正确
214、数据处理的大流程步骤中的一个大体流向图,就是()、数据清理2154A、数据集成、数据变换B C、数据归约答案ABCDD、由于操作员重复录入,并发处理等不规范的操作,导致产生不完整,不准确的,无效的数据216也可以用在数据分析里答案错误、数据的缺失值是指现有数据集中某个或某些属性的值时不完整的217答案正确、处理空缺值的基本方法有种,包括忽略元组、人工填写空缺值、使用全局常量2186替换空缺值、使用属性的中心度量填充空缺值、使用与给定元组属同一类的所有样本的平均值来填充空缺值、使用最可能的值填充空缺值答案正确、若一条记录中有多个属性值被遗漏了,则可将该记录排除在数据挖掘之外答案219正确、噪声数据是指一个测量变量中的随机错误或偏差答案正确
22013、商品数据一般包括()A、商品分类、商品价格、商品展示B C、商品评价答案ABCD、采集交易数据主要是为了通过数据分析评估客户价值,将潜在客户变为价值客户14答案正确、评价数据主要以图片的形式出现15答案错误、新闻网站有()
16、腾讯网、百度贴吧A B、凤凰网、博客C D答案、社交网站有()AC
17、腾讯网、百度贴吧A B、凤凰网、博客C D答案、商务数据可用于多种行业()BD
18、制造业、金融业A B、个人娱乐、餐饮行业C D答案ABCD、噪声数据也可以用于数据挖掘进行分析221答案错误、孤立点的是不符合数据模型的数据222答案正确、孤立点并不真实存在,是人们无意中弄出的偏差比较大的数据223答案错误、处理噪声数据可以使用()方法
224、分箱法、回归法A B、聚类、忽略元组C D答案、数据集成是指将互相关联的分布式异构数据源集成到一起,使用户能够以ABC225透明的方式访问这些数据源答案正确、数据集成的方法有()226A、联邦数据库B、中间件集成、数据仓库、聚类C D答案、数据仓库是数据集成最常用的方法ABC227答案正确、数据仓库来集成数据时需要处理的问题包括()
228、实体识别、冗余A B、相关分析、数据冲突和检测C D答案、实体识别,它所解决的问题是如何匹配多个信息源在现实世界中的实体事物ABCD229答案正确、数据规约就是为了压缩数据量,帮助从原有庞大数据集中获得一个精简的数据集230合,并使这一精简数据集保持原有数据集的完整性答案正确、数据规约的策略有()
231、维归约、数量归约A B、数据压缩、实体识别C D答案、主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合ABC232指标答案正确、属性子集选择,主要用于检测并删除不相关、弱相关或冗余的属性目的是找出最小属性集,233使得数据类的概率分布尽可能地接近使用所有属性得到的原分布答案正确、数量规约中有参数的方法一般使用()、回归234A、对数的线性模型、直方图B C、聚类答案D AB、数量规约中无参数的方法一般使用()235A、直方图B、聚类、抽样、数据立方体聚集C D答案、数据变换是将数据转换或统一成易于进行数据挖掘的数据存储形式,使得挖掘过ABCD236程可能更有效答案正确、数据变换的方法有很多种,包括光滑、属性构造、聚集、数据规范化、数据离散237化、概念分层等答案正确、数据规范化包括()
238、最大-最小规范化、零-均值规范化A B、小数定标规范化、数据离散化C D答案、全称为中文名为数据抽取、转换和加载ABC239ETL,Extraction-Transformation-Loading,答案正确
240、安装kettle,必须先安装jdk(java的运行环境)答案正确、安装之后需要配置环境变量才能使用241jdk答案正确
242、ETL是Kettle的一种工具答案错误、()是转换里的基本组成部分它是一个图形化的组件,可以通过配置步骤的参243数,使得它完成相应的功能A、步骤B、跳、注释、转换C D答案、中的()定义了一个单向通道,允许数据从一个步骤向另一个步骤流动A244Kettle、步骤、跳A B、注释、转换C D答案、、文件等都属于文本文件B245csv txt答案正确的数据可分为结构化的表格数据和非结构化的表格数据
246.Excel答案正确
247、Excel是一种()、办公软件、开发软件A B、操作系统软件、数据库C D答案、文件在中可使用()步骤,进行的输入输出A248Excel kettleexcelA、excel输入B、excel输出、输出、输入答案C MicrosoftExcel DMicrosoftExcelABC
249、uMicrosoft Excel输出”步骤则可以设置Excel97文件或Excel2007版本的文件的输出答案正确、输出”步骤,仅能输出版本的文件250“ExcelExcel97答案正确
251、JSON(JavaScript ObjectNotation,JS对象简谱)是一种轻量级的数据交换格式答案正确、核心概念包括()252JSON、数组、对象A B、属性、路径C D答案、表达式通常是用来路径检索或设置的ABC253JsonPath Json答案正确、表达式有两种表示方法,分别是()254JsonPath、点记法、括号记法A B、逗号记法、操作符记法C D答案255XML指可扩展标记语言(ExtensibleMarkupLanguage),XML被设计用来传输和AB存储数据答案正确
256、XPath即为XML路径语言(XML PathLanguage),它是一种用来确定XML文档中某部分位置的语言答案正确、数据库分为关系型数据库和非关系型数据库257答案正确、数据的连接参数与的连接参数是完全相同的258MySQL Oracle答案错误、连接名称是设定一个在作业或转换范围内唯一的名称259答案正确、数据库连接步骤中在列表里可以选择可用的访问方式有()
260、连接、数据源A JDBCB ODBC、数据源D、Oracle的0CI连接C JNDI答案、数据库连接时,一般连接参数包括()ABCD261A、主机名B、数据库名、端口号、用户名和密码C D答案、数据清理,就是试图检测和去除数据集中的噪声数据和无关数据,处理遗漏数据,ABCD262去除空白数据域和知识背景下的白噪声,解决数据的一致性、唯一性问题,从而达到提高数据质量的目的答案正确、只能用单一的清洗步骤清洗工作,所以比较麻烦263Kettle答案错误、常用的转换步骤一般在()
264、转换目录A、脚本目录、校验目录B C、输出目录答案ABCD、字符串做剪切的功能,该步骤需要在剪切字符串版面添加需要剪切的(、字符串字段(输入265A流字段)、输出字段(输出流字段)、剪切的起始位置B C、剪切的结束位置答案ABCDD、字符串替换()步骤对字符串做查找替换266Replace instring答案正确、字符串操作功能包括()
267、首尾去除空白字符、大小写A B、数字移除/提取、删除特殊字符C D答案)ABCD
268、能使用正则表达式的是()A、字符串剪切、字符串替换、字符串操作B C、以上都不行答案D B、拆分字段成多行()可将一行记录拆分成多行记录,新的记录269Split filedto rows里有一个新的字段,由拆分后的子字符串填充答案正确、拆分字段根据分隔符将输入的一个字段拆分成多个字段270Split Fields答案正确、合并字段将多个字段用分隔符连接起来输出到一个新的字段271Concat Fields答案正确、字段选择可以对输入流的字段做选择、删除、重命名等操作,还272Select values可以更改字段的数据类型和精度等答案正确
273、字段选择Selectvalues有3个选项卡A、选择和修改B、移除、元数据、替换C D答案、计算器步骤是一个函数集合来创建新的字段,还可以设置字段是否移除临时字段ABC274答案正确、流查询在查询前把数据都加载到内存中,并且只能进行等值查询275答案正确、过滤记录让数据流从一路到两路276答案正确、重复数据产生原因有
277、录入出错、数据不完整A B、数据缩写、硬件设备出错C D答案、不完全重复数据,客观上表示现实世界中的同一实体,但由于表达方式ABC278不同或拼写错误等原因,导致数据存在了多条重复记录答案正确、“唯一行(哈希值)”步骤可以附加比较存储在内存中的记录值,防止哈希碰撞279冲突答案正确、“唯一行(哈希值)”步骤必须先使用排序,不然无法去重280答案错误、“去除重复记录”步骤要求输入的数据是事先排好序的,因为它是通过比较相邻281记录的值来判断是否重复的答案正确、一个作业包括一个或多个作业项,这些作业项以某种顺序来执行282答案正确、作业的组成包括()283A、作业项B、作业跳、注释、输入C D答案、作业项结果有两个作用,一是决定作业的执行路径,二是向下一个作业项传递一个ABC284结果对象答案正确、作业跳是作业项之间的连接线,定义了作业的执行路径285答案正确、在里,作业是使用一种回溯算法来执行作业里所有作业项的286Kettle答案正确、作业的执行结果是唯一的287答案错误、作业中的变量代表一个任意长度的字符串值288答案正确、变量的格式是${变量名}或者%%变量名%%289答案正确290>读入student,csv文件,输出以Tab分隔符分隔的student,txt文件student,csv文件以逗号为分隔符student.csv要求
1.运行流程图截图和运行结果文件内容截图或
2.书写分析执行步骤答案:解析:291>读入student,xlsx文件,输出分隔符为逗号的student.csv文件和命名为stuout.xlsx的文件student,xlsx要求
1.运行流程图截图、运行结果文件内容截图或
2.书写分析执行步骤>读入文件,输出文件和的文件292“student.js”“JsonToExcel.xlsx”“student-out.js”要求运行流程图截图、运行结果文件内容截图student,js
1.或书写分析执行步骤
2.、商务数据可以监控竞争对手的动态19答案正确、商务数据不同帮助企业和个人共享客户信息20答案错误、商务数据的来源包括()
21、电子商务平台、社交平台A B、数据、个人数据C020D答案、是企业对企业之间通过互联网进行产品、服务及信息的交换ABC22B2B答案正确、是个人对企业开展的电子商务活动23B2C答案错误、下列常用的平台有()24B2CA、阿里巴巴B、京东、唯品会、亚马逊C D答案、常见的平台有()BCD25C2CA、阿里巴巴B、咸鱼、淘宝D、eBayC答案、社交电商指基于社交关系、利用互联网社交媒介实现电子商务中的流量获取、商品BCD26推广和交易等其中一个或多个环节,产生间接或直接交易行为的在线经营活动答案:
293、读入°stringOP.xlsx0文件,输出标准格式MstringOPOut..xlsxM文件klringOp.xlsx原文075520023CITY ZhenIDC3021a/AB CQ-CHONGQINGODESH-shanghaiCD110[CODE0010_「r075542rora CITY1SHEN^CNs3r021—6祥文CHONGQINGSHANGHAIBJ-BeUingSZ-Shen答案:
294、将个人信息.xlsx表中数据Gender字段改为Sex,统一数据为F、M•并去除重狂数据持用一个人信息.xlsx要求
1.运行流程图截图、运行结果文件内容截图或
2.书写分析执行步骤答案:
295、先从Excel谈取数据,保存到Excel,再从文本文件中读取数据保存到Excel,如果产生错误就发送假件,并且停止作业,如果成功发送成功邮件.文本文件输入.ixtExcel输入.xlsx要求1,运行流程图截图、运行结果文件内容截图答案正确、抖音属于社交内容电商27答案正确、社交分享电商主要包括()
28、拼多多、微信A B、蘑菇街、微博C D答案、电商模式是线上()引流线下()消费模式ABD29020Online Offline答案正确、数据主要有电商平台数据和展销平台组成30020020答案正确、数据采集又称数据获取,是利用设备或技术手段从现实环境及网络31获取数据并放入系统内部进行使用答案正确、大多数互联网页编写都是用语言32HTML答案正确、电子商务数据主要归类为()33A、文本B、图片、视频、音频C D答案、配置一种采集任务可以采集多个数据源ABC34答案错误、防采集措施有()
35、封、验证码识别A IPB、登录、不允许打开网页C D答案、常见的采集方法包括爬虫采集和接口采集ABC36web API答案正确、爬虫主要分为通用网络爬虫和聚焦网络爬虫37Web答案正确、通用网络爬虫基本工作流程包含()
38、打开浏览器、抓取网页A B、数据存储、预处理C D答案、调用网站自身提供的应用程序编程接口,可以实现网络数据采集答BCD39案正确、数据的存储方式有()A、Excel
40、、数据库B CSVC、答案D PythonABC、数据采集工具分为编程类和可视化采集工具两类41答案正确、数据采集工具可以针对某个主题从微博爬取相关信息42答案正确、数据采集工具不能爬取学术信息43答案错误、常见的爬虫语言有()
44、、A HTMLBPython、C JavaDPHP答案、是一款服务器端解释性开源非编译脚本语言BCD45Python答案正确、数据采集器是进行数据采集的机器或者工具46答案正确、数据采集器建立的任务也称之为规则47答案正确、数据采集器采集不同字段时,建立一种规则就可以了48答案错误、数据采集器不能采集以下哪种数据()49A、图片B、文字、网站信息、专利C D答案、哪种不是数据采集器D50A、Python爬虫B、八爪鱼采集器、火车头采集器、后羿采集器C D答案、简易采集模式是利用系统内置模板进行数据采集的模式答案正确A
51、简易采集可根据不同的参数进行不同程度的自定义采集答案正确、简5253易采集模板所有用户都可以使用答案错误、单页采集只能采集列表数据54答案错误、表格数据采集要先选中表格中的一行数据55答案正确、单网页采集主要是采集一个网页中的数据56答案正确、列表详情页数据采集比单网页数据采集复杂57答案正确、列表详情页需要从每个商品的标题进入到商品的详情页58答案正确、采集列表详情页数据不需要循环步骤59答案错误、单个网页上有很多相同链接,点击链接后进入60,再进行详情页数据采集,答案详情页*
619、当配置好任务,进行数据采集是,即用自己的本地电脑进行数据采集答案启动本地采集*
629、如果想使用云服务集群进行采集,可以选择答案启动云采集
9、数据导出可以导出的文件类型为()A、Excel
63、B csvHTML、数据表答案D MySqlABCD、文本循环是通过输入关键字采集跟关键字相关的数据64答案正确、循环是通过使用多个地址进行数据采集65URL URL答案正确、循环采集包括()66A、URL循环B、文本循环、单个元素循环、随机循环C D答案、采集京东商品详情页数据,字段可任意ABC67要求叙述采集步骤或使用采集器采集数据截图答案解析、分页循环采集是指把一页数据分成多页进行采集68答案错误、网址中有多个页面需要采集叫分页循环采集69答案正确、点击页面上的“下一页”按钮翻页,是最常见的翻页方式70答案正确、需要登录时就不能进行采集71答案错误。
个人认证
优秀文档
获得点赞 0