还剩9页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
data试题及答案
一、单项选择题(共30题,每题1分,共30分)(注每题只有一个正确答案,将正确答案的字母填在括号内)
1.1数据基础概念下列关于“数据”的描述,正确的是()A.数据是信息的载体,信息是数据的内涵B.数据只能是数字形式,不能是文本或图像C.数据的价值不随时间变化D.原始数据一定是有意义的信息
1.2数据类型与特征下列数据中,属于结构化数据的是()A.社交媒体评论B.订单记录表格C.医疗影像D.录音文件
1.3数据处理基础数据预处理中,“处理缺失值”的常见方法不包括()A.删除记录B.均值填充C.数据标准化D.插值法
1.4数据库基础在关系型数据库中,“主键”的主要作用是()A.提高查询速度B.唯一标识一条记录第1页共11页C.存储重复数据D.允许字段值为空
1.5数据分析方法下列分析方法中,属于描述性分析的是()A.预测用户流失率B.统计各产品的销售占比C.建立客户分群模型D.分析影响销售额的因素
1.6数据安全与隐私下列措施中,属于数据加密技术的是()A.数据脱敏B.数据备份C.防火墙防护D.访问权限控制
1.7大数据技术“大数据”的4V特征中,“Volume”指的是()A.数据价值密度低B.数据规模大C.数据处理速度快D.数据类型多样
1.8数据可视化适合展示“某地区各季度销售额变化趋势”的图表类型是()A.饼图B.折线图C.柱状图第2页共11页D.散点图
1.9数据仓库与数据湖数据仓库的核心特点是()A.实时处理海量数据B.面向分析,集成历史数据C.存储非结构化数据D.支持高并发查询
1.10机器学习基础下列算法中,属于监督学习的是()A.K-means聚类B.线性回归C.主成分分析(PCA)D.Apriori关联规则
1.11数据质量评估数据质量的“完整性”指标关注的是()A.数据是否准确反映实际情况B.数据是否包含所有必要字段C.数据是否在合理时间内更新D.数据是否无重复或冗余
1.12数据生命周期数据从产生到销毁的完整流程称为()A.数据清洗B.数据治理C.数据生命周期管理D.数据建模第3页共11页
1.13云计算与数据存储下列存储模式中,属于“云存储”的是()A.本地服务器硬盘B.云盘(如百度云、阿里云盘)C.U盘D.移动硬盘
1.14数据伦理“数据偏见”可能导致的问题是()A.数据存储效率降低B.算法决策不公平C.数据处理速度变慢D.数据备份失败
1.15数据标准与规范“数据元”是指()A.数据的存储格式B.最小的数据单元(如一个字段)C.数据的访问权限D.数据的加密方式
1.16数据集成技术下列工具中,常用于数据集成的是()A.Python PandasB.TableauC.HadoopD.Spark
1.17数据挖掘目标第4页共11页“发现数据中隐藏的关联规则”属于数据挖掘的()目标A.分类B.聚类C.关联分析D.预测
1.18数据备份策略“每周全量备份+每日增量备份”属于()备份策略A.定时备份B.差异备份C.混合备份D.实时备份
1.19数据建模方法下列模型中,属于“预测型模型”的是()A.用户画像B.销售预测模型C.客户分群模型D.产品推荐模型
1.20数据质量问题处理发现数据中存在“异常值”时,首要处理步骤是()A.直接删除异常值B.分析异常值产生原因C.用均值替换异常值D.标记异常值后忽略
1.21数据安全法规第5页共11页《网络安全法》中,“关键信息基础设施”的数据安全保护要求属于()A.强制性要求B.推荐性要求C.行业自律要求D.自愿性要求
1.22数据可视化工具下列工具中,属于开源数据可视化平台的是()A.Power BIB.TableauC.EChartsD.Qlik Sense
1.23数据量单位1TB等于()GBA.1000B.1024C.1024×1024D.1000×
10001.24数据仓库设计星型模型的特点是()A.包含多个事实表和一个维度表B.以事实表为中心,周围连接维度表C.所有表通过外键直接关联D.适合实时查询场景
1.25数据清洗步骤第6页共11页数据清洗的正确流程是()A.处理缺失值→处理异常值→处理重复值→数据标准化B.处理异常值→处理缺失值→处理重复值→数据标准化C.处理重复值→处理缺失值→处理异常值→数据标准化D.数据标准化→处理缺失值→处理异常值→处理重复值
1.26数据隐私保护“对个人敏感信息进行脱敏处理”的目的是()A.提高数据存储效率B.确保数据不可访问C.保护个人隐私安全D.加快数据处理速度
1.27数据类型转换将“字符串型日期”转换为“日期型”属于数据预处理中的()操作A.数据清洗B.数据集成C.数据转换D.数据归约
1.28数据共享原则数据共享时需遵循的核心原则是()A.完全开放共享B.最小必要共享C.优先内部共享D.按数据价值高低共享
1.29数据价值评估第7页共11页“数据的价值取决于其对业务决策的支持程度”体现了数据的()特征A.时效性B.有用性C.可变性D.可加工性
1.30数据科学流程数据科学项目的第一步是()A.数据建模B.数据收集C.需求分析D.数据清洗
二、多项选择题(共20题,每题2分,共40分)(注每题有多个正确答案,多选、少选、错选均不得分,将正确答案的字母填在括号内)
2.1数据特征与分类下列属于非结构化数据的有()A.文本文件(如Word文档)B.图像(如JPG、PNG)C.关系型数据库表D.音频文件E.视频文件
2.2数据处理技术数据预处理中,“数据转换”的常用方法有()A.归一化第8页共11页B.标准化C.数据分组D.数据采样E.数据编码
2.3数据库类型下列数据库中,属于关系型数据库的有()A.MySQLB.MongoDBC.OracleD.SQL ServerE.Redis
2.4大数据技术框架Hadoop生态系统包含的组件有()A.HDFS(分布式存储)B.MapReduce(分布式计算)C.Spark(内存计算)D.Hive(数据仓库工具)E.Kafka(消息队列)
2.5数据可视化类型适合展示“各产品销售额占比”的图表类型有()A.饼图B.环形图C.堆叠柱状图D.折线图E.雷达图第9页共11页
2.6机器学习算法属于无监督学习的算法有()A.决策树B.聚类算法(如DBSCAN)C.神经网络D.主成分分析(PCA)E.K-means
2.7数据安全威胁常见的数据安全威胁包括()A.黑客攻击B.数据泄露C.数据篡改D.拒绝服务攻击(DoS)E.数据备份失败
2.8数据治理内容数据治理的核心内容包括()A.数据标准制定B.数据质量管理C.数据安全管理D.数据生命周期管理E.数据可视化
2.9数据生命周期阶段数据生命周期的主要阶段有()A.数据产生与采集B.数据存储与组织第10页共11页C.数据处理与分析D.数据共享与应用E.数据归档与销毁
2.10数据仓库应用数据仓库的典型应用场景有()A.企业报表统计B.实时交易处理C.历史数据分析D.客户画像构建E.业务流程监控
2.11数据质量维度数据质量的核心维度包括()A.准确性B.完整性C.一致性D.及时性E.唯一性第11页共11页。
个人认证
优秀文档
获得点赞 0