还剩4页未读,继续阅读
文本内容:
第一章数据仓库与数据挖掘概述无习题第二章数据仓库概述一.判断题在分析型处理产生后,数据处理的环境由原来的以单一数据库为中心的数据环境发展为以数据仓库为基础的体系化环境在事务型(操作型)数据处理下,数据处理的环境主要是以单一数据库为中心的数据环境数据仓库是为构建分析型数据处理环境而出现的一种数据存储和组织技术.面向应用,是数据仓库区别于传统的操作型数据库的关键特征一个数据仓库是通过集成多个异种数据源来构造的由于在数据仓库中只进行数据的初始装载和查询操作,所以,数据一旦进入数据仓库,就是稳定的,基本上不会被更新数据立方体必须是维的3在数据仓库中,概念分层定义了一个映射序列,可以将低层概念映射到更一般的高层概念方体的格,是在单个维上定义的映射序列,可以将低层概念映射到更一般的高层概念雪花模型通过在每个维表基础上,增加附加维表的方式来降低星型模型中可能会存在的冗余现象在事实星座模型中,有且仅能有一个事实表在数据仓库的设计过程中,要坚持“数据驱动和需求驱动双驱动,且以需求驱动为中心”的原则二.单选题在以下人员中,被誉为“数据仓库之父”的是()(知识点数据仓库的基本概念;易)A.H.lnmon B.E.F.Codd C.Simon D.Pawlak以下关于数据仓库的说法正确的是()(知识点数据仓库的基本概念;难)数据仓库中的数据只能来源于组织内部的操作型数据库A.数据仓库是为应对事务型数据处理的需要而产生的B.数据仓库是面向主题的,这是其区别于操作型数据库的关键特征C.数据仓库必须是面向企业全局的,不能以部门为单位建立数据仓库D.以下哪项不是“信息包图”中的元素?()(知识点数据仓库的三级模型;难)维度维的概念层次及相应层次上的数量A.B.度量方体的格C.D.以下哪项不属于数据仓库的逻辑模型?()(知识点数据仓库的三级模型;中)星型模型雪花模型A.B.度量模型事实星座模型C.D.在数据仓库的设计过程中,下列描述正确的是()(知识点数据仓库的设计;难)数据仓库是“数据驱动+需求驱动”双驱动,但必须以需求驱动为中心A.数据仓库主要面向分析型处理环境,在设计时很难完全明确用户的需求B.数据仓库与数据库一样,其数据主要来自于企业的业务流程C.数据仓库的设计目标是要提高事务处理的性能D.下面哪项关于星型模型的说法是不正确的()(知识点数据仓库的三级模型;难)有一个事实表,且事实表中的属性由指向各个维表的外键和一些相应的度量数据组成A.有一组小的附属表,称为维表,且每维一个维表B.事实表的每个字段都是事实度量字段C.由于每维只能建立一个维表,使得维表中有些信息会产生冗余D.在数据仓库的概念模型中,通过()来实现数据从客观世界到主观认识的映射(知识点数据仓库的三级模型;易)模型信息包图A.E-R B.星型模型雪花模型C.D.四.填空题数据仓库的关键特征有面向()、()、稳定的和()的(知识点数据仓库的基本概念;易)数据仓库的三级模型包括概念模型、()模型和物理模型(知识点数据仓库的三级模型;易)设计数据仓库时,常见的逻辑模型包括()模型、雪花模型和()模型;其中,针对多个数据仓库应用的是()模型(知识点数据仓库的三级模型;中)随着计算机应用的深入,其所执行的数据处理类型也相应的分成事务型数据处理和(其中,)o数据仓库是为迎合()的需要而产生的一种新的数据存储机制(知识点数据仓库的基本概念;中)数据仓库与数据库的设计方法不同,数据库的设计遵循方法,而数据仓库的设计遵循()SDLC方法(知识点数据仓库的设计;中)第三章联机分析处理()OLAP一.判断题是一种多维数据分析技术OLTP是关系型数据库的主要应用OLTP相对于技术的验证性分析过程,数据挖掘技术表现出更高的自动学习能力OLAP的上钻操作是在某一维上从汇总数据深入到细节数据进行观察OLAP二.单选题技术的核心是()(知识点的基本概念;中)OLAP OLAP在线性对用户的快速响应A.B互操作性多维分析C.D.关于和的区别描述,不正确的是()(知识点的基本概念;难)OLAP OLTPOLAP主要面向企业的高层管理人员,用以辅助决策;而主要面向企业的基层管理人员,A.OLAP OLTP用以辅助日常业务与技术不同,需要处理大量相对简单的任务B.OLAP OLTP的特点在于一次性处理的事务量大,但事务内容比较简单且重复率高是以数据C.OLAP D.OLAP仓库为基础的,但其最终数据来源与一样,大都来自底层的数据库系统OLTP
三、填空题常见的的分析方法包括()、切块、钻取和()(知识点的基本概念;中)OLAP o OLAP OLAP的数据组织方式有如下几种、()和()(知识点的基本概念;中)
四、多ROLAP OLAP选题以下哪些属于的常见操作?()(知识点的基本概念;易)OLAP OLAP切片切块钻取旋转A.B CD第四章数据挖掘的基本概念一.单选题某超市研究销售记录数据后发现,买面包的人很大概率也会购买牛奶,这种属于数据挖掘的哪类问题?()(知识点数据挖掘的基本概念;中)关联规则发现聚类A.B.分类孤立点检测C.D.对没有类标签属性的数据集,使用哪种技术可以使得同类数据与其他类数据相分离()(知识点数据挖掘的基本概念;难)关联规则发现聚类A.B.分类孤立点检测C.D.假设现在的数据挖掘任务是识别垃圾邮件的典型特征,通常所使用的数据挖掘功能是()(知识点数据挖掘的基本概念;中)关联分析分类预测A.B.概念描述聚类分析C.D.二.判断题在聚类分析中,类(簇)内的相似性越大,类(簇)间的差别越大,聚类的效果就越好“啤酒与尿布”的案例是聚类分析的典型案例第五章数据预处理一.单选题对于区间按照自然划分的规则,可以划分为()(知识点数据预处理;中)[240,460],3-4-5))A.[200,300,[300,400,[400,500])))B.[300,350,[350,400,[400,450,[450,500])))C.[200,250,[250,300,[300,350,[350,400])D.[200,300,[300,400]已知一组价格数据按照等宽(宽度为)分箱方法对其进行平滑,15,21,24,21,25,4,8,34,28,10可以划分为几个箱子?()(知识点数据预处理;易)A.3B.4C.5D.6假定属性的平均值与标准差分别为和使用规范化,则属性值income$54000$16000,z-score将变换为()(知识点数据预处理;中)$73600A.
0.736B.
0.716C.
1.225D.1在数据归约的如下描述中,错误的是()(知识点数据预处理;难)数据归约技术可以用来得到数据集的归约表示,它小得多,但仍接近保持原数据的完整性A.对归约后的数据集进行挖掘可提高挖掘的效率,并产生相同(或几乎相同)的结果B.用于数据归约的时间可以超过或“抵消”在归约后的数据集上挖掘节省的时间C.维归约可以检测并删除不相关、弱相关或冗余的属性维D.将原始数据进行集成、变换、维度归约、数值归约是在以下哪个步骤进行的?()(知识点数据预处理;中)频繁模式挖掘分类和预测A.B.数据预处理数据流挖掘C.D.二.多选题在现实世界的数据中,元组在某些属性上缺少值是常有的,处理该问题的常用方法包括()(知识点数据预处理;中)忽略元组使用一个全局变量填充空缺值A.B.使用属性的平均值填充空缺值使用最可能的值进行填充C.D.使用与给定元组属同一类的所有样本的平均值E.以下方法中,哪些属于数据规范化的方法?()(知识点数据预处理;难)最大最小规范化小数定标规范化A.B.规则规范化C.3-4-5D.Z-score在维归约方法中,常见的用于属性子集选择的启发式方法有()(知识点数据预处理;难)逐步向前选择逐步向后删除A.B.向前选择和向后删除相结合判定树归纳C.D.三.填空题商务智能的三大支撑技术有()、()和数据挖掘(知识点商务智能的基本概念;易)常见的数据规范化的方法有()、零均值规范化,和((知识点数据预处理;中)第六)o章概念描述特征化和比较一.单选题以下操作中不属于数据概化操作是()(知识点概念描述;中)将维数据立方体聚集为维数据立方体A.n n-1利用进行数据的上卷操作B.OLAP考察任务相关数据中每个属性的不同取值的个数,对数据进行概化操作C.利用最大最小规范化方法,将数据按比例缩放到一个小的特定区间D.什么是()(知识点概念描述;易)A0I面向属性归纳属性相关分析A.B.数据库中的知识发现属性子集选择C.D.以下关于面向属性归纳的描述中,正确的是知识点概念描述;难属性概化阈值是用来控制数据集中属性个数的参数A.在面向属性归纳过程中,绝对不能生成相同的行B.概化关系阈值是用来控制广义元组个数的参数C.面向属性归纳是根据属性与决策任务间的相关性来选择属性的方法D.什么是知识点数据仓库的基本概念;易DW领域知识发现机器学习A.B.数据挖掘数据仓库C.D.对某商场年的销售数据执行面向属性归纳操作后,得到如下数据表设目标集合为“电冰2016箱”,则在数据表基础上可得到如下定量描述规则〃电冰箱〃东北〃华北其中,VX,itemX==\Rightarrow=locationX=]VlocationX=”[t2:]和分别为定量描述规则的权,则,、的值为知识点概念描述;难tl t2t tlt2o;;A.
0.
430.57B.
0.
50.5;;C.
0.
330.67D.
0.
40.6二.多选题常见的度量数据集中趋势的指标有知识点概念描述;中均值中位数A.B.众数四分位数C.D.方差E.三.填空题对某商场年的销售数据执行面向属性归纳操作后,得到如下数据表2002设目标集合为“电视”,则在数据表基础上可得到如下定量描述规则VX,itemX=TV=\Rightarrow=locationX=z/Asia,/[tl]VlocationX=zzEurope[t2:]其中,tl和分别为定量描述规则的权,则二,t2t tlt2=o知识点概念描述;中习题答案【第二章】对;知识点数据仓库的基本概念;易
1.对;知识点数据仓库的基本概念;易
2.对;知识点数据仓库的基本概念;易
3.错;知识点数据仓库的基本概念;中
4.对;知识点数据仓库的基本概念;中
5.对;知识点数据仓库的基本概念;难
6.(错;知识点数据立方体;易)
7.(对;知识点数据立方体;中)
8.(错;知识点数据立方体;难)
9.(对;知识点数据仓库的三级模型;中)
10.(错;知识点数据仓库的三级模型;难)1L(错;知识点数据仓库的基本概念;中)
12.ACDCBCB主题、集成的、反映历史变化(知识点数据仓库的基本概念;易)
1..逻辑模型(知识点数据仓库的三级模型;易)
2.星型、事实星座、事实星座(知识点数据仓库的三级模型;中)
3.分析型数据处理、分析型数据处理(知识点数据仓库的基本概念;中)4(知识点数据仓库的设计;中)
5.CLDS【第三章】(错;知识点的基本概念;易)L OLAP(对;知识点的基本概念;易)
2.OLAP(对;知识点的基本概念;难)
3.OLAP(错;知识点的基本概念;中)
4.OLAPDC常见的的分析方法包括(切片)、切块、钻取和(旋转)(知识点的基本L OLAPo OLAP概念;中)的数据组织方式有如下几种、()和()(知识点的
2.OLAP ROLAPMOLAP HOLAPoOLAP基本概念;中)ABCD【第四章】ABB(对;知识点数据挖掘的基本概念;中)L(错;知识点数据挖掘的基本概念;易)
2.【第五章】A ACCCABCDEABD ABCD商务智能的三大支撑技术有(数据仓库)、()和数据挖掘(知识点商务智能的L OLAP基本概念;易).常见的数据规范化的方法有(最小最大规范化)、零均值规范化,和(小数定标规范化)2(知识点数据预处理;中)o【第六章】D ACDC ABC
0.
40.6。
个人认证
优秀文档
获得点赞 0