还剩1页未读,继续阅读
文本内容:
计算机专业认知实习报告学号:姓名凌红康专业班级计科102学院电子信息学院2010年6月相对于结构化数据而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML.HTML、各类报表、图像和音频/视频信息等等字段可根据需要扩充,即字段数目不定,可称为半结构化数据,例如Exchange存储的数据在信息社会,信息可以划分为两大类一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号;而另一类信息无法用数字或统一的结构表示,如文本、图像、声音、网页等,我们称之为非结构化数据结构化数据属于非结构化数据,是非结构化数据的特例随着网络技术的发展,特别是Internet和Intranet技术的飞快发展,使得非结构化数据的数量日趋增大这时,主要用于管理结构化数据的关系数据库的局限性暴露地越来越明显因而,数据库技术相应地进入了“后关系数据库时代”,发展进入基于网络应用的非结构化数据库时代所谓非结构化数据库,是指数据库的变长纪录由若干不可重复和可重复的字段组成,而每个字段又可由若干不可重复和可重复的子字段组成
1.在这次的实习里,我们主要学习半结构化数据的建模技术,即XML我们学习了
2.XML的介绍认识的表示语言,XML的特色和它的应用;
3.XML的基础知识如XML是一种数据描述技术;
4.XML的相关技术如XSL和CSS;
5.XML的数据源对象;XML的文档对象模型有DOM技术数据挖掘Data Mining旨在从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识还有很多和这一术语相近似的术语,如从数据库中发现知识KDD、数据分析、数据融合Data Fusion以及决策支持等数据挖掘的任务主要是关联分析、聚类分析、分类、预测、时序模式和偏差分析等
1.关联分析associatio.analysis:两个或两个以上变量的取值之间存在的规律性称为关联数据关联是数据库中存在的一类重要的、可被发现的知识
2.聚类分析clustering:聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异
3.分类classification:分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示分类是利用训练数据集通过一定的算法而求得分类规则分类可被用于规则描述和预测
4.预测predication:预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测
5.时序模式time-serie,pattern:时序模式是指通过时间序列搜索出的重复发生概率较高的模式与回归一样,它也是用己知的数据预测未来的值,但这些数据的区别是变量所处时间的不同
6.偏差分析deviation:在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的偏差检验的基本方法就是寻找观察结果与参照之间的差别数据挖掘常的基本技术
1.统计学
2.聚类分析和模式识别聚类分析主要是根据事物的特征对其进行聚类或分类,即所谓物以类聚,以期从中发现规律和典型模式近些年来模糊聚类和神经网络聚类方法也有了长足的发展
3.决策树分类技术
4.人工神经网络和遗传基因算法
5.规则归纳
6.可视化技术数据挖掘的过程可以分为6个步骤1理解业务2理解数据3准备数据4建模5模型评估6模型部署本次学习数据挖掘主要学习了1,数据挖掘的发展简述数据的丰富与知识的贫乏,从数据到知识和数据挖掘的产生2,数据挖掘的基本知识数据挖掘的定义,数据挖掘的深入
3.数据挖掘的功能概念描述定性与对比,关联分析,分类与预测,聚类分析,异类分析及演化分析
4.数据预处理
5.关联挖掘关联规则挖掘和单维布尔联规则挖掘,空间数据库的概述与总结这次学习了L空间数据库的概述空间数据库的重要性空间数据库的组成,空间数据库管理系统的实现
2.数据库的特点数据库的复杂性,数据库处理的多样性及大量的数据3,空间数据库的设计空间数据库设计过程,空间数据库的数据模型设计,空间数据库设计的原则、步骤、技术方法
4.空间数据库库的实现与维护空间数据库的实现,相关的其他设计如安全性,完整性等,空间数据库的运行与维护
5.数据库的数据模型GIS数据库及其管理基于关系型数据库和文件系统的管理方法,以关系型数据库为核心的引入面向对象机制,建立全新的面向对象的数据库管理系统GIS空间分析
1.空间分析的概念定义及重要性
2.空间分析的主要内容空间位置,空间分布,空间形态,空间距离,空间关系,
3.基本空间分析技术空间查询与量算,缓冲区分析,叠置分析,网络分析,空间插值,空间统计分析,数字高程模型与数字地形分析
4.空间数据库的发展面向对象模型的应用,多媒体技术拓宽了地理空间数据库系统的应用领域,虚拟现实技术促进了地理空间数据库的可视化,分布式处理和Client/Server模式的应用,使地理空间数据库具有与Internet/Intranet的连接能力,实现分布式事物处理、透明存取、跨平台应用、异构网互联、多协议自动转换等面向对象的数据库应用系统的概述与总结
1.概述面向对象分析,面向对象设计,面向对象程序设计,面向对象测试,00A概论,00D概论,面向对象测试概论,UML引论,
2.使用案例分析使用案例,使用案例图
3.静态建模认定对象与类,确认对象关系,模型的完善,
4.动态建模建模步骤,序列图的使用,状态图的使用,协作图的使用,动作图的使用,
5.系统框架建模逻辑框架设计,物理框架设计,
6.使用UML的软件过程CMM软件成熟度标准,RUP开发周期,软件架构
7.面向对象设计案例分析交互式图形编辑系统:用于创建、编辑、浏览图形,图形由直线、矩形、椭圆和文本组成,约束条件提供可视化编辑手段,可浏览多个图形,不考虑图形的保存和装入,需求分析,系统分析,系统建模,系统实现.实时数据库技术
1.实时应用的数据处理
2.实时数据库简介实时数据库系统定义,实时系统的主要特性及时性、可预测性和可靠性等,实时数据库与传统数据库,实时数据库与其它高级数据库的联系,3•实时数据库的特征RTDB的数据特征,RTDB的事务特征,
4.实时数据库管理系统实时数据库系统的主要问题,实时数据库系统结构,实时数据库执行模型,
5.实时事务模型实时事务的建模特性,实时事务的分类,实时事务的特性,实时事务模型,嵌套实时事务模型,
6.实时事务调度与并发控制实时事务调度,实时事务的并发控制,
7.实时数据库应用国内外实时数据库的发展现状,实时数据库系统在企业信息化的应用,基于实时数据库的高级数据应用技术通过本次的认知学习,我学习了半结构化数据建模XML的相关知识,基于数据库的数据挖掘,空间数据库及实时数据库,还有面向对象的的数据库应用系统开发的知识这次学习让我体会到数据库技术的复杂和深奥,数据库是一项包含了大量知识的一门学科,所以说我们如果想精通数据库,需要有明确的学习目标我个人的目标是在接下来的一年里要抽出一定的时间与精力来学习数据库,主要是本次认知实习的内容在接下来的几周我计划第一周学习XML和数据挖掘,进行实践的训练,多读这方面的书籍,加深理解,以达到自己学习的目标基本了解并能掌握基本的知识第二周及还剩余的时间我计划学习空间数据库,面向对象数据库及实时数据库的知识,不过重点放在面向对象数据库的学习,可能以后工作最可能用到的就是面向对象数据库的知识,毕竟它已经在企业的应用还是比较多的这部分知识更新颖对我来说,也是我比较感兴趣的。
个人认证
优秀文档
获得点赞 0