还剩10页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
第五章数据处理和可视化表达课题数据处理和可视化表达课时4课时本章是必修一第五章的内容,随着移动互联网和物联网的飞速发展,人类社会产生的数据以惊人的速度增长,海量的数据几乎包含了一切形式的数据本章要让同学认识到大数据及其特征,认识大数据对人们日常生活的影教材分析响,了解数据采集、分析和可视化表达的基本方法;学会选用恰当的软件工具或平台处理数据,分析报告;学会利用python的扩展库来解决会考题,理解对数据保护的意义在第五章当中学生已经对python语言已经有了基本的了解,在本章的学习党中除了了解大数据还要学习python的扩展库在本章节的学习当中学情分析要注重培养学生学习的主动性,培养学生自主学习的意识让学生学会选择恰当的学习工具进行学习,建构知识,培养技能,发展思维促进信息技术学科核心素养达成,完成项目学习目标
1.能够理解大数据的4V特征并能举出例子
2.了解数据采集,分析和可视化表达的基本方法教学目标
3.了解python的第三方库的基础知识,学会利用第三方库来做题
4.促进信息技术学科核心素养达成,完成学习目标重点与难重点大数据的4V特征,可视化表达的基本方法,python的扩展库点难点python的扩展库教学方法讲授法、任务驱动法、小组合作法、自主探究法课前准备多媒体课件、教学视频,随堂练习教学设计让学生进行思考你在网站购物时是否出现过类似的事情当你在搜索一导入件物品的时候,购物网站就会给你进行类似商品的推荐和广告的投放从此例子来引入本章内容的学习
3.我们在用python进行数据分析的时候,经常会用到pandas库中的DataFrame,这是类似于的数据结构A一维表格B二维表格C三维表格D四维表格
4.在用python编程对数据进行分析的时候,代码pandas.DataFrame.sum执行的操作是A返回所有列的和B返回所有行的和C返回所有数据中的最大值D返回所有数中最小值
5.利用python程序绘制尸2的x次方尸2%函数图像,则下列程序第五行应该填写的代码是I11000II750/|500/250•二OL,k,r-1234560246•S1Import matplotlib.pyplot as pit2Import numpyas np3x=np.linspace0,10,504Y=2**x56Pit.showA pit.plot x,y Bpit.plot y,xC pit.bar x,y Dpit.boxplot x,y
6.吴老师利用python编写一个程序画出一个一元一次方程的函数图,程序如下所示1import numpyas np2from matplotlibimport pyplot as pit3x=np.arange1,104y=2*x*x+6*xT25pit.titley=2*x*x+6*xT2”6pit.xlablex7pit.ylable“y8pit,plot x,y9pit.show请问程序第5行语句的作用是请问程序第8行语句的作用是如果将第8行pit.plot x,y语句改为pit.bar x,y,则程序执行结果变为绘制图
7.利用python编程处理数据的时候,常常会用到pandas库,其中一维数据结构是series1import random2s=pandas.Series[4,6,7]3print s.sum此程序运行的结果是板书设数据处理和可视化表达计
5.1认识大数据4V特征大量,多样,价值密度低,高速
5.2数据的采集数据采集的方法和工具系统日志采集法、网络数据采集法,其他数据采集法,python的扩展库
5.3数据的分析特征探索、关联分析、聚类与分类、建立模型和模型评价
5.4数据可视化表达方式教学反思任务一认识大数据的概念和特征
1.让同学自行阅读课本P10-P102来了解大数据的概念和特征,阅读完成之后学生进行总结,教师加以补充,在上新课之前所举的购物网站的例子就是应用的大数据
2.让学生4人为小组讨论一下在日常生活中还有哪些应用了大数据?例如移动支付、网约车、高德地图等任务二观看视频总结大数据对日常生活的影响让学生们观看视频《大数据时代,我们无处可逃》然后以小组为单位讨论一下大数据时代对日常生活的影响
(一)正面影响
1.方便支付
2.方便出行
3.方便购物和产品推荐
4.方便看病和诊病
(二)负面影响
1.个人信息泄露
2.信息伤害与诈骗授新课任务三阅读课本了解数据采集的方法和工具让学生自行阅读课本P104-P109了解数据采集的方法和工具以及数据的存储和保护,阅读完成之后学生进行总结任务四学习python网络采集程序使用的扩展库
(一)导入模块的方法
1.import模块名as别名例如import numpyas np
2.from模块名import功能名as别名例如from matplotlibimport pyplot aspit
(二)扩展库
1.NumPy是Python语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库
2.SciPy是一个算法库和工具包
3.Matplotlib:是一个2D绘图库,可以生成绘图、直方图、条形图、散点图
4.NumPy常与SciPy和Matplotlib一起使用import numpyas npimportmatplotlib.pyplotaspitfrom scipyimport optimizex=[l,2,3,4,5,6,7,8]y=[l,1/2,1/3,1/4,1/5,1/6,1/7,1/8]pit.title test#图标名称pit.xlabel X#乂轴的名称pit.ylabel轴的名称pit.scatter x,y#绘制散点图pit.show*Python
3.
8.5Shell*import numpyas npimportmatplotlib.pyplotaspitfrom scipyimport optimizex=[l,2,3,4,5,6,7,8]y=[l,1/2,1/3,1/4,1/5,1/6,1/7,1/8]pit.title test#图标名称pit.xlabel X#x轴的名称pit.ylabel轴的名称pit.plot x,y#绘制曲线图知识点:函数描述Pit.titleO设置图像的标题pit.xlableO设置X轴的名称Pit.ylableO设置y轴的名称pit.show显示图像Pit.plot x,y绘制线性图Pit.scatter x,y绘制散点图pit.showFile EditShell DebugOptions WindowHelp遂,Figure
1.0回今嚏I+Q旦区i|Pit.piex,y绘制饼图Pit.bar x,y绘制柱形图
5.pandas库Pandas库主要用于快速简单的数据操作,聚合和可视化呈现库中有两个主要的数据结构,一维数组Series和二维数组DataFrame结构1Series一维数组import pandas as pdgrade=[47,58,67]gradel=pd.Series[47,58,67]#自动索引print gradeprintgradelRESTART:C:\Users\sy\A]rise,二py[47,58,67]047158267dtype:int642DataFrame二维的表格型数据结构import pandasas pdgrade=[[88,89,92],[77,86,89],[94,99,101]]name二厂张华〃「李明〃/王兴〃]sub=[〃英语〃,〃数学〃,〃语文〃]df=pd.DataFramegrade,name,sub printdf一英语张华学语文李明王兴887794±series求和sum,求平均值mean importpandas912二s pandas.Series[6,8,9]源和print s.sum#print#求平均值s.mean
237.666666666666667DataFrame的行列求和,求平均值import numpyas npimportpandasaspdgrade=[[88,89,92],[77,86,89],[94,99,101]]二厂张华〃,“李明〃,王兴”]name[英语〃,数学,语文”]sub=df=pd.DataFramegrade,name,sub行的求和,df fRow_sum]=df.apply lambda x:x.sum,axis=D#行的平均分,df fRow_mean]=df.apply lambdax:x.mean,axis=l#列的求和・,df.locf Col__sum]=df.apply lambdax:x sum#英语数学语文Row,sum Rowmean
88.
089.
092.
0269.
0134.
5077.
086.
089.
0252.
0126.
0094.
099.
0101.
0294.
0147.00sum
259.
0274.
0282.
0815.
0407.50mean
129.
5137.
0141.
0407.
5203.75华明兴张李王,#列的平均值df.locf Col_mean]=df.applyambdax:x.mean printdf知识点Pandas.DataFrame.sum返回所有列的和Pandas.DataFrame.sumaxis=l返回所有行的和lLococ扩展Random生成随机数的函数库import randomnuml=random.random#返回随机生成的一个实数num2=random.randint0,1#生成一个[0,10]之间的一个整数printnumlprintnum
20.59928666033904086»9»import random选手的随机报名顺序为:[小绿,‘小蓝,小黄‘,小红]stud二厂小黄一小红小蓝〃,〃小绿〃]print〃选手的报名顺序〃,stud random,shuffle stud#打乱选手的报名顺序print〃选手的随机报名顺序为,stud名顺序;[小黄,’小红,‘小蓝‘,‘小绿]»知识点random,random返回随机生成的一个实数Random,randint a,b生成一个[a,b]之间的整数Random.Shuffle打乱排序任务五观看视频了解数据的分析数据的分析一般包括特征探索,关联分析,聚类分类,建立模型和模型评价
1、数据的特征探索对数据进行预处理,发现和处理缺失值、异常数据、绘制直方图、求最大值、最小值、极差
2、关联分析发现大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式
3、聚类分析依据研究对象样品或指标的特征,对其进行分类的方法,减少研究对象的数目任务六阅读课本了解数据的可视化表达的方式,观看视频了解什么是词云图数据、学生1寸支数下人A技术数据「信息疆.信息按:\、,y—‘看盲焉术系约普而二司数据鑫技木柒T及小技术学生词云图是目前常用的关键词可视化数据的表达方式,词云图通常使用文字的大小和颜色来表示关键词出现的频次用python编程进行词云图的制作的顺序为导入文本,分词,特征提取,数据分析,保存词云图总结由学生进行总结,教师进行补充
1.手机导航应用能够实时推荐最快路线,主要体现了大数据的()特征A数据体量巨大B数据类型多C数据变化速度快D价值密度低课堂练习
2.2020年11月1日,正式开始第七次全国人口普查,普查信息除了普查员登记获取之外,还可以通过小程序自主填报后者的数据采集方式是()A实验数据采集B传感器采集C网络爬虫D系统录入。
个人认证
优秀文档
获得点赞 0