还剩14页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
用样本估计总体【考试要求】
1.会用统计图表对总体进行估计2能用数字特征估计总体集中趋势和总体离散程度.【知识梳理】
1.平均数、中位数和众数
(1)平均数X=;(X1+X2I⑵中位数将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的生均数(当数据个数是偶数时).
(3)众数一组数据中出现次数量多的数据(即频数最大值所对应的样本数据).
2.方差和标准差1n_1n_
(1)方差%产或;;一X
2.⑵标准差一尤)
2.【常用结论】巧用三个有关的结论
(1)若即,X2,…,x〃的平均数为1,那么mxz+a,…,/刀/+〃的平均数为〃+〃;
(2)数据为,X2,…,/与数据为=为+,X21=也+,…,Xn=x-\-a的方差相等,即数据经n过平移后方差不变;
(3)若卬M…,X〃的方差为sV那么QX1+/,以2+〃,…,QX+〃的方差为【思考辨析】判断下列结论是否正确(请在括号中打“J”或“义”)
(1)对一组数据来说,平均数和中位数总是非常接近.(X)
(2)方差与标准差具有相同的单位.(X)
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(V)
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(V)【教材改编题】
1.给出一组数据133,5,5,5,下列说法不正确的是()A.这组数据的极差为4B.这组数据的平均数为3C.这组数据的中位数为4答案c解析由茎叶图知,乙小区成绩低的户数少于甲小区,且成绩大多高于甲小区,所以乙小区成绩的平均数大于甲小区.因为乙小区成绩分布比较集中,所以乙小区成绩的方差比甲小区小.
5.某大学共有12000名学生,为了了解学生课外图书阅读量情况,该校随机地从全校学生中抽取1000名,统计他们每年阅读的书籍数量,由此来估计全体学生当年的阅读书籍数量的情况,下列估计中正确的是(注同一组数据用该组区间的中点值作为代表X)A.中位数为6B.众数为10C.平均数为D.该校读书不低于8本的人数约为3600答案c解析由图知,中位数x在[4,8)内,所以X4+XQ—4)=,解得x=,A错误;由图知,众数在[4,8)内,故众数为6,B错误;平均数为4X(2X+6X+10X+14X+18X)=,C正确;由图知,该校读书不低于8本的频率之和为1—X4=,所以该校读书不低于8本的人数约为X12000=4320,D错误.
6.(2022•深圳模拟)若甲组样本数据为,Q,…,x〃(数据各不相同)的平均数为2,方差为4,乙组样本数据3xi+〃,3+小…,的平均数为4,则下列说法不正确的是()A.a的值为一2B.乙组样本数据的方差为36C.两组样本数据的样本中位数一定相同D.两组样本数据的样本极差不同答案c解析由题意可知,3X2+Q=4,故Q=-2,故A正确;乙组样本数据方差为9义4=36,故B正确;设甲组样本数据的中位数为方,则乙组样本数据的中位数为3为一2,所以两组样本数据的样本中位数不一定相同,故C错误;甲组数据的极差为Xmax—尤min,则乙组数据的极差为(3%max—2)—(3犬min—2)=3(Xmax—Xmin),所以两组样本数据的样本极差不同,故D正确.
7.2021年高考某题的第⑴问的得分情况如下:得分(分)02341百分率(%)其中得分的众数是.答案0解析众数是指一组数据中出现次数最多的数据,根据所给表格知,百分率最高的是
0.
8.已知数据为,工2,…,X9的方差为5,则数据3x1+1,3x2+L…,3刈+1的方差为.答案45解析原数据的方差为5,则线性变换后的数据的方差为32义5=
45.
9.自中国进入工业化进程以来,个人的文化水平往往影响或在某种程度上决定了个人的薪酬高低,文化水平较高的人往往收入较高.将个人的文化水平用数字表示,记“没有接受过系统学习或自学的成年人”为最低分25分,“顶级尖端人才”为最高分95分.为了分析A市居民的受教育程度,从A市居民中随机抽取1000人的文化水平数据X,将样本分成小学[25,35),初中[35,45),高中[45,55),专科[55,65),本科[65,75),硕士[75,85),博士[85,95]七组,整理后得到如图所示的频率分布直方图.
(1)求样本数据的众数和中位数(保留一位小数);⑵请估计该市居民的平均文化水平.(同组中的每个数据用该组区间的中点值代替)解
(1)样本数据的众数为竺产=XR[25,65)的频率为+++=,X£[25,75)的频率为++++=所以中位数在区间[65,75)上,中位数为.—.565+10X—=65+^
(2)平均文化水平T=30X+40X+50X+60X+70X+80X+90X=
10.某家水果店的店长为了解本店苹果的日销售情况,记录了近期连续120天苹果的日销售量(单位kg),并绘制频率分布直方图如图.⑴请根据频率分布直方图估计该水果店苹果日销售量的众数、中位数和平均数;(同一组中的数据以这组数据所在区间中点的值作代表)⑵一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能90%地满足顾客的需求(在10天中,大约有9天可以满足顾客的需求).请问每天应该进多少千克苹果?解
(1)由题图可知,区间[80,90)的频率最大,所以众数为85,中位数设为九,则++工-80义=,可得x=平均数为7=65X5+75X+85X+95X+105X+115X5X10=
(2)日销售量[60,100)的频率为,日销售量[60,110)的频率为,故所求的量位于[100,110).由-----------=,得100+=,故每天应该进千克苹果.
11.已知一组数据1,2,a,b,5,8的平均数和中位数均为4,其中小Z£N*,在去掉其中的一个最大数后,该组数据一定不变的是()A.平均数B.众数C.中位数D.标准差答案BATI”-T/16+〃+/解析由题意知,---------------=4,〃=3b=5可得Q+Z=8,又中位数为4,b=3,a—3或{u时,4=5,b=5标准差为芈;众数为5,=4当Qi时,众数为%标准差为很,去掉其中的一个最大数后,数据为1,2,a,b,5,=3,b=3,168当,或时,平均数为华,众数为5,中位数为3,标准差为最b=5[a=5,°3〃=4,163\l6当「(时,平均数为与,众数为4,中位数为4,标准差为=43综上,数据变化前后一定不变的是众数.
12.(
2022.东三省四市联考)某同学掷骰子5次,并记录了每次骰子出现的点数,得出平均数为2,方差为的统计结果,则下列点数中一定不出现的是()A.1B.2c・5D.6答案D解析因为也铲■=,根据方差的计算公式知,方差大于,因此不能出现点数6,(5—2)2Q—2)2因为丁一二,-1—=,(1-2)25-则其余的点数125都有可能出现.
13.小华同学每天晚上睡觉前要求自己背诵15个英文单词,若超出记为“+”,不足记为“一”,则上周一至周五,他的完成情况分别为-2,-1,%,+4,y,已知这五个数据的平均数是0,方差是,则上周一至周五,小华背诵的单词数量的众数和中位数分别是()A.13,14B.-2,-1C.13,13D.-2,-2答案A解析因为-2,-1,x,+4,y这五个数据的平均数是0,方差是,所以有x=-2,x=19解得或「口=11尸一2,不管取哪一组解,这5天的单词量均是以下几个数,13,14,13,19,16,所以众数和中位数分别是13,
14.
14.已知一组数据b,3,5的中位数为7,平均数为8,则乃=.答案135解析因为一组数据m乩3,5的平均数为8,所以(3+b+3+5)=8,解得〃+6=24,若〃=瓦则=6=12,此时4个数为3,5,12,12,显然中位数不是7,不妨设ab,若则匕221,此时4个数排列为3,5,b,中位数为4,不符合题意,若3v〃W5,则19WAV21,此时4个数排列为3,m5,b,显然中位数不是7,若〃5,则4个数排列为3,5,
①b,则中位数为字=7,解得〃=9,则b=15,所以=9X15=
135.
15.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36,36,37,37,40,43,43,44,44,若用样本估计总体,则年龄在(工一5,工+s)内的人数占公司人数的百分比是()(其中7是平均数,s为标准差,结果精确到1%)A.14%B.25%C.56%D.67%答案c_36+36+37+37+40+43+43+44+44解析因为x=-------------------------------------------------------=40,,=(16+16+9+9+0+9+9+16+16)=^^,即s=学,所以年龄在(7一S,T+5),即答,岑)内的人数为5,——5所以年龄在(x—5,x+s)内的人数占公司人数的百分比为§256%.
16.中国独有的文书工具,即笔、墨、纸、砚,有文房四宝之名,起源于南北朝时期.其中宣纸是文房四宝的一种,宣纸“始于唐代,产于泾县”,因唐代泾县隶属宣州管辖,故因地得名宣纸.宣纸按质量等级分为正牌(优等品)、副牌(合格品)、废品三等.某公司生产的宣纸为纯手工制作,年产宣纸10000刀(1刀=100张),该公司按照某种质量指标x给宣纸确定等级如表所示X的范围44,48]U52,56]48,52][0,44]U56,60]质量等级副牌正牌废品在该公司所生产的宣纸中随机抽取了一刀进行检验,得到频率分布直方图如图所示,已知每张正牌宣纸的利润为15元,副牌宣纸的利润为8元,废品的利润为一20元.⑴试估计该公司的年利润;⑵市场上有一种售价为100万元的机器可以改进宣纸的生产工艺,但这种机器的使用寿命为一年,只能提高宣纸的质量,不能增加宣纸的年产量.据调查这种机器生产的宣纸的质量指标x如表所示X的范围x—2,x+2x-6,x+6频率75其中x为质量指标x的平均值,但是由于人们对传统手工工艺的认可,改进后的正牌和副牌宣纸的利润都将下降3元/张,请问该公司是否购买这种机器,请你为公司提出合理建议,并说明理由.(同一组的数据用该组区间的中点值作代表)解⑴由频率分布直方图得,一刀宣纸有正牌100XX4=40(张),有副牌100XX4X2=40(张),有废品100XX4X2=20(张),・•・该公司一刀宣纸的利润的估计值为40X15+40X8—20X20=520(元),••・估计该公司的年利涧为520万元.
(2)由频率分布直方图得,~=42X X4+46X X4+50X X4+54X X4+58X X4=
50.这种机器生产的宣纸的质量指标x如表所示:X的范围48,5244,56频率75・••一刀宣纸中正牌的张数估计为100X7=,废品的张数估计为100义(1—5)=,副牌的张数为100X(5-7)=,,一刀宣纸的利润为
68.27X12+X5—X20=(元),•••公司改进后该公司的利润为
864.14—100=(万元),•・•,••・建议该公司购买这种机器.D.这组数据的众数为5答案B解析这组数据的极差为57=4,A正确;平均数为一一号B错误;中位数为〒=4,C正确;众数为5,D正确.
2.下列说法正确的是()A.众数可以准确地反映出总体的情况B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越小答案C解析对于A,众数体现了样本数据的最大集中点,但对其他数据信息的忽略使得无法客观反映总体特征,所以A错误;对于B,一组数的平均数不可能大于这组数据中的每一个数据,所以B错误;对于C,平均数、众数与中位数从不同的角度描述了一组数据的集中趋势,所以C正确;对于D,方差可以用来衡量一组数据波动的大小,方差越小,数据波动越小,方差越大,数据波动越大,所以D错误.
3.设一组样本数据即,X2,…,X〃的方差为,则数据10X1,10X2,…,10b的方差为()A.B.C.1D.10答案c解析•••样本数据汨,…,%〃的方差为,X2,根据任何一组数据同时扩大几倍,方差将变为平方倍增长,二・数据10X1,10光2,…,10x〃的方差为100X=l.题型一样本的数字特征例1⑴在一次歌咏比赛中,七位裁判为一选手打出的分数如下90,89,90,95,93,94,93,去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为()A.92,B.92,2C.93,2D.93,90+90+93+94+93所以平均数x==
92.答案A解析由题意得所剩数据为90,90,93,94,
93.方差=190-922+90-922+93-922+93-922+94-922]=$2⑵已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为$2,则A.x=4,S22B.x=4,52=2C.x4,52V2D.x4,522答案A解析设7个数为为,,工尤九X7,X2,4,5,6,-di+X2+X3+X4+X5+X6+X7则-----------:~~7—-------------=4,=2,所以为+2+3+4+%5+6+7=28,X X XXXxi—42+%2—42+%3—42+%4—42+%5—42+%6—42+%7—42=14,则这8个数的平均数为x=1XI+X2+X3+X4+X5+^6+X7+4=|X28+4=4,方差为52=/X[xi—42+12—42+%3—42+%4—42+%5—42+%6—42+%7—42+4—42]17=gX14+0=a
2.【教师备选】某高校分配给某中学一个保送名额,该中学进行校内举荐评选,评选条件除了要求该生获得该校“三好学生”称号,还要求学生在近期连续3次大型考试中,每次考试的名次都在全校前5名每次考试无并列名次,现有甲、乙、丙、丁四位同学都获得了“三好学生”称号,四位同学在近期连续3次大型考试名次的数据分别为甲同学平均数为3,众数为2;乙同学中位数为3,众数为3;丙同学众数为3,方差小于3;丁同学平均数为3,方差小于
3.则一定符合推荐要求的同学有A.甲和乙B.乙和丁C.丙和丁D.甲和丁答案D解析对于甲同学,平均数为3,众数为2,则3次考试的成绩的名次为2,2,5,满足要求;对于乙同学,中位数为3,众数为3,可举反例3,3,6,不满足要求;对于丙同学,众数为3,方差小于3,可举特例3,3,6,则平均数为4,方差s2=gx[2X3—4尸+6—4口=23,不满足要求;对于丁同学,平均数为3,方差小于3,设丁同学3次考试的名次分别为汨,如若为,X2,X3中至少有一个大于等于6,则方差52=,J[(X|—3)2+(%2—3)2+(%3—3)2]3,与已知条件矛盾,所以即,X2,13均不大于5,满足要求.思维升华平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其离散程度.跟踪训练1
(1)从某小学随机抽取100名同学,将他们的身高(单位厘米)分布情况汇总如下,身高100,110]110,120]120,130]130,140]140,150]频数535302010由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)()A.B.C.D.答案c解析由题意知身高在(100,110],(110,120],(120,130]内的频率依次为前两组频率和为,组距为10,设中位数为羽则(x—120)Xy^=,解得x7
(2)(2021・新高考全国I改编)有一组样本数据为,及,…,即由这组数据得到新样本数据.竺,其中M=Xj+c(i=l,2,…,叫c为非零常数,贝1」()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差不同答案c解析设样本数据汨,Q,…,儿的平均数、中位数、标准差、极差分别为工,m,t,依题意得,新样本数据yi,”,…,y〃的平均数、中位数、标准差、极差分别为x+c,m+c,t,因为cWO,所以C正确,D不正确.题型二总体集中趋势的估计例2棉花是我国纺织工业重要的原料.新疆作为我国最大的产棉区,对国家棉花产业发展、确保棉粮安全以及促进新疆农民增收、实现乡村振兴战略都具有重要意义.准确掌握棉花质量现状、动态,可以促进棉花产业健康和稳定的发展.在新疆某地收购的一批棉花中随机抽测了100根棉花的纤维长度(单位mm),得到样本的频数分布表如下频数频率纤维长度[0,504[50,1008[100,15010[150,20010[200,25016[250,30040[300,350]12⑴在图中作出样本的频率分布直方图;
(2)根据
(1)中作出的频率分布直方图求这一棉花样本的众数、中位数与平均数,并对这批棉花的众数、中位数和平均数进行估计.解
(1)样本的频率分布直方图如图所示.
(2)由样本的频率分布直方图,」日人叫250+300传众数为2=275(mm);设中位数为羽(x—250)义=50%—48%,解得x=,即中位数为mm;设平均数为工,则~=25X+75X+125X+175X+225X+275X+325X()=222mm,故平均数为222mm.由样本的这些数据,可得购进的这批棉花的众数、中位数和平均数分别约为275mm、mm和222mm.【教师备选】某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在[40,100]内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法不正确的是()A.频率分布直方图中第三组的频数为10B.根据频率分布直方图估计样本的众数为75分C.根据频率分布直方图估计样本的中位数为75分D.根据频率分布直方图估计样本的平均数为75分答案D解析分数在[60,70)内的频率为1-10义(++++)=,所以第三组的频数为100X=10,故A正确;因为众数的估计值是频率分布直方图中最高矩形底边的中点的横坐标,从图中可看出众数的估计值为75分,故B正确;因为++10=,+++X10=,所以中位数位于[70,80内,设中位数为乂则+x—70=,解得x=75,所以中位数的估计值为75分,故C正确;样本平均数的估计值为45X10X+55X10X4-65X10X+75X10X+85X10X+95X10X=73分,故D错误.思维升华频率分布直方图的数字特征1众数最高矩形的底边中点的横坐标.2中位数中位数左边和右边的矩形的面积和应该相等.⑶平均数平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.跟踪训练2首次实施新高考的八省市于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70,[70,90,[90,110,[110,130,[130,150]分组,绘制了如图所示的频率分布直方图.⑴求出图中的值并估计本次考试及格率“及格率”指得分为90分及以上的学生所占比例;⑵估计该校学生联考数学成绩的众数、平均数.解1由频率分布直方图的性质,可得++++X20=1,解得=所以及格率为++X20==66%.2由图可得,众数估计值为100分.平均数估计值为义60+X80+X100+X120+X140=分.题型三总体离散程度的估计例
32021.全国乙卷某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据⑵判断新设备生产产品的该项指标的均值较旧设备是否有显著提高如果y—九则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高.解1由表格中的数据易得x=强义—H+OH------------FO+H—+=,y=4义+++0+++++++=,S仁=X[—+2X—2+—+2X—2+—2+2*一2+—2]=,^=^X[-2+3X-2+-2+2X-2+2X-2+-2]=⑵由⑴中数据可得y—x=—=,而2\J第=/+si=「,显然有y—三R与苗成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.【教师备选】从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表质量指标值分组[75,85[85,95[95,105[105,115[115,125]频数62638228⑴根据上表补全如图所示的频率分布直方图;2估计这种产品质量指标值的平均数及方差同一组中的数据用该组区间的中点值作代表;⑶根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解1补全后的频率分布直方图如图所示.2质量指标值的样本平均数为x=80X+90X+100X+110X+120X=
100.质量指标值的样本方差为-202X+-102X+02X+102X+202X=
104.所以这种产品质量指标值的平均数约为100,方差约为
104.⑶质量指标值不低于95的产品所占比例约为++=由于该估计值小于,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.思维升华总体离散程度的估计标准差方差反映了数据的离散与集中、波动与稳定的程度.标准差方差越大,数据的离散程度越大;标准差方差越小,数据的离散程度越小.跟踪训练
32022.蚌埠质检某校计划在秋季运动会期间开展“运动与健康”知识大赛,为此某班开展了10次模拟测试,以此选拔选手代表班级参赛,下表为甲、乙两名学生的历次模拟测试成绩.场次23456789101甲98949797959393959395乙92949394959496979798甲、乙两名学生测试成绩的平均数分别记作x,y,方差分别记作s3a1求x,y,5,si;⑵以这10次模拟测试成绩及⑴中的结果为参考,请你从甲、乙两名学生中选出一人代表班级参加比赛,并说明你作出选择的理由.一1角星1X=^98+94+97+97+95+93+93+95+93+95=95,—1y=而92+94+93+94+95+94+96+97+97+98=95,5=-^[32+-12+22+22+0+-22+-22+0+-22+0]=3,5=-A[-32+-l2+-22+-l2+0+-l2+12+22+22+32]=2答案一由1可知,x甲、乙两人平均分相同,但甲发挥更稳定,所以可以派甲同学答案二由1可知,甲、乙两人平均分相同,两人成绩的方差差距不大,但从10次代表班级参赛.测试成绩的增减趋势可以发现,甲的成绩总体呈下降趋势,乙的成绩总体呈上升趋势,说明乙的状态越来越好,所以可以派乙同学代表班级参赛.课时精练
1.某机构调查了10种食品的卡路里含量,结果如下107,135,138,140,146,175,179182,191,
195.则这组数据的中位数是A.B.146C.175D.135答案A._,八皿,146+175解析中位数为---------5-----=
2.给定一组数据5,5,4,3,3,3,222』,则这组数据A.众数为2B.平均数为s2121s2222C.方差为D.标准差为4答案c解析由题中数据可得,众数为2和3,故A错误;_5+5++1平均数为t=-----------m----------=3,故B错误;方差?=5—32+5—32+…+2_32+1—32W=,标准差为.W4,故C正确,D错误.
3.若数据由,尤2,…,尤〃的平均数为x,方差为居则43,4工2—3,…,4/3的平均数和汨一一标准差分别为A.x,sB.4x~3,sC.4x—3,4sD.4x—3,yj16s2—24s+9答案c—1解析因为X=-XI+X H-------------2fe1—9—9—=工[汨-\-X—X$2X2+%2-x2-1-------------------2],n所以4x]—3,4Q—3,…,4居一3的平均数为x=^[4xi—3+4%2—3-1----F4工〃—3]3〃]=4x—3,=[4xi+%2H----------------标准差为-x2+X—X2-1---------------FX”-X2]2=4,P=4s.
4.某市为推进垃圾分类工作的实施,开展了“垃圾分类进小区”的评比活动.现对该市甲、乙两个小区进行评比,从中各随机选出20户家庭进行评比打分,每户成绩满分为100分,评分后得到如下茎叶图.通过茎叶图比较甲、乙两个小区成绩的平均数及方差大小A.x xB.x Axs〈私甲v乙,端甲乙,帑C.x xs^sl甲v乙,。
个人认证
优秀文档
获得点赞 0