还剩14页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
第讲特征数及抽样方法41一.两种抽样方法(-)简单随机抽样概念一般地,从元素个数为的总体中逐个不放回地抽取容量为〃的样本,如果每一次抽取时总体中的各个
1.N个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样..最常用的简单随机抽样的方法抽签法和随机数法
2.适用范围是总体中的个体性质,相似,无明显层次;总体容量较小,尤其是样本容量较小.3
(二)分层抽样概念当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样、将
1.总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样..应用范围是总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.
2.特征等比例抽样3二.频率分布直方图(表)频率分布直方图基础概念
1.频率
①纵轴表示组距,
②频率数据落在各小组内的频率用各长长方形的面积表示
③各小长方形的面积总和等于
1.
④分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体的分布规律..频率分布直方图的步骤如下2(i)求极差;(ii)确定组距和组数;(m)将数据分组;(iv)列频率分布表;()画频率分布直方图.频率分布直方图能很,容易地表示大量数据,非常直观地表明分布的形状.v三.茎叶图概念当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即
1.第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推)..两个突出的优点其一是统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得,到,其二是在比2赛时随时记录,方便记录与表示.四.样本的数字特征【答案】A【详解】解从频率分布直方图上可以看出()X=1-
0.06+
0.04=
0.9,()y=50x
0.36+
0.34=35,故选A.(全国高一专题练习)学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为”的样本,其频率分
10.布直方图如图所示,其中支出在[50,60)的同学有30人,则〃的值为()▲肺本【答案】A【详解】由频率分布直方图可知,支出在[50,60)的同学的频率为
0.03xl0=Q3故选A题型三平均数、众数、中位数(全国高一课时练习)下面表格记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位分).已
1.知甲组数据的中位数为乙组数据的平均数为则羽的值分别为()15,
16.8,V甲组912X2427乙组91518y24A.15,18B.14,19C.16,17D.13,10【答案】A【详解】甲组共有个数,其余个数分别为余下一个数为工,将它们按从小到大排列后,第三个数为中位数,549,12,24,27,故中间数必定为且为X15,X
16.8=-+15+18+J+24,解得日8,故选A.(全国)阳澄湖大闸蟹在国内外享誉盛名,某超市从批发商那里购得只大闸蟹,这批大闸蟹的平均重量
2.10000是克.现在某超市员工随机抽取了一个样本容量为的样本,检测得这只大闸蟹的平均重量为克,则100100100X以下说法正确的是()大于等于小于以上都有可能A.X100B.X100C.X100D.【答案】D【详解】解由于样本平均数是一个随机变量,故选D.(吉林长春外国语学校高二开学考试)甲组数据为乙组数据为
3.5,12,16,21,25,37,1,6,14,则甲、乙的平均数、极差及中位数相同的是()18,38,39,极差平均数中位数)都不相同A.B.C.I.【答案】B【详解】—5+12+16+21+25+37116“6=T故甲、乙的平均数相同,1+6+14+18+38+39=O O甲、乙的极差分别为故不同,37-5=32,39-1=38,甲、乙的中位数分别为《^子,且等=故不同,16,故选B.(北京中学高一期中)一组数据的平均数为方差为将这组数据的每个数都乘以〃(〃>())得
4.101到一组新数据,则下列说法正确的是()这组新数据的平均数为]这组新数据的平均数为最A.B.这组新数据的方差为原这组新数据的标准差为C.D.s2【答案】D.【详解】由题可知,这组新数据的平均数为激,故错误;这组新数据的方差为故错误;这组新数据的标准差为四,AB c故正确.D故选D.(山西省长治市第二中学校高一月考)在发生某公共卫生事件期间,我国有关机构规定该事件在一段
5.展现春城昆明的城市形象,2021年6月5日全国30个城市联动举行了“20216015春城之邀---------------粒来自昆明的种子”活动,活动特别准备了万份“神秘”花种盲盒,其中有一种花种的花卉,其植株高度的一个随2机样本的频率分布直方图如图所示,根据这个样本的频率分布直方图,下面结论中不正确的是()频率这种花卉的植株高度超过的估计占A.5OC77225%这种花卉的植株高度低于的估计占B.30cm5%这种花卉的植株高度的平均数估计超过C.45cm这种花卉的植株高度的中位数估计不超过D.45cm【答案】D【详解】对于由频率分布直方图可知,这种花卉的植株高度超过的频率为()所以这种花A,50cm10x
0.010+0,015=
0.25,卉的植株高度超过的估计占所以正确,50cm25%,A对于由频率分布直方图可知,这种花卉的植株高度低于机的频率为所以这种花卉的植株B,30c10x
0.005=
0.05,高度低于的估计占所以正确,30cm5%,B对于这种花卉的植株高度的平均数约为C,所以正确,25x10x
0.005+35x10x
0.0104-45x10x
0.060+55x10x
0.0154-65x10x
0.010=
46.545,C对于因为所以中位数在之D,10x
0.005+10x
0.010=
0.
150.5,10x
0.005+10x
0.010+10x
0.060=
0.
750.5,40-50间,设中位数为工,()解得了所以错误,故选PIO10x
0.005+10x
0.010+^-40x
0.060=
0.5,
45.845,D D(邯山区新思路学本文化辅导学校高一月考)跳水比赛共有名裁判分别给出某选手的原始评分,评定该选
8.7手的成绩时,从个原始评分中去掉个最高分、个最低分,得到个有效评分.个有效评分与个原始评分711557相比,一定不会改变的数字特征是()众数标准差中位数)极差A.B.C.I.【答案】C【详解】从个原始评分去掉个最高分、个最低分,得到个有效评分,7115其平均数、极差、方差都可能会发生改变,不变的数字特征数中位数.故选C.(江苏通州•高一期中)某机构调查了种食品的卡路里含量,结果如下
9.10107,135,138,140,146,175,179,182,191,
195.则这组数据的第25百分位数和中位数分别是()A.138,
160.5B.138,146C.138,175D.135,
160.5【答案】A直接按照百分位数的定义求第百分位数;按中位数的定义求中位数.25【详解】将个数按从小到大排列10107,135,138,140,146,175,179,182,191,195,而10x25%=
2.5,为第3项138;中位数为粤工=16052故选A(宁夏大学附属中学高二月考(文))某次数学检测中,某一题目的得分情况如下:
10.得分(分)01234百分率(%)
37.
08.
66.
028.
220.2其中众数是()分分A.
37.0%B.
20.2%C.0D.4【答案】C【详解】解众数是指一组数据中出现次数最多的数据,根据所给表格的百分率最高的是“0”,可求出众数是
0.故选C.(四川雅安•高二期末(文))某中学有个学生社团,每个社团的人数分别是
11.1070,60,60,50,60,40,40,30,30,10,则这组数据的平均数,众数,中位数的和为()A.165B.160C.150D.170【答案】C【详解】人数分别是则众数为中位数为竺罗=平均数为10,30,30,40,40,50,60,60,60,70,60,45,公10+30+30+40+40+50+60+60+60+70------------------------------------------------------二45,10••・平均数,众数,中位数的和为:60+45+45=
150.故选C.(福建省福州第一中学)福州地铁二号线“福州大学站”的一个安保员,某日将负责的车箱从中午一点开
12.始的十班下车的人数统计如下、、、、、、、、、则这组数据的众数为()36731046768,A.3B.6C.7D.8【答案】B【详解】、、、、、、、、、按从小到大排列、、、、、、、、、3673104676833466677810所以众数为6故选B题型四方差、标准差(全国高二课时练习)有甲、乙两种水稻,测得每种水稻各株的分廉数据,计算出样本均值
1.10(X E(X方差分别为(X11,o(x34由此可以估计()石甲)=乙),甲)=乙)=甲种水稻比乙种水稻分菜整齐A.乙种水稻比甲种水稻分薨整齐B.甲、乙两种水稻分菜整齐程度相同C.甲、乙两种水稻分薨整齐程度不能比较D.【答案】B【详解】解已知样本方差Q(X)=
3.4,Z)(X11乙甲)二由此估计,乙种水稻的方差约为甲种水稻的方差约为
3.4,
11.因为
3.411所以乙种水稻比甲种水稻分薨整齐故选B.(玉林市第十一中学高二月考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所
2.示),则该样本的极差是()12520233312448955577889001147941785A.56B.53C.55D.516【答案】A【详解】由题意,茎叶图中数据最大值为最小值为68,12故极差=68-12=56故选A(全国(文))在五场篮球比赛中,甲、乙两名运动员得分的茎叶图如图所示.下列说法正确的是(
3.甲得分的中位数和极差都比乙大A.甲得分的中位数比乙小,但极差比乙大B.甲得分的中位数和极差都比乙小C.甲得分的中位数比乙大,但极差比乙小D.【答案】B【详解】甲得分依次为、、、、中位数是极差为乙得分依次为、、、、中位数是12103839,10,39-1=38,1122232430,23,极差为则甲得分的中位数比乙小,极差比乙大,故选30-11=19,B.(咸阳百灵学校高一月考)甲、乙两个样本的方差分别为由此反映()
4.4=
6.6,4=
14.31,样本甲的波动比样本乙大样本乙的波动比样本甲大A.B.样本甲和样本乙的波动一样大样本甲和样本乙的波动大小无法确定C.D.【答案】B【详解】解样本方差的大小反应样本的波动情况,样本方差越大,则样本波动越大,反之波动越小,所以此题样本乙的波动比样本甲的波动大.故选B(山西怀仁•高二期末(文))有一组样本数据为,刍,…,由这组数据得到新样本数据,其
5.中弘,为,为,…,/,y=%+c(i=l,2,・・・〃)c为非零常数,则()两组样本数据的样本平均数相同两组样本数据的样本中位数数相同A.B.两组样本数据的样本标准差相同两组样本数据的样本极差不同C.D.【答案】C【详解】设样本数据七,%,工3,…,%的样本平均数为元,样本中位数为加,样本标准差为$,根据平均数和标准差的性质可知,样本数据为,%,为,…,%的样本平均数为元+,样本标准差为一根据中位数的概念可知,样本数据%,%,必,…,%的样本中位数为m+J根据极差的概念可知两组样本数据的样本极差相同.故选C(长春市第二十九中学)如果玉,马,与,%的方差是!,则司,的方差为(
6.339,3X3,3%A.9B.3C.-D.63【答案】B【详解】如果王,刍,的方差是:,则的方差为x2,53%,3%,3X3,3%32X1=3,J J故选B.(广东惠州•高一期末)已知有样本数据、、、、则该样本的方差为()
7.24568,A.5B.4C.2D.0【答案】B2+4+5+6+8解平均数为5【详解】胡士至4,(2-5)2+(4-5)2+(5-5)2+(6-5)2+(8-5)2该样本的万差为------L=
4.』~~---------------------------』~~------------------------------------』~~---------------------------------』~~------------------------------------故选B.
8.(浙江台州•高一期末)若数据为,%2,,%的方差为2,贝IJ2%-3,2%2-3,…,2七7-3的方差为()A.1B.2C.4D.8【答案】D【详解】解因为数据为》2,,王的方差为2,所以王—々一的方差为23,23,…,2%—32X2=
8.故选D.
9.(云南昆明•高二期末(文))设一组样本数据4马,,%的方差为1,则数据%+6,9+6,,乙+6的方差为()A.36B.7C.6D.1【答案】D【详解】解设4工2,,Z的平均数为即I=-(%+%,+…+X〃),则n数据x\+6,z+6,,乙+6的平均数x=x+6,1___—[(%1-+(X一---------F(X—X)2]=12/zn所以数据X1+6,w+6,,当+6的方差为I___s~—―[%+6—x—6-+%2+6—x—6~+…+Q”+6—x—6~]n=—[(玉—x)2+(工-x)2H i-(x—xy]=1,2nn故选D
10.(湖南天心•长郡中学高二期末)已知数据知与,^ooo的方差为4,若凹=2%(,=12,2020,2A.2B.4C.8D.16则新数据X,)%,,乂000的方差为()【答案】D【详解】解:由题意可得”八八1(王一%)_%)2]=4,2002+(%2_%)2+…+(%2000因为凹=2%,=1,2,……,2020,所以y=2x,所以新数据X,%,的方差为,%000]———斤为;-丁-丁]Ky+%-y+…+%000ZUUU九产+『][2%j-22X2-2x2HH2X2000-2x2000诋^西―X2[4+4%2_%2+…+4%2000-%21一——1一幻=42000K3X2+%2-%2+・・,+%2000—%2]=4x4=16,故选D(全国高一期末)已知五个数据筋的平均数是则该样本标准差为()
11.3,4,6,7X,A.1B.V2C.73D.2【答案】B【详解】解因为五个数据的平均数是筋3,4,x,6,7所以X=:3+4+X+6+7,解得X=5,所以标准差为s=JJ(3—5)2+(4—5)2+(5-5)2+(6—5)2+(7-5)2=72,故选B(山西)数据玉,%,,%的平均数为标准差为则数据々+的方
12.4,2,3%+2,32,,3%+2差和平均数分别为()A.36,14B.14,36C.12,19D.4,12【答案】A【详解】数据玉,/的平均数为标准差为所以数据花,%,…,%的方差为平均数为.根据方x,4,2,4,42差和平均数的性质可得M+2,3%+2,…,3%+2的方差为4=36,平均数为3x4+2=
14.32x故选:A.
13.(广州大学附属中学高二开学考试)若数据X,%…,工〃的平均数为4,标准差为1,则3%+5,3%+5,…,的平均数和标准差分别为()3%+5A.4,1B.17,8C.17,9D.17,3【答案】D【详解】解:西,/,…,〃的平均数为元,方差为标准差为X•・.3尤1+5,3々+5,…,3七7+5的平均数为3元+5,即为
17.方差s2=L[(3玉+5—35—5)2+・・・+(3玉+5—35—5)2]玉_元)(七_元)952=9,n=-x321(2+・・・+2]=L-/.标准差s=3s=
3.故选D.具体数字算法频率分布直方图(表)特征数众数次数出现最多的数字频率最大或最高组的中间值中位数频率等于时的横坐标
0.5样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数平均数所有数字之和除以总个数每个小矩形面积乘以小矩形底边中点的横坐标之和方差222S=_[X1_X+%2_X2+,+_X]n平均数反映了数据取值的平均水平,标准差、方差描述了一组数据波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定题型一两种抽样法(石嘴山市第三中学高二月考)下列说法正确的个数是().
1.
②总体的个体数不多时宜用简单随机抽样法;
②在对总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
③西货商场的抽奖活动是抽签法;
④整个抽样过程中,每个个体被抽取的机率相等(有剔除时例外).A.1B.2C.3D.4【答案】B【详解】解对于
①,总体的个体数不多时宜用简单随机抽样法,命题正确;对于
②,系统抽样在总体均分以后的第一部分进行抽样时,采用的是简单随机抽样,,
②错误;对于
③,百货商场的抽奖活动是抽签法,也叫抓阉,命题正确;对于
④,系统抽样的整个抽样过程中,每个个体被抽取的概率相等(有剔除时概率也相等),
④错误;综上,正确的命题有个.2故选B.(全国高一课时练习)关于简单随机抽样,下列说法中正确的是()
2.
①它要求被抽取样本的总体的个数有限;
②它是从总体中逐个地进行抽取;
③它是一种不放回抽样;
④它是一种等可能性抽样.A.
①②③④B.
③④C.
①②③D.
①③④【答案】A【详解】
①简单随机抽样中被抽取样本的总体的个数有限,正确;
②简单随机抽样是从总体中逐个地进行抽取,正确;
③简单随机抽样是一种不放回抽样,正确;
④简单随机抽样是一种等可能抽样,即每个个体被抽取的可能性相等,正确.故答案为
①②③④.故选A.(广州大学附属中学高二月考)某工厂利用随机数表对生产的个零件进行抽样测试,先将个零件进行
3.505066674037146405711105650995866876832037905716031163149084452175738805905223594310编号,编号分别为…,从中抽取个样本,下面提供随机数表的第行到第行01,02,50,512A.10B.05C.09D.20若从表中第行第列开始向右依次读取数据,则得到的第个样本编号是()194【答案】C【详解】依题意,读取的第一个数为向右每两位读取数据,依次为14,64,05,71,11,05,65,09,其中不在编号范围内,舍去,而后一个与前一个重复,应舍去后一个读取符合要求的两位数64,71,65050505,据依次为则刚好是第四个符合要求的编号,所以得到的第个样本编号是14,05,11,09,
09409.故选C(大同市平城中学校高一月考)我国古代数学名著《九章算术》有一抽样问题“今有某地北面若干人,西面
4.有人,南面有人,这三面要征调人,而北面共征调人(用分层简单抽样的方法),则北面共有74886912300108A.8000B.8100C.8200D.8300【答案】R多少人()【详解】解设北面人数为心根据题意知,x_108x+7488+6912-300解得%=8100,所以北面共有人.8100故选B(陕西省黄陵县中学高一月考)某校高二年级有男生人,女生人,为了解该年级学生的体育达
5.600500标情况,从男生中任意抽取人,从女生中任意抽取人进行调查.这种抽样方法是()3025系统抽样法抽签法A.B.随机数法分层抽样法C.D.【答案】D【详解】・••所要研究的对象是男生和女生,要了解该年级学生的体育达标情况,而男生和女生的体育达标情况有比较大的差异性,・•・抽取样本的时候应该选择分层抽样,总体是由男生和女生组成,比例为600500=65,故抽取的比例也是
65.故选D(渭南市尚德中学高一月考)甲、乙两套设备生产的同类型产品共件,采用分层抽样的方法从中抽取
6.4800一个容量为的样本进行质量检测.若样本中有件产品由甲设备生产,则乙设备生产的产品总数为()件.8050A.1800B.1600C.1900D.1000【答案】A【详解】解样本容量为80,・•・抽取的比例为鲁=占,480060又样本中有件产品由甲设备生产,,样本中件产品由乙设备生产,5030,乙设备生产的产品总数为30x60=
1800.故选A.(崇仁县第二中学(文))某校选修乒乓球课程的学生中,高一年级有名,高二年级有名,现用分层抽
7.5030样的方法在这名学生中抽取一个样本,已知在高一年级的学生中抽取了名,则在高二年级的学生中应抽8010取的人数为()A.6B.8C.10D.12【答案】A【详解】设样本容量为N,则()解得沪NxU=l,16,8030所以高二所抽人数为16x=
6.80故选A(黑龙江让胡路•大庆中学)从一个容量为〃()的总体中抽取一个容量为的样本,当选取简单
8.2m3,mwN3随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是:,则选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是(所以及格率是80%.故选D.(河南商丘•)某校高三年级共有名学生选修地理,某次考试地理成绩均在分之间,分数统
8.60060〜90计后绘成频率分布直方图,如图所示,则成绩在[70,85)分的学生人数为()【答案】A厮或C【详解】成绩在[78,85)分内的频率为5x(
0.04+
0.06+
0.05)=
0.75,所以成绩在[78,85)分的学生人数为600x
0.75=
450.故选C(陕西铜川•高一期末)某班名学生在一次百米测试中,成绩全部不小于秒且小于秒,将测试结果
9.501319按如下方式分成六组第一组,成绩大于等于秒且小于秒;第二组,成绩大于等于秒且小于秒;…;13141415第六组,成绩大于等于秒且小于秒,如图是按上述分组方法得到的频率分布直方图,设成绩小于秒的181917学生人数占全班总人数的百分比为%,成绩大于等于秒且小于秒的学生人数为了,则从频率分布直方图1517中可分析出和的值分别是()X yB.90%,45A.90%,35C.10%,35D.10%,45。
个人认证
优秀文档
获得点赞 0