(1 )填充频率分布表的空格;
(2 )补全频数直方图;
(3 )在该问题中,总体、个体、样本和样本容量各是什么?
(4 )全体参赛学生中,竞赛成绩落在哪组范围内的人数最多?
(5 )若成绩在90 分以上(不含90 分)为优秀,则该校成绩优秀的约为多少人?题型:解答题难度:中档来源:贵州省竞赛题
解:(1)60.5﹣70.5的人数=50×0.16=8,
90.5﹣100.5的频数为:50﹣4﹣8﹣10﹣16=12,
频率==0.24.填充频数分布表得;
(2)如图:
(3)总体是900名学生的竞赛成绩,个体是一个学生的竞赛成绩,样本是所抽取的50名学生的成绩,样本容量是50.
(4)80.9~90.5之间的频率为0.32,故人数最多.
(5)12 ÷50 ×100% ×900=216(人),故该校成绩优秀学生约为216人.
考点:
考点名称:直方图频数分布直方图的定义:在统计数据时,按照频数分布表,在平面直角坐标系中,横轴标出每个组的端点,纵轴表示频数,每个矩形的高代表对应的频数,称这样的统计图为频数分布直方图。
相关概念:
组数:在统计数据时,我们把数据按照不同的范围分成几个组,分成的组的个数称为组数。
组距:每一组两个端点的差。
频数分布直方图的特点:
①能够显示各组频数分布的情况;
②易于显示各组之间频数的差别。
作直方图的目的有:
作直方图的目的就是通过观察图的形状,判断生产过程是否稳定,预测生产过程的质量。
1判断一批已加工完毕的产品;
搜集有关数据。
直方图将数据根据差异进行分类,特点是明察秋毫地掌握差异。
2在公路工程质量管理中,作直方图的目的有:
①估算可能出现的不合格率;
②考察工序能力估算法
③判断质量分布状态;
④判断施工能力;
a. 抽取的样本数量过小,将会产生较大误差,可信度低,也就失去了统计的意义。因此,样本数不应少于50个。
b. 组数 k 选用不当,k 偏大或偏小,都会造成对分布状态的判断有误。
c. 直方图一般适用于计量值数据,但在某些情况下也适用于计数值数据,这要看绘制直方图的目的而定。
d. 图形不完整,标注不齐全,直方图上应标注:公差范围线、平均值 的位置(点画线表示)不能与公差中心M相混淆;图的右上角标出:N、S、C p或 CPK.
制作频数分布直方图的方法:
①集中和记录数据,求出其最大值和最小值。数据的数量应在100个以上,在数量不多的情况下,至少也应在50个以上。 我们把分成组的个数称为组数,每一个组的两个端点的差称为组距。
②将数据分成若干组,并做好记号。分组的数量在5-12之间较为适宜。
③计算组距的宽度。用最大值和最小值之差去除组数,求出组距的宽度。
④计算各组的界限位。各组的界限位可以从第一组开始依次计算,第一组的下界为最小值减去最小测定单位的一半,第一组的上界为其下界值加上组距。第二组的下界限位为第一组的上界限值,第二组的下界限值加上组距,就是第二组的上界限位,依此类推。
⑤统计各组数据出现频数,作频数分布表。
⑥作直方图。以组距为底长,以频数为高,作各组的矩形图。
应用步骤:
(1)收集数据。作直方图的数据一般应大于50个。
(2)确定数据的极差(R)。用数据的最大值减去最小值 求得。
(3)确定组距(h)。先确定直方图的组数,然后以此组数去除极差,可得直方图每组的宽度,即组距。组数的确定要适当。组数太少,会引起较大计算误差;组数太多,会影响数据分组规律的明显性,且计算工作量加大。
(4)确定各组的界限值。为避免出现数据值与组界限值重合而造成频数据计算困难,组的界限值单位应取最小测量单位的1/2。分组时应把数据表中最大值和最小值包括在内。
第一组下限值为:最小值-0.5;
第一组上限值为:第一组下限值加组距;
第二组下限值就是第一组的上限值;
第二组上限值就是第二组的下限值加组距;
第三组以后,依此类推定出各组的组界。
(5)编制频数分布表。把多个组上下界限值分别填入频数分布表内,并把数据表中的各个数据列入相应的组,统计各组频数据(f )。
(6)按数据值比例画出横坐标。
(7)按频数值比例画纵坐标。以观测值数目或百分数表示。
(8)画直方图。按纵坐标画出每个长方形的高度,它代表取落在此长方形中的数据数。(注意:每个长方形的宽度都是相等的。)在直方图上应标注出公差范围(T)、样本容量(n)、样本平均值(x)、样本标准偏差值(s)和x的位置等。
考点名称:象形统计图
象形统计图定义:
是利用现象本身的象形画来显示统计数据的图形,它的形象直观,使人一眼就能了解此幅图所表达的是哪些方面的信息。
象形统计图的特点:形象,直观,数据比例很清楚。注意:要有数据名称,单位,右下角的图例。
在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。
表现统计数字大小和变动的各种图形总称。其中有条形统计图、扇形统计图、折线统计图、象形图等。
其特点是:形象具体、简明生动、通俗易懂、一目了然。
其主要用途有:
①表示现象间的对比关系;
②揭露总体结构;
③检查计划的执行情况;
④揭示现象间的依存关系,反映总体单位的分配情况;
⑤说明现象在空间上的分布情况。
一般采用直角坐标系:
横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;
或采用角度坐标(如圆形图)、地理坐标(如地形图)等。按图尺的数字性质分类,有实数图、累积数图、百分数图、对数图、坐标图、指数图等;
其结构包括图名、图目(图中的标题)、图尺(坐标单位)、各种图线(基线、轮廓线、指导线等)、图注(图例说明、资料来源等)等。考点名称:总体、个体、样本、样本容量掌握总体、个体、样本,样本容量的概念,能正确区分总体、个体、样本、样本容量
总体、个体、样本、样本容量,这四个概念之间其实有其内在联系,
总体:我们把所要考察的对象的全体叫做总体;
个体:把组成总体的每一个考察对象叫做个体;
样本:从总体中取出的一部分个体叫做这个总体的一个样本;
样本容量:一个样本包含的个体的数量叫做这个样本的容量。
我们在区分这四个概念时,首先找出考察的对象,从而找出总体、个体,再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量。考点名称:用样本估算总体用样本估计总体的两个手段:
(1)用样本的频率分布估计总体的分布;
(2)用样本的数字特征估计总体的数字特征,需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本的容量越大,估计的结果也就越精确。