步骤2:确定组数。设n为数据个数,组数k可按下表取值,或按经验公式k≈ 估计,这是经验值,不必死套公式,如下图看出,组数k=3,图形太粗糙,k=12,分组又过多;故取在3-12之间最合适,本例试取组数k=7.

步骤3:确定组距。本例组距:h=(最大值-最小值)/组数=1.38/7=0.2
步骤4:确定各组的组界。为了使得所有数据不会落在组界上,并保证最小组9.22落在第一组内,故取第一组的组下限等于最小值减去最小测量单位的一半 (在本例即0.01/2=0.005)。于是
第一组的组下限:9.22-0.005=9.215
第一组的组上限;第一组的组下限+组距:9.215+0.2=9.415
其余各组以此类推,可见最大值10.60已包括在第七组内。
步骤5:确定各组的频数。将数据表中的各个数据按其数值大小分布到各个组中去。从而得出频数分布表
|
组号 |
频数 |
|
1、9.215-9.415 |
1 |
|
2、9.415-9.615 |
8 |
|
3、9.615-9.815 |
14 |
|
4、9.815-10.015 |
29 |
|
5、10.015-10.215 |
32 |
|
6、10.215-10.415 |
12 |
|
7、10.415-10.615 |
4 |
步骤6:作直方图.以横轴上每组对应的组距线段为底,以该组的频数为高,作出由7个矩形所组成的直方图。
步骤7:对直方图的观察。本例直方图形状的特点是:中间高、两头低、左右对称。故直方图反映了数据的规律。事实上,如果我们将上述抽查螺丝作直方图的作法再重复做几遍,我们就会发现这几次作出来的直方图样子都差不多,所以直方图确实反映了数据的规律。
上述频数直方图还不能反映出螺丝直径落在某个直方组的可能性大小,故将每个直方组的频数除以总频数N=100,所得到的比率就称为频率,它反映了螺丝直径落在该直方组的可能性大小。