测量误差的值点列图和统计直方图和概率密度分布图
时间:2014-10-13 阅读:2329
测量误差的统计特性
1.测量值点列图
在相同测量条件下,对某钢球工件的直径测量150次,得到一个测量样本(x1,x2,……,x150 ),以测量序数i为横坐标,以测得值xi或其误差为纵坐标,画出测量值点列图(measurement point plot),如图2 - 1所示。由该测量值点列图可见,xi出现后,不能预见xi+1出现的大小和方向,但就样本数据的分布规律而言具 有如下特征:
①数据集中在算术平均值7.335附近,如不存在系统误差,它接近约定真值;
②数据分布在7.085〜7.585之间,即可确定测量值分布及其误差分布的大致范围;
③正负误差的数目大致相同;
④误差的总和大致趋于零。
以上所述的四个统计特征,分别称之为单峰性、有界性、对称性和抵偿性。这些特征都反映了随机误差的统计规律,其中误差的抵偿性是zui本质的统计特征,它常作为判定误差是否具有随机性的标志。
由测量数据的测量值点列图可以粗略看出测量误差的统计特性,如果利用测量数据作出统计直方图,就会更形象地看出其概率特征。
2.统计直方图和概率密度分布图
将上述测量样本按数据的大小划分为11组,组距△x= 0.05mm,用每组出现的数据个数 (称为频数mi)除以样本数n,得频率,再除以组距△x,得频率密度。表2-1中列出了子区间的中心值xi及其频数mi和频率fi。
表2-1 测量钢球工件直径的统计数据
子区间号 | 子区间中心值/mm | 频数mi/个 | 频率fi/% | 累积频率Fi/% | |
观测值工xi | 残余误差ui | ||||
1 | 7.085 | -0.25 | 3 | 2.00 | 2.00 |
2 | 7.135 | -0.20 | 7 | 4.67 | 6.67 |
3 | 7.185 | -0.15 | 15 | 10.00 | 16.67 |
4 | 7.235 | -0.10 | 18 | 12.0 | 28.67 |
5 | 7.285 | -0.05 | 28 | 18.66 | 47.33 |
6 | 7.335 | 0 | 29 | 19.33 | 66.66 |
7 | 7.385 | +0.05 | 24 | 16.00 | 82.66 |
8 | 7.435 | +0.10 | 12 | 8.00 | 90.66 |
9 | 7.485 | +0.15 | 10 | 6.67 | 97.33 |
10 | 7.535 | +0.20 | 2 | 1.33 | 98.66 |
11 | 7.585 | +0.25 | 2 | 1.33 | 99.99 |
|
|
| n=150 |
|
|
根据表2 - 1中数据,可按下列步骤作出统计直方图(statistical histogram),如图2-2所示:
①以xi为横坐标,为纵坐标,建立坐标系。
②在横坐标上划出等分的子区间。本例的子区间数目为11,各子区间的中心值为xi,各子区间的间距△x = 0.05 mm。
③划出各子区间的直方柱。如观测值落入2号子区间(7. 11mm,7. 16mm)的频数为7, 频率为 7/150=4. 67%。
④把各直方柱顶部中点用直线连接起来,便得到一条由许多折线连接起来的曲线。当测量样本数n无限增加,分组间隔△x趋于零时,图2-2中直方图折线就变成一条光滑的曲线,即测量总体的概率(分布)密度曲线,记为f(x)。这就是用实验方法由样本数据得到的概率密度分巧图(probability density distribution plot)。
概率密度曲线f(x)完好地描述了该测量(值)总体分布及其误差分布的统计规律„由概率论易知,f(x)具有下列两个性质:
式中:a≤x≤b—置信区间;
P(a≤x≤b)—x出现在[a,b]内的概率,也称为置信概率(或置信水平),简记为符号P; a——显著性水平(又称显著度或危险率)。
上述各量的几何意义如图2 - 3所示。
对于不同的被测量,其概率密度分布函数的形式可能是不同的。在测量不确定度评定中, 经常提到的分布有两点分布、反正弦分布、矩形分布、三角分布、梯形分布、正态分布以及投影分布等。上述对测量总体及其分布的实验统计方法,在实际工作中经常使用。在对精密仪器 的误差分析与计量检定工作中,为了使实验统计方法具有足够的可靠程度,在绘制统计直方图时应注意以下问题。
(1) 样本大小
样本大小即重复测量次数n。显然n越大,样本呈现的分布规律越稳定。但n太大,不仅资源浪费过大,而且难以保证多次测量都满足相同的测量条件。实践表明,在仅要确定误差的分布范围时,可取n=50〜200;若要确定误差分布规律时,则可取n=200~1000
(2)子区间的间距△x
子区间间距的下限应大于仪器分辨力,并使子区间有适当的数目。子区间数目随n的增大而增加,一般,子区间个数的选取方法大致如下:
•当n = 50〜100时,子区间的个数是6〜10;
•当n = 100〜200时,子区间的个数是9〜12;
•当n = 200〜500时,子区间的个数是12〜17;
•当n>500时,子区间的个数是20。
也可利用下列两个公式之一来计算分组数m或间距△x,即