计量测试中异常数据剔除的措施

摘 要众所周知,计量测量工作对获取数据的精准性有着极高的要求,而要确保获取数据的精准性,除了需在数据获取后进行科学、有效的处理外,尚需剔除其中一些异常数据,之后方可作为相关科研工作的参考依据。本文通过论述计量仪器出现误差的原因,并以实例来说明计量测试中异常数据剔除的措施,能够保证计量测试的准确性和科学性。

【关键词】计量测试 异常数据 剔除措施

计量测量,其本身便是一项对数据精准性有着极高要求的工作。而要确保数据获取的精准性,除了需科学处理计量测量所得出的数据外,尚需找出其中的异常数据并将之剔除,如此方能作为相关科学的参考依据。当前,国内已然根据计量测量中异常数据的出现原因提出了4种有针对性的异常数据剔除方法,这些方法可独立使用,亦可综合利用,其目的均在于判定异常值并将之剔除,以确保计量测量数据的准确性。

1 计量仪器出现误差的原因

由于计量仪器对外部环境有着极高的要求,加之其本身也是一种高精密的仪器,因而任何外部环境的变化都可能导致仪器测试结果产生偏差,并最终影响到检测结果的准确性。就当前的外部环境而言,可能导致计量仪器产生误差的原因主要包括以下几个方面:

(1)仪器受到了外界诸如震动、机械动荡一类的自然或人为因素影响;

(2)受电磁干扰或因供电电压不稳而导致的检测仪器出现故障;

(3)操作人员本身经验不足,加之操作事物所因其的检测不准确;

(4)仪器本身存在如元件损坏、零件松动一类的质量问题,这类问题一旦发生,将直接导致检测结果不准确,从而影响到工作人员的正常测量。

对于以上影响因素,操作人员在实际的操作过程中,务必全面排除,如此方能确保测量结果的准确性。当然,在此过程中,针对异常值的剔除尚需注意采取合适的剔除方法,若剔除方法选择不当则可能收获适得其反的效果。简言之,即针对异常值不同的产生原因需采取有针对性的剔除方法,方能确保仪器测量结果达到规定的使用标准。

在实际的判断异常值过程中,以下几种是当前人们最常用的异常值判断准则,即3∑准则、肖维勒准则、t检验法以及格拉布斯准则。

2 计量测试中异常数据剔除的措施

以上所提准则,虽其实际内容各不相同,但却均是置信概率的运用基础,而所谓的置信概率,即随机变量于置信区间内的落入概率。若实际的运用过程中,将置信区间内的测量数据实际范围用X来表示,那么以上所提之准则则能用以下方式来表达:

2.1 3∑准则

该式子所表达的含义为可疑数据与整租数据的算术平均差,其目的是要找出该差与3倍哒的绝对值之间的差异,若偏差较大则将此数值舍弃。在实际的运用过程中,将所测数据代入上式,若与上式相符,则可判断该值为异常值,应将其剔除。

2.2 肖维勒准则

在该公式的使用过程抓奶哥,若将测得的独立数据带入,上式仍然成立则可判定Xd为异常值,可将之剔除。

2.3 格布拉斯准则

该式中,Xd表示测量数据,s则代表着贝塞尔公式计算的标准差,至于其他的如G、与n均可在表中查询。

2.4 t检验法

该检验法是将Xi这一可疑数值意外的数值假定为数据的集合总体,进而根据该数据集总体设定其正态分布。对于该数据,虽仅是假定其分布状态,但无论其是否为正态均需通过进一步的判定。当然,于实际的运用过程中,通常都不进行深入判定该样本是否符合正态分布特征,而仅是将其样本视作近似为正态分布,如此便可将Xi这一可疑数据视作一个总容量为1的样本,进而在比较两者的总体时,若两者均在同一总体中被包含,则两者之间显然不应存在这样的差异,从而可由此计算出统计量k,具体的表达式为:

于上式中,针对样本的数据算术平均值,我们用X表示,那么S所代表者则为样本数据的标准差,之后通过计算得出K指,并通过与查询所得的T分布表所得之进行比较,若比较结果显示:显著性水平a下的t检验值较大,则表明Xi的出现应是一个小概率事件,可将之视作异常值而予以剔除。

3 实例判定

以下为结合实例所判定的异常值判断准则:如经过某测量得出了如下一系列的测量数据:10.002,10.204,0.218,10.228,10.230,10.312,10.320,10.342,10.346,结合以上方式进行判断并剔除异常值,那么置信概念的可取值可设定为95%,那么相应地。

此时,我们将异常值怀疑为10.346,之后通过计算可得出这十个数的平均值为10.2317,那么对应的X1的平均值则为10.2231,,经过综合计算,得出10.346為异常值,应将其剔除。

通过采用四种方法来进行判定,其10346为异常值,而G(a,n)与10.002-10.2317非常相近,这在一定程度上说明了应用格拉布斯准则的效果较好。在整个判定过程中,作为判定异常数值的基本思想是:先做好某一个统计量,如果这个统计量在规定的范围之内,便可以认为是服从止态分布,否则就认为相关的数据并不服从止态分布,这则说明了其中的数据存在一定的误差。

4 结语

在实际的运用过程中,为切实保障准侧的景准确并尽量降低误判现象的发生概率,通常情况下可结合两种或三种判定准则进行综合判定,若集中判定方式所得出之结论均保持一直,则可将之可疑数据剔除,如此判断方式方可切实提升测量的准确性。当然,若几种方法的综合使用,所得判定结果存在差异,则应慎重考虑该数据是否要进行剔除,并进行反复验证。对于这种情况,笔者的建议是将处理数据全部保留,以确保异常数据剔除的高效性与准确性,进而保障测得数据的有效性。

参考文献

[1]赵媞,孙明珠,王中禹.计量测试中异常数据剔除方法的探讨[J].科技创新与应用,2014(28):293-293.

[2]徐丹,王中禹.计量测试中异常数据剔除的措施[J].科技经济导刊,2016(20):156-157.

[3]王莹,刘佳,王欣,等.计量检测中异常数据剔除的有效方法[J].电子世界,2016(24):93-93.

[4]翟志强.试论计量检定中的异常值及其剔除方法[J].中国科技博览,2015(33):390-390.

作者单位

东华计量测试研究院 江西省南昌市 330029

推荐访问:剔除 计量 异常 措施 数据