四 [统计学笔记] 数据分布的数字特征_梅森上校的博客( 四 )


四分位差
四分位差是指上四分位数(QU)与下四分位数(QL)之差,因此也叫内距或四分间距 。
计算公式为:
四分位差特点:
平均差
平均差(mean deviation)是各变量值与其算术平均数离差绝对值的平均数 。因此,也称平均绝对离差,通常用M.D表示 。
平均差的计算有两种情况
如果数据是未分组数据(原始数据),则用简单算术平均法来计算平均差:
如果数据是分组数据,采用加权算术平均法来计算平均差:
平均差的特点:
方差和标准差
方差是各变量值与其算术平均数离差平方的算术平均数 。标准差就是方差的平方根 。
方差、标准差特点:
方差、标准差计算公式
总体数据
四 [统计学笔记] 数据分布的数字特征_梅森上校的博客
样本数据
① 未分组数据(原始数据)的样本方差和样本标准差的计算公式分别为:
② 分组数据的样本方差和样本标准差的计算公式分别为:
(k为组数)
标准化值(标准分数)
标准化值就是用各变量值与其平均数的离差再除以其标准差 。
标准化值的计算公式为:
标准化值的特点:标准化值具有均值为0,标准差为1的特性 。
经验法则(3σ 质量管理法则的原理)
使用条件:
在正态分布或近似正态分布(对称的钟型分布)的条件下
切比雪夫定理
利用切比雪夫定理来判断有多少的数据落入以均值为中心的k(标准化值)个标准差范围内 。
使用条件:任意分布形态的数据
根据切比雪夫定理的内容,至少有(
)的数据落入均值左右k个标准差范围内,其中k为大于1的任意数,当然也可以为小数 。
离散系数
离散系数也称变异系数(coefficient of variation),它是极差、四分位差、平均差或标准差等变异指标与其算术平均数对比的结果 。
常用的离散系数有极差系数、平均差系数和标准差系数,但应用最广泛的是标准差系数 。
标准差系数的计算公式:
四 [统计学笔记] 数据分布的数字特征_梅森上校的博客
离散系数的作用
离散系数是测度数据离散程度的相对统计量中位数和众数,可用于比较不同变量值水平或不同计量单位的不同组别数据的离散程度 。
离散系数大的,则该组数据的离散程度就大;离散系数小的,则该组数据的离散程度就小 。
总结:反映数据离散程度的各测定值的应用场合
1)对于分类数据,主要用异众比率来测度其离散程度;
2)对于顺序数据,主要用四分位差来测度其离散程度;
3)对于数值型数据,主要用方差或标准差来测度其离散程度 。
4)当需要对不同组别数据的离散程度进行比较时,则使用离散系数 。
数据分布形态的测定
分布形态测定问题的提出
集中趋势和离散程度是数据分布特征的两个重要方面,但要想全面了解数据的分布特点,我们还需要知道数据的分布形状,那么如何测定一组数据的分布形状呢?
分布形态测定的作用
通过分布形态的测定,我们可以了解数据分布形状的对称性以及分布曲线的扁平陡峭程度 。将这两点结合,我们还可以判断数据是否接近于正态分布 。

数据分布形态的测度主要是通过偏度系数和峰度系数来实现的 。矩又是计算偏度系数和峰度系数的基础 。
矩可分为总体矩和样本矩 。
样本距


以上关于本文的内容,仅作参考!温馨提示:如遇专业性较强的问题(如:疾病、健康、理财等),还请咨询专业人士给予相关指导!

「辽宁龙网」www.liaoninglong.com小编还为您精选了以下内容,希望对您有所帮助: