四 [统计学笔记] 数据分布的数字特征_梅森上校的博客

(四)数据分布的数字特征数据的分布特征与使用的描述统计量
四 [统计学笔记] 数据分布的数字特征_梅森上校的博客
数据集中趋势
在统计研究中,需要搜集大量数据并对其进行加工整理,大多数情况下数据都会呈现出一种钟形分布,即各个变量值与中间位置的距离越近,出现的次数越多;与中间位置距离越远,出现的次数越少,从而形成了一种以中间值为中心的集中趋势 。这个集中趋势是现象共性的特征,也是现象规律性的数量表现 。
根据统计学知识,集中趋势指平均数,是一组数据中有代表性的值,这些数值趋向于落在数值大小排列的数据中心,被称为中心趋势度量 。最常用的中心趋势度量有算术平均数、几何平均数、调和平均数、众数和中位数 。
均值是一组数据的算术平均,它利用了全部数据信息,是概括一组数据最常用的一个值 。
众数是一组数据中出现次数最多的变量值,它用于对分类数据的概括性度量,其特点是不受极端值的影响,但它没有利用全部数据信息,而且还具有不唯一性 。一组数据可能有众数,也可能没有众数;可能有一个众数,也可能有多个众数 。
中位数是一组数据按大小顺序排序后处于中间位置上的变量,它主要用于对顺序数据的概括性度量 。
对于总体中的个体数据,有时会呈现出在一定范围内以某个数据为中心上下波动的分布特征,即数据有时具有它分布的中心,我们称之为数据分布的集中趋势 。
集中趋势指标的分类
四 [统计学笔记] 数据分布的数字特征_梅森上校的博客
集中趋势指标的作用
可以反映一组数据分布的中心或一般水平;
可以反映同一现象在不同时间或空间条件下的发展趋势或差异;
以用来分析现象之间的依存关系;
样本平均数是统计推断的一个重要统计量 。
集中趋势的测定数值平均数
数值平均数只适用于定量数据(数值型数据),而不适用于定性数据 。
1、算术平均数
(1)简单算术平均数
简单算术平均数是根据未分组数据(原始数据)计算的一种平均数,它是将所有的原始数据相加再除以数据总个数得到的 。
2、加权算术平均数
四 [统计学笔记] 数据分布的数字特征_梅森上校的博客
其中,Xi有两种情况:在单变量值分组中,Xi代表各组的变量值;在组距式分组中,Xi代表各组的组中值,
四 [统计学笔记] 数据分布的数字特征_梅森上校的博客
称作权重(频率) 。
四 [统计学笔记] 数据分布的数字特征_梅森上校的博客
(3)算术平均数的主要数学性质
①各变量值与其算术平均数的离差之和等于零;
即:
四 [统计学笔记] 数据分布的数字特征_梅森上校的博客
②各变量值与其算术平均数的离差平方和最小 。
即:
四 [统计学笔记] 数据分布的数字特征_梅森上校的博客
3. 调和平均数
调和平均数加权算术平均数的一种变形 。
调和平均数与加权算术平均数的关系是:若已知各组变量值 及其标志总量mi(mi=xifi ),而缺乏fi的数据时,则加权算术平均数可通过变形得到fi(fi=mi/xi)后,再以mi为权数的调和平均数形式来计算 。


以上关于本文的内容,仅作参考!温馨提示:如遇专业性较强的问题(如:疾病、健康、理财等),还请咨询专业人士给予相关指导!

「辽宁龙网」www.liaoninglong.com小编还为您精选了以下内容,希望对您有所帮助: