24, 10月
【汇旺担保】单变数统计分析

[拼音]:danbianliang tongji fenxi

[英文]:univariate statistic

在一个时间点上对某一变数的描述和推论。根据资料获取方式的不同,对单变数的统计分析采用统计描述和统计推论两种方式。

单变数统计描述

当资料的获取包括了研究的全体物件时采用。它分为研究变数的全貌和典型特征两部分。变数的全貌是通过分布来描述的,即将资料简化为变数值和频次对的集合。为了使这种分布更直观,常采取统计表式统计图的形式(见表)。变数的典型特征由一系列特征值描述,变数的层次不同,使用的特征值也不同,最常见的特征值有集中值和离散值。集中值又称集中趋势,表明一组资料的典型情况和平均水平。离散值又称离散趋势,反映变数值的分散程度或波动范围。

常用的特征值有:

(1)众值М0 和异众比例γ。适用于各种层次的变数,但以定类变数最为适用。众值М0 用来表示变数的集中值,异众比例γ用来表示变数的离散值。

众值М0=资料中具有频次最高的变数值,如表中生育孩子数是2时,频次为48,即是众值。

式中N为观察总数;fmo为众值的频次。

(2)中位值Мd和极差R或四分互差Q。适用于定序以上层次的变数,但以定序变数最为常用。中位值Мd用来表示变数的集中值,极差R或四分互差Q用来表示变数的离散值

中位值Мd为资料中居中位置的变数值。对于未分组资料,当资料按序排列后,对应(N+1)/2位置的变数值,即为中位值,表中资料的中位值为3(孩子数)。对于分组资料,则累计频率达50%点的变数值即为中位值。

极差 R为资料中变数最大值与最小值之差。表中极差为12。四分互差Q为资料分布中累计频率达25%或75%点变数值之差。

(3)均值μ和标准差

。仅适用于定距以上变数。均值μ用来表示变数的集中值,是资料总和的平均。标准差

用来表示变数围绕均值μ 的平均分散程度。计算公式为

式中N为观察总数;Xi为观测值。

标准差

的平方称作方差。方差也可用来表示定距以上变数的离散值。

单变数统计推论

当资料的蒐集只包括研究物件的一个随机样本时采用。它分为引数估计和假设检验两部分。引数估计就是根据抽样结果,科学地估计总体特征值的大小或范围。用样本的均值塣、成数p和标准差s作为总体的特征值,均值μ、成数 p和标准差

的估计值,称作引数的点估计。例如,根据样本的人均收入,估计总体的人均收入。

式中Xi为样本中的观察值;

为样本的容量;

为所研究的类别在样本中的数目。

引数的区间估计是对总体的特征值所在范围作出估计。例如,根据样本的人均收入,估计总体的人均收入在什么范围。在样本容量

不小于30时,总体均值的区间估计为

总体成数的区间估计为

根据公式确定:

区间估计公式中,估计正确的概率为1-α(见图)。

假设检验是根据抽样结果在一定可靠性的基础上对原假设作出接受或拒绝的判断。例如,为了确信某地生育率是否已控制在15‰,可进行一次抽样调查。根据抽样结果,来检验生育率为15‰的假设是否可以接受。这样的判断都带有概率的性质,百分之百判断正确是不可能的。衡量判断中可靠性大小,一般用显著性水平大小来表示。

使用统计推论技术的条件是:赖以抽样的总体名单必须是齐全的;抽样是概率抽样。同时非抽样误差在推论中没有涉及。如果资料的非抽样误差太大,统计推论的结果将失去其应有的正确性。

更多信息: 葡京官方网站 汇旺担保 引流 汇旺担保 代收 汇旺担保 qp料

Read More