大家好!12描述性统计分析今天让小编来大家介绍下关于描述性统计分为,以下是小编对此问题的归纳整理,让我们一起来看看吧。
- 描述性统计
统计学是通过随机的方法采集数据,用各种分析方法了解数据的内涵,推断数据特性的一门学科。
统计学由描述性统计和推断性统计两部分组成。
描述性统计分析作为统计学中最基础的统计分析,即对一组样本数据的各种特征量进行分析,以便描述这组样本的各种特征及推断其本源总体的特征。
描述性统计分析的类别很多,主要包括数据的频数分析、集中趋势分析、离散程度分析、数据分布分析以及一些基本的统计图形。
常用的指标有均值、中位数、众数;标准误差、极差;四分位数、十分位数、百分位数;标准差、方差、变异系数;最大值、最小值、百分比;频数分布、峰度、偏度;基本统计图形;探索分析等。
数据的集中趋势一般采用平均值、中位数表示。
数据的离散程度一般采用方差、标准差表示。
数据的分布情况一般采用直方图表示。
- 统计思想
统计的基本思想是从随机性中寻找规律性。统计思想的基本方法就是根据样本性质推断总体性质。推断的两大支柱就是概率和误差,这两点贯穿于整个统计学的所有关键知识。统计学最终归结为两个核心理念:
- 允许误差下的概率保证;
- 允许误差下的统计推断。
- 统计思维模式
统计思维模式就是在统计的实际工作中和统计学理论的应用研究中,必须遵循的基本理论和指导方式。统计思维模式主要包括均值模式、变异模式、估计模式、相关模式、拟合模式、归纳模式、检验模式和比较模式。
- 均值模式
均值是对所要研究对象最简明的表示,也是对象最重要的特征。均值模式是从对象的总体看问题,观察对象普遍的发展趋势,而不受个别偶然现象的影响,是总体观的体现。
- 变异模式
均值代表了某种变异,否则无从谈起。统计研究对象中的个体必须存在差异,统计方法就是要认识事物数量方面的差异。在统计学中,用来反映变异的概念是方差,它表示离散程度。平均与变异都是对具有同类个体的总体特征的抽象和宏观度量。
- 估计模式
估计模式时应用某种合理的方法,通过对有限量样本的分析,对未知总体或未发生事务进行估计和推测的思想,即由部分事物的特征和规律来推测总体事物的特征,并对其进行认识。使用估计方法的前提条件要求获取的样本要和总体具有类似的性质,这样,在某种条件下,样本特性才能代表总体特性。在估计的过程中,须保持逻辑的严谨性。
- 相关模式
并不是所有事物之间都存在严格的因果关系。在某些统计样本的变化过程中,经常会出现一些其他事物相随共变或相随共现的情况,我们把这种非确定性关系的相随共变叫作统计相关性。它们之间不存在确定的函数关系,也会有奇异值出现。
- 拟合模式
在统计世界中,个体显随机性,群体显规律性。拟合是对群体规律性的抽象,即公式化或模型化。一旦事物的变化被模型化,我们就找到了解决问题的方法,知道了变化趋势。
- 归纳模式
由某些事物中部分对象的特征推断出该类事物全部对象的特征,或者由个别事实概括出一般结论的推理称为归纳推理。归纳推理是由部分到整体,由个别到一般的推理。在推断性统计中,由随机抽样样本性质推断总体性质的方法就是归纳法。有时归纳法得出的结论未必真实,还需要用实际样本资料对结论进行检验。
- 校验模式
推断性统计的依据是归纳法。归纳法得出的结论永远是概率性质的。为了保证基于局部特征和规律所推断出来的对整体的判断的可信度,我们需要增加一道校验过程,即利用实际样本资料来校验事先对总体某些数量特征的假设是否正确。
- 比较模式
比较模式是按照比较方式、遵从比较原则,将比较对象与比较标准进行对比,追踪对象的差异和变化,进而对比较对象做出评价和判断。统计的比较模式在相对指标、变异指标、时间序列分析、指数、抽样推断、模式比较迭代和相关分析中得到了有效的运用。
- 数据的特征度量
- 哪些特征量位置:均值、众数、中位数、百分位数离散程度:方差和标准差、极差、四分位数、变异系数分布形状:偏度系数、峰度系数、频数分布位置均值
均值是所有观测值的平均值,是描述数据取值中心位置的一个度量,计算公式如下:
多个正数的求平均计算公式:
算术平均:
加权算术平均:
几何平均:
调和平均:
加权调和平均:
平方平均:
- 中位数
中位数是描述观测值数据中心位置的统计量,大体上比中位数大或小的数据量各占一半。中位数的一个优点是不受个别极端数据的影响,具有稳健性。中位数的计算方法是:先将数据从小到大排序为x1,x2,x3,。。。,xn,然后计算:
x(n 1)/2,n为奇数
1/2(xn/2 xn/2 1),n为偶数
- 众数
观测值中出现次数最多的数称为众数,众数不如均值和中位数应用普遍。在属性变量分析中,常须考虑频数,因此众数用得多一些。
- 百分位数
百分位数是指在排序的数据集中,一组数据个数在数据集个数中占的百分比位置。百分位数是描述数据分布和位置的统计量。四分卫数是指把数据个数分成四个均等的部分,0.5分位数就是中位数,记为q2;0.25分位数和0.75分位数又分别称为下、上四分位数,并分别记为q1和q3。
- 分散程度极差与半级差方差标准差变异系数分布形状频数偏度系数峰度系数
- 数据类型与图示
- 数据类型图示线图直方图折线图茎叶图箱线图雷达图条形图环形图饼图
本文到此结束,希望对大家有所帮助。