统计学 - 描述性统计学
描述性统计学使我们能够洞悉数据,而无需详细查看所有数据。
描述数据的关键特征
快速了解数据的分布情况是统计方法中的重要步骤。
我们计算关于数据的关键数值,这些数值告诉我们数据的分布情况。我们还会绘制图表以直观地显示数据的分布情况。
数据的主要特征
- 数据的中心位置在哪里?(位置)
- 数据有多大变化?(尺度)
- 数据的形状是什么?(形状)
这些可以通过**汇总统计量**(数值)来描述。
数据的中心位置
数据的大部分值都集中在数据的**中心位置**。
平均数、中位数和众数等不同类型的平均数是**度量**中心位置的指标。
**注意:** 中心位置的度量也称为**位置参数**,因为它们告诉我们一些关于数据在数轴上的“位置”信息。
数据的变异
数据的**变异**是指数据围绕中心位置的离散程度。
标准差、极差和四分位数等统计量是**度量**变异的指标。
**注意:** 变异的度量也称为**尺度参数**。
数据的形状
数据的形状可以指数据在中心位置两侧的聚集方式。
**偏度**等统计量描述了中心位置右侧或左侧是否更大。偏度是一种**形状参数**。
频数表
**频数表**是展示数据的典型方法之一。
**频数表**统计和排序数据到表格中。通常,数据需要被分类到区间内。
频数表通常是制作图表以直观展示数据的基础。
数据可视化
不同类型的图表用于不同类型的数据。例如
- 饼图用于定性数据
- 直方图用于定量数据
- 散点图用于双变量数据
图表通常与数值汇总统计量密切相关。
例如,箱线图显示了**四分位数**的位置。
四分位数还告诉我们最小值和最大值、极差、四分位距和中位数的位置。