首先,标准差与标准偏差是一个概念,标准差也被称为标准偏差,或者实验标准差。
简单来说,标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
例如,两组数的集合 {0, 5, 9, 14} 和 {5, 6, 8, 9} 其平均值都是 7,但第二个集合具有较小的标准差。
标准差可以当作不确定性的一种测量。例如在物理科学中,做重复性测量时,测量数值集合的标准差代表这些测量的精确度。当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则认为测量值与预测值互相矛盾。这很容易理解,因为如果测量值都落在一定数值范围之外,可以合理推论预测值是否正确。
标准差应用于投资上,可作为量度回报稳定性的指标。标准差数值越大,代表回报远离过去平均数值,回报较不稳定故风险越高。相反,标准差数值越小,代表回报较为稳定,风险亦较小。
标准差的定义及简易计算公式
标准计算公式
假设有一组数值(皆为实数),其平均值为:
- .
此组数值的标准差为:
- .
简化计算公式
上述公式可以变换为一个较简单的公式:
上述代数变换的过程如下:
随机变量的标准差计算公式
一随机变量 的标准差定义为:
- .
须注意并非所有随机变量都具有标准差,因为有些随机变量不存在期望值。 如果随机变量 为 具有相同机率,则可用上述公式计算标准差。
样本标准差
在真实世界中,除非在某些特殊情况下,找到一个总体的真实的标准差是不现实的。大多数情况下,总体标准差是通过随机抽取一定量的样本并计算样本标准差估计的。
从一大组数值当中取出一样本数值组合 ,常定义其样本标准差:
样本方差 是对总体方差的无偏估计。 中分母为 是因为 的自由度为 ,这是由于存在约束条件 。
连续随机变量的标准差计算公式
概率密度为 的连续随机变量 的标准差是:
其中
标准差的性质
对于常数 和随机变量 和 :
- 其中: 表示随机变量 和 的协方差。