相关系数,或称线性相关系数、皮氏积矩相关系数(Pearson product-moment correlation coefficient,PPCC)等,是衡量两个随机变量之间线性相关程度的指标。它由卡尔・皮尔森(Karl Pearson)在1880年代提出,现已广泛地应用于科学的各个领域。依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。
相关系数_相关系数 -定义
相关系数公式相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。由于研究对象的不同,相关系数有如下几种定义方式。
简单相关系数:又叫相关系数或线性相关系数,一般用字母r表示,用来度量两个变量间的线性关系。
复相关系数:又叫多重相关系数。复相关是指因变量与多个自变量之间的相关关系。例如,某种商品的季节性需求量与其价格水平、职工收入水平等现象之间呈现复相关关系。
典型相关系数:是先对原来各组变量进行主成分分析,得到新的线性关系的综合指标,再通过综合指标之间的线性相关系数来研究原各组变量间相关关系。
相关系数_相关系数 -计算问题
相关系数的计算
相关系数是测定变量之间关系密切程度的量。对两个变量之间的线性相关程度的度量称为单相关系数。通常以r表示样本的相关系数。
计算该相关系数时,假定两个变量之间是线性关系,而且两个变量都是随机变量。此外,样本数据中不应有极端值,否则会对相关系数的值有较大影响。相关系数的性质如下:
1.相关系数的值介于-1与+1之间,即-1≤r≤+1。
当r>0时,表示两变量正相关,当r<0时,表示两变量为负相关。当|r|=1时,表示两变量为完全线性相关即函数关系。当r=1时,称为完全正相关,而当r=-1时,称为完全负相关。当r=0时,表示两变量间无线性相关关系。
2.r具有对称性。X与y之间的相关系数rxy和y与x之间的相关系数ryx相等。
3.r数值大小与x和y的数据原点及计量尺度无关。改变x和y的数据原点和计量尺度,并不改变r数值的大小。
4.r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。
5.r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系。
当