区别:
1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,效率没有pearson相关系数高。
2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数。
3.两个定序测量数据之间也用spearman相关系数,不能用pearson相关系数。
拓展知识:
pearson相关通常是用来计算等距及等比数据或者说连续数据之间的相关的,这类数据的取值不限于整数,如前后两次考试成绩的相关就适合用pearson相关。
spearman相关专门用于计算等级数据之间的关系,这类数据的特点是数据有先后等级之分但连续两个等级之间的具体分数差异却未必都是相等的,比如第一名和第二名的分数差就未必等于第二名和第三名的分数差。两次考试的排名数据适用于spearman相关。
spearman相关只能计算等级数据,但pearson相关却既可以用来算等级相关,也可以算连续数据的相关,只不过一般默认用pearson相关计算连续数据的相关。
在 统计学中, 以查尔斯·斯皮尔曼命名的斯皮尔曼等级相关系数,即spearman相关系数。经常用希腊字母ρ表示。 它是衡量两个变量的依赖性的 非参数 指标。 它利用单调方程评价两个统计变量的相关性。 如果数据中没有重复值, 并且当两个变量完全单调相关时,斯皮尔曼相关系数则为+1或−1。
Pearson相关系数(Pearson CorrelationCoefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。
如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数,主要有Pearson简单相关系数。
参考资料:
区别:
1.分析范围不同:
Pearson用于计算连续数据的相关,而speraman相关是专门用于分析顺序数据,二者分析范围不同。
2.用途不同:
Pearson相关是最常见的相关公式,用于计算连续数据的相关,比如计算班上学生数学成绩和语文成绩的相关可以用Pearson相关。而spearman相关是专门用于分析顺序数据的,就是那种只有顺序关系,但并非等距的数据,比如计算班上学生数学成绩排名和语文成绩排名的关系。
当然如果你也可以用pearson相关来计算顺序数据,此时得到的结果和用spearman相关得到的一样。
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。于是,著名统计学家卡尔·皮尔逊设计了统计指标--相关系数(Correlation coefficient)。相关系数是用以反映变量之间相关关系密切程度的统计指标。
相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。
本回答被网友采纳Pearson相关系数和Spearman相关系数是常用的统计指标,用于衡量两个变量之间的相关性。它们的主要区别在于:
变量类型:
Pearson相关系数适用于连续变量之间的相关性分析,可以测量线性关系的强度和方向。
Spearman相关系数适用于有序变量或非线性变量之间的相关性分析,可以测量变量的等级顺序相关性。
数据要求:
Pearson相关系数要求变量满足正态分布和线性关系的假设。
Spearman相关系数不要求变量满足正态分布和线性关系的假设,它使用的是变量的秩次来计算相关性。
异常值的影响:
Pearson相关系数对异常值比较敏感,异常值可能会对相关系数造成较大的影响。
Spearman相关系数对异常值不敏感,它使用的是秩次而不是原始数值,可以减少异常值对相关系数的影响。
综上所述,如果变量满足正态分布和线性关系的假设,且要研究变量之间的线性关系,可以选择使用Pearson相关系数;如果变量不满足正态分布或线性关系的假设,或者要研究变量之间的等级顺序相关性,可以选择使用Spearman相关系数。