pearson相关系数和spearman相关系数的区别

如题所述

区别:

1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,效率没有pearson相关系数高。

2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数。

3.两个定序测量数据之间也用spearman相关系数,不能用pearson相关系数。

拓展知识:

pearson相关通常是用来计算等距及等比数据或者说连续数据之间的相关的,这类数据的取值不限于整数,如前后两次考试成绩的相关就适合用pearson相关。

spearman相关专门用于计算等级数据之间的关系,这类数据的特点是数据有先后等级之分但连续两个等级之间的具体分数差异却未必都是相等的,比如第一名和第二名的分数差就未必等于第二名和第三名的分数差。两次考试的排名数据适用于spearman相关。

spearman相关只能计算等级数据,但pearson相关却既可以用来算等级相关,也可以算连续数据的相关,只不过一般默认用pearson相关计算连续数据的相关。

在 统计学中, 以查尔斯·斯皮尔曼命名的斯皮尔曼等级相关系数,即spearman相关系数。经常用希腊字母ρ表示。 它是衡量两个变量的依赖性的 非参数 指标。 它利用单调方程评价两个统计变量的相关性。 如果数据中没有重复值, 并且当两个变量完全单调相关时,斯皮尔曼相关系数则为+1或−1。

Pearson相关系数(Pearson CorrelationCoefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。

如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数,主要有Pearson简单相关系数。

参考资料:

spearman相关系数_百度百科

Pearson相关系数_百度百科

温馨提示:内容为网友见解,仅供参考
第1个回答  2018-07-27

区别:

1.分析范围不同:

Pearson用于计算连续数据的相关,而speraman相关是专门用于分析顺序数据,二者分析范围不同。

2.用途不同:

Pearson相关是最常见的相关公式,用于计算连续数据的相关,比如计算班上学生数学成绩和语文成绩的相关可以用Pearson相关。而spearman相关是专门用于分析顺序数据的,就是那种只有顺序关系,但并非等距的数据,比如计算班上学生数学成绩排名和语文成绩排名的关系。

当然如果你也可以用pearson相关来计算顺序数据,此时得到的结果和用spearman相关得到的一样。

拓展材料:

相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。于是,著名统计学家卡尔·皮尔逊设计了统计指标--相关系数(Correlation coefficient)。相关系数是用以反映变量之间相关关系密切程度的统计指标。

相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。

本回答被网友采纳
第2个回答  2017-07-29
在SPSS软件相关分析中,pearson(皮尔逊),kendall(肯德尔)和spearman(斯伯曼/斯皮尔曼)三种相关分析方法有什么异同两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述.Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。Kendall'stau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格;计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据;计算Kendall秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,宜用spearman或kendall相关Pearson相关复选项积差相关计算连续变量或是等间距测度的变量间的相关分析Kendall复选项等级相关计算分类变量间的秩相关,适用于合并等级资料Spearman复选项等级相关计算斯皮尔曼相关,适用于连续等级资料注:1若非等间距测度的连续变量因为分布不明-可用等级相关/也可用Pearson相关,对于完全等级离散变量必用等级相关2当资料不服从双变量正态分布或总体分布型未知或原始数据是用等级表示时,宜用Spearman或Kendall相关。3若不恰当用了Kendall等级相关分析则可能得出相关系数偏小的结论。则若不恰当使用,可能得相关系数偏小或偏大结论而考察不到不同变量间存在的密切关系。对一般情况默认数据服从正态分布的,故用Pearson分析方法。在SPSS里进入Correlate-》Bivariate,在变量下面CorrelationCoefficients复选框组里有3个选项:PearsonKendall'stau-bSpearman:Spearmanspearman(斯伯曼/斯皮尔曼)相关系数斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。它是依据两列成对等级的各对等级数之差来进行计算的,所以又称为“等级差数法”斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究。Kendall's相关系数肯德尔(Kendall)W系数又称和谐系数,是表示多列等级变量相关程度的一种方法。适用这种方法的数据资料一般是采用等级评定的方法收集的,即让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物。等级评定法每个评价者对N件事物排出一个等级顺序,最小的等级序数为1,最大的为N,若并列等级时,则平分共同应该占据的等级,如,平时所说的两个并列第一名,他们应该占据1,2名,所以它们的等级应是1.5,又如一个第一名,两个并列第二名,三个并列第三名,则它们对应的等级应该是1,2.5,2.5,5,5,5,这里2.5是2,3的平均,5是4,5,6的平均。肯德尔(Kendall)U系数又称一致性系数,是表示多列等级变量相关程度的一种方法。该方法同样适用于让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物所得的数据资料,只不过评定时采用对偶评定的方法,即每一次评定都要将N个事物两两比较,评定结果如下表所示,表格中空白位(阴影部分可以不管)填入的数据为:若i比j好记1,若i比j差记0,两者相同则记0.5。一共将得到K张这样的表格,将这K张表格重叠起来,对应位置的数据累加起来作为最后进行计算的数据,这些数据记为γij。正态分布的相关检验对来自正态总体的两个样本进行均值比较常使用T检验的方法。T检验要求两个被比较的样本来自正态总体。两个样本方差相等与不等时用的计算T值的公式不同。进行方差齐次性检验使用F检验。对应的零假设是:两组样本方差相等。P值小于0.05说明在该水平上否定原假设,方差不齐;否则两组方差无显著性差异。U检验时用服从正态分布的检验量去检验总体均值差异情况的方法。在这种情况下总体方差通常是已知的。虽然T检验法与U检验法所解决的问题大体相同,但在小样本(样本数n)=30作为大样本)且均方差未知的情况下就不能用U检验法了。均值检验时不同的数据使用不同的统计量使用MEANS过程求若干组的描述统计量,目的在于比较。因此必须分组求均值。这是与Descriptives过程不同之处。检验单个变量的均值是否与给定的常数之间存在差异,用One-SampleTTest单样本T检验过程。检验两个不相关的样本是否来自来具有相同均值的总体,用Independent-SamplesTtest独立样本t检验过程。如果分组样本不独立,用PairedSampleTtest配对t检验。如果分组不止两个,应使用One-WayANOVO一元方差分析(用于检验几个独立的组,是否来自均值相等的总体)过程进行单变量方差分析。如果试图比较的变量明显不服从正态分布,则应该考虑使用一种非参数检验过程Nonparametrictest.如果用户相比较的变量是分类变量,应该使用Crosstabs功能。当样本值不能为负值时用右侧单边检验。本回答被提问者采纳
第3个回答  2023-07-18
Pearson相关系数和Spearman相关系数是两种常用于衡量变量之间关联程度的统计指标,但它们的计算方法和应用场景有所不同。
1. Pearson相关系数:
Pearson相关系数衡量的是两个变量之间的线性相关程度。它是通过计算变量间的协方差和标准差的比值来衡量的。Pearson相关系数的取值范围在-1到1之间,其中1表示完全正相关,-1表示完全负相关,而0表示无线性相关。
Pearson相关系数主要适用于连续型的数值型数据,并且假设变量之间满足线性关系。它对异常值较为敏感,且只能捕捉到线性相关的关系。
2. Spearman相关系数:
Spearman相关系数是一种非参数的方法,它衡量的是两个变量之间的单调关系,即变量的相对顺序是否一致。首先,将原始数据转换为等级数据(将原始数据按大小排序并用相应的等级表示),然后计算等级之间的Pearson相关系数。
Spearman相关系数不仅适用于连续型的数据,也适用于有序离散型的数据。它对数据的分布和异常值相对较稳健,能够捕捉到变量之间的单调关系,但无法捕捉到非单调的关系。
总结:
- Pearson相关系数衡量的是两个变量之间的线性相关程度,适用于连续型的数据。
- Spearman相关系数衡量的是两个变量的单调关系,适用于有序离散型和连续型的数据。
- Pearson相关系数对异常值较为敏感,而Spearman相关系数对异常值相对较稳健。
- Pearson相关系数可以捕捉到线性相关性,而Spearman相关系数能够捕捉到更广泛的关系,包括单调关系。
第4个回答  2023-07-29

Pearson相关系数和Spearman相关系数是常用的统计指标,用于衡量两个变量之间的相关性。它们的主要区别在于:

    变量类型:

    Pearson相关系数适用于连续变量之间的相关性分析,可以测量线性关系的强度和方向。

    Spearman相关系数适用于有序变量或非线性变量之间的相关性分析,可以测量变量的等级顺序相关性。

    数据要求:

    Pearson相关系数要求变量满足正态分布和线性关系的假设。

    Spearman相关系数不要求变量满足正态分布和线性关系的假设,它使用的是变量的秩次来计算相关性。

    异常值的影响:

    Pearson相关系数对异常值比较敏感,异常值可能会对相关系数造成较大的影响。

    Spearman相关系数对异常值不敏感,它使用的是秩次而不是原始数值,可以减少异常值对相关系数的影响。

    综上所述,如果变量满足正态分布和线性关系的假设,且要研究变量之间的线性关系,可以选择使用Pearson相关系数;如果变量不满足正态分布或线性关系的假设,或者要研究变量之间的等级顺序相关性,可以选择使用Spearman相关系数。

相似回答