상관 점수. 심리학 논문의 상관관계

순위가 매겨지는 두 가지 계열의 값이 있는 경우 Spearman의 순위 상관 관계를 계산하는 것이 합리적입니다.

이러한 행은 다음과 같이 나타낼 수 있습니다.

  • 연구 중인 동일한 개체 그룹에서 결정된 한 쌍의 특징;
  • 동일한 기호 세트에 의해 2개의 연구 대상에서 결정된 개별 종속 기호 쌍;
  • 한 쌍의 그룹 종속 기호;
  • 기호의 개인 및 그룹 종속.

이 방법에는 각 기능에 대해 개별적으로 지표의 순위를 지정하는 작업이 포함됩니다.

가장 작은 값은 가장 작은 순위를 갖습니다.

이 방법은 연구된 현상 사이의 관계의 존재를 확립하도록 설계된 비모수 통계적 방법을 나타냅니다.

  • 두 시리즈의 정량적 데이터 사이의 실제 병렬도를 결정하는 단계;
  • 정량적으로 표현된 식별된 관계의 견고성 평가.

상관 분석

둘 이상의 관계가 존재하는지 여부를 탐지하기 위해 고안된 통계적 방법 랜덤 변수(변수)뿐만 아니라 그 강도도 호출되었습니다. 상관 분석.

그것은 correlatio (lat.) - 비율에서 그 이름을 얻었습니다.

사용할 때 다음과 같은 시나리오가 가능합니다.

  • 상관 관계의 존재(양수 또는 음수);
  • 상관관계가 없습니다(제로).

변수 간의 관계를 설정하는 경우 우리는 대화 중이 야그들의 상관 관계에 대해. 즉, X의 값이 변할 때 Y의 값의 비례적인 변화가 필연적으로 관찰된다고 말할 수 있습니다.

다양한 연결 측정(계수)이 도구로 사용됩니다.

그들의 선택은 다음에 의해 영향을 받습니다.

  • 난수를 측정하는 방법;
  • 난수 사이의 관계의 특성.

상관 관계의 존재는 그래픽(그래프) 및 계수(숫자 표시)로 표시될 수 있습니다.

상관 관계는 다음과 같은 특징이 있습니다.

  • 연결 강도(상관 계수 ±0.7 ~ ±1 - 강함, ±0.3 ~ ±0.699 - 중간, 0 ~ ±0.299 - 약함);
  • 통신 방향(정방향 또는 역방향).

상관 분석의 목표

상관 분석에서는 연구된 변수 간의 인과 관계를 설정할 수 없습니다.

다음과 같은 목적으로 수행됩니다.

  • 변수 간의 의존성 설정;
  • 다른 변수를 기반으로 변수에 대한 특정 정보를 얻는 것;
  • 이 의존성의 근접성(연결)을 결정하는 것;
  • 설정된 연결의 방향을 결정합니다.

상관 분석 방법


이 분석다음을 사용하여 수행할 수 있습니다.

  • 제곱법 또는 피어슨법;
  • 순위 방법 또는 Spearman.

Pearson 방법은 다음이 필요한 계산에 적용할 수 있습니다. 정확한 정의변수 사이에 존재하는 힘. 그것의 도움으로 연구 된 징후는 양적으로만 표현되어야합니다.

Spearman 방법 또는 순위 상관 관계를 적용하기 위해 특성 표현에 엄격한 요구 사항이 없습니다. 양적 및 귀속적일 수 있습니다. 이 방법 덕분에 연결 강도의 정확한 설정이 아니라 표시 특성에 대한 정보를 얻을 수 있습니다.

변수 행에는 열린 옵션이 포함될 수 있습니다. 예를 들어, 근무경력을 1년 이내, 5년 이상 등의 값으로 표현하는 경우

상관 계수

두 변수의 변화 특성을 특성화하는 통계적 값을 상관 계수 또는 쌍을 이루는 상관 계수라고 합니다. 양적으로는 -1에서 +1까지입니다.

가장 일반적인 비율은 다음과 같습니다.

  • 피어슨- 구간 척도에 속하는 변수에 적용 가능;
  • 창병– 순서 척도 변수의 경우.

상관 계수 사용에 대한 제한 사항

다음과 같은 경우 상관 계수를 계산할 때 신뢰할 수 없는 데이터를 얻을 수 있습니다.

  • 변수에 대한 충분한 수의 값이 있습니다(25-100 쌍의 관찰).
  • 예를 들어 연구 된 변수 사이에 선형이 아닌 2 차 관계가 설정됩니다.
  • 각각의 경우 데이터에는 둘 이상의 관찰이 포함됩니다.
  • 변수의 비정상적인 값(이상치)의 존재;
  • 연구 중인 데이터는 잘 정의된 관찰 하위 그룹으로 구성됩니다.
  • 상관 관계의 존재는 원인으로 간주될 수 있는 변수와 결과적으로 어떤 변수를 설정할 수 없습니다.

상관성 검정

통계 값을 평가하기 위해 값 또는 극단 값의 무작위 발생 확률을 특성화하는 유의성 또는 신뢰도의 개념이 사용됩니다.

상관 관계의 유의성을 결정하는 가장 일반적인 방법은 스튜던트 t-검정을 결정하는 것입니다.

그 값을 표의 값과 비교하여 자유도를 2로 한다. 기준의 계산된 값이 표의 값보다 크면 상관계수의 유의성을 나타낸다.

경제적 계산을 수행할 때 신뢰 수준 0.05(95%) 또는 0.01(99%)이면 충분하다고 간주됩니다.

창병 계급

Spearman의 순위 상관 계수를 사용하면 현상 간의 연결이 있는지 통계적으로 설정할 수 있습니다. 계산에는 각 속성(순위)에 대한 일련 번호 설정이 포함됩니다. 순위는 오름차순 또는 내림차순일 수 있습니다.

순위를 매길 피처의 수는 얼마든지 가능합니다. 이것은 수를 제한하는 다소 힘든 과정입니다. 20개의 표지판에 도달하면 어려움이 시작됩니다.

Spearman 계수를 계산하려면 다음 공식을 사용하십시오.

여기서:

n - 순위가 지정된 기능의 수를 표시합니다.

d는 두 변수의 순위 차이에 불과합니다.

∑(d2)는 순위 차이 제곱의 합입니다.

심리학에서의 상관분석의 적용

통계 지원 심리학 연구보다 객관적이고 대표성을 높입니다. 심리 실험을 통해 얻은 데이터를 통계적으로 처리하여 유용한 정보를 최대한 추출할 수 있습니다.

상관 분석은 결과를 처리하는 데 가장 폭넓게 적용되었습니다.

연구 중에 얻은 결과의 상관 관계 분석을 수행하는 것이 적절합니다.

  • 불안(R. Temml, M. Dorca, V. Amen 테스트에 따름);
  • 가족 관계(E.G. Eidemiller, V.V. Yustitskis의 "가족 관계 분석"(DIA) 설문지);
  • 내부성 - 외부성 수준 (E.F. Bazhin, E.A. Golynkina 및 A.M. Etkind의 설문지);
  • 교사들 사이의 정서적 소진 수준(V.V. Boyko 설문지);
  • 다양한 교육 프로필에 있는 학생들의 언어 지능 요소 간의 연결(K.M. Gurevich 및 기타 방법);
  • 공감 수준(V.V. Boyko의 방법)과 결혼 만족도 사이의 관계(V.V. Stolin, T.L. Romanova, G.P. Butenko의 설문지);
  • 청소년의 사회 측정적 상태(Jacob L. Moreno의 테스트)와 가족 교육 스타일의 특성(E.G. Eidemiller의 설문지, V.V. Yustitskis) 간의 연관성;
  • 완전한 편부모 가정에서 자란 청소년의 삶의 목표 구조(설문지 Edward L. Deci, Richard M. Ryan Ryan).

Spearman 기준에 따른 상관 분석 수행에 대한 간략한 지침

Spearman 방법을 사용한 상관 분석 수행 다음 알고리즘에 따라:

  • 쌍을 이루는 비교 가능한 기능은 2개의 행으로 배열되며, 그 중 하나는 X로 표시되고 다른 하나는 Y로 표시됩니다.
  • X 시리즈의 값은 오름차순 또는 내림차순으로 정렬됩니다.
  • Y 시리즈 값의 배열 순서는 X 시리즈 값과의 일치에 의해 결정됩니다.
  • X 시리즈의 각 값에 대해 순위를 결정합니다. 최소값에서 최대값까지 일련 번호를 할당합니다.
  • Y 시리즈의 각 값에 대해 순위도 결정합니다(최소에서 최대까지).
  • 공식 D=X-Y를 사용하여 X와 Y의 순위 간의 차이(D)를 계산합니다.
  • 결과 차이 값은 제곱됩니다.
  • 순위 차이의 제곱을 합산합니다.
  • 공식을 사용하여 계산을 수행합니다.

Spearman 상관 관계 예

다음 데이터가 있는 경우 서비스 기간과 부상률 사이의 상관 관계를 확립할 필요가 있습니다.

대부분 적절한 방법분석은 순위 방법이기 때문에 표시 중 하나는 최대 1년의 경력 및 7년 이상의 경력과 같은 개방형 옵션의 형태로 제공됩니다.

문제의 해결은 워크시트에 요약되어 있고 수동으로 수행할 수 있는 데이터 순위에서 시작됩니다. 그들의 볼륨은 크지 않습니다:

직장 경험 부상 수 서수 (순위) 순위 차이 순위 차이 제곱
d(x-y)
최대 1년 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 이상 6 5 1 +4 16
Σd2 = 38.5

열에 분수 순위가 나타나는 것은 동일한 크기의 변형이 나타나는 경우 순위의 산술 평균 값이 발견된다는 사실 때문입니다. 이 예에서 부상률 12는 두 번 발생하고 순위 2와 3이 할당됩니다. 이 순위의 산술 평균(2 + 3) / 2 = 2.5를 찾고 이 값을 2개의 지표에 대한 워크시트에 넣습니다.
얻은 값을 작업 공식에 대입하고 간단한 계산을 통해 -0.92와 동일한 Spearman 계수를 얻습니다.

계수의 음수 값은 존재를 나타냅니다. 피드백표시 사이에 짧은 작업 경험이 수반된다는 것을 주장할 수 있습니다. 큰 수부상. 또한 이러한 지표의 관계의 강도는 상당히 큽니다.
계산의 다음 단계는 얻은 계수의 신뢰성을 결정하는 것입니다.
그 오차와 스튜던트 기준이 계산됩니다.

회귀 및 상관 분석 - 통계 연구 방법. 이것은 하나 이상의 독립 변수에 대한 매개변수의 종속성을 표시하는 가장 일반적인 방법입니다.

아래에서 구체적인 실제 사례경제학자들 사이에서 매우 인기 있는 이 두 가지 분석을 살펴보겠습니다. 우리는 또한 그것들을 결합했을 때 결과를 얻는 예를 제공 할 것입니다.

Excel의 회귀 분석

종속 변수에 대한 일부 값(독립, 독립)의 영향을 보여줍니다. 예를 들어, 경제 활동 인구의 수가 기업 수, 임금 및 기타 매개변수에 어떻게 의존하는지. 또는: 외국인 투자, 에너지 가격 등이 GDP 수준에 어떤 영향을 미치는지.

분석 결과를 통해 우선 순위를 지정할 수 있습니다. 그리고 주요 요소를 기반으로 예측하고 우선 순위 영역의 개발을 계획하고 관리 결정을 내립니다.

회귀 발생:

  • 선형(y = a + bx);
  • 포물선(y = a + bx + cx 2);
  • 지수 (y = a * exp(bx));
  • 거듭제곱(y = a*x^b);
  • 쌍곡선(y = b/x + a);
  • 대수(y = b * 1n(x) + a);
  • 지수(y = a * b^x).

Excel에서 회귀 모델을 작성하고 결과를 해석하는 예를 고려하십시오. 해 보자 선형 유형회귀.

작업. 6개 기업에서 월평균 그리고 퇴직한 직원의 수. 평균 급여에 대한 퇴직 직원 수의 의존성을 결정할 필요가 있습니다.

모델 선형 회귀다음과 같은 형식이 있습니다.

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

여기서 는 회귀 계수, x는 영향을 미치는 변수, k는 요인 수입니다.

이 예에서 Y는 퇴직 근로자의 지표입니다. 영향을 미치는 요소는 임금(x)입니다.

Excel에는 선형 회귀 모델의 매개변수를 계산하는 데 사용할 수 있는 기본 제공 함수가 있습니다. 그러나 Analysis ToolPak 추가 기능을 사용하면 더 빠르게 작업을 수행할 수 있습니다.

강력한 분석 도구 활성화:

활성화되면 데이터 탭에서 추가 기능을 사용할 수 있습니다.

이제 우리는 회귀 분석을 직접 다룰 것입니다.



우선, 우리는 R-제곱과 계수에 주목합니다.

R-제곱은 결정 계수입니다. 이 예에서는 0.755 또는 75.5%입니다. 이는 모델의 계산된 매개변수가 연구된 매개변수 간의 관계를 75.5% 설명한다는 것을 의미합니다. 결정 계수가 높을수록 더 좋은 모델입니다. 양호 - 0.8 이상. 나쁨 - 0.5 미만(이러한 분석은 합리적인 것으로 간주될 수 없음). 우리의 예에서 - "나쁘지 않다".

계수 64.1428은 고려 중인 모델의 모든 변수가 0인 경우 Y가 무엇인지 보여줍니다. 즉, 모델에 설명되지 않은 다른 요인도 분석된 매개변수의 값에 영향을 미칩니다.

계수 -0.16285는 Y에 대한 변수 X의 가중치를 보여줍니다. 즉, 이 모델 내에서 평균 월 급여는 가중치가 -0.16285(작은 영향 정도)로 퇴직자 수에 영향을 미칩니다. "-" 기호는 부정적인 영향: 급여가 높을수록 퇴사율이 낮아집니다. 공정합니다.



Excel의 상관관계 분석

상관 분석은 하나 또는 두 개의 샘플에서 지표 사이에 관계가 있는지 여부를 확인하는 데 도움이 됩니다. 예를 들어, 기계의 작동 시간과 수리 비용 사이, 장비 가격과 작동 기간, 어린이의 키와 체중 등.

관계가 있는 경우 한 매개변수의 증가가 다른 매개변수의 증가(양의 상관관계) 또는 감소(음의)로 이어지는지 여부. 상관 분석은 분석가가 한 지표의 값이 다른 지표의 가능한 값을 예측할 수 있는지 여부를 결정하는 데 도움이 됩니다.

상관 계수는 r로 표시됩니다. +1에서 -1까지 다양합니다. 상관관계 분류 다른 지역다를 것입니다. 계수 값이 0이면 샘플 간에 선형 관계가 없습니다.

Excel을 사용하여 상관 계수를 찾는 방법을 고려하십시오.

CORREL 함수는 쌍을 이루는 계수를 찾는 데 사용됩니다.

작업: 작업 시간 사이에 관계가 있는지 확인 선반및 유지 보수 비용.

커서를 아무 셀에 놓고 fx 버튼을 누릅니다.

  1. "통계" 범주에서 CORREL 기능을 선택합니다.
  2. 인수 "배열 1" - 값의 첫 번째 범위 - 기계 시간: A2: A14.
  3. 인수 "Array 2" - 값의 두 번째 범위 - 수리 비용: B2:B14. 확인을 클릭합니다.

연결 유형을 결정하려면 계수의 절대 수를 확인해야 합니다(각 활동 필드에는 자체 척도가 있습니다).

여러 매개변수(2개 이상)의 상관관계 분석을 위해서는 "데이터 분석"("분석 패키지" 추가 기능)을 사용하는 것이 더 편리합니다. 목록에서 상관관계를 선택하고 배열을 지정해야 합니다. 모든 것.

결과 계수는 상관 행렬에 표시됩니다. 이 같은:

상관-회귀 분석

실제로 이 두 기술은 종종 함께 사용됩니다.

예시:


이제 회귀 분석 데이터가 표시됩니다.

코스 작업

주제: 상관 분석

소개

1. 상관관계 분석

1.1 상관관계의 개념

1.2 상관관계의 일반적인 분류

1.3 상관 필드와 그 구축 목적

1.4 상관분석의 단계

1.5 상관 계수

1.6 정규화된 Bravais-Pearson 상관 계수

1.7 Spearman의 순위 상관 계수

1.8 상관 계수의 기본 속성

1.9 상관계수의 유의성 확인

1.10 쌍 상관 계수의 임계 값

2. 다변수 실험 계획하기

2.1 문제의 조건

2.2 계획의 중심(주 수준) 및 요인의 변동 수준 결정

2.3 계획 매트릭스 구축

2.4 분산의 균질성과 다른 시리즈의 동일한 측정 정확도 확인

2.5 회귀 방정식의 계수

2.6 재현성 분산

2.7 회귀식 계수의 유의성 확인

2.8 회귀식의 적정성 확인

결론

서지

소개

실험 계획은 실험 연구의 합리적인 구성 방법을 연구하는 수학 및 통계 분야입니다. 최적의 선택연구 중인 요인과 그 목적에 따른 실험의 실제 계획을 정의하여 결과를 분석하는 방법. 실험계획의 시작은 영국의 통계학자인 R. Fisher(1935)의 연구에서 시작되었는데, 그는 합리적인 실험계획이 측정결과의 최적처리 못지않게 추정의 정확성에 있어 상당한 이득을 가져다준다는 점을 강조하였다. 20세기 60년대에는 현대 이론실험 계획. 그 방법은 함수 근사 이론 및 수학 프로그래밍과 밀접하게 관련되어 있습니다. 세워짐 최적의 계획그리고 그들의 속성은 다양한 종류의 모델에 대해 조사됩니다.

실험 계획 - 지정된 요구 사항을 충족하는 실험 계획의 선택, 실험 전략 개발을 목표로 하는 일련의 조치(선험적 정보 획득에서 실행 가능한 수학적 모델 또는 정의 획득에 이르기까지 최적의 조건). 이것은 연구 중인 현상의 메커니즘에 대한 불완전한 지식의 조건에서 구현되는 실험의 의도적인 제어입니다.

측정, 후속 데이터 처리 및 수학적 모델 형태의 결과 공식화 과정에서 오류가 발생하고 원본 데이터에 포함된 정보의 일부가 손실됩니다. 실험 계획 방법을 사용하면 수학적 모델의 오류를 결정하고 적합성을 판단할 수 있습니다. 모델의 정확도가 충분하지 않은 경우 실험 계획 방법을 사용하면 최소한의 비용으로 이전 정보를 잃지 않고 추가 실험을 통해 수학적 모델을 현대화할 수 있습니다.

실험 계획의 목적은 실험을 수행하기 위한 조건과 규칙을 찾는 것으로 대상에 대한 신뢰할 수 있는 정보를 얻을 수 있습니다. 최소 비용정확성에 대한 정량적 평가와 함께 이 정보를 간결하고 편리한 형태로 제공합니다.

에서 사용되는 주요 계획 방법 중 다른 단계연구 용도:

선별 실험 계획, 주요 의미는 추가 세부 연구 대상인 전체 요인에서 중요한 요인 그룹을 선택하는 것입니다.

분산 분석을 위한 실험 설계, 즉 질적 요소가 있는 대상에 대한 계획 작성;

회귀 모델(다항식 및 기타)을 얻을 수 있는 회귀 실험 계획

주요 작업이 연구 대상의 실험적 최적화인 극단적인 실험을 계획합니다.

동적 프로세스 등의 연구 계획

이 분야를 공부하는 목적은 계획 이론 및 현대 정보 기술의 방법을 사용하여 전문 분야의 생산 및 기술 활동을 준비하는 것입니다.

학문의 목표: 연구 현대적인 방법과학 및 산업 실험을 계획, 조직 및 최적화하고 실험을 수행하고 결과를 처리합니다.

1. 상관관계 분석

1.1 상관관계의 개념

연구자는 종종 두 가지 이상의 방법에 관심이 있습니다. 많은 분량하나 이상의 연구 샘플에서 변수. 예를 들어 키가 사람의 체중에 영향을 줄 수 있습니까? 아니면 압력이 제품 품질에 영향을 줄 수 있습니까?

이러한 종류의 변수 간의 관계를 상관 또는 상관이라고 합니다. 상관 관계는 한 특성의 변동성이 다른 특성의 변동성과 일치한다는 사실을 반영하는 두 특성의 일관된 변경입니다.

예를 들어, 평균적으로 사람의 키와 체중 사이에는 양의 관계가 있으며 키가 클수록 사람의 체중이 더 많이 나가는 것으로 알려져 있습니다. 그러나 상대적으로 키가 작은 사람들이 과체중이고 반대로 성장이 느린 무기력한 사람들이 가벼울 때 이 규칙에 대한 예외가 있습니다. 이러한 배제의 이유는 각각의 생물학적, 생리학적 또는 심리적 특성이 환경, 유전, 사회, 생태 등 많은 요인의 영향에 의해 결정되기 때문입니다.

상관 관계는 수학적 통계 방법으로 대표 샘플에서만 연구할 수 있는 확률적 변화입니다. 상관관계와 상관관계 의존성이라는 두 용어는 종종 같은 의미로 사용됩니다. 의존은 영향, 연결을 의미합니다. 수백 가지 이유에 의해 설명될 수 있는 조정된 변경입니다. 상관 관계는 인과 관계의 증거로 간주 될 수 없으며 일반적으로 한 기능의 변경이 다른 기능의 특정 변경을 수반한다는 것을 나타냅니다.

상관 의존성 - 한 기능의 값이 발생 확률에 미치는 변화입니다. 다른 값또 다른 표시.

상관 분석의 작업은 다양한 특징 간의 관계의 방향(양 또는 음)과 형식(선형, 비선형)을 설정하고 그 견고성을 측정하고 마지막으로 얻은 상관 관계의 유의 수준을 확인하는 것으로 축소됩니다. 계수.

상관 관계는 형태, 방향 및 정도(강도)가 다릅니다. .

상관 관계의 모양은 직선 또는 곡선일 수 있습니다. 예를 들어 시뮬레이터의 교육 세션 수와 제어 세션에서 올바르게 해결된 문제 수 사이의 관계는 간단할 수 있습니다. 곡선은 예를 들어 동기 수준과 작업의 효율성 사이의 관계일 수 있습니다(그림 1). 동기 부여가 증가하면 작업의 효율성이 처음에는 증가하고 다음에는 도달합니다. 최적의 수준동기 최대 효율작업 완료; 동기 부여가 더 증가하면 효율성이 감소합니다.

그림 1 - 문제 해결의 효율성과 동기 부여 경향의 강도 사이의 관계

방향에서 상관 관계는 양수("직접") 및 음수("역")일 수 있습니다. 양의 직선 상관 관계를 통해 한 속성의 높은 값은 다른 속성의 높은 값에 해당하고 한 속성의 낮은 값은 다른 속성의 낮은 값에 해당합니다(그림 2). 음의 상관 관계에서는 비율이 반대입니다(그림 3). 양의 상관 관계가 있는 경우 상관 계수는 긍정적인 신호, 음의 상관 관계 - 음의 부호.

그림 2 - 직접적인 상관관계

그림 3 - 역상관


그림 4 - 상관관계 없음

상관의 정도, 강도 또는 견고성은 상관 계수의 값에 의해 결정됩니다. 연결의 강도는 방향에 의존하지 않으며 상관 계수의 절대값에 의해 결정됩니다.

1.2 상관 관계의 일반적인 분류

상관 계수에 따라 다음 상관 관계가 구별됩니다.

상관 계수 r>0.70으로 강하거나 가깝습니다.

중간(0.50에서

보통(0.30에서

약함(0.20에서

매우 약함(r에서<0,19).

1.3 상관 필드와 그 구축 목적

두 특성의 측정값(x i , y i)인 실험 데이터를 기반으로 상관 관계를 연구합니다. 실험 데이터가 거의 없는 경우 2차원 경험적 분포는 x i 및 y i 값의 이중 계열로 표시됩니다. 이 경우, 특징들 간의 상관관계는 다양한 방식으로 기술될 수 있다. 인수와 함수의 대응 관계는 표, 공식, 그래프 등으로 나타낼 수 있습니다.

다른 통계 방법과 마찬가지로 상관 관계 분석은 실험 값 x i 및 y i가 얻어지는 특정 일반 모집단에서 연구된 기능의 동작을 설명하는 확률 모델의 사용을 기반으로 합니다. 미터법 단위(미터, 초, 킬로그램 등) 단위로 그 값을 정확하게 측정할 수 있는 정량적 특성 간의 상관관계를 조사할 때 2차원 정규 분포의 일반 모집단 모델은 매우 자주 채택 된. 이러한 모델은 변수 x i 와 y i 간의 관계를 직교 좌표계에서 점의 궤적으로 그래픽으로 표시합니다. 이 그래픽 종속성은 산점도 또는 상관 필드라고도 합니다.
2차원 정규 분포(상관 필드)의 이 모델을 사용하면 상관 계수에 대한 시각적 그래픽 해석을 제공할 수 있습니다. 집계 분포는 5가지 매개변수에 따라 달라집니다. μ x , μ y – 평균값(수학적 기대치); σ x ,σ y 는 확률 변수 X와 Y의 표준 편차이고 p는 확률 변수 X와 Y 사이의 관계 측정값인 상관 ​​계수입니다.
p \u003d 0이면 2차원 법선 집합에서 얻은 값 x i , y i 는 원으로 둘러싸인 영역 내에서 x, y 좌표의 그래프에 있습니다(그림 5, a). 이 경우 확률 변수 X와 Y 사이에는 상관 관계가 없으며 상관 관계가 없다고 합니다. 2차원 정규분포에서 비상관성은 확률변수 X와 Y의 독립성을 동시에 의미합니다.

객관적으로 존재하는 현상 사이의 관계에 대한 연구는 통계학의 가장 중요한 과제입니다. 종속성에 대한 통계적 연구 과정에서 현상 간의 인과 관계가 드러납니다. 인과 관계는 현상과 과정 사이의 연결이며, 그 중 하나(원인)가 변경되면 다른 하나(결과)가 변경됩니다.

현상의 징후와 과정은 관계를 연구하는 의미에 따라 두 가지로 나뉩니다. 다른 관련 징후의 변화를 일으키는 징후를 계승 , 또는 단순히 요인. 요인 특성의 영향으로 변화하는 특성을 생산적인 .

통계에서 현상과 프로세스의 기능적 및 확률론적(확률적) 연결은 다음과 같이 구분됩니다.

  • 기능의 그들은 요인 속성의 특정 값이 결과 값의 한 값에 해당하는 그러한 관계를 호출합니다.
  • 인과 관계가 각 개별 사례에 나타나지 않지만 일반적으로 평균적으로 많은 수의 관찰이 있으면 그러한 종속성을 호출합니다 확률적(확률적) . 상관 관계는 확률적 연결의 특별한 경우입니다.

게다가, 현상과 그 특징 사이의 연결은 분류됩니다. 조임 정도, 방향성, 분석적 표현에 따라

쪽으로 직접 및 역 관계를 구별하십시오:

  • 직접 연결 - 이것은 요인 속성 값의 증가(감소)와 함께 유효 값의 증가(감소)가 발생하는 관계입니다. 예를 들어 노동 생산성의 증가는 생산 수익성 수준의 증가에 기여합니다.
  • 피드백의 경우 결과 속성의 값은 요인 속성의 영향으로 변경되지만 요인 속성의 변경과 비교하여 반대 방향입니다. 따라서 자본 생산성 수준이 증가하면 단위 생산량당 비용이 감소합니다.

해석적 표현으로 직선(또는 단순히 선형) 연결과 비선형 연결을 구별합니다.

  • 현상 사이의 통계적 관계를 대략적인 직선 방정식으로 나타낼 수 있다면 이를 선형 연결 형식: y=a+bx.
  • 연결이 곡선(포물선, 쌍곡선 등)의 방정식으로 표현될 수 있으면 이러한 연결을 비선형(곡선) 연결 .

의사 소통의 친밀감 결과 특성의 전체 변동에 대한 요인 특성의 영향 정도를 보여줍니다. 타이트함 정도에 따른 커뮤니케이션 분류 표 1에 나와 있습니다.

연결의 존재, 통계에서의 특성 및 방향을 식별하기 위해 병렬 데이터 가져오기, 분석 그룹화, 그래픽, 상관 관계를 확인하는 방법이 사용됩니다. 통계적 관계를 연구하는 주요 방법은 통계적 상관관계 및 회귀분석 기반 커뮤니케이션 모델링 .

상관 관계 - 이것은 무작위 변수 중 하나가 변경되면 다른 하나에 대한 수학적 기대치가 변경되는 엄격한 기능적 특성을 갖지 않는 무작위 변수 간의 통계적 관계입니다. 통계에서 다음 유형의 상관 관계를 구별하는 것이 일반적입니다. :

  • 쌍 상관 - 두 징후 사이의 관계(유효 및 요인 또는 두 요인);
  • 사적 상관 관계 - 다른 요인 특성의 고정 값과 유효 및 한 요인 특성 간의 관계.
  • 다중 상관 관계 - 연구에 포함된 결과 및 둘 이상의 요인 특성의 의존성.

상관분석 업무 두 기호(쌍으로 연결된 연결 포함)와 유효 및 요인 기호 집합(다요소 연결 포함) 사이의 연결 근접성에 대한 정량적 결정입니다.

연결의 견고성은 상관 계수의 값으로 정량적으로 표현되며, 이는 기호 간의 연결의 견고성의 양적 특성을 제공하여 다중 회귀 방정식을 구성할 때 요인 기호의 "유용성"을 결정할 수 있게 합니다. .

상관 관계는 회귀와 상호 연결되어 있습니다. 첫 번째는 통계적 관계의 강도(긴장성)를 평가하고 두 번째는 그 형태를 조사하기 때문입니다.

회귀 분석 회귀 방정식의 형태로 관계의 분석적 표현을 결정하는 것으로 구성됩니다.

회귀 요인 값에 대한 유효 속성의 무작위 값 평균 값의 의존성이라고 하며, 회귀 방정식 - 결과 기호와 하나 이상의 요인 기호 간의 상관 관계를 설명하는 방정식.

쌍 상관이 있는 직선 관계에 대한 상관 및 회귀 분석 공식 표 2에 나와 있습니다.

표 2 - 쌍 상관 관계가 있는 직선 관계에 대한 상관 관계 및 회귀 분석 공식
지시자명칭 및 공식
쌍 상관 관계의 직선 방정식 y x = a +bx, 여기서 b는 회귀 계수입니다.
정규 방정식 시스템 최소제곱 계수를 결정하기 위해 그리고
긴밀한 관계를 결정하기 위한 선형 상관 계수,
그의 해석:
r = 0 - 연결 없음;
0 -1 r = 1 - 기능적 연결
신축성 절대
상대 탄성

"상관 분석의 기초" 주제에 대한 문제 해결의 예

과제 1(쌍상관에 따른 직선관계 분석) . 5명의 작업장 직원의 자격 및 월별 생산량에 대한 데이터가 있습니다.

근로자의 자격과 출력 간의 관계를 연구하려면 선형 관계 방정식과 상관 계수를 결정하십시오. 회귀 및 상관 계수에 대한 해석을 제공하십시오.

해결책 . 제안된 테이블을 확장해 보겠습니다.

직선 방정식의 매개변수를 정의합시다. yx = a+bx. 이를 위해 방정식 시스템을 풉니다.

따라서 회귀 계수는 18입니다.

b는 양수이므로 x와 y 사이에는 직접적인 관계가 있습니다.
a=92-4×18
a=20
선형 관계 방정식의 형식은 y x =20+18x입니다.

연구 된 기능 간의 관계의 견고성 (강도)을 결정하기 위해 다음 공식에 따라 상관 계수 값을 결정합니다.

= (2020-2020×460/5)/(√10×√3280) ≈ 180/181.11=0.99. 상관 계수가 0.7보다 크므로 이 계열의 관계가 강합니다.

작업 2 . 기업에서 제품 가격은 80 루블에서 인하되었습니다. 단위당 최대 60 루블. 가격을 인하한 후 하루 400개에서 500개로 판매가 증가했습니다. 절대 및 상대 탄성을 결정합니다. 추가 가격 인하 가능성(또는 불가능)을 고려하여 탄력성을 평가합니다.

해결책 . 탄력성에 대한 예비 분석을 수행할 수 있는 지표를 계산해 보겠습니다.

보시다시피 가격인하율은 절대값이 수요증가율과 같습니다.

절대 및 상대 탄성은 다음 공식으로 찾을 수 있습니다.

= (500-400)/(60-80) =100/(-20) -5 - 절대 탄성

= (100:400)/(-20:80) = -1 - 상대 탄성

상대탄력성의 계수는 1이다. 이것은 수요증가율이 가격인하율과 같다는 사실을 확인시켜준다. 이러한 상황에서 우리는 가격 인하 전후에 기업이받은 수익을 계산합니다 : 80 * 400 = 32,000 루블. 하루에 60 * 500 = 30,000 루블. 일일 - 우리가 볼 수 있듯이 수익이 감소했으며 더 이상의 가격 인하가 적절하지 않습니다.

심리학 연구 자료의 처리에서 통계적 방법의 사용은 실험 데이터에서 유용한 정보를 추출할 수 있는 좋은 기회를 제공합니다. 가장 일반적인 통계 방법 중 하나는 상관 분석입니다.

"상관"이라는 용어는 "동물의 부분과 기관의 상관 관계의 법칙"을 추론한 프랑스 고생물학자 J. Cuvier에 의해 처음 사용되었습니다(이 법칙을 사용하면 발견된 신체 부분에서 전체 동물의 모양을 복원할 수 있습니다 ). 이 용어는 영국의 생물학자이자 통계학자인 F. Galton에 의해 통계에 도입되었습니다(단순한 "연결"이 아니라 - 관계, 그리고 "연결된 것처럼"- 상관 관계).

상관분석은 상관계수, 2차원 기술통계, 두 변수의 관계(공동변동성)의 정량적 척도를 이용하여 변수 간의 관계에 대한 가설을 검증하는 것이다. 따라서 이것은 확률 변수 또는 특성 간의 상관 관계를 감지하기 위한 일련의 방법입니다.

두 확률 변수에 대한 상관 분석에는 다음이 포함됩니다.

  • 상관 필드를 구축하고 상관 테이블을 컴파일하는 단계;
  • 샘플 상관 계수 및 상관 비율 계산;
  • 관계의 중요성에 대한 통계적 가설을 테스트합니다.

상관 분석의 주요 목적은 연구 중인 두 개 이상의 변수 간의 관계를 식별하는 것이며, 이는 연구 중인 두 특성의 공동 조정된 변화로 간주됩니다. 이 변동성은 모양, 방향 및 강도의 세 가지 주요 특성을 가지고 있습니다.

상관 관계의 형태는 선형 또는 비선형일 수 있습니다. 선형 형식은 상관 관계를 식별하고 해석하는 데 더 편리합니다. 선형 상관의 경우 두 가지 주요 방향, 즉 양수("순방향 연결")와 음수("피드백")를 구별할 수 있습니다.

연결의 강도는 연구된 변수의 관절 변동성이 얼마나 확연한지를 직접 나타냅니다. 심리학에서 현상의 기능적 상호 연결은 해당 기능의 확률적 연결로만 경험적으로 드러날 수 있습니다. 확률 관계의 특성에 대한 시각적 표현은 산점도-축이 두 변수의 값에 해당하고 각 주제가 점인 그래프로 제공됩니다.

상관 계수는 확률 관계의 수치적 특성으로 사용되며 그 값은 -1에서 +1까지 다양합니다. 계산 후 연구원은 원칙적으로 가장 강력한 상관 관계만 선택하여 추가로 해석합니다(표 1).

"충분히 강한" 상관 관계를 선택하는 기준은 상관 계수 자체의 절대값(0.7~1) 또는 통계적 유의 수준에 따라 결정되는 이 계수의 상대 값(0.01~0.1)일 수 있습니다. 표본의 크기. 작은 표본에서는 추가 해석을 위해 통계적 유의 수준에 따라 강한 상관 관계를 선택하는 것이 더 정확합니다. 큰 표본에 대해 수행되는 연구의 경우 상관 계수의 절대 값을 사용하는 것이 좋습니다.

따라서 상관 분석의 작업은 다양한 기능 간의 관계의 방향(양 또는 음)과 형식(선형, 비선형)을 설정하고 견고성을 측정하고 마지막으로 얻은 유의 수준을 확인하는 것으로 축소됩니다. 상관 계수.

현재 많은 다른 상관 계수가 개발되었습니다. 가장 많이 사용되는 아르 자형- 피어슨, 아르 자형-창병과 τ - 켄달. "상관관계" 메뉴의 최신 컴퓨터 통계 프로그램은 정확히 이 세 가지 계수를 제공하며 다른 연구 문제를 해결하기 위해 그룹을 비교하는 방법이 제공됩니다.

상관 계수를 계산하는 방법의 선택은 변수가 속하는 척도의 유형에 따라 다릅니다(표 2).

간격이 있고 명목 척도가 있는 변수의 경우 Pearson 상관 계수(제품 모멘트의 상관 관계)가 사용됩니다. 두 변수 중 하나 이상이 순서 척도를 가지거나 정규 분포가 아닌 경우 Spearman의 순위 상관이 사용됩니다.

t-켄달. 두 변수 중 하나가 이분법이면 점 2계열 상관을 사용할 수 있습니다(통계 컴퓨터 프로그램 SPSS에서는 이 가능성을 사용할 수 없으며 대신 순위 상관 계산을 사용할 수 있음). 두 변수가 이분법적인 경우 4-필드 상관 관계가 사용됩니다(이 유형의 상관 관계는 거리 측정 및 유사성 측정의 정의를 기반으로 SPSS에 의해 계산됨). 이분법이 아닌 두 변수 간의 상관 계수 계산은 두 변수 간의 관계가 선형(단방향)인 경우에만 가능합니다. 예를 들어 연결이 -모양(모호함)인 경우 상관 계수는 연결 강도의 척도로 사용하기에 적합하지 않습니다. 그 값은 0이 되는 경향이 있습니다.

따라서 상관계수를 적용하기 위한 조건은 다음과 같다.

  • 동일한 개체 샘플에서 정량적(순위, 미터법) 척도로 측정된 변수;
  • 변수 간의 관계는 단조적입니다.

상관 분석에 의해 검정되는 주요 통계 가설은 방향성이 없으며 일반 모집단에서 상관 관계가 0이라는 주장을 포함합니다. H 0: r xy= 0. 기각되면 대립가설이 채택됨 H 1: r xy≠ 0 - 계산된 상관 계수의 부호에 따라 양수 또는 음의 상관 관계가 있음.

가설의 수용 또는 거부에 따라 의미 있는 결론이 도출됩니다. 만약, 통계적 테스트 결과에 따르면 H 0: r xy= 0이 수준에서 벗어나지 않으면 의미 있는 결론은 다음과 같습니다. 엑스그리고 와이찾을 수 없습니다. 만약에 H 0 r xy= 0은 수준에서 벗어나는데, 이는 양(음) 관계가 발견되었음을 의미합니다. 엑스그리고 와이. 그러나 밝혀진 상관관계에 대한 해석은 신중하게 접근해야 합니다. 과학적 관점에서 단순히 두 변수 간의 관계를 설정한다고 해서 인과 관계의 존재를 의미하는 것은 아닙니다. 더욱이 상관관계의 존재는 원인과 결과 사이의 순서 관계를 설정하지 않습니다. 이는 단순히 두 변수가 우연의 일치에서 예상되는 것보다 더 많은 관련이 있음을 나타냅니다. 그럼에도 불구하고 인과 관계 연구에서 상관 방법을 사용하는 것은 주의해서 충분히 정당화됩니다. "변수 X가 지표 증가의 이유"와 같은 범주형 구문은 피해야 합니다. 와이". 그러한 진술은 이론적으로 엄격하게 입증되어야 하는 가정으로 공식화되어야 합니다.

각 상관 계수에 대한 수학적 절차에 대한 자세한 설명은 수학 통계 교과서에 나와 있습니다. ; ; 측정 척도의 유형에 따라 이러한 계수를 사용할 가능성을 설명하는 것으로 우리 자신을 제한할 것입니다.

메트릭 변수의 상관관계

동일한 샘플에서 측정된 두 메트릭 변수의 관계를 연구하기 위해 다음을 사용합니다. 상관 계수 아르 자형- 피어슨. 계수 자체는 일반적으로 기호로 표시되는 피처 간의 선형 관계만 존재함을 특징으로 합니다. 엑스그리고 와이. 선형 상관 계수는 모수적 방법이며 측정 결과가 간격의 척도로 제시되고 분석된 변수의 값 분포가 정상과 약간 다를 경우에만 올바른 적용이 가능합니다. 사용이 적절한 상황이 많이 있습니다. 예를 들면: 학생의 지능과 학업 성취도 사이의 연결을 설정합니다. 기분과 문제 상황에서 벗어나는 성공 사이; 소득 수준과 기질 사이 등

피어슨 계수는 심리학 및 교육학에서 널리 사용됩니다. 예를 들어, I. Ya. Kaplunovich와 P. D. Rabinovich, M. P. Nuzhdina의 작업에서 Pearson 선형 상관 계수의 계산은 제시된 가설을 확인하는 데 사용되었습니다.

데이터를 "수동으로" 처리할 때 상관 계수를 계산한 다음 결정해야 합니다. - 유의 수준(데이터 검증을 단순화하기 위해 임계값 테이블이 사용됨 rxy, 이 기준을 사용하여 컴파일됨). Pearson의 선형 상관 계수 값은 +1을 초과할 수 없고 -1보다 작을 수 없습니다. 이 두 숫자 +1과 -1은 상관 계수의 한계입니다. 계산 결과 값이 +1보다 크거나 -1보다 작으면 계산 오류가 발생했음을 나타냅니다.

컴퓨터에서 계산할 때 통계 프로그램(SPSS, Statistica)은 계산된 상관계수를 더 정확한 값으로 함께 제공합니다. -수준.

합격 또는 불합격에 대한 통계적 판단을 위해 H0일반적으로 설정 α = 0.05, 많은 양의 관측치(100개 이상) α = 0.01. 만약에 피 ≤ α, H 0기각되고 연구된 변수(상관관계의 부호에 따라 양수 또는 음수) 간에 통계적으로 유의한(유의한) 관계가 발견되었다는 의미 있는 결론이 내려집니다. 언제 피 > α, H0기각되지 않은 경우 의미 있는 결론은 관계(통계적으로 유의한)가 발견되지 않았다는 진술로 제한됩니다.

연결이 발견되지 않았지만 연결이 실제로 존재한다고 믿을 만한 이유가 있는 경우 연결이 불안정한 이유를 확인해야 합니다.

통신 비선형성– 이를 위해 2차원 산점도를 분석합니다. 관계가 비선형이지만 단조로운 경우 순위 상관 관계로 이동합니다. 만약 관계가 단조롭지 않다면 표본을 관계가 단조로운 부분으로 나누고 표본의 각 부분에 대해 개별적으로 상관관계를 계산하거나 표본을 대조그룹으로 나누어 표현수준에 따라 비교한다. 특성.

하나 또는 두 기능의 분포에서 이상값이 있고 뚜렷한 비대칭이 있습니다.이렇게 하려면 두 기능의 빈도 분포에 대한 히스토그램을 살펴봐야 합니다. 이상치나 비대칭이 있는 경우 이상치를 제외하거나 순위 상관 관계로 전환합니다.

샘플 이질성(2D 산점도 분석). 관계가 다른 방향을 가질 수 있는 부분으로 샘플을 나누십시오.

관계가 통계적으로 유의한 경우 의미 있는 결론을 내리기 전에 잘못된 상관 관계의 가능성을 배제해야 합니다.

  • 이상값으로 인한 연결. 이상치가 있는 경우 상관 관계 순위 지정으로 이동하거나 이상치를 제외합니다.
  • 관계는 세 번째 변수의 영향으로 인한 것입니다.. 유사한 현상이 있을 경우 전체 표본뿐만 아니라 각 그룹별로도 개별적으로 상관관계를 계산할 필요가 있다. "세 번째" 변수가 메트릭인 경우 편상관을 계산합니다.

편상관계수 rxy-z두 변수 간의 관계가 다음과 같다는 가정을 테스트해야 하는 경우 계산됩니다. 엑스그리고 와이세 번째 변수의 영향에 의존하지 않음 . 매우 자주 두 변수는 세 번째 변수의 영향으로 두 변수가 함께 변경된다는 사실 때문에 서로 상관 관계가 있습니다. 즉, 실제로 해당 속성들 사이에는 아무런 관련이 없지만 공통 원인의 영향을 받아 통계적 관계로 나타납니다. 예를 들어, 두 변수의 변동성의 일반적인 원인은 연령대가 다른 그룹에서 다양한 심리적 특성의 관계를 연구할 때 연령일 수 있습니다. 인과관계의 관점에서 편상관을 해석할 때 주의해야 합니다. 와 관련이 있다 엑스그리고 와이, 그리고 편상관 rxy-z 0에 가까우므로 반드시 다음을 따르는 것은 아닙니다. 에 대한 일반적인 이유입니다 엑스그리고 와이.

순위 변수의 상관관계

상관 계수가 정량적 데이터에 허용되지 않는 경우 아르 자형- 피어슨, 그런 다음 예비 순위 지정 후 두 변수의 관계에 대한 가설을 테스트하기 위해 상관 관계를 적용할 수 있습니다. 아르 자형-창병또는 τ -켄달라. 예를 들어, I. A. Lavochkin의 음악적 영재 청소년의 정신신체적 특성에 대한 연구에서는 Spearman 기준이 사용되었습니다.

두 계수(Spearman 및 Kendall)의 올바른 계산을 위해 측정 결과는 순위 또는 간격 척도로 표시되어야 합니다. 이러한 기준 사이에는 근본적인 차이가 없지만 Kendall 계수는 값 쌍 간의 가능한 모든 대응을 통해 정렬하여 변수 간의 관계를 보다 완전하고 상세하게 분석하기 때문에 더 "의미 있는" 것으로 일반적으로 받아들여집니다. Spearman의 계수는 변수 사이의 양적 연관성 정도를 보다 정확하게 고려합니다.

Spearman의 순위 상관 계수고전적인 Pearson 상관 계수의 비모수적 유사체이지만 그 계산은 비교 변수(산술 평균 및 분산)의 분포 관련 지표가 아니라 순위를 고려합니다. 예를 들어, "나는 진짜다"와 "나는 이상적이다"라는 사람의 생각에 포함된 성격 특성의 순위 평가 사이의 관계를 결정할 필요가 있습니다.

Spearman 계수는 심리학 연구에서 널리 사용됩니다. 예를 들어, Yu. V. Bushov와 N. N. Nesmelova의 작업에서 : 사람의 개별 특성에 대한 소리 신호의 지속 시간 추정 및 재생 정확도의 의존성을 연구하는 데 사용 된 사람은 바로 그 사람이었습니다.

이 계수는 유사하기 때문에 아르 자형-Pearson, 가설을 검증하기 위해 그것을 사용하는 것은 계수를 사용하는 것과 유사합니다. 아르 자형- 피어슨. 즉, 검증된 통계적 가설, 통계적 결정을 내리는 절차 및 의미 있는 결론의 공식화가 동일합니다. 컴퓨터 프로그램(SPSS, Statistica)에서 동일한 계수에 대한 유의 수준 아르 자형- 피어슨과 아르 자형-Spearman은 항상 일치합니다.

비율 이점 아르 자형- 스피어맨 대 비율 아르 자형-Pearson - 의사 소통에 더 민감합니다. 다음과 같은 경우에 사용합니다.

  • 정규형(왜도, 이상치)에서 적어도 하나의 변수 분포에 상당한 편차가 있음;
  • 곡선(단조) 연결의 모양.

계수 적용 제한 아르 자형- 스피어맨은 다음과 같습니다.

  • 각 변수에 대해 최소 5개의 관측값;
  • 하나 또는 두 변수 모두에서 동일한 순위가 많은 계수는 거친 값을 제공합니다.

순위 상관 계수 τ -켄달라동일하거나 다른 경향(값의 증가 또는 감소)을 갖는 두 샘플의 값 쌍의 비율 계산을 기반으로 하는 독립적인 독창적인 방법입니다. 이 비율은 또한 일치 요인. 따라서이 방법의 주요 아이디어는 쌍으로 주제를 비교하여 관계의 방향을 판단 할 수 있다는 것입니다. 엑스의 변화와 방향이 일치한다. 와이, 이것은 긍정적인 관계를 나타내며 일치하지 않으면 부정적인 관계입니다. 이 방법에서 하나의 변수는 크기의 오름차순으로 단조로운 시퀀스(예: 남편의 데이터)로 표시됩니다. 다른 변수(예: 아내의 데이터)에는 해당 순위가 지정됩니다. 역전의 수(첫 번째 행과 비교한 단조성의 위반)는 상관 계수 공식에 사용됩니다.

계산할 때 τ- Kendall "수동" 데이터는 먼저 변수별로 정렬됩니다. 엑스. 그런 다음 각 과목에 대해 자신의 순위가 몇 번인지 계산됩니다. 와이아래 과목의 순위보다 낮은 것으로 판명되었습니다. 결과는 일치 열에 기록됩니다. "우연" 열의 모든 값의 합은 다음과 같습니다. - 총 일치 수는 Kendall 계수를 계산하기 위한 공식으로 대체됩니다. 이는 계산적으로 더 간단하지만 다음과 대조적으로 표본이 증가함에 따라 아르 자형- Spearman, 계산량은 비례하여 증가하는 것이 아니라 기하급수적으로 증가합니다. 예를 들어, 언제 N= 12 66쌍의 주제를 분류해야 하며, N= 489 - 이미 1128 쌍, 즉 계산량이 17 배 이상 증가합니다. 통계 프로그램(SPSS, Statistica)의 컴퓨터에서 계산할 때 Kendall 계수는 계수와 유사하게 계산됩니다. 아르 자형-창병과 아르 자형- 피어슨. 계산된 상관 계수 τ - Kendall은 보다 정확한 값이 특징입니다. -수준.

원본 데이터에 이상치가 있는 경우 Kendall 계수를 적용하는 것이 좋습니다.

순위 상관 계수의 특징은 최대 순위 상관(+1, -1)이 원래 변수 간의 엄격한 직접 또는 반비례 관계에 반드시 해당하지 않는다는 것입니다. 엑스그리고 와이: 그들 사이의 단조로운 기능적 연결만 있으면 충분합니다. 순위 상관 관계는 한 변수의 큰 값이 항상 다른 변수의 큰 값(+1)에 해당하거나 한 변수의 큰 값이 항상 다른 변수의 작은 값에 해당하고 그 반대의 경우(-1) 최대 모듈로 값에 도달합니다. ).

검정할 통계적 가설, 통계적 결정을 내리는 절차 및 의미 있는 결론의 공식화는 경우와 동일 아르 자형-창병 또는 아르 자형- 피어슨.

통계적으로 유의한 관계가 발견되지 않았지만 실제로 관계가 있다고 믿을 만한 이유가 있는 경우 먼저 계수에서 이동해야 합니다.

아르 자형- 스피어맨 대 비율 τ -Kendall(또는 그 반대로)을 선택한 다음 연결이 불안정한 가능한 이유를 확인합니다.

  • 통신 비선형성: 이렇게 하려면 2D 산점도를 보십시오. 관계가 단조롭지 않으면 표본을 관계가 단조로운 부분으로 나누거나 표본을 대조 그룹으로 나눈 다음 특성의 표현 수준에 따라 비교합니다.
  • 샘플 이질성: 2차원 산점도를 보고 샘플을 관계가 다른 방향을 가질 수 있는 부분으로 나누십시오.

관계가 통계적으로 유의하면 의미 있는 결론을 내리기 전에 잘못된 상관 가능성을 배제해야 합니다(메트릭 상관 계수와 유사).

이분법적 변수의 상관관계

이분 척도로 측정된 두 변수를 비교할 때 상관의 척도는 이분 데이터에 대한 상관 계수인 소위 계수 j입니다.

계수 φ+1과 -1 사이에 있습니다. 이것은 양수 및 음수 모두일 수 있으며 이분법적으로 측정된 두 피쳐 간의 연결 방향을 특성화합니다. 그러나 φ의 해석은 특정 문제를 일으킬 수 있습니다. 계수 φ를 계산하는 방식에 포함된 이분법 데이터는 2차원 법선 표면처럼 보이지 않으므로 해석된 값이 rxy\u003d 0.60과 φ \u003d 0.60은 동일합니다. 계수 φ는 코딩 방법과 소위 4필드 테이블 또는 분할 테이블을 사용하여 계산할 수 있습니다.

상관 계수 φ를 적용하려면 다음 조건이 충족되어야 합니다.

  • 비교되는 특성은 이분법적 척도로 측정되어야 합니다.
  • 엑스그리고 와이동일해야합니다.

이러한 유형의 상관 관계는 거리 측정 및 유사성 측정의 정의를 기반으로 SPSS 컴퓨터 프로그램에서 계산됩니다. 요인 분석, 군집 분석, 다변량 척도화와 같은 일부 통계 절차는 이러한 측정의 적용을 기반으로 하며, 때로는 그 자체가 유사성 측정을 계산하기 위한 추가 가능성을 제공합니다.

하나의 변수를 이분법적 척도(변수 엑스), 다른 하나는 구간 또는 비율 척도(변수 와이), 사용 이차 상관 계수예를 들어, 키와 체중에 대한 아동의 성별 효과에 대한 가설을 테스트할 때. 이 계수는 -1에서 +1까지 다양하지만 부호는 결과 해석에 중요하지 않습니다. 사용하려면 다음 조건이 충족되어야 합니다.

  • 비교 징후는 다른 척도로 측정해야 합니다. 엑스- 이분법적 규모로; 또 다른 와이- 간격 또는 비율의 척도로;
  • 변하기 쉬운 와이정규 분포 법칙이 있습니다.
  • 비교 변수의 다양한 기능 수 엑스그리고 와이동일해야합니다.

만약 변수 엑스이분법적 척도로 측정된 변수 와이순위 척도(변수 와이), 사용할 수 있습니다 순위-이차 상관 계수, 이는 Kendall의 τ와 밀접하게 관련되어 있으며 정의에서 우연과 역전의 개념을 사용합니다. 결과에 대한 해석은 동일합니다.

SPSS 및 Statistica 컴퓨터 프로그램을 사용하여 상관 분석을 수행하는 것은 간단하고 편리한 작업입니다. 이렇게 하려면 이변량 상관 관계 대화 상자(Analyze>Correlate>Bivariate…)를 호출한 후 연구 중인 변수를 Variables 필드로 이동하고 변수 간의 상관 관계를 감지할 방법을 선택해야 합니다. 결과 출력 파일에는 계산된 각 기준에 대한 정사각형 테이블(상관관계)이 포함되어 있습니다. 표의 각 셀에는 상관 계수(상관 계수)의 바로 그 값, 계산된 계수 Sig의 통계적 유의성, 피험자 수가 포함됩니다.

결과 상관 테이블의 표제 및 측면 열에는 변수의 이름이 포함됩니다. 변수 자체와의 상관 관계가 최대이므로 테이블의 대각선(왼쪽 위 - 오른쪽 아래 모서리)은 단위로 구성됩니다. 테이블은 이 대각선에 대해 대칭입니다. 프로그램에서 "유의한 상관 관계 표시" 확인란을 선택하면 통계적으로 유의한 계수가 최종 상관 관계 테이블에 표시됩니다. 0.05 이하 수준에서 별표(*) 하나, 0.01 수준에서 - 별표 두 개(**).

요약하자면 상관 분석의 주요 목적은 변수 간의 관계를 식별하는 것입니다. 연결의 척도는 상관 계수이며, 선택은 변수가 측정되는 척도의 유형, 비교된 변수의 다양한 기능 수 및 변수의 분포에 직접적으로 의존합니다. 두 변수 사이에 상관관계가 있다고 해서 두 변수 사이에 인과관계가 있는 것은 아닙니다. 상관관계가 인과관계를 직접적으로 나타내지는 않지만 원인에 대한 단서가 될 수 있습니다. 이를 바탕으로 가설을 세울 수 있습니다. 어떤 경우에는 상관관계의 결여가 인과관계 가설에 더 깊은 영향을 미칩니다. 두 변수의 상관 관계가 0이면 한 변수가 다른 변수에 미치는 영향이 없음을 나타낼 수 있습니다.

공유하다