Scorul de corelare. Corelații în teze în psihologie

În prezența a două serii de valori supuse clasamentului, este rațional să se calculeze corelația de rang a lui Spearman.

Astfel de serii pot fi reprezentate:

  • o pereche de trăsături determinate în același grup de obiecte studiate;
  • o pereche de trăsături subordonate individuale determinate în 2 obiecte studiate de același set de trăsături;
  • o pereche de caracteristici subordonate grupului;
  • subordonarea individuală şi de grup a semnelor.

Metoda presupune ierarhizarea indicatorilor separat pentru fiecare dintre caracteristici.

Cel mai puțin important este cel mai jos rang.

Această metodă se referă la o metodă statistică neparametrică menită să stabilească existența unei legături între fenomenele studiate:

  • determinarea gradului real de paralelism între două serii de date cantitative;
  • evaluarea strângerii relației identificate, exprimată în termeni cantitativi.

Analiza corelației

O metodă statistică concepută pentru a identifica existența unei relații între 2 sau mai multe variabile aleatoare(variabile), precum și puterea sa, a fost numit analiza corelației.

Și-a luat numele de la corelatio (lat.) - ratio.

Când îl utilizați, sunt posibile următoarele scenarii:

  • prezența unei corelații (pozitive sau negative);
  • nici o corelație (zero).

În cazul stabilirii unei relaţii între variabile este vorba despre corelarea lor. Cu alte cuvinte, putem spune că, cu o modificare a valorii lui X, se va observa în mod necesar o modificare proporțională a valorii lui Y.

Ca instrumente sunt folosite diverse măsuri de comunicare (coeficienți).

Alegerea lor este influențată de:

  • o modalitate de a măsura numere aleatorii;
  • natura relației dintre numere aleatoare.

Existența unei corelații poate fi afișată grafic (grafice) și folosind un coeficient (afișare numerică).

Corelația se caracterizează prin următoarele caracteristici:

  • rezistența de legătură (cu un coeficient de corelație de la ± 0,7 la ± 1 - puternică; de la ± 0,3 la ± 0,699 - medie; de ​​la 0 la ± 0,299 - slab);
  • direcția de comunicare (înainte sau înapoi).

Obiectivele analizei corelației

Analiza corelației nu permite stabilirea unei relații cauzale între variabilele studiate.

Se realizează cu scopul de a:

  • stabilirea dependențelor între variabile;
  • obținerea de informații specifice despre o variabilă pe baza unei alte variabile;
  • determinarea etanșeității (legăturii) acestei dependențe;
  • determinarea direcţiei conexiunii stabilite.

Metode de analiză a corelației


Această analiză se poate face folosind:

  • metoda pătratelor sau Pearson;
  • metoda rangului sau Spearman.

Metoda lui Pearson este aplicabilă pentru calculele care necesită definiție precisă forța care există între variabile. Caracteristicile studiate cu ajutorul lui trebuie exprimate doar cantitativ.

Pentru a aplica metoda Spearman sau corelarea rangului, nu există cerințe stricte în exprimarea caracteristicilor - poate fi atât cantitativă, cât și atributivă. Datorită acestei metode, se obțin informații nu despre stabilirea exactă a rezistenței conexiunii, ci având un caracter orientativ.

Rândurile de variabile pot conține variante deschise. De exemplu, atunci când experiența de muncă este exprimată prin valori precum până la 1 an, mai mult de 5 ani etc.

Coeficient de corelație

Valoarea statistică care caracterizează natura modificării a două variabile se numește coeficient de corelație sau coeficient de corelație de pereche. În termeni cantitativi, variază de la -1 la +1.

Cele mai frecvente cote sunt:

  • Pearson- aplicabil pentru variabilele apartinand scalei intervalului;
  • Spearman- pentru variabilele de scară ordinală.

Limitări ale utilizării coeficientului de corelație

Obținerea de date nesigure la calcularea coeficientului de corelație este posibilă în cazurile în care:

  • sunt disponibile un număr suficient de valori variabile (25-100 de perechi de observații);
  • între variabilele studiate, de exemplu, se stabilește o relație pătratică, și nu una liniară;
  • în fiecare caz, datele conțin mai mult de o observație;
  • prezența unor valori anormale (outliers) ale variabilelor;
  • datele investigate constau din subgrupuri de observații clar distincte;
  • prezenţa unei corelaţii nu ne permite să stabilim care dintre variabile poate fi considerată ca o cauză, şi care ca o consecinţă.

Verificarea semnificației corelației

Pentru evaluarea mărimilor statistice se folosește conceptul de semnificație sau fiabilitate a acestora, care caracterizează probabilitatea apariției aleatorii a unei mărimi sau a valorilor sale extreme.

Cea mai comună metodă de determinare a semnificației unei corelații este determinarea testului Student.

Valoarea acestuia este comparată cu valoarea tabelară, numărul de grade de libertate este luat ca 2. Când valoarea calculată a criteriului este mai mare decât valoarea tabelară, indică semnificația coeficientului de corelație.

La efectuarea calculelor economice, un nivel de încredere de 0,05 (95%) sau 0,01 (99%) este considerat suficient.

Spearman se clasează

Coeficientul de corelare a rangului lui Spearman face posibilă stabilirea statistică a prezenței unei legături între fenomene. Calculul său implică stabilirea unui număr de serie pentru fiecare caracteristică - un rang. Rangul poate fi fie în creștere, fie în scădere.

Numărul de caracteristici care trebuie clasate poate fi orice număr. Acesta este un proces destul de laborios care limitează numărul acestora. Dificultățile încep când ajungi la 20 de semne.

Pentru a calcula coeficientul Spearman, utilizați formula:

în care:

n - afișează numărul de caracteristici clasate;

d nu este altceva decât diferența dintre rangurile din două variabile;

iar ∑ (d2) este suma pătratelor diferențelor de rang.

Analiza corelației în psihologie

Suport statistic cercetare psihologică vă permite să le faceți mai obiective și mai reprezentative. Prelucrarea statistică a datelor obținute în cursul experimentelor psihologice contribuie la extragerea unui maxim de informații utile.

Analiza corelației este cea mai utilizată în procesarea rezultatelor acestora.

Este oportun să se efectueze o analiză de corelare a rezultatelor obținute în timpul cercetării:

  • anxietatea (după testele lui R. Temml, M. Dorca, V. Amen);
  • relațiile de familie („Chestionarul „Analiza relațiilor de familie” (DIA) al EG Eidemiller, VV Yustitskis);
  • nivelul de internalitate-externalitate (chestionar al lui EF Bazhin, EA Golynkina și AM Etkind);
  • nivelul de burnout emoțional în rândul profesorilor (chestionar de V.V. Boyko);
  • legătura dintre elementele inteligenței verbale a elevilor în diferite pregătiri de specialitate (metoda lui K.M. Gurevich și alții);
  • relația dintre nivelul de empatie (metoda lui V.V. Boyko) și satisfacția față de căsătorie (chestionarul lui V.V. Stolin, T.L. Romanova, G.P. Butenko);
  • relația dintre statutul sociometric al adolescenților (testul Jacob L. Moreno) și particularitățile stilului de educație familială (chestionarul lui E.G. Eidemiller, V.V. Yustitskis);
  • structura obiectivelor de viață ale adolescenților crescuți în familii complete și incomplete (chestionar Edward L. Deci, Richard M. Ryan Ryan).

Scurte instrucțiuni pentru efectuarea analizei de corelație după criteriul lui Spearman

Se efectuează analiza corelației folosind metoda lui Spearman conform următorului algoritm:

  • semnele comparabile pereche sunt situate pe 2 rânduri, dintre care unul este indicat cu X, iar celălalt cu Y;
  • valorile seriei X sunt dispuse în ordine crescătoare sau descrescătoare;
  • succesiunea de aranjare a valorilor seriei Y este determinată de corespondența dintre valorile seriei X;
  • pentru fiecare valoare din rândul X, determinați rangul - atribuiți un număr secvenţial de la valoarea minimă la maximă;
  • pentru fiecare dintre valorile din seria Y determinați și rangul (de la minim la maxim);
  • calculați diferența (D) dintre rangurile lui X și Y, folosind formula D = X-Y;
  • valorile diferenței rezultate sunt pătrate;
  • efectuați însumarea pătratelor diferențelor de rang;
  • efectuați calcule folosind formula:

Exemplu de corelație Spearman

Este necesar să se stabilească prezența unei corelații între experiența de muncă și rata accidentării dacă sunt disponibile următoarele date:

Cel mai metoda potrivita analiza este metoda rangului, deoarece unul dintre semne este prezentat sub formă de opțiuni deschise: experiență de muncă de până la 1 an și experiență de muncă de 7 sau mai mulți ani.

Soluția problemei începe cu clasarea datelor, care sunt compilate într-o foaie de lucru și pot fi efectuate manual, deoarece volumul lor nu este mare:

Experiență de muncă Numărul de răni Numere de serie (clasamente) Diferența de ranguri Diferența de rang la pătrat
d (x-y)
pana la 1 an 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 și mai mult 6 5 1 +4 16
Σ d2 = 38,5

Apariția rangurilor fracționale în coloană se datorează faptului că în cazul apariției unor variante de aceeași dimensiune se găsește media aritmetică a rangului. În acest exemplu, rata accidentării de 12 apare de două ori și i se atribuie rangurile 2 și 3, găsim media aritmetică a acestor ranguri (2 + 3) / 2 = 2,5 și punem această valoare în foaia de lucru pentru 2 indicatori.
După ce am efectuat înlocuirea valorilor obținute în formula de lucru și efectuând calcule simple, obținem coeficientul Spearman egal cu -0,92

O valoare negativă a coeficientului indică prezența părereîntre semne și ne permite să afirmăm că o scurtă experiență de muncă este însoțită de un numar mare leziuni. Mai mult, puterea conexiunii dintre acești indicatori este destul de mare.
Următorul pas în calcule este de a determina fiabilitatea coeficientului obținut:
eroarea lui și testul t Student sunt calculate

Analiza de regresie și corelație - metode de cercetare statistică. Acestea sunt cele mai comune moduri de a arăta cum un parametru depinde de una sau mai multe variabile independente.

Mai jos pe specific exemple practice Luați în considerare aceste două analize care sunt foarte populare în rândul economiștilor. Și, de asemenea, vom da un exemplu de obținere a rezultatelor atunci când acestea sunt combinate.

Analiza de regresie în Excel

Afișează efectul unor valori (independente, independente) asupra variabilei dependente. De exemplu, modul în care numărul populației active din punct de vedere economic depinde de numărul de întreprinderi, de mărimea salariilor și de alți parametri. Sau: cum afectează investițiile străine, prețurile la energie etc. nivelul PIB-ului.

Rezultatul analizei vă permite să stabiliți priorități. Și pe baza factorilor principali, anticipați, planificați dezvoltarea zonelor prioritare, luați decizii de management.

Are loc regresia:

  • liniară (y = a + bx);
  • parabolic (y = a + bx + cx 2);
  • exponențial (y = a * exp (bx));
  • putere (y = a * x ^ b);
  • hiperbolic (y = b / x + a);
  • logaritmică (y = b * 1n (x) + a);
  • exponențial (y = a * b ^ x).

Să ne uităm la un exemplu de construire a unui model de regresie în Excel și de interpretare a rezultatelor. Hai sa luam tip liniar regresie.

Sarcină. La 6 întreprinderi, media lunară salariuși numărul de angajați care au demisionat. Este necesar să se determine dependența numărului de angajați care renunță la salariul mediu.

Model regresie liniara arata asa:

Y = a 0 + a 1 x 1 + ... + a k x k.

Unde a - coeficienți de regresie, x - variabile de influență, k - numărul de factori.

În exemplul nostru, Y este indicatorul angajaților care au demisionat. Factorul de influență este salariul (x).

Excel are funcții încorporate pe care le puteți utiliza pentru a calcula parametrii unui model de regresie liniară. Dar programul de completare Analysis Package o va face mai repede.

Activăm un instrument analitic puternic:

La activare, programul de completare va fi disponibil în fila „Date”.

Acum să trecem direct la analiza de regresie.



În primul rând, acordați atenție pătratului R și coeficienților.

R-pătratul este coeficientul de determinare. În exemplul nostru - 0,755 sau 75,5%. Aceasta înseamnă că parametrii calculați ai modelului explică relația dintre parametrii studiați cu 75,5%. Cu cât coeficientul de determinare este mai mare, cu atât modelul este mai bun. Bun - peste 0,8. Rău - mai puțin de 0,5 (o astfel de analiză nu poate fi considerată rezonabilă). În exemplul nostru - „nu e rău”.

Coeficientul 64,1428 arată ce va fi Y dacă toate variabilele din modelul luat în considerare sunt egale cu 0. Adică alți factori care nu sunt descriși în model afectează și valoarea parametrului analizat.

Coeficientul -0,16285 arată ponderea variabilei X pe Y. Adică salariul mediu lunar în cadrul acestui model influențează numărul de persoane care renunță cu o pondere de -0,16285 (acesta este un grad mic de influență). Semnul „-” indică influență negativă: cu cât salariul este mai mare, cu atât este mai mic numărul de renunțători. Ceea ce este corect.



Analiza corelației în Excel

Analiza corelației ajută la stabilirea dacă există o relație între indicatorii din unul sau două eșantioane. De exemplu, între timpul de funcționare al mașinii și costul reparațiilor, prețul echipamentului și durata de funcționare, înălțimea și greutatea copiilor etc.

Dacă există o relație, atunci dacă o creștere a unui parametru duce la o creștere (corelație pozitivă) sau o scădere (negativă) a celuilalt. Analiza corelației ajută analistul să determine dacă valoarea unui indicator poate prezice valoarea posibilă a altuia.

Coeficientul de corelație se notează cu r. Variază de la +1 la -1. Clasificarea corelaţiilor pentru diferite sfere va fi diferit. Când coeficientul este 0, nu există o relație liniară între eșantioane.

Să vedem cum să folosiți instrumentele Excel pentru a găsi coeficientul de corelație.

Pentru a găsi coeficienți perechi, este utilizată funcția CORREL.

Obiectiv: Stabiliți dacă există o relație între orele de lucru strungși costul întreținerii acestuia.

Punem cursorul în orice celulă și apăsăm butonul fx.

  1. În categoria „Statistică”, selectați funcția CORREL.
  2. Argumentul matricei 1 - primul interval de valori - timpul de funcționare a mașinii: A2: A14.
  3. Argumentul matricei 2 - al doilea interval de valori - costul reparației: B2: B14. Faceți clic pe OK.

Pentru a determina tipul de conexiune, trebuie să vă uitați la numărul absolut al coeficientului (fiecare domeniu de activitate are propria sa scară).

Pentru analiza corelației mai multor parametri (mai mult de 2), este mai convenabil să utilizați Data Analysis (Analysis Package add-in). În listă, trebuie să selectați o corelație și să desemnați o matrice. Tot.

Coeficienții obținuți vor fi afișați în matricea de corelație. Ca aceasta:

Analiza corelației-regresiune

În practică, aceste două tehnici sunt adesea folosite împreună.

Exemplu:


Acum sunt vizibile și datele de regresie.

LUCRARE DE CURS

Tema: Analiza corelației

Introducere

1. Analiza corelației

1.1 Conceptul de corelare

1.2 Clasificarea generală a corelațiilor

1.3 Câmpuri de corelație și scopul construcției lor

1.4 Etapele analizei corelației

1.5 Coeficienți de corelație

1.6 Coeficientul de corelație normalizat Brave-Pearson

1.7 Coeficientul de corelare a rangului lui Spearman

1.8 Proprietăți de bază ale coeficienților de corelație

1.9 Verificarea semnificației coeficienților de corelație

1.10 Valori critice ale coeficientului de corelație de pereche

2. Planificarea unui experiment multivariat

2.1 Stare de problemă

2.2 Determinarea centrului planului (nivel de bază) și a nivelului de variație a factorilor

2.3 Construirea unei matrice de planificare

2.4 Verificarea omogenității dispersiei și uniformității măsurătorilor în diferite serii

2.5 Coeficienții ecuației de regresie

2.6 Dispersia reproductibilității

2.7 Verificarea semnificației coeficienților ecuației de regresie

2.8 Verificarea adecvării ecuaţiei de regresie

Concluzie

Bibliografie

INTRODUCERE

Planificarea experimentelor este o disciplină matematică și statistică care studiază metode de organizare rațională a cercetării experimentale - de la alegere optimă factorii în studiu și definirea planului propriu-zis al experimentului în conformitate cu scopul acestuia la metodele de analiză a rezultatelor. Începutul planificării experimentului a fost pus de lucrările statisticianului englez R. Fisher (1935), care a subliniat că planificarea rațională a experimentului dă un câștig nu mai puțin semnificativ în acuratețea estimărilor decât prelucrarea optimă a măsurătorii. rezultate. În anii 60 ai secolului XX, a existat teoria modernă planificarea unui experiment. Metodele sale sunt strâns legate de teoria aproximării funcțiilor și de programare matematică. Construit planuri optimeși a investigat proprietățile lor pentru o clasă largă de modele.

Planificarea experimentului - alegerea unui plan de experiment care să îndeplinească cerințele specificate, un set de acțiuni care vizează dezvoltarea unei strategii de experimentare (de la obținerea de informații a priori până la obținerea unui model matematic funcțional sau determinarea conditii optime). Acesta este controlul intenționat al experimentului, care se realizează în condiții de cunoaștere incompletă a mecanismului fenomenului studiat.

În procesul de măsurători, prelucrarea ulterioară a datelor, precum și formalizarea rezultatelor sub forma unui model matematic, apar erori și o parte din informațiile conținute în datele inițiale se pierd. Utilizarea metodelor de planificare experimentală vă permite să determinați eroarea modelului matematic și să judecați adecvarea acestuia. Dacă acuratețea modelului se dovedește a fi insuficientă, atunci utilizarea metodelor de planificare experimentală vă permite să modernizați modelul matematic cu experimente suplimentare fără a pierde informațiile anterioare și cu costuri minime.

Scopul planificării experimentului este de a găsi astfel de condiții și reguli pentru efectuarea experimentelor în care este posibil să se obțină informații fiabile și de încredere despre un obiect cu cel mai mic cost muncă, precum și să prezinte aceste informații într-o formă compactă și convenabilă cu o evaluare cantitativă a acurateței.

Printre principalele metode de planificare utilizate în diferite etape cercetare utilizeaza:

Planificarea unui experiment de screening, a cărui semnificație principală este selecția din întregul set de factori a unui grup de factori esențiali care sunt supuși unui studiu mai detaliat;

Proiectarea unui experiment pentru analiza varianței, de ex. intocmirea de planuri pentru obiecte cu factori de calitate;

Planificarea unui experiment de regresie care vă permite să obțineți modele de regresie (polinom și altele);

Planificarea unui experiment extrem, în care sarcina principală este optimizarea experimentală a obiectului de cercetare;

Planificarea în studiul proceselor dinamice etc.

Scopul studierii disciplinei este de a pregăti studenții pentru activități de producție și tehnice din specialitatea lor folosind metodele teoriei planificării și tehnologiile informaționale moderne.

Obiectivele disciplinei: studiu metode moderne planificarea, organizarea și optimizarea unui experiment științific și industrial, efectuarea experimentelor și prelucrarea rezultatelor obținute.

1. ANALIZA CORELATIEI

1.1 Conceptul de corelare

Cercetătorul este adesea interesat de modul în care două sau cantitate mare variabile dintr-una sau mai multe probe studiate. De exemplu, înălțimea poate afecta greutatea unei persoane sau presiunea poate afecta calitatea produsului?

Acest tip de relație între variabile se numește corelație sau corelație. Corelația este o schimbare consistentă a două trăsături, reflectând faptul că variabilitatea unei trăsături este în concordanță cu variabilitatea celeilalte.

Se știe, de exemplu, că, în medie, există o relație pozitivă între înălțimea oamenilor și greutatea lor și astfel încât, cu cât înălțimea este mai mare, cu atât greutatea unei persoane este mai mare. Cu toate acestea, există excepții de la această regulă atunci când persoanele relativ scunde sunt supraponderale și, dimpotrivă, astenicii, cu creștere mare, sunt ușoare. Motivul pentru astfel de excepții este că fiecare semn biologic, fiziologic sau psihologic este determinat de influența mai multor factori: de mediu, genetici, sociali, ecologici etc.

Legăturile de corelație sunt modificări probabilistice care pot fi studiate numai pe eșantioane reprezentative prin metode de statistică matematică. Ambii termeni - corelație și corelație - sunt adesea folosiți în mod interschimbabil. Dependența implică influență, legătura implică orice schimbare agreată care poate fi atribuită sutelor de motive. Relațiile de corelație nu pot fi considerate ca dovezi ale unei relații cauzale, ele indică doar că schimbările într-o trăsătură, de regulă, sunt însoțite de anumite schimbări în alta.

Dependența de corelație - acestea sunt modificări care introduc valorile unei caracteristici în probabilitatea de apariție sensuri diferite alt semn.

Sarcina analizei corelației se reduce la stabilirea direcției (pozitive sau negative) și a formei (liniare, neliniare) a relației dintre semne variabile, măsurarea etanșeității acesteia și, în final, la verificarea nivelului de semnificație al coeficienților de corelație obținuți.

Legăturile de corelație diferă ca formă, direcție și grad (putere) .

În formă, corelația poate fi dreaptă sau curbă. De exemplu, relația dintre numărul de antrenamente pe simulator și numărul de probleme rezolvate corect în sesiunea de control poate fi simplă. De exemplu, relația dintre nivelul de motivație și eficacitatea performanței sarcinii poate fi curbiliniară (Figura 1). Odată cu creșterea motivației, eficiența performanței sarcinii crește mai întâi, apoi este atinsă nivel optim motivație, care corespunde eficienta maxima finalizarea sarcinii; o creștere suplimentară a motivației este deja însoțită de o scădere a eficienței.

Figura 1 - Relația dintre eficacitatea rezolvării problemei și puterea tendinței motivaționale

În direcția corelației, conexiunea poate fi pozitivă ("directă") și negativă ("inversă"). Cu o corelație dreaptă pozitivă, valorile mai mari ale unei caracteristici corespund unor valori mai mari ale alteia, iar valorile mai mici ale unei caracteristici corespund unor valori mai mici ale alteia (Figura 2). Cu o corelație negativă, rapoartele sunt inversate (Figura 3). Cu o corelație pozitivă, coeficientul de corelație are semn pozitiv, cu corelație negativă - semn negativ.

Figura 2 - Corelație directă

Figura 3 - Corelație inversă


Figura 4 - Lipsa corelației

Gradul, rezistența sau etanșeitatea corelației este determinată de valoarea coeficientului de corelație. Rezistența conexiunii nu depinde de direcția acesteia și este determinată de valoarea absolută a coeficientului de corelație.

1.2 Clasificarea generală a corelaţiilor

În funcție de coeficientul de corelație, se disting următoarele corelații:

Puternic sau strâns cu un coeficient de corelație r> 0,70;

Medie (la 0,50

Moderat (la 0.30

Slab (la 0,20

Foarte slab (la r<0,19).

1.3 Câmpuri de corelație și scopul construcției lor

Corelația este studiată pe baza datelor experimentale, care sunt valori măsurate (x i, y i) a două caracteristici. Dacă datele experimentale sunt puține, atunci distribuția empirică bivariată este reprezentată ca o serie dublă de valori x i și y i. În acest caz, dependența de corelație dintre caracteristici poate fi descrisă în moduri diferite. Corespondența dintre un argument și o funcție poate fi specificată printr-un tabel, formulă, grafic etc.

Analiza corelației, ca și alte metode statistice, se bazează pe utilizarea modelelor probabilistice care descriu comportamentul caracteristicilor studiate într-o anumită populație generală, din care se obțin valorile experimentale x i și y i. Atunci când se investighează corelația dintre caracteristicile cantitative ale căror valori pot fi măsurate cu precizie în unități de scări metrice (metri, secunde, kilograme etc.), atunci modelul unei populații generale bidimensionale distribuite normal este foarte des. adoptat. Un astfel de model afișează grafic relația dintre variabilele x i și y i sub forma unui loc de puncte într-un sistem de coordonate dreptunghiular. Această diagramă este numită și diagramă de dispersie sau câmp de corelație.
Acest model al unei distribuții normale bidimensionale (câmp de corelație) vă permite să oferiți o interpretare vizuală grafică a coeficientului de corelație, deoarece distribuția în agregat depinde de cinci parametri: μ x, μ y - valori medii (așteptări matematice); σ x, σ y sunt abaterile standard ale variabilelor aleatoare X și Y și p este coeficientul de corelație, care este o măsură a relației dintre variabilele aleatoare X și Y.
Dacă p = 0, atunci valorile, x i, y i, obținute dintr-o populație normală bidimensională, sunt situate pe grafic în coordonatele x, y în interiorul ariei delimitate de un cerc (Figura 5, a). În acest caz, nu există o corelație între variabilele aleatoare X și Y și se numesc necorelate. Pentru o distribuție normală bivariată, necorelare înseamnă în același timp independența variabilelor aleatoare X și Y.

Studiul legăturilor existente în mod obiectiv între fenomene este cea mai importantă sarcină a statisticii. În procesul cercetării statistice a dependențelor se dezvăluie relațiile cauză-efect între fenomene. Relațiile cauzale sunt o astfel de conexiune între fenomene și procese atunci când o modificare a unuia dintre ele - cauza duce la o schimbare a celuilalt - efectul.

Semnele fenomenelor și proceselor sunt împărțite în două clase în funcție de semnificația lor pentru studiul relației. Semnele care provoacă modificări în alte semne înrudite sunt numite factorial , sau doar factori. Se numesc semnele care se modifică sub influența semnelor factorilor efectiv .

În statistică, se disting conexiunile funcționale și stocastice (probabilistice) ale fenomenelor și proceselor:

  • Funcţional se numește o astfel de relație, în care o anumită valoare a atributului factorului corespunde unei valori a celui efectiv.
  • Dacă dependența cauzală se manifestă nu în fiecare caz individual, ci în general, în medie, cu un număr mare de observații, atunci o astfel de dependență se numește stocastic (probabilistic) ... Corelația este un caz special de conexiune stocastică.

În plus, legăturile dintre fenomene şi semnele lor sunt clasificate prin gradul de apropiere, direcție și expresie analitică.

Către există conexiuni directe și inverse:

  • Comunicare directă - aceasta este o astfel de relație în care cu o creștere (scădere) a valorilor atributului factorului, are loc o creștere (scădere) a valorilor celui efectiv. Deci, de exemplu, o creștere a productivității muncii contribuie la creșterea nivelului de rentabilitate a producției.
  • În cazul feedback-ului valorile atributului efectiv se modifică sub influența factorialului, dar în direcția opusă față de modificarea atributului factorial. Deci, odată cu creșterea nivelului de rentabilitate a activelor, costul unei unități de producție scade.

Prin exprimare analitică există conexiuni drepte (sau pur și simplu liniare) și neliniare:

  • Dacă relația statistică dintre fenomene poate fi exprimată aproximativ prin ecuația unei drepte, atunci se numește link de linie de forma: y = a + bx.
  • Dacă legătura poate fi exprimată prin ecuația oricărei linii curbe (parabolă, hiperbolă etc.), atunci o astfel de conexiune se numește conexiune neliniară (curbilinie). .

Strângerea comunicării arată măsura influenței atributului factorului asupra variației generale a atributului efectiv. Clasificarea comunicării după gradul de apropiere este prezentată în tabelul 1.

Pentru a identifica prezența unei conexiuni, natura și direcția acesteia în statistică se folosesc următoarele metode: aducerea de date paralele, grupări analitice, grafice, corelații. Principala metodă de studiere a relației statistice este statistica modelarea comunicării bazată pe analiza de corelație și regresie .

Corelație este o relație statistică între variabile aleatoare care nu are o natură strict funcțională, în care o modificare a uneia dintre variabilele aleatoare duce la o modificare a așteptării matematice a celeilalte. În statistică, se obișnuiește să se facă distincția între următoarele tipuri de corelații :

  • corelație de pereche - relația dintre două semne (eficient și factorial, sau două factoriale);
  • corelație parțială - relația dintre caracteristicile efective și una factoriale cu o valoare fixă ​​a altor caracteristici factoriale;
  • corelație multiplă - dependența semnelor efective și a doi sau mai mulți factori incluse în studiu.

Sarcina analizei corelației este o determinare cantitativă a strângerii relației dintre două trăsături (cu o relație de pereche) și dintre efectiv și un set de trăsături factoriale (cu o relație multifactorială).

Strângerea relației este exprimată cantitativ prin mărimea coeficienților de corelație, care, dând o caracteristică cantitativă a strângerii relației dintre caracteristici, fac posibilă determinarea „utilității” caracteristicilor factorilor la construirea ecuației de regresie multiplă. .

Corelația este interconectată cu regresia, deoarece prima evaluează rezistența (strângerea) relației statistice, cea din urmă examinează forma acesteia.

Analiza regresiei este de a determina expresia analitică a relației sub forma unei ecuații de regresie.

Regresia se numește dependența valorii medii a unei variabile aleatoare a indicatorului efectiv de mărimea factorialului și ecuația de regresie - o ecuație care descrie corelația dintre o trăsătură efectivă și una sau mai multe factoriale.

Formule de analiză a corelației-regresiune pentru relația în linie dreaptă cu corelarea perechilor sunt prezentate în tabelul 2.

Tabelul 2 - Formule de analiză a corelației-regresiune pentru conexiunea în linie dreaptă cu corelația de pereche
IndicatorDenumirea și formula
Ecuația unei linii drepte pentru corelarea perechilor y x = a + bx, unde b este coeficientul de regresie
Sistem de ecuații normale cele mai mici pătrate pentru a determina coeficienții Ași b
Coeficient de corelație liniară pentru determinarea etanșeității comunicării,
interpretarea lui:
r = 0 - fără conexiune;
0 -1 r = 1 - conexiune funcțională
Elasticitate absolută
Elasticitatea este relativă

Exemple de rezolvare a problemelor pe tema „Fundamentele analizei corelației”

Problema 1 (analiza relației drepte în corelația de perechi) ... Există date despre calificările și producția lunară a cinci lucrători din atelier:

Pentru a studia relația dintre calificările muncitorilor și producția acestora, se determină ecuația relației liniare și coeficientul de corelație. Oferiți o interpretare a coeficienților de regresie și corelație.

Soluţie ... Să extindem tabelul propus.

Să determinăm parametrii ecuației dreptei y x = a + bx... Pentru a face acest lucru, vom rezolva sistemul de ecuații:

Deci coeficientul de regresie este 18.

Deoarece в este un număr pozitiv, există o legătură directă între parametrii x și y.
a = 92-4 × 18
a = 20
Ecuația liniară a conexiunii are forma yx = 20 + 18x.

Pentru a determina etanșeitatea (rezistența) relației dintre caracteristicile studiate, determinăm valoarea coeficientului de corelație prin formula:

= (2020-20 × 460/5) / (√10 × √3280) ≈ 180 / 181,11 = 0,99. Deoarece coeficientul de corelație este mai mare de 0,7, relația din această serie este puternică.

Sarcina 2 ... La întreprindere, prețurile pentru produse au fost reduse de la 80 de ruble. pe unitate până la 60 de ruble. După reducerea prețului, vânzările au crescut de la 400 la 500 de unități pe zi. Determinați elasticitatea absolută și relativă. Faceți o evaluare a elasticității în scopul posibilității (sau imposibilității) unor reduceri suplimentare de preț.

Soluţie ... Să calculăm indicatorii care ne permit să efectuăm o analiză preliminară a elasticității:

După cum puteți vedea, rata de scădere a prețului este egală în valoare absolută cu rata de creștere a cererii.

Găsim elasticitățile absolute și relative prin formulele:

= (500-400) / (60-80) = 100 / (- 20) -5 - elasticitate absolută

= (100: 400) / (- 20:80) = -1 - elasticitate relativă

Modulul de elasticitate relativă este 1. Aceasta confirmă faptul că rata de creștere a cererii este egală cu rata de scădere a prețurilor. Într-o astfel de situație, calculăm veniturile primite de întreprindere înainte și după reducerea prețului: 80 * 400 = 32.000 de ruble. pe zi, 60 * 500 = 30.000 de ruble. pe zi - după cum putem vedea, veniturile au scăzut și reduceri suplimentare de preț nu sunt recomandabile.

Utilizarea metodelor statistice în prelucrarea materialelor din cercetarea psihologică oferă o oportunitate excelentă de a extrage informații utile din datele experimentale. Una dintre cele mai comune metode statistice este analiza corelației.

Termenul de „corelare” a fost folosit pentru prima dată de paleontologul francez J. Cuvier, care a dedus „legea corelării părților și organelor animalelor” (această lege face posibilă reconstituirea aspectului întregului animal din părțile găsite ale animalelor). corp). Acest termen a fost introdus în statistică de către biologul și statisticianul englez F. Galton (nu doar „conexiune” - relațieși „ca o conexiune” - corelatie).

Analiza corelației este un test de ipoteze despre relațiile dintre variabile folosind coeficienți de corelație, statistici descriptive bidimensionale, o măsură cantitativă a relației (variabilitatea comună) a două variabile. Astfel, acesta este un set de metode pentru detectarea dependenței de corelație dintre variabile sau caracteristici aleatoare.

Analiza corelației pentru două variabile aleatoare include:

  • construirea unui câmp de corelare și compilarea unui tabel de corelare;
  • calcularea coeficienților de corelație ale eșantionului și a rapoartelor de corelație;
  • testarea ipotezei statistice a semnificaţiei relaţiei.

Scopul principal al analizei de corelație este de a identifica relația dintre două sau mai multe variabile studiate, care este considerată ca o schimbare comună consistentă a celor două caracteristici studiate. Această variabilitate are trei caracteristici principale: formă, direcție și rezistență.

Forma corelației poate fi liniară sau neliniară. Forma liniară este mai convenabilă pentru identificarea și interpretarea corelației. Pentru o relație de corelație liniară, se pot distinge două direcții principale: pozitivă („relație directă”) și negativă („feedback”).

Puterea relației indică în mod direct cât de clar se manifestă variabilitatea comună a variabilelor studiate. În psihologie, relația funcțională a fenomenelor poate fi relevată empiric doar ca relație probabilistică a trăsăturilor corespunzătoare. O idee clară a naturii relației probabilistice este dată de o diagramă de împrăștiere - un grafic ale cărui axe corespund valorilor a două variabile, iar fiecare subiect este un punct.

Ca caracteristică numerică a relației probabilistice, se folosesc coeficienți de corelație, ale căror valori variază în intervalul de la –1 la +1. După efectuarea calculelor, cercetătorul, de regulă, selectează numai cele mai puternice corelații, care sunt interpretate în continuare (Tabelul 1).

Criteriul de selectare a corelațiilor „suficient de puternice” poate fi atât valoarea absolută a coeficientului de corelație propriu-zis (de la 0,7 la 1), cât și valoarea relativă a acestui coeficient, determinată de nivelul de semnificație statistică (de la 0,01 la 0,1), în funcție de pe dimensiunea eșantionului. În eșantioane mici pentru interpretare ulterioară, este mai corect să se selecteze corelații puternice pe baza nivelului de semnificație statistică. Pentru studiile efectuate pe eșantioane mari, este mai bine să folosiți valorile absolute ale coeficienților de corelație.

Astfel, sarcina analizei corelației se reduce la stabilirea direcției (pozitive sau negative) și a formei (liniare, neliniare) a relației dintre semne variabile, măsurarea etanșeității acesteia și, în final, la verificarea nivelului de semnificație al coeficienților de corelație obținuți. .

În prezent, au fost dezvoltați mulți coeficienți de corelație diferiți. Cele mai folosite sunt r-Pirson, r-Speerman și τ - Kendall. Programele moderne de statistică pe calculator din meniul „Corelații” oferă exact acești trei coeficienți, iar pentru rezolvarea altor probleme de cercetare sunt propuse metode de comparare a grupurilor.

Alegerea metodei de calcul al coeficientului de corelație depinde de tipul de scară căreia îi aparțin variabilele (Tabelul 2).

Pentru variabilele cu un interval și cu o scară nominală se folosește coeficientul de corelație Pearson (corelarea momentelor produselor). Dacă cel puțin una dintre cele două variabile are o scară ordinală sau nu este distribuită în mod normal, se utilizează corelația rangului Spearman sau

t-Kendall. Dacă una dintre cele două variabile este dihotomică, poate fi utilizată corelația punct pe două rânduri (această caracteristică nu este disponibilă în programul de calculator statistic SPSS; în schimb se poate calcula corelația de rang). În cazul în care ambele variabile sunt dihotomice, se utilizează o corelație cu patru câmpuri (acest tip de corelație este calculată de SPSS pe baza definiției măsurilor de distanță și a măsurilor de similaritate). Calculul coeficientului de corelație între două variabile nedihotomice este posibil doar dacă relația dintre ele este liniară (unidirecțională). Dacă conexiunea, de exemplu, U-formă (ambiguă), coeficientul de corelație nu este adecvat pentru a fi utilizat ca măsură a rezistenței de legătură: valoarea acestuia tinde spre zero.

Astfel, condițiile de aplicare a coeficienților de corelație vor fi următoarele:

  • variabile măsurate într-o scară cantitativă (rang, metric) pe același eșantion de obiecte;
  • relaţia dintre variabile este monotonă.

Ipoteza statistică principală, care este testată prin analiza corelației, este nedirecționată și conține o afirmație despre egalitatea corelației cu zero în populația generală. H0: rxy= 0. Dacă este respinsă, se acceptă o ipoteză alternativă H1: rxy≠ 0 pe prezența corelației pozitive sau negative - în funcție de semnul coeficientului de corelație calculat.

Pe baza acceptării sau respingerii ipotezelor se trag concluzii semnificative. Dacă, conform rezultatelor unei verificări statistice H0: rxy= 0 nu se abate la nivelul a, atunci concluzia semnificativă va fi următoarea: relația dintre Xși Y nu a fost gasit. Eu gras H0rxy= 0 deviază la nivelul a, ceea ce înseamnă că s-a găsit o relație pozitivă (negativă) între Xși Y... Cu toate acestea, interpretarea corelațiilor relevate trebuie abordată cu prudență. Din punct de vedere științific, simpla stabilire a unei relații între două variabile nu înseamnă că există o relație cauzală. Mai mult, prezența unei corelații nu stabilește o relație de succesiune între cauză și efect. Pur și simplu indică faptul că cele două variabile sunt mai legate între ele decât s-ar aștepta prin coincidență. Cu toate acestea, cu respectarea precauției, utilizarea metodelor de corelare în studiul relațiilor cauză-efect este pe deplin justificată. Evitați expresiile categorice precum „variabila X este motivul creșterii indicatorului Y". Asemenea afirmații ar trebui formulate ca ipoteze care trebuie fundamentate riguros în teorie.

O descriere detaliată a procedurii matematice pentru fiecare coeficient de corelație este dată în manualele de statistică matematică; ; ; si altele.Ne vom limita la a descrie posibilitatea utilizarii acestor coeficienti in functie de tipul scarii de masurare.

Corelarea variabilelor metrice

Pentru a studia relația dintre două variabile metrice măsurate pe același eșantion, aplicați coeficient de corelație r-Pirson... Coeficientul însuși caracterizează prezența doar unei relații liniare între trăsături, notate, de regulă, prin simboluri Xși Y... Coeficientul de corelație liniară este o metodă parametrică și aplicarea sa corectă este posibilă numai dacă rezultatele măsurătorilor sunt prezentate pe o scară de intervale, iar distribuția valorilor în variabilele analizate diferă de la normal la un grad nesemnificativ. Există multe situații în care utilizarea sa este adecvată. De exemplu: stabilirea unei legături între inteligența unui student și performanța sa academică; între starea de spirit și succesul în ieșirea dintr-o situație problemă; între nivelul veniturilor și temperament etc.

Coeficientul Pearson este utilizat pe scară largă în psihologie și pedagogie. De exemplu, în lucrările lui I. Ya. Kaplunovich și PD Rabinovich, MP Nuzhdina, calculul coeficientului de corelație liniară al lui Pearson a fost folosit pentru a confirma ipotezele prezentate.

La prelucrarea datelor „manual”, este necesar să se calculeze coeficientul de corelație și apoi să se determine p- nivelul de semnificație (pentru a simplifica verificarea datelor, se folosesc tabele de valori critice r xy care sunt compilate folosind acest criteriu). Valoarea coeficientului de corelație liniară al lui Pearson nu poate depăși +1 și poate fi mai mică de –1. Aceste două numere +1 și –1 sunt limitele coeficientului de corelație. Când calculul are ca rezultat o valoare mai mare de +1 sau mai mică de –1, aceasta indică faptul că a apărut o eroare de calcul.

La calculul pe calculator, programul statistic (SPSS, Statistica) însoțește coeficientul de corelație calculat cu o valoare mai precisă p-nivel.

Pentru o decizie statistică de acceptare sau respingere H 0 de obicei setat α = 0,05 și pentru o cantitate mare de observații (100 sau mai mult) α = 0,01. Dacă p ≤ a, H 0 deviază și face o concluzie semnificativă că s-a găsit o relație de încredere (semnificativă) statistic între variabilele studiate (pozitive sau negative - în funcție de semnul corelației). Când p> a, H 0 nu este respinsă, concluzia semnificativă se limitează la afirmația că relația (semnificativă statistic) nu a fost găsită.

Dacă nu este găsită nicio conexiune, dar există motive să credeți că există o conexiune, ar trebui să verificați posibilele motive pentru nefiabilitatea conexiunii.

Neliniaritatea comunicării- pentru a face acest lucru, analizați diagrama de dispersie bidimensională. Dacă relația este neliniară, dar monotonă, accesați corelațiile de rang. Dacă relația nu este monotonă, atunci împărțiți eșantionul în părți în care relația este monotonă și calculați corelațiile separat pentru fiecare parte a eșantionului sau împărțiți eșantionul în grupuri contrastante și apoi comparați-le în funcție de nivelul de severitate al trăsătura.

Prezența unor valori aberante și o asimetrie pronunțată în distribuția uneia sau a ambelor trăsături. Pentru a face acest lucru, trebuie să vă uitați la histogramele distribuției de frecvență a ambelor semne. Dacă există valori aberante sau asimetrii, excludeți valorile aberante sau accesați corelațiile de rang.

Eterogenitatea probei(analizați un grafic de dispersie 2D). Încercați să împărțiți proba în părți în care relația poate avea direcții diferite.

Dacă relația este semnificativă statistic, atunci înainte de a face o concluzie semnificativă, este necesar să excludem posibilitatea unei corelări false:

  • conexiunea se datorează emisiilor... Dacă există valori aberante, mergeți la ierarhizarea corelațiilor sau excludeți valorile aberante;
  • relaţia se datorează influenţei celei de-a treia variabile... Dacă există un astfel de fenomen, este necesar să se calculeze corelația nu numai pentru întregul eșantion, ci și pentru fiecare grup separat. Dacă „a treia” variabilă este metrică, calculați corelația parțială.

Coeficient de corelație parțială r xy -z se calculează dacă este necesar să se verifice ipoteza că relaţia dintre două variabile Xși Y nu depinde de influenţa celei de-a treia variabile Z... Foarte des, două variabile se corelează între ele doar datorită faptului că ambele se schimbă constant sub influența celei de-a treia variabile. Cu alte cuvinte, de fapt, nu există nicio legătură între proprietățile corespunzătoare, ci se manifestă într-o relație statistică sub influența unei cauze comune. De exemplu, vârsta poate fi o cauză comună a variabilității a două variabile atunci când se studiază relația dintre diferitele caracteristici psihologice dintr-o grupă de vârstă. Trebuie avut grijă atunci când se interpretează corelația parțială dintr-o perspectivă cauzală, deoarece dacă Z se coreleaza cu X si cu Y, și corelația parțială r xy -z este aproape de zero, nu rezultă neapărat că este Z este un motiv comun pentru Xși Y.

Corelarea variabilelor de rang

Dacă coeficientul de corelație este inacceptabil pentru datele cantitative r-Pirson, apoi pentru a testa ipoteza despre relația dintre două variabile după clasarea preliminară, pot fi aplicate corelații r-Sperman sau τ - Kendall... De exemplu, în studiul caracteristicilor psihofizice ale adolescenților talentați din punct de vedere muzical I.A.Lavochkin, a fost folosit criteriul Spearman.

Pentru calcularea corectă a ambilor coeficienți (Spearman și Kendall), rezultatele măsurătorilor trebuie prezentate într-o scară de ranguri sau intervale. Nu există diferențe fundamentale între aceste criterii, dar este general acceptat că coeficientul lui Kendall este mai „semnificativ”, deoarece analizează relațiile dintre variabile mai complet și în detaliu, analizând toate potrivirile posibile între perechile de valori. Coeficientul lui Spearman ține cont mai precis de gradul cantitativ de relație dintre variabile.

Coeficientul de corelare a rangului lui Spearman este un analog neparametric al coeficientului de corelație Pearson clasic, dar la calcularea acestuia se iau în considerare indicatorii variabilelor comparate (media aritmetică și varianța), neaferente distribuției, ci rangurile. De exemplu, este necesar să se determine relația dintre evaluările de rang ale trăsăturilor de personalitate incluse în ideea persoanei despre „sinele real” și „sinele ideal”.

Coeficientul lui Spearman este utilizat pe scară largă în cercetarea psihologică. De exemplu, în lucrarea lui Yu.V. Bushov și N.N.

Deoarece acest coeficient este un analog r-Pirson, atunci aplicarea sa pentru a testa ipoteze este similară cu aplicarea coeficientului r-Pirson. Adică, ipoteza statistică testabilă, procedura de luare a unei decizii statistice și formularea unei concluzii semnificative sunt aceleași. În programele de calculator (SPSS, Statistica), nivelurile de semnificație pentru aceiași coeficienți r-Pirson și r- Specialele sunt întotdeauna aceleași.

Avantaj de cote r-Speerman versus cote r-Pirson - mai sensibil la comunicare. Îl folosim în următoarele cazuri:

  • prezența unei abateri semnificative a distribuției a cel puțin unei variabile de la forma normală (asimetrie, valori aberante);
  • apariția unei conexiuni curbilinii (monotone).

Limitarea de aplicare a coeficientului r- Specialistii sunt:

  • pentru fiecare variabilă cel puțin 5 observații;
  • coeficientul pentru un număr mare de ranguri egale într-una sau ambele variabile dă o valoare grosieră.

Coeficientul de corelare a rangului τ - Kendall este o metodă originală independentă bazată pe calcularea raportului de perechi de valori a două eșantioane care au tendințe identice sau diferite (valori crescătoare sau descrescătoare). Acest coeficient mai este numit coeficient de concordanţă... Astfel, ideea principală a acestei metode este că direcția conexiunii poate fi judecată prin compararea perechi a subiecților între ei: dacă o pereche de subiecți are o schimbare în X coincide in directie cu schimbarea in Y, aceasta indică o relație pozitivă, dacă nu, o relație negativă, de exemplu, în studiul calităților personale care sunt decisive pentru bunăstarea familiei. În această metodă, o variabilă este prezentată ca o secvență monotonă (de exemplu, datele soțului) în ordine crescătoare de mărime; unei alte variabile (de exemplu, datele soției) i se atribuie locurile de rang corespunzătoare. Numărul de inversiuni (încălcări ale monotoniei față de primul rând) este utilizat în formula pentru coeficienții de corelație.

Când se numără τ- Kendall „manual”, datele sunt mai întâi ordonate după variabilă X... Apoi, pentru fiecare subiect, se calculează de câte ori rangul său în funcție de Y se dovedește a fi mai mic decât rangul subiecților care sunt mai jos. Rezultatul este înregistrat în coloana „Meciuri”. Suma tuturor valorilor din coloana „Potrivire” este P- numărul total de potriviri, este substituit în formula pentru a calcula coeficientul Kendall, care este mai simplu din punct de vedere computațional, dar cu o creștere a eșantionului, spre deosebire de r-Speerman, volumul calculelor nu crește proporțional, ci exponențial. Deci, de exemplu, pentru N= 12, este necesar să sortăm 66 de perechi de subiecți, iar pentru N= 489 - deja 1128 de perechi, adică volumul calculelor crește de peste 17 ori. Când se calculează pe un computer într-un program statistic (SPSS, Statistica), coeficientul Kendall este calculat în mod similar cu coeficienții r-Speerman și r-Pirson. Coeficient de corelație calculat τ -Kendall se caracterizează printr-o valoare mai precisă p-nivel.

Coeficientul Kendall este preferat dacă datele sursă conțin valori aberante.

O caracteristică a coeficienților de corelație de rang este că corelațiile maxime de rang modulo (+1, –1) nu corespund neapărat unor relații stricte directe sau invers proporționale între variabilele inițiale Xși Y: este suficientă doar o legătură funcțională monotonă între ele. Corelațiile de rang ating valoarea lor maximă modulo dacă o valoare mai mare a unei variabile corespunde întotdeauna unei valori mai mari a altei variabile (+1), sau o valoare mai mare a unei variabile corespunde întotdeauna unei valori mai mici a altei variabile și invers (–1) ).

Ipoteza statistică de testat, procedura de luare a unei decizii statistice și formularea unei concluzii semnificative sunt aceleași ca și pentru cazul r-Difuzor sau r-Pirson.

Dacă nu se găsește o relație semnificativă statistic, dar există motive să credem că există o relație, ar trebui mai întâi să comutați de la coeficient

r-Difuzor la coeficient τ -Kendall (sau invers), apoi verificați posibilele motive pentru nefiabilitatea conexiunii:

  • neliniaritatea comunicării: Pentru a face acest lucru, consultați diagrama de dispersie 2D. Dacă relația nu este monotonă, atunci împărțiți eșantionul în părți în care relația este monotonă sau împărțiți eșantionul în grupuri contrastante și apoi comparați-le în funcție de nivelul de severitate al trăsăturii;
  • eterogenitatea probei: vezi un grafic de împrăștiere bidimensională, încercați să împărțiți proba în părți în care relația poate avea direcții diferite.

Dacă relația este semnificativă statistic, atunci înainte de a face o concluzie semnificativă, este necesar să excludem posibilitatea unei corelații false (prin analogie cu coeficienții de corelație metrici).

Corelarea variabilelor dihotomice

Când se compară două variabile măsurate pe o scară dihotomică, măsura corelației este așa-numitul coeficient j, care este coeficientul de corelație pentru datele dihotomice.

Magnitudinea coeficientul φ este între +1 și –1. Poate fi fie pozitiv, fie negativ, caracterizând direcția conexiunii dintre două trăsături măsurate dihotomic. Cu toate acestea, interpretarea lui φ poate pune probleme specifice. Datele dihotomice incluse în schema de calcul al coeficientului φ nu arată ca o suprafață normală bidimensională; prin urmare, este incorect să presupunem că valorile interpretate r xy= 0,60 și φ = 0,60 sunt aceleași. Coeficientul φ poate fi calculat prin metoda de codificare, precum și folosind așa-numitul tabel cu patru câmpuri sau tabel de contingență.

Pentru a aplica coeficientul de corelație φ, trebuie îndeplinite următoarele condiții:

  • trăsăturile comparate trebuie măsurate pe o scară dihotomică;
  • Xși Y ar trebui să fie la fel.

Acest tip de corelație se calculează în programul de calculator SPSS pe baza determinării măsurilor de distanță și a măsurilor de similaritate. Unele proceduri statistice, precum analiza factorială, analiza clusterului, scalarea multivariată, se bazează pe aplicarea acestor măsuri, iar uneori ele însele prezintă posibilități suplimentare pentru calcularea măsurilor de similaritate.

În cazurile în care o variabilă este măsurată pe o scară dihotomică (variabilă X), iar celălalt pe scara intervalelor sau a rapoartelor (variabilă Y) este folosit coeficient de corelație biserială, de exemplu, la testarea ipotezelor despre influența sexului copilului asupra indicatorului de înălțime și greutate. Acest coeficient variază în intervalul de la –1 la +1, dar semnul său nu este important pentru interpretarea rezultatelor. Pentru a-l utiliza, trebuie respectate următoarele condiții:

  • caracteristicile comparate trebuie măsurate pe diferite scale: unu X- la scară dihotomică; celălalt Y- în scara intervalelor sau a rapoartelor;
  • variabil Y are o lege de distribuție normală;
  • numărul de caracteristici variabile din variabilele comparate Xși Y ar trebui să fie la fel.

Dacă variabila X măsurată pe o scară dihotomică și variabila Yîn scala de rang (variabilă Y), poate fi utilizat coeficientul de corelare rang-biseriala, care este strâns legat de τ-Kendall și folosește în definiția sa conceptele de coincidență și inversare. Interpretarea rezultatelor este aceeași.

Analiza corelației folosind programele de calculator SPSS și Statistica este o operațiune simplă și convenabilă. Pentru a face acest lucru, după apelarea casetei de dialog Bivariate Corelations (Analiză> Corelate> Bivariate ...), trebuie să mutați variabilele studiate în câmpul Variabile și să selectați metoda prin care va fi dezvăluită relația de corelație dintre variabile. Fișierul de ieșire conține un tabel pătrat (corelații) pentru fiecare criteriu calculat. Fiecare celulă a tabelului conține: valoarea coeficientului de corelație propriu-zis (Coeficientul de corelație), semnificația statistică a coeficientului calculat Sig, numărul de subiecți.

Antetul și coloana laterală a tabelului de corelare rezultat conțin numele variabilelor. Diagonala (colțul din stânga sus - dreapta jos) a tabelului este formată din unele, deoarece corelația oricărei variabile cu ea însăși este maximă. Tabelul este simetric față de această diagonală. Dacă în program este bifată caseta de selectare „Marcați corelații semnificative”, atunci coeficienții semnificativi statistic vor fi marcați în tabelul de corelare final: la nivelul de 0,05 și mai puțin - cu un asterisc (*) și la nivelul de 0,01 - cu două asteriscuri (**).

Deci, pentru a rezuma: scopul principal al analizei de corelație este de a identifica relația dintre variabile. Măsura relației o reprezintă coeficienții de corelație, a căror alegere depinde direct de tipul de scară în care sunt măsurate variabilele, de numărul de caracteristici variabile din variabilele comparate și de distribuția variabilelor. Corelația dintre două variabile nu înseamnă că există o relație cauzală între ele. În timp ce corelația nu indică în mod direct cauzalitate, ea poate fi un indiciu al cauzei. Pe baza ei se pot formula ipoteze. În unele cazuri, lipsa corelației are un impact mai profund asupra ipotezei de cauzalitate. Corelația zero între două variabile poate indica că nu există niciun efect al unei variabile asupra celeilalte.

Imparte asta