Korelacijski rezultat. Korelacije u tezi iz psihologije

U prisustvu dvije serije vrijednosti koje podliježu rangiranju, racionalno je izračunati Spearmanovu rang korelaciju.

Takve serije mogu biti predstavljene:

  • par karakteristika utvrđenih u istoj grupi objekata koji se proučavaju;
  • par pojedinačnih podređenih osobina određenih u 2 objekta koji se proučavaju istim skupom karakteristika;
  • par grupnih podređenih karakteristika;
  • individualna i grupna podređenost znakova.

Metoda uključuje rangiranje indikatora posebno za svaku od karakteristika.

Najmanje bitan je najniži rang.

Ova metoda se odnosi na neparametarsku statističku metodu dizajniranu da utvrdi postojanje veze između fenomena koji se proučavaju:

  • utvrđivanje stvarnog stepena paralelizma između dvije serije kvantitativnih podataka;
  • procjena čvrstoće identifikovanog odnosa, izražena u kvantitativnom smislu.

Korelaciona analiza

Statistička metoda dizajnirana da identificira postojanje veze između 2 ili više slučajne varijable(varijable), kao i njegova snaga, je imenovan korelacione analize.

Ime je dobio po correlatio (lat.) - omjer.

Kada ga koristite, mogući su sljedeći scenariji:

  • prisustvo korelacije (pozitivne ili negativne);
  • nema korelacije (nula).

U slučaju uspostavljanja veze između varijabli dolazi o njihovoj korelaciji. Drugim riječima, možemo reći da će se s promjenom vrijednosti X nužno uočiti proporcionalna promjena vrijednosti Y.

Kao alati se koriste različite komunikacijske mjere (koeficijenti).

Na njihov izbor utiču:

  • način mjerenja slučajnih brojeva;
  • priroda odnosa između slučajnih brojeva.

Postojanje korelacije može se prikazati grafički (grafici) i pomoću koeficijenta (numerički prikaz).

Korelaciju karakterišu sljedeće karakteristike:

  • čvrstoća veze (sa koeficijentom korelacije od ± 0,7 do ± 1 - jaka; od ± 0,3 do ± 0,699 - srednja; od 0 do ± 0,299 - slaba);
  • smjer komunikacije (naprijed ili nazad).

Ciljevi korelacione analize

Korelaciona analiza ne dozvoljava uspostavljanje uzročne veze između proučavanih varijabli.

Izvodi se sa ciljem:

  • uspostavljanje zavisnosti između varijabli;
  • dobijanje specifičnih informacija o varijabli na osnovu druge varijable;
  • utvrđivanje čvrstoće (povezanosti) ove zavisnosti;
  • određivanje pravca uspostavljene veze.

Metode analize korelacije


Ova analiza može se uraditi pomoću:

  • metoda kvadrata ili Pearson;
  • rank method ili Spearman.

Pearsonova metoda je primjenjiva za proračune koji zahtijevaju precizna definicija sila koja postoji između varijabli. Osobine koje se proučavaju uz njegovu pomoć trebaju biti izražene samo kvantitativno.

Da bi se primenila Spearmanova metoda ili korelacija ranga, ne postoje strogi zahtevi u izražavanju karakteristika – može biti i kvantitativna i atributivna. Zahvaljujući ovoj metodi, ne dobijaju se informacije o tačnom utvrđivanju snage veze, već imaju indikativni karakter.

Redovi varijabli mogu sadržavati otvorene varijante. Na primjer, kada je radno iskustvo izraženo vrijednostima kao što su do 1 godine, više od 5 godina itd.

Koeficijent korelacije

Statistička vrijednost koja karakterizira prirodu promjene dvije varijable naziva se koeficijent korelacije ili koeficijent korelacije para. U kvantitativnom smislu, kreće se od -1 do +1.

Najčešći izgledi su:

  • Pearson- primjenjivo za varijable koje pripadaju intervalnoj skali;
  • Spearman- za varijable ordinalne skale.

Ograničenja upotrebe koeficijenta korelacije

Dobijanje nepouzdanih podataka prilikom izračunavanja koeficijenta korelacije moguće je u slučajevima kada:

  • dostupan je dovoljan broj varijabilnih vrijednosti (25-100 parova zapažanja);
  • između proučavanih varijabli, na primjer, uspostavlja se kvadratni odnos, a ne linearni;
  • u svakom slučaju, podaci sadrže više od jednog zapažanja;
  • prisutnost abnormalnih vrijednosti (odstupanja) varijabli;
  • podaci koji se istražuju sastoje se od jasno izdvojenih podgrupa zapažanja;
  • prisutnost korelacije ne dozvoljava nam da ustanovimo koja od varijabli se može smatrati uzrokom, a koja posljedicom.

Provjera značajnosti korelacije

Za procjenu statističkih veličina koristi se koncept njihovog značaja ili pouzdanosti, koji karakteriše vjerovatnoću slučajnog pojavljivanja neke veličine ili njenih ekstremnih vrijednosti.

Najčešći metod za određivanje značaja korelacije je određivanje Studentovog testa.

Njegova vrijednost se upoređuje sa tabelarnom vrijednošću, broj stupnjeva slobode se uzima kao 2. Kada je izračunata vrijednost kriterija veća od vrijednosti u tabeli, to ukazuje na značaj koeficijenta korelacije.

Prilikom izvođenja ekonomskih proračuna dovoljnim se smatra nivo pouzdanosti od 0,05 (95%) ili 0,01 (99%).

Spearman činovi

Spearmanov koeficijent korelacije ranga omogućava da se statistički utvrdi postojanje veze između fenomena. Njegovo izračunavanje uključuje uspostavljanje serijskog broja za svaku karakteristiku - rang. Rang se može povećati ili smanjiti.

Broj karakteristika koje treba rangirati može biti bilo koji broj. Ovo je prilično naporan proces koji ograničava njihov broj. Poteškoće počinju kada dostignete 20 znakova.

Da biste izračunali Spearmanov koeficijent, koristite formulu:

pri čemu:

n - prikazuje broj rangiranih karakteristika;

d nije ništa drugo do razlika između rangova u dvije varijable;

i ∑ (d2) je zbir kvadrata razlike u rangu.

Korelaciona analiza u psihologiji

Statistička podrška psihološko istraživanje omogućava vam da ih učinite objektivnijim i visoko reprezentativnim. Statistička obrada podataka dobijenih u toku psiholoških eksperimenata doprinosi izvlačenju maksimuma korisnih informacija.

Korelaciona analiza se najčešće koristi u obradi njihovih rezultata.

Prikladno je izvršiti analizu korelacije rezultata dobijenih tokom istraživanja:

  • anksioznost (prema testovima R. Temml, M. Dorca, V. Amen);
  • porodični odnosi ("Analiza porodičnih odnosa" (DIA) upitnik EG Eidemiller, VV Yustitskis);
  • nivo internosti-eksternalnosti (upitnik EF Bazhin, EA Golynkina i AM Etkind);
  • stepen emocionalnog sagorevanja među nastavnicima (upitnik V.V. Boyko);
  • povezanost elemenata verbalne inteligencije studenata na različitim specijalističkim obukama (metod K.M. Gurevicha i dr.);
  • odnos između nivoa empatije (metoda V.V. Boyka) i zadovoljstva brakom (upitnik V.V. Stolina, T.L. Romanove, G.P. Butenko);
  • odnos sociometrijskog statusa adolescenata (test Jacob L. Moreno) i posebnosti stila porodičnog obrazovanja (upitnik E.G. Eidemillera, V.V. Yustitskisa);
  • struktura životnih ciljeva adolescenata odgajanih u potpunim i nepotpunim porodicama (upitnik Edward L. Deci, Richard M. Ryan Ryan).

Kratke upute za provođenje korelacijske analize prema Spearmanovom kriteriju

Izvršena je korelaciona analiza primjenom Spearmanove metode prema sljedećem algoritmu:

  • upareni uporedivi znakovi nalaze se u 2 reda, od kojih je jedan označen sa X, a drugi sa Y;
  • vrijednosti X serije su raspoređene u rastućem ili opadajućem redoslijedu;
  • redoslijed lokacije vrijednosti serije Y određen je njihovom korespondencijom vrijednosti serije X;
  • za svaku vrijednost u redu X odredite rang - dodijelite redni broj od minimalne vrijednosti do maksimuma;
  • za svaku od vrijednosti u nizu Y također odredite rang (od minimuma do maksimuma);
  • izračunajte razliku (D) između rangova X i Y, koristeći formulu D = X-Y;
  • rezultirajuće vrijednosti razlike su na kvadrat;
  • izvršiti sumiranje kvadrata razlike u rangu;
  • izvršite proračune koristeći formulu:

Primjer Spearmanove korelacije

Potrebno je utvrditi postojanje korelacije između radnog iskustva i stope ozljeda ako su dostupni sljedeći podaci:

Većina odgovarajuća metoda analiza je rang metoda, jer jedan od znakova je predstavljen u obliku otvorenih opcija: radno iskustvo do 1 godine i radno iskustvo od 7 ili više godina.

Rješenje problema počinje rangiranjem podataka, koje se sastavlja u radni list i može se izvesti ručno, jer volumen im nije veliki:

Radno iskustvo Broj povreda Serijski brojevi (činovi) Razlika u rangu Razlika u rangu na kvadrat
d (x-y)
do 1 godine 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 i više 6 5 1 +4 16
Σ d2 = 38,5

Pojava frakcijskih rangova u koloni je posljedica činjenice da se u slučaju pojave varijanti iste veličine nalazi aritmetička sredina ranga. U ovom primjeru, stopa ozljede od 12 se javlja dva puta i dodjeljuje joj se rang 2 i 3, nađemo aritmetičku sredinu ovih rangova (2 + 3) / 2 = 2,5 i stavimo ovu vrijednost u radni list za 2 indikatora.
Nakon što smo izvršili zamjenu dobivenih vrijednosti u radnu formulu i izvršili jednostavne proračune, dobijamo Spearmanov koeficijent jednak -0,92

Negativna vrijednost koeficijenta ukazuje na prisustvo povratne informacije između znakova i omogućava nam da tvrdimo da je kratko radno iskustvo praćeno veliki broj povrede. Štaviše, snaga veze između ovih pokazatelja je prilično velika.
Sljedeći korak u proračunima je određivanje pouzdanosti dobijenog koeficijenta:
izračunavaju se njegova greška i Studentov t test

Regresiona i korelaciona analiza - statističke metode istraživanja. Ovo su najčešći načini da se pokaže kako parametar zavisi od jedne ili više nezavisnih varijabli.

U nastavku o konkretnim praktični primjeri Razmotrite ove dvije analize koje su veoma popularne među ekonomistima. Takođe ćemo dati primjer dobivanja rezultata kada se kombiniraju.

Regresiona analiza u Excel-u

Pokazuje uticaj nekih vrednosti (nezavisnih, nezavisnih) na zavisnu varijablu. Na primjer, kako broj ekonomski aktivnog stanovništva zavisi od broja preduzeća, veličine plata i drugih parametara. Ili: kako strane investicije, cijene energije itd. utiču na nivo BDP-a.

Rezultat analize vam omogućava da odredite prioritete. I na osnovu glavnih faktora predviđajte, planirajte razvoj prioritetnih oblasti, donosite upravljačke odluke.

Regresija se dešava:

  • linearni (y = a + bx);
  • parabolični (y = a + bx + cx 2);
  • eksponencijalni (y = a * exp (bx));
  • snaga (y = a * x ^ b);
  • hiperbolično (y = b / x + a);
  • logaritamski (y = b * 1n (x) + a);
  • eksponencijalni (y = a * b ^ x).

Pogledajmo primjer izgradnje regresijskog modela u Excelu i interpretacije rezultata. Uzmimo linearni tip regresija.

Zadatak. Kod 6 preduzeća, prosječno mjesečno nadnica i broj zaposlenih koji su dali otkaz. Potrebno je utvrditi zavisnost broja zaposlenih koji su dali otkaz od prosječne plate.

Model linearna regresija izgleda ovako:

Y = a 0 + a 1 x 1 + ... + a k x k.

Gdje je a - koeficijenti regresije, x - utjecajne varijable, k - broj faktora.

U našem primjeru, Y je indikator zaposlenih koji su dali otkaz. Faktor uticaja su plate (x).

Excel ima ugrađene funkcije koje možete koristiti za izračunavanje parametara modela linearne regresije. Ali dodatak Analysis Package će to učiniti brže.

Aktiviramo moćan analitički alat:

Nakon aktivacije, dodatak će biti dostupan na kartici Podaci.

Sada idemo direktno na regresionu analizu.



Prije svega obratite pažnju na R-kvadrat i koeficijente.

R-kvadrat je koeficijent determinacije. U našem primjeru 0,755, odnosno 75,5%. To znači da izračunati parametri modela objašnjavaju odnos između proučavanih parametara za 75,5%. Što je veći koeficijent determinacije, to je model bolji. Dobro - iznad 0,8. Loše - manje od 0,5 (takva analiza se teško može smatrati razumnom). U našem primjeru - "nije loše".

Koeficijent 64,1428 pokazuje koliki će biti Y ako su sve varijable u modelu koji se razmatraju jednake 0. Odnosno, na vrijednost analiziranog parametra utiču i drugi faktori koji nisu opisani u modelu.

Koeficijent -0,16285 pokazuje težinu varijable X prema Y. Odnosno, prosječna mjesečna plata u okviru ovog modela utiče na broj onih koji su napustili sa ponderom od -0,16285 (ovo je mali stepen uticaja). Znak "-" označava loš uticaj: što je veća plata, manje je onih koji odustaju. Što je pošteno.



Korelaciona analiza u Excel-u

Korelaciona analiza pomaže da se utvrdi da li postoji veza između indikatora u jednom ili dva uzorka. Na primjer, između vremena rada mašine i troškova popravki, cijene opreme i trajanja rada, visine i težine djece itd.

Ako postoji veza, onda da li povećanje jednog parametra dovodi do povećanja (pozitivna korelacija) ili smanjenja (negativna) u drugom. Analiza korelacije pomaže analitičaru da utvrdi da li vrijednost jednog indikatora može predvidjeti moguću vrijednost drugog.

Koeficijent korelacije označava se r. Varira od +1 do -1. Klasifikacija korelacija za različite sfere biće drugačiji. Kada je koeficijent 0, ne postoji linearna veza između uzoraka.

Pogledajmo kako koristiti Excel alate za pronalaženje koeficijenta korelacije.

Za pronalaženje uparenih koeficijenata koristi se CORREL funkcija.

Cilj: Utvrditi postoji li veza između radnog vremena strug i troškove njegovog održavanja.

Stavljamo kursor u bilo koju ćeliju i pritisnemo dugme fx.

  1. U kategoriji "Statistički" odaberite funkciju CORREL.
  2. Argument "Niz 1" - prvi raspon vrijednosti - vrijeme rada mašine: A2: A14.
  3. Argument niza 2 - drugi raspon vrijednosti - cijena popravke: B2: B14. Kliknite OK.

Da biste odredili vrstu veze, morate pogledati apsolutni broj koeficijenta (svako polje aktivnosti ima svoju skalu).

Za korelacione analize nekoliko parametara (više od 2) pogodnije je koristiti analizu podataka (dodatak paketa za analizu). Na listi morate odabrati korelaciju i odrediti niz. Sve.

Dobijeni koeficijenti će biti prikazani u korelacionoj matrici. Volim ovo:

Korelaciono-regresiona analiza

U praksi se ove dvije tehnike često koriste zajedno.

primjer:


Sada su vidljivi i podaci o regresiji.

NASTAVNI RAD

Tema: Korelaciona analiza

Uvod

1. Analiza korelacije

1.1 Koncept korelacije

1.2 Opšta klasifikacija korelacija

1.3 Korelaciona polja i svrha njihove konstrukcije

1.4 Faze korelacione analize

1.5 Koeficijenti korelacije

1.6 Normalizovani Brave-Pearson koeficijent korelacije

1.7 Spearmanov koeficijent korelacije ranga

1.8 Osnovna svojstva koeficijenata korelacije

1.9 Provjera značajnosti koeficijenata korelacije

1.10 Kritične vrijednosti koeficijenta korelacije para

2. Planiranje multivarijantnog eksperimenta

2.1 Problemsko stanje

2.2 Određivanje centra plana (osnovni nivo) i nivoa varijacije faktora

2.3 Izgradnja matrice planiranja

2.4 Provjera homogenosti disperzije i uniformnosti mjerenja u različitim serijama

2.5 Koeficijenti regresione jednadžbe

2.6 Disperzija reproduktivnosti

2.7 Provjera značajnosti koeficijenata regresione jednačine

2.8 Provjera adekvatnosti jednačine regresije

Zaključak

Bibliografija

UVOD

Planiranje eksperimenata je matematička i statistička disciplina koja proučava metode racionalne organizacije eksperimentalnog istraživanja - od optimalan izbor faktore koji se proučavaju i definisanje stvarnog plana eksperimenta u skladu sa njegovom svrhom do metoda analize rezultata. Početak planiranja eksperimenta postavili su radovi engleskog statističara R. Fishera (1935), koji je naglasio da racionalno planiranje eksperimenta daje ne manje značajan dobitak u tačnosti procjena od optimalne obrade mjerenja. rezultate. Šezdesetih godina 20. vijeka postojala je moderna teorija planiranje eksperimenta. Njegove metode su usko povezane sa teorijom aproksimacije funkcija i matematičkim programiranjem. Izgrađen optimalni planovi i istraživali njihova svojstva za široku klasu modela.

Planiranje eksperimenta - izbor plana eksperimenta koji ispunjava određene zahtjeve, skup radnji usmjerenih na razvoj strategije eksperimentiranja (od dobijanja a priori informacija do dobijanja izvodljivog matematičkog modela ili određivanja optimalni uslovi). Ovo je svrsishodna kontrola eksperimenta, koja se ostvaruje u uslovima nepotpunog poznavanja mehanizma fenomena koji se proučava.

U procesu mjerenja, naknadne obrade podataka, kao i formalizacije rezultata u obliku matematičkog modela, nastaju greške i neke informacije sadržane u početnim podacima se gube. Korištenje metoda eksperimentalnog planiranja omogućava vam da odredite grešku matematičkog modela i ocijenite njegovu adekvatnost. Ako se ispostavi da je tačnost modela nedovoljna, tada korištenje metoda eksperimentalnog planiranja omogućuje modernizaciju matematičkog modela dodatnim eksperimentima bez gubitka prethodnih informacija i uz minimalne troškove.

Svrha planiranja eksperimenta je pronaći takve uslove i pravila za izvođenje eksperimenata pod kojima je moguće dobiti pouzdane i pouzdane informacije o objektu sa najmanji trošak rada, kao i prezentirati ove informacije u kompaktnom i prikladnom obliku s kvantitativnom procjenom tačnosti.

Među glavnim metodama planiranja koje se koriste u različite faze istraživanje koristi:

Planiranje skrining eksperimenta, čije je glavno značenje izbor iz čitavog skupa faktora grupe bitnih faktora koji su predmet daljeg detaljnog proučavanja;

Dizajniranje eksperimenta za analizu varijanse, tj. izrada planova objekata sa faktorima kvaliteta;

Planiranje regresijskog eksperimenta koji vam omogućava da dobijete regresijske modele (polinomske i druge);

Planiranje ekstremnog eksperimenta, u kojem je glavni zadatak eksperimentalna optimizacija objekta istraživanja;

Planiranje u proučavanju dinamičkih procesa itd.

Svrha izučavanja discipline je osposobljavanje studenata za proizvodno-tehničke aktivnosti u svojoj specijalnosti korištenjem metoda teorije planiranja i savremenih informacionih tehnologija.

Ciljevi discipline: studij savremenim metodama planiranje, organizovanje i optimizacija naučnog i industrijskog eksperimenta, izvođenje eksperimenata i obrada rezultata.

1. KORELACIONA ANALIZA

1.1 Koncept korelacije

Istraživača često zanima kako dva ili velika količina varijable u jednom ili više proučavanih uzoraka. Na primjer, može li visina utjecati na težinu osobe ili pritisak može utjecati na kvalitetu proizvoda?

Ova vrsta odnosa između varijabli naziva se korelacija ili korelacija. Korelacija je konzistentna promjena dvije osobine, koja odražava činjenicu da je varijabilnost jedne osobine u skladu s varijabilnosti druge.

Poznato je, na primjer, da u prosjeku postoji pozitivan odnos između visine ljudi i njihove težine, i to takav da što je visina veća, to je veća težina osobe. Međutim, postoje izuzeci od ovog pravila kada su relativno niski ljudi pretili, i, obrnuto, astenici, s visokim rastom, su lagani. Razlog ovakvih izuzetaka je taj što je svaka biološka, ​​fiziološka ili psihološka osobina određena utjecajem mnogih faktora: okolišnih, genetskih, društvenih, ekoloških itd.

Korelacijske veze su probabilističke promjene koje se mogu proučavati samo na reprezentativnim uzorcima metodama matematičke statistike. Oba termina - korelacija i korelacija - se često koriste naizmjenično. Zavisnost podrazumijeva utjecaj, povezanost podrazumijeva svaku dogovorenu promjenu koja se može pripisati stotinama razloga. Korelacijske veze se ne mogu smatrati dokazom uzročne veze, one samo ukazuju na to da su promjene u jednom svojstvu, po pravilu, praćene određenim promjenama u drugom.

Korelaciona zavisnost - to su promjene koje unose vrijednosti jedne karakteristike u vjerovatnoću pojave različita značenja drugi znak.

Zadatak korelacione analize svodi se na utvrđivanje pravca (pozitivnog ili negativnog) i oblika (linearnog, nelinearnog) odnosa između promenljivih predznaka, merenje njegove čvrstoće i, konačno, na proveru nivoa značajnosti dobijenih koeficijenata korelacije.

Korelacijske veze se razlikuju po obliku, smjeru i stupnju (jačini) .

Po obliku, korelacija može biti ravna ili zakrivljena. Na primjer, odnos između broja treninga na simulatoru i broja ispravno riješenih problema u kontrolnoj sesiji može biti jednostavan. Na primjer, odnos između nivoa motivacije i efektivnosti izvršenja zadatka može biti krivolinijski (slika 1). Sa povećanjem motivacije prvo se povećava efektivnost izvršenja zadatka, a zatim se postiže optimalan nivo motivacije, što odgovara maksimalna efikasnost dovršavanje zadatka; dalje povećanje motivacije već je praćeno smanjenjem efikasnosti.

Slika 1 – Odnos između efektivnosti rješavanja problema i snage motivacijske tendencije

U pravcu korelacije veza može biti pozitivna („direktna“) i negativna („inverzna“). Uz pozitivnu pravolinijsku korelaciju, veće vrijednosti jednog svojstva odgovaraju višim vrijednostima drugog, a niže vrijednosti jednog svojstva odgovaraju nižim vrijednostima drugog (slika 2). Uz negativnu korelaciju, omjeri su obrnuti (slika 3). Uz pozitivnu korelaciju, koeficijent korelacije ima pozitivan znak, sa negativnom korelacijom - negativni predznak.

Slika 2 – Direktna korelacija

Slika 3 - Inverzna korelacija


Slika 4 – Nedostatak korelacije

Stepen, jačina ili čvrstoća korelacije određena je vrijednošću koeficijenta korelacije. Jačina veze ne zavisi od njenog pravca i određena je apsolutnom vrednošću koeficijenta korelacije.

1.2 Opšta klasifikacija korelacija

Ovisno o koeficijentu korelacije razlikuju se sljedeće korelacije:

Jaka ili čvrsta sa koeficijentom korelacije r> 0,70;

Prosjek (na 0,50

Umjereno (u 0.30

Slab (na 0,20

Veoma slab (na r<0,19).

1.3 Korelaciona polja i svrha njihove konstrukcije

Korelacija se proučava na osnovu eksperimentalnih podataka, koji predstavljaju izmjerene vrijednosti (x i, y i) dvije karakteristike. Ako je eksperimentalnih podataka malo, tada je bivarijantna empirijska raspodjela predstavljena kao dvostruki niz vrijednosti x i i y i. U ovom slučaju, ovisnost o korelaciji između karakteristika može se opisati na različite načine. Korespondencija između argumenta i funkcije može se odrediti pomoću tabele, formule, grafikona itd.

Korelaciona analiza, kao i druge statističke metode, temelji se na korištenju vjerojatnosnih modela koji opisuju ponašanje proučavanih karakteristika u određenoj općoj populaciji, iz kojih se dobijaju eksperimentalne vrijednosti x i i y i. Kada se istražuje korelacija između kvantitativnih karakteristika čije se vrijednosti mogu precizno izmjeriti u jedinicama metričke skale (metri, sekunde, kilogrami itd.), onda se vrlo često koristi model dvodimenzionalne normalno raspoređene opće populacije. usvojeno. Takav model grafički prikazuje odnos između varijabli x i i y i u obliku lokusa tačaka u pravougaonom koordinatnom sistemu. Ovaj dijagram se još naziva i dijagram raspršenja ili korelacijsko polje.
Ovaj model dvodimenzionalne normalne distribucije (korelacijsko polje) omogućava vam da date vizuelnu grafičku interpretaciju koeficijenta korelacije, jer distribucija u agregatu zavisi od pet parametara: μ x, μ y - srednje vrednosti (matematička očekivanja); σ x, σ y su standardne devijacije slučajnih varijabli X i Y, a p je koeficijent korelacije, koji je mjera odnosa između slučajnih varijabli X i Y.
Ako je p = 0, tada se vrijednosti, x i, y i, dobijene iz dvodimenzionalne normalne populacije, nalaze na grafu u koordinatama x, y unutar područja omeđenog krugom (slika 5, a). U ovom slučaju ne postoji korelacija između slučajnih varijabli X i Y i one se nazivaju nekoreliranim. Za bivarijantnu normalnu distribuciju, nekorelacija znači istovremeno i nezavisnost slučajnih varijabli X i Y.

Proučavanje objektivno postojećih veza među pojavama najvažniji je zadatak statistike. U procesu statističkog istraživanja zavisnosti otkrivaju se uzročno-posledične veze među pojavama. Uzročne veze su takva veza između pojava i procesa kada promjena jednog od njih - uzroka dovodi do promjene drugog - posljedice.

Znakovi pojava i procesa dijele se u dvije klase prema njihovom značaju za proučavanje odnosa. Znakovi koji uzrokuju promjene u drugim srodnim znakovima nazivaju se faktorijel ili samo faktori. Znakovi koji se mijenjaju pod uticajem faktorskih znakova nazivaju se efektivno .

U statistici se razlikuju funkcionalne i stohastičke (vjerovatne) veze pojava i procesa:

  • Funkcionalni naziva se takav odnos u kojem određena vrijednost faktorskog atributa odgovara jednoj vrijednosti efektivnog.
  • Ako se uzročna ovisnost manifestira ne u svakom pojedinačnom slučaju, već općenito, u prosjeku s velikim brojem zapažanja, tada se takva ovisnost naziva stohastički (vjerovatni) ... Korelacija je poseban slučaj stohastičke veze.

osim toga, klasificirane su veze između pojava i njihovih znakova po stepenu bliskosti, usmerenosti i analitičkom izrazu.

Towards postoje direktne i inverzne veze:

  • Direktna veza - to je takav odnos u kojem s povećanjem (smanjenjem) vrijednosti faktorskog atributa dolazi do povećanja (smanjenja) vrijednosti efektivnog. Tako, na primjer, povećanje produktivnosti rada doprinosi povećanju nivoa profitabilnosti proizvodnje.
  • U slučaju povratnih informacija vrijednosti efektivnog atributa se mijenjaju pod utjecajem faktorijala, ali u suprotnom smjeru u odnosu na promjenu faktorijalnog atributa. Dakle, sa povećanjem nivoa povrata na sredstva, trošak jedinice proizvodnje se smanjuje.

Analitičkim izrazom postoje pravolinijske (ili jednostavno linearne) i nelinearne veze:

  • Ako se statistički odnos između pojava može približno izraziti jednadžbom prave linije, onda se naziva line link oblika: y = a + bx.
  • Ako se veza može izraziti jednadžbom bilo koje krive linije (parabole, hiperbole, itd.), onda se takva veza naziva nelinearna (krivolinijska) veza .

Nepropusnost komunikacije pokazuje mjeru utjecaja atributa faktora na ukupnu varijaciju efektivnog atributa. Klasifikacija komunikacije prema stepenu bliskosti prikazan je u tabeli 1.

Za identifikaciju prisutnosti veze, njene prirode i smjera u statistici, koriste se sljedeće metode: dovođenje paralelnih podataka, analitička grupisanja, grafička, korelacija. Glavna metoda za proučavanje statističke veze je statistička komunikacijsko modeliranje zasnovano na korelacionoj i regresijskoj analizi .

Korelacija je statistički odnos između slučajnih varijabli koji nema striktno funkcionalnu prirodu, u kojem promjena jedne od slučajnih varijabli dovodi do promjene matematičkog očekivanja druge. U statistici je uobičajeno razlikovati sljedeće vrste korelacije :

  • korelacija parova - odnos između dva znaka (efektivni i faktorijalni, ili dva faktorijalna);
  • parcijalna korelacija - odnos između efektivne i jedne faktorske karakteristike sa fiksnom vrednošću ostalih faktorskih karakteristika;
  • višestruka korelacija - zavisnost efektivnog i dva ili više faktorskih znakova uključenih u studiju.

Zadatak korelacione analize je kvantitativno određivanje čvrstoće odnosa između dva svojstva (sa odnosom u paru) i između efektivnog i skupa faktorskih karakteristika (sa multifaktorskim odnosom).

Čvrstost odnosa kvantitativno se izražava veličinom koeficijenata korelacije, koji, dajući kvantitativnu karakteristiku čvrstoće odnosa između obilježja, omogućavaju određivanje "korisnosti" faktorskih karakteristika pri konstruiranju jednadžbe višestruke regresije. .

Korelacija je međusobno povezana s regresijom, budući da prva procjenjuje snagu (zaštićenost) statističke veze, druga ispituje njen oblik.

Regresiona analiza je odrediti analitički izraz odnosa u obliku jednadžbe regresije.

Regresija naziva se zavisnost prosječne vrijednosti slučajne varijable efektivnog indikatora od veličine faktorijala, i jednadžba regresije - jednačina koja opisuje korelaciju između efektivne osobine i jednog ili više faktorskih.

Formule korelaciono-regresijske analize za pravolinijski odnos sa korelacijom parova prikazani su u tabeli 2.

Tabela 2 - Formule korelaciono-regresione analize za pravolinijsku vezu sa parnom korelacijom
IndeksOznaka i formula
Jednačina prave linije za korelaciju parova y x = a + bx, gdje je b koeficijent regresije
Sistem normalnih jednačina najmanjih kvadrata za određivanje koeficijenata a i b
Koeficijent linearne korelacije za određivanje tesnosti komunikacije,
njegovo tumačenje:
r = 0 - nema veze;
0 -1 r = 1 - funkcionalna veza
Apsolutna elastičnost
Elastičnost je relativna

Primjeri rješavanja zadataka na temu "Osnove korelacijske analize"

Problem 1 (analiza pravolinijskog odnosa u parnoj korelaciji) ... Postoje podaci o kvalifikacijama i mjesečnom učinku pet radnika u radionici:

Za proučavanje odnosa između kvalifikacija radnika i njihove proizvodnje, odrediti linearnu jednadžbu odnosa i koeficijent korelacije. Dajte tumačenje koeficijenata regresije i korelacije.

Rješenje ... Proširimo predloženu tabelu.

Odredimo parametre jednačine prave y x = a + bx... Da bismo to uradili, rešićemo sistem jednačina:

Dakle, koeficijent regresije je 18.

Pošto je v pozitivan broj, postoji direktna veza između parametara x i y.
a = 92-4 × 18
a = 20
Linearna jednačina veze ima oblik yx = 20 + 18x.

Da bismo odredili čvrstoću (snagu) odnosa između proučavanih karakteristika, određujemo vrijednost koeficijenta korelacije po formuli:

= (2020-20 × 460/5) / (√10 × √3280) ≈ 180 / 181,11 = 0,99. Pošto je koeficijent korelacije veći od 0,7, veza u ovoj seriji je jaka.

Zadatak 2 ... U preduzeću su cijene proizvoda smanjene sa 80 rubalja. po jedinici do 60 rubalja. Nakon sniženja cijena, prodaja je porasla sa 400 na 500 jedinica dnevno. Odredite apsolutnu i relativnu elastičnost. Izvršiti procjenu elastičnosti u cilju mogućnosti (ili nemogućnosti) daljnjeg sniženja cijena.

Rješenje ... Izračunajmo indikatore koji nam omogućavaju da izvršimo preliminarnu analizu elastičnosti:

Kao što vidite, stopa pada cijena je u apsolutnoj vrijednosti jednaka stopi povećanja potražnje.

Apsolutnu i relativnu elastičnost nalazimo po formulama:

= (500-400) / (60-80) = 100 / (- 20) -5 - apsolutna elastičnost

= (100: 400) / (- 20:80) = -1 - relativna elastičnost

Modul relativne elastičnosti je 1. Ovo potvrđuje činjenicu da je stopa rasta tražnje jednaka stopi pada cijena. U takvoj situaciji izračunavamo prihode koje je preduzeće primilo prije i nakon smanjenja cijene: 80 * 400 = 32.000 rubalja. dnevno, 60 * 500 = 30.000 rubalja. po danu - kao što vidimo prihodi su smanjeni i dalje snižavanje cijena nije preporučljivo.

Upotreba statističkih metoda u obradi materijala iz psiholoških istraživanja pruža odličnu priliku za izvlačenje korisnih informacija iz eksperimentalnih podataka. Jedna od najčešćih statističkih metoda je analiza korelacije.

Termin "korelacija" prvi je upotrijebio francuski paleontolog J. Cuvier, koji je izveo "zakon korelacije dijelova i organa životinja" (ovaj zakon omogućava rekonstrukciju izgleda cijele životinje iz pronađenih dijelova tijelo). Ovaj termin je u statistiku uveo engleski biolog i statističar F. Galton (ne samo "veza" - odnos, i "kao veza" - korelacija).

Korelaciona analiza je test hipoteza o odnosima između varijabli pomoću koeficijenata korelacije, dvodimenzionalne deskriptivne statistike, kvantitativne mjere odnosa (zajedničke varijabilnosti) dvije varijable. Dakle, ovo je skup metoda za otkrivanje korelacione zavisnosti između slučajnih varijabli ili karakteristika.

Analiza korelacije za dvije slučajne varijable uključuje:

  • izgradnja korelacionog polja i sastavljanje korelacione tabele;
  • izračunavanje koeficijenata korelacije uzorka i korelacionih odnosa;
  • testiranje statističke hipoteze o značajnosti odnosa.

Osnovna svrha korelacione analize je da se identifikuje odnos između dve ili više proučavanih varijabli, koji se smatra zajedničkom doslednom promenom dve proučavane karakteristike. Ova varijabilnost ima tri glavne karakteristike: oblik, smjer i snagu.

Oblik korelacije može biti linearan ili nelinearan. Linearni oblik je pogodniji za identifikaciju i tumačenje korelacije. Za linearnu korelaciju mogu se razlikovati dva glavna pravca: pozitivan („direktan odnos“) i negativan („povratna informacija“).

Jačina veze direktno ukazuje na to koliko se jasno manifestuje zajednička varijabilnost proučavanih varijabli. U psihologiji, funkcionalni odnos pojava može se empirijski otkriti samo kao vjerovatnoća veza odgovarajućih karakteristika. Jasnu ideju o prirodi vjerojatnosnog odnosa daje dijagram raspršenja - graf čije osi odgovaraju vrijednostima dvije varijable, a svaki subjekt je tačka.

Kao numerička karakteristika vjerovatnoćeg odnosa koriste se koeficijenti korelacije čije vrijednosti variraju u rasponu od –1 do +1. Nakon izvršenih proračuna, istraživač, po pravilu, odabire samo najjače korelacije koje se dalje tumače (tabela 1).

Kriterijum za odabir "dovoljno jakih" korelacija može biti kako apsolutna vrijednost samog koeficijenta korelacije (od 0,7 do 1), tako i relativna vrijednost ovog koeficijenta, određena nivoom statističke značajnosti (od 0,01 do 0,1), u zavisnosti na veličinu uzorka. U malim uzorcima za dalju interpretaciju, ispravnije je odabrati jake korelacije na osnovu nivoa statističke značajnosti. Za studije provedene na velikim uzorcima, bolje je koristiti apsolutne vrijednosti koeficijenata korelacije.

Dakle, zadatak korelacione analize svodi se na utvrđivanje pravca (pozitivnog ili negativnog) i oblika (linearnog, nelinearnog) odnosa između različitih znakova, merenje njegove čvrstoće i, konačno, na proveru nivoa značajnosti dobijenih koeficijenata korelacije. .

Trenutno je razvijeno mnogo različitih koeficijenata korelacije. Najviše se koriste r-Pirson, r-Speerman i τ -Kendal. Savremeni kompjuterski statistički programi u meniju "Korelacije" nude upravo ova tri koeficijenta, a metode grupnog poređenja su predložene za rešavanje drugih istraživačkih problema.

Izbor metode za izračunavanje koeficijenta korelacije zavisi od vrste skale kojoj pripadaju varijable (tabela 2).

Za varijable s intervalom i nominalnom skalom koristi se Pirsonov koeficijent korelacije (korelacija momenata proizvoda). Ako barem jedna od dvije varijable ima ordinalnu skalu ili nije normalno raspoređena, koristi se korelacija ranga Spearman, ili

t-Kendall. Ako je jedna od dvije varijable dihotomna, može se koristiti dvoredna korelacija (u statističkom kompjuterskom programu SPSS ova karakteristika je odsutna; umjesto toga može se izračunati rang korelacija). U slučaju da su obje varijable dihotomne, koristi se korelacija sa četiri polja (ovaj tip korelacije izračunava SPSS na osnovu definicije mjera udaljenosti i mjera sličnosti). Izračunavanje koeficijenta korelacije između dvije ne-dihotomne varijable moguće je samo ako je odnos između njih linearan (jednosmjeran). Ako je veza, npr. U-u obliku (dvosmisleno), koeficijent korelacije nije pogodan za upotrebu kao mjera jačine veze: njegova vrijednost teži nuli.

Dakle, uslovi za primenu koeficijenata korelacije biće sledeći:

  • varijable mjerene u kvantitativnoj (rang, metrička) skala na istom uzorku objekata;
  • odnos između varijabli je monoton.

Glavna statistička hipoteza, koja se provjerava korelacijskom analizom, je neusmjerena i sadrži tvrdnju o jednakosti korelacije sa nulom u općoj populaciji. H 0: r xy= 0. Ako se odbije, prihvata se alternativna hipoteza H 1: r xy≠ 0 na prisustvo pozitivne ili negativne korelacije - zavisno od predznaka izračunatog koeficijenta korelacije.

Na osnovu prihvatanja ili odbijanja hipoteza donose se smisleni zaključci. Ako, prema rezultatima statističke provjere H 0: r xy= 0 ne odstupa na nivou a, onda će smisleni zaključak biti sljedeći: odnos između X i Y nije pronađeno. Ako na H 0 r xy= 0 odstupa na nivou a, što znači da je pronađena pozitivna (negativna) veza između X i Y... Međutim, tumačenju otkrivenih korelacija treba pristupiti s oprezom. Sa naučne tačke gledišta, jednostavno uspostavljanje veze između dve varijable ne znači da postoji uzročna veza. Štaviše, prisustvo korelacije ne uspostavlja vezu između uzroka i posledice. To jednostavno ukazuje da su te dvije varijable više povezane jedna s drugom nego što bi se očekivalo slučajno. Ipak, uz poštovanje opreza, upotreba korelacionih metoda u proučavanju uzročno-posledičnih veza je potpuno opravdana. Izbjegavajte kategorične fraze poput „varijabla X je razlog povećanja indikatora Y". Takve izjave treba formulisati kao pretpostavke koje moraju biti rigorozno teorijski potkrijepljene.

Detaljan opis matematičke procedure za svaki koeficijent korelacije dat je u udžbenicima matematičke statistike; ; ; i dr. Ograničićemo se na opisivanje mogućnosti korišćenja ovih koeficijenata u zavisnosti od vrste merne skale.

Korelacija metričkih varijabli

Za proučavanje odnosa dvije metričke varijable mjerene na istom uzorku, primjenite koeficijent korelacije r-Pirson... Sam koeficijent karakterizira postojanje samo linearnog odnosa između obilježja, označenih, u pravilu, simbolima X i Y... Koeficijent linearne korelacije je parametarska metoda i njegova ispravna primjena je moguća samo ako su rezultati mjerenja prikazani na skali intervala, a raspodjela vrijednosti u analiziranim varijablama se razlikuje od normalne do neznatnog stepena. Postoje mnoge situacije u kojima je njegova upotreba prikladna. Na primjer: uspostavljanje veze između inteligencije studenta i njegovog akademskog uspjeha; između raspoloženja i uspjeha u izlasku iz problematične situacije; između nivoa prihoda i temperamenta, itd.

Pearsonov koeficijent se široko koristi u psihologiji i pedagogiji. Na primjer, u radovima I. Ya. Kaplunovich i PD Rabinovich, MP Nuzhdina, izračunavanje Pearsonovog linearnog koeficijenta korelacije korišteno je za potvrdu postavljenih hipoteza.

Prilikom obrade podataka "ručno" potrebno je izračunati koeficijent korelacije, a zatim odrediti str- nivo značaja (kako bi se pojednostavila verifikacija podataka, koriste se tabele kritičnih vrednosti r xy koji se sastavljaju prema ovom kriteriju). Vrijednost Pearsonovog koeficijenta linearne korelacije ne može preći +1 i biti manja od –1. Ova dva broja +1 i –1 su granice za koeficijent korelacije. Kada proračun rezultira vrijednošću većom od +1 ili manjom od –1, to znači da je došlo do greške u proračunu.

Prilikom računanja na računaru, statistički program (SPSS, Statistica) prati izračunati koeficijent korelacije tačnijom vrijednošću str-nivo.

Za statističku odluku da prihvati ili odbije H 0 obično postavljeno α = 0,05, a za veliki broj zapažanja (100 ili više) α = 0,01. Ako p ≤ α, H 0 odstupa i donosi smislen zaključak da je utvrđena statistički pouzdana (značajna) veza između proučavanih varijabli (pozitivna ili negativna – u zavisnosti od predznaka korelacije). Kada p> α, H 0 nije odbačen, smisleni zaključak je ograničen na tvrdnju da veza (statistički značajna) nije pronađena.

Ako veza nije pronađena, ali postoji razlog za vjerovanje da postoji, trebali biste provjeriti moguće razloge za nepouzdanost veze.

Nelinearnost komunikacije- da biste to učinili, analizirajte dvodimenzionalni dijagram raspršenja. Ako je odnos nelinearan, ali monotoničan, prijeđite na rang korelacije. Ako odnos nije monoton, onda podijelite uzorak na dijelove u kojima je odnos monoton, i izračunajte korelacije posebno za svaki dio uzorka, ili podijelite uzorak u kontrastne grupe, a zatim ih uporedite prema stupnju ozbiljnosti osobina.

Prisutnost odstupanja i izražena asimetrija u distribuciji jedne ili obje osobine. Da biste to učinili, morate pogledati histograme distribucije frekvencija oba znaka. Ako postoje odstupanja ili asimetrije, isključite odstupanja ili idite na rang korelacije.

Heterogenost uzorka(analizirajte 2D dijagram raspršenja). Pokušajte podijeliti uzorak na dijelove u kojima odnos može imati različite smjerove.

Ako je odnos statistički značajan, onda je prije donošenja smislenog zaključka potrebno isključiti mogućnost lažne korelacije:

  • priključak je zbog emisije... Ako postoje odstupanja, idite na rangiranje korelacija ili isključite odstupanja;
  • odnos je posledica uticaja treće varijable... Ako postoji takva pojava, potrebno je izračunati korelaciju ne samo za cijeli uzorak, već i za svaku grupu posebno. Ako je "treća" varijabla metrička, izračunajte djelomičnu korelaciju.

Parcijalni koeficijent korelacije r xy -z izračunava se ako je potrebno provjeriti pretpostavku da je odnos između dvije varijable X i Y ne zavisi od uticaja treće varijable Z... Vrlo često dvije varijable koreliraju jedna s drugom samo zbog činjenice da se obje dosljedno mijenjaju pod utjecajem treće varijable. Drugim riječima, zapravo ne postoji veza između odgovarajućih svojstava, već se ona manifestuje u statističkom odnosu pod uticajem zajedničkog uzroka. Na primjer, starost može biti čest uzrok varijabilnosti u dvije varijable kada se proučava odnos različitih psiholoških karakteristika u starosnoj grupi. Treba biti oprezan kada se parcijalna korelacija tumači iz uzročne perspektive, jer ako Z korelira sa X i sa Y, i parcijalna korelacija r xy -z je blizu nule, ne znači nužno da jeste Z je čest razlog za X i Y.

Korelacija varijabli ranga

Ako je koeficijent korelacije neprihvatljiv za kvantitativne podatke r-Pirson, zatim da se testira hipoteza o odnosu dvije varijable nakon preliminarnog rangiranja, mogu se primijeniti korelacije r-Speerman ili τ -Kendal... Na primjer, u proučavanju psihofizičkih karakteristika muzički darovitih adolescenata I. A. Lavočkina, korišten je Spearmanov kriterij.

Za ispravan izračun oba koeficijenta (Spearman i Kendall), rezultati mjerenja moraju biti prikazani u skali rangova ili intervala. Ne postoje fundamentalne razlike između ovih kriterija, ali je općenito prihvaćeno da je Kendall koeficijent „smisleniji“, budući da potpunije i detaljnije analizira odnose između varijabli, pregledavajući sva moguća poklapanja između parova vrijednosti. Spearmanov koeficijent preciznije uzima u obzir kvantitativni stepen veze između varijabli.

Spearmanov koeficijent korelacije ranga je neparametarski analog klasičnog Pirsonovog koeficijenta korelacije, ali pri njegovom izračunavanju uzimaju se u obzir indikatori upoređenih varijabli (aritmetička sredina i varijansa), koji nisu vezani za distribuciju, već rangovi. Na primjer, potrebno je utvrditi odnos između procjena ranga osobina ličnosti uključenih u ideju osobe o njegovom „stvarnom ja“ i „idealnom ja“.

Spearmanov koeficijent se široko koristi u psihološkim istraživanjima. Na primjer, u radu Yu.V. Bushova i N.N.

Pošto je ovaj koeficijent analogan r-Pirson, onda je njegova primjena za testiranje hipoteza slična primjeni koeficijenta r-Pirson. Odnosno, provjerljiva statistička hipoteza, postupak donošenja statističke odluke i formulacija smislenog zaključka su isti. U kompjuterskim programima (SPSS, Statistica) nivoi značajnosti za iste koeficijente r-Pirson i r-Specijalisti su uvek isti.

Prednost kvote r-Speerman protiv kvota r-Pirson - osjetljiviji na komunikaciju. Koristimo ga u sledećim slučajevima:

  • prisustvo značajnog odstupanja distribucije najmanje jedne varijable od normalnog oblika (asimetrija, outliers);
  • pojava krivolinijske (monotonske) veze.

Ograničenje za primjenu koeficijenta r- Specijalisti su:

  • za svaku varijablu najmanje 5 zapažanja;
  • koeficijent za veliki broj jednakih rangova u jednoj ili obje varijable daje grubu vrijednost.

Koeficijent korelacije ranga τ -Kendal je nezavisna originalna metoda zasnovana na izračunavanju omjera parova vrijednosti dva uzorka koji imaju iste ili različite tendencije (povećanje ili smanjenje vrijednosti). Ovaj koeficijent se još naziva koeficijent podudarnosti... Dakle, glavna ideja ove metode je da se smjer veze može procijeniti parnim upoređivanjem subjekata jedan s drugim: ako par subjekata ima promjenu u X poklapa se u pravcu sa promjenom u Y, ovo ukazuje na pozitivan odnos, ako ne, negativan odnos, na primjer, u proučavanju ličnih kvaliteta koji su odlučujući za dobrobit porodice. U ovoj metodi, jedna varijabla je predstavljena kao monotonski niz (na primjer, podaci o mužu) u rastućem redoslijedu veličine; drugoj varijabli (na primjer, ženini podaci) dodjeljuju se odgovarajuća rangirana mjesta. Broj inverzija (kršenja monotonije u odnosu na prvi red) koristi se u formuli za koeficijente korelacije.

Prilikom brojanja τ- Kendall "ručno" podaci su prvo poređani po varijabli X... Zatim se za svaki predmet izračunava koliko je puta njegov rang prema Y ispada da je manji od ranga subjekata koji su niži. Rezultat se bilježi u koloni "Utakmice". Zbir svih vrijednosti u koloni "Podudaranje" je P- ukupan broj podudaranja se zamjenjuje u formulu za izračunavanje Kendalovog koeficijenta, koji je računski jednostavniji, ali s povećanjem uzorka, za razliku od r-Speerman, obim proračuna se ne povećava proporcionalno, već eksponencijalno. Tako, na primjer, za N= 12, potrebno je izdvojiti 66 parova predmeta, a za N= 489 - već 1128 parova, odnosno volumen proračuna se povećava više od 17 puta. Prilikom računanja na računaru u statističkom programu (SPSS, Statistica), Kendall koeficijent se izračunava slično koeficijentima r-Speerman i r-Pirson. Izračunati koeficijent korelacije τ -Kendall karakteriše tačnija vrijednost str-nivo.

Kendallov koeficijent je poželjniji kada postoje odstupanja u izvornim podacima.

Karakteristika koeficijenata rang korelacije je da maksimalne korelacije ranga po modulu (+1, –1) ne odgovaraju nužno strogim direktnim ili obrnuto proporcionalnim odnosima između početnih varijabli X i Y: dovoljna je samo monotona funkcionalna veza između njih. Korelacije ranga dostižu svoju maksimalnu modulo vrijednost ako veća vrijednost jedne varijable uvijek odgovara većoj vrijednosti druge varijable (+1), ili veća vrijednost jedne varijable uvijek odgovara manjoj vrijednosti druge varijable i obrnuto (–1 ).

Statistička hipoteza koja se testira, postupak donošenja statističke odluke i formulacija smislenog zaključka isti su kao u slučaju r-Speaker ili r-Pirson.

Ako statistički značajna veza nije pronađena, ali postoji razlog za vjerovanje da veza postoji, prvo treba preći s koeficijenta

r- Zvučnik do koeficijenta τ -Kendall (ili obrnuto), a zatim provjerite moguće razloge nepouzdanosti veze:

  • nelinearnost komunikacije: Da biste to učinili, pogledajte 2D dijagram raspršenja. Ako odnos nije monoton, onda podijelite uzorak na dijelove u kojima je odnos monoton, ili podijelite uzorak u kontrastne grupe, a zatim ih uporedite prema nivou ozbiljnosti osobine;
  • heterogenost uzorka: pogledajte graf dvodimenzionalnog raspršenja, pokušajte podijeliti uzorak na dijelove u kojima odnos može imati različite smjerove.

Ako je odnos statistički značajan, onda je prije donošenja smislenog zaključka potrebno isključiti mogućnost lažne korelacije (po analogiji sa metričkim koeficijentima korelacije).

Korelacija dihotomnih varijabli

Kada se porede dvije varijable mjerene na dihotomnoj skali, mjera korelacije je tzv. koeficijent j, koji je koeficijent korelacije za dihotomne podatke.

Količina koeficijent φ leži između +1 i –1. Može biti pozitivan ili negativan, karakterizirajući smjer veze između dva dihotomno mjerena svojstva. Međutim, interpretacija φ može predstavljati specifične probleme. Dihotomni podaci uključeni u shemu za izračunavanje koeficijenta φ ne izgledaju kao dvodimenzionalna normalna površina, stoga je pogrešno pretpostaviti da su interpretirane vrijednosti r xy= 0,60 i φ = 0,60 su isti. Koeficijent φ se može izračunati metodom kodiranja, kao i korištenjem takozvane tabele sa četiri polja ili tabele kontingencije.

Da bi se primenio koeficijent korelacije φ, moraju biti ispunjeni sledeći uslovi:

  • osobine koje se porede treba meriti na dihotomnoj skali;
  • X i Y trebao bi biti isti.

Ova vrsta korelacije se izračunava u računarskom programu SPSS na osnovu određivanja mera udaljenosti i mera sličnosti. Neki statistički postupci, kao što su faktorska analiza, klaster analiza, multivarijantno skaliranje, zasnivaju se na primjeni ovih mjera, a ponekad i sami predstavljaju dodatne mogućnosti za izračunavanje mjera sličnosti.

U slučajevima kada se jedna varijabla mjeri na dihotomnoj skali (varijabla X), a drugi na skali intervala ili omjera (varijabilan Y) se koristi biserijski koeficijent korelacije, na primjer, prilikom testiranja hipoteza o utjecaju spola djeteta na pokazatelj visine i težine. Ovaj koeficijent varira u rasponu od –1 do +1, ali njegov predznak nije važan za interpretaciju rezultata. Da biste ga koristili, morate se pridržavati sljedećih uslova:

  • karakteristike koje se porede treba meriti na različitim skalama: jedan X- na dihotomnoj skali; drugi Y- u skali intervala ili omjera;
  • varijabla Y ima normalan zakon raspodjele;
  • broj različitih karakteristika u upoređenim varijablama X i Y trebao bi biti isti.

Ako je varijabla X mjereno na dihotomnoj skali, i varijabla Y na ljestvici ranga (varijabilna Y), može biti korišteno rang-biserijski koeficijent korelacije, koji je usko povezan sa τ-Kendallom i koristi u svojoj definiciji koncepte koincidencije i inverzije. Tumačenje rezultata je isto.

Korelaciona analiza korišćenjem računarskih programa SPSS i Statistica je jednostavna i praktična operacija. Da biste to učinili, nakon pozivanja dijaloškog okvira Bivarijantne korelacije (Analyze> Correlate> Bivariate...), potrebno je premjestiti proučavane varijable u polje Variables i odabrati metodu pomoću koje će se otkriti korelacijski odnos između varijabli. Izlazni fajl sadrži kvadratnu tabelu (korelacije) za svaki izračunati kriterijum. Svaka ćelija tabele sadrži: vrednost samog koeficijenta korelacije (Correlation Coefficient), statističku značajnost izračunatog koeficijenta Sig, broj ispitanika.

Zaglavlje i bočni stupac rezultirajuće korelacijske tablice sadrže nazive varijabli. Dijagonala (gornji lijevi - donji desni ugao) tabele se sastoji od jedinica, jer je korelacija bilo koje varijable sa sobom maksimalna. Tabela je simetrična oko ove dijagonale. Ako je u programu označeno polje za potvrdu "Označi značajne korelacije", tada će statistički značajni koeficijenti biti označeni u konačnoj korelacionoj tabeli: na nivou od 0,05 i manje - jednom zvezdicom (*), a na nivou od 0,01 - sa dvije zvjezdice (**).

Dakle, da rezimiramo: glavna svrha korelacione analize je da identifikuje odnos između varijabli. Mjera odnosa su koeficijenti korelacije, čiji izbor direktno ovisi o vrsti skale na kojoj se varijable mjere, broju varijabilnih karakteristika u upoređivanim varijablama i distribuciji varijabli. Korelacija između dvije varijable ne znači da postoji uzročna veza između njih. Iako korelacija ne ukazuje direktno na uzročnost, ona može biti trag za uzrok. Na osnovu toga se mogu formirati hipoteze. U nekim slučajevima, nedostatak korelacije ima dublji uticaj na hipotezu o uzročnosti. Nulta korelacija između dvije varijable može ukazivati ​​na to da nema efekta jedne varijable na drugu.

Podijelite ovo