Korrelatsiooni hindamine. Korrelatsioonid psühholoogia teesides

Kui järjestamisele kuuluvad kaks väärtuste seeriat, on otstarbekas arvutada Spearmani järgu korrelatsioon.

Selliseid seeriaid saab esindada:

  • samas uuritavate objektide rühmas määratud tunnuste paar;
  • üksikute alluvate tunnuste paar, mis on määratud 2 uuritavas objektis sama tunnuste kogumi järgi;
  • rühma alluvate tunnuste paar;
  • tunnuste individuaalne ja grupiline alluvus.

Meetod hõlmab näitajate järjestamist iga tunnuse jaoks eraldi.

Väikseimal väärtusel on madalaim aste.

See meetod viitab mitteparameetrilisele statistilisele meetodile, mis on loodud uuritavate nähtuste vahelise seose olemasolu kindlakstegemiseks:

  • kahe kvantitatiivse andmerea vahelise paralleelsuse tegeliku määra kindlaksmääramine;
  • tuvastatud seose läheduse hindamine, väljendatuna kvantitatiivselt.

Korrelatsioonianalüüs

Statistiline meetod, mis on loodud kahe või enama vahelise seose tuvastamiseks juhuslikud muutujad(muutujad), samuti selle tugevust nimetatakse korrelatsioonianalüüs.

See sai oma nime korrelatsioonist (lat.) - ratio.

Selle kasutamisel on võimalikud järgmised stsenaariumid:

  • korrelatsiooni olemasolu (positiivne või negatiivne);
  • korrelatsioon puudub (null).

Kui muutujate vahel luuakse seos me räägime nende korrelatsiooni kohta. Teisisõnu võime öelda, et kui X väärtus muutub, täheldatakse tingimata Y väärtuse proportsionaalset muutust.

Vahenditena kasutatakse erinevaid kommunikatsioonimõõte (koefitsiente).

Nende valikut mõjutavad:

  • juhuslike arvude mõõtmise meetod;
  • juhuslike arvude vahelise seose olemus.

Korrelatsiooniseose olemasolu saab kuvada graafiliselt (graafikud) ja koefitsiendi abil (numbriline kuva).

Korrelatsioonisuhet iseloomustavad järgmised tunnused:

  • ühenduse tugevus (korrelatsioonikoefitsiendiga ±0,7 kuni ±1 – tugev; ±0,3 kuni ±0,699 – keskmine; 0 kuni ±0,299 – nõrk);
  • suhtluse suund (otsene või vastupidine).

Korrelatsioonianalüüsi eesmärgid

Korrelatsioonianalüüs ei võimalda tuvastada põhjuslikku seost uuritavate muutujate vahel.

See viiakse läbi järgmistel eesmärkidel:

  • muutujate vaheliste seoste loomine;
  • muutuja kohta teatud informatsiooni saamine teise muutuja põhjal;
  • selle sõltuvuse läheduse (seotuse) määramine;
  • loodud ühenduse suuna määramine.

Korrelatsioonianalüüsi meetodid


See analüüs saab teha kasutades:

  • ruutude või Pearsoni meetod;
  • auaste meetod või Spearman.

Pearsoni meetod on rakendatav arvutuste jaoks, mis nõuavad täpne määratlus muutujate vahel eksisteeriv jõud. Tema abiga uuritud tunnuseid tuleks väljendada ainult kvantitatiivselt.

Spearmani meetodi või järgukorrelatsiooni rakendamiseks ei ole tunnuste väljendamisele rangeid nõudeid – see võib olla nii kvantitatiivne kui ka atributiivne. Tänu sellele meetodile ei saada teavet ühenduse tugevuse täpse määramise kohta, vaid see on ligikaudne.

Muutujate read võivad sisaldada avatud variante. Näiteks kui töökogemust väljendatakse väärtustes nagu kuni 1 aasta, üle 5 aasta jne.

Korrelatsioonikordaja

Kahe muutuja muutuste olemust iseloomustavat statistilist suurust nimetatakse korrelatsioonikordajaks või paaride korrelatsioonikordajaks. Kvantitatiivselt on see vahemikus -1 kuni +1.

Kõige tavalisemad koefitsiendid on:

  • Pearson– kehtib intervallskaalale kuuluvate muutujate puhul;
  • Spearman– järgu skaala muutujate jaoks.

Korrelatsioonikordaja kasutamise piirangud

Ebausaldusväärsete andmete saamine korrelatsioonikordaja arvutamisel on võimalik juhtudel, kui:

  • saadaval on piisav arv muutuvaid väärtusi (25-100 vaatluspaari);
  • uuritavate muutujate vahel luuakse näiteks ruutsuhe, mitte lineaarne;
  • igal juhul sisaldavad andmed rohkem kui ühte vaatlust;
  • muutujate anomaalsete väärtuste (kõrvalväärtuste) olemasolu;
  • uuritavad andmed koosnevad selgelt eristatavatest vaatluste alarühmadest;
  • korrelatsiooni olemasolu ei võimalda tuvastada, milliseid muutujaid võib pidada põhjuseks ja milliseid tagajärjeks.

Korrelatsiooni olulisuse kontrollimine

Statistiliste suuruste hindamiseks kasutatakse nende olulisuse ehk usaldusväärsuse mõistet, mis iseloomustab mingi suuruse või selle äärmuslike väärtuste juhusliku esinemise tõenäosust.

Kõige tavalisem meetod korrelatsiooni olulisuse määramiseks on Studenti t-test.

Selle väärtust võrreldakse tabeli väärtusega, vabadusastmete arvuks võetakse 2. Kui kriteeriumi arvutuslik väärtus on suurem kui tabeli väärtus, näitab see korrelatsioonikordaja olulisust.

Majandusarvutuste tegemisel loetakse piisavaks usaldusnivoo 0,05 (95%) või 0,01 (99%).

Spearmani auastmed

Spearmani auaste korrelatsioonikordaja võimaldab statistiliselt kindlaks teha nähtustevahelise seose olemasolu. Selle arvutamine hõlmab iga atribuudi seerianumbri – auastme – määramist. Auaste võib olla tõusev või kahanev.

Järjestatavate funktsioonide arv võib olla ükskõik milline. See on üsna töömahukas protsess, mis piirab nende arvu. Raskused algavad siis, kui jõuad 20 märgini.

Spearmani koefitsiendi arvutamiseks kasutage valemit:

milles:

n – kuvab järjestatud objektide arvu;

d pole midagi muud kui kahe muutuja auastmete erinevus;

ja ∑(d2) on astmete erinevuste ruudu summa.

Korrelatsioonanalüüsi rakendamine psühholoogias

Statistiline tugi psühholoogilised uuringud võimaldab muuta need objektiivsemaks ja esinduslikumaks. Psühholoogiliste eksperimentide käigus saadud andmete statistiline töötlemine aitab ammutada maksimaalselt kasulikku teavet.

Kõige laialdasemalt kasutatav meetod nende tulemuste töötlemiseks on korrelatsioonianalüüs.

Uuringu käigus saadud tulemuste korrelatsioonianalüüs on asjakohane:

  • ärevus (R. Temmli, M. Dorca, V. Ameni testide järgi);
  • perekondlikud suhted (E.G. Eidemilleri, V.V. Yustitskise ankeet “Peresuhete analüüs” (ARA));
  • sisesuse-välisuse tase (E.F. Bazhini, E.A. Golynkina ja A.M. Etkindi küsimustik);
  • emotsionaalse läbipõlemise tase õpetajate seas (V.V. Boyko küsimustik);
  • seosed õpilaste verbaalse intelligentsuse elementide vahel multidistsiplinaarse koolituse käigus (K.M. Gurevichi jt metoodika);
  • seosed empaatiataseme (V.V. Boyko meetod) ja abieluga rahulolu vahel (V.V. Stolini, T.L. Romanova, G.P. Butenko küsimustik);
  • seosed noorukite sotsiomeetrilise staatuse (Jacob L. Moreno test) ja perekasvatusstiili tunnuste vahel (E.G. Eidemilleri, V.V. Yustitskise küsimustik);
  • kahe vanema ja üksikvanemaga peredes kasvanud noorukite elueesmärkide struktuurid (ankeet Edward L. Deci, Richard M. Ryan Ryan).

Lühijuhised korrelatsioonianalüüsi läbiviimiseks Spearmani kriteeriumi abil

Korrelatsioonianalüüs tehakse Spearmani meetodil vastavalt järgmisele algoritmile:

  • paaris võrreldavad omadused on paigutatud 2 rida, millest üks on tähistatud X-ga ja teine ​​Y-ga;
  • X-seeria väärtused on järjestatud kasvavas või kahanevas järjekorras;
  • Y-seeria väärtuste paigutuse järjestuse määrab nende vastavus X-seeria väärtustele;
  • iga X-seeria väärtuse jaoks määrake auaste - määrake seerianumber minimaalsest väärtusest maksimumini;
  • iga Y-seeria väärtuse jaoks määrake ka auaste (minimaalsest maksimumini);
  • arvutada erinevus (D) X ja Y ridade vahel, kasutades valemit D=X-Y;
  • saadud erinevuse väärtused ruudustatakse;
  • sooritada järguvahede ruutude liitmine;
  • tehke arvutused järgmise valemi abil:

Spearmani korrelatsiooni näide

Töökogemuse ja vigastuste esinemissageduse vahelise seose olemasolu on vaja kindlaks teha, kui on olemas järgmised andmed:

Enamik sobiv meetod analüüs on järjestusmeetod, kuna üks tunnustest on esitatud avatud võimaluste kujul: töökogemus kuni 1 aasta ja töökogemus 7 aastat või rohkem.

Probleemi lahendamine algab andmete järjestamisest, mis koondatakse töötabelisse ja mida saab teha käsitsi, sest nende maht ei ole suur:

Töökogemus Vigastuste arv Seerianumbrid (järgud) Auastme erinevus Auastmete erinevus ruudus
d(x-y)
kuni 1 aasta 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 või rohkem 6 5 1 +4 16
Σ d2 = 38,5

Murdjärkude ilmumine veerus on tingitud sellest, et võrdse suurusjärgu variantide ilmnemisel leitakse järgu aritmeetiline keskmine väärtus. Selles näites esineb vigastusnäitaja 12 kaks korda ja sellele omistatakse järgud 2 ja 3, leidke nende astmete aritmeetiline keskmine (2+3)/2= 2,5 ja kandke see väärtus 2 näitaja töölehel.
Asendades saadud väärtused töövalemisse ja tehes lihtsaid arvutusi, saame Spearmani koefitsiendi -0,92

Negatiivne koefitsiendi väärtus näitab olemasolu tagasisidet tunnuste vahel ja võimaldab väita, et lühikese töökogemusega kaasneb suur hulk vigastused Pealegi on nende näitajate vahelise seose tugevus üsna suur.
Arvutuste järgmine etapp on saadud koefitsiendi usaldusväärsuse määramine:
arvutatakse selle viga ja Studenti test

Regressioon- ja korrelatsioonianalüüs – statistilised meetodid uurimine. Need on kõige levinumad viisid parameetri sõltuvuse näitamiseks ühest või mitmest sõltumatust muutujast.

Allpool konkreetselt praktilisi näiteid Vaatame neid kahte majandusteadlaste seas väga populaarset analüüsi. Toome ka näite tulemuste saamisest nende kombineerimisel.

Regressioonianalüüs Excelis

Näitab mõne väärtuse (sõltumatu, sõltumatu) mõju sõltuvale muutujale. Näiteks kuidas sõltub majanduslikult aktiivse elanikkonna arv ettevõtete arvust, palkadest ja muudest parameetritest. Või: kuidas mõjutavad SKT taset välisinvesteeringud, energiahinnad jne.

Analüüsi tulemus võimaldab esile tuua prioriteedid. Ja põhiteguritest lähtuvalt ennustada, planeerida prioriteetsete valdkondade arengut ja teha juhtimisotsuseid.

Regressioon toimub:

  • lineaarne (y = a + bx);
  • paraboolne (y = a + bx + cx 2);
  • eksponentsiaalne (y = a * exp(bx));
  • võimsus (y = a*x^b);
  • hüperboolne (y = b/x + a);
  • logaritmiline (y = b * 1n(x) + a);
  • eksponentsiaalne (y = a * b^x).

Vaatame näidet Excelis regressioonimudeli loomisest ja tulemuste tõlgendamisest. Võtame lineaarne tüüp regressioon.

Ülesanne. 6 ettevõttes keskmiselt kuus palgad ja lahkunud töötajate arv. Vajalik on välja selgitada töölt lahkuvate töötajate arvu sõltuvus keskmisest palgast.

Mudel lineaarne regressioon sellel on järgmine vorm:

Y = a 0 + a 1 x 1 +…+a k x k.

Kui a on regressioonikoefitsiendid, x on mõjutavad muutujad, k on tegurite arv.

Meie näites on Y töötajate töölt lahkumise näitaja. Mõjuteguriks on palk (x).

Excelil on sisseehitatud funktsioonid, mis aitavad teil lineaarse regressioonimudeli parameetreid arvutada. Kuid lisandmoodul "Analüüsipakett" teeb seda kiiremini.

Aktiveerime võimsa analüütilise tööriista:

Pärast aktiveerimist on lisandmoodul saadaval vahekaardil Andmed.

Nüüd teeme regressioonanalüüsi ise.



Kõigepealt pöörame tähelepanu R-ruudule ja koefitsientidele.

R-ruut on määramistegur. Meie näites – 0,755 ehk 75,5%. See tähendab, et disaini parameetrid mudelid selgitavad 75,5% uuritud parameetrite vahelisest sõltuvusest. Mida suurem on determinatsioonikoefitsient, seda parem on mudel. Hea – üle 0,8. Halb – alla 0,5 (vaevalt saab sellist analüüsi mõistlikuks pidada). Meie näites – “pole paha”.

Koefitsient 64,1428 näitab, milline on Y, kui kõik muutujad vaadeldavas mudelis on võrdsed 0-ga. See tähendab, et analüüsitava parameetri väärtust mõjutavad ka muud mudelis kirjeldamata tegurid.

Koefitsient -0,16285 näitab muutuja X osakaalu Y-s. See tähendab, et selle mudeli keskmine kuupalk mõjutab loobujate arvu kaaluga -0,16285 (see on väike mõju). Märk "-" näitab negatiivset mõju: mida suurem palk, seda vähem inimesi lahkub. Mis on õiglane.



Korrelatsioonianalüüs Excelis

Korrelatsioonianalüüs aitab kindlaks teha, kas ühe või kahe valimi näitajate vahel on seos. Näiteks masina tööaja ja remondi maksumuse, seadmete hinna ja töötamise kestuse, laste pikkuse ja kaalu vahel jne.

Kui seos on olemas, siis kas ühe parameetri suurenemine toob kaasa teise parameetri suurenemise (positiivne korrelatsioon) või languse (negatiivne). Korrelatsioonianalüüs aitab analüütikul kindlaks teha, kas ühe näitaja väärtust saab kasutada teise võimaliku väärtuse ennustamiseks.

Korrelatsioonikordaja tähistatakse r-ga. Varieerub vahemikus +1 kuni -1. Korrelatsioonide klassifikatsioon jaoks erinevad valdkonnad saab olema erinev. Kui koefitsient on 0, pole valimite vahel lineaarset seost.

Vaatame, kuidas Exceli abil korrelatsioonikordaja leida.

Paariskoefitsientide leidmiseks kasutatakse funktsiooni CORREL.

Eesmärk: teha kindlaks, kas tööaja vahel on seos treipink ja selle hoolduskulud.

Asetage kursor mis tahes lahtrisse ja vajutage nuppu fx.

  1. Kategoorias „Statistika” valige funktsioon CORREL.
  2. Argument "Massiiv 1" - esimene väärtuste vahemik - masina tööaeg: A2:A14.
  3. Argument "Massiiv 2" - teine ​​väärtuste vahemik - remondi maksumus: B2:B14. Klõpsake nuppu OK.

Ühenduse tüübi määramiseks peate vaatama koefitsiendi absoluutarvu (igal tegevusalal on oma skaala).

Mitme parameetri (rohkem kui 2) korrelatsioonianalüüsiks on mugavam kasutada “Andmeanalüüsi” (lisandmoodul “Analysis Package”). Peate loendist valima korrelatsiooni ja määrama massiivi. Kõik.

Saadud koefitsiendid kuvatakse korrelatsioonimaatriksis. nagu see:

Korrelatsioon- ja regressioonanalüüs

Praktikas kasutatakse neid kahte tehnikat sageli koos.

Näide:


Nüüd on nähtavaks saanud regressioonanalüüsi andmed.

KURSUSETÖÖ

Teema: Korrelatsioonianalüüs

Sissejuhatus

1. Korrelatsioonianalüüs

1.1 Korrelatsiooni mõiste

1.2 Korrelatsioonide üldine klassifikatsioon

1.3 Korrelatsiooniväljad ja nende ehitamise eesmärk

1.4 Korrelatsioonianalüüsi etapid

1.5 Korrelatsioonikordajad

1.6 Normaliseeritud Bravais-Pearsoni korrelatsioonikordaja

1.7 Spearmani järgu korrelatsioonikordaja

1.8 Korrelatsioonikordajate põhiomadused

1.9 Korrelatsioonikordajate olulisuse kontrollimine

1.10 Paari korrelatsioonikordaja kriitilised väärtused

2. Mitmefaktorilise eksperimendi planeerimine

2.1 Probleemi seisund

2.2 Planeeringu keskpunkti (põhitase) ja faktorite variatsiooni taseme määramine

2.3 Planeeringu maatriksi koostamine

2.4 Dispersiooni homogeensuse ja mõõtmise samaväärsuse kontrollimine erinevates seeriates

2.5 Regressioonivõrrandi koefitsiendid

2.6 Reprodutseeritavuse dispersioon

2.7 Regressioonivõrrandi kordajate olulisuse kontrollimine

2.8 Regressioonivõrrandi adekvaatsuse kontrollimine

Järeldus

Viited

SISSEJUHATUS

Eksperimentaalne planeerimine on matemaatiline ja statistiline distsipliin, mis uurib ratsionaalse organiseerimise meetodeid eksperimentaalsed uuringud- alates optimaalne valik uuritavad tegurid ja tegeliku katseplaani kindlaksmääramine vastavalt selle eesmärgile kuni tulemuste analüüsimeetoditeni. Eksperimentide planeerimine sai alguse inglise statistiku R. Fisheri (1935) töödest, kes rõhutasid, et ratsionaalne eksperimentaalne planeerimine ei anna hinnangute täpsuses vähem olulist kasu kui mõõtmistulemuste optimaalne töötlemine. 20. sajandi 60. aastatel oli kaasaegne teooria eksperimendi planeerimine. Tema meetodid on tihedalt seotud funktsioonide lähendamise teooria ja matemaatilise programmeerimisega. Ehitatud optimaalsed plaanid ja nende omadusi uuriti laia mudeliklassi jaoks.

Eksperimendi planeerimine – kindlaksmääratud nõuetele vastava katseplaani valimine, katsestrateegia väljatöötamisele suunatud tegevuste kogum (alates a priori teabe hankimisest kuni toimiva matemaatilise mudeli saamiseni või optimaalsed tingimused). See on eksperimendi sihipärane juhtimine, mis viiakse ellu uuritava nähtuse mehhanismi mittetäielike teadmiste tingimustes.

Mõõtmiste, hilisema andmetöötluse, aga ka tulemuste matemaatilise mudeli vormistamisel tekivad vead ja osa algandmetes sisalduvast infost läheb kaduma. Eksperimentaalsete planeerimismeetodite kasutamine võimaldab määrata matemaatilise mudeli vea ja hinnata selle adekvaatsust. Kui mudeli täpsus osutub ebapiisavaks, siis eksperimentaalsete planeerimismeetodite kasutamine võimaldab matemaatilist mudelit kaasajastada täiendavate katsetega ilma eelnevat infot kaotamata ja minimaalsete kuludega.

Katse planeerimise eesmärk on leida katsete läbiviimiseks sellised tingimused ja reeglid, mille alusel on võimalik saada usaldusväärset ja usaldusväärset teavet objekti kohta. kõige madalamate kuludega tööjõudu ning esitada see teave kompaktsel ja mugaval kujul koos täpsuse kvantitatiivse hinnanguga.

aastal kasutatud peamiste planeerimismeetodite hulgas erinevad etapid uuringutes kasutatakse:

skriiningeksperimendi kavandamine, mille peamine tähendus on oluliste tegurite rühma valimine kogu tegurite hulgast, mida täiendavalt üksikasjalikult uuritakse;

Eksperimentaalne disain ANOVA jaoks, st. kvalitatiivsete teguritega objektide plaanide koostamine;

Regressioonieksperimendi kavandamine, mis võimaldab saada regressioonimudeleid (polünoom ja muud);

Ekstreemeksperimendi kavandamine, mille peamiseks ülesandeks on uurimisobjekti eksperimentaalne optimeerimine;

Planeerimine dünaamiliste protsesside uurimisel jne.

Distsipliini õppimise eesmärk on planeerimisteooria meetodeid ja kaasaegseid infotehnoloogiaid kasutades valmistada üliõpilasi ette oma eriala tootmis- ja tehniliseks tegevuseks.

Distsipliini eesmärgid: õpe kaasaegsed meetodid teaduslike ja tööstuslike katsete planeerimine, korraldamine ja optimeerimine, katsete läbiviimine ja saadud tulemuste töötlemine.

1. KORRELAATSIOONI ANALÜÜS

1.1 Korrelatsiooni mõiste

Teadlast huvitab sageli, kuidas kaks või rohkem muutujad ühes või mitmes uuringuvalimis. Näiteks kas pikkus võib mõjutada inimese kaalu või vererõhk võib mõjutada toote kvaliteeti?

Sellist muutujate vahelist sõltuvust nimetatakse korrelatsiooniks või korrelatsiooniks. Korrelatsioon on kahe tunnuse järjekindel muutus, mis peegeldab asjaolu, et ühe tunnuse varieeruvus on kooskõlas teise tunnuse muutlikkusega.

Näiteks on teada, et inimeste pikkuse ja kaalu vahel on keskmiselt positiivne seos ja selline, et mida suurem pikkus, seda suurem on inimese kaal. Sellest reeglist on siiski erandeid, kui suhteliselt lühikesed inimesed on ülekaalulised ja vastupidi, kõrge kasvuga asteenilised inimesed on väikese kaaluga. Selliste erandite põhjuseks on see, et iga bioloogilise, füsioloogilise või psühholoogilise tunnuse määrab paljude tegurite mõju: keskkonna, geneetilise, sotsiaalse, keskkonna jne.

Korrelatsiooniseosed on tõenäosuslikud muutused, mida saab matemaatilise statistika meetodeid kasutades uurida ainult esinduslike valimite põhjal. Mõlemat terminit – korrelatsioonisuhe ja korrelatsioonisõltuvus – kasutatakse sageli vaheldumisi. Sõltuvus eeldab mõju, seost - mis tahes kooskõlastatud muutusi, mida saab seletada sadade põhjustega. Korrelatsioone ei saa pidada põhjus-tagajärg seose tõendiks, need näitavad ainult seda, et ühe tunnuse muutustega kaasnevad tavaliselt teatud muutused teises.

Korrelatsioonisõltuvus - need on muutused, mis toovad esinemise tõenäosusesse ühe tunnuse väärtused erinevad tähendused teine ​​märk.

Korrelatsioonianalüüsi ülesanne taandub muutuvate tunnuste vahelise seose suuna (positiivne või negatiivne) ja vormi (lineaarne, mittelineaarne) kindlaksmääramisele, selle tiheduse mõõtmisele ja lõpuks saadud korrelatsioonikordajate olulisuse taseme kontrollimisele.

Korrelatsiooniühendused erinevad vormi, suuna ja astme (tugevuse) poolest .

Korrelatsiooniseose vorm võib olla lineaarne või kõverjooneline. Näiteks võib seos simulaatori treeningute arvu ja kontrollseansi õigesti lahendatud probleemide arvu vahel olla sirgjooneline. Näiteks motivatsioonitaseme ja ülesande efektiivsuse vaheline seos võib olla kõverjooneline (joonis 1). Kui motivatsioon tõuseb, suureneb esmalt ülesande täitmise efektiivsus, seejärel see saavutatakse. optimaalne tase motivatsioon, mis vastab maksimaalne efektiivsusülesande täitmine; Motivatsiooni edasise tõusuga kaasneb efektiivsuse langus.

Joonis 1 – Seos probleemide lahendamise efektiivsuse ja motivatsioonikalduvuse tugevuse vahel

Suunamisel võib korrelatsioonisuhe olla positiivne ("otsene") ja negatiivne ("pöördvõrdeline"). Positiivse lineaarse korrelatsiooni korral vastavad ühe tunnuse kõrgemad väärtused teise suurematele väärtustele ja ühe tunnuse madalamad väärtused vastavad teise madalatele väärtustele (joonis 2). Negatiivse korrelatsiooni korral on seosed pöördvõrdelised (joonis 3). Positiivse korrelatsiooni korral on korrelatsioonikordajal positiivne märk, negatiivse korrelatsiooniga - negatiivne märk.

Joonis 2 – Otsene korrelatsioon

Joonis 3 – pöördkorrelatsioon


Joonis 4 – korrelatsioon puudub

Korrelatsiooni aste, tugevus või lähedus määratakse korrelatsioonikordaja väärtusega. Ühenduse tugevus ei sõltu selle suunast ja selle määrab korrelatsioonikordaja absoluutväärtus.

1.2 Korrelatsioonide üldine klassifikatsioon

Sõltuvalt korrelatsioonikoefitsiendist eristatakse järgmisi korrelatsioone:

Tugev või lähedane korrelatsioonikoefitsiendiga r>0,70;

Keskmine (0,50

Mõõdukas (kell 0.30

Nõrk (0.20

Väga nõrk (r<0,19).

1.3 Korrelatsiooniväljad ja nende ehitamise eesmärk

Korrelatsiooni uuritakse katseandmete põhjal, milleks on kahe tunnuse mõõdetud väärtused (x i, y i). Kui eksperimentaalseid andmeid on vähe, esitatakse kahemõõtmeline empiiriline jaotus väärtuste x i ja y i topeltreana. Samas saab tunnuste vahelist korrelatsioonisõltuvust kirjeldada erinevalt. Argumendi ja funktsiooni vastavust saab anda tabeli, valemi, graafiku vms abil.

Korrelatsioonianalüüs, nagu ka teised statistilised meetodid, põhineb tõenäosusmudelite kasutamisel, mis kirjeldavad uuritavate tunnuste käitumist teatud üldpopulatsioonis, millest saadakse eksperimentaalsed väärtused xi ja y i. Kvantitatiivsete tunnuste korrelatsiooni uurimisel, mille väärtusi saab täpselt mõõta meeterskaala ühikutes (meetrid, sekundid, kilogrammid jne), võetakse väga sageli kasutusele kahemõõtmeline normaalselt jaotatud populatsioonimudel. Selline mudel kuvab muutujate x i ja y i vahelisi seoseid graafiliselt punktide geomeetrilise asukoha kujul ristkülikukujuliste koordinaatide süsteemis. Seda graafilist seost nimetatakse ka hajuvusgraafikuks või korrelatsiooniväljaks.
See kahemõõtmelise normaaljaotuse mudel (korrelatsiooniväli) võimaldab anda korrelatsioonikordaja selge graafilise tõlgenduse, kuna jaotus kokku sõltub viiest parameetrist: μ x, μ y – keskmised väärtused (matemaatilised ootused); σ x ,σ y – juhuslike suuruste X ja Y standardhälbed ning p – korrelatsioonikordaja, mis on juhuslike suuruste X ja Y vahelise seose mõõt.
Kui p = 0, siis kahemõõtmelisest normaalpopulatsioonist saadud väärtused x i , y i paiknevad graafikul koordinaatides x, y ringiga piiratud alal (joonis 5, a). Sel juhul pole juhuslike suuruste X ja Y vahel korrelatsiooni ning neid nimetatakse korreleerimata. Kahemõõtmelise normaaljaotuse korral tähendab mittekorrelatsioon samaaegselt juhuslike suuruste X ja Y sõltumatust.

Nähtustevaheliste objektiivselt eksisteerivate seoste uurimine on statistika tähtsaim ülesanne. Sõltuvuste statistilise uurimise käigus selguvad nähtuste vahelised põhjus-tagajärg seosed.

Põhjus-tagajärg seosed on selline seos nähtuste ja protsesside vahel, kui muutus ühes neist – põhjusest – toob kaasa muutuse teises – tagajärjes. Nähtuste ja protsesside märgid jagunevad vastavalt nende tähtsusele suhte uurimisel kahte klassi. Nimetatakse märke, mis põhjustavad muutusi teistes seotud märkides faktoriaalne või lihtsalt tegurid. Nimetatakse tunnuseid, mis muutuvad faktorikarakteristikute mõjul .

tõhus

  • Statistikas eristatakse nähtuste ja protsesside vahelisi funktsionaalseid ja stohhastilisi (tõenäosuslikke) seoseid: Funktsionaalne
  • nad nimetavad sellist seost, milles faktortunnuse teatud väärtus vastab resultatiivse ühele väärtusele. Kui põhjuslik sõltuvus ei ilmne mitte igal üksikjuhul, vaid üldiselt suurel hulgal vaatlustel keskmiselt, siis sellist sõltuvust nn. stohhastiline (tõenäosuslik)

. Stohhastilise suhtluse erijuhtum on korrelatsioonkommunikatsioon. Pealegi, liigitatakse nähtuste ja nende tunnuste vahelisi seoseid

tiheduse, suuna ja analüütilise väljenduse järgi. Suuna järgi

  • eristada otse- ja pöördühendusi: Otsene suhtlus
  • - see on suhe, milles teguri karakteristiku väärtuste suurenemisega (vähenemisega) kaasneb tulemuse väärtuste suurenemine (vähenemine). Näiteks aitab tööviljakuse tõus tõsta tootmise tasuvuse taset. Tagasiside korral

tekkiva karakteristiku väärtused muutuvad faktorkarakteristiku mõjul, kuid vastupidises suunas võrreldes tegurikarakteristiku muutumisega. Seega väheneb kapitali tootlikkuse taseme tõusuga toodanguühiku maksumus. Analüütilise väljenduse järgi

  • eristada lineaarseid (või lihtsalt lineaarseid) ja mittelineaarseid ühendusi: lineaarne ühendus vorm: y=a+bx.
  • Kui seost saab väljendada mis tahes kõverjoone võrrandiga (parabool, hüperbool jne), siis sellist seost nimetatakse nn. mittelineaarne (kõverjooneline) ühendus .

Ühenduse lähedus näitab tegurikarakteristiku mõju mõõtu tulemuseks oleva tunnuse üldisele varieerumisele. Side klassifikatsioon tihedusastme järgi esitatud tabelis 1.

Seose olemasolu, selle olemuse ja suuna tuvastamiseks statistikas kasutatakse järgmisi meetodeid: paralleelandmete toomine, analüütilised rühmitused, graafiline, korrelatsioonid. Statistiliste seoste uurimise peamine meetod on statistiline korrelatsiooni- ja regressioonanalüüsil põhinev kommunikatsiooni modelleerimine .

Korrelatsioon on statistiline seos juhuslike muutujate vahel, millel ei ole rangelt funktsionaalset olemust, mille puhul ühe juhusliku muutuja muutus toob kaasa teise matemaatilise ootuse muutumise. Statistikas on tavaks eristada järgmisi korrelatsioonitüüpe :

  • paariskorrelatsioon - seos kahe tunnuse vahel (tulemuslik ja faktor või kaks faktorit);
  • osaline korrelatsioon - sõltuvus resultant- ja ühe teguri karakteristikute vahel muude faktoritunnuste fikseeritud väärtusega;
  • mitmekordne korrelatsioon – uuringusse kaasatud resultant- ja kahe või enama faktorikarakteristiku sõltuvus.

Korrelatsioonianalüüsi ülesanne on kahe tunnuse (paarisuhtes) ning resultant- ja paljude faktoritunnuste vahelise seose vahelise seose kvantitatiivne määramine (mitmefaktorilises seoses).

Seose lähedust väljendab kvantitatiivselt korrelatsioonikordajate suurus, mis, andes kvantitatiivse karakteristiku tunnustevahelise seose tihedusele, võimaldab määrata faktortunnuste “kasulikkust” mitmekordse regressiooni konstrueerimisel. võrrand.

Korrelatsioon on omavahel seotud regressiooniga, kuna esimene hindab statistilise seose tugevust (lähedust), teine ​​selle vormi.

Regressioonanalüüs seisneb seose analüütilise väljenduse määramises regressioonivõrrandi kujul.

Regressioon on resultantkarakteristiku juhusliku suuruse keskmise väärtuse sõltuvus faktortunnuse väärtusest ja regressioonivõrrand – võrrand, mis kirjeldab korrelatsiooni resultantkarakteristiku ja ühe või mitme faktoriaalse tunnuse vahel.

Korrelatsiooni-regressioonanalüüsi valemid lineaarseks seoseks paariskorrelatsiooniga on esitatud tabelis 2.

Tabel 2 – Paarikorrelatsiooniga lineaarsete seoste korrelatsiooni-regressioonanalüüsi valemid
NäitajaNimetus ja valem
Paaride korrelatsiooni joonvõrrand y x = a +bx, kus b on regressioonikordaja
Normaalvõrrandite süsteem vähimruutude meetod koefitsientide määramiseks a Ja b
Lineaarne korrelatsioonikoefitsient ühenduse tiheduse määramiseks,
tema tõlgendus:
r = 0 – ühendus puudub;
0 -1 r = 1 – funktsionaalne ühendus
Absoluutne elastsus
Suhteline elastsus

Näiteid probleemide lahendamisest teemal “Korrelatsioonianalüüsi alused”

Ülesanne 1 (lineaarse seose analüüs paaridevahelise korrelatsiooniga) . Andmed on olemas viie tsehhi töötaja kvalifikatsiooni ja kuutoodangu kohta:

Töötajate kvalifikatsiooni ja nende toodangu vahelise seose uurimiseks määrake lineaarsuhte võrrand ja korrelatsioonikordaja. Regressiooni- ja korrelatsioonikordaja tõlgendamine.

Lahendus . Laiendame pakutud tabelit.

Määrame sirgjoone võrrandi parameetrid y x = a +bx. Selleks lahendame võrrandisüsteemi:

See tähendab, et regressioonikordaja on 18.

Kuna b on positiivne arv, on parameetrite x ja y vahel otsene seos.
a = 92-4 × 18
a = 20
Lineaarse sidestusvõrrandi vorm on y x = 20 + 18x.

Uuritud tunnuste vahelise seose tiheduse (tugevuse) määramiseks määrame korrelatsioonikordaja väärtuse valemi abil:

= (2020–20×460/5)/(√10×√3280) ≈ 180/181,11=0,99. Kuna korrelatsioonikordaja on suurem kui 0,7, on seos selles reas tugev.

Probleem 2 . Ettevõttes on toodete hindu alandatud 80 rublalt. ühiku kohta kuni 60 hõõruda.

Lahendus Pärast hinnaalandust kasvas müük 400 ühikult 500 ühikule päevas. Määratlege absoluutne ja suhteline elastsus.

Andke hinnang elastsusele, pidades silmas edasiste hindade alandamise võimalust (või võimatust).

. Arvutame välja näitajad, mis võimaldavad meil elastsuse eelanalüüsi teha:

Nagu näeme, on hinnalanguse kiirus absoluutväärtuses võrdne nõudluse kasvu kiirusega.

Leiame absoluutse ja suhtelise elastsuse valemite abil:

= (500-400)/(60-80) =100/(-20) -5 – absoluutne elastsus

Statistiliste meetodite kasutamine psühholoogiliste uurimismaterjalide töötlemisel annab suurepärase võimaluse ammutada eksperimentaalsetest andmetest kasulikku teavet. Üks levinumaid statistilisi meetodeid on korrelatsioonianalüüs.

Mõistet “korrelatsioon” kasutas esmakordselt prantsuse paleontoloog J. Cuvier, kes tuletas “loomaosade ja elundite korrelatsiooniseaduse” (see seadus võimaldab rekonstrueerida leitud kehaosade põhjal kogu looma välimust). . Selle termini tõi statistikasse inglise bioloog ja statistik F. Galton (mitte lihtsalt "ühendus" - suhe ja "justkui ühendus" - korrelatsioon).

Korrelatsioonianalüüs on muutujatevaheliste seoste hüpoteeside testimine, kasutades korrelatsioonikordajaid, kahe muutujaga kirjeldavat statistikat, kahe muutuja seose (ühise varieeruvuse) kvantitatiivset mõõdikut. Seega on see meetodite kogum juhuslike muutujate või tunnuste vaheliste korrelatsioonide tuvastamiseks.

Kahe juhusliku muutuja korrelatsioonianalüüs hõlmab järgmist:

  • korrelatsioonivälja konstrueerimine ja vastavustabeli koostamine;
  • valimi korrelatsioonikordajate ja korrelatsiooniseoste arvutamine;
  • seose olulisuse statistilise hüpoteesi testimine.

Korrelatsioonianalüüsi põhieesmärk on tuvastada seos kahe või enama uuritava muutuja vahel, mida peetakse kahe uuritava tunnuse ühiseks koordineeritud muutuseks. Sellel varieeruvusel on kolm peamist tunnust: kuju, suund ja tugevus.

Korrelatsiooni vorm võib olla lineaarne või mittelineaarne. Lineaarne vorm on korrelatsiooniseose tuvastamiseks ja tõlgendamiseks mugavam. Lineaarse korrelatsiooni puhul saab eristada kahte peamist suunda: positiivne ("otsene seos") ja negatiivne ("tagasiside").

Seose tugevus näitab otseselt, kui väljendunud on uuritud muutujate ühine varieeruvus. Psühholoogias saab nähtuste funktsionaalset seost empiiriliselt tuvastada vaid vastavate tunnuste tõenäosusliku seosena. Selge ettekujutuse tõenäosusliku seose olemusest annab hajuvusdiagramm - graafik, mille teljed vastavad kahe muutuja väärtustele ja iga subjekt tähistab punkti.

Tõenäosuselise seose arvulise tunnusena kasutatakse korrelatsioonikordajaid, mille väärtused varieeruvad vahemikus –1 kuni +1. Pärast arvutuste tegemist valib uurija reeglina välja ainult tugevaimad korrelatsioonid, mida edasi tõlgendatakse (tabel 1).

"Piisavalt tugevate" korrelatsioonide valimise kriteeriumiks võib olenevalt olla kas korrelatsioonikordaja enda absoluutväärtus (0,7 kuni 1) või selle koefitsiendi suhteline väärtus, mis on määratud statistilise olulisuse tasemega (0,01 kuni 0,1). valimi suuruse kohta. Väikestes valimites on õigem valida tugevad korrelatsioonid edasiseks tõlgendamiseks statistilise olulisuse taseme alusel. Suurte proovidega tehtud uuringute jaoks on parem kasutada korrelatsioonikordajate absoluutväärtusi.

Seega taandub korrelatsioonianalüüsi ülesanne muutuvate karakteristikute vahelise seose suuna (positiivne või negatiivne) ja vormi (lineaarne, mittelineaarne) kindlaksmääramisele, selle tiheduse mõõtmisele ja lõpuks saadud korrelatsioonikordajate olulisuse taseme kontrollimisele. .

Praeguseks on välja töötatud palju erinevaid korrelatsioonikordajaid. Enim kasutatud on r- Pearson, r-Spearman ja τ -Kendall. Kaasaegsed arvutistatistikaprogrammid pakuvad menüüs “Korrelatsioonid” just neid kolme koefitsienti ning muude uurimisprobleemide lahendamiseks pakutakse meetodeid rühmade võrdlemiseks.

Korrelatsioonikordaja arvutamise meetodi valik sõltub skaala tüübist, kuhu muutujad kuuluvad (tabel 2).

Intervall- ja nominaalskaala muutujate puhul kasutatakse Pearsoni korrelatsioonikordajat (produkti momendi korrelatsioon). Kui vähemalt üks kahest muutujast on järguskaalal või ei ole normaalselt jaotunud, kasutatakse Spearmani auaste korrelatsiooni või

t-Kendall. Kui üks kahest muutujast on dihhotoomne, saab kasutada punktide biseerilist korrelatsiooni (statistika arvutiprogrammis SPSS see funktsioon pole saadaval, selle asemel saab kasutada astmekorrelatsiooni arvutusi). Kui mõlemad muutujad on dihhotoomilised, kasutatakse neljavälja korrelatsiooni (seda tüüpi korrelatsiooni arvutab SPSS kaugusmõõtude ja sarnasusmõõtude definitsiooni alusel). Kahe mittedihhotoomse muutuja vahelise korrelatsioonikordaja arvutamine on võimalik ainult siis, kui nendevaheline seos on lineaarne (ühesuunaline). Kui ühendus on näiteks U-kujuline (mitmetähenduslik), korrelatsioonikordaja ei sobi kasutamiseks ühenduse tugevuse mõõtjana: selle väärtus kipub nulli.

Seega on korrelatsioonikoefitsientide rakendamise tingimused järgmised:

  • muutujad, mida mõõdetakse kvantitatiivsel (järgu, meetermõõdustiku) skaalal samal objektide valimil;
  • muutujate vaheline seos on monotoonne.

Peamine statistiline hüpotees, mida kontrollitakse korrelatsioonianalüüsiga, on mittesuunaline ja sisaldab väidet, et korrelatsioon on populatsioonis võrdne nulliga H 0: r xy= 0. Kui see lükatakse tagasi, aktsepteeritakse alternatiivset hüpoteesi H 1: r xy≠ 0 näitab positiivse või negatiivse korrelatsiooni olemasolu, olenevalt arvutatud korrelatsioonikordaja märgist.

Hüpoteeside aktsepteerimise või tagasilükkamise põhjal tehakse sisukad järeldused. Kui statistilise testimise tulemuste järgi H 0: r xy= 0 ei hälbi tasemel a, siis on sisukas järeldus järgmine: seos vahel X Ja Y ei leitud. Kui kell H 0 r xy= 0 hälbib tasemel a, mis tähendab, et vahel on tuvastatud positiivne (negatiivne) seos X Ja Y. Siiski tuleks tuvastatud korrelatsioonide tõlgendamisse suhtuda ettevaatlikult. Teaduslikust vaatenurgast ei tähenda lihtsalt kahe muutuja vahelise seose loomine põhjuse-tagajärje seose olemasolu. Pealegi ei loo korrelatsiooni olemasolu põhjuse ja tagajärje vahelist seost. See lihtsalt näitab, et kaks muutujat on omavahel seotud suuremal määral, kui juhuslikult eeldada võiks. Kui aga olla ettevaatlik, on korrelatsioonimeetodite kasutamine põhjus-tagajärg seoste uurimisel õigustatud. Peaksite vältima kategoorilisi fraase nagu "muutuja X on indikaatori tõusu põhjus Y" Sellised väited tuleks sõnastada eeldustena, mis peavad olema teoreetiliselt rangelt põhjendatud.

Iga korrelatsioonikordaja matemaatilise protseduuri üksikasjalik kirjeldus on toodud matemaatilise statistika õpikutes; ; ; jne. Piirdume nende koefitsientide kasutamise võimaluse kirjeldamisega sõltuvalt mõõteskaala tüübist.

Meetriliste muutujate korrelatsioon

Kahe samas valimis mõõdetud meetermõõdustiku muutuja vahelise seose uurimiseks kasutatakse seda korrelatsioonikordaja r- Pearson. Koefitsient ise iseloomustab ainult lineaarset seost tunnuste vahel, mida tavaliselt tähistatakse sümbolitega X Ja Y. Lineaarne korrelatsioonikordaja on parameetriline meetod ja selle õige kasutamine on võimalik ainult siis, kui mõõtmistulemused on esitatud intervallskaalal ning väärtuste jaotus analüüsitavates muutujates erineb normaalsest vaid vähesel määral. On palju olukordi, kus selle kasutamine on asjakohane. Näiteks: seose loomine õpilase intelligentsuse ja tema õppeedukuse vahel; meeleolu ja probleemsest olukorrast väljumise edukuse vahel; sissetulekutaseme ja temperamendi vahel jne.

Pearsoni koefitsienti kasutatakse laialdaselt psühholoogias ja pedagoogikas. Näiteks I. Ya Kaplunovitši ja P. D. Rabinovitši, M. P. Nuzhdina töödes kasutati hüpoteeside kinnitamiseks Pearsoni lineaarse korrelatsioonikordaja arvutamist.

Andmete käsitsi töötlemisel on vaja arvutada korrelatsioonikordaja ja seejärel määrata lk-olulisuse tase (andmete kontrollimise lihtsustamiseks kasutage kriitiliste väärtuste tabeleid r xy, mis on koostatud selle kriteeriumi alusel). Pearsoni lineaarse korrelatsioonikordaja väärtus ei tohi ületada +1 ja olla väiksem kui –1. Need kaks arvu +1 ja –1 on korrelatsioonikordaja piirid. Kui arvutuse tulemuseks on väärtus, mis on suurem kui +1 või väiksem kui –1, näitab see, et arvutustes on ilmnenud viga.

Arvutiga arvutamisel saadab statistikaprogramm (SPSS, Statistica) arvutatud korrelatsioonikordaja täpsema väärtusega lk-tase.

Statistilise otsuse jaoks, kas nõustuda või tagasi lükata H 0 tavaliselt paigaldatud α = 0,05 ja suure hulga vaatluste puhul (100 või enam) α = 0,01. Kui p ≤ α, H 0 lükatakse tagasi ja tehakse sisukas järeldus, et uuritavate muutujate vahel on leitud statistiliselt usaldusväärne (oluline) seos (positiivne või negatiivne, olenevalt korrelatsiooni märgist). Millal p > α, H 0 ei lükata tagasi, piirdub sisukas järeldus väitega, et (statistiliselt olulist) seost ei leitud.

Kui ühendust ei leita, kuid on alust arvata, et ühendus on tegelikult olemas, tuleks kontrollida ühenduse ebausaldusväärsuse võimalikke põhjuseid.

Kommunikatsiooni mittelineaarsus– Selleks analüüsige kahemõõtmelist hajuvusgraafikut. Kui suhe on mittelineaarne, kuid monotoonne, liikuge edasi järjestuskorrelatsioonide juurde. Kui seos ei ole monotoonne, jagage valim osadeks, milles seos on monotoonne, ja arvutage korrelatsioonid iga valimi osa jaoks eraldi või jagage valim kontrastseteks rühmadeks ja seejärel võrrelge neid vastavalt valimi väljendustasemele. omadus.

Kõrvalväärtuste olemasolu ja väljendunud asümmeetria ühe või mõlema tunnuse jaotuses. Selleks tuleb vaadata mõlema tunnuse sagedusjaotuse histogramme. Kui esineb kõrvalekaldeid või asümmeetriat, välistage kõrvalekalded või jätkake järjestuskorrelatsioonide määramisega.

Valimi heterogeensus(analüüsida 2D hajuvusgraafikut). Proovi jaotada valim osadeks, milles suhe võib olla erineva suunaga.

Kui seos on statistiliselt oluline, siis enne sisuka järelduse tegemist tuleb välistada valekorrelatsiooni võimalus:

  • ühendus on tingitud heitgaasidest. Kui on kõrvalekaldeid, minge järjestuskorrelatsioonide juurde või välistage kõrvalekalded;
  • seos on tingitud kolmanda muutuja mõjust. Sellise nähtuse olemasolul on vaja arvutada korrelatsioon mitte ainult kogu valimi, vaid ka iga rühma kohta eraldi. Kui "kolmas" muutuja on meetriline, arvutage osaline korrelatsioon.

Osaline korrelatsioonikordaja r xy -z arvutatakse, kui on vaja kontrollida eeldust, et seos kahe muutuja vahel X Ja Y ei sõltu kolmanda muutuja mõjust Z. Väga sageli on kaks muutujat omavahel korrelatsioonis ainult seetõttu, et nad mõlemad muutuvad kooskõlastatult kolmanda muutuja mõjul. Ehk siis tegelikult pole vastavate omaduste vahel seost, vaid see ilmneb statistilises seoses ühise põhjuse mõjul. Näiteks võib vanus olla kahe muutuja varieeruvuse sagedaseks põhjuseks, kui uurida erinevate psühholoogiliste tunnuste seost erinevas vanuses rühmas. Osalise korrelatsiooni tõlgendamisel põhjusliku seose vaatenurgast tuleks olla ettevaatlik, sest kui Z korreleerub ka X ja koos Y ja osaline korrelatsioon r xy -z on nullilähedane, ei pruugi sellest järeldada, mis täpselt Z on levinud põhjus X Ja Y.

Auastmemuutujate korrelatsioon

Kui korrelatsioonikordaja on kvantitatiivsete andmete puhul vastuvõetamatu r- Pearson, siis saab kahe muutuja vahelise seose hüpoteesi testimiseks pärast esialgset järjestamist rakendada korrelatsioone r- Odamees või τ -Kendall. Näiteks I. A. Lavochkini muusikaliselt andekate noorukite psühhofüüsiliste omaduste uurimisel kasutati Spearmani kriteeriumi.

Mõlema koefitsiendi (Spearman ja Kendall) korrektseks arvutamiseks tuleb mõõtmistulemused esitada järgu või intervalli skaalal. Põhimõttelisi erinevusi nende kriteeriumide vahel ei ole, kuid üldtunnustatud seisukoht on, et Kendalli koefitsient on „tähenduslikum”, kuna see analüüsib muutujate vahelisi seoseid põhjalikumalt ja detailsemalt, läbides kõik võimalikud vastavused väärtuspaaride vahel. Spearmani koefitsient võtab täpsemalt arvesse muutujatevahelise seose kvantitatiivset määra.

Spearmani astme korrelatsioonikordaja on klassikalise Pearsoni korrelatsioonikordaja mitteparameetriline analoog, kuid selle arvutamisel ei arvestata mitte võrreldavate muutujate jaotusega seotud näitajaid (aritmeetiline keskmine ja dispersioon), vaid pigem järjestusi. Näiteks on vaja kindlaks teha seos nende isiksuseomaduste pingerea hinnangute vahel, mis on osa inimese ettekujutusest tema "tegelikust minast" ja "ideaalsest minast".

Spearmani koefitsienti kasutatakse psühholoogilistes uuringutes laialdaselt. Näiteks Yu V. Bushovi ja N. N. Nesmelova töös: seda kasutati helisignaalide kestuse hindamise ja reprodutseerimise täpsuse sõltuvuse uurimiseks inimese individuaalsetest omadustest.

Kuna see koefitsient on analoogne r-Pearson, siis on selle kasutamine hüpoteeside kontrollimiseks sarnane koefitsiendi kasutamisega r- Pearson. See tähendab, et testitav statistiline hüpotees, statistilise otsuse tegemise protseduur ja sisulise järelduse formuleerimine on samad. Arvutiprogrammides (SPSS, Statistica) samade koefitsientide olulisuse tasemed r-Pearson ja r-Spearmani omad langevad alati kokku.

Koefitsiendi eelis r-Spearman vs suhe r-Pearson – suurem suhtlemistundlikkus. Kasutame seda järgmistel juhtudel:

  • vähemalt ühe muutuja jaotuse olulise kõrvalekalde olemasolu normaalvormist (asümmeetria, kõrvalekalded);
  • kõverjoonelise (monotoonse) ühenduse ilmumine.

Koefitsiendi rakendamise piirang r-Spearman on:

  • iga muutuja kohta vähemalt 5 vaatlust;
  • ühe või mõlema muutuja suure hulga identsete astmete koefitsient annab ligikaudse väärtuse.

Aste korrelatsioonikordaja τ -Kendall on sõltumatu originaalmeetod, mis põhineb kahe sama või erineva suundumusega (suurenevad või vähenevad väärtused) proovi väärtuspaaride suhte arvutamisel. Seda koefitsienti nimetatakse ka vastavuskoefitsient. Seega on selle meetodi põhiidee selles, et seose suunda saab hinnata paarides olevate katsealuste võrdlemise teel: kui subjektide paaril on muutus X kattub suunas muutumisega Y, see viitab positiivsele seosele, kui see ei lange kokku, viitab see negatiivsele seosele, näiteks pere heaolu seisukohalt määrava tähtsusega isikuomadusi. Selle meetodi puhul esitatakse üks muutuja monotoonse jadana (näiteks abikaasa andmed) kasvavas suurusjärgus; teisele muutujale (näiteks naise andmetele) määratakse vastavad edetabelikohad. Korrelatsioonikordajate valemis kasutatakse inversioonide arvu (monotoonilisuse rikkumisi võrreldes esimese reaga).

Kui loendatakse τ- Kendall "käsitsi" järjestatakse andmed kõigepealt muutuja järgi X. Seejärel arvutatakse iga õppeaine kohta välja, mitu korda tema auaste on Y osutub madalamaks kui allolevate katsealuste auaste. Tulemus salvestatakse veergu "Maches". Kõigi väärtuste summa veerus "Sobivus" on P– vastete koguarv asendatakse Kendalli koefitsiendi arvutamise valemisse, mis on arvutuslikult lihtsam, kuid valimi suurenedes, erinevalt r-Spearman, arvutuste maht ei suurene mitte proportsionaalselt, vaid eksponentsiaalselt. Nii näiteks millal N= 12 on vaja sorteerida 66 paari õppeainet ja millal N= 489 – juba 1128 paari, s.t arvutuste maht suureneb üle 17 korra. Arvutades arvutis statistikaprogrammis (SPSS, Statistica), arvutatakse Kendalli koefitsient sarnaselt koefitsientidega r-Spearman ja r- Pearson. Arvutatud korrelatsioonikordaja τ -Kendelli iseloomustab täpsem väärtus lk-tase.

Kendalli koefitsiendi kasutamine on eelistatav, kui lähteandmetes on kõrvalekaldeid.

Auaste korrelatsioonikordajate tunnuseks on see, et maksimaalsed absoluutsed korrelatsioonid (+1, –1) ei pruugi tingimata vastata rangetele otse- või pöördvõrdelistele seostele algsete muutujate vahel. X Ja Y: piisab ainult nendevahelisest monotoonsest funktsionaalsest ühendusest. Astekorrelatsioonid saavutavad maksimaalse absoluutväärtuse, kui ühe muutuja suurem väärtus vastab alati teise muutuja suuremale väärtusele (+1) või ühe muutuja suurem väärtus vastab alati teise muutuja väiksemale väärtusele ja vastupidi (–1 ).

Testitav statistiline hüpotees, statistilise otsuse tegemise protseduur ja sisulise järelduse vormistamine on samad, mis juhtumi puhul r-Spearman või r- Pearson.

Kui statistiliselt olulist seost ei leita, kuid on alust arvata, et seos tegelikult on, tuleks esmalt liikuda koefitsiendilt

r-Spearman koefitsiendini τ -Kendall (või vastupidi) ja seejärel kontrollige ebausaldusväärse ühenduse võimalikke põhjuseid:

  • kommunikatsiooni mittelineaarsus: Selleks vaadake 2D-hajumisgraafikut. Kui seos ei ole monotoonne, siis jaga valim osadeks, milles seos on monotoonne, või jaga valim vastandlikesse rühmadesse ja seejärel võrdle neid vastavalt tunnuse väljendustasemele;
  • proovi heterogeensus: Vaadake kahemõõtmelist hajuvusgraafikut, proovige jaotada valim osadeks, milles seos võib olla erineva suunaga.

Kui seos on statistiliselt oluline, siis enne sisulise järelduse tegemist on vaja välistada valekorrelatsiooni võimalus (analoogiliselt meetermõõdustiku korrelatsioonikordajatega).

Dihhotoomsete muutujate korrelatsioon

Kahe dihhotoomsel skaalal mõõdetud muutuja võrdlemisel on korrelatsiooni mõõdupuuks nn koefitsient j, mis on dihhotoomsete andmete korrelatsioonikordaja.

Suurusjärk koefitsient φ jääb vahemikku +1 kuni –1. See võib olla kas positiivne või negatiivne, iseloomustades kahe dihhotoomiliselt mõõdetud tunnuse vahelise seose suunda. Siiski võib φ tõlgendamine tekitada spetsiifilisi probleeme. Koefitsiendi φ arvutamisel kasutatavad dihhotoomsed andmed ei meenuta kahemõõtmelist normaalpinda, mistõttu on vale eeldada, et tõlgendatud väärtused r xy=0,60 ja φ = 0,60 on samad. Koefitsienti φ saab arvutada nii kodeerimismeetodil kui ka nn neljaväljatabeli ehk situatsioonitabeli abil.

Korrelatsioonikordaja φ rakendamiseks peavad olema täidetud järgmised tingimused:

  • võrreldavaid omadusi tuleb mõõta dihhotoomsel skaalal;
  • X Ja Y peaks olema sama.

Seda tüüpi korrelatsioon arvutatakse SPSS-i arvutiprogrammis kaugusmõõtude ja sarnasusmõõtude definitsiooni alusel. Mõned statistilised protseduurid, nagu faktoranalüüs, klasteranalüüs, mitmemõõtmeline skaleerimine, on üles ehitatud nende mõõtude kasutamisele ja pakuvad mõnikord ka ise täiendavaid võimalusi sarnasusnäitajate arvutamiseks.

Juhtudel, kui ühte muutujat mõõdetakse dihhotoomsel skaalal (muutuja X) ja teine ​​intervalli või suhte skaalal (muutuja Y), kasutatud biseeriline korrelatsioonikordaja Näiteks kui kontrollite hüpoteese lapse soo mõju kohta pikkusele ja kaalule. See koefitsient varieerub vahemikus –1 kuni +1, kuid selle märk ei oma tulemuste tõlgendamisel tähtsust. Selle kasutamiseks peavad olema täidetud järgmised tingimused:

  • Võrreldavaid omadusi tuleb mõõta erinevatel skaaladel: üks X– dihhotoomsel skaalal; muud Y– intervallide või suhete skaalal;
  • muutuv Y omab tavalist jaotusseadust;
  • varieeruvate tunnuste arv võrreldavates muutujates X Ja Y peaks olema sama.

Kui muutuja X mõõdetuna dihhotoomsel skaalal ja muutujaga Y astmeskaalal (muutuja Y), saab kasutada aste-biseeria korrelatsioonikordaja, mis on tihedalt seotud Kendalli τ-ga ja kasutab oma definitsioonis kokkulangevuse ja inversiooni mõisteid. Tulemuste tõlgendamine on sama.

Korrelatsioonianalüüsi läbiviimine arvutiprogrammide SPSS ja Statistica abil on lihtne ja mugav toiming. Selleks tuleb pärast dialoogiboksi Bivariate Correlations (Analüüsi>Korrelatsioon>Kahemuutuja...) väljakutsumist viia uuritavad muutujad väljale Variables ja valida meetod, mille abil tuvastatakse muutujatevaheline korrelatsioon. Iga arvutatud kriteeriumi väljundfail sisaldab ruudukujulist tabelit (korrelatsioonid). Igas tabeli lahtris on näidatud: korrelatsioonikordaja enda väärtus (Correlation Coefficient), arvutatud koefitsiendi Sig statistiline olulisus, katsealuste arv.

Saadud korrelatsioonitabeli päises ja külgmistes veergudes on muutujate nimed. Tabeli diagonaal (ülemine vasak - alumine parem nurk) koosneb ühikutest, kuna mis tahes muutuja korrelatsioon iseendaga on maksimaalne. Tabel on selle diagonaali suhtes sümmeetriline. Kui programmis on märkeruut "Märgi olulised korrelatsioonid", märgitakse lõplikus korrelatsioonitabelis statistiliselt olulised koefitsiendid: tasemel 0,05 ja vähem - ühe tärniga (*) ja tasemel 0,01 - koos kaks tärni (**).

Kokkuvõtteks: korrelatsioonianalüüsi peamine eesmärk on tuvastada muutujate vaheline seos. Seosuse mõõdupuuks on korrelatsioonikordajad, mille valik sõltub otseselt muutujate mõõdetava skaala tüübist, varieeruvate tunnuste arvust võrreldavates muutujates ja muutujate jaotusest. Korrelatsiooni olemasolu kahe muutuja vahel ei tähenda, et nende vahel on põhjuslik seos. Kuigi korrelatsioon ei näita otseselt põhjuslikku seost, võib see olla põhjuse vihje. Selle põhjal saab püstitada hüpoteese. Mõnel juhul mõjutab korrelatsiooni puudumine põhjusliku seose hüpoteesi sügavamalt. Nullkorrelatsioon kahe muutuja vahel võib viidata sellele, et üks muutuja ei mõjuta teist.



Jaga