Korrelaatiopisteet. Korrelaatiot psykologian opinnäytetyössä

Kahden järjestyksen alaisen arvosarjan läsnä ollessa on järkevää laskea Spearmanin rankkorrelaatio.

Tällaisia ​​sarjoja voidaan edustaa:

  • pari piirteitä, jotka on määritetty samassa tutkittavien objektien ryhmässä;
  • pari yksittäisiä alisteisia piirteitä, jotka määritetään kahdessa tutkittavassa objektissa samalla ominaisuusjoukolla;
  • pari ryhmän alisteista piirteitä;
  • merkkien yksilö- ja ryhmäalistus.

Menetelmässä indikaattorit asetetaan paremmuusjärjestykseen erikseen kunkin ominaisuuden osalta.

Vähiten tärkeä on alhaisin arvo.

Tämä menetelmä viittaa ei-parametriseen tilastolliseen menetelmään, joka on suunniteltu varmistamaan, että tutkittavien ilmiöiden välillä on yhteys:

  • määritetään kahden kvantitatiivisen datasarjan välinen samansuuntaisuus;
  • tunnistetun suhteen tiukkuuden arviointi kvantitatiivisesti ilmaistuna.

Korrelaatioanalyysi

Tilastollinen menetelmä, joka on suunniteltu tunnistamaan kahden tai useamman välisen suhteen olemassaolo satunnaismuuttujia(muuttujat), samoin kuin sen vahvuus, nimettiin korrelaatioanalyysi.

Se sai nimensä korrelaatiosta (lat.) - ratio.

Sitä käytettäessä seuraavat skenaariot ovat mahdollisia:

  • korrelaation olemassaolo (positiivinen tai negatiivinen);
  • ei korrelaatiota (nolla).

Muuttujien välisen suhteen luomisen tapauksessa se tulee niiden korrelaatiosta. Toisin sanoen voidaan sanoa, että X:n arvon muutoksella havaitaan väistämättä suhteellinen muutos Y:n arvossa.

Työkaluina käytetään erilaisia ​​viestintämittauksia (kertoimia).

Heidän valintaan vaikuttavat:

  • tapa mitata satunnaislukuja;
  • satunnaislukujen välisen suhteen luonne.

Korrelaation olemassaolo voidaan näyttää graafisesti (kaaviot) ja kertoimen avulla (numeerinen näyttö).

Korrelaatiolle on tunnusomaista seuraavat ominaisuudet:

  • sidoslujuus (korrelaatiokertoimella ± 0,7 - ± 1 - vahva; ± 0,3 - ± 0,699 - keskitaso; 0 - ± 0,299 - heikko);
  • viestintäsuunta (eteen tai taaksepäin).

Korrelaatioanalyysin tavoitteet

Korrelaatioanalyysi ei mahdollista syy-yhteyden määrittämistä tutkittujen muuttujien välillä.

Se toteutetaan tavoitteena:

  • muuttujien välisten riippuvuuksien määrittäminen;
  • tietyn informaation hankkiminen muuttujasta toisen muuttujan perusteella;
  • määritetään tämän riippuvuuden tiiviys (liitos);
  • muodostetun yhteyden suunnan määrittäminen.

Korrelaatioanalyysimenetelmät


Tämä analyysi voidaan tehdä käyttämällä:

  • neliön menetelmä tai Pearson;
  • rank-menetelmä tai Spearman.

Pearsonin menetelmä soveltuu laskelmiin, jotka vaativat tarkka määritelmä muuttujien välillä vallitseva voima. Sen avulla tutkitut ominaisuudet tulisi ilmaista vain määrällisesti.

Spearman-menetelmän tai rankkorrelaation soveltamiseksi piirteiden ilmaisemiseen ei ole tiukkoja vaatimuksia - se voi olla sekä kvantitatiivista että attribuutiota. Tämän menetelmän ansiosta tietoa ei saada yhteyden vahvuuden tarkasta määrittämisestä, vaan niillä on suuntaa-antava luonne.

Muuttujien rivit voivat sisältää avoimia muunnelmia. Esimerkiksi kun työkokemus ilmaistaan ​​arvoilla, kuten enintään 1 vuosi, yli 5 vuotta jne.

Korrelaatiokerroin

Kahden muuttujan muutoksen luonnetta kuvaavaa tilastollista arvoa kutsutaan korrelaatiokertoimeksi tai parikorrelaatiokertoimeksi. Määrällisesti se vaihtelee -1:stä +1:een.

Yleisimmät kertoimet ovat:

  • Pearson- soveltuu intervalliasteikolle kuuluville muuttujille;
  • Spearman- järjestysasteikkomuuttujille.

Korrelaatiokertoimen käytön rajoitukset

Epäluotettavien tietojen saaminen korrelaatiokerrointa laskettaessa on mahdollista tapauksissa, joissa:

  • käytettävissä on riittävä määrä muuttuvia arvoja (25-100 havaintoparia);
  • tutkittujen muuttujien välille muodostetaan esimerkiksi neliöllinen suhde, ei lineaarinen;
  • kussakin tapauksessa tiedot sisältävät useamman kuin yhden havainnon;
  • muuttujien epänormaalien arvojen (outliers) esiintyminen;
  • tutkittava tieto koostuu selkeästi erotetuista havaintojen alaryhmistä;
  • korrelaation olemassaolo ei salli meidän määrittää, mitä muuttujista voidaan pitää syynä ja mitä seurauksena.

Korrelaation merkityksen tarkistaminen

Tilastollisten suureiden arvioinnissa käytetään niiden merkittävyyden tai luotettavuuden käsitettä, joka kuvaa suuren tai sen ääriarvojen satunnaisen esiintymisen todennäköisyyttä.

Yleisin tapa määrittää korrelaation merkitys on Studentin testi.

Sen arvoa verrataan taulukkoarvoon, vapausasteiden lukumääräksi otetaan 2. Kun kriteerin laskettu arvo on suurempi kuin taulukkoarvo, se ilmaisee korrelaatiokertoimen merkityksen.

Taloudellisia laskelmia tehtäessä 0,05 (95 %) tai 0,01 (99 %) luottamustaso katsotaan riittäväksi.

Spearman riveissä

Spearmanin rankkorrelaatiokerroin mahdollistaa ilmiöiden välisen yhteyden olemassaolon tilastollisen toteamisen. Sen laskemiseen kuuluu sarjanumeron luominen jokaiselle ominaisuudelle - arvo. Sijoitus voi joko nousta tai laskea.

Luokiteltujen ominaisuuksien lukumäärä voi olla mikä tahansa. Tämä on melko työläs prosessi, joka rajoittaa niiden määrää. Vaikeudet alkavat, kun saavutat 20 merkkiä.

Spearman-kertoimen laskemiseksi käytä kaavaa:

jossa:

n - näyttää luokiteltujen ominaisuuksien lukumäärän;

d ei ole mitään muuta kuin ero kahden muuttujan arvojen välillä;

ja ∑ (d2) on järjestyserojen neliöiden summa.

Korrelaatioanalyysi psykologiassa

Tilastollinen tuki psykologinen tutkimus voit tehdä niistä objektiivisempia ja edustavampia. Psykologisten kokeiden aikana saatujen tietojen tilastollinen käsittely auttaa keräämään mahdollisimman paljon hyödyllistä tietoa.

Korrelaatioanalyysiä käytetään laajimmin niiden tulosten käsittelyssä.

On tarkoituksenmukaista tehdä korrelaatioanalyysi tutkimuksen aikana saaduista tuloksista:

  • ahdistus (R. Temmlin, M. Dorcan, V. Amenin testien mukaan);
  • perhesuhteet (EG Eidemillerin, VV Yustitskin kyselylomake "Perhesuhteiden analyysi" (DIA));
  • sisäisyyden-ulkopuolisuuden taso (EF Bazhinin, EA Golynkinan ja AM Etkindin kysely);
  • opettajien tunnepalamisen taso (V.V. Boykon kysely);
  • eri erikoiskoulutuksessa olevien opiskelijoiden verbaalisen älykkyyden elementtien välinen yhteys (K.M. Gurevichin menetelmä ja muut);
  • empatiatason (V.V. Boykon menetelmä) ja avioliittoon tyytyväisyyden välinen suhde (V.V. Stolinin, T.L. Romanovan, G.P. Butenkon kysely);
  • nuorten sosiometrisen aseman (Jacob L. Morenon testi) ja perhekasvatuksen tyylin erityispiirteiden välinen suhde (E.G. Eidemillerin, V.V. Yustitskin kysely);
  • kokonaisissa ja epätäydellisissä perheissä kasvatettujen nuorten elämäntavoitteiden rakenne (kyselylomake Edward L. Deci, Richard M. Ryan Ryan).

Lyhyet ohjeet korrelaatioanalyysin suorittamiseen Spearmanin kriteerin mukaan

Korrelaatioanalyysi suoritetaan Spearmanin menetelmällä seuraavan algoritmin mukaan:

  • parilliset vertailumerkit sijaitsevat kahdessa rivissä, joista toinen on merkitty X:llä ja toisella Y;
  • X-sarjan arvot on järjestetty nousevaan tai laskevaan järjestykseen;
  • sarjan Y arvojen järjestyksen järjestys määräytyy niiden vastaavuuden perusteella sarjan X arvojen kanssa;
  • määritä jokaiselle rivin X arvolle järjestys - määritä järjestysnumero minimiarvosta enimmäisarvoon;
  • jokaiselle sarjan Y arvolle määritetään myös sijoitus (minimistä maksimiin);
  • laske ero (D) X:n ja Y:n välillä käyttämällä kaavaa D = X-Y;
  • tuloksena saadut eroarvot neliötetään;
  • suorittaa arvoerojen neliöiden summaus;
  • suorita laskelmat kaavalla:

Esimerkki Spearman-korrelaatiosta

On tarpeen määrittää korrelaatio työkokemuksen ja tapaturmaasteen välillä, jos seuraavat tiedot ovat saatavilla:

Useimmat sopiva menetelmä analyysi on sijoitusmenetelmä, koska yksi merkeistä esitetään avoimina vaihtoehtoina: työkokemus enintään 1 vuosi ja työkokemus 7 vuotta tai enemmän.

Ongelman ratkaisu alkaa tietojen luokittelulla, joka kootaan laskentataulukkoon ja voidaan suorittaa manuaalisesti, koska niiden määrä ei ole suuri:

Työkokemus Loukkaantumisten määrä Sarjanumerot (riveissä) Ero riveissä Sijoitusero neliöity
d (x-y)
jopa 1 vuosi 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 ja enemmän 6 5 1 +4 16
Σ d2 = 38,5

Murtolukujen esiintyminen sarakkeessa johtuu siitä, että samankokoisten varianttien ilmestyessä järjestyksen aritmeettinen keskiarvo löytyy. Tässä esimerkissä loukkaantumisprosentti 12 esiintyy kahdesti ja sille annetaan arvot 2 ja 3, löydämme näiden asteiden aritmeettisen keskiarvon (2 + 3) / 2 = 2,5 ja laitamme tämän arvon laskentataulukkoon 2 indikaattorille.
Kun saadut arvot on korvattu työkaavalla ja suoritettu yksinkertaiset laskelmat, saamme Spearman-kertoimen, joka on yhtä suuri kuin -0,92

Kertoimen negatiivinen arvo osoittaa läsnäolon palautetta merkkien välissä ja antaa meille mahdollisuuden väittää, että lyhyt työkokemus liittyy suuri numero vammoja. Lisäksi näiden indikaattoreiden välisen yhteyden vahvuus on melko suuri.
Seuraava vaihe laskelmissa on määrittää saadun kertoimen luotettavuus:
hänen virheensä ja Studentin t-testi lasketaan

Regressio- ja korrelaatioanalyysi - tilastolliset tutkimusmenetelmät. Nämä ovat yleisimpiä tapoja näyttää, kuinka parametri riippuu yhdestä tai useammasta riippumattomasta muuttujasta.

Alla tarkemmin käytännön esimerkkejä Harkitse näitä kahta analyysiä, jotka ovat erittäin suosittuja taloustieteilijöiden keskuudessa. Ja myös annamme esimerkin tulosten saamisesta, kun ne yhdistetään.

Regressioanalyysi Excelissä

Näyttää joidenkin arvojen (riippumaton, riippumaton) vaikutuksen riippuvaan muuttujaan. Esimerkiksi kuinka aktiivisen väestön määrä riippuu yritysten lukumäärästä, palkkojen koosta ja muista parametreistä. Tai: miten ulkomaiset sijoitukset, energian hinnat jne. vaikuttavat BKT:n tasoon.

Analyysin tulos antaa sinun priorisoida. Ja päätekijöiden perusteella ennustaa, suunnitella painopistealueiden kehitystä, tehdä johtamispäätöksiä.

Regressio tapahtuu:

  • lineaarinen (y = a + bx);
  • parabolinen (y = a + bx + cx 2);
  • eksponentiaalinen (y = a * exp (bx));
  • teho (y = a * x ^ b);
  • hyperbolinen (y = b/x + a);
  • logaritminen (y = b * 1n (x) + a);
  • eksponentiaalinen (y = a * b ^ x).

Katsotaanpa esimerkkiä regressiomallin rakentamisesta Excelissä ja tulosten tulkinnasta. Otetaan lineaarinen tyyppi regressio.

Tehtävä. 6 yrityksessä keskimäärin kuukausittain palkka ja irtisanoneiden työntekijöiden määrä. On tarpeen määrittää irtisanoutuneiden työntekijöiden lukumäärän riippuvuus keskipalkasta.

Malli lineaarinen regressio näyttää tältä:

Y = a 0 + a 1 x 1 + ... + a k x k.

Missä a - regressiokertoimet, x - vaikuttavat muuttujat, k - tekijöiden lukumäärä.

Esimerkissämme Y on irtisanoneiden työntekijöiden indikaattori. Vaikuttava tekijä on palkat (x).

Excelissä on sisäänrakennettuja funktioita, joiden avulla voit laskea lineaarisen regressiomallin parametreja. Mutta Analysis Package -apuohjelma tekee sen nopeammin.

Aktivoimme tehokkaan analyyttisen työkalun:

Aktivoinnin jälkeen apuohjelma on käytettävissä "Data"-välilehdellä.

Siirrytään nyt suoraan regressioanalyysiin.



Ensinnäkin kiinnitä huomiota R-neliöön ja kertoimiin.

R-neliö on determinaatiokerroin. Esimerkissämme - 0,755 tai 75,5%. Tämä tarkoittaa, että mallin lasketut parametrit selittävät tutkittujen parametrien välisen suhteen 75,5 %:lla. Mitä suurempi determinaatiokerroin, sitä parempi malli on. Hyvä - yli 0,8. Huono - alle 0,5 (tällaista analyysiä tuskin voidaan pitää järkevänä). Esimerkissämme - "ei paha".

Kerroin 64,1428 osoittaa, mikä Y on, jos kaikki tarkasteltavan mallin muuttujat ovat yhtä suuria kuin 0. Eli myös muut tekijät, joita ei ole kuvattu mallissa, vaikuttavat analysoitavan parametrin arvoon.

Kerroin -0,16285 näyttää muuttujan X painon Y:ssä. Eli keskimääräinen kuukausipalkka tässä mallissa vaikuttaa lopettavien lukumäärään painolla -0,16285 (tämä on pieni vaikutus). "-"-merkki osoittaa negatiivinen vaikutus: mitä korkeampi palkka, sitä vähemmän luopuneita on. Mikä on reilua.



Korrelaatioanalyysi Excelissä

Korrelaatioanalyysi auttaa selvittämään, onko indikaattoreiden välillä suhdetta yhdessä vai kahdessa otoksessa. Esimerkiksi koneen käyttöajan ja korjauskustannusten välillä, laitteiden hinta ja käyttöaika, lasten pituus ja paino jne.

Jos suhde on olemassa, niin johtaako yhden parametrin kasvu toisen parametrin nousuun (positiivinen korrelaatio) vai laskuun (negatiivinen). Korrelaatioanalyysi auttaa analyytikkoa määrittämään, voiko yhden indikaattorin arvo ennustaa toisen mahdollisen arvon.

Korrelaatiokerroin on merkitty r:llä. Vaihtelee +1:stä -1:een. Korrelaatioiden luokittelu for eri sfäärit tulee olemaan erilainen. Kun kerroin on 0, näytteiden välillä ei ole lineaarista suhdetta.

Katsotaanpa kuinka käyttää Excel-työkaluja korrelaatiokertoimen löytämiseen.

Parillisten kertoimien etsimiseen käytetään CORREL-funktiota.

Tavoite: Selvitä, onko työtuntien välillä suhdetta sorvi ja sen ylläpitokustannukset.

Laitamme kohdistimen mihin tahansa soluun ja painamme fx-painiketta.

  1. Valitse "Tilasto"-luokasta CORREL-toiminto.
  2. Taulukon 1 argumentti - ensimmäinen arvoalue - koneen toiminta-aika: A2: A14.
  3. Taulukon 2 argumentti - toinen arvoalue - korjauskustannukset: B2: B14. Napsauta OK.

Yhteystyypin määrittämiseksi sinun on tarkasteltava kertoimen absoluuttista lukumäärää (jokaisella toiminta-alalla on oma asteikko).

Useiden parametrien (yli 2) korrelaatioanalyysiin on kätevämpää käyttää Data Analysis -sovellusta (Analysis Package -apuohjelma). Luettelosta sinun on valittava korrelaatio ja määritettävä taulukko. Kaikki.

Saadut kertoimet näytetään korrelaatiomatriisissa. Kuten tämä:

Korrelaatio-regressioanalyysi

Käytännössä näitä kahta tekniikkaa käytetään usein yhdessä.

Esimerkki:


Nyt myös regressiotiedot ovat näkyvissä.

KURSSITYÖT

Aihe: Korrelaatioanalyysi

Johdanto

1. Korrelaatioanalyysi

1.1 Korrelaation käsite

1.2 Korrelaatioiden yleinen luokittelu

1.3 Korrelaatiokentät ja niiden rakentamisen tarkoitus

1.4 Korrelaatioanalyysin vaiheet

1.5 Korrelaatiokertoimet

1.6 Normalisoitu Brave-Pearson-korrelaatiokerroin

1.7 Spearmanin rankkorrelaatiokerroin

1.8 Korrelaatiokertoimien perusominaisuudet

1.9 Korrelaatiokertoimien merkitsevyyden tarkistaminen

1.10 Parin korrelaatiokertoimen kriittiset arvot

2. Monimuuttujakokeen suunnittelu

2.1 Ongelmatilanne

2.2 Suunnitelman keskipisteen (perustaso) ja tekijöiden vaihtelutason määrittäminen

2.3 Suunnittelumatriisin rakentaminen

2.4 Dispersion homogeenisuuden ja mittauksen tasaisuuden tarkistus eri sarjoissa

2.5 Regressioyhtälön kertoimet

2.6 Toistettavuuden hajonta

2.7 Regressioyhtälön kertoimien merkitsevyyden tarkistus

2.8 Regressioyhtälön riittävyyden tarkistaminen

Johtopäätös

Bibliografia

JOHDANTO

Kokeilusuunnittelu on matemaattinen ja tilastollinen tieteenala, joka tutkii kokeellisen tutkimuksen rationaalisen organisoinnin menetelmiä - alkaen optimaalinen valinta tutkittavat tekijät ja varsinaisen kokeen suunnitelman määrittely sen tarkoituksen mukaisesti tulosten analysointimenetelmiin. Kokeen suunnittelun alun loivat englantilaisen tilastotieteilijän R. Fisherin (1935) työt, jotka korostivat, että kokeen rationaalinen suunnittelu antaa yhtä merkittävää voittoa arvioiden tarkkuudessa kuin mittauksen optimaalinen käsittely. tuloksia. 1900-luvun 60-luvulla oli moderni teoria kokeilun suunnittelu. Sen menetelmät liittyvät läheisesti funktioiden approksimaatioteoriaan ja matemaattiseen ohjelmointiin. Rakennettu optimaaliset suunnitelmat ja tutki niiden ominaisuuksia laajalle malliryhmälle.

Kokeilusuunnittelu - määritellyt vaatimukset täyttävän koesuunnitelman valinta, kokeilustrategian kehittämiseen tähtäävä toimenpidesarja (ennakkotietojen hankkimisesta toimivan matemaattisen mallin hankkimiseen tai määrittämiseen). optimaaliset olosuhteet). Tämä on kokeen määrätietoista ohjausta, joka toteutetaan olosuhteissa, joissa tutkittavan ilmiön mekanismin tuntemus on puutteellinen.

Mittauksissa, tietojen myöhemmässä käsittelyssä sekä tulosten formalisoinnissa matemaattisen mallin muodossa syntyy virheitä ja osa lähtötiedon sisältämistä tiedoista katoaa. Kokeellisten suunnittelumenetelmien avulla voit määrittää matemaattisen mallin virheen ja arvioida sen riittävyyttä. Jos mallin tarkkuus osoittautuu riittämättömäksi, kokeellisten suunnittelumenetelmien käyttö mahdollistaa matemaattisen mallin nykyaikaistamisen lisäkokeilla menettämättä aikaisempaa tietoa ja pienin kustannuksin.

Kokeilusuunnittelun tarkoituksena on löytää kokeiden suorittamiselle sellaiset olosuhteet ja säännöt, joilla on mahdollista saada luotettavaa ja luotettavaa tietoa kohteesta. vähiten kustannuksia työvoimaa sekä esittää nämä tiedot kompaktissa ja kätevässä muodossa kvantitatiivisen tarkkuuden arvioinnin kanssa.

Yksi tärkeimmistä suunnittelumenetelmistä, joita käytetään vuonna eri vaiheita tutkimuskäyttöä:

Suunnittelee seulontakokeilua, jonka päätarkoituksena on seulontakokeilun, jonka päätarkoitus on valinta koko tekijäjoukosta olennaisten tekijöiden joukosta, joita tutkitaan tarkemmin;

Varianssianalyysin kokeen suunnittelu, ts. suunnitelmien laatiminen kohteille laatutekijöiden kanssa;

Regressiokokeen suunnittelu, jonka avulla voit saada regressiomalleja (polynomi ja muut);

Äärimmäisen kokeen suunnittelu, jossa päätehtävänä on tutkimuskohteen kokeellinen optimointi;

Suunnittelu dynaamisten prosessien tutkimuksessa jne.

Tieteen opiskelun tarkoituksena on valmistaa opiskelijat ammattinsa tuotantoon ja tekniseen toimintaan suunnitteluteorian menetelmin ja nykyaikaisen tietotekniikan avulla.

Tieteen tavoitteet: opiskelu nykyaikaisia ​​menetelmiä tieteellisen ja teollisen kokeen suunnittelu, organisointi ja optimointi, kokeiden suorittaminen ja saatujen tulosten käsittely.

1. KORRELAATIOANALYYSI

1.1 Korrelaatiokäsite

Tutkija on usein kiinnostunut siitä, kuinka kaksi tai Suuri määrä muuttujat yhdessä tai useammassa tutkitussa otoksessa. Voiko pituus esimerkiksi vaikuttaa henkilön painoon tai voiko paine vaikuttaa tuotteen laatuun?

Tällaista muuttujien välistä suhdetta kutsutaan korrelaatioksi tai korrelaatioksi. Korrelaatio on johdonmukainen muutos kahdessa ominaisuudessa, mikä heijastaa sitä tosiasiaa, että yhden ominaisuuden vaihtelevuus on linjassa toisen ominaisuuden vaihtelun kanssa.

Tiedetään esimerkiksi, että ihmisten pituuden ja painon välillä on keskimäärin positiivinen suhde ja sellainen, että mitä suurempi pituus, sitä suurempi on ihmisen paino. Tästä säännöstä on kuitenkin poikkeuksia, kun suhteellisen lyhyet ihmiset ovat ylipainoisia, ja päinvastoin korkeakasvuiset asteeniset ovat kevyitä. Syynä tällaisiin poikkeuksiin on se, että jokainen biologinen, fysiologinen tai psykologinen merkki määräytyy monien tekijöiden vaikutuksesta: ympäristöllinen, geneettinen, sosiaalinen, ekologinen jne.

Korrelaatiolinkit ovat todennäköisyysmuutoksia, joita voidaan tutkia vain edustavilla otoksilla matemaattisten tilastojen menetelmin. Molempia termejä - korrelaatio ja korrelaatio - käytetään usein vaihtokelpoisina. Riippuvuus merkitsee vaikuttamista, yhteys mitä tahansa sovittua muutosta, joka voi johtua sadoista syistä. Korrelaatiosuhteita ei voida pitää todisteena syy-yhteydestä, ne osoittavat vain, että yhden piirteen muutoksiin liittyy yleensä tiettyjä muutoksia toisessa.

Korrelaatioriippuvuus - nämä ovat muutoksia, jotka tuovat yhden ominaisuuden arvot esiintymistodennäköisyyteen erilaisia ​​merkityksiä toinen merkki.

Korrelaatioanalyysin tehtävä rajoittuu muuttuvien ominaisuuksien välisen suhteen suunnan (positiivinen tai negatiivinen) ja muodon (lineaarinen, epälineaarinen) määrittämiseen, sen tiiviyden mittaamiseen ja lopuksi saatujen korrelaatiokertoimien merkitsevyystason tarkistamiseen.

Korrelaatiolinkit eroavat muodoltaan, suunnalta ja asteelta (voimakkuus) .

Muodossa korrelaatio voi olla suora tai kaareva. Esimerkiksi simulaattorin harjoitusten lukumäärän ja ohjausistunnon oikein ratkaistujen ongelmien lukumäärän välinen suhde voi olla suoraviivainen. Esimerkiksi motivaation tason ja tehtävän suorittamisen tehokkuuden välinen suhde voi olla kaareva (kuva 1). Kun motivaatio kasvaa, tehtävän suorittamisen tehokkuus ensin kasvaa, sitten se saavutetaan optimaalinen taso motivaatiota, mikä vastaa maksimaalinen tehokkuus tehtävän suorittaminen; motivaation lisääntymiseen liittyy jo tehokkuuden lasku.

Kuva 1 - Ongelmanratkaisun tehokkuuden ja motivoivan taipumuksen vahvuuden välinen suhde

Korrelaatiosuunnassa yhteys voi olla positiivinen ("suora") ja negatiivinen ("käänteinen"). Positiivisella suorakorrelaatiolla yhden ominaisuuden korkeammat arvot vastaavat toisen korkeampia arvoja ja yhden ominaisuuden pienemmät arvot vastaavat toisen ominaisuuden pienempiä arvoja (kuva 2). Negatiivisella korrelaatiolla suhteet ovat käänteisiä (kuva 3). Positiivisella korrelaatiolla korrelaatiokerroin on positiivinen merkki, negatiivinen korrelaatio - negatiivinen merkki.

Kuva 2 - Suora korrelaatio

Kuva 3 - Käänteinen korrelaatio


Kuva 4 - Korrelaation puute

Korrelaation asteen, vahvuuden tai tiukkuuden määrää korrelaatiokertoimen arvo. Yhteyden vahvuus ei riipu sen suunnasta ja sen määrää korrelaatiokertoimen itseisarvo.

1.2 Yleinen korrelaatioiden luokittelu

Korrelaatiokertoimesta riippuen erotetaan seuraavat korrelaatiot:

Vahva tai tiukka, korrelaatiokerroin r> 0,70;

Keskiarvo (0,50

Kohtalainen (0.30

Heikko (0.20

Erittäin heikko (r<0,19).

1.3 Korrelaatiokentät ja niiden rakentamisen tarkoitus

Korrelaatiota tutkitaan kokeellisten tietojen perusteella, jotka ovat kahden ominaisuuden mittausarvoja (x i, y i). Jos kokeellisia tietoja on vähän, niin kaksimuuttujainen empiirinen jakauma esitetään arvojen x i ja y i kaksoissarjana. Tässä tapauksessa ominaisuuksien välistä korrelaatioriippuvuutta voidaan kuvata eri tavoin. Argumentin ja funktion välinen vastaavuus voidaan määrittää taulukolla, kaavalla, kaaviolla jne.

Korrelaatioanalyysi, kuten muutkin tilastolliset menetelmät, perustuu todennäköisyysmallien käyttöön, jotka kuvaavat tutkittujen piirteiden käyttäytymistä tietyssä yleisessä populaatiossa, josta saadaan kokeelliset arvot x i ja y i. Kun tutkitaan korrelaatiota kvantitatiivisten ominaisuuksien välillä, joiden arvot voidaan mitata tarkasti metristen asteikkojen yksiköissä (metrit, sekunnit, kilogrammat jne.), niin hyvin usein kaksiulotteisen normaalijakauman yleisen populaation malli on hyväksytty. Tällainen malli näyttää muuttujien x i ja y i välisen suhteen graafisesti pisteen paikan muodossa suorakulmaisessa koordinaattijärjestelmässä. Tätä kuvaajaa kutsutaan myös sirontakuvaajaksi tai korrelaatiokenttään.
Tämän kaksiulotteisen normaalijakauman (korrelaatiokentän) mallin avulla voit antaa visuaalisen graafisen tulkinnan korrelaatiokertoimesta, koska jakauma aggregaatissa riippuu viidestä parametrista: μ x, μ y - keskiarvot (matemaattiset odotukset); σ x, σ y ovat satunnaismuuttujien X ja Y keskihajontoja ja p on korrelaatiokerroin, joka on satunnaismuuttujien X ja Y välisen suhteen mitta.
Jos p = 0, niin kaksiulotteisesta normaalipopulaatiosta saadut arvot x i, y i sijaitsevat kaaviossa koordinaateissa x, y ympyrän rajaamalla alueella (kuva 5, a). Tässä tapauksessa satunnaismuuttujien X ja Y välillä ei ole korrelaatiota ja niitä kutsutaan korreloimattomiksi. Kaksimuuttujaisessa normaalijakaumassa korreloimattomuus tarkoittaa samalla satunnaismuuttujien X ja Y riippumattomuutta.

Objektiivisesti olemassa olevien ilmiöiden välisten yhteyksien tutkiminen on tilaston tärkein tehtävä. Tilastollisen riippuvuuden tutkimuksen prosessissa paljastetaan ilmiöiden välisiä syy-seuraus-suhteita. Syy-suhteet ovat sellainen yhteys ilmiöiden ja prosessien välillä, kun muutos toisessa niistä - syy johtaa muutokseen toisessa - seuraus.

Ilmiöiden ja prosessien merkit jaetaan kahteen luokkaan sen mukaan, mikä merkitys niillä on suhteen tutkimisessa. Merkkejä, jotka aiheuttavat muutoksia muihin vastaaviin merkkeihin, kutsutaan tekijällinen tai vain tekijöitä. Merkkejä, jotka muuttuvat tekijämerkkien vaikutuksesta, kutsutaan tehokas .

Tilastoissa erotetaan ilmiöiden ja prosessien toiminnalliset ja stokastiset (todennäköisyys) yhteydet:

  • Toimiva kutsutaan sellaista suhdetta, jossa tietty tekijä-attribuutin arvo vastaa yhtä tehokkaan arvoa.
  • Jos syy-riippuvuus ei ilmene jokaisessa yksittäistapauksessa, vaan yleensä, keskimäärin suurella määrällä havaintoja, niin tällaista riippuvuutta kutsutaan stokastinen (todennäköisyys) ... Korrelaatio on stokastisen yhteyden erikoistapaus.

Lisäksi, ilmiöiden ja niiden merkkien väliset yhteydet luokitellaan läheisyysasteen, suunnan ja analyyttisen ilmaisun perusteella.

Kohti on suoria ja käänteisiä yhteyksiä:

  • Suoraa viestintää - tämä on sellainen suhde, jossa tekijä-attribuutin arvojen kasvaessa (vähentyessä) tehokkaan arvot kasvavat (pienenevät). Joten esimerkiksi työn tuottavuuden kasvu lisää osaltaan tuotannon kannattavuustasoa.
  • Palautteen tapauksessa efektiivisen attribuutin arvot muuttuvat faktoriaalin vaikutuksesta, mutta päinvastaiseen suuntaan tekijän muutokseen verrattuna. Joten kun omaisuuden tuottotaso nousee, tuotantoyksikön kustannukset laskevat.

Analyyttisellä ilmaisulla on suoraviivaisia ​​(tai yksinkertaisesti lineaarisia) ja epälineaarisia yhteyksiä:

  • Jos ilmiöiden välinen tilastollinen suhde voidaan likimäärin ilmaista suoran yhtälön avulla, niin sitä kutsutaan ns. rivin linkki muotoa: y = a + bx.
  • Jos yhteys voidaan ilmaista minkä tahansa kaarevan suoran yhtälöllä (paraabeli, hyperbola jne.), niin tällaista yhteyttä kutsutaan ns. epälineaarinen (kaareva) yhteys .

Viestinnän kireys näyttää tekijä-attribuutin vaikutuksen mittarin tehokkaan attribuutin yleiseen vaihteluun. Viestinnän luokittelu läheisyyden asteen mukaan on esitetty taulukossa 1.

Yhteyden olemassaolon, sen luonteen ja suunnan tunnistamiseen tilastoissa käytetään seuraavia menetelmiä: rinnakkaistietojen tuominen, analyyttinen ryhmittely, graafinen, korrelaatio. Pääasiallinen menetelmä tilastollisen suhteen tutkimiseksi on tilastollinen viestintämallinnus perustuu korrelaatio- ja regressioanalyysiin .

Korrelaatio on satunnaismuuttujien välinen tilastollinen suhde, jolla ei ole tiukasti toiminnallista luonnetta, jossa muutos toisessa satunnaismuuttujassa johtaa muutokseen toisen matemaattisissa odotuksissa. Tilastoissa on tapana erottaa seuraavat korrelaatiotyypit :

  • parikorrelaatio - kahden merkin välinen suhde (tehokas ja tekijä tai kaksi tekijää);
  • osittainen korrelaatio - tehollisen ja yhden tekijän ominaisuuden välinen suhde muiden tekijäominaisuuksien kiinteään arvoon;
  • moninkertainen korrelaatio - tutkimukseen sisältyvän tehokkaan ja kahden tai useamman tekijämerkin riippuvuus.

Korrelaatioanalyysin tehtävä on kvantitatiivinen määritys kahden ominaisuuden välisen suhteen tiukkuudesta (parisuhteella) sekä tehollisen ja tekijäominaisuuksien joukon välillä (monitekijäsuhteella).

Suhteen tiiviys ilmaistaan ​​kvantitatiivisesti korrelaatiokertoimien suuruudella, joka antaa kvantitatiivisen ominaisuuden piirteiden välisen suhteen tiiviydelle mahdollistaa tekijäominaisuuksien "hyödyllisyyden" määrittämisen moninkertaista regressioyhtälöä muodostettaessa. .

Korrelaatio on yhteydessä regression kanssa, koska edellinen arvioi tilastollisen suhteen vahvuutta (tiukkuutta), jälkimmäinen sen muotoa.

Taantumisanalyysi on määrittää suhteen analyyttinen lauseke regressioyhtälön muodossa.

Regressio kutsutaan tehollisen indikaattorin satunnaismuuttujan keskiarvon riippuvuudeksi tekijän suuruudesta, ja regressioyhtälö - yhtälö, joka kuvaa tehokkaan ominaisuuden ja yhden tai useamman tekijän välistä korrelaatiota.

Korrelaatio-regressioanalyysin kaavat suoraviivaiselle suhteelle parikorrelaatiolla esitetään taulukossa 2.

Taulukko 2 - Korrelaatio-regressioanalyysin kaavat suoraviivaista yhteyttä varten parikorrelaatiolla
IndikaattoriNimitys ja kaava
Suoran yhtälö parikorrelaatiolle y x = a + bx, missä b on regressiokerroin
Normaaliyhtälöjärjestelmä pienimmän neliösumman kertoimien määrittämiseksi a ja b
Lineaarinen korrelaatiokerroin tiedonsiirron tiiviyden määrittämiseksi,
hänen tulkintansa:
r = 0 - ei yhteyttä;
0 -1 r = 1 - toimiva liitäntä
Absoluuttinen elastisuus
Elastisuus on suhteellista

Esimerkkejä ongelmien ratkaisemisesta aiheesta "Korrelaatioanalyysin perusteet"

Tehtävä 1 (suoran suhteen analyysi parikorrelaatiossa) ... Siellä on tietoja viiden konepajan työntekijän pätevyydestä ja kuukausituotosta:

Työntekijöiden pätevyyden ja tuotannon välisen suhteen tutkimiseksi määritä lineaarinen suhdeyhtälö ja korrelaatiokerroin. Anna tulkinta regressio- ja korrelaatiokertoimista.

Ratkaisu ... Laajennetaan ehdotettua taulukkoa.

Määritetään suoran yhtälön parametrit y x = a + bx... Tätä varten ratkaisemme yhtälöjärjestelmän:

Joten regressiokerroin on 18.

Koska в on positiivinen luku, parametrien x ja y välillä on suora yhteys.
a = 92-4 × 18
a = 20
Lineaarinen yhteysyhtälö on muotoa yx = 20 + 18x.

Tutkittujen ominaisuuksien välisen suhteen tiukkuuden (vahvuuden) määrittämiseksi määritämme korrelaatiokertoimen arvon kaavalla:

= (2020-20 × 460/5) / (√10 × √3280) ≈ 180 / 181,11 = 0,99. Koska korrelaatiokerroin on suurempi kuin 0,7, suhde tässä sarjassa on vahva.

Tehtävä 2 ... Yrityksessä tuotteiden hintoja on alennettu 80 ruplasta. yksikköä kohti jopa 60 ruplaa. Hinnan alennuksen jälkeen myynti kasvoi 400 yksiköstä 500 yksikköön päivässä. Määritä absoluuttinen ja suhteellinen elastisuus. Tee joustoarvio, jonka tavoitteena on uusien hinnanalennusten mahdollisuus (tai mahdottomuus).

Ratkaisu ... Lasketaan indikaattorit, joiden avulla voimme suorittaa alustavan joustoanalyysin:

Kuten näette, hintojen laskunopeus on absoluuttisesti sama kuin kysynnän kasvuvauhti.

Löydämme absoluuttiset ja suhteelliset joustavuudet kaavojen avulla:

= (500-400) / (60-80) = 100 / (- 20) -5 - absoluuttinen elastisuus

= (100: 400) / (- 20:80) = -1 - suhteellinen elastisuus

Suhteellisen jouston moduuli on 1. Tämä vahvistaa sen tosiasian, että kysynnän kasvuvauhti on yhtä suuri kuin hintojen laskunopeus. Tällaisessa tilanteessa laskemme yrityksen saamat tulot ennen hinnanalennusta ja sen jälkeen: 80 * 400 = 32 000 ruplaa. päivässä, 60 * 500 = 30 000 ruplaa. päivässä - kuten näemme, tulot ovat laskeneet, eivätkä lisäalennukset ole suositeltavaa.

Tilastollisten menetelmien käyttö psykologisen tutkimuksen materiaalien käsittelyssä tarjoaa loistavan mahdollisuuden poimia hyödyllistä tietoa kokeellisesta tiedosta. Yksi yleisimmistä tilastollisista menetelmistä on korrelaatioanalyysi.

Termiä "korrelaatio" käytti ensin ranskalainen paleontologi J. Cuvier, joka päätteli "eläinten osien ja elinten korrelaatiolain" (tämän lain avulla on mahdollista rekonstruoida koko eläimen ulkonäkö löydetyistä osista). vartalo). Tämän termin otti tilastoihin englantilainen biologi ja tilastotieteilijä F. Galton (ei vain "yhteys" - suhde ja "kuin yhteys" - korrelaatio).

Korrelaatioanalyysi on muuttujien välisiä suhteita koskevien hypoteesien testi käyttämällä korrelaatiokertoimia, kaksiulotteisia kuvaavia tilastoja, kahden muuttujan suhteen (yhteisen vaihtelun) kvantitatiivista mittaa. Siten tämä on joukko menetelmiä satunnaismuuttujien tai -ominaisuuksien välisen korrelaatioriippuvuuden havaitsemiseksi.

Kahden satunnaismuuttujan korrelaatioanalyysi sisältää:

  • korrelaatiokentän rakentaminen ja korrelaatiotaulukon laatiminen;
  • näytteiden korrelaatiokertoimien ja korrelaatiosuhteiden laskeminen;
  • tilastollisen hypoteesin testaaminen suhteen merkitsevyydestä.

Korrelaatioanalyysin päätarkoituksena on tunnistaa kahden tai useamman tutkitun muuttujan välinen suhde, jota pidetään kahden tutkitun ominaisuuden yhteisenä johdonmukaisena muutoksena. Tällä vaihtelulla on kolme pääominaisuutta: muoto, suunta ja vahvuus.

Korrelaation muoto voi olla lineaarinen tai epälineaarinen. Lineaarinen muoto on helpompi tunnistaa ja tulkita korrelaatiota. Lineaariselle korrelaatiosuhteelle voidaan erottaa kaksi pääsuuntaa: positiivinen ("suora suhde") ja negatiivinen ("palaute").

Suhteen vahvuus kertoo suoraan, kuinka selkeästi tutkittujen muuttujien yhteinen vaihtelevuus ilmenee. Psykologiassa ilmiöiden toiminnallinen suhde voidaan empiirisesti paljastaa vain vastaavien piirteiden todennäköisyyssuhteena. Selkeän käsityksen todennäköisyyssuhteen luonteesta antaa sirontakaavio - kaavio, jonka akselit vastaavat kahden muuttujan arvoja, ja jokainen kohde on piste.

Todennäköisyyssuhteen numeerisena ominaisuutena käytetään korrelaatiokertoimia, joiden arvot vaihtelevat -1:n ja +1:n välillä. Laskelmien suorittamisen jälkeen tutkija valitsee pääsääntöisesti vain vahvimmat korrelaatiot, joita tulkitaan edelleen (taulukko 1).

Kriteerinä "riittävän vahvojen" korrelaatioiden valinnassa voi olla sekä itse korrelaatiokertoimen absoluuttinen arvo (0,7 - 1) että tämän kertoimen suhteellinen arvo, joka määräytyy tilastollisen merkitsevyyden tason mukaan (0,01 - 0,1), riippuen näytekoon mukaan. Pienissä näytteissä jatkotulkintaa varten on oikeampaa valita vahvat korrelaatiot tilastollisen merkitsevyyden tason perusteella. Suurilla näytteillä tehdyissä tutkimuksissa on parempi käyttää korrelaatiokertoimien absoluuttisia arvoja.

Siten korrelaatioanalyysin tehtävä rajoittuu muuttuvien merkkien välisen suhteen suunnan (positiivinen tai negatiivinen) ja muodon (lineaarinen, epälineaarinen) määrittämiseen, sen tiiviyden mittaamiseen ja lopuksi saatujen korrelaatiokertoimien merkitsevyystason tarkistamiseen. .

Tällä hetkellä on kehitetty monia erilaisia ​​korrelaatiokertoimia. Eniten käytetyt ovat r-Pirson, r-Speerman ja τ -Kendall. Nykyaikaiset tietokonetilasto-ohjelmat "Korrelaatiot"-valikossa tarjoavat juuri nämä kolme kerrointa, ja ryhmävertailumenetelmiä ehdotetaan muiden tutkimusongelmien ratkaisemiseksi.

Korrelaatiokertoimen laskentamenetelmän valinta riippuu asteikkotyypistä, johon muuttujat kuuluvat (taulukko 2).

Muuttujille, joilla on intervalli ja nimellinen asteikko, käytetään Pearson-korrelaatiokerrointa (tulojen momenttien korrelaatio). Jos ainakin toisella kahdesta muuttujasta on järjestysasteikko tai se ei ole normaalijakautumassa, käytetään Spearman-arvokorrelaatiota, tai

t-Kendall. Jos toinen kahdesta muuttujasta on dikotominen, voidaan käyttää pisteen kaksirivistä korrelaatiota (tilastotietokoneohjelmassa SPSS tämä ominaisuus puuttuu, sen sijaan voidaan laskea rankkorrelaatio). Siinä tapauksessa, että molemmat muuttujat ovat kaksijakoisia, käytetään neljän kentän korrelaatiota (SPSS laskee tämäntyyppisen korrelaation etäisyysmittojen ja samankaltaisuusmittojen määritelmän perusteella). Kahden ei-dikotomisen muuttujan välisen korrelaatiokertoimen laskeminen on mahdollista vain, jos niiden välinen suhde on lineaarinen (yksisuuntainen). Jos yhteys esim. U-muotoinen (epäselvä), korrelaatiokerroin ei sovellu käytettäväksi sidoslujuuden mittana: sen arvo pyrkii nollaan.

Siten ehdot korrelaatiokertoimien soveltamiselle ovat seuraavat:

  • muuttujat mitattuna kvantitatiivisella (sijoitus-, metri-) asteikolla samasta objektiotosta;
  • muuttujien välinen suhde on monotoninen.

Päätilastollinen hypoteesi, jota testataan korrelaatioanalyysillä, on suuntaamaton ja sisältää väitteen korrelaation yhtäläisyydestä nollaan yleisväestössä. H 0: r xy= 0. Jos se hylätään, hyväksytään vaihtoehtoinen hypoteesi H 1: r xy≠ 0 positiivisen tai negatiivisen korrelaation olemassaolosta - riippuen lasketun korrelaatiokertoimen etumerkistä.

Hypoteesien hyväksymisen tai hylkäämisen perusteella tehdään merkityksellisiä johtopäätöksiä. Jos tilastollisen tarkastuksen tulosten mukaan H 0: r xy= 0 ei poikkea tasolla a, niin mielekäs johtopäätös on seuraava: välinen suhde X ja Y ei löydetty. Jos klo H 0 r xy= 0 poikkeaa tasolla a, mikä tarkoittaa, että välillä löydettiin positiivinen (negatiivinen) suhde X ja Y... Paljastuneiden korrelaatioiden tulkintaa tulee kuitenkin lähestyä varoen. Tieteellisesti katsottuna pelkkä kahden muuttujan välisen suhteen luominen ei tarkoita, että syy-yhteys olisi olemassa. Lisäksi korrelaation olemassaolo ei muodosta sekvenssisuhdetta syyn ja seurauksen välille. Se yksinkertaisesti osoittaa, että nämä kaksi muuttujaa liittyvät toisiinsa enemmän kuin sattumalta voisi odottaa. Siitä huolimatta, varovaisuutta noudattaen, korrelaatiomenetelmien käyttö syy-seuraus-suhteiden tutkimuksessa on täysin perusteltua. Vältä kategorisia lauseita, kuten "muuttuja X on syy indikaattorin kasvuun Y". Tällaiset väitteet tulisi muotoilla olettamuksiksi, jotka on perusteltava tiukasti teoriassa.

Yksityiskohtainen kuvaus kunkin korrelaatiokertoimen matemaattisesta menettelystä on annettu matemaattisten tilastojen oppikirjoissa; ; ; Rajaudumme kuvaamaan mahdollisuutta käyttää näitä kertoimia mitta-asteikon tyypistä riippuen.

Metrimuuttujien korrelaatio

Jos haluat tutkia kahden samalla otoksella mitatun metrimuuttujan suhdetta, käytä korrelaatiokerroin r-Pirson... Kerroin itsessään luonnehtii vain lineaarisen suhteen olemassaoloa ominaisuuksien välillä, joka on yleensä merkitty symboleilla X ja Y... Lineaarinen korrelaatiokerroin on parametrinen menetelmä ja sen oikea käyttö on mahdollista vain, jos mittaustulokset esitetään intervalliasteikolla ja arvojen jakauma analysoitavissa muuttujissa poikkeaa normaalista merkityksettömään. On monia tilanteita, joissa sen käyttö on tarkoituksenmukaista. Esimerkiksi: yhteyden luominen opiskelijan älykkyyden ja hänen akateemisen suorituksensa välille; mielialan ja ongelmatilanteesta selviämisen onnistumisen välillä; tulotason ja luonteen välillä jne.

Pearsonin kerrointa käytetään laajalti psykologiassa ja pedagogiikassa. Esimerkiksi I. Ya. Kaplunovichin ja kansanedustaja Nuzhdinan PD Rabinovichin teoksissa Pearsonin lineaarisen korrelaatiokertoimen laskentaa käytettiin vahvistamaan esitettyjä hypoteesia.

Käsiteltäessä tietoja "manuaalisesti" on tarpeen laskea korrelaatiokerroin ja sitten määrittää p- merkitsevyystaso (tietojen tarkistamisen yksinkertaistamiseksi käytetään kriittisten arvojen taulukoita r xy jotka on laadittu tätä kriteeriä käyttäen). Pearsonin lineaarisen korrelaatiokertoimen arvo ei saa ylittää +1 ja olla pienempi kuin –1. Nämä kaksi numeroa +1 ja –1 ovat korrelaatiokertoimen rajat. Kun laskennan tulos on suurempi kuin +1 tai pienempi kuin -1, tämä tarkoittaa, että on tapahtunut laskentavirhe.

Kun lasketaan tietokoneella, tilastoohjelma (SPSS, Statistica) antaa lasketun korrelaatiokertoimen mukana tarkemman arvon p-taso.

Tilastollinen päätös hyväksyä tai hylätä H 0 yleensä asetettu α = 0,05 ja suurelle määrälle havaintoja (100 tai enemmän) α = 0,01. Jos p ≤ α, H 0 poikkeaa ja tekee merkityksellisen johtopäätöksen, että tutkittujen muuttujien välillä löydettiin tilastollisesti luotettava (merkittävä) suhde (positiivinen tai negatiivinen - riippuen korrelaation merkistä). Kun p> α, H 0 ei hylätä, mielekäs johtopäätös rajoittuu väitteeseen, että yhteyttä (tilastollisesti merkitsevää) ei löydetty.

Jos yhteyttä ei löydy, mutta on syytä uskoa, että yhteys on olemassa, kannattaa tarkistaa mahdolliset syyt yhteyden epäluotettavuuteen.

Viestinnän epälineaarisuus- tehdäksesi tämän analysoimalla kaksiulotteinen sirontakuvaaja. Jos suhde on epälineaarinen mutta monotoninen, siirry järjestyskorrelaatioihin. Jos suhde ei ole monotoninen, jaa näyte osiin, joissa suhde on monotoninen, ja laske korrelaatiot erikseen jokaiselle näytteen osalle tai jaa näyte vastakkaisiin ryhmiin ja vertaa niitä sitten niiden vakavuuden mukaan. ominaisuus.

Poikkeamien esiintyminen ja selvä epäsymmetria yhden tai molempien piirteiden jakautumisessa. Tätä varten sinun on tarkasteltava molempien merkkien taajuusjakauman histogrammeja. Jos poikkeavuuksia tai epäsymmetrioita on, sulje pois poikkeamat tai siirry rankkorrelaatioihin.

Näytteen heterogeenisyys(analysoi 2D-sirontakuvaaja). Yritä jakaa otos osiin, joissa suhteella voi olla eri suuntia.

Jos suhde on tilastollisesti merkitsevä, niin ennen järkevän johtopäätöksen tekemistä on suljettava pois väärän korrelaation mahdollisuus:

  • yhteys johtuu päästöistä... Jos poikkeavia arvoja on, siirry sijoituskorrelaatioihin tai sulje pois poikkeamat;
  • suhde johtuu kolmannen muuttujan vaikutuksesta... Jos tällainen ilmiö on olemassa, on tarpeen laskea korrelaatio ei vain koko otokselle, vaan myös jokaiselle ryhmälle erikseen. Jos "kolmas" muuttuja on metrinen, laske osittainen korrelaatio.

Osittainen korrelaatiokerroin r xy -z lasketaan, jos on tarpeen tarkistaa oletus, että kahden muuttujan välinen suhde X ja Y ei riipu kolmannen muuttujan vaikutuksesta Z... Hyvin usein kaksi muuttujaa korreloivat keskenään vain siksi, että molemmat muuttuvat johdonmukaisesti kolmannen muuttujan vaikutuksesta. Toisin sanoen itse asiassa vastaavien ominaisuuksien välillä ei ole yhteyttä, vaan se ilmenee tilastollisessa suhteessa yhteisen syyn vaikutuksesta. Esimerkiksi ikä voi olla yleinen syy kahden muuttujan vaihteluun tutkittaessa eri psykologisten ominaisuuksien suhdetta ikäryhmässä. Osittaista korrelaatiota kausaalisesta näkökulmasta tulkittaessa tulee olla varovainen, koska jos Z korreloi kanssa X ja kanssa Y, ja osittainen korrelaatio r xy -z on lähellä nollaa, siitä ei välttämättä seuraa, että se on Z on yleinen syy X ja Y.

Sijoitusmuuttujien korrelaatio

Jos korrelaatiokerrointa ei voida hyväksyä kvantitatiivisille tiedoille r-Pirson, sitten kahden muuttujan suhteesta tehdyn hypoteesin testaamiseksi alustavan luokituksen jälkeen voidaan käyttää korrelaatioita r-Speerman tai τ -Kendall... Esimerkiksi musiikillisesti lahjakkaiden nuorten I.A.Lavochkinin psykofyysisten ominaisuuksien tutkimuksessa käytettiin Spearman-kriteeriä.

Molempien kertoimien (Spearman ja Kendall) oikeaa laskemista varten mittaustulokset on esitettävä asteikolla tai intervalleina. Näillä kriteereillä ei ole perustavanlaatuisia eroja, mutta yleisesti tunnustetaan, että Kendall-kerroin on "merkittävämpi", koska se analysoi muuttujien välisiä suhteita täydellisemmin ja yksityiskohtaisemmin tarkastelemalla läpi kaikki mahdolliset arvoparien väliset vastaavuudet. Spearmanin kerroin ottaa tarkemmin huomioon muuttujien välisen suhteen kvantitatiivisen asteen.

Spearmanin rankkorrelaatiokerroin on klassisen Pearson-korrelaatiokertoimen ei-parametrinen analogi, mutta sitä laskettaessa huomioidaan vertailumuuttujien (aritmeettinen keskiarvo ja varianssi) indikaattorit, jotka eivät liity jakaumaan, vaan arvot. On esimerkiksi tarpeen määrittää suhde persoonallisuuden piirteiden arvoarvostelujen välillä, jotka sisältyvät henkilön käsitykseen hänen "todellisesta itsestään" ja "ideaalisesta itsestään".

Spearmanin kerrointa käytetään laajasti psykologisessa tutkimuksessa. Esimerkiksi Yu.V. Bushovin ja N.N.

Koska tämä kerroin on analoginen r-Pirson, sen soveltaminen hypoteesien testaamiseen on samanlainen kuin kertoimen soveltaminen r-Pirson. Toisin sanoen testattava tilastollinen hypoteesi, tilastollisen päätöksen tekomenettely ja merkityksellisen johtopäätöksen muotoilu ovat samat. Tietokoneohjelmissa (SPSS, Statistica) samojen kertoimien merkitsevyystasot r-Pirson ja r- Erikoistarjoukset ovat aina samat.

Kertoimen etu r-Speerman vastaan ​​kertoimet r-Pirson - herkempi kommunikaatiolle. Käytämme sitä seuraavissa tapauksissa:

  • vähintään yhden muuttujan jakauman merkittävä poikkeama normaalimuodosta (epäsymmetria, poikkeamat);
  • kaarevan (monotonisen) yhteyden esiintyminen.

Kertoimen soveltamisen rajoitus r– Asiantuntijat ovat:

  • jokaista muuttujaa kohti vähintään 5 havaintoa;
  • kerroin suurelle määrälle yhtä suuria arvoja yhdessä tai molemmissa muuttujissa antaa karkean arvon.

Rankkorrelaatiokerroin τ -Kendall on itsenäinen alkuperäinen menetelmä, joka perustuu kahden näytteen arvoparien suhteen laskemiseen, joilla on sama tai erilainen suuntaus (nousevat tai laskevat arvot). Tätä kerrointa kutsutaan myös yhteensopivuuskerroin... Tämän menetelmän perusideana on siis se, että yhteyden suunta voidaan arvioida vertaamalla koehenkilöitä pareittain keskenään: jos koehenkilöparilla on muutos X suuntautuu yhteen muutoksen kanssa Y, tämä osoittaa positiivista suhdetta, jos ei, negatiivista suhdetta esimerkiksi tutkittaessa perheen hyvinvoinnin kannalta ratkaisevia henkilökohtaisia ​​ominaisuuksia. Tässä menetelmässä yksi muuttuja esitetään monotonisena sekvenssinä (esimerkiksi aviomiehen tiedot) nousevassa suuruusjärjestyksessä; toiselle muuttujalle (esimerkiksi vaimon datalle) annetaan vastaavat arvopaikat. Korrelaatiokertoimien kaavassa käytetään inversioiden määrää (monotonisuuden rikkomuksia ensimmäiseen riviin verrattuna).

Kun lasketaan τ- Kendall "manuaalisesti" tiedot järjestetään ensin muuttujan mukaan X... Sitten jokaiselle aiheelle lasketaan, kuinka monta kertaa hänen arvonsa mukaan Y osoittautuu alhaisemmaksi kuin alempana olevien koehenkilöiden arvo. Tulos kirjataan "Osumat" -sarakkeeseen. Kaikkien "Match" -sarakkeen arvojen summa on P- otteluiden kokonaismäärä korvataan kaavassa Kendall-kertoimen laskemiseksi, mikä on laskennallisesti yksinkertaisempaa, mutta otoksen kasvua, toisin kuin r-Speerman, laskelmien määrä ei kasva suhteellisesti, vaan eksponentiaalisesti. Siis esimerkiksi varten N= 12, on tarpeen selvittää 66 paria aiheita, ja varten N= 489 - jo 1128 paria, eli laskelmien määrä kasvaa yli 17 kertaa. Kun lasketaan tietokoneella tilastoohjelmassa (SPSS, Statistica), Kendall-kerroin lasketaan samalla tavalla kuin kertoimet r-Speerman ja r-Pirson. Laskettu korrelaatiokerroin τ -Kendallille on ominaista tarkempi arvo p-taso.

Kendallin kerroin on parempi, jos lähdetiedot sisältävät poikkeavia arvoja.

Rankkorrelaatiokertoimien ominaisuus on, että suurimmat modulo rankkorrelaatiot (+1, –1) eivät välttämättä vastaa tiukkoja suoria tai käänteisesti verrannollisia alkumuuttujien välisiä suhteita. X ja Y: vain yksitoikkoinen toiminnallinen yhteys niiden välillä riittää. Sijoituskorrelaatiot saavuttavat maksimimoduuliarvonsa, jos yhden muuttujan suurempi arvo vastaa aina toisen muuttujan suurempaa arvoa (+1), tai yhden muuttujan suurempi arvo vastaa aina toisen muuttujan pienempää arvoa ja päinvastoin (-1 ).

Testattava tilastollinen hypoteesi, menettelytapa tilastollisen päätöksen tekemiseksi ja merkityksellisen johtopäätöksen tekeminen ovat samat kuin tapauksessa r- Kaiutin tai r-Pirson.

Jos tilastollisesti merkitsevää yhteyttä ei löydy, mutta on syytä uskoa, että yhteys on olemassa, on ensin vaihdettava kertoimesta

r- Kaiutin kertoimeksi τ -Kendall (tai päinvastoin) ja tarkista sitten mahdolliset syyt yhteyden epäluotettavuuteen:

  • kommunikaation epälineaarisuus: Voit tehdä tämän katsomalla 2D-sirontakaaviota. Jos suhde ei ole yksitoikkoinen, jaa otos osiin, joissa suhde on monotoninen, tai jaa otos vastakkaisiin ryhmiin ja vertaa niitä sitten ominaisuuden vakavuuden mukaan;
  • näytteen heterogeenisuus: katso kaavio kaksiulotteisesta sironnasta, yritä jakaa näyte osiin, joissa suhteella voi olla eri suunnat.

Jos suhde on tilastollisesti merkitsevä, niin ennen mielekkään johtopäätöksen tekemistä on vältettävä väärän korrelaation mahdollisuus (analogisesti metristen korrelaatiokertoimien kanssa).

Dikotomisten muuttujien korrelaatio

Verrattaessa kahta kaksijakoisella asteikolla mitattua muuttujaa korrelaation mittana on ns. kerroin j, joka on dikotomisen datan korrelaatiokerroin.

Suuruus kerroin φ on välillä +1 ja -1. Se voi olla joko positiivinen tai negatiivinen, ja se kuvaa kahden dikotomisesti mitatun ominaisuuden välistä yhteyden suuntaa. Kuitenkin φ:n tulkinta voi aiheuttaa erityisiä ongelmia. Kertoimen φ laskentakaavioon sisältyvät kaksiulotteiset tiedot eivät näytä kaksiulotteiselta normaalipinnalta, joten on väärin olettaa, että tulkitut arvot r xy= 0,60 ja φ = 0,60 ovat samat. Kerroin φ voidaan laskea koodausmenetelmällä sekä käyttämällä ns. nelikenttätaulukkoa tai kontingenssitaulukkoa.

Korrelaatiokertoimen φ soveltaminen edellyttää, että seuraavat ehdot täyttyvät:

  • verrattavat ominaisuudet tulee mitata dikotomisella asteikolla;
  • X ja Y pitäisi olla sama.

Tämäntyyppinen korrelaatio lasketaan SPSS-tietokoneohjelmassa etäisyysmittojen ja samankaltaisuusmittojen määrittämisen perusteella. Jotkut tilastolliset menetelmät, kuten tekijäanalyysi, klusterianalyysi, monimuuttujaskaalaus, perustuvat näiden mittareiden soveltamiseen, ja joskus ne tarjoavat itse lisämahdollisuuksia samankaltaisuusmittareiden laskemiseen.

Tapauksissa, joissa yhtä muuttujaa mitataan dikotomisella asteikolla (muuttuja X), ja toinen intervallien tai suhteiden asteikolla (muuttuja Y) käytetään biserial korrelaatiokerroin esimerkiksi testattaessa hypoteeseja lapsen sukupuolen vaikutuksesta pituuden ja painon indikaattoriin. Tämä kerroin vaihtelee välillä –1 ja +1, mutta sen etumerkillä ei ole merkitystä tulosten tulkinnan kannalta. Sen käyttöä varten on noudatettava seuraavia ehtoja:

  • verrattavat ominaisuudet tulee mitata eri asteikoilla: yksi X- kaksijakoisessa mittakaavassa; toinen Y- intervallien tai suhteiden asteikolla;
  • muuttuja Y on normaali jakelulaki;
  • verrattujen muuttujien vaihtelevien ominaisuuksien lukumäärä X ja Y pitäisi olla sama.

Jos muuttuja X mitataan dikotomisella asteikolla ja muuttuja Y asteikolla (muuttuja Y), voidaan käyttää rank-biserial-korrelaatiokerroin, joka liittyy läheisesti τ-Kendalliin ja käyttää määritelmässään sattuman ja inversion käsitteitä. Tulosten tulkinta on sama.

Korrelaatioanalyysi SPSS- ja Statistica-tietokoneohjelmilla on yksinkertainen ja kätevä toimenpide. Tätä varten sinun on avattava Bivariate Correlations -valintaikkuna (Analysoi> Korreloi> Bivariate ...) siirrettävä tutkitut muuttujat Muuttujat-kenttään ja valittava menetelmä, jolla muuttujien välinen korrelaatiosuhde paljastetaan. Tulostiedosto sisältää neliönmuotoisen taulukon (korrelaatiot) jokaiselle lasketulle kriteerille. Jokainen taulukon solu sisältää: itse korrelaatiokertoimen arvon (Correlation Coefficient), lasketun kertoimen Sig tilastollisen merkitsevyyden, koehenkilöiden lukumäärän.

Tuloksena olevan korrelaatiotaulukon otsikko ja sivusarake sisältävät muuttujien nimet. Taulukon diagonaali (vasen yläkulma - oikea alakulma) koostuu ykkösistä, koska minkä tahansa muuttujan korrelaatio itsensä kanssa on maksimi. Taulukko on symmetrinen tämän diagonaalin suhteen. Jos ohjelmassa on valittuna "Merkitse merkitsevät korrelaatiot" -valintaruutu, tilastollisesti merkitsevät kertoimet merkitään lopulliseen korrelaatiotaulukkoon: tasolla 0,05 tai vähemmän - yhdellä tähdellä (*) ja tasolla 0,01 - kaksi tähteä (**).

Yhteenvetona: korrelaatioanalyysin päätarkoitus on tunnistaa muuttujien välinen suhde. Suhteen mittana ovat korrelaatiokertoimet, joiden valinta riippuu suoraan siitä, millaisessa mittakaavassa muuttujia mitataan, kuinka paljon vaihtelevia piirteitä verrattavissa muuttujissa on sekä muuttujien jakautuminen. Kahden muuttujan välinen korrelaatio ei tarkoita, että niiden välillä olisi syy-yhteys. Vaikka korrelaatio ei suoraan osoita syy-yhteyttä, se voi olla vihje syystä. Sen perusteella voidaan muodostaa hypoteeseja. Joissakin tapauksissa korrelaation puute vaikuttaa syvemmällä syy-yhteyttä koskevaan hypoteesiin. Kahden muuttujan välinen nollakorrelaatio voi tarkoittaa, että toisella muuttujalla ei ole vaikutusta toiseen.

Jaa tämä