Korelačné skóre. Korelácie v tézach v psychológii

V prítomnosti dvoch sérií hodnôt podliehajúcich klasifikácii je racionálne vypočítať Spearmanovu koreláciu hodnotenia.

Takéto série môžu byť zastúpené:

  • dvojica znakov určených v rovnakej skupine skúmaných objektov;
  • dvojica jednotlivých podriadených znakov určených v 2 skúmaných objektoch rovnakým súborom znakov;
  • dvojica skupinových podriadených znakov;
  • individuálna a skupinová podriadenosť znamení.

Metóda zahŕňa klasifikáciu ukazovateľov samostatne pre každú z charakteristík.

Najmenej dôležitá je najnižšia hodnosť.

Táto metóda sa vzťahuje na neparametrickú štatistickú metódu určenú na stanovenie existencie spojenia medzi skúmanými javmi:

  • určenie skutočného stupňa paralelizmu medzi dvoma sériami kvantitatívnych údajov;
  • posúdenie tesnosti identifikovaného vzťahu vyjadrené v kvantitatívnych termínoch.

Korelačná analýza

Štatistická metóda určená na identifikáciu existencie vzťahu medzi 2 alebo viacerými náhodné premenné(premenné), ako aj jeho sila, bola pomenovaná korelačná analýza.

Svoj názov dostal od correlatio (lat.) - pomer.

Pri jeho použití sú možné nasledujúce scenáre:

  • prítomnosť korelácie (pozitívnej alebo negatívnej);
  • žiadna korelácia (nula).

V prípade stanovenia vzťahu medzi premennými prichádza o ich korelácii. Inými slovami, môžeme povedať, že so zmenou hodnoty X bude nevyhnutne pozorovaná proporcionálna zmena hodnoty Y.

Ako nástroje sa používajú rôzne komunikačné opatrenia (koeficienty).

Ich výber ovplyvňuje:

  • spôsob merania náhodných čísel;
  • povaha vzťahu medzi náhodnými číslami.

Existenciu korelácie je možné zobraziť graficky (grafy) a pomocou koeficientu (numerické zobrazenie).

Korelácia je charakterizovaná nasledujúcimi vlastnosťami:

  • pevnosť väzby (s korelačným koeficientom od ± 0,7 do ± 1 - silná; od ± 0,3 do ± 0,699 - stredná; od 0 do ± 0,299 - slabá);
  • smer komunikácie (dopredu alebo dozadu).

Ciele korelačnej analýzy

Korelačná analýza neumožňuje stanoviť kauzálny vzťah medzi skúmanými premennými.

Vykonáva sa s cieľom:

  • stanovenie závislostí medzi premennými;
  • získanie špecifických informácií o premennej na základe inej premennej;
  • určenie tesnosti (spojenia) tejto závislosti;
  • určenie smeru nadviazaného spojenia.

Metódy korelačnej analýzy


Táto analýza možno vykonať pomocou:

  • metóda štvorcov alebo Pearson;
  • rank metóda alebo Spearman.

Pearsonova metóda je použiteľná pre výpočty, ktoré si vyžadujú presná definícia sila, ktorá existuje medzi premennými. Vlastnosti študované s jeho pomocou by sa mali vyjadrovať iba kvantitatívne.

Na uplatnenie Spearmanovej metódy alebo hodnotovej korelácie neexistujú žiadne prísne požiadavky na vyjadrenie znakov – môže byť kvantitatívne aj atribútové. Vďaka tejto metóde sa nezískava informácia o presnom stanovení pevnosti spojenia, ale má indikatívny charakter.

Riadky premenných môžu obsahovať otvorené varianty. Napríklad, keď sú pracovné skúsenosti vyjadrené hodnotami, ako sú do 1 roka, viac ako 5 rokov atď.

Korelačný koeficient

Štatistická hodnota charakterizujúca charakter zmeny dvoch premenných sa nazýva korelačný koeficient alebo párový korelačný koeficient. V kvantitatívnom vyjadrení sa pohybuje od -1 do +1.

Najbežnejšie kurzy sú:

  • Pearson- použiteľné pre premenné patriace do intervalovej stupnice;
  • Spearman- pre premenné radovej stupnice.

Obmedzenia používania korelačného koeficientu

Získanie nespoľahlivých údajov pri výpočte korelačného koeficientu je možné v prípadoch, keď:

  • je k dispozícii dostatočný počet premenných hodnôt (25-100 párov pozorovaní);
  • medzi študovanými premennými je napríklad vytvorený kvadratický vzťah a nie lineárny;
  • v každom prípade údaje obsahujú viac ako jedno pozorovanie;
  • prítomnosť abnormálnych hodnôt (odľahlých hodnôt) premenných;
  • skúmané údaje pozostávajú z jasne rozlíšených podskupín pozorovaní;
  • prítomnosť korelácie nám neumožňuje určiť, ktoré z premenných možno považovať za príčinu a ktoré za následok.

Kontrola významnosti korelácie

Na hodnotenie štatistických veličín sa používa pojem ich významnosti alebo spoľahlivosti, ktorý charakterizuje pravdepodobnosť náhodného výskytu veličiny alebo jej extrémnych hodnôt.

Najbežnejšou metódou na určenie významnosti korelácie je stanovenie Študentovho testu.

Jeho hodnota sa porovnáva s tabuľkovou hodnotou, počet stupňov voľnosti sa berie ako 2. Ak je vypočítaná hodnota kritéria väčšia ako tabuľková hodnota, indikuje významnosť korelačného koeficientu.

Pri vykonávaní ekonomických výpočtov sa za dostatočnú považuje úroveň spoľahlivosti 0,05 (95 %) alebo 0,01 (99 %).

Rad Spearman

Spearmanov koeficient poradovej korelácie umožňuje štatisticky určiť prítomnosť spojenia medzi javmi. Jeho výpočet zahŕňa stanovenie poradového čísla pre každý znak - hodnosť. Poradie sa môže zvyšovať alebo znižovať.

Počet funkcií, ktoré sa majú zoradiť, môže byť ľubovoľný. Ide o pomerne namáhavý proces, ktorý obmedzuje ich počet. Ťažkosti začínajú, keď dosiahnete 20 znakov.

Na výpočet Spearmanovho koeficientu použite vzorec:

kde:

n - zobrazuje počet hodnotených prvkov;

d nie je nič iné ako rozdiel medzi pozíciami v dvoch premenných;

a ∑ (d2) je súčet druhých mocnín rozdielov v poradí.

Korelačná analýza v psychológii

Štatistická podpora psychologický výskum umožňuje, aby boli objektívnejšie a vysoko reprezentatívne. Štatistické spracovanie údajov získaných v priebehu psychologických experimentov prispieva k extrakcii maximálneho množstva užitočných informácií.

Korelačná analýza sa najčastejšie používa pri spracovaní ich výsledkov.

Je vhodné vykonať korelačnú analýzu výsledkov získaných počas výskumu:

  • úzkosť (podľa testov R. Temml, M. Dorca, V. Amen);
  • rodinné vzťahy ("Analýza rodinných vzťahov" (DIA) dotazník EG Eidemiller, VV Yustitskis);
  • úroveň internality-externality (dotazník EF Bazhin, EA Golynkina a AM Etkind);
  • miera emocionálneho vyhorenia medzi učiteľmi (dotazník V.V. Bojka);
  • prepojenie prvkov verbálnej inteligencie študentov v rôznych špecializovaných školeniach (metóda K. M. Gurevicha a iných);
  • vzťah medzi mierou empatie (metóda V.V. Bojka) a spokojnosťou s manželstvom (dotazník V.V. Stolína, T.L. Romanovej, G.P. Butenka);
  • vzťah medzi sociometrickým statusom adolescentov (test Jacoba L. Morena) a osobitosťami štýlu rodinnej výchovy (dotazník E.G. Eidemillera, V.V. Yustitskisa);
  • štruktúra životných cieľov adolescentov vychovávaných v úplných a neúplných rodinách (dotazník Edward L. Deci, Richard M. Ryan Ryan).

Stručný návod na vykonanie korelačnej analýzy podľa Spearmanovho kritéria

Uskutoční sa korelačná analýza pomocou Spearmanovej metódy podľa nasledujúceho algoritmu:

  • spárované porovnateľné znaky sú umiestnené v 2 radoch, z ktorých jeden je označený X a druhý Y;
  • hodnoty radu X sú usporiadané vo vzostupnom alebo zostupnom poradí;
  • postupnosť umiestnenia hodnôt série Y je určená ich zhodou s hodnotami série X;
  • pre každú hodnotu v riadku X určte poradie - priraďte poradové číslo od minimálnej hodnoty po maximum;
  • pre každú z hodnôt v rade Y určite poradie (od minima po maximum);
  • vypočítajte rozdiel (D) medzi radmi X a Y pomocou vzorca D = X-Y;
  • výsledné hodnoty rozdielu sú štvorcové;
  • vykonať súčet druhých mocnín rozdielov v poradí;
  • vykonajte výpočty podľa vzorca:

Príklad Spearmanovej korelácie

Je potrebné stanoviť existenciu korelácie medzi pracovnými skúsenosťami a mierou úrazovosti, ak sú k dispozícii tieto údaje:

Väčšina vhodná metóda analýza je metóda hodnotenia, keďže jedno zo znakov je prezentované vo forme otvorených možností: pracovné skúsenosti do 1 roka a pracovné skúsenosti 7 alebo viac rokov.

Riešenie problému začína zoraďovaním údajov, ktoré sa zostaví do pracovného hárka a je možné ho vykonať ručne, od r ich objem nie je veľký:

Pracovné skúsenosti Počet zranení Sériové čísla (poradie) Rozdiel v poradí Rozdiel v poradí na druhú
d (x-y)
do 1 roka 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 a viac 6 5 1 +4 16
Σ d2 = 38,5

Výskyt zlomkových poradí v stĺpci je spôsobený tým, že v prípade výskytu variantov rovnakej veľkosti sa zistí aritmetický priemer poradia. V tomto príklade sa úrazovosť 12 vyskytuje dvakrát a sú jej priradené hodnosti 2 a 3, nájdeme aritmetický priemer týchto poradí (2 + 3) / 2 = 2,5 a túto hodnotu zapíšeme do pracovného hárka pre 2 ukazovatele.
Po nahradení získaných hodnôt do pracovného vzorca a vykonaní jednoduchých výpočtov získame Spearmanov koeficient rovný -0,92

Záporná hodnota koeficientu indikuje prítomnosť spätná väzba medzi znameniami a umožňuje nám tvrdiť, že krátka pracovná skúsenosť je sprevádzaná Vysoké číslo zranenia. Okrem toho je sila spojenia medzi týmito ukazovateľmi pomerne veľká.
Ďalším krokom vo výpočtoch je určenie spoľahlivosti získaného koeficientu:
vypočíta sa jeho chyba a Studentov t test

Regresná a korelačná analýza - štatistické metódy výskumu. Toto sú najbežnejšie spôsoby, ako ukázať, ako parameter závisí od jednej alebo viacerých nezávislých premenných.

Nižšie konkrétne praktické príklady Zvážte tieto dve analýzy, ktoré sú medzi ekonómami veľmi obľúbené. A tiež uvedieme príklad získania výsledkov, keď sa skombinujú.

Regresná analýza v Exceli

Zobrazuje vplyv niektorých hodnôt (nezávislých, nezávislých) na závislú premennú. Napríklad ako závisí počet ekonomicky aktívneho obyvateľstva od počtu podnikov, veľkosti miezd a iných parametrov. Alebo: ako zahraničné investície, ceny energií atď. ovplyvňujú úroveň HDP.

Výsledok analýzy vám umožňuje určiť priority. A na základe hlavných faktorov predvídať, plánovať rozvoj prioritných oblastí, robiť manažérske rozhodnutia.

Regresia sa deje:

  • lineárny (y = a + bx);
  • parabolický (y = a + bx + cx 2);
  • exponenciálny (y = a * exp (bx));
  • mocnina (y = a * x ^ b);
  • hyperbolický (y = b / x + a);
  • logaritmické (y = b * 1n (x) + a);
  • exponenciálna (y = a * b ^ x).

Pozrime sa na príklad zostavenia regresného modelu v Exceli a interpretácie výsledkov. Vezmime lineárny typ regresia.

Úloha. V 6 podnikoch priemer mesačne mzda a počet zamestnancov, ktorí skončili. Je potrebné určiť závislosť počtu zamestnancov, ktorí končia, od priemernej mzdy.

Model lineárna regresia vyzerá takto:

Y = a 0 + a 1 x 1 + ... + a k x k.

Kde a - regresné koeficienty, x - ovplyvňujúce premenné, k - počet faktorov.

V našom príklade je Y ukazovateľom zamestnancov, ktorí prestali pracovať. Ovplyvňujúci faktor sú mzdy (x).

Excel má vstavané funkcie, ktoré môžete použiť na výpočet parametrov lineárneho regresného modelu. Ale doplnok Analysis Package to urobí rýchlejšie.

Aktivujeme výkonný analytický nástroj:

Po aktivácii bude doplnok dostupný na karte „Údaje“.

Teraz prejdime priamo k regresnej analýze.



V prvom rade si dajte pozor na R-štvorec a koeficienty.

R-štvorec je koeficient determinácie. V našom príklade - 0,755 alebo 75,5%. To znamená, že vypočítané parametre modelu vysvetľujú vzťah medzi študovanými parametrami na 75,5 %. Čím vyšší je koeficient determinácie, tým lepší je model. Dobré - nad 0,8. Zlá - menej ako 0,5 (takúto analýzu možno len ťažko považovať za primeranú). V našom príklade - "nie je to zlé".

Koeficient 64,1428 ukazuje, aké bude Y, ak sa všetky premenné v uvažovanom modeli rovnajú 0. To znamená, že hodnotu analyzovaného parametra ovplyvňujú aj ďalšie faktory, ktoré nie sú v modeli popísané.

Koeficient -0,16285 ukazuje váhu premennej X na Y. To znamená, že priemerná mesačná mzda v rámci tohto modelu ovplyvňuje počet ľudí, ktorí odídu s váhou -0,16285 (to je malá miera vplyvu). Znak "-" označuje zlý vplyv: čím vyšší plat, tým menej ľudí, ktorí odídu. Čo je spravodlivé.



Korelačná analýza v Exceli

Korelačná analýza pomáha určiť, či existuje vzťah medzi ukazovateľmi v jednej alebo dvoch vzorkách. Napríklad medzi dobou prevádzky stroja a nákladmi na opravy, cenou zariadenia a dobou prevádzky, výškou a hmotnosťou detí atď.

Ak existuje vzťah, potom či zvýšenie jedného parametra vedie k zvýšeniu (pozitívna korelácia) alebo zníženiu (negatívnemu) druhého. Korelačná analýza pomáha analytikovi určiť, či hodnota jedného ukazovateľa môže predpovedať možnú hodnotu iného ukazovateľa.

Korelačný koeficient označujeme r. Pohybuje sa od +1 do -1. Klasifikácia korelácií pre rôznych sfér bude iná. Keď je koeficient 0, medzi vzorkami neexistuje lineárny vzťah.

Pozrime sa, ako pomocou nástrojov Excelu nájsť korelačný koeficient.

Na nájdenie párových koeficientov sa používa funkcia CORREL.

Cieľ: Zistite, či existuje vzťah medzi pracovným časom sústruh a náklady na jeho údržbu.

Umiestnime kurzor do ľubovoľnej bunky a stlačíme tlačidlo fx.

  1. V kategórii "Štatistické" vyberte funkciu CORREL.
  2. Argument pole 1 - prvý rozsah hodnôt - čas prevádzky stroja: A2: A14.
  3. Argument poľa 2 - druhý rozsah hodnôt - náklady na opravu: B2: B14. Kliknite na tlačidlo OK.

Ak chcete určiť typ pripojenia, musíte sa pozrieť na absolútne číslo koeficientu (každá oblasť činnosti má svoju vlastnú stupnicu).

Pre korelačnú analýzu viacerých parametrov (viac ako 2) je vhodnejšie použiť Data Analysis (doplnok Analysis Package). V zozname musíte vybrať koreláciu a určiť pole. Všetko.

Získané koeficienty sa zobrazia v korelačnej matici. Páči sa ti to:

Korelačno-regresná analýza

V praxi sa tieto dve techniky často používajú spoločne.

Príklad:


Teraz sú viditeľné aj regresné údaje.

KURZOVÁ PRÁCA

Téma: Korelačná analýza

Úvod

1. Korelačná analýza

1.1 Pojem korelácie

1.2 Všeobecná klasifikácia korelácií

1.3 Korelačné polia a účel ich konštrukcie

1.4 Etapy korelačnej analýzy

1.5 Korelačné koeficienty

1.6 Normalizovaný Brave-Pearsonov korelačný koeficient

1.7 Spearmanov koeficient poradovej korelácie

1.8 Základné vlastnosti korelačných koeficientov

1.9 Kontrola významnosti korelačných koeficientov

1.10 Kritické hodnoty párového korelačného koeficientu

2. Plánovanie viacrozmerného experimentu

2.1 Problémový stav

2.2 Určenie stredu plánu (základná úroveň) a úrovne variácie faktorov

2.3 Zostavenie plánovacej matice

2.4 Kontrola homogenity rozptylu a rovnomernosti merania v rôznych sériách

2.5 Koeficienty regresnej rovnice

2.6 Rozptyl reprodukovateľnosti

2.7 Kontrola významnosti koeficientov regresnej rovnice

2.8 Kontrola primeranosti regresnej rovnice

Záver

Bibliografia

ÚVOD

Plánovanie experimentov je matematická a štatistická disciplína, ktorá študuje metódy racionálnej organizácie experimentálneho výskumu – od optimálna voľba skúmané faktory a definícia skutočného plánu experimentu v súlade s jeho účelom k metódam analýzy výsledkov. Začiatok plánovania experimentu položili práce anglického štatistika R. Fishera (1935), ktorý zdôraznil, že racionálne plánovanie experimentu dáva nemenej významný zisk v presnosti odhadov ako optimálne spracovanie merania. výsledky. V 60. rokoch 20. stor moderná teória plánovanie experimentu. Jeho metódy úzko súvisia s teóriou aproximácie funkcií a matematickým programovaním. Postavený optimálne plány a skúmali ich vlastnosti pre širokú triedu modelov.

Plánovanie experimentu – výber plánu experimentu, ktorý spĺňa špecifikované požiadavky, súbor akcií zameraných na vypracovanie stratégie experimentovania (od získania apriórnych informácií až po získanie funkčného matematického modelu alebo určenie optimálne podmienky). Ide o účelové riadenie experimentu, ktoré sa realizuje za podmienok neúplného poznania mechanizmu skúmaného javu.

V procese meraní, následnom spracovaní údajov, ako aj formalizácii výsledkov vo forme matematického modelu vznikajú chyby a niektoré informácie obsiahnuté vo východiskových údajoch sa strácajú. Použitie metód experimentálneho plánovania umožňuje určiť chybu matematického modelu a posúdiť jeho primeranosť. Ak sa ukáže, že presnosť modelu je nedostatočná, potom použitie metód experimentálneho plánovania umožňuje modernizáciu matematického modelu ďalšími experimentmi bez straty predchádzajúcich informácií a s minimálnymi nákladmi.

Účelom plánovania experimentu je nájsť také podmienky a pravidlá na vykonávanie experimentov, za ktorých je možné získať spoľahlivé a spoľahlivé informácie o objekte s najnižšie náklady práce, ako aj prezentovať tieto informácie v kompaktnej a pohodlnej forme s kvantitatívnym hodnotením presnosti.

Medzi hlavné metódy plánovania používané v rôznych štádiách výskum využíva:

Plánovanie skríningového experimentu, ktorého hlavným významom je výber z celého súboru faktorov skupiny podstatných faktorov, ktoré sú predmetom ďalšieho podrobného štúdia;

Navrhovanie experimentu na analýzu rozptylu, t.j. vypracovanie plánov objektov s faktormi kvality;

Plánovanie regresného experimentu, ktorý umožňuje získať regresné modely (polynómy a iné);

Plánovanie extrémneho experimentu, v ktorom je hlavnou úlohou experimentálna optimalizácia výskumného objektu;

Plánovanie pri štúdiu dynamických procesov a pod.

Účelom štúdia odboru je pripraviť študentov na výrobno-technickú činnosť v ich odbore s využitím metód teórie plánovania a moderných informačných technológií.

Ciele disciplíny: štúdium moderné metódy plánovanie, organizovanie a optimalizácia vedeckého a priemyselného experimentu, vykonávanie experimentov a spracovanie získaných výsledkov.

1. KORELAČNÁ ANALÝZA

1.1 Korelačný koncept

Výskumníka často zaujíma, ako dvaja resp veľká kvantita premenných v jednej alebo viacerých študovaných vzorkách. Môže napríklad výška ovplyvniť hmotnosť človeka alebo môže tlak ovplyvniť kvalitu produktu?

Tento druh vzťahu medzi premennými sa nazýva korelácia alebo korelácia. Korelácia je konzistentná zmena dvoch znakov, ktorá odráža skutočnosť, že variabilita jednej vlastnosti je v súlade s variabilitou druhej.

Je napríklad známe, že medzi výškou ľudí a ich hmotnosťou je v priemere pozitívny vzťah, a to taký, že čím väčšia výška, tým väčšia váha človeka. Existujú však výnimky z tohto pravidla, keď majú relatívne nízke osoby nadváhu, a naopak, astenici s vysokým rastom sú ľahkí. Dôvodom takýchto výnimiek je, že každý biologický, fyziologický alebo psychologický znak je určený vplyvom mnohých faktorov: environmentálnych, genetických, sociálnych, ekologických atď.

Korelačné väzby sú pravdepodobnostné zmeny, ktoré možno študovať len na reprezentatívnych vzorkách metódami matematickej štatistiky. Oba pojmy - korelácia a korelácia - sa často používajú zameniteľne. Závislosť znamená vplyv, spojenie znamená akúkoľvek dohodnutú zmenu, ktorú možno pripísať stovkám dôvodov. Korelačné vzťahy nemožno považovať za dôkaz kauzálneho vzťahu, len naznačujú, že zmeny jedného znaku sú spravidla sprevádzané určitými zmenami iného.

Korelačná závislosť - sú to zmeny, ktoré zavádzajú hodnoty jednej charakteristiky do pravdepodobnosti výskytu rôzne významyďalšie znamenie.

Úloha korelačnej analýzy sa redukuje na určenie smeru (kladného alebo záporného) a tvaru (lineárneho, nelineárneho) vzťahu medzi premenlivými znamienkami, meranie jeho tesnosti a napokon na kontrolu hladiny významnosti získaných korelačných koeficientov.

Korelačné väzby sa líšia formou, smerom a stupňom (sila) .

Vo forme môže byť korelácia rovná alebo zakrivená. Napríklad vzťah medzi počtom tréningov na simulátore a počtom správne vyriešených problémov v kontrolnej relácii môže byť jednoduchý. Napríklad vzťah medzi úrovňou motivácie a efektívnosťou plnenia úloh môže byť krivočiary (obrázok 1). S nárastom motivácie sa efektivita výkonu úlohy najskôr zvyšuje, až potom sa dosahuje optimálna úroveň motivácia, čomu zodpovedá maximálna účinnosť dokončenie úlohy; ďalší nárast motivácie je už sprevádzaný poklesom efektivity.

Obrázok 1 - Vzťah medzi efektivitou riešenia problému a silou motivačnej tendencie

V smere korelácie môže byť spojenie pozitívne ("priame") a negatívne ("inverzné"). Pri pozitívnej priamkovej korelácii vyššie hodnoty jedného znaku zodpovedajú vyšším hodnotám druhého a nižšie hodnoty jedného znaku zodpovedajú nižším hodnotám iného (obrázok 2). Pri negatívnej korelácii sú pomery obrátené (obrázok 3). Pri kladnej korelácii má korelačný koeficient kladné znamenie, s negatívnou koreláciou - negatívne znamienko.

Obrázok 2 - Priama korelácia

Obrázok 3 - Inverzná korelácia


Obrázok 4 - Nedostatok korelácie

Mieru, silu alebo tesnosť korelácie určuje hodnota korelačného koeficientu. Sila spojenia nezávisí od jeho smeru a je určená absolútnou hodnotou korelačného koeficientu.

1.2 Všeobecná klasifikácia korelácií

V závislosti od korelačného koeficientu sa rozlišujú tieto korelácie:

silný alebo tesný s korelačným koeficientom r> 0,70;

Priemer (pri 0,50

Mierne (o 0:30

Slabé (pri 0,20

Veľmi slabé (pre r<0,19).

1.3 Korelačné polia a účel ich konštrukcie

Korelácia je študovaná na základe experimentálnych údajov, ktorými sú namerané hodnoty (x i, y i) dvoch znakov. Ak je experimentálnych údajov málo, potom je bivariačná empirická distribúcia reprezentovaná ako dvojitý rad hodnôt x i a y i. V tomto prípade môže byť korelačná závislosť medzi znakmi opísaná rôznymi spôsobmi. Korešpondencia medzi argumentom a funkciou môže byť špecifikovaná tabuľkou, vzorcom, grafom atď.

Korelačná analýza, podobne ako iné štatistické metódy, je založená na použití pravdepodobnostných modelov, ktoré popisujú správanie sa skúmaných znakov v určitej všeobecnej populácii, z ktorej sa získavajú experimentálne hodnoty x i a y i. Keď sa skúma korelácia medzi kvantitatívnymi charakteristikami, ktorých hodnoty možno presne merať v jednotkách metrických mierok (metre, sekundy, kilogramy atď.), potom sa veľmi často používa model dvojrozmernej normálne rozloženej všeobecnej populácie. prijali. Takýto model zobrazuje vzťah medzi premennými x i a y i graficky vo forme lokusu bodov v pravouhlom súradnicovom systéme. Tento graf sa tiež nazýva bodový graf alebo korelačné pole.
Tento model dvojrozmerného normálneho rozdelenia (korelačné pole) vám umožňuje poskytnúť vizuálnu grafickú interpretáciu korelačného koeficientu, pretože rozdelenie v súhrne závisí od piatich parametrov: μ x, μ y - stredné hodnoty (matematické očakávania); σ x, σ y sú štandardné odchýlky náhodných premenných X a Y a p je korelačný koeficient, ktorý je mierou vzťahu medzi náhodnými premennými X a Y.
Ak p = 0, potom hodnoty x i, y i, získané z dvojrozmernej normálnej populácie, sa nachádzajú na grafe v súradniciach x, y v rámci oblasti ohraničenej kružnicou (obrázok 5, a). V tomto prípade neexistuje žiadna korelácia medzi náhodnými premennými X a Y a nazývajú sa nekorelované. Pre bivariačné normálne rozdelenie znamená nekorelácia súčasne nezávislosť náhodných premenných X a Y.

Štúdium objektívne existujúcich súvislostí medzi javmi je najdôležitejšou úlohou štatistiky. V procese štatistického výskumu závislostí sa odhaľujú vzťahy príčin a následkov medzi javmi. Kauzálne vzťahy sú také prepojenie javov a procesov, keď zmena jedného z nich – príčiny vedie k zmene druhého – účinku.

Znaky javov a procesov sú rozdelené do dvoch tried podľa ich významu pre štúdium vzťahu. Znaky, ktoré spôsobujú zmeny v iných súvisiacich znakoch, sa nazývajú faktoriál alebo len faktory. Znaky, ktoré sa menia pod vplyvom faktorových znakov, sa nazývajú efektívne .

V štatistike sa rozlišujú funkčné a stochastické (pravdepodobnostné) súvislosti javov a procesov:

  • Funkčné nazýva sa taký vzťah, v ktorom určitá hodnota atribútu faktora zodpovedá jednej hodnote efektívneho.
  • Ak sa kauzálna závislosť neprejavuje v každom jednotlivom prípade, ale vo všeobecnosti, v priemere s veľkým počtom pozorovaní, potom sa takáto závislosť nazýva stochastický (pravdepodobný) ... Korelácia je špeciálny prípad stochastického spojenia.

okrem toho klasifikujú sa súvislosti medzi javmi a ich znakmi mierou blízkosti, smerovania a analytického vyjadrenia.

Smerom k existujú priame a inverzné spojenia:

  • Priama komunikácia - ide o taký vzťah, v ktorom so zvýšením (poklesom) hodnôt atribútu faktora dôjde k zvýšeniu (poklesu) hodnôt efektívneho faktora. Takže napríklad zvýšenie produktivity práce prispieva k zvýšeniu úrovne ziskovosti výroby.
  • V prípade spätnej väzby hodnoty efektívneho atribútu sa pod vplyvom faktoriálu menia, ale v opačnom smere v porovnaní so zmenou faktoriálu. Takže so zvýšením úrovne návratnosti aktív sa náklady na jednotku produkcie znižujú.

Analytickým vyjadrením existujú priame (alebo jednoducho lineárne) a nelineárne spojenia:

  • Ak sa dá štatistický vzťah medzi javmi približne vyjadriť rovnicou priamky, potom sa volá linkový odkaz tvaru: y = a + bx.
  • Ak je možné spojenie vyjadriť rovnicou ľubovoľnej zakrivenej čiary (parabola, hyperbola atď.), potom sa takéto spojenie nazýva nelineárne (krivočiare) spojenie .

Komunikačná tesnosť ukazuje mieru vplyvu atribútu faktora na celkovú variáciu efektívneho atribútu. Klasifikácia komunikácie podľa stupňa blízkosti je uvedený v tabuľke 1.

Na identifikáciu prítomnosti spojenia, jeho povahy a smeru v štatistike sa používajú tieto metódy: prinášanie paralelných údajov, analytické zoskupenia, grafické, korelačné. Hlavnou metódou na štúdium štatistického vzťahu je štatistická komunikačné modelovanie založené na korelačnej a regresnej analýze .

Korelácia je štatistický vzťah medzi náhodnými premennými, ktorý nemá striktne funkčný charakter, v ktorom zmena jednej z náhodných premenných vedie k zmene matematického očakávania druhej. V štatistike je zvykom rozlišovať medzi nasledujúcimi typmi korelácie :

  • párová korelácia - vzťah medzi dvoma znakmi (efektívnym a faktoriálnym, alebo dvoma faktoriálmi);
  • parciálna korelácia - vzťah medzi efektívnou a jednou faktoriálovou charakteristikou s pevnou hodnotou ostatných faktorových charakteristík;
  • viacnásobná korelácia - závislosť efektívnych a dvoch alebo viacerých faktorových znakov zahrnutých do štúdie.

Úloha korelačnej analýzy je kvantitatívne určenie tesnosti vzťahu medzi dvoma znakmi (s párovým vzťahom) a medzi efektívnymi a súborom faktorových znakov (s multifaktoriálnym vzťahom).

Tesnosť vzťahu je kvantitatívne vyjadrená veľkosťou korelačných koeficientov, ktoré poskytujú kvantitatívnu charakteristiku tesnosti vzťahu medzi znakmi a umožňujú určiť „užitočnosť“ faktorových znakov pri konštrukcii viacnásobnej regresnej rovnice. .

Korelácia je prepojená s regresiou, keďže prvá hodnotí silu (tesnosť) štatistického vzťahu, druhá skúma jeho formu.

Regresná analýza je určiť analytické vyjadrenie vzťahu vo forme regresnej rovnice.

Regresia sa nazýva závislosť priemernej hodnoty náhodnej veličiny efektívneho ukazovateľa od veľkosti faktoriálu a regresná rovnica - rovnica opisujúca koreláciu medzi efektívnym znakom a jedným alebo viacerými faktoriálnymi znakmi.

Vzorce korelačnej-regresnej analýzy pre lineárny vzťah s párovou koreláciou sú uvedené v tabuľke 2.

Tabuľka 2 - Vzorce korelačno-regresnej analýzy pre priame spojenie s párovou koreláciou
IndexOznačenie a vzorec
Rovnica priamky pre párovú koreláciu y x = a + bx, kde b je regresný koeficient
Systém normálnych rovníc najmenších štvorcov na určenie koeficientov a a b
Lineárny korelačný koeficient na určenie tesnosti komunikácie,
jeho výklad:
r = 0 - žiadne spojenie;
0 -1 r = 1 - funkčné spojenie
Absolútna elasticita
Elasticita je relatívna

Príklady riešenia úloh na tému "Základy korelačnej analýzy"

Úloha 1 (analýza priameho vzťahu v párovej korelácii) ... K dispozícii sú údaje o kvalifikácii a mesačnom výkone piatich pracovníkov v dielni:

Na štúdium vzťahu medzi kvalifikáciou pracovníkov a ich produkciou určte rovnicu lineárneho vzťahu a korelačný koeficient. Poskytnite interpretáciu regresných a korelačných koeficientov.

Riešenie ... Rozšírime navrhovanú tabuľku.

Určme parametre rovnice priamky y x = a + bx... Aby sme to dosiahli, vyriešime systém rovníc:

Takže regresný koeficient je 18.

Keďže в je kladné číslo, existuje priama súvislosť medzi parametrami x a y.
a = 92-4 × 18
a = 20
Lineárna rovnica spojenia má tvar yx = 20 + 18x.

Na určenie tesnosti (pevnosti) vzťahu medzi študovanými znakmi určíme hodnotu korelačného koeficientu podľa vzorca:

= (2020-20 × 460/5) / (√10 × √3280) ≈ 180 / 181,11 = 0,99. Keďže korelačný koeficient je väčší ako 0,7, vzťah v tomto rade je silný.

Úloha 2 ... V podniku sa ceny produktov znížili z 80 rubľov. za jednotku až 60 rubľov. Po znížení cien sa predaj zvýšil zo 400 na 500 kusov za deň. Určte absolútnu a relatívnu elasticitu. Vykonajte posúdenie elasticity s cieľom možnosti (alebo nemožnosti) ďalšieho zníženia ceny.

Riešenie ... Vypočítajme ukazovatele, ktoré nám umožňujú vykonať predbežnú analýzu elasticity:

Ako vidíte, miera poklesu cien sa v absolútnej hodnote rovná rýchlosti rastu dopytu.

Absolútnu a relatívnu elasticitu nájdeme podľa vzorcov:

= (500-400) / (60-80) = 100 / (- 20) -5 - absolútna elasticita

= (100: 400) / (- 20:80) = -1 - relatívna elasticita

Modul relatívnej elasticity je 1. To potvrdzuje skutočnosť, že tempo rastu dopytu sa rovná rýchlosti poklesu cien. V takejto situácii vypočítame výnosy prijaté podnikom pred a po znížení ceny: 80 * 400 = 32 000 rubľov. za deň, 60 * 500 = 30 000 rubľov. za deň – ako vidíme, príjmy sa znížili a ďalšie znižovanie cien sa neodporúča.

Využitie štatistických metód pri spracovaní materiálov z psychologického výskumu poskytuje skvelú príležitosť vyťažiť užitočné informácie z experimentálnych dát. Jednou z najbežnejších štatistických metód je korelačná analýza.

Pojem „korelácia“ prvýkrát použil francúzsky paleontológ J. Cuvier, ktorý odvodil „zákon korelácie častí a orgánov zvierat“ (tento zákon umožňuje rekonštruovať vzhľad celého zvieraťa z nájdených častí telo). Tento pojem zaviedol do štatistiky anglický biológ a štatistik F. Galton (nie len „spojenie“ – vzťah a "ako spojenie" - korelácia).

Korelačná analýza je test hypotéz o vzťahoch medzi premennými pomocou korelačných koeficientov, dvojrozmernej deskriptívnej štatistiky, kvantitatívnej miery vzťahu (spoločnej variability) dvoch premenných. Ide teda o súbor metód na zisťovanie korelačnej závislosti medzi náhodnými premennými alebo znakmi.

Korelačná analýza pre dve náhodné premenné zahŕňa:

  • vytvorenie korelačného poľa a zostavenie korelačnej tabuľky;
  • výpočet výberových korelačných koeficientov a korelačných pomerov;
  • testovanie štatistickej hypotézy významnosti vzťahu.

Hlavným účelom korelačnej analýzy je identifikovať vzťah medzi dvoma alebo viacerými študovanými premennými, čo sa považuje za spoločnú konzistentnú zmenu dvoch študovaných charakteristík. Táto variabilita má tri hlavné charakteristiky: tvar, smer a pevnosť.

Forma korelácie môže byť lineárna alebo nelineárna. Lineárna forma je vhodnejšia na identifikáciu a interpretáciu korelácie. Pre lineárny korelačný vzťah možno rozlíšiť dva hlavné smery: pozitívny („priamy vzťah“) a negatívny („spätná väzba“).

Sila vzťahu priamo naznačuje, ako zreteľne sa prejavuje spoločná variabilita skúmaných premenných. Funkčný vzťah javov možno v psychológii empiricky odhaliť len ako pravdepodobnostný vzťah zodpovedajúcich znakov. Jasnú predstavu o povahe pravdepodobnostného vzťahu poskytuje bodový diagram - graf, ktorého osi zodpovedajú hodnotám dvoch premenných a každý subjekt je bod.

Ako numerická charakteristika pravdepodobnostného vzťahu sa používajú korelačné koeficienty, ktorých hodnoty sa pohybujú v rozmedzí od –1 do +1. Po vykonaní výpočtov výskumník spravidla vyberie len najsilnejšie korelácie, ktoré sa ďalej interpretujú (tabuľka 1).

Kritériom pre výber „dostatočne silných“ korelácií môže byť ako absolútna hodnota samotného korelačného koeficientu (od 0,7 do 1), tak aj relatívna hodnota tohto koeficientu, určená hladinou štatistickej významnosti (od 0,01 do 0,1), v závislosti na veľkosti vzorky. V malých vzorkách pre ďalšiu interpretáciu je správnejšie vybrať silné korelácie na základe hladiny štatistickej významnosti. Pre štúdie vykonávané na veľkých vzorkách je lepšie použiť absolútne hodnoty korelačných koeficientov.

Úloha korelačnej analýzy sa teda redukuje na určenie smeru (pozitívneho alebo negatívneho) a formy (lineárneho, nelineárneho) vzťahu medzi rôznymi znamienkami, meranie jeho tesnosti a nakoniec na kontrolu hladiny významnosti získaných korelačných koeficientov. .

V súčasnosti bolo vyvinutých mnoho rôznych korelačných koeficientov. Najpoužívanejšie sú r- Pirson, r-Speerman a τ -Kendall. Moderné počítačové štatistické programy v menu „Korelácie“ ponúkajú práve tieto tri koeficienty a na riešenie iných výskumných problémov sú navrhnuté metódy skupinového porovnávania.

Výber metódy výpočtu korelačného koeficientu závisí od typu škály, do ktorej premenné patria (Tabuľka 2).

Pre premenné s intervalom a s nominálnou stupnicou sa používa Pearsonov korelačný koeficient (korelácia momentov súčinov). Ak aspoň jedna z dvoch premenných má ordinálnu stupnicu alebo nie je normálne rozdelená, použije sa Spearmanova poradová korelácia, resp.

t-Kendall. Ak je jedna z dvoch premenných dichotomická, možno použiť bodovú dvojriadkovú koreláciu (v štatistickom počítačovom programe SPSS táto vlastnosť chýba, namiesto toho možno vypočítať poradovú koreláciu). V prípade, že sú obe premenné dichotomické, použije sa štvorpoľová korelácia (tento typ korelácie vypočíta SPSS na základe definície mier vzdialenosti a miery podobnosti). Výpočet korelačného koeficientu medzi dvoma nedichotomickými premennými je možný len vtedy, ak je vzťah medzi nimi lineárny (jednosmerný). Ak je spojenie napr. U-tvarovaný (nejednoznačný), korelačný koeficient nie je vhodný na použitie ako miera pevnosti väzby: jeho hodnota má tendenciu k nule.

Podmienky na uplatnenie korelačných koeficientov budú teda nasledovné:

  • premenné merané v kvantitatívnej (hodnotovej, metrickej) škále na tej istej vzorke objektov;
  • vzťah medzi premennými je monotónny.

Hlavná štatistická hypotéza, ktorá je testovaná korelačnou analýzou, je neusmernená a obsahuje tvrdenie o rovnosti korelácie k nule v bežnej populácii. H0: r xy= 0. Ak sa zamietne, prijme sa alternatívna hypotéza H 1: r xy≠ 0 o prítomnosti pozitívnej alebo negatívnej korelácie - v závislosti od znamienka vypočítaného korelačného koeficientu.

Na základe prijatia alebo odmietnutia hypotéz sa vyvodzujú zmysluplné závery. Ak podľa výsledkov štatistickej kontroly H0: r xy= 0 sa neodchyľuje na úrovni a, potom bude zmysluplný záver nasledovný: vzťah medzi X a Y nenájdené. Ak pri H 0 r xy= 0 sa odchyľuje na úrovni a, čo znamená, že medzi nimi bol zistený pozitívny (negatívny) vzťah X a Y... K interpretácii odhalených korelácií však treba pristupovať opatrne. Z vedeckého hľadiska jednoduché stanovenie vzťahu medzi dvoma premennými neznamená, že existuje kauzálny vzťah. Okrem toho prítomnosť korelácie nestanovuje sekvenčný vzťah medzi príčinou a následkom. Jednoducho to naznačuje, že tieto dve premenné spolu súvisia viac, ako by sa zhodou okolností očakávalo. Napriek tomu, s dodržaním opatrnosti, je použitie korelačných metód pri štúdiu vzťahov príčin a následkov plne opodstatnené. Vyhnite sa kategorickým frázam ako „premenná X je dôvodom zvýšenia ukazovateľa Y". Takéto tvrdenia by mali byť formulované ako predpoklady, ktoré musia byť prísne teoreticky podložené.

Podrobný popis matematického postupu pre každý korelačný koeficient je uvedený v učebniciach matematickej štatistiky; ; ; Obmedzíme sa na popis možnosti použitia týchto koeficientov v závislosti od typu meracej stupnice.

Korelácia metrických premenných

Ak chcete študovať vzťah dvoch metrických premenných nameraných na tej istej vzorke, použite korelačný koeficient r- Pirson... Samotný koeficient charakterizuje prítomnosť iba lineárneho vzťahu medzi znakmi, spravidla označený symbolmi X a Y... Koeficient lineárnej korelácie je parametrická metóda a jej správna aplikácia je možná iba vtedy, ak sú výsledky merania prezentované na stupnici intervalov a rozloženie hodnôt v analyzovaných premenných sa líši od normálneho až nevýznamného stupňa. Existuje veľa situácií, v ktorých je jeho použitie vhodné. Napríklad: vytvorenie spojenia medzi inteligenciou študenta a jeho akademickým výkonom; medzi náladou a úspechom pri vymanení sa z problémovej situácie; medzi úrovňou príjmu a temperamentom atď.

Pearsonov koeficient je široko používaný v psychológii a pedagogike. Napríklad v prácach I. Ya. Kaplunovicha a PD Rabinovicha, poslanca Nuzhdinu, bol na potvrdenie predložených hypotéz použitý výpočet Pearsonovho lineárneho korelačného koeficientu.

Pri „ručnom spracovaní“ údajov je potrebné vypočítať korelačný koeficient a následne určiť p- úroveň významnosti (na zjednodušenie overovania údajov sa používajú tabuľky kritických hodnôt r xy ktoré sa zostavujú pomocou tohto kritéria). Hodnota Pearsonovho lineárneho korelačného koeficientu nemôže presiahnuť +1 a byť menšia ako –1. Tieto dve čísla +1 a –1 sú hranice pre korelačný koeficient. Keď je výsledkom výpočtu hodnota väčšia ako +1 alebo menšia ako –1, znamená to, že sa vyskytla chyba výpočtu.

Pri výpočte na počítači štatistický program (SPSS, Statistica) doplní vypočítaný korelačný koeficient presnejšou hodnotou p-úroveň.

Pre štatistické rozhodnutie o prijatí alebo odmietnutí H 0 zvyčajne nastavený α = 0,05 a pre veľké množstvo pozorovaní (100 alebo viac) α = 0,01. Ak p < a, H0 vybočuje a robí zmysluplný záver, že medzi skúmanými premennými (pozitívnymi alebo negatívnymi – v závislosti od znamienka korelácie) bol zistený štatisticky spoľahlivý (významný) vzťah. Kedy p> a, H0 sa nezamieta, zmysluplný záver sa obmedzuje na konštatovanie, že vzťah (štatisticky významný) nebol zistený.

Ak sa nenájde žiadne spojenie, ale existuje dôvod domnievať sa, že spojenie existuje, mali by ste skontrolovať možné dôvody nespoľahlivosti spojenia.

Nelinearita komunikácie- na tento účel analyzujte dvojrozmerný bodový graf. Ak je vzťah nelineárny, ale monotónny, prejdite na hodnotiace korelácie. Ak vzťah nie je monotónny, potom rozdeľte vzorku na časti, v ktorých je vzťah monotónny, a vypočítajte korelácie samostatne pre každú časť vzorky, alebo rozdeľte vzorku do kontrastných skupín a potom ich porovnajte podľa úrovne závažnosti vlastnosť.

Prítomnosť odľahlých hodnôt a výrazná asymetria v distribúcii jednej alebo oboch vlastností. Aby ste to dosiahli, musíte sa pozrieť na histogramy rozdelenia frekvencií oboch znamení. Ak existujú odľahlé hodnoty alebo asymetrie, vylúčte odľahlé hodnoty alebo prejdite na hodnotiace korelácie.

Heterogenita vzorky(analyzujte 2D bodový graf). Skúste vzorku rozdeliť na časti, v ktorých môže mať vzťah rôzne smery.

Ak je vzťah štatisticky významný, potom pred zmysluplným záverom je potrebné vylúčiť možnosť falošnej korelácie:

  • spojenie je spôsobené emisiami... Ak existujú odľahlé hodnoty, prejdite na hodnotiace korelácie alebo vylúčte odľahlé hodnoty;
  • vzťah je spôsobený vplyvom tretej premennej... Ak k takémuto javu dôjde, je potrebné vypočítať koreláciu nielen pre celú vzorku, ale aj pre každú skupinu zvlášť. Ak je „tretia“ premenná metrická, vypočítajte čiastočnú koreláciu.

Parciálny korelačný koeficient r xy -z sa vypočíta, ak je potrebné skontrolovať predpoklad, že vzťah medzi dvoma premennými X a Y nezávisí od vplyvu tretej premennej Z... Veľmi často dve premenné navzájom korelujú len vďaka tomu, že obe sa pod vplyvom tretej premennej konzistentne menia. Inými slovami, v skutočnosti neexistuje žiadna súvislosť medzi zodpovedajúcimi vlastnosťami, ale prejavuje sa v štatistickom vzťahu pod vplyvom spoločnej príčiny. Napríklad vek môže byť častou príčinou variability dvoch premenných pri skúmaní vzťahu rôznych psychologických charakteristík vo vekovej skupine. Pri interpretácii parciálnej korelácie z kauzálneho hľadiska treba byť opatrný, pretože ak Z koreluje s X a s Y a čiastočná korelácia r xy -z je blízko nule, z toho nevyhnutne nevyplýva, že je Z je častým dôvodom X a Y.

Korelácia premenných poradia

Ak je korelačný koeficient neprijateľný pre kvantitatívne údaje r- Pirson, potom na testovanie hypotézy o vzťahu dvoch premenných po predbežnom zoradení možno použiť korelácie r- Speerman alebo τ -Kendall... Napríklad pri štúdiu psychofyzických charakteristík hudobne nadaných adolescentov I.A.Lavočkina sa použilo Spearmanovo kritérium.

Pre správny výpočet oboch koeficientov (Spearman a Kendall) musia byť výsledky merania prezentované v stupnici radov alebo intervalov. Medzi týmito kritériami nie sú žiadne zásadné rozdiely, ale všeobecne sa uznáva, že Kendallov koeficient je „zmysluplnejší“, pretože podrobnejšie a podrobnejšie analyzuje vzťahy medzi premennými, pričom skúma všetky možné zhody medzi pármi hodnôt. Spearmanov koeficient presnejšie zohľadňuje kvantitatívnu mieru vzťahu medzi premennými.

Spearmanov koeficient poradovej korelácie je neparametrickou obdobou klasického Pearsonovho korelačného koeficientu, pri jeho výpočte sa však berú do úvahy ukazovatele porovnávaných premenných (aritmetický priemer a rozptyl), nesúvisiace s rozdelením, ale poradie. Napríklad je potrebné určiť vzťah medzi hodnoteniami hodností osobnostných čŕt zahrnutých v predstave človeka o jeho „skutočnom ja“ a „ideálnom ja“.

Spearmanov koeficient je široko používaný v psychologickom výskume. Napríklad v práci Yu.V. Bushova a N.N.

Pretože tento koeficient je analógový r-Pirson, potom je jeho aplikácia na testovanie hypotéz podobná aplikácii koeficientu r- Pirson. To znamená, že testovateľná štatistická hypotéza, postup pri prijímaní štatistického rozhodnutia a formulácia zmysluplného záveru sú rovnaké. V počítačových programoch (SPSS, Statistica) sú hladiny významnosti pre rovnaké koeficienty r-Pirson a r-Špeciálne sú vždy rovnaké.

Výhoda kurzu r-Speerman verzus šance r-Pirson - citlivejší na komunikáciu. Používame ho v nasledujúcich prípadoch:

  • prítomnosť významnej odchýlky distribúcie aspoň jednej premennej od normálnej formy (asymetria, odľahlé hodnoty);
  • vzhľad krivočiareho (monotónneho) spojenia.

Obmedzenie pre uplatnenie koeficientu r- Špecialisti sú:

  • pre každú premennú aspoň 5 pozorovaní;
  • koeficient pre veľký počet rovnakých pozícií v jednej alebo oboch premenných dáva hrubú hodnotu.

Koeficient poradovej korelácie τ -Kendall je nezávislá originálna metóda založená na výpočte pomeru párov hodnôt dvoch vzoriek, ktoré majú rovnakú alebo rôznu tendenciu (rastúce alebo klesajúce hodnoty). Tento koeficient sa nazýva aj koeficient zhody... Hlavnou myšlienkou tejto metódy je teda to, že smer spojenia možno posúdiť párovým porovnaním subjektov medzi sebou: ak má pár subjektov zmenu v X sa zhoduje v smere so zmenou v Y, to naznačuje pozitívny vzťah, ak nie, negatívny vzťah, napríklad pri skúmaní osobných vlastností, ktoré sú rozhodujúce pre rodinnú pohodu. V tejto metóde je jedna premenná prezentovaná ako monotónna postupnosť (napríklad manželove údaje) vo vzostupnom poradí; inej premennej (napríklad údajom o manželke) sú priradené zodpovedajúce miesta v poradí. Počet inverzií (narušenie monotónnosti v porovnaní s prvým riadkom) sa používa vo vzorci pre korelačné koeficienty.

Pri počítaní τ- Kendall „ručne“ dáta najskôr zoradí podľa premennej X... Potom sa pri každom predmete spočíta, koľkokrát je jeho hodnosť podľa Y sa ukáže byť nižšia ako hodnosť subjektov, ktorí sú nižšie. Výsledok sa zaznamená do stĺpca "Zápasy". Súčet všetkých hodnôt v stĺpci „Zhoda“ je P- celkový počet zhôd sa dosadí do vzorca na výpočet Kendallovho koeficientu, ktorý je výpočtovo jednoduchší, ale s nárastom vzorky, na rozdiel od r-Speerman, objem výpočtov sa nezväčšuje proporcionálne, ale exponenciálne. Takže napríklad pre N= 12, treba vytriediť 66 dvojíc predmetov, a za N= 489 - už 1128 párov, to znamená, že objem výpočtov sa zvyšuje viac ako 17-krát. Pri výpočte na počítači v štatistickom programe (SPSS, Statistica) sa Kendallov koeficient počíta podobne ako koeficienty r-Speerman a r- Pirson. Vypočítaný korelačný koeficient τ -Kendall sa vyznačuje presnejšou hodnotou p-úroveň.

Kendallov koeficient sa uprednostňuje, ak zdrojové údaje obsahujú odľahlé hodnoty.

Charakteristickým znakom koeficientov poradovej korelácie je, že maximálne korelácie poradia modulo (+1, –1) nemusia nevyhnutne zodpovedať prísnym priamym alebo nepriamo úmerným vzťahom medzi počiatočnými premennými. X a Y: postačuje len monotónne funkčné spojenie medzi nimi. Rankové korelácie dosahujú svoju maximálnu hodnotu modulo, ak väčšia hodnota jednej premennej vždy zodpovedá väčšej hodnote inej premennej (+1), alebo väčšia hodnota jednej premennej vždy zodpovedá menšej hodnote inej premennej a naopak (–1 ).

Štatistická hypotéza, ktorá sa má testovať, postup pri prijímaní štatistického rozhodnutia a formulácia zmysluplného záveru sú rovnaké ako v prípade r-Rečník resp r- Pirson.

Ak sa nenájde štatisticky významný vzťah, ale existuje dôvod domnievať sa, že existuje, mali by ste najskôr prejsť z koeficientu

r-Reproduktor na koeficient τ -Kendall (alebo naopak) a potom skontrolujte možné dôvody nespoľahlivosti spojenia:

  • nelinearita komunikácie: Ak to chcete urobiť, pozrite si 2D bodový graf. Ak vzťah nie je monotónny, potom rozdeľte vzorku na časti, v ktorých je vzťah monotónny, alebo rozdeľte vzorku do kontrastných skupín a potom ich porovnajte podľa úrovne závažnosti znaku;
  • heterogenita vzorky: pozrite si graf dvojrozmerného rozptylu, skúste vzorku rozdeliť na časti, v ktorých môže mať vzťah rôzne smery.

Ak je vzťah štatisticky významný, potom pred zmysluplným záverom je potrebné vylúčiť možnosť falošnej korelácie (analogicky s metrickými korelačnými koeficientmi).

Korelácia dichotomických premenných

Pri porovnávaní dvoch premenných nameraných na dichotomickej škále je mierou korelácie takzvaný koeficient j, čo je korelačný koeficient pre dichotomické údaje.

Veľkosť koeficient φ leží medzi +1 a –1. Môže byť buď pozitívny alebo negatívny, charakterizujúci smer spojenia medzi dvoma dichotomicky meranými znakmi. Interpretácia φ však môže predstavovať špecifické problémy. Dichotomické údaje zahrnuté v schéme na výpočet koeficientu φ nevyzerajú ako dvojrozmerná normálna plocha, preto je nesprávne predpokladať, že interpretované hodnoty r xy= 0,60 a φ = 0,60 sú rovnaké. Koeficient φ možno vypočítať kódovacou metódou, ako aj pomocou takzvanej štvorpolovej tabuľky alebo kontingenčnej tabuľky.

Na uplatnenie korelačného koeficientu φ musia byť splnené tieto podmienky:

  • porovnávané vlastnosti by sa mali merať na dichotomickej škále;
  • X a Y by mala byť rovnaká.

Tento typ korelácie je vypočítaný v počítačovom programe SPSS na základe určenia mier vzdialenosti a miery podobnosti. Niektoré štatistické postupy, ako je faktorová analýza, zhluková analýza, multivariačné škálovanie, sú založené na aplikácii týchto mier a niekedy samotné poskytujú ďalšie možnosti na výpočet mier podobnosti.

V prípadoch, keď sa jedna premenná meria na dichotomickej škále (premenná X) a druhý na stupnici intervalov alebo pomerov (premenné Y) sa používa bisériový korelačný koeficient, napríklad pri testovaní hypotéz o vplyve pohlavia dieťaťa na ukazovateľ výšky a hmotnosti. Tento koeficient sa pohybuje v rozmedzí od –1 do +1, ale jeho znamienko nie je dôležité pre interpretáciu výsledkov. Ak ho chcete použiť, musíte dodržiavať nasledujúce podmienky:

  • porovnávané charakteristiky by sa mali merať na rôznych mierkach: jedna X- v dichotomickej mierke; ostatný Y- v stupnici intervalov alebo pomerov;
  • premenlivý Y má normálny distribučný zákon;
  • počet rôznych znakov v porovnávaných premenných X a Y by mala byť rovnaká.

Ak premenná X merané na dichotomickej škále a premenná Y v rebríčku hodností (premenná Y), môže byť použité poradovo-dvojsériový korelačný koeficient, ktorý úzko súvisí s τ-Kendall a vo svojej definícii používa pojmy koincidencia a inverzia. Interpretácia výsledkov je rovnaká.

Korelačná analýza pomocou počítačových programov SPSS a Statistica je jednoduchá a pohodlná operácia. Aby ste to urobili, po vyvolaní dialógového okna Bivariačné korelácie (Analyze> Correlate> Bivariate ...) je potrebné presunúť študované premenné do poľa Premenné a vybrať metódu, ktorou sa korelačný vzťah medzi premennými odhalí. Výstupný súbor obsahuje štvorcovú tabuľku (Korelácie) pre každé vypočítané kritérium. Každá bunka tabuľky obsahuje: hodnotu samotného korelačného koeficientu (Correlation Coefficient), štatistickú významnosť vypočítaného koeficientu Sig, počet subjektov.

Hlavička a bočný stĺpec výslednej korelačnej tabuľky obsahujú názvy premenných. Uhlopriečka (ľavý horný - pravý dolný roh) tabuľky pozostáva z jednotiek, pretože korelácia akejkoľvek premennej so sebou samým je maximálna. Stôl je symetrický okolo tejto uhlopriečky. Ak je v programe zaškrtnuté políčko "Označiť významné korelácie", potom sa vo výslednej tabuľke korelácií označia štatisticky významné koeficienty: na úrovni 0,05 a menej - jednou hviezdičkou (*) a na úrovni 0,01 - s dve hviezdičky (**).

Aby som to zhrnul: hlavným účelom korelačnej analýzy je identifikovať vzťah medzi premennými. Mierou vzťahu sú korelačné koeficienty, ktorých výber priamo závisí od typu škály, v ktorej sú premenné merané, počtu variujúcich sa znakov v porovnávaných premenných a distribúcie premenných. Korelácia medzi dvoma premennými neznamená, že medzi nimi existuje kauzálny vzťah. Hoci korelácia priamo nenaznačuje kauzalitu, môže byť kľúčom k príčine. Na jeho základe možno vytvárať hypotézy. V niektorých prípadoch má nedostatok korelácie hlbší vplyv na hypotézu príčinnej súvislosti. Nulová korelácia medzi dvoma premennými môže naznačovať, že neexistuje žiadny vplyv jednej premennej na druhú.

Zdieľajte to