Korrelatsioonikordaja analüüs. Korrelatsiooni- ja regressioonianalüüs Excelis: täitmisjuhised

Artiklis käsitletakse korrelatsiooni, korrelatsioonianalüüsi ja korrelatsioonikordaja definitsioone. Antakse korrelatsiooni määratlus ja selle peamised omadused.

  • Korrelatsioon ja regressioonanalüüs viljakustegurite uurimisel
  • Viljakustegurite hindamine Baškortostani Vabariigis

Teadlasi huvitab sageli, kuidas kaks või suur kogus muutujad ühes või mitmes uuringuvalimis. Näiteks võib sellist seost täheldada katseandmete riistvaralise töötlemise vea ja võrgu pinge tõusude suuruse vahel. Teine näide on andmesideühenduse võimsuse ja signaali-müra suhte vaheline seos.

Inglise loodusteadlane Francis Galton võttis 1886. aastal kasutusele termini "korrelatsioon", et kirjeldada seda tüüpi interaktsiooni olemust. Hiljem arenes tema õpilane Karl Pearson matemaatiline valem, mis võimaldab anda tunnuste korrelatsioonidele kvantitatiivse hinnangu.

Suuruste (tegurite, tunnuste) vahelised sõltuvused jagunevad kahte tüüpi: funktsionaalsed ja statistilised.

Funktsionaalsete sõltuvuste korral vastab ühe muutuja iga väärtus teise muutuja teatud väärtusele. Lisaks on kahe teguri funktsionaalne seos võimalik ainult tingimusel, et teine ​​suurus sõltub ainult esimesest ja ei sõltu ühestki teisest suurusest. Kui suurus sõltub paljudest teguritest, on funktsionaalne seos võimalik, kui esimene suurus ei sõltu muudest teguritest peale nende, mis sisalduvad määratud komplektis.

Statistilise sõltuvuse korral toob ühe suuruse muutumine kaasa muutuse teiste suuruste jaotuses, mis teatud tõenäosusega omandavad teatud väärtused.

Palju suuremat huvi pakub teine erijuhtum statistiline sõltuvus, kui mõne väärtuste vahel on seos juhuslikud muutujad teiste keskmise väärtusega, selle eripäraga, et igal üksikjuhul võib ükskõik milline omavahel seotud suurus võtta erinevaid väärtusi.

Sellist muutujate vahelist sõltuvust nimetatakse korrelatsiooniks või korrelatsiooniks.

Korrelatsioonianalüüs- meetod, mis võimaldab tuvastada seost mitme juhusliku muutuja vahel.

Korrelatsioonianalüüs lahendab kaks peamist probleemi:

  • Esimene ülesanne on määrata suhtlusvorm, s.o. asutamisel matemaatiline vorm, milles see suhe väljendub. See on väga oluline, sest alates õige valik Suhtlemise vorm sõltub omaduste vaheliste seoste uurimise lõpptulemusest.
  • Teine ülesanne on mõõta rahvast, s.o. tunnuste vahelise seose meetmed, et teha kindlaks antud teguri mõju määr tulemusele. See lahendatakse matemaatiliselt korrelatsioonivõrrandi parameetrite määramisega.

Seejärel hinnatakse ja analüüsitakse saadud tulemusi korrelatsioonimeetodi spetsiaalsete indikaatorite (määramiskoefitsiendid, lineaarne ja mitmekordne korrelatsioon jne) abil, samuti kontrollitakse uuritavate tunnuste vahelise seose olulisust.

Korrelatsioonanalüüsi meetoditega lahendatakse järgmised ülesanded:

  1. Suhe. Kas parameetrite vahel on seos?
  2. Prognoosimine. Kui ühe parameetri käitumine on teada, siis saab ennustada ka teise parameetri käitumist, mis korreleerub esimesega.
  3. Objektide klassifitseerimine ja identifitseerimine. Korrelatsioonianalüüs aitab valida klassifitseerimiseks sõltumatute tunnuste komplekti.

Korrelatsioon on statistiline seos kahe või enama juhusliku muutuja vahel (või väärtuste vahel, mida võib selliseks pidada teatud vastuvõetava täpsusega). Selle olemus seisneb selles, et kui ühe muutuja väärtus muutub, toimub teise muutuja loomulik muutus (vähenemine või suurenemine).

Korrelatsioonikordaja abil määratakse kindlaks, kas kahe omaduse vahel on seos.

Korrelatsioonikordaja p jaoks elanikkonnast, on reeglina teadmata, seetõttu hinnatakse seda eksperimentaalsete andmete põhjal, mis on n väärtuspaarist (x i, y i) koosnev valim, mis on saadud kahe karakteristiku X ja Y ühisel mõõtmisel. Korrelatsioonikoefitsient määratakse näidisandmete põhjal. nimetatakse valimi korrelatsioonikordajaks (või lihtsalt korrelatsioonikordajaks). Tavaliselt tähistatakse seda sümboliga r.

Korrelatsioonikordaja peamised omadused on järgmised:

  1. Korrelatsioonikordajatega saab iseloomustada ainult lineaarseid seoseid, s.t. need, mida väljendatakse lineaarfunktsiooni võrrandiga. Kui erinevate omaduste vahel on mittelineaarne seos, tuleks kasutada muid ühenduse indikaatoreid.
  2. Korrelatsioonikoefitsientide väärtused on abstraktsed arvud vahemikus -1 kuni +1, st. -1< r < 1.
  3. Karakteristikute sõltumatu varieerumisega, kui nende vahel puudub seos, on r = 0.
  4. Positiivse või otsese seose korral, kui ühe tunnuse väärtuste suurenemisega suurenevad teise väärtused, omandab korrelatsioonikoefitsient positiivse (+) märgi ja jääb vahemikku 0 kuni +1, s.o. 0< r < 1.
  5. Negatiivse või pöördvõrdelise seose korral, kui ühe tunnuse väärtuste suurenemisega kahanevad teise tunnuse väärtused vastavalt, kaasneb korrelatsioonikoefitsiendiga negatiivne (–) märk ja see jääb vahemikku 0 kuni –1, s.o. -1< r <0.
  6. Mida tugevam on seos tunnuste vahel, seda lähemal on korrelatsioonikordaja ô1ô-le. Kui r = ± 1, siis muutub korrelatsioonisuhe funktsionaalseks, s.t. Iga atribuudi X väärtus vastab atribuudi Y ühele või mitmele rangelt määratletud väärtusele.
  7. Karakteristikutevahelise korrelatsiooni usaldusväärsust ei saa hinnata ainult korrelatsioonikordajate suuruse järgi. See parameeter sõltub vabadusastmete arvust k = n –2, kus: n on indikaatorite X ja Y korrelatsioonipaaride arv. Mida suurem on n, seda suurem on seose usaldusväärsus sama korrelatsioonikordaja väärtuse juures .

Korrelatsioonikoefitsient arvutatakse järgmise valemi abil:

kus x on faktori tunnuse väärtus; y - saadud atribuudi väärtus; n - andmepaaride arv.

Korrelatsiooni uuritakse eksperimentaalsete andmete alusel, milleks on kahe tunnuse x,y mõõdetud väärtused x i ,y i. Kui eksperimentaalseid andmeid on suhteliselt vähe, esitatakse kahemõõtmeline empiiriline jaotus väärtuste x i , y i topeltreana. Samas saab tunnuste vahelist korrelatsioonisõltuvust kirjeldada erinevalt. Argumendi ja funktsiooni vastavust saab anda tabeli, valemi, graafiku vms abil.

Kui uuritakse korrelatsiooni kvantitatiivsete tunnuste vahel, mille väärtusi saab täpselt mõõta meeterskaala ühikutes, võetakse väga sageli kasutusele kahe muutujaga normaalselt jaotatud populatsioonimudel. Selline mudel kuvab muutujate x ja y vahelisi seoseid graafiliselt punktide geomeetrilise asukoha kujul ristkülikukujulises koordinaatsüsteemis. Seda graafilist seost nimetatakse hajuvusgraafikuks või korrelatsiooniväljaks.

See kahemõõtmelise normaaljaotuse mudel (korrelatsiooniväli) võimaldab anda korrelatsioonikordaja selge graafilise tõlgenduse, kuna Jaotus sõltub ühiselt viiest parameetrist:

  • väärtuste x,y matemaatilised ootused E[x], E[y];
  • standardhälbed px, py juhuslike suuruste x,y ;
  • korrelatsioonikordaja p, mis on juhuslike suuruste x ja y vahelise seose mõõt. Toome näiteid korrelatsiooniväljade kohta.

Kui p = 0, siis kahemõõtmelisest normaalpopulatsioonist saadud väärtused x i ,y i asuvad graafikul ringiga piiratud alal. Sellisel juhul puudub korrelatsioon juhuslike suuruste x ja y vahel ning neid nimetatakse korreleerimata. Kahe muutujaga normaaljaotuse korral tähendab mittekorrelatsioon samaaegselt juhuslike suuruste x ja y sõltumatust.

Kui p = 1 või p = -1, siis räägime täielikust korrelatsioonist ehk juhuslike suuruste x ja y vahel on lineaarne funktsionaalne sõltuvus.

Kui p = 1, määravad x i,y i väärtused positiivse kaldega sirgjoonel asuvad punktid (x i suurenemisega suurenevad ka y i väärtused).

Vahepealsetel juhtudel, kui -1< p <1, определяемые значениями x i ,y i точки попадают в область, ограниченную некоторым эллипсом, причём при p>0 on positiivne korrelatsioon (x suurenemisega kipuvad y väärtused üldiselt suurenema), kusjuures p<0 корреляция отрицательная. Чем ближе p к ±1, тем уже эллипс и тем теснее точки, определяемые экспериментальными значениями, группируются около прямой линии.

Siin peaksite pöörama tähelepanu asjaolule, et joon, mida mööda punktid on rühmitatud, võib olla mitte ainult sirge, vaid ka mis tahes muu kujuga: parabool, hüperbool jne. Sel juhul arvestatakse mittelineaarset korrelatsiooni.

Tunnuste vahelist korrelatsioonisõltuvust saab kirjeldada erinevalt, eelkõige saab mis tahes seose vormi väljendada üldvõrrandiga y=f(x), kus tunnus y on sõltuv muutuja või sõltumatu muutuja x funktsioon, nimetatakse argumendiks.

Seega aitab korrelatsioonivälja visuaalne analüüs määrata mitte ainult statistilise seose olemasolu (lineaarne või mittelineaarne) uuritavate tunnuste vahel, vaid ka selle lähedust ja kuju.

Korrelatsiooniseose uurimisel on oluliseks analüüsivaldkonnaks seose läheduse määramine. Kahe tunnuse vahelise seose lähedusastme mõiste tekib sellest, et tegelikkuses mõjutavad sellest tuleneva tunnuse muutumist paljud tegurid. Sel juhul saab ühe teguri mõju väljendada märgatavamalt ja selgemalt kui teiste tegurite mõju. Tingimuste muutudes võib otsustava teguri roll nihkuda mõnele teisele tunnusele.

Seoste statistilisel uurimisel võetakse reeglina arvesse ainult peamisi tegureid. Samuti hinnatakse seose läheduse astet arvestades selle konkreetse seose täpsema uurimise vajadust ja praktilise kasutamise olulisust.

Üldiselt võimaldavad teadmised korrelatsiooni tiheduse kvantitatiivsest hindamisest lahendada järgmise küsimuste rühma:

  • vajadus selle märkidevahelise seose ja selle praktilise rakendamise teostatavuse põhjaliku uurimise järele;
  • seose avaldumise erinevuste määr konkreetsetes tingimustes (seoste läheduse hinnangu võrdlemine erinevate tingimuste puhul);
  • suuremate ja väiksemate tegurite tuvastamine antud konkreetsetes tingimustes järjestikuse kaalumise ja tunnuse võrdlemise teel erinevate teguritega.

Ühenduse läheduse indikaatorid peavad vastama mitmele põhinõudele:

  • seose läheduse näitaja väärtus peaks olema võrdne nulliga või nullilähedane, kui uuritavate tunnuste (protsesside, nähtuste) vahel seos puudub;
  • kui uuritavate tunnuste vahel on funktsionaalne seos, peaks seose tiheduse näitaja väärtus olema võrdne ühega;
  • kui tunnuste vahel on korrelatsioon, tuleks seose tiheduse näitaja absoluutväärtust väljendada korraliku murdena, mis on väärtuselt suurem, mida tihedam on uuritavate tunnuste seos (kipub ühtsusele).

Korrelatsioonisõltuvuse määravad erinevad parameetrid, mille hulgas on enim kasutatavad kahe juhusliku muutuja vahelist seost iseloomustavad paarisnäitajad: kovariatsioonikordaja (korrelatsioonimoment) ja lineaarne korrelatsioonikordaja (Pearsoni korrelatsioonikordaja).

Ühenduse tugevuse määrab ühenduse tiheduse indikaatori absoluutväärtus ja see ei sõltu ühenduse suunast.

Sõltuvalt korrelatsioonikordaja p absoluutväärtusest jagatakse tunnustevahelised korrelatsioonid tugevuse järgi järgmiselt:

  • tugev või tihe (p >0,70 juures);
  • keskmine (0,50< p <0,69);
  • mõõdukas (kell 0.30< p <0,49);
  • nõrk (0.20< p <0,29);
  • väga nõrk (lk<0,19).

Korrelatsiooni vorm võib olla lineaarne või mittelineaarne.

Näiteks võib seos õpilase koolitustaseme ja lõplike tunnistuse hinnete vahel olla lineaarne. Mittelineaarse seose näiteks on motivatsiooni tase ja antud ülesande täitmise efektiivsus. (Motivatsiooni kasvades tõuseb esmalt ülesande täitmise efektiivsus, seejärel saavutatakse teatud motivatsioonitasemel maksimaalne efektiivsus; edasise motivatsiooni tõusuga kaasneb aga efektiivsuse langus.)

Suunamisel võib korrelatsioonisuhe olla positiivne (otsene) ja negatiivne (pöördvõrdeline).

Positiivse lineaarse korrelatsiooni korral vastavad ühe tunnuse kõrgemad väärtused teise suurematele väärtustele ja ühe tunnuse madalamad väärtused vastavad teise madalamatele väärtustele. Negatiivse korrelatsiooni korral on suhted vastupidised.

Korrelatsioonikordaja märk sõltub korrelatsiooni suunast: positiivse korrelatsiooni korral on korrelatsioonikordaja positiivse märgiga, negatiivse korrelatsiooniga negatiivse märgiga.

Bibliograafia

  1. Ableeva, A. M. Hindamisvahendite fondi moodustamine föderaalse osariigi haridusstandardi tingimustes [tekst] / A. M. Ableeva, G. A. Salimova // Sotsiaal-, humanitaar-, loodusteaduste ja tehniliste erialade õpetamise aktuaalsed probleemid kõrgkoolide moderniseerimise kontekstis haridus: materjalid rahvusvaheline teadus- ja metoodiline konverents, 4.-5. aprill 2014 / Baškiiri Riiklik Põllumajandusülikool, Infotehnoloogia- ja juhtimisteaduskond. - Ufa, 2014. - lk 11-14.
  2. Ganieva, A.M. Tööhõive ja tööpuuduse statistiline analüüs [Tekst] / A.M. Ganieva, T.N. Lubova // Majandusstatistilise uurimistöö ja infotehnoloogia päevakajalised küsimused: artiklite kogumik. teaduslik Art.: pühendatud 40. aastapäevale majandusteaduse statistika ja infosüsteemide osakonna loomisest / Baškiiri Riiklik Põllumajandusülikool. - Ufa, 2011. - lk 315-316.
  3. Ismagilov, R. R. Loominguline rühm - tõhus vorm teadusuuringute korraldamiseks kõrghariduses [Tekst] / R. R. Ismagilov, M. Kh. Urazlin, D. R. Islamgulov // Piirkonna teaduslikud, tehnilised ja teaduslik-hariduslikud kompleksid: probleemid ja arenguväljavaated: teaduslik-praktilise konverentsi materjalid / Valgevene Vabariigi Teaduste Akadeemia, UGATU. - Ufa, 1999. - lk 105-106.
  4. Islamgulov, D.R. Pädevuspõhine lähenemine õpetamisele: hariduse kvaliteedi hindamine [Tekst] / D.R. Islamgulov, T.N. Lubova, I.R. Islamgulova // Kaasaegne teadusbülletään. – 2015. – T. 7. – nr 1. – Lk 62-69.
  5. Islamgulov, D. R. Üliõpilaste uurimistöö on põllumajandusülikooli spetsialistide koolitamise kõige olulisem element [Tekst] / D. R. Islamgulov // Üliõpilaste praktilise koolituse probleemid ülikoolis praegusel etapil ja nende lahendamise viisid: kogumine. materjaliteaduslik meetod. Conf., 24. aprill 2007 / Baškiiri Riiklik Põllumajandusülikool. - Ufa, 2007. - lk 20-22.
  6. Lubova, T.N. Föderaalse osariigi haridusstandardi rakendamise aluseks on pädevuspõhine lähenemine [Tekst] / T.N. Lubova, D.R. Islamgulov, I.R. Islamgulova // BODEST RESEARCH - 2016: Materjalid XII rahvusvahelisele teadus- ja praktilisele konverentsile, 15.-22. veebruar 2016. - Sofia: Byal GRAD-BG OOD, 2016. - 4. köide Pedagoogikateadused. – lk 80-85.
  7. Lubova, T.N. Uued haridusstandardid: rakendusfunktsioonid [Tekst] / T.N. Lubova, D.R. Islamgulov // Kaasaegne teadusbülletään. – 2015. – T. 7. – nr 1. – Lk 79-84.
  8. Lubova, T.N. Õpilaste iseseisva töö korraldus [Tekst] / T.N. Lubova, D.R. Islamgulov // Kõrghariduse haridusprogrammide rakendamine föderaalse osariigi kõrghariduse haridusstandardi raames: ülevenemaalise teadus- ja metoodikakonverentsi materjalid riikliku meditsiininõukogu keskkonnajuhtimise ja veemajanduse külastuskoosoleku raames föderaalse haridusasutuse kasutamine kõrgharidussüsteemis. / Baškiiri Riiklik Põllumajandusülikool. - Ufa, 2016. - lk 214-219.
  9. Lubova, T.N. Föderaalse osariigi haridusstandardi rakendamise aluseks on pädevuspõhine lähenemine [Tekst] / T.N. Lubova, D.R. Islamgulov, I.R. Islamgulova // Kaasaegne teadusbülletään. – 2015. – T. 7. – nr 1. – Lk 85-93.
  10. Saubanova, L.M. Demograafiline koormustase [tekst] / L.M. Saubanova, T.N. Lubova // Majandusstatistilise uurimistöö ja infotehnoloogia päevakajalised küsimused: artiklite kogumik. teaduslik Art.: pühendatud 40. aastapäevale majandusteaduse statistika ja infosüsteemide osakonna loomisest / Baškiiri Riiklik Põllumajandusülikool. - Ufa, 2011. - Lk 321-322.
  11. Fakhrullina, A.R. Inflatsiooni statistiline analüüs Venemaal [Tekst] / A.R. Fakhrullina, T.N. Lubova // Majandusstatistilise uurimistöö ja infotehnoloogia päevakajalised küsimused: artiklite kogumik. teaduslik Art.: pühendatud 40. aastapäevale majandusteaduse statistika ja infosüsteemide osakonna loomisest / Baškiiri Riiklik Põllumajandusülikool. - Ufa, 2011. - lk 323-324.
  12. Farkhutdinova, A.T. Tööturg Baškortostani Vabariigis 2012. aastal [Elektrooniline ressurss] / A.T. Farkhutdinova, T.N. Lubova // Üliõpilaste teadusfoorum. V rahvusvahelise üliõpilaste elektroonilise teaduskonverentsi materjalid: elektrooniline teaduskonverents (elektrooniline kogu). Venemaa loodusteaduste akadeemia. 2013. aasta.

Korrelatsioonianalüüs

Korrelatsioon– statistiline seos kahe või enama juhusliku muutuja vahel (või muutujate vahel, mida võib selliseks pidada teatud vastuvõetava täpsusastmega). Veelgi enam, muutused ühes või mitmes sellises koguses põhjustavad süstemaatilist muutust teises või muudes suurustes. Kahe juhusliku muutuja vahelise korrelatsiooni matemaatiline mõõt on korrelatsioonikordaja.

Korrelatsioon võib olla positiivne ja negatiivne (võimalik on ka, et statistiline seos puudub – näiteks sõltumatute juhuslike suuruste puhul). Negatiivne korrelatsioon - korrelatsioon, kus ühe muutuja suurenemine on seotud teise muutuja vähenemisega ja korrelatsioonikordaja on negatiivne. Positiivne korrelatsioon - korrelatsioon, kus ühe muutuja suurenemine on seotud teise muutuja suurenemisega ja korrelatsioonikordaja on positiivne.

Autokorrelatsioon - statistiline seos sama jada juhuslike muutujate vahel, kuid võetud nihkega, näiteks juhusliku protsessi jaoks - ajalise nihkega.

Lase X,Y- kaks juhuslikku muutujat, mis on määratletud ühes tõenäosusruumis. Seejärel antakse nende korrelatsioonikordaja valemiga:

,

kus cov tähistab kovariatsiooni ja D on dispersioon või samaväärne

,

kus sümbol tähistab matemaatilist ootust.

Sellise seose graafiliseks esitamiseks võite kasutada ristkülikukujulist koordinaatsüsteemi, mille teljed vastavad mõlemale muutujale. Iga väärtuste paar on tähistatud konkreetse sümboliga. Seda graafikut nimetatakse hajuvusdiagrammiks.

Korrelatsioonikordaja arvutamise meetod sõltub skaala tüübist, millesse muutujad kuuluvad. Seega on intervall- ja kvantitatiivse skaalaga muutujate mõõtmiseks vaja kasutada Pearsoni korrelatsioonikordajat (produktihetke korrelatsioon). Kui vähemalt üks kahest muutujast on järguskaalal või ei ole normaalselt jaotunud, tuleb kasutada Spearmani auaste korrelatsiooni või Kendali τ (tau). Juhul, kui üks kahest muutujast on dihhotoomne, kasutatakse punkt-biseeria korrelatsiooni ja kui mõlemad muutujad on dihhotoomilised: neljavälja korrelatsiooni. Kahe mittedihhotoomse muutuja vahelise korrelatsioonikordaja arvutamine on mõttekas ainult siis, kui nendevaheline seos on lineaarne (ühesuunaline).

Kendelli korrelatsioonikordaja

Kasutatakse vastastikuse häire mõõtmiseks.

Spearmani korrelatsioonikordaja

Korrelatsioonikordaja omadused

kui võtta kahe juhusliku suuruse skalaarkorrutiseks kovariatsioon, siis on juhusliku suuruse norm võrdne ja Cauchy-Bunyakovsky ebavõrdsuse tagajärg on: . , Kus. Veelgi enam, antud juhul märgid ja k kokku sobima: .

Korrelatsioonianalüüs

Korrelatsioonianalüüs- statistiliste andmete töötlemise meetod, mis seisneb koefitsientide uurimises ( korrelatsioonid) muutujate vahel. Sel juhul võrreldakse ühe või mitme tunnusepaari vahelisi korrelatsioonikoefitsiente, et teha kindlaks nendevahelised statistilised seosed.

Sihtmärk korrelatsioonianalüüs- anda teavet ühe muutuja kohta, kasutades teist muutujat. Juhtudel, kui eesmärki on võimalik saavutada, öeldakse, et muutujad on korreleerima. Kõige üldisemal kujul tähendab korrelatsiooni hüpoteesi aktsepteerimine seda, et muutuja A väärtuse muutus toimub samaaegselt B väärtuse proportsionaalse muutumisega: kui mõlemad muutujad suurenevad, siis korrelatsioon on positiivne, kui üks muutuja suureneb ja teine ​​väheneb, korrelatsioon on negatiivne.

Korrelatsioon peegeldab ainult väärtuste lineaarset sõltuvust, kuid ei kajasta nende funktsionaalset ühenduvust. Näiteks kui arvutate koguste vahelise korrelatsioonikoefitsiendi A = sin(x) Ja B = cos(x) , siis on see nullilähedane, st koguste vahel puudub sõltuvus. Samal ajal on suurused A ja B seaduse järgi ilmselgelt funktsionaalselt seotud sin 2 (x) + cos 2 (x) = 1 .

Korrelatsioonianalüüsi piirangud

Paaride (x,y) jaotuste graafikud koos vastavate korrelatsioonikordajatega x ja y igaühe jaoks. Pange tähele, et korrelatsioonikoefitsient peegeldab lineaarset seost (ülemine rida), kuid ei kirjelda seose kõverat (keskjoont) ja ei sobi üldse keerukate mittelineaarsete seoste kirjeldamiseks (alumine rida).

  1. Rakendamine on võimalik, kui uurimiseks on piisav arv juhtumeid: konkreetse tüübi puhul on korrelatsioonikordaja vahemikus 25 kuni 100 vaatluspaari.
  2. Teine piirang tuleneb korrelatsioonianalüüsi hüpoteesist, mis hõlmab muutujate lineaarne sõltuvus. Paljudel juhtudel, kui seose olemasolu on usaldusväärselt teada, ei pruugi korrelatsioonianalüüs anda tulemusi lihtsalt seetõttu, et seos on mittelineaarne (väljendatuna näiteks paraboolina).
  3. Ainuüksi korrelatsiooni fakt ei anna alust väita, milline muutujatest eelneb või põhjustab muutusi, ega seda, et muutujad on üksteisega üldiselt põhjuslikus seoses, näiteks mõne kolmanda teguri toime tõttu.

Kasutusala

See statistiliste andmete töötlemise meetod on majandus- ja sotsiaalteadustes (eriti psühholoogias ja sotsioloogias) väga populaarne, kuigi korrelatsioonikoefitsientide rakendusala on lai: tööstustoodete kvaliteedikontroll, metallurgia, agrokeemia, hüdrobioloogia, biomeetria ja teised.

Meetodi populaarsus on tingitud kahest asjaolust: korrelatsioonikoefitsiente on suhteliselt lihtne arvutada ning nende kasutamine ei nõua erilist matemaatilist ettevalmistust. Koos tõlgendamise lihtsusega on koefitsiendi kohaldamise lihtsus kaasa toonud selle laialdase kasutamise statistilise andmeanalüüsi valdkonnas.

Vale korrelatsioon

Tihti innustab korrelatsiooniuuringute ahvatlev lihtsus uurijat tegema valesid intuitiivseid järeldusi tunnuste paaride vahelise põhjuse-tagajärje seose olemasolu kohta, samas kui korrelatsioonikordajad loovad vaid statistilisi seoseid.

Sotsiaalteaduste kaasaegses kvantitatiivses metoodikas on tegelikult loobutud katsetest luua empiiriliste meetodite abil põhjus-tagajärg seoseid vaadeldavate muutujate vahel. Seega, kui sotsiaalteaduste teadlased räägivad uuritavate muutujate vaheliste seoste loomisest, eeldatakse kas üldist teoreetilist eeldust või statistilist sõltuvust.

Vaata ka

Wikimedia sihtasutus. 2010. aasta.

Vaadake, mis on "korrelatsioonianalüüs" teistes sõnaraamatutes:

    Vt KORRELAATSIOONANALÜÜS. Antinazi. Sotsioloogia entsüklopeedia, 2009 ... Sotsioloogia entsüklopeedia

    Matemaatilise statistika haru, mis ühendab praktilisi meetodeid korrelatsiooni uurimiseks kahe (või enama) juhusliku tunnuse või teguri vahel. Vaata Korrelatsioon (matemaatilises statistikas)... Suur entsüklopeediline sõnaraamat

    KORRELAATSIOONANALÜÜS, matemaatilise statistika osa, mis ühendab praktilisi meetodeid kahe (või enama) juhusliku tunnuse või teguri vahelise korrelatsiooni uurimiseks. Vt Korrelatsioon (vt KORRELATION (vastastikune suhe ... entsüklopeediline sõnaraamat

    Korrelatsioonianalüüs- (majandusteaduses) matemaatilise statistika haru, mis uurib muutuvate suuruste vahelisi seoseid (korrelatsioon on suhe, ladinakeelsest sõnast correlatio). Suhe võib olla täielik (st funktsionaalne) ja mittetäielik,... ... Majandus- ja matemaatikasõnastik

    korrelatsioonianalüüs- (psühholoogias) (ladinakeelsest sõnast correlatio ratio) statistiline meetod uuritavate tunnuste või tegurite seose vormi, märgi ja läheduse hindamiseks. Ühenduse vormi määramisel võetakse arvesse selle lineaarsust või mittelineaarsust (st nagu keskmiselt... ... Suurepärane psühholoogiline entsüklopeedia

    korrelatsioonianalüüs- - [L.G. Sumenko. Inglise-vene infotehnoloogia sõnaraamat. M.: Riigiettevõte TsNIIS, 2003.] Teemad infotehnoloogia üldiselt EN korrelatsioonianalüüs ... Tehniline tõlkija juhend

    korrelatsioonianalüüs- koreliacinės analizės statusas T valdkond Kūno kultūra ir sporto apibrėžtis Statistikos metodas, kuriuo įvertinami tiriamųjų asmenų, reiškinių või faktorių santykiai. vastavusmenys: engl. korrelatsiooniuuringud vok. Analyze der Correlation, f;… … Sporto terminų žodynas

    Matemaatilisel korrelatsiooniteoorial põhinevate meetodite kogum (vt korrelatsioon) kahe juhusliku tunnuse või teguri vahelise korrelatsiooni tuvastamiseks. K. a. eksperimentaalsed andmed hõlmavad järgmist ... ... Suur Nõukogude entsüklopeedia

    Matemaatika osa statistika, kombineerides praktilist Korrelatiivsed uurimismeetodid. kahe (või enama) juhusliku tunnuse või teguri vahelised sõltuvused. Vaata korrelatsiooni... Suur entsüklopeediline polütehniline sõnaraamat

KURSUSETÖÖ

Teema: Korrelatsioonianalüüs

Sissejuhatus

1. Korrelatsioonianalüüs

1.1 Korrelatsiooni mõiste

1.2 Korrelatsioonide üldine klassifikatsioon

1.3 Korrelatsiooniväljad ja nende ehitamise eesmärk

1.4 Korrelatsioonianalüüsi etapid

1.5 Korrelatsioonikordajad

1.6 Normaliseeritud Bravais-Pearson korrelatsioonikordaja

1.7 Spearmani järgu korrelatsioonikordaja

1.8 Korrelatsioonikordajate põhiomadused

1.9 Korrelatsioonikordajate olulisuse kontrollimine

1.10 Paari korrelatsioonikordaja kriitilised väärtused

2. Mitmefaktorilise eksperimendi planeerimine

2.1 Probleemi seisund

2.2 Planeeringu keskpunkti (põhitase) ja faktorite variatsiooni taseme määramine

2.3 Planeeringu maatriksi koostamine

2.4 Dispersiooni homogeensuse ja mõõtmise samaväärsuse kontrollimine erinevates seeriates

2.5 Regressioonivõrrandi koefitsiendid

2.6 Reprodutseeritavuse dispersioon

2.7 Regressioonivõrrandi kordajate olulisuse kontrollimine

2.8 Regressioonivõrrandi adekvaatsuse kontrollimine

Järeldus

Bibliograafia

SISSEJUHATUS

Eksperimentaalne planeerimine on matemaatiline ja statistiline distsipliin, mis uurib meetodeid eksperimentaalse uurimistöö ratsionaalseks korraldamiseks - uuritavate tegurite optimaalsest valikust ja tegeliku katseplaani määramisest vastavalt selle eesmärgile kuni tulemuste analüüsimeetoditeni. Eksperimentide planeerimine sai alguse inglise statistiku R. Fisheri (1935) töödest, kes rõhutasid, et ratsionaalne eksperimentaalne planeerimine ei anna hinnangute täpsuses vähem olulist kasu kui mõõtmistulemuste optimaalne töötlemine. 20. sajandi 60. aastatel tekkis kaasaegne eksperimentaalse planeerimise teooria. Tema meetodid on tihedalt seotud funktsioonide lähendamise teooria ja matemaatilise programmeerimisega. Ehitati optimaalsed plaanid ja uuriti nende omadusi laia mudeliklassi jaoks.

Katse planeerimine on kindlaksmääratud nõuetele vastava katseplaani valimine, katsestrateegia väljatöötamisele suunatud tegevuste kogum (alates a priori teabe hankimisest kuni toimiva matemaatilise mudeli saamiseni või optimaalsete tingimuste määramiseni). See on eksperimendi sihipärane juhtimine, mis viiakse ellu uuritava nähtuse mehhanismi mittetäielike teadmiste tingimustes.

Mõõtmiste, hilisema andmetöötluse, aga ka tulemuste matemaatilise mudeli vormistamisel tekivad vead ja osa algandmetes sisalduvast infost läheb kaduma. Eksperimentaalsete planeerimismeetodite kasutamine võimaldab määrata matemaatilise mudeli vea ja hinnata selle adekvaatsust. Kui mudeli täpsus osutub ebapiisavaks, siis eksperimentaalsete planeerimismeetodite kasutamine võimaldab matemaatilist mudelit kaasajastada lisakatsetega ilma eelnevat infot kaotamata ja minimaalsete kuludega.

Katse planeerimise eesmärk on leida katsete läbiviimiseks sellised tingimused ja reeglid, mille alusel on võimalik saada usaldusväärset ja usaldusväärset teavet objekti kohta minimaalse tööjõukuluga, samuti esitada see teave kompaktsel ja mugaval kujul. täpsuse kvantitatiivse hinnanguga.

Uuringu erinevatel etappidel kasutatavate peamiste planeerimismeetodite hulgas on järgmised:

skriiningeksperimendi kavandamine, mille peamine tähendus on oluliste tegurite rühma valimine kogu tegurite hulgast, mida täiendavalt üksikasjalikult uuritakse;

Eksperimentaalne disain ANOVA jaoks, st. kvalitatiivsete teguritega objektide plaanide koostamine;

Regressioonieksperimendi kavandamine, mis võimaldab saada regressioonimudeleid (polünoom ja muud);

Ekstreemeksperimendi kavandamine, mille peamiseks ülesandeks on uurimisobjekti eksperimentaalne optimeerimine;

Planeerimine dünaamiliste protsesside uurimisel jne.

Distsipliini õppimise eesmärk on planeerimisteooria meetodeid ja kaasaegseid infotehnoloogiaid kasutades valmistada üliõpilasi ette oma eriala tootmis- ja tehniliseks tegevuseks.

Distsipliini eesmärgid: teaduslike ja tööstuslike katsete kavandamise, korraldamise ja optimeerimise, katsete läbiviimise ja saadud tulemuste töötlemise kaasaegsete meetodite uurimine.

1. KORRELAATSIOONI ANALÜÜS

1.1 Korrelatsiooni mõiste

Teadlast huvitab sageli, kuidas on ühes või mitmes uuritavas proovis kaks või enam muutujat üksteisega seotud. Näiteks kas pikkus võib mõjutada inimese kaalu või vererõhk võib mõjutada toote kvaliteeti?

Sellist muutujate vahelist sõltuvust nimetatakse korrelatsiooniks või korrelatsiooniks. Korrelatsioon on kahe tunnuse järjepidev muutus, mis peegeldab asjaolu, et ühe tunnuse varieeruvus on kooskõlas teise tunnuse varieeruvusega.

Näiteks on teada, et inimeste pikkuse ja kaalu vahel on keskmiselt positiivne seos ja selline, et mida suurem pikkus, seda suurem on inimese kaal. Sellest reeglist on siiski erandeid, kui suhteliselt lühikesed inimesed on ülekaalulised ja vastupidi, kõrge kasvuga asteenilised inimesed on väikese kaaluga. Selliste erandite põhjuseks on see, et iga bioloogilise, füsioloogilise või psühholoogilise tunnuse määrab paljude tegurite mõju: keskkonna, geneetilise, sotsiaalse, keskkonna jne.

Korrelatsiooniseosed on tõenäosuslikud muutused, mida saab matemaatilise statistika meetodeid kasutades uurida ainult esinduslike valimite põhjal. Mõlemat terminit – korrelatsioonilink ja korrelatsioonisõltuvus – kasutatakse sageli vaheldumisi. Sõltuvus eeldab mõju, seost - mis tahes kooskõlastatud muutusi, mida saab seletada sadade põhjustega. Korrelatsiooniseoseid ei saa pidada põhjus-tagajärg seose tõendiks, need viitavad vaid sellele, et ühe tunnuse muutustega kaasnevad tavaliselt teatud muutused teises.

Korrelatsioonisõltuvus - Need on muudatused, mis lisavad ühe tunnuse väärtused teise tunnuse erinevate väärtuste esinemise tõenäosusse.

Korrelatsioonianalüüsi ülesanne taandub muutuvate tunnuste vahelise seose suuna (positiivne või negatiivne) ja vormi (lineaarne, mittelineaarne) kindlaksmääramisele, selle läheduse mõõtmisele ja lõpuks saadud korrelatsioonikordajate olulisuse taseme kontrollimisele.

Korrelatsiooniühendused erinevad vormi, suuna ja astme (tugevuse) poolest .

Korrelatsiooniseose vorm võib olla lineaarne või kõverjooneline. Näiteks võib seos simulaatori treeningute arvu ja kontrollseansi õigesti lahendatud probleemide arvu vahel olla sirgjooneline. Näiteks motivatsioonitaseme ja ülesande efektiivsuse vaheline seos võib olla kõverjooneline (joonis 1). Motivatsiooni kasvades tõuseb esmalt ülesande täitmise efektiivsus, seejärel saavutatakse optimaalne motivatsioonitase, mis vastab ülesande täitmise maksimaalsele efektiivsusele; Motivatsiooni edasise tõusuga kaasneb efektiivsuse langus.

Joonis 1 – Seos probleemide lahendamise efektiivsuse ja motivatsioonikalduvuse tugevuse vahel

Suunamisel võib korrelatsioonisuhe olla positiivne ("otsene") ja negatiivne ("pöördvõrdeline"). Positiivse lineaarse korrelatsiooni korral vastavad ühe tunnuse kõrgemad väärtused teise suurematele väärtustele ja ühe tunnuse madalamad väärtused vastavad teise madalatele väärtustele (joonis 2). Negatiivse korrelatsiooni korral on seosed pöördvõrdelised (joonis 3). Positiivse korrelatsiooni korral on korrelatsioonikordaja positiivse märgiga, negatiivse korrelatsiooniga negatiivse märgiga.

Joonis 2 – Otsene korrelatsioon

Joonis 3 – pöördkorrelatsioon


Joonis 4 – korrelatsioon puudub

Korrelatsiooni aste, tugevus või lähedus määratakse korrelatsioonikordaja väärtusega. Ühenduse tugevus ei sõltu selle suunast ja selle määrab korrelatsioonikordaja absoluutväärtus.

1.2 Korrelatsioonide üldine klassifikatsioon

Sõltuvalt korrelatsioonikoefitsiendist eristatakse järgmisi korrelatsioone:

Tugev või lähedane korrelatsioonikoefitsiendiga r>0,70;

Keskmine (0,50

Mõõdukas (kell 0.30

Nõrk (0.20

Väga nõrk (r<0,19).

1.3 Korrelatsiooniväljad ja nende ehitamise eesmärk

Korrelatsiooni uuritakse katseandmete põhjal, milleks on kahe tunnuse mõõdetud väärtused (x i, y i). Kui eksperimentaalseid andmeid on vähe, esitatakse kahemõõtmeline empiiriline jaotus väärtuste x i ja y i topeltreana. Samas saab tunnuste vahelist korrelatsioonisõltuvust kirjeldada erinevalt. Argumendi ja funktsiooni vastavust saab anda tabeli, valemi, graafiku vms abil.

Korrelatsioonianalüüs, nagu ka teised statistilised meetodid, põhineb tõenäosusmudelite kasutamisel, mis kirjeldavad uuritavate tunnuste käitumist teatud üldpopulatsioonis, millest saadakse eksperimentaalsed väärtused xi ja y i. Kvantitatiivsete tunnuste korrelatsiooni uurimisel, mille väärtusi saab täpselt mõõta meeterskaala ühikutes (meetrid, sekundid, kilogrammid jne), võetakse väga sageli kasutusele kahemõõtmeline normaalselt jaotatud populatsioonimudel. Selline mudel kuvab muutujate x i ja y i vahelisi seoseid graafiliselt punktide geomeetrilise asukoha kujul ristkülikukujuliste koordinaatide süsteemis. Seda graafilist seost nimetatakse ka hajuvusgraafikuks või korrelatsiooniväljaks.
See kahemõõtmelise normaaljaotuse mudel (korrelatsiooniväli) võimaldab anda korrelatsioonikordaja selge graafilise tõlgenduse, kuna jaotus kokku sõltub viiest parameetrist: μ x, μ y – keskmised väärtused (matemaatilised ootused); σ x ,σ y – juhuslike suuruste X ja Y standardhälbed ning p – korrelatsioonikordaja, mis on juhuslike suuruste X ja Y vahelise seose mõõt.
Kui p = 0, siis kahemõõtmelisest normaalpopulatsioonist saadud väärtused x i , y i paiknevad graafikul koordinaatides x, y ringiga piiratud alal (joonis 5, a). Sel juhul pole juhuslike suuruste X ja Y vahel korrelatsiooni ning neid nimetatakse korreleerimata. Kahemõõtmelise normaaljaotuse korral tähendab mittekorrelatsioon samaaegselt juhuslike suuruste X ja Y sõltumatust.

Teadusuuringutes on sageli vaja leida seos tulemus- ja faktorimuutujate vahel (saagi saak ja sademete hulk, inimese pikkus ja kaal homogeensetes rühmades soo ja vanuse järgi, pulsisagedus ja kehatemperatuur , jne.).

Teised on märgid, mis aitavad kaasa muutustele nendega seotud inimestes (esimene).

Korrelatsioonianalüüsi mõiste

Neid on palju Eelnevast lähtudes võib öelda, et korrelatsioonianalüüs on meetod, mida kasutatakse kahe või enama muutuja statistilise olulisuse hüpoteesi kontrollimiseks, kui uurija suudab neid mõõta, kuid mitte muuta.

Kõnealusel mõistel on ka teisi määratlusi. Korrelatsioonianalüüs on töötlemismeetod, mis hõlmab muutujatevaheliste korrelatsioonikordajate uurimist. Sel juhul võrreldakse ühe või mitme tunnusepaari vahelisi korrelatsioonikoefitsiente, et teha kindlaks nendevahelised statistilised seosed. Korrelatsioonanalüüs on meetod statistilise sõltuvuse uurimiseks juhuslike muutujate vahel, millel on valikuline range funktsionaalne olemus, mille puhul ühe juhusliku muutuja dünaamika viib teise matemaatilise ootuse dünaamikani.

Vale korrelatsiooni mõiste

Korrelatsioonianalüüsi läbiviimisel tuleb arvestada, et seda saab läbi viia mis tahes tunnuste kogumi suhtes, mis on sageli üksteise suhtes absurdsed. Mõnikord pole neil põhjuslikku seost üksteisega.

Sel juhul räägitakse valekorrelatsioonist.

Korrelatsioonianalüüsi probleemid

Eeltoodud definitsioonide põhjal saame formuleerida kirjeldatud meetodi järgmised ülesanded: hankida informatsiooni ühe otsitava muutuja kohta teise abil; määrata uuritavate muutujate vahelise seose lähedus.

Korrelatsioonanalüüs hõlmab uuritavate tunnuste vahelise seose määramist ja seetõttu saab korrelatsioonianalüüsi ülesandeid täiendada järgmisega:

  • tegurite väljaselgitamine, millel on saadud omadusele suurim mõju;
  • varem uurimata seoste põhjuste väljaselgitamine;
  • korrelatsioonimudeli konstrueerimine selle parameetrilise analüüsiga;
  • sideparameetrite olulisuse uurimine ja nende intervallide hindamine.

Seos korrelatsioonianalüüsi ja regressiooni vahel

Korrelatsioonianalüüsi meetod ei piirdu sageli uuritavate suuruste omavahelise seose lähedase leidmisega. Mõnikord täiendatakse seda regressioonivõrrandite koostamisega, mis saadakse samanimelise analüüsi abil ja mis kirjeldavad korrelatsioonisõltuvust saadud ja teguri (faktori) karakteristiku (tunnuste) vahel. See meetod koos vaadeldava analüüsiga moodustab meetodi

Meetodi kasutamise tingimused

Efektiivsed tegurid sõltuvad ühest kuni mitmest tegurist. Korrelatsioonianalüüsi meetodit saab kasutada juhul, kui on olemas suur hulk tähelepanekuid efektiivsete ja faktorinäitajate (faktorite) väärtuse kohta, kusjuures uuritavad tegurid peavad olema kvantitatiivsed ja kajastatud konkreetsetes allikates. Esimest saab määrata tavaseadusega – sel juhul on korrelatsioonianalüüsi tulemuseks Pearsoni korrelatsioonikordajad või kui karakteristikud sellele seadusele ei allu, kasutatakse Spearmani järgu korrelatsioonikordajat.

Korrelatsioonianalüüsi tegurite valimise reeglid

Selle meetodi rakendamisel on vaja kindlaks määrata tulemusnäitajaid mõjutavad tegurid. Nende valimisel võetakse arvesse asjaolu, et näitajate vahel peavad olema põhjus-tagajärg seosed. Mitmefaktorilise korrelatsioonimudeli loomisel valitakse need, millel on saadud näitajale oluline mõju, kusjuures eelistatav on mitte kaasata korrelatsioonimudelisse vastastikku sõltuvaid tegureid, mille paarikorrelatsioonikordaja on suurem kui 0,85, samuti neid mille puhul seos resultatiivse parameetriga ei ole lineaarne ega funktsionaalne.

Tulemuste kuvamine

Korrelatsioonianalüüsi tulemusi saab esitada tekstis ja graafilises vormis. Esimesel juhul esitatakse need korrelatsioonikoefitsiendina, teisel - hajuvusdiagrammi kujul.

Parameetritevahelise korrelatsiooni puudumisel paiknevad punktid diagrammil kaootiliselt, keskmist ühendusastet iseloomustab suurem järjestusaste ja seda iseloomustab märgitud märkide enam-vähem ühtlane kaugus mediaanist. Tugev ühendus kipub olema sirge ja r = 1 korral on punktdiagramm tasane joon. Pöördkorrelatsioon erineb graafiku suuna poolest ülemisest vasakust alumises paremas suunas, otsene korrelatsioon - alumisest vasakust paremasse ülanurka.

Hajumisdiagrammi 3D esitus

Lisaks traditsioonilisele 2D hajuvusdiagrammi kuvale kasutatakse nüüd korrelatsioonianalüüsi 3D graafilist esitust.

Kasutatakse ka hajuvusmaatriksit, mis kuvab kõik paarisgraafikud ühel joonisel maatriksivormingus. N muutuja puhul sisaldab maatriks n rida ja n veergu. Diagramm, mis asub i-nda rea ​​ja j-nda veeru ristumiskohas, on muutujate Xi versus Xj graafik. Seega on iga rida ja veerg üks mõõde, ühes lahtris kuvatakse kahemõõtmeline hajuvusdiagramm.

Ühenduse tiheduse hindamine

Korrelatsiooniseose tiheduse määrab korrelatsioonikordaja (r): tugev - r = ±0,7 kuni ±1, keskmine - r = ±0,3 kuni ±0,699, nõrk - r = 0 kuni ±0,299. See klassifikatsioon ei ole range. Joonisel on veidi erinev diagramm.

Näide korrelatsioonanalüüsi meetodi kasutamisest

Ühendkuningriigis viidi läbi huvitav uuring. See on pühendatud suitsetamise ja kopsuvähi vahelisele seosele ning viidi läbi korrelatsioonianalüüsi kaudu. See tähelepanek on esitatud allpool.

Algandmed korrelatsioonianalüüsiks

Professionaalne rühm

suremus

Põllumehed, metsamehed ja kalurid

Kaevurid ja karjääritöölised

Gaasi, koksi ja kemikaalide tootjad

Klaasi ja keraamika tootjad

Ahjude, sepikodade, valukodade ja valtsitehaste töötajad

Elektri- ja elektroonikatöölised

Insenerid ja sellega seotud elukutsed

Puidutööstus

Nahatöölised

Tekstiilitöölised

Tööriiete tootjad

Töötajad toidu-, joogi- ja tubakatööstuses

Paberi ja trükiste tootjad

Muude toodete tootjad

Ehitajad

Maalijad ja dekoraatorid

Statsionaarsete mootorite, kraanade jne juhid.

Mujal välja arvatud töötajad

Transpordi- ja sidetöötajad

Laotöölised, laohoidjad, pakkijad ja täitemasinate töötajad

Kontoritöötajad

Müüjad

Spordi- ja vabaajatöötajad

Administraatorid ja juhid

Professionaalid, tehnikud ja kunstnikud

Alustame korrelatsioonianalüüsi. Selguse huvides on parem alustada lahendust graafilise meetodiga, mille jaoks konstrueerime hajusdiagrammi.

See näitab otsest seost. Üksnes graafilise meetodi põhjal on aga raske ühemõttelist järeldust teha. Seetõttu jätkame korrelatsioonianalüüsi tegemist. Allpool on toodud näide korrelatsioonikordaja arvutamisest.

Tarkvara abil (MS Exceli kirjeldatakse allpool näitena) määrame korrelatsioonikordaja, milleks on 0,716, mis tähendab tugevat seost uuritavate parameetrite vahel. Määrame saadud väärtuse statistilise usaldusväärsuse vastava tabeli abil, mille jaoks peame 25 väärtuste paarist lahutama 2, mille tulemusena saame 23 ja seda rida tabelis kasutades leiame r kriitilise väärtuse p = 0,01 (kuna need on meditsiinilised andmed, rangem sõltuvus, muudel juhtudel piisab p=0,05), mis on selle korrelatsioonianalüüsi jaoks 0,51. Näide näitas, et arvutatud r on suurem kui kriitiline r ja korrelatsioonikordaja väärtust peetakse statistiliselt usaldusväärseks.

Tarkvara kasutamine korrelatsioonianalüüsi läbiviimisel

Kirjeldatud tüüpi statistilist andmetöötlust saab läbi viia tarkvara, eriti MS Exceli abil. Korrelatsioon hõlmab järgmiste parameetrite arvutamist funktsioonide abil:

1. Korrelatsioonikordaja määratakse funktsiooni CORREL abil (massiivi1; massiivi2). Massiiv1,2 - resultant- ja faktorimuutujate väärtuste intervalli lahter.

Lineaarset korrelatsioonikordajat nimetatakse ka Pearsoni korrelatsioonikordajaks ja seetõttu saate alates Excel 2007-st funktsiooni kasutada samade massiividega.

Korrelatsioonianalüüsi graafiline kuvamine Excelis toimub paneeli "Charts" abil valikuga "Scatter Plot".

Pärast algandmete täpsustamist saame graafiku.

2. Paaripõhise korrelatsioonikordaja olulisuse hindamine Studenti t-testi abil. T-kriteeriumi arvutatud väärtust võrreldakse selle näitaja tabeli (kriitilise) väärtusega vaadeldava parameetri vastavast väärtuste tabelist, võttes arvesse kindlaksmääratud olulisuse taset ja vabadusastmete arvu. See hinnang viiakse läbi funktsiooni STUDISCOVER(tõenäosus; vabadusastmed) abil.

3. Paaride korrelatsioonikordajate maatriks. Analüüs viiakse läbi Andmeanalüüsi tööriista abil, milles on valitud Korrelatsioon. Paaride korrelatsioonikordajate statistiline hindamine toimub selle absoluutväärtuse võrdlemisel tabeli (kriitilise) väärtusega. Kui arvutatud paaridevaheline korrelatsioonikordaja ületab kriitilist, võime antud tõenäosuse astet arvesse võttes öelda, et nullhüpoteesi lineaarse seose olulisuse kohta ei lükata ümber.

Lõpuks

Korrelatsioonanalüüsi meetodi kasutamine teadusuuringutes võimaldab määrata seoseid erinevate tegurite ja tulemusnäitajate vahel. Arvestada tuleb sellega, et absurdsest andmepaarist või -kogumist on võimalik saada kõrge korrelatsioonikordaja ja seetõttu tuleb seda tüüpi analüüs läbi viia piisavalt suurel andmemassiivil.

Pärast r arvutatud väärtuse saamist on soovitatav seda võrrelda kriitilise r-ga, et kinnitada teatud väärtuse statistilist usaldusväärsust. Korrelatsioonianalüüsi saab teha käsitsi valemite või tarkvara, eriti MS Exceli abil. Siin saab koostada ka hajuvusdiagrammi, mille eesmärk on visuaalselt kujutada seost uuritud korrelatsioonianalüüsi tegurite ja saadud tunnuse vahel.

Korrelatsioonianalüüsi definitsioon

Majanduslikku laadi probleemide lahendamisel, nimelt prognoosimisel, kasutatakse sageli korrelatsioonianalüüsi. See põhineb juhusliku muutuja mõnel väärtusel, mida esindab muutuja, mis sõltub juhtumist ja võib teatud tõenäosusega võtta teatud väärtused. Sel juhul võib vastav jaotusseadus näidata konkreetsete väärtuste sagedust nende kogusummas. Korrelatsioonianalüüs statistikas põhineb teatud majandusnäitajate vaheliste seoste uurimisel stohhastilisel sõltuvusel.

Korrelatsioonianalüüsi tüübid

Korrelatsioonianalüüs toimib nii selle seose funktsionaalsete (täielike) kui ka muude tegurite poolt moonutatud (mittetäielike) sõltuvustega. Esimese tüübi (funktsionaalne sõltuvus) näide on valmistoodete tootmine ja tarbimine defitsiidi tingimustes. Mittetäielikku seost võib näha näiteks tööviljakuse ja töötajate tööstaaži vahel. Samal ajal mõjutab suurem kogemus selle kvaliteeti, kuid teatud tegurite (tervis või haridus) mõjul see sõltuvus moondub.

Korrelatsioonianalüüsi kasutamine statistikas

Matemaatilises statistikas kasutatakse laialdaselt korrelatsioonianalüüsi.

Samas on selle peamiseks ülesandeks määrata protsessis või nähtuses sõltumatute (faktoriaalsete) ja sõltuvate (tulemuslike) tunnuste seose ja iseloomu lähedus. Korrelatsioon ilmneb ainult suuremahulise faktorivõrdluse korral. Seega saab selle tihedust määrata teatud korrelatsioonikordaja abil, mis on spetsiaalselt arvutatud ja paikneb vahemikus [-1;+1]. Nende näitajate vahelise seose olemust saab määrata korrelatsioonivälja abil. Juhul, kui Y on sõltuv tunnus, X on sõltumatu tunnus, siis võttes iga juhtumi kujul X(j), on korrelatsiooniväljal koordinaadid (x j;y j).

Korrelatsioonianalüüs majandusteaduses

Ettevõtlusüksuste majandustegevus sõltub väga paljudest erinevatest teguritest. Sel juhul tuleb arvestada nende kompleksiga, kuna igaüks neist eraldi ei suuda uuritavat nähtust tervikuna kindlaks teha. Seetõttu annab uuritavast objektist selge ettekujutuse ainult teatud tegurite kogum nende tihedas vastastikuses seoses. Mitmemõõtmeline korrelatsioonianalüüs võib koosneda mitmest etapist. Esiteks need tegurid, mille abil määratakse maksimaalne mõju uuritavale indikaatorile ja valitakse analüüsimiseks välja olulisemad. Teine etapp hõlmab korrelatsioonianalüüsiks vajaliku esialgse teabe kogumist ja hindamist. Kolmandas uuritakse iseloomu ning modelleeritakse seost lõppnäitajate ja muude tegurite vahel. Ehk siis genereeritud matemaatiline võrrand on põhjendatud, mis kõige täpsemalt väljendab analüüsitava sõltuvuse olemust. Ja viimane etapp hõlmab korrelatsioonianalüüsi tulemuste hindamist selle praktilise rakendamisega.

Jaga