Korelasyon puanı. Psikolojide tezdeki korelasyonlar

Sıralamaya tabi iki dizi değerin varlığında Spearman's rank korelasyonunu hesaplamak mantıklıdır.

Bu tür seriler temsil edilebilir:

  • incelenen aynı nesne grubunda belirlenen bir çift özellik;
  • aynı özellik kümesi tarafından incelenen 2 nesnede belirlenen bir çift bağımsız alt özellik;
  • bir çift grup alt özelliği;
  • işaretlerin bireysel ve grup bağımlılığı.

Yöntem, göstergelerin her bir özellik için ayrı ayrı sıralanmasını içerir.

En az önemli olan en düşük rütbedir.

Bu yöntem, incelenen fenomenler arasında bir bağlantının varlığını kurmak için tasarlanmış parametrik olmayan bir istatistiksel yöntemi ifade eder:

  • iki nicel veri dizisi arasındaki gerçek paralellik derecesinin belirlenmesi;
  • nicel olarak ifade edilen, tanımlanan ilişkinin sıkılığının değerlendirilmesi.

Korelasyon analizi

2 veya daha fazlası arasındaki ilişkinin varlığını belirlemek için tasarlanmış istatistiksel bir yöntem rastgele değişkenler(değişkenler) ve gücü olarak adlandırıldı korelasyon analizi.

Adını korelasyon (lat.) - orandan almıştır.

Kullanırken, aşağıdaki senaryolar mümkündür:

  • bir korelasyonun varlığı (pozitif veya negatif);
  • korelasyon yok (sıfır).

Değişkenler arasında ilişki kurulması durumunda gelir onların korelasyonu hakkında. Başka bir deyişle, X değerindeki bir değişiklikle Y değerinde orantılı bir değişiklik gözlemleneceğini söyleyebiliriz.

Araç olarak çeşitli iletişim önlemleri (katsayıları) kullanılır.

Seçimleri şunlardan etkilenir:

  • rastgele sayıları ölçmenin bir yolu;
  • rastgele sayılar arasındaki ilişkinin doğası.

Bir korelasyonun varlığı grafik (grafikler) ve bir katsayı (sayısal gösterim) kullanılarak görüntülenebilir.

Korelasyon aşağıdaki özelliklerle karakterize edilir:

  • bağ gücü (± 0,7 ila ± 1 - güçlü; ± 0,3 ila ± 0,699 - orta; 0 ila ± 0,299 - zayıf);
  • iletişim yönü (ileri veya geri).

Korelasyon analizinin amaçları

Korelasyon analizi, çalışılan değişkenler arasında nedensel bir ilişki kurulmasına izin vermez.

Şu amaçlarla gerçekleştirilir:

  • değişkenler arasında bağımlılıklar kurmak;
  • başka bir değişkene dayalı olarak bir değişken hakkında belirli bilgilerin elde edilmesi;
  • bu bağımlılığın sıkılığının (bağlantısının) belirlenmesi;
  • kurulan bağlantının yönünün belirlenmesi.

Korelasyon analizi yöntemleri


Bu analiz kullanılarak yapılabilir:

  • kareler yöntemi veya Pearson;
  • sıralama yöntemi veya Spearman.

Pearson yöntemi, aşağıdakileri gerektiren hesaplamalar için geçerlidir: kesin tanım değişkenler arasında var olan kuvvet. Yardımı ile incelenen özellikler sadece nicel olarak ifade edilmelidir.

Spearman yöntemini veya sıra korelasyonunu uygulamak için, özelliklerin ifadesinde katı bir gereklilik yoktur - hem nicel hem de nitel olabilir. Bu yöntem sayesinde, bağlantının gücünün kesin olarak kurulması hakkında değil, gösterge niteliğinde bir bilgi elde edilir.

Değişken satırları açık değişkenler içerebilir. Örneğin iş tecrübesi 1 yıla kadar, 5 yıldan fazla vb. değerlerle ifade edildiğinde.

Korelasyon katsayısı

İki değişkendeki değişimin doğasını karakterize eden istatistiksel değere korelasyon katsayısı veya çift korelasyon katsayısı denir. Kantitatif olarak -1 ile +1 arasında değişmektedir.

En yaygın oranlar:

  • Pearson- aralık ölçeğine ait değişkenler için geçerlidir;
  • Mızrakçı- sıralı ölçek değişkenleri için.

Korelasyon katsayısını kullanmanın sınırlamaları

Korelasyon katsayısı hesaplanırken güvenilir olmayan verilerin elde edilmesi şu durumlarda mümkündür:

  • yeterli sayıda değişken değer mevcuttur (25-100 çift gözlem);
  • çalışılan değişkenler arasında, örneğin, doğrusal değil, ikinci dereceden bir ilişki kurulur;
  • her durumda, veriler birden fazla gözlem içerir;
  • değişkenlerin anormal değerlerinin (aykırı değerlerin) varlığı;
  • incelenen veriler, açıkça ayırt edilen gözlem alt gruplarından oluşur;
  • bir korelasyonun varlığı, hangi değişkenlerin neden, hangilerinin sonuç olarak kabul edilebileceğini belirlememize izin vermez.

Korelasyonun Öneminin Kontrol Edilmesi

İstatistiksel nicelikleri değerlendirmek için, bir miktarın rastgele bir şekilde ortaya çıkma olasılığını veya uç değerlerinin olasılığını karakterize eden önem veya güvenilirlik kavramı kullanılır.

Bir korelasyonun önemini belirlemenin en yaygın yöntemi Student testini belirlemektir.

Değeri tablo değeri ile karşılaştırılır, serbestlik derecesi sayısı 2 olarak alınır. Ölçütün hesaplanan değeri tablo değerinden büyük olduğunda korelasyon katsayısının önemini gösterir.

Ekonomik hesaplamalar yapılırken 0,05 (%95) veya 0,01 (%99) güven düzeyi yeterli kabul edilir.

Mızrakçı rütbeleri

Spearman'ın sıra korelasyon katsayısı, fenomenler arasında bir bağlantının varlığını istatistiksel olarak belirlemeyi mümkün kılar. Hesaplaması, her özellik için bir seri numarası oluşturulmasını içerir - bir sıra. Sıralama artan veya azalan olabilir.

Sıralanacak özelliklerin sayısı herhangi bir sayı olabilir. Bu, sayılarını sınırlayan oldukça zahmetli bir süreçtir. 20 işarete ulaştığınızda zorluklar başlar.

Spearman katsayısını hesaplamak için aşağıdaki formülü kullanın:

burada:

n - sıralanan özelliklerin sayısını görüntüler;

d, iki değişkendeki sıralar arasındaki farktan başka bir şey değildir;

ve ∑ (d2) rank farklarının karelerinin toplamıdır.

Psikolojide korelasyon analizi

istatistiksel destek psikolojik araştırma onları daha nesnel ve son derece temsil edici hale getirmenize olanak tanır. Psikolojik deneyler sırasında elde edilen verilerin istatistiksel olarak işlenmesi, maksimum yararlı bilgilerin çıkarılmasına katkıda bulunur.

Korelasyon analizi, sonuçlarının işlenmesinde en yaygın olarak kullanılır.

Araştırma sırasında elde edilen sonuçların korelasyon analizinin yapılması uygundur:

  • kaygı (R. Temml, M. Dorca, V. Amen'in testlerine göre);
  • aile ilişkileri ("Aile ilişkilerinin analizi" (DIA) anketi, EG Eidemiller, VV Yustitskis);
  • içsellik-dışsallık düzeyi (EF Bazhin, EA Golynkina ve AM Etkind'in anketi);
  • öğretmenler arasındaki duygusal tükenmişlik düzeyi (V.V. Boyko'nun anketi);
  • farklı uzmanlık eğitimindeki öğrencilerin sözlü zeka unsurları arasındaki bağlantı (K.M. Gurevich ve diğerleri yöntemi);
  • empati düzeyi (V.V. Boyko'nun yöntemi) ile evlilikten memnuniyet (V.V. Stolin'in anketi, T.L. Romanova, G.P. Butenko) arasındaki ilişki;
  • ergenlerin sosyometrik durumu (Jacob L. Moreno testi) ile aile eğitimi tarzının özellikleri (E.G. Eidemiller, V.V. Yustitskis'in anketi) arasındaki ilişki;
  • tam ve eksik ailelerde yetişen ergenlerin yaşam hedeflerinin yapısı (anket Edward L. Deci, Richard M. Ryan Ryan).

Spearman'ın kriterine göre korelasyon analizi yapmak için kısa talimatlar

Spearman yöntemi kullanılarak korelasyon analizi yapılır. aşağıdaki algoritmaya göre:

  • eşleştirilmiş karşılaştırılabilir işaretler, biri X, diğeri Y ile gösterilen 2 satırda bulunur;
  • X serisinin değerleri artan veya azalan düzende düzenlenmiştir;
  • Y serisinin değerlerinin düzenlenme sırası, X serisinin değerlerine karşılık gelmeleri ile belirlenir;
  • X satırındaki her değer için sıralamayı belirleyin - minimum değerden maksimuma bir sıralı sayı atayın;
  • Y serisindeki değerlerin her biri için sıralamayı da belirler (minimumdan maksimuma);
  • D = X-Y formülünü kullanarak X ve Y sıraları arasındaki farkı (D) hesaplayın;
  • ortaya çıkan fark değerlerinin karesi alınır;
  • sıra farklarının karelerinin toplamını gerçekleştirin;
  • formülü kullanarak hesaplamalar yapın:

Spearman korelasyon örneği

Aşağıdaki veriler mevcutsa, iş deneyimi ile yaralanma oranı arasında bir ilişkinin varlığının belirlenmesi gerekir:

Çoğu uygun yöntem analiz sıralama yöntemidir, çünkü işaretlerden biri açık seçenekler şeklinde sunulur: 1 yıla kadar iş tecrübesi ve 7 veya daha fazla yıllık iş tecrübesi.

Sorunun çözümü, bir çalışma sayfasında derlenen ve manuel olarak gerçekleştirilebilen verilerin sıralanmasıyla başlar. hacimleri büyük değil:

İş deneyimi Yaralanma sayısı Seri numaraları (rütbe) rütbe farkı Sıra farkının karesi
d (x-y)
1 yıla kadar 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 ve daha fazlası 6 5 1 +4 16
Σ d2 = 38,5

Sütundaki kesirli sıraların görünümü, aynı boyuttaki varyantların ortaya çıkması durumunda, sıranın aritmetik ortalamasının bulunmasından kaynaklanmaktadır. Bu örnekte, 12 yaralanma oranı iki kez meydana geliyor ve sıra 2 ve 3'e atanıyor, bu sıraların aritmetik ortalamasını (2 + 3) / 2 = 2,5 buluyoruz ve bu değeri 2 gösterge için çalışma sayfasına koyuyoruz.
Elde edilen değerlerin çalışma formülüne değiştirilmesini ve basit hesaplamalar yapılmasını gerçekleştirdikten sonra, -0.92'ye eşit Spearman katsayısını elde ederiz.

Katsayının negatif bir değeri varlığı gösterir geri bildirim işaretler arasında ve kısa bir iş deneyimine eşlik ettiğini iddia etmemize izin verir. Büyük bir sayı yaralanmalar. Ayrıca, bu göstergeler arasındaki bağlantının gücü oldukça büyüktür.
Hesaplamalarda bir sonraki adım, elde edilen katsayının güvenilirliğini belirlemektir:
hatası ve Student t testi hesaplanır

Regresyon ve korelasyon analizi - istatistiksel araştırma yöntemleri. Bunlar, bir parametrenin bir veya daha fazla bağımsız değişkene nasıl bağlı olduğunu göstermenin en yaygın yollarıdır.

Aşağıda özel olarak pratik örnekler Ekonomistler arasında çok popüler olan bu iki analizi düşünün. Ayrıca sonuçların birleştirildiğinde elde edilmesine ilişkin bir örnek vereceğiz.

Excel'de regresyon analizi

Bazı değerlerin (bağımsız, bağımsız) bağımlı değişken üzerindeki etkisini gösterir. Örneğin, ekonomik olarak aktif nüfus sayısının nasıl işletme sayısına, ücretlerin büyüklüğüne ve diğer parametrelere bağlı olduğu. Veya: yabancı yatırımlar, enerji fiyatları vb. GSYİH seviyesini nasıl etkiler?

Analizin sonucu önceliklendirmenizi sağlar. Ve ana faktörlere dayanarak, tahmin edin, öncelikli alanların gelişimini planlayın, yönetim kararları verin.

Gerileme olur:

  • doğrusal (y = a + bx);
  • parabolik (y = a + bx + cx 2);
  • üstel (y = a * exp (bx));
  • güç (y = a * x ^ b);
  • hiperbolik (y = b / x + a);
  • logaritmik (y = b * 1n (x) + a);
  • üstel (y = a * b ^ x).

Excel'de bir regresyon modeli oluşturmaya ve sonuçları yorumlamaya ilişkin bir örneğe bakalım. Hadi alalım doğrusal tip gerileme.

Görev. 6 işletmede aylık ortalama maaş ve işten ayrılan çalışan sayısı. İşten ayrılan çalışan sayısının ortalama maaşa bağımlılığının belirlenmesi gerekmektedir.

modeli doğrusal regresyon buna benzer:

Y = bir 0 + bir 1 x 1 + ... + bir k x k.

a - regresyon katsayıları, x - etkileyen değişkenler, k - faktör sayısı.

Örneğimizde Y, işten ayrılan çalışanların göstergesidir. Etkileyen faktör ücretlerdir (x).

Excel, doğrusal bir regresyon modelinin parametrelerini hesaplamak için kullanabileceğiniz yerleşik işlevlere sahiptir. Ancak Analiz Paketi eklentisi bunu daha hızlı yapacaktır.

Güçlü bir analitik aracı etkinleştiriyoruz:

Aktivasyon üzerine, eklenti "Veri" sekmesinde bulunacaktır.

Şimdi doğrudan regresyon analizine geçelim.



Her şeyden önce, R-kare ve katsayılara dikkat edin.

R-kare, belirleme katsayısıdır. Örneğimizde - 0,755 veya %75.5. Bu, modelin hesaplanan parametrelerinin, çalışılan parametreler arasındaki ilişkiyi %75,5 oranında açıkladığı anlamına gelir. Belirleme katsayısı ne kadar yüksek olursa, model o kadar iyi olur. İyi - 0.8'in üzerinde. Kötü - 0,5'ten az (böyle bir analiz pek makul kabul edilemez). Örneğimizde - "fena değil".

64.1428 katsayısı, incelenen modeldeki tüm değişkenlerin 0'a eşit olması durumunda Y'nin ne olacağını gösterir. Yani modelde açıklanmayan diğer faktörler de analiz edilen parametrenin değerini etkiler.

-0.16285 katsayısı, X değişkeninin Y üzerindeki ağırlığını gösterir. Yani, bu modeldeki ortalama aylık maaş, -0.16285 ağırlıkla işten ayrılan kişi sayısını etkiler (bu küçük bir etki derecesidir). "-" işareti gösterir Kötü etkisi: maaş ne kadar yüksekse, bırakanların sayısı o kadar az olur. Hangisi adil.



Excel'de korelasyon analizi

Korelasyon analizi, bir veya iki örneklemdeki göstergeler arasında bir ilişki olup olmadığını belirlemeye yardımcı olur. Örneğin, makinenin çalışma süresi ile onarım maliyeti, ekipmanın fiyatı ve çalışma süresi, çocukların boy ve kilosu vb.

Bir ilişki varsa, o zaman bir parametredeki artışın diğerinde bir artışa (pozitif korelasyon) veya bir azalmaya (negatif) yol açıp açmadığı. Korelasyon analizi, analistin bir göstergenin değerinin diğerinin olası değerini tahmin edip edemeyeceğini belirlemesine yardımcı olur.

Korelasyon katsayısı r ile gösterilir. +1 ile -1 arasında değişir. Korelasyonların sınıflandırılması farklı küreler farklı olacak. Katsayı 0 olduğunda, örnekler arasında doğrusal bir ilişki yoktur.

Korelasyon katsayısını bulmak için Excel araçlarının nasıl kullanılacağına bakalım.

Eşleştirilmiş katsayıları bulmak için CORREL işlevi kullanılır.

Amaç: Çalışma saatleri arasında bir ilişki olup olmadığını belirlemek torna ve bakım maliyeti.

İmleci herhangi bir hücreye koyuyoruz ve fx düğmesine basıyoruz.

  1. "İstatistiksel" kategorisinde, CORREL işlevini seçin.
  2. Dizi 1 argümanı - ilk değer aralığı - makine çalışma süresi: A2: A14.
  3. Dizi 2 argümanı - ikinci değer aralığı - onarım maliyeti: B2: B14. Tamam'ı tıklayın.

Bağlantı türünü belirlemek için katsayının mutlak sayısına bakmanız gerekir (her faaliyet alanının kendi ölçeği vardır).

Birkaç parametrenin (2'den fazla) korelasyon analizi için Veri Analizi (Analiz Paketi eklentisi) kullanmak daha uygundur. Listede bir korelasyon seçmeniz ve bir dizi belirlemeniz gerekir. Her şey.

Elde edilen katsayılar korelasyon matrisinde görüntülenecektir. Bunun gibi:

Korelasyon-regresyon analizi

Uygulamada, bu iki teknik genellikle birlikte kullanılır.

Örnek:


Artık regresyon verileri de görülebilir.

DERS ÇALIŞMASI

Konu: Korelasyon Analizi

Tanıtım

1. Korelasyon analizi

1.1 Korelasyon kavramı

1.2 Korelasyonların genel sınıflandırması

1.3 Korelasyon alanları ve yapılarının amacı

1.4 Korelasyon analizinin aşamaları

1.5 Korelasyon katsayıları

1.6 Normalleştirilmiş Cesur-Pearson korelasyon katsayısı

1.7 Spearman's rank korelasyon katsayısı

1.8 Korelasyon katsayılarının temel özellikleri

1.9 Korelasyon katsayılarının öneminin kontrol edilmesi

1.10 Çift korelasyon katsayısının kritik değerleri

2. Çok değişkenli bir deney planlama

2.1 Sorun durumu

2.2 Planın merkezinin (temel seviye) ve faktörlerin değişkenlik seviyesinin belirlenmesi

2.3 Bir planlama matrisi oluşturma

2.4 Farklı serilerde dağılımın homojenliğini ve ölçüm tekdüzeliğini kontrol etme

2.5 Regresyon denkleminin katsayıları

2.6 Tekrarlanabilirliğin dağılımı

2.7 Regresyon denkleminin katsayılarının öneminin kontrol edilmesi

2.8 Regresyon denkleminin yeterliliğinin kontrol edilmesi

Çözüm

bibliyografya

GİRİŞ

Deney planlaması, deneysel araştırmanın rasyonel organizasyon yöntemlerini inceleyen matematiksel ve istatistiksel bir disiplindir. optimal seçim incelenen faktörler ve deneyin gerçek planının amacına uygun olarak sonuçları analiz etme yöntemlerine göre tanımlanması. Deneyin planlanmasının başlangıcı, deneyin rasyonel planlamasının, tahminlerin doğruluğunda ölçümün optimal işlenmesinden daha az önemli bir kazanç sağlamadığını vurgulayan İngiliz istatistikçi R. Fisher'ın (1935) çalışmaları ile atıldı. Sonuçlar. 20. yüzyılın 60'larında, modern teori bir deney planlamak. Yöntemleri, fonksiyonların yaklaşıklığı teorisi ve matematiksel programlama ile yakından ilişkilidir. İnşa edilmiş optimal planlar ve geniş bir model sınıfı için özelliklerini araştırdı.

Deney planlaması - belirtilen gereksinimleri karşılayan bir deney planının seçimi, bir deney stratejisi geliştirmeyi amaçlayan bir dizi eylem (önceden bilgi elde etmekten uygulanabilir bir matematiksel model elde etmeye veya optimal koşullar). Bu, incelenen olgunun mekanizması hakkında eksik bilgi koşulları altında gerçekleştirilen deneyin amaçlı kontrolüdür.

Ölçümler sürecinde, verilerin daha sonra işlenmesi ve sonuçların matematiksel bir model şeklinde resmileştirilmesinde hatalar ortaya çıkar ve ilk verilerde bulunan bilgilerin bir kısmı kaybolur. Deneysel planlama yöntemlerinin kullanılması, matematiksel modelin hatasını belirlemenize ve yeterliliğini yargılamanıza olanak tanır. Modelin doğruluğunun yetersiz olduğu ortaya çıkarsa, deneysel planlama yöntemlerinin kullanılması, önceki bilgileri kaybetmeden ve minimum maliyetle matematiksel modeli ek deneylerle modernize etmenizi sağlar.

Deney planlamasının amacı, bir nesne hakkında güvenilir ve güvenilir bilgi elde etmenin mümkün olduğu deneyler yapmak için bu tür koşulları ve kuralları bulmaktır. en düşük maliyetli emeğin yanı sıra, bu bilgiyi nicel bir doğruluk değerlendirmesi ile kompakt ve uygun bir biçimde sunar.

kullanılan başlıca planlama yöntemleri arasında Farklı aşamalar araştırma kullanır:

Ana anlamı, daha ayrıntılı çalışmaya tabi olan bir grup temel faktörün tüm faktörlerinden seçim yapmak olan bir tarama deneyinin planlanması;

Varyans analizi için bir deney tasarlama, ör. kalite faktörlerine sahip nesneler için planlar hazırlamak;

Regresyon modelleri (polinom ve diğerleri) elde etmenizi sağlayan bir regresyon deneyi planlamak;

Ana görevin araştırma nesnesinin deneysel optimizasyonu olduğu aşırı bir deney planlamak;

Dinamik süreçlerin çalışmasında planlama, vb.

Disiplini incelemenin amacı, öğrencileri planlama teorisi ve modern bilgi teknolojileri yöntemlerini kullanarak uzmanlık alanlarındaki üretim ve teknik faaliyetlere hazırlamaktır.

Disiplin hedefleri: çalışma modern yöntemler Bilimsel ve endüstriyel bir deneyin planlanması, düzenlenmesi ve optimize edilmesi, deneylerin yapılması ve elde edilen sonuçların işlenmesi.

1. KORELASYON ANALİZİ

1.1 korelasyon kavramı

Araştırmacı genellikle iki ya da büyük miktar Bir veya daha fazla çalışılan örnekteki değişkenler. Örneğin, boy bir kişinin kilosunu etkileyebilir mi veya basınç ürün kalitesini etkileyebilir mi?

Değişkenler arasındaki bu tür bir ilişkiye korelasyon veya korelasyon denir. Korelasyon, bir özelliğin değişkenliğinin diğerinin değişkenliği ile uyumlu olduğu gerçeğini yansıtan, iki özellikte tutarlı bir değişikliktir.

Örneğin, ortalama olarak, insanların boyları ile ağırlıkları arasında pozitif bir ilişki olduğu ve boy ne kadar büyükse, bir kişinin ağırlığı o kadar fazla olduğu bilinmektedir. Bununla birlikte, nispeten kısa insanlar aşırı kilolu olduğunda ve tersine, yüksek büyüme gösteren astenikler hafif olduğunda bu kuralın istisnaları vardır. Bu tür istisnaların nedeni, her biyolojik, fizyolojik veya psikolojik işaretin birçok faktörün etkisi ile belirlenmesidir: çevresel, genetik, sosyal, ekolojik vb.

Korelasyon bağlantıları, matematiksel istatistik yöntemleriyle yalnızca temsili örnekler üzerinde çalışılabilen olasılıksal değişikliklerdir. Her iki terim - korelasyon ve korelasyon - genellikle birbirinin yerine kullanılır. Bağımlılık etki anlamına gelir, bağlantı ise yüzlerce nedene atfedilebilecek üzerinde anlaşmaya varılmış herhangi bir değişikliği ifade eder. Korelasyon ilişkileri nedensel bir ilişkinin kanıtı olarak kabul edilemez, yalnızca bir özellikteki değişikliklere, kural olarak, diğerinde belirli değişikliklerin eşlik ettiğini gösterirler.

korelasyon bağımlılığı - bunlar, bir özelliğin değerlerini meydana gelme olasılığına sokan değişikliklerdir. Farklı anlamlar başka bir işaret.

Korelasyon analizinin görevi, değişen özellikler arasındaki ilişkinin yönünü (pozitif veya negatif) ve şeklini (doğrusal, doğrusal olmayan) belirlemeye, sıkılığını ölçmeye ve son olarak elde edilen korelasyon katsayılarının anlamlılık düzeyini kontrol etmeye indirgenir.

Korelasyon bağlantıları biçim, yön ve derece (kuvvet) bakımından farklılık gösterir. .

Formda, korelasyon düz veya eğri olabilir. Örneğin, simülatördeki eğitim sayısı ile kontrol oturumunda doğru çözülen problem sayısı arasındaki ilişki basit olabilir. Örneğin, motivasyon düzeyi ile görev performansının etkinliği arasındaki ilişki eğrisel olabilir (Şekil 1). Motivasyonun artması ile görev performansının etkinliği önce artar, sonra başarı sağlanır. optimal seviye karşılık gelen motivasyon maksimum verimlilik görevi tamamlamak; motivasyonda daha fazla artışa zaten verimlilikte bir düşüş eşlik ediyor.

Şekil 1 - Problem çözmenin etkililiği ile motivasyonel eğilimin gücü arasındaki ilişki

Korelasyon yönünde bağlantı pozitif ("doğrudan") ve negatif ("ters") olabilir. Pozitif bir doğrusal korelasyon ile, bir özelliğin daha yüksek değerleri diğerinin daha yüksek değerlerine karşılık gelir ve bir özelliğin daha düşük değerleri diğerinin daha düşük değerlerine karşılık gelir (Şekil 2). Negatif bir korelasyon ile oranlar tersine çevrilir (Şekil 3). Pozitif bir korelasyon ile korelasyon katsayısı, pozitif işaret, negatif korelasyon ile - negatif işaret.

Şekil 2 - Doğrudan korelasyon

Şekil 3 - Ters korelasyon


Şekil 4 - Korelasyon eksikliği

Korelasyonun derecesi, gücü veya sıkılığı, korelasyon katsayısının değeri ile belirlenir. Bağlantının gücü, yönüne bağlı değildir ve korelasyon katsayısının mutlak değeri ile belirlenir.

1.2 Korelasyonların genel sınıflandırması

Korelasyon katsayısına bağlı olarak, aşağıdaki korelasyonlar ayırt edilir:

r> 0.70 korelasyon katsayısına sahip güçlü veya sıkı;

Ortalama (0.50'de

Orta (0.30'da

Zayıf (0.20'de

Çok zayıf (r için<0,19).

1.3 Korelasyon alanları ve yapılarının amacı

Korelasyon, iki özelliğin ölçülen değerleri (x i, y i) olan deneysel veriler temelinde incelenir. Deneysel veriler azsa, iki değişkenli ampirik dağılım, x i ve y i değerlerinin çift serisi olarak temsil edilir. Bu durumda, özellikler arasındaki korelasyon bağımlılığı farklı şekillerde açıklanabilir. Bir argüman ve bir fonksiyon arasındaki yazışmalar bir tablo, formül, grafik vb. ile belirtilebilir.

Korelasyon analizi, diğer istatistiksel yöntemler gibi, belirli bir genel popülasyonda incelenen özelliklerin davranışını tanımlayan, deneysel değerlerin x i ve y i'nin elde edildiği olasılıklı modellerin kullanımına dayanır. Değerleri metrik ölçek birimlerinde (metre, saniye, kilogram vb.) Doğru bir şekilde ölçülebilen nicel özellikler arasındaki korelasyon araştırıldığında, iki boyutlu normal olarak dağılmış bir genel popülasyon modeli çok sık kullanılır. kabul edilen. Böyle bir model, x i ve y i değişkenleri arasındaki ilişkiyi, dikdörtgen bir koordinat sistemindeki noktaların yeri biçiminde grafiksel olarak gösterir. Bu çizim aynı zamanda bir dağılım grafiği veya korelasyon alanı olarak da adlandırılır.
Bu iki boyutlu normal dağılım modeli (korelasyon alanı), korelasyon katsayısının görsel bir grafik yorumunu vermenizi sağlar, çünkü toplamdaki dağılım beş parametreye bağlıdır: μ x, μ y - ortalama değerler (matematiksel beklentiler); σ x, σ y, X ve Y rastgele değişkenlerinin standart sapmalarıdır ve p, X ve Y rastgele değişkenleri arasındaki ilişkinin bir ölçüsü olan korelasyon katsayısıdır.
p = 0 ise, iki boyutlu normal bir popülasyondan elde edilen x i, y i değerleri, bir daire ile sınırlanan alan içinde x, y koordinatlarında grafikte yer alır (Şekil 5, a). Bu durumda, X ve Y rastgele değişkenleri arasında korelasyon yoktur ve bunlara korelasyonsuz denir. İki değişkenli bir normal dağılım için, korelasyonsuzluk, aynı zamanda X ve Y rasgele değişkenlerinin bağımsızlığı anlamına gelir.

Olgular arasında nesnel olarak var olan bağlantıların incelenmesi, istatistiğin en önemli görevidir. Bağımlılıkların istatistiksel araştırması sürecinde, fenomenler arasındaki neden-sonuç ilişkileri ortaya çıkar. Nedensel ilişkiler, birindeki bir değişiklik - neden diğerinde bir değişikliğe yol açar - sonuç - fenomenler ve süreçler arasında böyle bir bağlantıdır.

Olayların ve süreçlerin belirtileri, ilişkiyi incelemek için önemlerine göre iki sınıfa ayrılır. İlgili diğer işaretlerde değişikliğe neden olan işaretlere denir. faktöriyel , ya da sadece faktörler. Faktör işaretlerinin etkisi altında değişen işaretlere denir. etkili .

İstatistikte, fenomenlerin ve süreçlerin işlevsel ve stokastik (olasılıklı) bağlantıları ayırt edilir:

  • fonksiyonel faktör niteliğinin belirli bir değerinin etkili olanın bir değerine karşılık geldiği böyle bir ilişki denir.
  • Nedensel bağımlılık, her bir durumda değil, genel olarak, ortalama olarak çok sayıda gözlemle kendini gösterirse, böyle bir bağımlılığa denir. stokastik (olasılık) ... Korelasyon, stokastik bağlantının özel bir durumudur.

Dışında, fenomenler ve onların işaretleri arasındaki bağlantılar sınıflandırılır yakınlık derecesi, yön ve analitik ifade ile.

Karşı doğrudan ve ters bağlantılar vardır:

  • Doğrudan iletişim - bu, faktör özniteliğinin değerlerinde bir artış (azalma) ile etkili olanın değerlerinde bir artış (düşüş) olan bir ilişkidir. Bu nedenle, örneğin, emek verimliliğindeki bir artış, üretimin karlılık düzeyindeki bir artışa katkıda bulunur.
  • Geri bildirim durumunda etkin özniteliğin değerleri faktöriyelin etkisi altında değişir, ancak faktöriyel öznitelikteki değişime göre ters yönde. Dolayısıyla, varlıkların getirisi seviyesindeki bir artışla, bir üretim biriminin maliyeti azalır.

Analitik ifade ile düz hat (veya basitçe lineer) ve lineer olmayan bağlantılar vardır:

  • Olgular arasındaki istatistiksel ilişki yaklaşık olarak düz bir çizginin denklemi ile ifade edilebiliyorsa, buna denir. hat bağlantısı formun: y = a + bx.
  • Bağlantı, herhangi bir eğri çizginin (parabol, hiperbol vb.) denklemi ile ifade edilebiliyorsa, böyle bir bağlantıya denir. doğrusal olmayan (eğrisel) bağlantı .

iletişim sıkılığı faktör özelliğinin, etkin özelliğin genel varyasyonu üzerindeki etkisinin ölçüsünü gösterir. Yakınlık derecesine göre iletişimin sınıflandırılması tablo 1'de sunulmuştur.

İstatistikte bir bağlantının varlığını, niteliğini ve yönünü belirlemek için aşağıdaki yöntemler kullanılır: paralel veri getirme, analitik gruplama, grafik, korelasyon. İstatistiksel ilişkiyi incelemek için ana yöntem istatistikseldir. korelasyon ve regresyon analizine dayalı iletişim modellemesi .

korelasyon Kesin olarak işlevsel bir yapıya sahip olmayan, rastgele değişkenlerden birinde meydana gelen bir değişikliğin diğerinin matematiksel beklentisinde bir değişikliğe yol açtığı rastgele değişkenler arasındaki istatistiksel bir ilişkidir. İstatistikte, aşağıdaki korelasyon türlerini ayırt etmek gelenekseldir. :

  • çift ​​korelasyonu - iki işaret arasındaki ilişki (etkili ve faktöriyel veya iki faktöriyel);
  • kısmi korelasyon - diğer faktöriyel özelliklerin sabit bir değeri ile etkili ve bir faktöriyel özellik arasındaki ilişki;
  • çoklu korelasyon - çalışmaya dahil edilen etkili ve iki veya daha fazla faktör işaretinin bağımlılığı.

Korelasyon analizinin görevi iki özellik arasındaki (bir çift ilişki ile) ve etkili ve bir dizi faktöriyel özellik arasındaki (çok faktörlü bir ilişki ile) ilişkinin sıkılığının nicel bir tespitidir.

İlişkinin sıkılığı, özellikler arasındaki ilişkinin sıkılığının nicel bir özelliğini vererek, çoklu regresyon denklemini oluştururken faktör özelliklerinin "yararlılığını" belirlemeyi mümkün kılan korelasyon katsayılarının büyüklüğü ile nicel olarak ifade edilir. .

Korelasyon, regresyon ile bağlantılıdır, çünkü birincisi istatistiksel ilişkinin gücünü (sıkılığını) değerlendirirken, ikincisi formunu inceler.

Regresyon analizi ilişkinin analitik ifadesini bir regresyon denklemi şeklinde belirlemektir.

regresyon etkin göstergenin rastgele bir değişkeninin ortalama değerinin faktöriyelin büyüklüğüne bağımlılığı olarak adlandırılır ve regresyon denklemi - etkili bir özellik ile bir veya daha fazla faktöriyel olan arasındaki korelasyonu tanımlayan bir denklem.

Çift korelasyonlu doğrusal ilişki için korelasyon-regresyon analizi formülleri tablo 2'de sunulmuştur.

Tablo 2 - Çift korelasyonlu düz hat bağlantısı için korelasyon-regresyon analizi formülleri
dizinTanım ve formül
Çift korelasyon için düz bir çizginin denklemi y x = a + bx, burada b regresyon katsayısıdır
Normal denklemler sistemi en küçük kareler katsayıları belirlemek için a ve B
İletişimin sıkılığını belirlemek için doğrusal korelasyon katsayısı,
onun yorumu:
r = 0 - bağlantı yok;
0 -1 r = 1 - fonksiyonel bağlantı
mutlak esneklik
Esneklik görecelidir

"Korelasyon analizinin temelleri" konusundaki problem çözme örnekleri

Problem 1 (çift korelasyonda doğrusal ilişkinin analizi) ... Atölyedeki beş işçinin nitelikleri ve aylık çıktıları hakkında veriler var:

İşçilerin nitelikleri ile üretimleri arasındaki ilişkiyi incelemek için doğrusal ilişki denklemini ve korelasyon katsayısını belirleyin. Regresyon ve korelasyon katsayılarının bir yorumunu sağlayın.

Çözüm ... Önerilen tabloyu genişletelim.

Düz çizgi denkleminin parametrelerini belirleyelim yx = a + bx... Bunu yapmak için denklem sistemini çözeceğiz:

Yani regresyon katsayısı 18'dir.

в pozitif bir sayı olduğundan, x ve y parametreleri arasında doğrudan bir bağlantı vardır.
bir = 92-4 × 18
bir = 20
Lineer bağlantı denklemi yx = 20 + 18x şeklindedir.

İncelenen özellikler arasındaki ilişkinin sıkılığını (kuvvetini) belirlemek için korelasyon katsayısının değerini aşağıdaki formülle belirleriz:

= (2020-20 × 460/5) / (√10 × √3280) ≈ 180 / 181.11 = 0.99. Korelasyon katsayısı 0,7'den büyük olduğu için bu serideki ilişki güçlüdür.

Görev 2 ... İşletmede ürün fiyatları 80 rubleden düşürüldü. 60 rubleye kadar birim başına. Fiyat indiriminden sonra satışlar günde 400 adetten 500 adete yükseldi. Mutlak ve bağıl esnekliği belirleyin. Daha fazla fiyat indirimi olasılığı (veya imkansızlığı) amacıyla bir esneklik değerlendirmesi yapın.

Çözüm ... Ön esneklik analizi yapmamıza izin veren göstergeleri hesaplayalım:

Gördüğünüz gibi, fiyat düşüş oranı talepteki artış oranına mutlak değerde eşittir.

Mutlak ve bağıl esneklikleri formüllerle buluruz:

= (500-400) / (60-80) = 100 / (- 20) -5 - mutlak esneklik

= (100: 400) / (- 20:80) = -1 - göreli esneklik

Göreceli esneklik modülü 1'dir. Bu, talepteki büyüme oranının fiyatlardaki düşüş oranına eşit olduğu gerçeğini doğrulamaktadır. Böyle bir durumda, fiyat indirimi öncesi ve sonrası işletmenin aldığı gelirleri hesaplıyoruz: 80 * 400 = 32.000 ruble. günde 60 * 500 = 30.000 ruble. günlük - gördüğümüz gibi, gelir azaldı ve daha fazla fiyat indirimi önerilmez.

Psikolojik araştırmalardan elde edilen materyallerin işlenmesinde istatistiksel yöntemlerin kullanılması, deneysel verilerden faydalı bilgiler çıkarmak için büyük bir fırsat sağlar. En yaygın istatistiksel yöntemlerden biri korelasyon analizidir.

"Korelasyon" terimi ilk olarak, "hayvanların parçalarının ve organlarının korelasyonu yasasını" çıkaran Fransız paleontolog J. Cuvier tarafından kullanılmıştır. vücut). Bu terim istatistiklere İngiliz biyolog ve istatistikçi F. Galton (sadece "bağlantı" değil - ilişki ve "bağlantı gibi" - korelasyon).

Korelasyon analizi, korelasyon katsayıları, iki boyutlu tanımlayıcı istatistikler, iki değişken arasındaki ilişkinin nicel bir ölçümü (ortak değişkenlik) kullanan değişkenler arasındaki ilişkiler hakkında bir hipotez testidir. Dolayısıyla bu, rastgele değişkenler veya özellikler arasındaki korelasyon bağımlılığını tespit etmeye yönelik bir dizi yöntemdir.

İki rastgele değişken için korelasyon analizi şunları içerir:

  • bir korelasyon alanı oluşturmak ve bir korelasyon tablosu derlemek;
  • örnek korelasyon katsayılarının ve korelasyon oranlarının hesaplanması;
  • ilişkinin önemine ilişkin istatistiksel hipotezin test edilmesi.

Korelasyon analizinin temel amacı, çalışılan iki özellikte ortak tutarlı bir değişiklik olarak kabul edilen iki veya daha fazla çalışılan değişken arasındaki ilişkiyi belirlemektir. Bu değişkenliğin üç ana özelliği vardır: şekil, yön ve güç.

Korelasyonun formu lineer veya lineer olmayan olabilir. Doğrusal form, korelasyonu tanımlamak ve yorumlamak için daha uygundur. Doğrusal bir korelasyon ilişkisi için iki ana yön ayırt edilebilir: pozitif ("doğrudan ilişki") ve negatif ("geri bildirim").

İlişkinin gücü, incelenen değişkenlerin ortak değişkenliğinin ne kadar açık bir şekilde ortaya çıktığını doğrudan gösterir. Psikolojide, fenomenlerin işlevsel ilişkisi, yalnızca karşılık gelen özelliklerin olasılıksal bir ilişkisi olarak ampirik olarak ortaya çıkarılabilir. Olasılık ilişkisinin doğası hakkında net bir fikir, bir dağılım diyagramı ile verilir - eksenleri iki değişkenin değerlerine karşılık gelen bir grafik ve her konu bir noktadır.

Olasılık ilişkisinin sayısal bir özelliği olarak, değerleri -1 ile +1 arasında değişen korelasyon katsayıları kullanılır. Hesaplamaları yaptıktan sonra, araştırmacı, kural olarak, yalnızca daha fazla yorumlanacak olan en güçlü korelasyonları seçer (Tablo 1).

"Yeterince güçlü" korelasyonları seçme kriteri, hem korelasyon katsayısının kendisinin mutlak değeri (0.7'den 1'e kadar) hem de bu katsayının istatistiksel anlamlılık düzeyine göre (0.01'den 0.1'e kadar) belirlenen göreli değeri olabilir. örnek boyutunda. Daha fazla yorum için küçük örneklerde, istatistiksel anlamlılık düzeyine dayalı güçlü korelasyonlar seçmek daha doğrudur. Büyük örneklemler üzerinde yapılan çalışmalarda korelasyon katsayılarının mutlak değerlerini kullanmak daha iyidir.

Böylece, korelasyon analizinin görevi, değişen işaretler arasındaki ilişkinin yönünü (pozitif veya negatif) ve şeklini (doğrusal, doğrusal olmayan) belirlemeye, sıkılığını ölçmeye ve son olarak, elde edilen korelasyon katsayılarının anlamlılık düzeyini kontrol etmeye indirgenir. .

Şu anda, birçok farklı korelasyon katsayısı geliştirilmiştir. En çok kullanılanlar r-Pirson, r-Speerman ve τ -Kendall. "Korelasyonlar" menüsündeki modern bilgisayar istatistik programları tam olarak bu üç katsayıyı sunar ve diğer araştırma problemlerini çözmek için grup karşılaştırma yöntemleri önerilmiştir.

Korelasyon katsayısını hesaplama yönteminin seçimi, değişkenlerin ait olduğu ölçek tipine bağlıdır (Tablo 2).

Aralıklı ve nominal ölçekli değişkenler için Pearson korelasyon katsayısı (ürünlerin momentlerinin korelasyonu) kullanılır. İki değişkenden en az birinin sıralı bir ölçeği varsa veya normal dağılmamışsa, Spearman sıra korelasyonu kullanılır veya

t-Kendall. İki değişkenden biri ikili ise, nokta iki sıralı korelasyon kullanılabilir (SPSS istatistiksel bilgisayar programında bu özellik yoktur; bunun yerine sıra korelasyonu hesaplanabilir). Her iki değişkenin de ikili olması durumunda, dört alanlı bir korelasyon kullanılır (bu tür korelasyon, uzaklık ölçüleri ve benzerlik ölçüleri tanımına dayalı olarak SPSS tarafından hesaplanır). İkili olmayan iki değişken arasındaki korelasyon katsayısının hesaplanması, ancak aralarındaki ilişkinin doğrusal (tek yönlü) olması durumunda mümkündür. Bağlantı, örneğin, sen-şekilli (belirsiz), korelasyon katsayısı bağ kuvvetinin bir ölçüsü olarak kullanım için uygun değildir: değeri sıfır olma eğilimindedir.

Böylece, korelasyon katsayılarını uygulama koşulları aşağıdaki gibi olacaktır:

  • aynı nesne örneğinde nicel (sıra, metrik) bir ölçekte ölçülen değişkenler;
  • değişkenler arasındaki ilişki monotondur.

Korelasyon analizi ile test edilen ana istatistiksel hipotez, yönsüzdür ve genel popülasyonda korelasyonun sıfıra eşitliği hakkında bir ifade içerir. H 0: r xy= 0. Reddedilirse, alternatif bir hipotez kabul edilir. H 1: r xy≠ 0, pozitif veya negatif korelasyonun varlığında - hesaplanan korelasyon katsayısının işaretine bağlı olarak.

Hipotezlerin kabulü veya reddi temelinde anlamlı sonuçlara varılır. Eğer, istatistiksel bir kontrol sonuçlarına göre H 0: r xy= 0, a düzeyinde sapma yapmazsa, anlamlı sonuç aşağıdaki gibi olacaktır: arasındaki ilişki x ve Y bulunamadı. eğer H 0 r xy= 0, a düzeyinde sapar, bu, arasında pozitif (negatif) bir ilişki bulunduğu anlamına gelir. x ve Y... Ancak, ortaya çıkan korelasyonların yorumuna ihtiyatla yaklaşılmalıdır. Bilimsel bir bakış açısına göre, sadece iki değişken arasında bir ilişki kurmak, nedensel bir ilişki olduğu anlamına gelmez. Ayrıca, bir korelasyonun varlığı neden ve sonuç arasında bir sıra ilişkisi kurmaz. Basitçe, iki değişkenin birbiriyle tesadüfen beklenenden daha fazla ilişkili olduğunu gösterir. Bununla birlikte, dikkatli olunarak, neden-sonuç ilişkilerinin incelenmesinde korelasyon yöntemlerinin kullanılması tamamen haklıdır. Göstergedeki artışın nedeni “X değişkenidir” gibi kategorik ifadelerden kaçının. Y". Bu tür ifadeler, teoride titizlikle doğrulanması gereken varsayımlar olarak formüle edilmelidir.

Matematiksel istatistik ders kitaplarında her korelasyon katsayısı için matematiksel prosedürün ayrıntılı bir açıklaması verilmiştir; ; ; ve diğerleri Ölçüm ölçeğinin türüne bağlı olarak bu katsayıları kullanma olasılığını tanımlamakla kendimizi sınırlayacağız.

Metrik değişkenlerin korelasyonu

Aynı örnek üzerinde ölçülen iki metrik değişkenin ilişkisini incelemek için korelasyon katsayısı r-Pirson... Katsayının kendisi, kural olarak sembollerle gösterilen özellikler arasında yalnızca doğrusal bir ilişkinin varlığını karakterize eder. x ve Y... Doğrusal korelasyon katsayısı parametrik bir yöntemdir ve doğru uygulanması ancak ölçüm sonuçlarının bir aralık ölçeğinde sunulması ve analiz edilen değişkenlerdeki değerlerin dağılımının normalden önemsiz derecede farklı olması durumunda mümkündür. Kullanımının uygun olduğu birçok durum vardır. Örneğin: bir öğrencinin zekası ile akademik performansı arasında bağlantı kurmak; ruh hali ve bir problem durumundan çıkma başarısı arasında; gelir düzeyi ile mizaç vb. arasında

Pearson katsayısı psikoloji ve pedagojide yaygın olarak kullanılmaktadır. Örneğin, I. Ya. Kaplunovich ve PD Rabinovich, MP Nuzhdina'nın çalışmalarında, öne sürülen hipotezleri doğrulamak için Pearson'ın doğrusal korelasyon katsayısının hesaplanması kullanıldı.

Verileri "manuel" olarak işlerken, korelasyon katsayısını hesaplamak ve ardından belirlemek gerekir. P- önem düzeyi (veri doğrulamasını basitleştirmek için kritik değer tabloları kullanılır r xy bu kriter kullanılarak derlenir). Pearson'ın lineer korelasyon katsayısının değeri +1'i geçemez ve -1'den küçük olamaz. Bu iki sayı +1 ve -1, korelasyon katsayısının sınırlarıdır. Hesaplama, +1'den büyük veya -1'den küçük bir değerle sonuçlandığında, bu, bir hesaplama hatasının meydana geldiğini gösterir.

Bilgisayarda hesaplama yaparken, istatistiksel program (SPSS, Statistica) hesaplanan korelasyon katsayısına daha doğru bir değerle eşlik eder. P-seviye.

Kabul etmek veya reddetmek için istatistiksel bir karar için H 0 genellikle ayarlanmış α = 0.05 ve büyük miktarda gözlem için (100 veya daha fazla) α = 0.01. Eğer p ≤ α, H 0 incelenen değişkenler arasında (ilişkinin işaretine bağlı olarak pozitif veya negatif) istatistiksel olarak güvenilir (anlamlı) bir ilişki bulunduğuna dair sapma yapar ve anlamlı bir sonuca varır. Ne zaman p> α, H 0 reddedilmez, anlamlı sonuç ilişkinin (istatistiksel olarak anlamlı) bulunamadığı ifadesiyle sınırlıdır.

Bağlantı bulunamazsa, ancak bağlantı olduğuna inanmak için bir neden varsa, bağlantının güvenilmezliği için olası nedenleri kontrol etmelisiniz.

İletişim doğrusalsızlığı- bunu yapmak için iki boyutlu dağılım grafiğini analiz edin. İlişki doğrusal değilse ancak monotonsa, sıralama korelasyonlarına gidin. Eğer ilişki monoton değilse, örneği ilişkinin monoton olduğu bölümlere ayırın ve örneğin her bir parçası için korelasyonları ayrı ayrı hesaplayın veya örneği zıt gruplara ayırın ve ardından bunları şiddetin düzeyine göre karşılaştırın. özellik.

Bir veya her iki özelliğin dağılımında aykırı değerlerin varlığı ve belirgin bir asimetri. Bunu yapmak için, her iki işaretin frekans dağılımının histogramlarına bakmanız gerekir. Aykırı değerler veya asimetriler varsa, aykırı değerleri hariç tutun veya sıralama korelasyonlarına gidin.

Örnek heterojenliği(2B dağılım grafiğini analiz edin). Örneği, ilişkinin farklı yönlere sahip olabileceği parçalara bölmeye çalışın.

İlişki istatistiksel olarak anlamlıysa, anlamlı bir sonuca varmadan önce yanlış korelasyon olasılığını dışlamak gerekir:

  • bağlantı emisyonlardan kaynaklanmaktadır... Aykırı değerler varsa, korelasyonları sıralayın veya aykırı değerleri hariç tutun;
  • ilişki üçüncü değişkenin etkisinden kaynaklanmaktadır.... Böyle bir olgu varsa, korelasyonu sadece örneklemin tamamı için değil, her grup için ayrı ayrı hesaplamak gerekir. "Üçüncü" değişken metrik ise, kısmi korelasyonu hesaplayın.

Kısmi korelasyon katsayısı r xy -z iki değişken arasındaki ilişkinin var olduğu varsayımının kontrol edilmesi gerekiyorsa hesaplanır. x ve Yüçüncü değişkenin etkisine bağlı değildir Z... Çok sık olarak, iki değişken, yalnızca her ikisinin de üçüncü değişkenin etkisi altında tutarlı bir şekilde değişmesi nedeniyle birbiriyle ilişkilidir. Başka bir deyişle, aslında karşılık gelen özellikler arasında hiçbir bağlantı yoktur, ancak ortak bir nedenin etkisi altında istatistiksel bir ilişki içinde kendini gösterir. Örneğin, bir yaş grubundaki çeşitli psikolojik özelliklerin ilişkisini incelerken yaş, iki değişkende yaygın bir değişkenlik nedeni olabilir. Kısmi korelasyonu nedensel bir bakış açısıyla yorumlarken dikkatli olunmalıdır, çünkü eğer Z ile ilişkilidir x Ve birlikte Y ve kısmi korelasyon r xy -z sıfıra yakın, mutlaka olduğu anlamına gelmez Z için yaygın bir nedendir x ve Y.

Sıra değişkenlerinin korelasyonu

Korelasyon katsayısı nicel veriler için kabul edilemez ise r-Pirson, daha sonra ön sıralamadan sonra iki değişkenin ilişkisi hakkındaki hipotezi test etmek için korelasyonlar uygulanabilir. r-Speerman veya τ -Kendall... Örneğin, müzikal olarak yetenekli ergenlerin psikofiziksel özelliklerinin araştırılmasında I.A.Lavochkin, Spearman kriteri kullanıldı.

Her iki katsayının (Spearman ve Kendall) doğru hesaplanması için, ölçüm sonuçlarının bir sıra veya aralık ölçeğinde sunulması gerekir. Bu kriterler arasında temel bir fark yoktur, ancak genellikle Kendall katsayısının daha "anlamlı" olduğu kabul edilir, çünkü değişkenler arasındaki ilişkileri daha eksiksiz ve ayrıntılı olarak analiz eder, değer çiftleri arasındaki tüm olası eşleşmeleri inceler. Spearman katsayısı, değişkenler arasındaki ilişkinin nicel derecesini daha doğru bir şekilde hesaba katar.

Spearman's rank korelasyon katsayısı klasik Pearson korelasyon katsayısının parametrik olmayan bir analoğudur, ancak hesaplanırken, dağılımla ilgili değil, karşılaştırılan değişkenlerin (aritmetik ortalama ve varyans) göstergeleri dikkate alınır, ancak sıralar. Örneğin, kişinin “gerçek benliği” ile ilgili düşüncesinde yer alan kişilik özelliklerinin sıra değerlendirmeleri ile “ideal benlik” arasındaki ilişkiyi belirlemek gerekir.

Spearman katsayısı psikolojik araştırmalarda yaygın olarak kullanılmaktadır. Örneğin, Yu.V. Bushov ve N.N.

Bu katsayı bir analog olduğundan r-Pirson, daha sonra hipotezleri test etmek için uygulanması, katsayının uygulanmasına benzer r-Pirson. Yani, test edilebilir istatistiksel hipotez, istatistiksel bir karar verme prosedürü ve anlamlı bir sonucun formülasyonu aynıdır. Bilgisayar programlarında (SPSS, Statistica), aynı katsayılar için anlamlılık düzeyleri r-Pirson ve r-Spesiyaller her zaman aynıdır.

Oran avantajı r-Speerman'e karşı oranlar r-Pirson - iletişime daha duyarlı. Aşağıdaki durumlarda kullanırız:

  • normal formdan (asimetri, aykırı değerler) en az bir değişkenin dağılımında önemli bir sapmanın varlığı;
  • eğrisel (monoton) bir bağlantının görünümü.

Katsayının uygulanması için sınırlama r-Uzmanlar:

  • her değişken için en az 5 gözlem;
  • bir veya her iki değişkende çok sayıda eşit sıra için katsayı kaba bir değer verir.

Sıra korelasyon katsayısı τ -Kendall aynı veya farklı eğilimlere sahip (artan veya azalan değerler) iki örneğin değer çiftlerinin oranının hesaplanmasına dayanan bağımsız özgün bir yöntemdir. Bu katsayı da denir uyum katsayısı... Bu nedenle, bu yöntemin ana fikri, konuları birbirleriyle ikili olarak karşılaştırarak bağlantının yönünün yargılanabilmesidir: eğer bir çift öznede bir değişiklik varsa. x değişikliği ile aynı doğrultudadır. Y, bu, örneğin aile refahı için belirleyici olan kişisel niteliklerin çalışmasında, olumlu bir ilişki, değilse de olumsuz bir ilişki olduğunu gösterir. Bu yöntemde, bir değişken, artan büyüklük sırasına göre monoton bir dizi (örneğin, kocanın verileri) olarak sunulur; başka bir değişkene (örneğin, eşin verileri) karşılık gelen sıra yerleri atanır. Formülde korelasyon katsayıları için ters çevirme sayısı (ilk satıra kıyasla monotonluk ihlalleri) kullanılır.

sayarken τ- Kendall "manuel" veriler ilk önce değişkene göre sıralanır x... Daha sonra her bir konu için kendi sıralamasının kaç katı olduğu hesaplanmıştır. Y daha düşük olan deneklerin sıralamasından daha az olduğu ortaya çıkıyor. Sonuç "Maçlar" sütununa kaydedilir. "Maç" sütunundaki tüm değerlerin toplamı P- Toplam eşleşme sayısı, hesaplama açısından daha basit olan, ancak örneğin aksine, örnekte bir artış olan Kendall katsayısını hesaplamak için formüle ikame edilir. r-Speerman, hesaplamaların hacmi orantılı olarak değil, katlanarak artıyor. Yani, örneğin, için n= 12, 66 çift özneyi sıralamak gerekir ve n= 489 - zaten 1128 çift, yani hesaplamaların hacmi 17 kattan fazla artıyor. Bir istatistiksel programda (SPSS, Statistica) bilgisayarda hesaplarken, Kendall katsayısı katsayılara benzer şekilde hesaplanır. r-Speerman ve r-Pirson. Hesaplanan korelasyon katsayısı τ -Kendall daha doğru bir değer ile karakterize edilir P-seviye.

Kaynak veriler aykırı değerler içeriyorsa Kendall katsayısı tercih edilir.

Sıra korelasyon katsayılarının bir özelliği, maksimum modülo sıra korelasyonlarının (+1, –1) ilk değişkenler arasındaki katı doğrudan veya ters orantılı ilişkilere mutlaka karşılık gelmemesidir. x ve Y: aralarında sadece monoton bir işlevsel bağlantı yeterlidir. Sıra korelasyonları, bir değişkenin daha büyük bir değeri her zaman başka bir değişkenin daha büyük bir değerine (+1) karşılık geliyorsa veya bir değişkenin daha büyük bir değeri her zaman başka bir değişkenin daha küçük bir değerine karşılık geliyorsa ve bunun tersi (-1) maksimum modulo değerine ulaşır. ).

Test edilecek istatistiksel hipotez, istatistiksel bir karar verme prosedürü ve anlamlı bir sonucun formülasyonu, durumla aynıdır. r-Hoparlör veya r-Pirson.

İstatistiksel olarak anlamlı bir ilişki bulunamıyorsa, ancak bir ilişki olduğuna inanmak için nedenler varsa, önce katsayıdan geçiş yapmalısınız.

r-Hoparlörden katsayıya τ -Kendall (veya tam tersi) ve ardından bağlantının güvenilmezliğinin olası nedenlerini kontrol edin:

  • iletişimin doğrusal olmaması: Bunu yapmak için 2B dağılım grafiğine bakın. Eğer ilişki monoton değilse, numuneyi ilişkinin monoton olduğu parçalara bölün veya numuneyi zıt gruplara bölün ve ardından bunları özelliğin ciddiyet düzeyine göre karşılaştırın;
  • örnek heterojenliği: iki boyutlu saçılma grafiğine bakın, numuneyi ilişkinin farklı yönlere sahip olabileceği parçalara bölmeye çalışın.

İlişki istatistiksel olarak anlamlıysa, anlamlı bir sonuca varmadan önce yanlış korelasyon olasılığını dışlamak gerekir (metrik korelasyon katsayılarına benzer şekilde).

İkili değişkenlerin korelasyonu

İkili bir ölçekte ölçülen iki değişkeni karşılaştırırken, korelasyonun ölçüsü, ikili veriler için korelasyon katsayısı olan j katsayısı olarak adlandırılır.

Büyüklük katsayısı φ+1 ile -1 arasında yer alır. İki ayrı ölçülen özellik arasındaki bağlantı yönünü karakterize eden pozitif veya negatif olabilir. Ancak, φ'nin yorumlanması belirli problemler doğurabilir. φ katsayısını hesaplama şemasına dahil edilen ikili veriler, iki boyutlu normal bir yüzey gibi görünmemektedir; bu nedenle, yorumlanan değerlerin yanlış olduğunu varsaymak yanlıştır. r xy= 0.60 ve φ = 0.60 aynıdır. Katsayı φ, kodlama yöntemiyle ve ayrıca dört alanlı tablo veya beklenmedik durum tablosu kullanılarak hesaplanabilir.

Korelasyon katsayısını φ uygulamak için aşağıdaki koşulların karşılanması gerekir:

  • karşılaştırılan özellikler ikili bir ölçekte ölçülmelidir;
  • x ve Y aynı olmalıdır.

Bu tür korelasyon, uzaklık ölçüleri ve benzerlik ölçülerinin belirlenmesine dayalı olarak SPSS bilgisayar programında hesaplanır. Faktör analizi, küme analizi, çok değişkenli ölçekleme gibi bazı istatistiksel prosedürler, bu önlemlerin uygulanmasına dayanır ve bazen benzerlik ölçümlerini hesaplamak için ek olasılıklar sunarlar.

Bir değişkenin ikili bir ölçekte ölçüldüğü durumlarda (değişken x) ve diğeri aralıklar veya oranlar ölçeğinde (değişken Y) kullanıldı ikili korelasyon katsayısıörneğin, çocuğun cinsiyetinin boy ve kilo göstergesi üzerindeki etkisi hakkındaki hipotezleri test ederken. Bu katsayı –1 ile +1 arasında değişir ancak işareti sonuçların yorumlanmasında önemli değildir. Kullanmak için aşağıdaki koşullara uyulmalıdır:

  • karşılaştırılan özellikler farklı ölçeklerde ölçülmelidir: bir x- ikili bir ölçekte; diğeri Y- aralıklar veya oranlar ölçeğinde;
  • değişken Y normal dağılım yasasına sahiptir;
  • karşılaştırılan değişkenlerdeki değişen özelliklerin sayısı x ve Y aynı olmalıdır.

değişken ise x ikili bir ölçekte ölçülür ve değişken Y sıralama ölçeğinde (değişken Y), kullanılabilir sıra-iki seri korelasyon katsayısıτ-Kendall ile yakından ilişkili olan ve tanımında tesadüf ve ters çevirme kavramlarını kullanan . Sonuçların yorumlanması aynıdır.

SPSS ve Statistica bilgisayar programlarını kullanarak korelasyon analizi basit ve kullanışlı bir işlemdir. Bunu yapmak için, İki Değişkenli Korelasyonlar iletişim kutusunu (Analiz> Korelasyon> İki Değişkenli ...) çağırdıktan sonra, çalışılan değişkenleri Değişkenler alanına taşımanız ve değişkenler arasındaki korelasyon ilişkisinin ortaya çıkacağı yöntemi seçmeniz gerekir. Çıktı dosyası, hesaplanan her kriter için bir kare tablo (Korelasyonlar) içerir. Tablonun her hücresi şunları içerir: korelasyon katsayısının kendisinin değeri (Korelasyon Katsayısı), hesaplanan Sig katsayısının istatistiksel önemi, denek sayısı.

Ortaya çıkan korelasyon tablosunun başlık ve yan sütunu, değişkenlerin adlarını içerir. Herhangi bir değişkenin kendisiyle korelasyonu maksimum olduğundan, tablonun köşegeni (sol üst - sağ alt köşe) olanlardan oluşur. Tablo bu köşegen etrafında simetriktir. Programda "Anlamlı korelasyonları işaretle" onay kutusu seçilirse, son korelasyon tablosunda istatistiksel olarak anlamlı katsayılar işaretlenecektir: 0,05 ve daha düşük düzeyde - bir yıldız işareti (*) ve 0,01 düzeyinde - ile iki yıldız işareti (**).

Özetlemek gerekirse: korelasyon analizinin temel amacı değişkenler arasındaki ilişkiyi belirlemektir. İlişkinin ölçüsü, seçimi doğrudan değişkenlerin ölçüldüğü ölçek tipine, karşılaştırılan değişkenlerdeki değişen özelliklerin sayısına ve değişkenlerin dağılımına bağlı olan korelasyon katsayılarıdır. İki değişken arasındaki korelasyon, aralarında nedensel bir ilişki olduğu anlamına gelmez. Korelasyon doğrudan nedenselliği göstermese de, nedene dair bir ipucu olabilir. Bunun temelinde hipotezler oluşturulabilir. Bazı durumlarda, korelasyon eksikliği nedensellik hipotezi üzerinde daha derin bir etkiye sahiptir. İki değişken arasındaki sıfır korelasyon, bir değişkenin diğeri üzerinde etkisinin olmadığını gösterebilir.

Bunu Paylaş