Statistika çoxvariantlı tədqiqat metodları faktor təhlili. Çoxvariantlı statistik təhlil (RUB 128.00). Faktor təhlili metodunun əsas anlayışları, onun həll etdiyi problemlərin mahiyyəti

Dərslik müəllifin çoxvariantlı statistik təhlil və ekonometrika kurslarının tədrisi təcrübəsi əsasında yaradılmışdır. Diskriminant, faktor, reqressiya təhlili, uyğunluq təhlili və zaman sıraları nəzəriyyəsi üzrə materiallardan ibarətdir. Çoxölçülü miqyaslı problemlərə yanaşmalar və çoxölçülü statistikanın bəzi digər problemləri təqdim olunur.

Qruplaşdırma və senzura.
Nümunə məlumatlarının qruplarını elə formada formalaşdırmaq tapşırığı, qruplaşdırılmış verilənlər qərar qəbul etmək üçün demək olar ki, qruplaşmadan əvvəl nümunə ilə eyni həcmdə məlumat verə bilsin. Qruplaşdırmanın məqsədləri, bir qayda olaraq, məlumatın həcmini azaltmaq, hesablamaları sadələşdirmək və məlumatları daha aydın etməkdir. Bəzi statistik testlər əvvəlcə qruplaşdırılmış nümunə ilə işləmək üçün nəzərdə tutulmuşdur. Müəyyən aspektlərdə qruplaşdırma problemi aşağıda daha ətraflı müzakirə olunacaq təsnifat probleminə çox bənzəyir. Qruplaşdırma vəzifəsi ilə eyni vaxtda tədqiqatçı nümunənin senzura problemini də həll edir, yəni. ondan, bir qayda olaraq, kobud müşahidə səhvlərinin nəticəsi olan kəskin kənar məlumatların xaric edilməsi. Təbii ki, müşahidə prosesinin özündə belə səhvlərin olmamasını təmin etmək arzuolunandır, lakin bu həmişə mümkün olmur. Bu iki problemin həlli üçün ən sadə üsullar bu fəsildə müzakirə olunur.

Mündəricat
1 İlkin məlumat
1.1 Analiz və cəbr
1.2 Ehtimal nəzəriyyəsi
1.3 Riyazi statistika
2 Çoxvariantlı paylamalar
2.1 Təsadüfi vektorlar
2.2 Müstəqillik
2.3 Rəqəm xarakteristikası
2.4 Çoxvariantlı halda normal paylanma
2.5 Korrelyasiya nəzəriyyəsi
3 Qruplaşdırma və senzura
3.1 Birölçülü qruplaşdırma
3.2 Birölçülü senzura
3.3 Fövqəladə hallar cədvəlləri
3.3.1 Müstəqillik fərziyyəsi
3.3.2 Homojenlik fərziyyəsi
3.3.3 Korrelyasiya sahəsi
3.4 Çoxölçülü qruplaşdırma
3.5 Çoxvariantlı senzura
4 Qeyri-rəqəm məlumatı
4.1 Giriş sözü
4.2 Müqayisə şkalaları
4.3 Ekspert qiymətləndirmələri
4.4 Ekspert qrupları
5 Güvən dəsti
5.1 Etibar intervalları
5.2 Etibarlılıq dəstləri
5.2.1 Çoxvariantlı parametr
5.2.2 Çoxvariantlı seçmə
5.3 Tolerant dəstlər
5.4 Kiçik nümunə
6 Reqressiya təhlili
6.1 Problemin ifadəsi
6.2 OMC axtarın
6.3 Məhdudiyyətlər
6.4 Plan matrisi
6.5 Statistik proqnoz
7 Dispersiya təhlili
7.1 Giriş qeydləri
7.1.1 Normallıq
7.1.2 Dispersiyaların vahidliyi
7.2 Bir amil
7.3 İki amil
7.4 Ümumi hal
8 Ölçülərin azalması
8.1 Təsnifat niyə lazımdır?
8.2 Model və nümunələr
8.2.1 Əsas komponentlərin təhlili
8.2.2 Xüsusiyyətlərin həddindən artıq qruplaşdırılması
8.2.3 Çoxölçülü miqyaslama
8.2.4 Diskriminant təhlili üçün göstəricilərin seçilməsi
8.2.5 Reqressiya modelində göstəricilərin seçilməsi
9 Diskriminant təhlili
9.1 Modelin tətbiqi
9.2 Xətti proqnozlaşdırma qaydası
9.3 Praktiki tövsiyələr
9.4 Bir misal
9.5 İkidən çox sinif
9.6 Ayrı-seçkiliyin keyfiyyətinin yoxlanılması
10 Evristik üsullar
10.1 Həddindən artıq fraksiya
10.1.1 Kvadrat meyar
10.1.2 Modulların meyarı
10 2 Pleiades metodu
11 Əsas komponent metodu
11 1 Problemin ifadəsi
112 Əsas komponentlərin hesablanması
11.3 Nümunə
114 Əsas komponentlərin xassələri
11.4.1 Öz-özünə təkrarlanma qabiliyyəti
11.4.2 Həndəsi xassələr
12 Faktor təhlili
12.1 Problemin ifadəsi
12.1.1 Əsas komponentlərlə əlaqə
12.1.2 Həllin birmənalılığı
12.2 Riyazi model
12.2.1 A üçün şərtlər
12.2.2 Yük matrisi üzrə şərtlər. Centroid üsulu
12.3 Gizli amillər
12.3.1 Bartlett metodu
12.3.2 Tomson metodu
12.4 Nümunə
13 Rəqəmsallaşdırma
13.1 Yazışmaların təhlili
13.1.1 Ki-kvadrat məsafəsi
13.1.2 Diskriminant təhlili tapşırıqları üçün rəqəmsallaşdırma
13.2 İkidən çox dəyişən
13.2.1 Yazışma matrisi kimi ikili verilənlər matrisindən istifadə
13.2.2 Maksimum korrelyasiya
13.3 Ölçü
13.4 Nümunə
13.5 Qarışıq məlumat işi
14 Çoxölçülü miqyaslama
14.1 Giriş qeydləri
14.2 Torgerson modeli
14.2.1 Stress meyarı
14.3 Torgerson alqoritmi
14.4 Fərdi fərqlər
15 Zaman seriyası
15.1 Ümumi müddəalar
15.2 Təsadüfilik meyarları
15.2.1 Zirvələr və çuxurlar
15.2.2 Faza uzunluğunun paylanması
15.2.3 Reytinq nisbətinə əsaslanan meyarlar
15.2.4 Korreloqram
15.3 Trend və mövsümilik
15.3.1 Çoxhədli meyllər
15.3.2 Trend dərəcəsinin seçilməsi
15.3.3 Antialiasing
15.3.4 Mövsümi dəyişikliklərin qiymətləndirilməsi
Normal paylama
B Paylama X2
C Tələbə paylanması
D Fisher paylanması.

Elektron kitabı rahat formatda pulsuz yükləyin, baxın və oxuyun:
Çoxvariantlı statistik analiz kitabını yükləyin, Dronov S.V., 2003 - fileskachat.com, sürətli və pulsuz yükləyin.

pdf yükləyin
Aşağıda bu kitabı bütün Rusiyaya çatdırılma ilə endirimlə ən yaxşı qiymətə ala bilərsiniz.

Ekonometriya

Çoxvariantlı statistik təhlil

Çoxdəyişənli statistik analizdə nümunə çoxölçülü fəzanın elementlərindən ibarətdir. Ekonometrik metodların bu bölməsinin adı da buradandır. Çoxvariantlı statistik təhlilin çoxsaylı problemlərindən ikisini nəzərdən keçirəcəyik - asılılığın bərpası və təsnifatı.

Xətti proqnoz funksiyasının qiymətləndirilməsi

Bir dəyişənin xətti proqnozlaşdırıcı funksiyasının nöqtə və inamlı qiymətləndirilməsi məsələsindən başlayaq.

İlkin məlumatlar – n cüt ədəddən (t k, x k), k = 1,2,...,n, burada t k müstəqil dəyişəndir (məsələn, zaman), x k isə asılı dəyişəndir (məsələn, , inflyasiya indeksi, ABŞ dollarının məzənnəsi, aylıq istehsal həcmi və ya pərakəndə satış məntəqəsinin gündəlik gəlirinin məbləği). Dəyişənlərin asılılıqla əlaqəli olduğu güman edilir

x k = a (t k - t avg)+ b + e k , k = 1,2,…,n,

burada a və b statistikaya məlum olmayan və qiymətləndirməyə tabe olan parametrlərdir, e k isə asılılığı təhrif edən xətalardır. Vaxt nöqtələrinin arifmetik ortası

t av = (t 1 + t 2 +…+t n) / n

sonrakı hesablamaları asanlaşdırmaq üçün modelə daxil edilmişdir.

Tipik olaraq, xətti əlaqənin a və b parametrləri ən kiçik kvadratlar metodundan istifadə etməklə qiymətləndirilir. Sonra bərpa edilmiş asılılıq nöqtə və interval proqnozu üçün istifadə olunur.

Məlum olduğu kimi, ən kiçik kvadratlar metodu 1794-cü ildə böyük alman riyaziyyatçısı K.Qauss tərəfindən hazırlanmışdır.Bu üsula əsasən, x-in t-dən asılılığını xətti yaxınlaşdıran ən yaxşı funksiyanı hesablamaq üçün iki dəyişənli funksiyanı nəzərə almaq lazımdır.

Ən kiçik kvadratların təxminləri f(a,b) funksiyasının arqumentlərin bütün qiymətləri üzərində minimuma çatdığı a* və b* dəyərləridir.

Bu təxminləri tapmaq üçün a və b arqumentlərinə münasibətdə f(a,b) funksiyasının qismən törəmələrini hesablamaq, onları 0-a bərabərləşdirmək, sonra yaranan tənliklərdən təxminləri tapmaq lazımdır: Bizdə:

Gəlin yaranan münasibətlərin sağ tərəflərini çevirək. Ümumi əmsalları 2 və (-1) cəmi işarəsi kimi çıxaraq. Sonra şərtlərə baxaq. Birinci ifadədəki mötərizələri açaq və hər bir terminin üçə bölündüyünü tapaq. İkinci ifadədə hər bir termin həm də üçünün cəmidir. Bu o deməkdir ki, hər bir məbləğ üç məbləğə bölünür. Bizdə:

Gəlin qismən törəmələri 0-a bərabərləşdirək. Sonra yaranan tənliklərdə (-2) əmsalını azalda bilərik. Çünki

(1)

tənliklər formasını alır

Beləliklə, ən kiçik kvadratların təxminləri formaya malikdir

(2)

(1) əlaqəsinə görə a* təxmini daha simmetrik formada yazıla bilər:

Bu təxmin asanlıqla formaya çevrilə bilər

Buna görə də, proqnozlaşdırmaq və interpolyasiya etmək üçün istifadə edilə bilən yenidən qurulmuş funksiya formaya malikdir

x*(t) = a*(t - t av)+ b*.

Diqqət yetirək ki, sonuncu düsturda t cf-dən istifadə onun ümumiliyini heç bir şəkildə məhdudlaşdırmır. Formanın bir modeli ilə müqayisə edin

x k = c t k + d + e k , k = 1,2,…,n.

Aydındır ki

Parametr təxminləri oxşar şəkildə əlaqələndirilir:

Parametr təxminləri və proqnozlaşdırıcı düstur əldə etmək üçün hər hansı ehtimal modelinə istinad etməyə ehtiyac yoxdur. Bununla belə, parametr qiymətləndirmələrində və yenidən qurulmuş funksiyada səhvləri öyrənmək üçün, yəni. a*, b* və x*(t) üçün inam intervalları qurun, belə bir model lazımdır.

Parametrik olmayan ehtimal modeli. Müstəqil dəyişən t-nin qiymətləri deterministik, e k, k = 1,2,...,n xətaları isə sıfır riyazi gözlənti və dispersiyaya malik müstəqil eyni paylanmış təsadüfi dəyişənlər olsun.

naməlum statistika.

Gələcəkdə e k , k = 1.2,...,n (çəkilərlə) kəmiyyətlər üçün ehtimal nəzəriyyəsinin Mərkəzi Limit Teoremindən (CLT) dəfələrlə istifadə edəcəyik, buna görə də onun şərtlərini yerinə yetirmək üçün fərz etmək lazımdır, məsələn, e k , k = 1.2 ,…,n xətaları sonludur və ya sonlu üçüncü mütləq momentə malikdir. Bununla belə, bu riyaziyyatdaxili “qaydalılıq şərtlərinə” diqqət yetirməyə ehtiyac yoxdur.

Parametr təxminlərinin asimptotik paylanması. (2) düsturundan belə nəticə çıxır

(5)

CLT-ə görə, təxmin b* riyazi gözlənti b və dispersiya ilə asimptotik normal paylanmaya malikdir.

qiymətləndirilməsi aşağıda verilmişdir.

(2) və (5) düsturlarından belə nəticə çıxır

İkinci əlaqədəki sonuncu i i üzərində cəmləndikdə 0-a çevrilir, buna görə də (2-4) düsturlarından belə çıxır ki,

(6)

Formula (6) təxmini göstərir

riyazi gözlənti və dispersiya ilə asimptotik normaldır

Qeyd edək ki, çoxölçülü normallıq o zaman mövcuddur ki, (6) düsturun hər bir üzvü bütün cəmi ilə müqayisədə kiçikdir, yəni.

(5) və (6) düsturları və səhvlər haqqında ilkin fərziyyələr də parametr qiymətləndirmələrinin qərəzsiz olmasını nəzərdə tutur.

Ən kiçik kvadratların təxminlərinin qərəzsizliyi və asimptotik normallığı onlar üçün asimptotik etimad hədlərini (əvvəlki fəsildəki limitlərə bənzər) müəyyən etməyi və məsələn, müəyyən dəyərlərə bərabərlik, ilk növbədə 0 olan statistik fərziyyələri yoxlamağı asanlaşdırır. Oxucuya təqdim edirik. etimad hədlərinin hesablanması üçün düsturları yazmaq və qeyd olunan fərziyyələri yoxlamaq qaydalarını formalaşdırmaq imkanı ilə.

Proqnozlaşdırma funksiyasının asimptotik paylanması. (5) və (6) düsturlarından belə nəticə çıxır

olanlar. proqnozlaşdırıcı funksiyanın hesablanmış təxmini qərəzsizdir. Buna görə də

Üstəlik, səhvlər məcmuda müstəqil olduğundan və

, Bu

Beləliklə,

Təsadüfi dəyişkənliyin bir və ya iki təsadüfi dəyişən, işarə ilə təmsil olunduğu vəziyyətlər var.

Məsələn, insanların statistik populyasiyasını öyrənərkən bizi boy və çəki maraqlandırır. Bu vəziyyətdə, statistik populyasiyada nə qədər insan olsa da, biz həmişə səpələnmə qrafası çəkə və bütün mənzərəni görə bilərik. Ancaq üç atribut varsa, məsələn, bir insanın yaşı əlavə olunursa, səpələnmə qrafiki üçölçülü məkanda qurulmalıdır. Üçölçülü məkanda nöqtələr toplusunu təsəvvür etmək artıq olduqca çətindir.

Əslində, praktikada hər bir müşahidə bir, iki və ya üç rəqəmlə deyil, onlarla xüsusiyyəti təsvir edən bəzi nəzərə çarpan rəqəmlər dəsti ilə təmsil olunur. Bu vəziyyətdə, səpələnmə grafiğinin qurulması çoxölçülü fəzaların nəzərə alınmasını tələb edəcəkdir.

Statistikanın çoxvariantlı müşahidələrlə təcrübələrin öyrənilməsi ilə məşğul olan bölməsi çoxvariantlı statistik təhlil adlanır.

Bir təcrübədə bir neçə işarənin (obyektin xassələrinin) eyni vaxtda ölçülməsi, ümumiyyətlə, yalnız bir və ya iki ölçməkdən daha təbiidir. Buna görə də, potensial çoxvariantlı statistik təhlilin geniş tətbiq sahəsi var.

Çoxvariantlı statistik təhlil aşağıdakı bölmələri əhatə edir:

Faktor təhlili;

Diskriminant təhlili;

Klaster təhlili;

Çoxölçülü miqyaslama;

Keyfiyyətə nəzarət üsulları.

Faktor təhlili

Mürəkkəb obyekt və sistemləri öyrənərkən (məsələn, psixologiya, biologiya, sosiologiya və s.) bu obyektlərin xassələrini müəyyən edən kəmiyyətləri (amilləri) çox vaxt birbaşa ölçmək olmur, bəzən hətta onların sayı və mənalı mənası da məlum olmur. . Lakin maraq doğuran amillərdən bu və ya digər şəkildə asılı olaraq, ölçmə üçün digər kəmiyyətlər də ola bilər. Üstəlik, bizi maraqlandıran naməlum amilin təsiri bir neçə ölçülmüş xüsusiyyətdə təzahür etdikdə, bu xüsusiyyətlər bir-biri ilə sıx əlaqəni göstərə bilər və amillərin ümumi sayı ölçülən dəyişənlərin sayından çox az ola bilər.

Ölçülən dəyişənlərə təsir edən amilləri aşkar etmək üçün faktor təhlili metodlarından istifadə edilir.

Faktor təhlilinin tətbiqinə misal olaraq psixoloji testlər əsasında şəxsiyyət xüsusiyyətlərinin öyrənilməsini göstərmək olar. Şəxsiyyət xassələri birbaşa ölçülə bilməz, onlar yalnız bir insanın davranışı və ya müəyyən suallara verdiyi cavabların xarakteri ilə qiymətləndirilə bilər. Təcrübələrin nəticələrini izah etmək üçün onlar amil analizinə məruz qalırlar ki, bu da bizə sınaqdan keçirilmiş şəxslərin davranışlarına təsir edən şəxsi xüsusiyyətləri müəyyən etməyə imkan verir.

Müxtəlif amil təhlili modelləri aşağıdakı fərziyyəyə əsaslanır: müşahidə edilən və ya ölçülən parametrlər tədqiq olunan obyekt və ya hadisənin yalnız dolayı xarakteristikalarıdır; reallıqda isə daxili (gizli, gizli, bilavasitə müşahidə olunmayan) sayı az olan və müşahidə olunan parametrlərin qiymətlərini təyin edən parametrlər və xassələr. Bu daxili parametrlər adətən amillər adlanır.

Faktor təhlilinin vəzifəsiamillərin xətti kombinasiyası və ola bilsin ki, bəzi əlavə, əhəmiyyətsiz pozğunluqlar şəklində müşahidə edilən parametrlərin təqdimatıdır.

Amil təhlilinin birinci mərhələsi, bir qayda olaraq, əvvəlkilərin xətti birləşmələri olan və müşahidə edilən məlumatlarda ümumi dəyişkənliyin böyük hissəsini “udmaq” və buna görə də məlumatda olan məlumatların əksəriyyətini ötürən yeni xüsusiyyətlərin seçilməsidir. orijinal müşahidələr. Bu adətən istifadə edilir əsas komponent metodu, baxmayaraq ki, bəzən başqa üsullardan da istifadə olunur (maksimum ehtimal metodu).

Əsas komponent metodu müşahidə məkanında yeni ortoqonal koordinat sisteminin seçilməsi ilə bağlıdır. Birinci əsas komponent kimi müşahidələr massivinin ən böyük səpələnməyə malik olduğu istiqamət seçilir; hər bir sonrakı əsas komponent elə seçilir ki, müşahidələrin səpələnməsi maksimum olsun və bu əsas komponent əvvəllər seçilmiş digər əsas komponentlərə ortoqonal olsun. Bununla belə, əsas komponent metodu ilə əldə edilən amillər adətən kifayət qədər aydın şəkildə şərh edilə bilməz. Buna görə də, amil təhlilində növbəti addım transformasiya, şərhi asanlaşdırmaq üçün amillərin fırlanmasıdır.

Diskriminant təhlili

Bir neçə qrupa bölünmüş obyektlər toplusu olsun və hər bir obyekt üçün onun hansı qrupa aid olduğunu müəyyən etmək olar. Hər bir obyekt üçün bir neçə kəmiyyət xüsusiyyətlərinin ölçüləri var. Bu xüsusiyyətlərə əsaslanaraq, obyektin hansı qrupa aid olduğunu öyrənmək üçün bir yol tapmaq lazımdır. Bu, eyni kolleksiyanın yeni obyektlərinin aid olduğu qrupları göstərməyə imkan verəcək. Problemi həll etmək üçün istifadə edirlər diskriminant təhlili üsulları.

Diskriminant təhlili- Bu, məzmunu müəyyən xüsusiyyətlərə görə müşahidə obyektlərinin ayrı-seçkilik (diskriminasiya) problemlərinin həlli üsullarının işlənib hazırlanmasından ibarət olan statistikanın bir sahəsidir.

Gəlin bəzi nümunələrə baxaq.

Ayrı-seçkilik təhlili, müəyyən bir vəzifəyə işə qəbul zamanı fərdlərin test nəticələrinin işlənməsində faydalıdır. Bu halda, bütün namizədləri iki qrupa bölmək lazımdır: “uyğun” və “uyğun deyil”.

Ayrı-seçkilik təhlilindən istifadə bank administrasiyası tərəfindən müştərilərə kredit verilərkən onların işlərinin maliyyə vəziyyətini qiymətləndirmək üçün mümkündür. Bank onları bir sıra meyarlara əsasən etibarlı və etibarsız kimi təsnif edir.

Diskriminant təhlili istehsal və təsərrüfat fəaliyyətinin hər hansı göstəricilərinin qiymətlərinə görə bir sıra müəssisələrin bir neçə homojen qrupa bölünməsi metodu kimi istifadə edilə bilər.

Diskriminant analiz üsulları, dəyərləri obyektlərin qruplara bölünməsini izah edən ölçülmüş xüsusiyyətlərin funksiyalarını qurmağa imkan verir. Bu funksiyaların olması arzu edilir (diskriminant xüsusiyyətlər) bir az idi. Bu halda təhlilin nəticələrini mənalı şəkildə şərh etmək daha asan olur.

Sadəliyinə görə xətti diskriminant təhlili xüsusi rol oynayır ki, burada təsnifat xüsusiyyətləri ilkin əlamətlərin xətti funksiyaları kimi seçilir.

Klaster təhlili

Klaster təhlili üsulları öyrənilən obyektlər toplusunu klaster adlanan “oxşar” obyektlər qruplarına bölməyə imkan verir.

Söz klasterİngilis mənşəli - cluster kimi tərcümə olunur fırça, dəstə, qrup, sürü, salxım.

Klaster təhlili aşağıdakı problemləri həll edir:

Obyekti xarakterizə edən bütün xüsusiyyətləri nəzərə alaraq obyektləri təsnif edir. Təsnifat imkanının özü bizi nəzərdən keçirilən məcmuə və ona daxil olan obyektləri daha dərindən dərk etməyə sövq edir;

Mövcud populyasiyada apriori verilmiş strukturun və ya təsnifatın mövcudluğunu yoxlamaq vəzifəsini qoyur. Belə test elmi tədqiqatın standart hipotetik-deduktiv sxemindən istifadə etməyə imkan verir.

Əksər klasterləşdirmə (ierarxik qrup) üsullarıdır aglomerativ(birləşmə) - hər biri tam olaraq bir ilkin müşahidədən (bir nöqtədən) ibarət olan elementar klasterlər yaratmaqla başlayırlar və hər bir sonrakı addımda ən yaxın iki çoxluq birinə birləşdirilir.

Bu prosesi dayandırmaq üçün an tədqiqatçı tərəfindən təyin edilə bilər (məsələn, lazımi sayda klaster və ya birləşmənin əldə edildiyi maksimum məsafəni təyin etməklə).

Klaster birləşmə prosesinin qrafik təsvirini istifadə edərək əldə etmək olar dendroqramlar- klaster birləşmə ağacı.

Aşağıdakı misalı nəzərdən keçirək. Gəlin hər biri üç dəyişən ilə xarakterizə olunan beş müəssisəni təsnif edək:

x 1- əsas istehsal fondlarının orta illik dəyəri, milyard rubl;

x 2- 1 rub üçün material xərcləri. istehsal məhsulları, qəpiklər;

x 3- istehsal olunan məhsulların həcmi, milyard rubl.

Çoxvariantlı statistik təhlil aşağıdakı problemləri həll etmək üçün istifadə olunur:

* əlamətlər arasında asılılığın öyrənilməsi;
* vektorlarla müəyyən edilmiş obyektlərin və ya xüsusiyyətlərin təsnifatı;
* xüsusiyyət sahəsinin ölçüsünü azaltmaq.

Bu halda, müşahidələrin nəticəsi obyektdə ölçülən sabit sayda kəmiyyət və bəzən keyfiyyət xüsusiyyətlərinin qiymətlərinin vektorudur. Kəmiyyət xarakteristikası müşahidə olunan vahidin rəqəm və ölçü vahidi ilə birbaşa ifadə oluna bilən xüsusiyyətidir. Kəmiyyət xarakteristikası keyfiyyət xarakteristikası ilə ziddiyyət təşkil edir - müşahidə vahidinin iki və ya daha çox şərti kateqoriyadan birinə aid edilməsi ilə müəyyən edilən xarakteristika (əgər tam olaraq iki kateqoriya varsa, o zaman xarakteristikaya alternativ deyilir). Keyfiyyət xüsusiyyətlərinin statistik təhlili qeyri-ədəd xarakterli obyektlərin statistikasının bir hissəsidir. Kəmiyyət xarakteristikaları intervallar, nisbətlər, fərqlər və mütləq miqyasda ölçülən xüsusiyyətlərə bölünür.

Keyfiyyətli olanlar - adlar və sıra miqyasında ölçülən xüsusiyyətlər üçün. Məlumatların işlənməsi üsulları sözügedən xüsusiyyətlərin ölçüldüyü miqyaslara uyğun olmalıdır.

Xüsusiyyətlər arasındakı asılılığın öyrənilməsinin məqsədləri xüsusiyyətlər arasında əlaqənin mövcudluğunu sübut etmək və bu əlaqəni öyrənməkdir. İki təsadüfi dəyişən X və Y arasında əlaqənin mövcudluğunu sübut etmək üçün korrelyasiya təhlilindən istifadə olunur. Əgər X və Y-nin birgə paylanması normaldırsa, onda statistik nəticələr seçmə xətti korrelyasiya əmsalına əsaslanır, digər hallarda Kendall və Spearman rütbəli korrelyasiya əmsallarından, keyfiyyət xüsusiyyətləri üçün isə x-kvadrat testindən istifadə edilir.

Y kəmiyyət əlamətinin x(1), x(2), ..., x(k) kəmiyyət əlamətlərindən funksional asılılığını öyrənmək üçün reqressiya təhlilindən istifadə olunur. Bu asılılığa reqressiya və ya qısaca desək, reqressiya deyilir. Reqressiya təhlilinin ən sadə ehtimal modeli (k = 1 halda) ilkin məlumat kimi müşahidə nəticələrinin (xi, yi), i = 1, 2, … , n cütlüyündən istifadə edir və formaya malikdir.

yi = axi + b + ei, i = 1, 2, … , n,

burada ei müşahidə xətalarıdır. Bəzən belə hesab edilir ki, ei eyni normal paylanma N(0, y2) olan müstəqil təsadüfi dəyişənlərdir. Müşahidə xətalarının paylanması adətən normaldan fərqli olduğundan, reqressiya modelini qeyri-parametrik formalaşdırmada nəzərdən keçirmək məqsədəuyğundur, yəni. ei-nin ixtiyari paylanması ilə.

Reqressiya təhlilinin əsas vəzifəsi y-nin x-dən xətti asılılığını təyin edən naməlum a və b parametrlərini qiymətləndirməkdir. Bu problemi həll etmək üçün 1794-cü ildə K. Gauss tərəfindən hazırlanmış ən kiçik kvadratlar üsulu istifadə olunur, yəni. kvadratların cəminin minimuma endirilməsi şərtindən a və b modelinin naməlum parametrlərinin təxminlərini tapın

a və b dəyişənləri ilə.

Dispersiya təhlili keyfiyyət xüsusiyyətlərinin kəmiyyət dəyişənə təsirini öyrənmək üçün istifadə olunur. Məsələn, k maşında istehsal olunan məhsul vahidlərinin keyfiyyətinin kəmiyyət göstəricisinin ölçü nəticələrinin k nümunəsi olsun, yəni. ədədlər toplusu (x1(j), x2(j), … , xn(j)), burada j maşın nömrəsidir, j = 1, 2, …, k və n nümunə ölçüsüdür. Dispersiya təhlilinin ümumi formalaşdırılmasında hesab edilir ki, ölçmə nəticələri müstəqildir və hər bir nümunədə eyni dispersiya ilə normal paylanma N(m(j), y2) olur.

Məhsulun keyfiyyətinin vahidliyinin yoxlanılması, yəni. maşın nömrəsinin məhsulun keyfiyyətinə təsirinin olmaması fərziyyənin sınaqdan keçirilməsinə gəlir

H0: m(1) = m(2) = … = m(k).

Variasiya təhlili belə fərziyyələri yoxlamaq üçün üsullar işləyib hazırlamışdır.

H0 hipotezi, göstərilən bərabərliklərdən ən azı birinin təmin olunmadığı alternativ H1 hipotezinə qarşı sınaqdan keçirilir. Bu fərziyyənin sınağı R. A. Fisher tərəfindən müəyyən edilmiş aşağıdakı "variasiya parçalanmasına" əsaslanır:

burada s2 birləşdirilmiş nümunədəki nümunə dispersiyasıdır, yəni.

Beləliklə, (7) düsturunun sağ tərəfindəki birinci termin qrupdaxili dispersiyanı əks etdirir. Nəhayət, qruplararası variasiya var,

Formula (7) kimi dispersiya genişlənməsi ilə əlaqəli tətbiqi statistika sahəsi dispersiya təhlili adlanır. Dispersiya probleminin təhlilinə misal olaraq yuxarıdakı H0 fərziyyəsini ölçmə nəticələrinin müstəqil olması və hər bir nümunədə eyni dispersiya ilə normal paylanma N(m(j), y2) olduğu fərziyyəsi altında sınaqdan keçirməyi nəzərdən keçirək. H0 doğrudursa, düsturun (7) sağ tərəfindəki y2-yə bölünən birinci hədd k(n-1) sərbəstlik dərəcələri ilə x-kvadrat paylanmaya malikdir və y2-yə bölünən ikinci hədd də x-kvadrat paylanması, lakin (k-1) sərbəstlik dərəcələri ilə, birinci və ikinci şərtlər təsadüfi dəyişənlər kimi müstəqildir. Buna görə təsadüfi dəyişən

(k-1) sərbəstlik dərəcələri və k(n-1) məxrəclər sərbəstlik dərəcələri ilə Fisher paylanmasına malikdir. H0 hipotezi qəbul edilir, əgər F< F1-б, и отвергается в противном случае, где F1-б - квантиль порядка 1-б распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. Значения F1-б берут из соответствующих таблиц.

Dispersiya təhlilinin klassik problemlərinin həlli, xüsusən H0 hipotezinin sınaqdan keçirilməsi üçün qeyri-parametrik üsullar işlənib hazırlanmışdır.

Çoxvariantlı statistik təhlil problemlərinin növbəti növü təsnifat problemləridir. Onlar üç prinsipcə fərqli növə bölünür - diskriminant təhlili, klaster təhlili, qruplaşdırma problemləri.

Diskriminant təhlilinin vəzifəsi müşahidə olunan obyekti əvvəllər təsvir edilmiş siniflərdən birinə təsnif etmək üçün bir qayda tapmaqdır. Bu zaman obyektlər vektorlardan istifadə etməklə riyazi modeldə təsvir edilir, onların koordinatları hər bir obyektdə bir sıra xüsusiyyətlərin müşahidəsinin nəticəsidir. Dərslər birbaşa riyazi terminlərlə və ya təlim nümunələrindən istifadə etməklə təsvir edilir. Təlim dəsti hər bir element üçün hansı sinfə aid olduğu göstərilən nümunədir.

Texniki diaqnostikada qərar qəbul etmək üçün diskriminant təhlilindən istifadə nümunəsini nəzərdən keçirək. Tutaq ki, məhsulun bir sıra parametrlərinin ölçülməsinin nəticələrinə əsasən, qüsurların olub-olmamasını müəyyən etmək lazımdır. Bu halda, əlavə tədqiqatlar zamanı aşkar edilmiş qüsurlar, məsələn, müəyyən bir əməliyyat müddətindən sonra aparılan təlim nümunəsinin elementləri üçün göstərilir. Diskriminant təhlili nəzarətin həcmini azaltmağa və həmçinin məhsulların gələcək davranışını proqnozlaşdırmağa imkan verir. Diskriminant təhlili reqressiya təhlilinə bənzəyir - birincisi keyfiyyət xarakteristikasının dəyərini proqnozlaşdırmağa imkan verir, ikincisi isə kəmiyyətdir. Qeyri-ədədi təbiətli obyektlərin statistikasında xüsusi halları reqressiya və diskriminant təhlilləri olan riyazi sxem hazırlanmışdır.

Klaster təhlili, statistik məlumatlara əsaslanaraq, nümunə elementlərini qruplara bölmək lazım olduqda istifadə olunur. Üstəlik, eyni qrupdan olan bir qrupun iki elementi onlarda ölçülən xüsusiyyətlərin dəyərlərinin cəmi baxımından "yaxın", müxtəlif qruplardan olan iki element isə eyni mənada "uzaq" olmalıdır. Diskriminant təhlilindən fərqli olaraq, klaster analizində siniflər müəyyən edilmir, lakin statistik məlumatların işlənməsi prosesində formalaşır. Məsələn, klaster təhlili bir sıra polad markalarını (və ya soyuducu markalarını) bir-birinə bənzər qruplara bölmək üçün istifadə edilə bilər.

Klaster analizinin başqa bir növü xüsusiyyətlərin bir-birinə yaxın olan qruplara bölünməsidir. Nümunə korrelyasiya əmsalı xüsusiyyətlərin oxşarlığının göstəricisi kimi xidmət edə bilər. Xüsusiyyətlərin klaster analizinin məqsədi nəzarət edilən parametrlərin sayını azaltmaq ola bilər ki, bu da nəzarət xərclərini əhəmiyyətli dərəcədə azalda bilər. Bunu etmək üçün, bir-biri ilə sıx əlaqəli xüsusiyyətlər qrupundan (korrelyasiya əmsalı 1-ə yaxındır - onun maksimum dəyəri) birinin dəyəri ölçülür, qalanlarının dəyərləri isə reqressiya təhlili ilə hesablanır.

Qruplaşdırma problemləri siniflər əvvəlcədən müəyyən edilmədikdə və bir-birindən “uzaqda” olmadıqda həll edilir. Buna misal olaraq tələbələri təhsil qruplarına qruplaşdırmaq olar. Texnologiyada qruplaşdırma məsələsinin həlli çox vaxt parametrik sıra olur - mümkün standart ölçülər parametrik sıra elementlərinə görə qruplaşdırılır. Ədəbiyyatda tətbiqi statistikaya dair normativ, texniki və təlimat sənədlərində, müşahidə nəticələrinin qruplaşdırılmasından da bəzən istifadə olunur (məsələn, histoqramların qurulması zamanı).

Təsnifat məsələləri təkcə çoxvariantlı statistik təhlildə deyil, həm də müşahidələrin nəticələri ədədlər, funksiyalar və ya qeyri-ədədi xarakterli obyektlər olduqda həll edilir. Beləliklə, bir çox klaster analizi alqoritmləri yalnız obyektlər arasındakı məsafələrdən istifadə edir. Buna görə də, aralarındakı məsafələr göstərildiyi müddətcə, onlardan qeyri-ədəd xarakterli obyektləri təsnif etmək üçün də istifadə edilə bilər. Ən sadə təsnifat problemi belədir: iki müstəqil nümunə verildikdə, onların iki və ya bir sinfi təmsil etdiyini müəyyən etmək lazımdır. Birdəyişənli statistikada bu vəzifə homojenlik fərziyyəsinin sınaqdan keçirilməsinə düşür.

Çoxvariantlı statistik təhlilin üçüncü bölməsi ölçülərin azaldılması problemidir (informasiyanın sıxılması). Onların həllinin məqsədi ilkin xarakteristikaları çevirməklə əldə edilmiş törəmə göstəricilər toplusunu müəyyən etməkdir ki, törəmə göstəricilərin sayı ilkin göstəricilərin sayından əhəmiyyətli dərəcədə azdır, lakin onlar şəhadətnamədə mövcud olan məlumatların mümkün olan ən böyük hissəsini ehtiva edir. orijinal statistik məlumatlar. Ölçülərin azaldılması problemləri çoxölçülü miqyaslama metodlarından, əsas komponentlərdən, faktor analizindən və s. istifadə etməklə həll edilir. Məsələn, ən sadə çoxölçülü miqyaslama modelində ilkin məlumatlar k obyekt arasındakı qoşa məsafələrdir və hesablamaların məqsədi obyektləri nöqtə kimi təqdim etməkdir. təyyarədə. Bu, obyektlərin bir-biri ilə necə əlaqəli olduğunu hərfi mənada görməyə imkan verir. Bu məqsədə nail olmaq üçün hər bir obyektə müstəvidə elə bir nöqtə təyin etmək lazımdır ki, i və j rəqəmləri olan cisimlərə uyğun olan nöqtələr arasında sij qoşa məsafələr bu obyektlər arasındakı ij məsafələrini mümkün qədər dəqiq əks etdirsin. Ən kiçik kvadratlar metodunun əsas fikrinə görə, müstəvidəki nöqtələr elə tapılır ki, qiymət

ən aşağı dəyərinə çatmışdır. Ölçülərin azaldılması və məlumatların vizuallaşdırılması problemlərinin bir çox başqa formaları var.

ehtimal riyazi statistika keyfiyyəti

ÇOXDƏNİŞLİ STATİSTİK TƏHLİL

Riyaziyyat bölməsi riyaziyyata həsr olunmuş statistika. çoxvariantlı statistik məlumatların toplanması, sistemləşdirilməsi və emalı üçün optimal planların qurulması üsullarını. tədqiq olunan çoxölçülü əlamətin komponentləri arasında əlaqələrin xarakterini və strukturunu müəyyən etməyə yönəlmiş və elmi və praktiki məlumat əldə etmək üçün nəzərdə tutulan məlumatlar. nəticələr. Çoxölçülü xüsusiyyət p-ölçülü göstəricilər (işarələr, dəyişənlər) kimi başa düşülür ki, bunlar arasında aşağıdakılar ola bilər: kəmiyyət, yəni. obyektin tədqiq olunan xassəsinin təzahürlərini müəyyən miqyasda skalyar şəkildə ölçmək, ordinal (və ya sıra), yəni. öyrənilən xassələrin onlarda təzahür dərəcəsinə görə təhlil edilən obyektləri; və təsnifat (və ya nominal), yəni öyrənilən obyektlər toplusunu sıralana bilməyən bircins (təhlil olunan xassə görə) siniflərə bölməyə imkan verir. Bu göstəricilərin ölçülməsinin nəticələri

tədqiq olunan əhalinin hər bir obyektində çoxölçülü müşahidələr və ya MS-nin aparılması üçün çoxölçülü məlumatların ilkin massivi əmələ gəlir. A. M. s-nin əhəmiyyətli bir hissəsi. A. tədqiq olunan çoxölçülü atributun çoxölçülü və müvafiq olaraq çoxölçülü müşahidələr ardıcıllığı (1) kimi şərh edildiyi vəziyyətlərə xidmət edir - ümumi əhali kimi. Bu zaman ilkin statistik məlumatların emalı üsullarının seçimi. verilənlər və onların xassələrinin təhlili çoxölçülü (birgə) ehtimal paylama qanununun təbiəti ilə bağlı müəyyən fərziyyələr əsasında həyata keçirilir.

Çoxdəyişənli paylanmaların və onların əsas xarakteristikalarının çoxdəyişənli statistik təhlili yalnız işlənmiş müşahidələrin (1) ehtimal xarakterli olduğu, yəni müvafiq ümumi populyasiyadan seçmə kimi şərh edildiyi vəziyyətləri əhatə edir. Bu alt bölmənin əsas məqsədləri aşağıdakılardır: statistik. tədqiq olunan çoxölçülü paylanmaların qiymətləndirilməsi, onların əsas ədədi xarakteristikaları və parametrləri; istifadə olunan statistik məlumatların xassələrinin öyrənilməsi. qiymətlər; bir sıra statistik məlumatlar üçün ehtimal paylamalarının öyrənilməsi, onların köməyi ilə statistika qurulur. təhlil edilən çoxölçülü məlumatların ehtimal xarakteri haqqında müxtəlif fərziyyələrin sınaqdan keçirilməsi üçün meyarlar. Əsas nəticələr, tədqiq olunan xarakteristikanın sıxlıq funksiyası əlaqə ilə verilən çoxölçülü normal paylanma qanununa tabe olduğu xüsusi vəziyyətə aiddir.

vektor riyaziyyatı haradadır. təsadüfi dəyişənin komponentlərinin gözləntiləri, yəni. təsadüfi vektorun kovariasiya matrisidir, yəni vektorun komponentlərinin kovariasiyası (degenerasiya olunmayan hal o zaman nəzərə alınır; əks halda, yəni rütbə ilə, bütün nəticələr etibarlı qalır, lakin daha aşağı ölçülü alt fəzaya münasibətdə). , tədqiq olunan cəmlənmiş təsadüfi vektor olduğu ortaya çıxır).

Beləliklə, əgər (1) təsadüfi seçməni təşkil edən müstəqil müşahidələr ardıcıllığıdırsa, o zaman parametrlər üçün maksimum ehtimal qiymətləndirmələri və (2)-də iştirak edənlər müvafiq olaraq statistikadır (bax, )

təsadüfi vektor isə p ölçülü normal qanuna tabedir və -dən asılı deyil və matris elementlərinin birgə paylanması sözdə təsvir olunur. Wisha rayonunun paylanması (bax), to-rogo

Eyni sxem çərçivəsində çoxdəyişənli təsadüfi kəmiyyətin belə seçmə xüsusiyyətlərinin paylanması və anları cüt, qismən və çox korrelyasiya əmsalları, ümumiləşdirilmiş (yəni), ümumiləşdirilmiş -Otel statistikası (bax). Xüsusilə (bax), əgər “qərəzsizliyə görə” düzəldilmiş təxmini nümunə kovariasiya matrisi kimi təyin etsək, yəni:

sonra təsadüfi dəyişən zamana və təsadüfi dəyişənlərə meyl edir

müvafiq olaraq (p, p-p) və (p,) sərbəstlik dərəcələri ilə F-paylanmalarına əməl edin n 1 + n 2-p-1). Nisbətən (7) n 1 və n 2 - eyni ümumi kütlədən çıxarılan (1) tipli iki müstəqil nümunənin həcmi - i-ci nümunədən qurulmuş (3) və (4)-(5) tipli qiymətləndirmələr və

Təxminlər əsasında qurulmuş ümumi nümunə kovaryansı və

Tədqiq olunan çoxölçülü əlamətin komponentləri arasında əlaqələrin təbiəti və strukturunun çoxölçülü statistik təhlili MS-in belə üsul və modellərinə xidmət edən anlayışları və nəticələri birləşdirir. a., çoxölçülü, çoxölçülü dispersiya təhlili Və kovariasiya təhlili, faktor analizi və əsas komponent analizi, kanonik analiz. korrelyasiya. Bu yarımbölmənin məzmununu təşkil edən nəticələri iki əsas növə bölmək olar.

1) Ən yaxşı (müəyyən mənada) statistik məlumatların qurulması. qeyd olunan modellərin parametrləri üçün qiymətləndirmələr və onların xassələrinin təhlili (dəqiqlik və ehtimal formulunda - onların paylanma qanunları, etibarlılıq bölgələri və s.). Beləliklə, tədqiq olunan çoxölçülü xüsusiyyət p-ölçülü normal paylanmaya tabe olan təsadüfi vektor kimi şərh edilsin və iki altvektora - sütunlara və müvafiq olaraq q və p-q ölçülərinə bölünsün. Bu vektorun riyazi olaraq müvafiq bölgüsünü təyin edir. gözləntilər, nəzəri və nümunəvi kovariasiya matrisləri, yəni:

Onda (bax , ) subvektor (ikinci subvektor sabit qiymət almaq şərtilə) də normal olacaq). Bu halda, maksimum ehtimal təxminləri. bu klassik çoxdəyişənli çoxlu reqressiya modelinin reqressiya əmsallarının və kovariativlərinin matrisləri üçün

müvafiq olaraq qarşılıqlı müstəqil statistika olacaq

burada qiymətləndirmənin paylanması normal qanuna tabedir , və təxminlər n - Uişart qanunu parametrləri ilə və (kovariasiya matrisinin elementləri matris elementləri ilə ifadə edilir).

Parametr qiymətləndirmələrinin qurulması və amil analizi modellərində, əsas komponentlər və kanonik korrelyasiya modellərində onların xassələrinin öyrənilməsi üzrə əsas nəticələr, müxtəlif seçmə kovariasiya matrislərinin öz qiymətlərinin və vektorlarının ehtimal-statistik xassələrinin təhlili ilə əlaqədardır.

Klassik çərçivəyə uyğun gəlməyən sxemlərdə. normal model və xüsusən də hər hansı bir ehtimal modeli çərçivəsində əsas nəticələr müəyyən bir ekzogen olaraq verilmiş funksional nöqteyi-nəzərdən ən yaxşı olan parametr qiymətləndirmələrinin hesablanması üçün alqoritmlərin qurulmasına (və onların xassələrinin öyrənilməsinə) aiddir. modelin keyfiyyəti (və ya adekvatlığı).

2) Statistik məlumatların qurulması. tədqiq olunan əlaqələrin strukturu haqqında müxtəlif fərziyyələrin sınaqdan keçirilməsi üçün meyarlar. Çoxdəyişənli normal model çərçivəsində ((1) tipli müşahidələrin ardıcıllığı müvafiq çoxdəyişənli normal populyasiyalardan təsadüfi nümunələr kimi şərh olunur), məsələn, statistik aşağıdakı fərziyyələri yoxlamaq üçün meyarlar.

I. Riyazi vektorun bərabərliyi haqqında fərziyyələr. tədqiq olunan göstəricilərin verilmiş konkret vektora gözləntiləri; Hotelling - statistik düsturu (6) əvəz etməklə yoxlanılır

II. Riyazi vektorların bərabərliyi haqqında fərziyyələr. iki nümunə ilə təmsil olunan iki populyasiyada gözləntilər (eyni, lakin naməlum kovariasiya matrisləri ilə); statistik məlumatlarla təsdiqlənir (bax).

III. Riyazi vektorların bərabərliyi haqqında fərziyyələr. nümunələri ilə təmsil olunan bir neçə ümumi populyasiyada gözləntilər (eyni, lakin naməlum kovariasiya matrisləri ilə); statistik məlumatlarla təsdiqlənir

j-ci ümumi kütləni təmsil edən həcm nümunəsində i-ci p-ölçülü müşahidənin olduğu və müvafiq olaraq nümunələrin hər biri və birləşdirilmiş üçün ayrıca qurulmuş (3) formasının təxminləridir. həcm nümunəsi

IV. Nümunələri ilə təmsil olunan bir neçə normal populyasiyanın ekvivalentliyi haqqında fərziyyələr statistikadan istifadə etməklə yoxlanılır.

kəsikdə - müşahidələrdən ayrıca qurulmuş (4) tipli qiymətləndirmə j- nümunələr, j=1, 2, ... , k.

V. Öyrənilən göstəricilərin orijinal p-ölçülü vektorunun bölündüyü müvafiq olaraq altvektorların-ölçü sütunlarının qarşılıqlı müstəqilliyi haqqında fərziyyələr statistikadan istifadə etməklə təsdiqlənir.

bütün vektor və onun alt vektoru üçün (4) formasının nümunə kovariasiya matrisləri olan və bunlardır. x(i) müvafiq olaraq.

Tədqiq olunan çoxölçülü müşahidələr toplusunun həndəsi strukturunun çoxölçülü statistik təhlili belə model və sxemlərin konsepsiyalarını və nəticələrini özündə birləşdirir. diskriminant təhlili, ehtimal paylamalarının qarışıqları, klaster təhlili və taksonomiya, çoxölçülü miqyaslama. Bütün bu sxemlərdə əsas anlayış təhlil olunan elementlər arasında məsafə (yaxınlıq ölçüləri, oxşarlıq ölçüləri) anlayışıdır. Bu vəziyyətdə, onlar hər birində göstəricilərin dəyərləri qeyd olunan real obyektlər kimi təhlil edilə bilər - sonra həndəsi. i-ci tədqiq olunan obyektin təsviri müvafiq p-ölçülü fəzada bir nöqtə olacaq və göstəricilərin özləri - sonra həndəsi. l-ci göstəricinin təsviri müvafiq n-ölçülü fəzada nöqtə olacaqdır.

Diskriminant təhlilinin üsulları və nəticələri (bax , , ) aşağıdakı vəzifəyə yönəldilmişdir. Məlumdur ki, müəyyən sayda populyasiyalar mövcuddur və tədqiqatçı hər bir populyasiyadan bir nümunəyə malikdir (“təlim nümunələri”). Mövcud təlim nümunələri əsasında, tədqiqatçının əvvəlcədən bilmədiyi bir vəziyyətdə onun ümumi populyasiyasına müəyyən yeni element (müşahidə) təyin etməyə imkan verən ən yaxşı, müəyyən mənada təsnifat qaydasını qurmaq tələb olunur. bu element hansı əhaliyə aiddir. Adətən, təsnifat qaydası hərəkətlərin ardıcıllığı kimi başa düşülür: tədqiq olunan göstəricilərin skalyar funksiyasını hesablayaraq, kəsimin dəyərlərinə əsaslanaraq, siniflərdən birinə bir element təyin etmək qərarı verilir (qurulması). diskriminant funksiyası); elementlərin siniflərə düzgün təyin edilməsi nöqteyi-nəzərindən onların informasiya məzmununun dərəcəsinə görə göstəricilərin özlərini sıralamaqla; müvafiq səhv təsnifat ehtimallarını hesablamaqla.

Çox vaxt (lakin həmişə deyil) ehtimal paylamalarının qarışıqlarını təhlil etmək vəzifəsi də nəzərdən keçirilən əhalinin "həndəsi quruluşunun" öyrənilməsi ilə əlaqədar yaranır. Bu halda, r-ci homojen sinif anlayışı müəyyən (adətən unimodal) paylanma qanunu ilə təsvir edilən ümumi populyasiyadan istifadə etməklə rəsmiləşdirilir ki, nümunənin (1) çıxarıldığı ümumi əhalinin paylanması aşağıdakı kimi təsvir edilir: p r - ümumi populyasiyada r-ci sinifin a priori ehtimalı (xüsusi elementləri) olduğu formada paylanmaların qarışığı. Çətinlik "yaxşı" statistikadır. naməlum parametrlərin qiymətləndirilməsi (nümunədən) və bəzən Kimə. Bu, xüsusən, elementlərin təsnifatını diskriminant analiz sxeminə endirməyə imkan verir, baxmayaraq ki, bu vəziyyətdə təlim nümunələri yox idi.

Klaster təhlilinin metodları və nəticələri (təsnifat, taksonomiya, “nəzarətsiz” nümunənin tanınması, bax , , ) aşağıdakı problemin həllinə yönəldilmişdir. Həndəsi təhlil edilən elementlər toplusu ya müvafiq nöqtələrin koordinatları ilə verilir (yəni, matris ..., n) , və ya həndəsi bir sıra onların nisbi mövqeyinin xüsusiyyətləri, məsələn, cüt məsafələr matrisi. Öyrənilən elementlər toplusunu nisbətən kiçik (əvvəllər məlum olan və ya olmayan) siniflərə bölmək tələb olunur ki, bir sinfin elementləri bir-birindən qısa məsafədə yerləşsin, müxtəlif siniflər isə, mümkünsə, bir-birindən kifayət qədər uzaq olsunlar. bir-birindən uzaq olan hissələrə bölünməzdi.

Çoxölçülü miqyaslama problemi (bax) tədqiq olunan elementlər çoxluğunun cüt məsafələr matrisindən istifadə etməklə müəyyən edildiyi və elementlərin hər birinə verilmiş sayda (p) koordinatların təyin edilməsindən ibarət olan vəziyyətə aiddir. bu köməkçi koordinatlardan istifadə etməklə ölçülən elementlər arasında cüt-cüt qarşılıqlı məsafələrin strukturu orta hesabla veriləndən ən az fərqlənəcəkdir. Qeyd etmək lazımdır ki, klaster analizinin və çoxölçülü miqyaslılığın əsas nəticələri və üsulları adətən mənbə məlumatlarının ehtimal xarakteri ilə bağlı heç bir fərziyyə olmadan hazırlanır.

Çoxvariantlı statistik təhlilin tətbiqi məqsədi əsasən aşağıdakı üç problemə xidmət etməkdir.

Təhlil olunan göstəricilər arasında asılılıqların statistik tədqiqi problemi. Fərz etsək ki, tədqiq edilmiş statistik qeydə alınmış göstəricilər x toplusu bu göstəricilərin mənalı mənasına və tədqiqatın yekun məqsədlərinə əsasən proqnozlaşdırılan (asılı) dəyişənlərin q-ölçülü alt vektoruna və (p-q)-ölçülü alt vektoruna bölünür. proqnozlaşdırıcı (müstəqil) dəyişənlər üçün deyə bilərik ki, problem nümunə (1) əsasında icazə verilən həllər sinfindən belə q ölçülü vektor funksiyasını müəyyən etməkdir. F, kənar göstəricilərin subvektorunun davranışına müəyyən mənada ən yaxşı yaxınlaşmanı verəcəkdir. Funksionalın spesifik növündən asılı olaraq, yaxınlaşmanın keyfiyyəti və təhlil edilən göstəricilərin xarakteri çoxlu reqressiya, dispersiya, kovariasiya və ya birləşmə analizinin bu və ya digər sxeminə gəlir.

Elementlərin (obyektlərin və ya göstəricilərin) ümumi (qeyri-ciddi) formalaşdırılmasında təsnifləşdirilməsi problemi statistik olaraq matris və ya matris şəklində təqdim olunan bütün təhlil edilmiş elementlər toplusunu nisbətən az sayda homojenlərə bölməkdir. müəyyən mənada, qruplar. Aprior məlumatın xarakterindən və təsnifat keyfiyyət meyarını təyin edən xüsusi funksional növündən asılı olaraq, ayrı-seçkilik təhlilinin, klaster analizinin (taksonomiya, "nəzarətsiz" nümunənin tanınması) və paylama qarışıqlarının parçalanmasının bu və ya digər sxeminə gəlir. .

Tədqiq olunan amil məkanının ölçüsünü azaltmaq və ən informativ göstəriciləri seçmək problemi ilkin göstəricilərin yol verilən çevrilmə sinfində tapılan nisbətən az sayda göstəricilərin belə bir dəstini müəyyən etməkdir. m-ölçülü xüsusiyyətlər sisteminin informasiya məzmununun ekzogen olaraq verilmiş ölçüsünün yuxarı müəyyən dəstəsinə nail olunduğu (bax). Avtoinformasiya ölçüsünü təyin edən funksionalın təyin edilməsi (yəni, statistik massivdə (1) orijinal xüsusiyyətlərin özlərinə nisbətən məlumatın qorunmasını maksimum dərəcədə artırmağa yönəldilmiş), xüsusən də faktor təhlilinin müxtəlif sxemlərinə və əsas parametrlərə səbəb olur. komponentləri, xüsusiyyətlərin ifrat qruplaşdırılması üsullarına . Xarici informasiya məzmununun ölçüsünü təyin edən, yəni (1) göstəricilərdə və ya hadisələrdə birbaşa olmayan bəzi digərləri ilə bağlı maksimum məlumat əldə etməyə yönəlmiş funksiyalar statistik sxemlərdə ən informativ göstəricilərin seçilməsi üçün müxtəlif üsullara səbəb olur. asılılıq tədqiqatı və diskriminant təhlili.

MS-nin əsas riyazi alətləri. A. xətti tənliklər sistemləri nəzəriyyəsinin və matris nəzəriyyəsinin xüsusi üsullarını (xüsusi qiymətlərin və vektorların sadə və ümumiləşdirilmiş məsələlərinin həlli üsulları; matrislərin sadə inversiya və psevdoinversiyaları; matrislər üçün diaqonallaşdırma prosedurları və s.) və müəyyən optimallaşdırma alqoritmlərini (metodları) təşkil edir. koordinat enişi, konjugat qradiyenti, budaq və bağlı, təsadüfi axtarışın müxtəlif versiyaları və stoxastik yaxınlaşma və s.).

yanan.: Anderson T., Çoxvariantlı statistik təhlilə giriş, trans. İngilis dilindən, M., 1963; Kendall M.J., Stewart A., Çoxvariantlı statistik analiz və zaman seriyası, trans. İngilis dilindən, M., 1976; Bolşev L.N., "Bull. Int. Stat. Inst.", 1969, No 43, s. 425-41; Wishart .J., "Biometrika", 1928, v. 20A, səh. 32-52: Hotelling H., "Ann. Math. Stat.", 1931, v. 2, səh. 360-78; [c] Kruskal J. V., "Psixometrika", 1964, v. 29, səh. 1-27; Ayvazyan S. A., Bezhaeva Z. İ., . Staroverov O.V., Çoxölçülü müşahidələrin təsnifatı, M., 1974.

S.A. Ayvazyan.

Riyazi ensiklopediya. - M.: Sovet Ensiklopediyası. I. M. Vinoqradov. 1977-1985.

Texniki Tərcüməçi Bələdçisi

Riyaziyyata həsr olunmuş riyazi statistika bölməsi (bax). tədqiq olunan (bax) çoxölçülü əlamətin komponentləri arasında əlaqələrin təbiətini və strukturunu müəyyən etməyə yönəlmiş və elmi əldə etmək üçün nəzərdə tutulan üsullar. və praktiki ......

Geniş mənada, bir neçə keyfiyyət və ya kəmiyyət xüsusiyyətləri ilə xarakterizə olunan obyektlərə aid statistik məlumatların öyrənilməsi üsullarını birləşdirən riyazi statistika bölməsi (Riyazi statistikaya baxın). Böyük Sovet Ensiklopediyası

ÇOXDƏNİŞLİ STATİSTİK TƏHLİL- üç və ya daha çox dəyişən arasında əlaqələri təhlil etmək üçün nəzərdə tutulmuş riyazi statistika bölməsi. A.M.S. problemlərinin üç əsas sinfini şərti olaraq ayıra bilərik. Bu, dəyişənlər arasında əlaqələrin strukturunun öyrənilməsi və məkanın ölçüsünü azaltmaqdır... Sosiologiya: Ensiklopediya

KOVARIANSIN TƏHLİLİ- – riyazi metodlar toplusu. müəyyən təsadüfi kəmiyyətin orta qiymətinin Y-nin qeyri-kəmiyyət amilləri çoxluğundan F və eyni zamanda kəmiyyət amilləri çoxluğundan asılılığının modellərinin təhlili ilə bağlı statistika.Y-yə münasibətdə... . .. Rus Sosioloji Ensiklopediyası

Riyaziyyat bölməsi məzmunu statistikanın inkişafı və tədqiqi olan statistika. aşağıdakı ayrı-seçkilik probleminin həlli üsulları: müşahidələrin nəticələrinə əsasən bir neçə mümkün variantdan hansının olduğunu müəyyən edin... ... Riyaziyyat Ensiklopediyası, Orlova İrina Vladlenovna, Kontsevaya Natalya Valerievna, Turundaevski Viktor Borisoviç. Kitab çoxvariantlı statistik təhlilə (MSA) və MSA-dan istifadə edərək hesablamaların təşkilinə həsr edilmişdir. Çoxvariantlı statistika metodlarını həyata keçirmək üçün statistik emal proqramı istifadə olunur...