İstatistiksel veri işlemenin unsurları. İstatistiksel veri işleme ve özellikleri İncelenen materyalin konsolidasyonu

İstatistiksel veri işlemenin unsurları.  İstatistiksel veri işleme ve özellikleri İncelenen materyalin konsolidasyonu
İstatistiksel veri işlemenin unsurları. İstatistiksel veri işleme ve özellikleri İncelenen materyalin konsolidasyonu

slayt 1

slayt 2

İstatistik, kitle eylemlerini, fenomenleri ve süreçleri tanımlayan verileri toplama, analiz etme ve işleme yöntemlerini inceleyen kesin bir bilimdir. Mevcut kalıpları tanımlamak için.

slayt 3

İstatistik çalışmaları: ülke ve bölgelerinin bireysel nüfus gruplarının sayısı, çeşitli ürün türlerinin üretimi ve tüketimi, malların ve yolcuların çeşitli ulaşım modlarıyla taşınması, doğal kaynaklar ve çok daha fazlası. İstatistiksel çalışmaların sonuçları, pratik ve bilimsel sonuçlar için yaygın olarak kullanılmaktadır. Şu anda, istatistik zaten lisede incelenmeye başlıyor, üniversitelerde zorunlu bir ders çünkü birçok bilim ve endüstri ile ilişkilendiriliyor. Mağazadaki satış sayısını artırmak, okuldaki bilgi kalitesini yükseltmek, ülkeyi ekonomik büyümede ilerletmek için istatistiksel araştırmalar yapmak ve uygun sonuçlar çıkarmak gerekir. Ve herkes bunu yapabilmelidir.

slayt 4

İstatistik unsurlarını incelemenin ana hedefleri İstatistiksel verilerin birincil işlenmesinde becerilerin oluşturulması; çeşitli biçimlerde sunulan nicel bilgilerin görüntüsü ve analizi (tablolar, diyagramlar, gerçek bağımlılıkların grafikleri şeklinde); önemli istatistiksel fikirler hakkında fikirlerin oluşumu, yani: tahmin fikri ve istatistiksel hipotezleri test etme fikri; rastgele olayların meydana gelme olasılıklarını belirli deneylerin sonuçlarıyla karşılaştırma becerilerinin oluşturulması.

slayt 5

İçindekiler Veri serisi Veri serisinin hacmi Veri serisinin kapsamı Veri serisinin modu Serinin ortancası Aritmetik ortalama Sıralı veri serisi Veri dağıtım tablosu Toplama Nominatif veri serisi Sonuç frekansı Yüzde frekansı Veri gruplama Veri işleme yöntemleri Özetleme

slayt 6

Tanım Bir veri serisi, bir tür ölçümün sonuçlarının bir serisidir. Örneğin: 1) bir kişinin boyunun ölçümleri 2) Bir kişinin (hayvan) ağırlığının ölçümleri 3) Sayaç okumaları (elektrik, su, ısı ...) 4) Yüz metre koşusu vb.

Slayt 7

Tanım Bir veri serisinin boyutu, tüm verilerin miktarıdır. Örneğin: bir dizi sayı verildiğinde 1; 3; 6; -4; 0, hacmi 5'e eşit olacaktır. Neden?

Slayt 8

Görevi tamamlayın: Enstitüde yüksek matematikte bir testi geçtiler. Grupta 10 kişi vardı ve karşılık gelen notları aldılar: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Hacmi belirleyin bu sıra. Cevap: 10

Slayt 9

Tanım Aralık, bir veri kümesindeki en büyük ve en küçük sayılar arasındaki farktır. Örneğin: bir sayı dizisi 1 verilirse; 3; 6; -4; 0; 2, o zaman bu veri serisinin aralığı 6'ya eşit olacaktır (çünkü 6 - 0 = 6)

slayt 10

Görevi tamamlayın: Enstitüde yüksek matematikte bir testi geçtiler. Grupta 10 kişi vardı ve karşılık gelen notları aldılar: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Bu dizinin aralığını belirleyin. Cevap: 3

slayt 11

Tanım Bir veri serisinin modu, bu seride en sık görülen seri sayısıdır. Bir veri kümesinin bir modu olabilir veya olmayabilir. Dolayısıyla, 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 veri dizilerinde, 47 ve 52 sayılarının her biri iki kez ve kalan sayılar - ikiden az. Bu gibi durumlarda serinin iki modu olduğu kabul edildi: 47 ve 52.

slayt 12

Görevi tamamlayın: Yani, 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 veri serisinde, 47 ve 52 sayılarının her biri iki kez ve kalan sayılar - ikiden az. Bu gibi durumlarda, dizinin iki modu olduğu kabul edildi: 47 ve 52. Enstitüde yüksek matematik sınavını geçtiler. Grupta 10 kişi vardı ve karşılık gelen notları aldılar: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Bu dizinin modunu belirleyin. Cevap: 4

slayt 13

Tanım Tek sayılı terimlerin ortancası, ortasına yazılan sayıdır. Terim sayısı çift olan medyan, ortaya yazılan iki sayının aritmetik ortalamasıdır. Örneğin: bir dizi sayının ortancasını belirleyin 1) 6; -4; 5; -2; -3; 3; 3; -2; 3. Cevap: -3 2) -1; 0; 2; 1; -1; 0;2; -1. Cevap: 0

slayt 14

Görevi tamamlayın: Enstitüde yüksek matematikte bir testi geçtiler. Grupta 10 kişi vardı ve karşılık gelen puanları aldılar: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Bu serinin ortancasını belirleyin. Cevap: 4

slayt 15

Tanım Aritmetik ortalama, bir serideki sayıların toplamının kendi sayılarına bölünmesinin bölümüdür. Örneğin: bir dizi sayı verildiğinde -1; 0; 2; 1; -1; 0; 2; -1. O zaman aritmetik ortalama şöyle olacaktır: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0.25

slayt 16

Görevi tamamlayın: Enstitüde yüksek matematikte bir testi geçtiler. Grupta 10 kişi vardı ve karşılık gelen notları aldılar: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Bu dizinin aritmetik ortalamasını belirleyin. Cevap: 3.9

slayt 17

UYGULAMALI ÇALIŞMA Görev: Dördüncü çeyrekte öğrenci Ivanov'un matematikteki ilerlemesini karakterize etmek. İŞİN YAPILMASI: 1. Bilgi toplama: Dergiden notlar yazılır: 5,4,5,3,3,5,4,4,4. 2. Elde edilen verilerin işlenmesi: hacim = 9 aralık = 5 - 3 = 2 mod = 4 medyan = 3 aritmetik ortalama = (5+4+5+3+3+5+4+4+4) : 9 ≈ 4 : öğrenci her zaman derse hazır değildir. Ağırlıklı olarak "4" de çalışmalar. Çeyrek için "4" gelir.

slayt 18

Bağımsız olarak: Serinin hacmini, serinin aralığını, modu, medyanı ve aritmetik ortalamayı bulmak gerekir: Kart 1. 22.5; 23; 21.5; 22; 23. Kart 2. 6; -4; 5; -2; -3; 3; 3; -2; 3. Kart 3. 12.5; 12; 12; 12.5; 13; 12.5; 13. Kart 4. -1; 0; 2; 1; -1; 0; 2; -1. Kart 5. 125; 130; 124; 131. Kart 6. 120; 100; 110.

slayt 19

Kart 1. seri hacmi = 5 seri aralığı = 10 mod = 23 medyan = 21,5 aritmetik ortalama = 13,3 Kart 3. seri hacmi = 7 seri aralığı = 1 mod = 12,5 medyan = 12,5 aritmetik ortalama = 12,5 Kart 2 . seri hacmi = 9 seri aralığı = 10 mod = 3 medyan = -3 aritmetik ortalama = 1 Kart 4. seri hacmi = 8 seri aralığı = 3 mod = -1 medyan = 0 aritmetik ortalama = 0.25

slayt 20

Kontrol edelim Kart 5. seri hacmi = 4 seri aralığı = 7 mod = ortanca yok = 127 aritmetik ortalama = 127.5 Kart 6. seri hacmi = 3 seri aralığı = 20 mod = medyan yok = 100 aritmetik ortalama = 110

slayt 21

Tanım Sıralı bir veri dizisi, verilerin bir tür kurala göre düzenlendiği bir dizidir.Bir dizi sayı nasıl sıralanır? (Sayıları, sonraki her sayı bir öncekinden daha az (daha fazla) olmayacak şekilde yazın); veya bazı isimleri "alfabetik sırayla" yazın ...

slayt 22

Görevi tamamlayın: Bir dizi sayı verildiğinde: -1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1 Düzenle artan sıra numaralarında. Çözüm: -3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3 Sonuç, sıralı bir seridir. Verilerin kendisi değişmedi, yalnızca göründükleri sıra değişti.

slayt 23

Tanım Veri dağılım tablosu, aynı sayının tekrarları yerine tekrar sayılarının kaydedildiği sıralı bir dizinin tablosudur. Tersine, eğer dağıtım tablosu biliniyorsa, sıralı bir veri serisi derlenebilir. Örneğin: -3; -3; -3; -1; -1; -1; -1; 5; 5; 7; 8; 8; 8; 8; 8 şeklinde sıralı bir dizi üretir.

slayt 24

Görevi tamamlayın: Bir kadın ayakkabı mağazasında istatistiksel çalışmalar yaptılar ve ayakkabı fiyatı ve satış sayısı için uygun bir tablo derlediler: Fiyat (rub.): 500 1200 1500 1800 2000 2500 Miktar: 8 9 14 15 3 1 sıralı veri serisi boyutu veri serisi aralığı serinin modu serinin medyanı veri serisinin aritmetik ortalaması

slayt 25

Ve şu soruları cevaplayın: Verilerden fiyat kategorileri, ayakkabı hangi fiyata mağazaya satılmamalıdır? Ayakkabı, hangi fiyattan dağıtılmalı? Hedeflemek için en iyi fiyat nedir?

slayt 26

Özetlemek gerekirse: İstatistiksel veri işlemenin nasıl gerçekleştiğine dair ilk kavramlarla tanıştık: veriler her zaman bir dizi ölçümün sonucudur, bazı veriler bulunabilir: hacim, aralık, mod, medyan ve aritmetik ortalama 3) herhangi bir veri serisi sipariş edilebilir ve derlenebilir veri dağıtım tablosu

slayt 27

Tanım Yalın veri serisi SAYISAL VERİ DEĞİLDİR, örneğin isimler; başlıklar; adaylıklar ... Örneğin: 1930'dan beri Dünya Kupası finalistlerinin listesi: Arjantin, Çekoslovakya, Macaristan, Brezilya, Macaristan, İsveç, Çekoslovakya, Almanya, İtalya, Hollanda, Hollanda, Almanya, Almanya, Arjantin, İtalya, Brezilya, Almanya, Fransa

slayt 28

Görevi tamamlayın: Önceki örnekten bulun: serinin hacmi 2) serinin modu 3) bir dağıtım tablosu yapın Çözüm: hacim \u003d 18; moda bir alman takımıdır.

slayt 29

Deney sonuçlarının istatistiksel olarak işlenmesi yöntemleri, deney sırasında elde edilen göstergelerin genelleştirilebildiği, sisteme getirilebildiği ve içlerinde gizli kalıpları ortaya çıkarabildiği matematiksel yöntemler, formüller, nicel hesaplama yöntemleridir.

Deneyde incelenen değişkenler arasında var olan istatistiksel nitelikteki bu tür düzenliliklerden bahsediyoruz.

Veri işlenme amacına göre tasnif edilecek veya kategorize edilecek ana unsurlardır 26 .

Matematiksel ve istatistiksel analiz yöntemlerinden bazıları, verilerin örnek dağılımını karakterize eden sözde temel matematiksel istatistiklerin hesaplanmasını mümkün kılar, örneğin:

örnek ortalama,

örneklem varyansı,

Medyan ve diğerleri.

Diğer matematiksel istatistik yöntemleri, bireysel örnek istatistiklerindeki değişikliklerin dinamiklerini yargılamayı mümkün kılar, örneğin:

dağılım analizi,

Regresyon analizi.

Üçüncü grup örnekleme yöntemleri kullanılarak, bu deneyde incelenen değişkenler arasında var olan istatistiksel ilişkiler güvenilir bir şekilde yargılanabilir:

Korelasyon analizi;

Faktor analizi;

karşılaştırma yöntemleri.

Tüm matematiksel-istatistiksel analiz yöntemleri geleneksel olarak birincil ve ikincil 27'ye ayrılır.

Deneyde yapılan ölçümlerin sonuçlarını doğrudan yansıtan göstergeler elde etmenin mümkün olduğu yöntemlere birincil denir.

İkincil yöntemlere, birincil verilere dayanarak içlerinde gizli olan istatistiksel kalıpların ortaya çıkarıldığı istatistiksel işleme denir.

Birincil istatistiksel işleme yöntemleri, örneğin şunları içerir:

Numune ortalamasının belirlenmesi;

Örnek varyansı;

Seçici moda;

Örnek medyan.

İkincil yöntemler tipik olarak şunları içerir:

Korelasyon analizi;

Regresyon analizi;

İki veya daha fazla numune için birincil istatistikleri karşılaştırma yöntemleri.

Örnek ortalamadan başlayarak temel matematiksel istatistikleri hesaplama yöntemlerini ele alalım.

Aritmetik ortalama - tüm veri değerleri toplamının terim sayısına oranıdır 28 .

İstatistiksel bir gösterge olarak ortalama değer, deneyde incelenen psikolojik kalitenin ortalama değerlendirmesidir.

Bu değerlendirme, psikodiagnostik muayeneye tabi tutulan denek grubunda bir bütün olarak gelişim derecesini karakterize eder. İki veya daha fazla numunenin ortalama değerlerini doğrudan karşılaştırarak, değerlendirilen kalitenin bu numunelerini oluşturan kişilerde göreceli gelişme derecesini yargılayabiliriz.

Numune ortalaması, aşağıdaki formül 29 kullanılarak belirlenir:

burada x cf, numune ortalaması veya numunenin aritmetik ortalamasıdır;

n - ortalama değerin hesaplandığı temelde örnek veya özel psikoteşhis göstergelerindeki denek sayısı;

x k - bireysel konular için özel gösterge değerleri. Bu tür n gösterge vardır, bu nedenle bu değişkenin k indeksi 1'den n'ye kadar değerler alır;

∑ - matematikte kabul edilen, bu işaretin sağındaki değişkenlerin değerlerinin toplam işareti.

Dağılım 30'un ortalama değeri hakkındaki verilerin dağılımının bir ölçüsüdür.

Varyans ne kadar büyük olursa, verilerdeki varyans veya dağılım da o kadar büyük olur. Aynı ortalamaya sahip fakat farklı dağılıma sahip nicelikleri birbirinden ayırt edebilmek için belirlenir.

Dispersiyon aşağıdaki formülle belirlenir:

örneklem varyansı veya basitçe varyans nerede;

Bu örnekteki ilkinden sonuncusuna kadar tüm x k'ler için özel ve ortalama değerler arasındaki farkların hesaplanması, bu farkların karesinin alınması ve toplanması gerektiği anlamına gelen bir ifade;

n, örneklemdeki denek sayısı veya varyansın hesaplandığı birincil değerlerdir.

Medyan çalışılan özelliğin değeri, bu özelliğin değerine göre sıralanan örneği ikiye bölen olarak adlandırılır.

Ortancayı bilmek, incelenen özelliğin belirli değerlerinin dağılımının simetrik olup olmadığını ve sözde normal dağılıma yaklaşıp yaklaşmadığını belirlemek için yararlıdır. Normal bir dağılım için ortalama ve medyan genellikle aynıdır veya birbirinden çok az farklılık gösterir.

Özelliklerin örnek dağılımı normal ise, verilerin normal dağılımına dayalı ikincil istatistiksel hesaplama yöntemleri buna uygulanabilir. Aksi takdirde, hesaplamalara ciddi hatalar girebileceğinden bu yapılamaz.

Moda bir tane daha temel matematiksel istatistik ve deneysel verilerin dağılımının özelliği. Mod, çalışılan özelliğin en çok örnekte bulunan niceliksel değeridir.

Normal dağılım dahil olmak üzere simetrik özellik dağılımları için mod değerleri ortalama ve medyan değerlerle çakışır. Asimetrik olan diğer dağılım türleri için bu tipik değildir.

İki dizi deneysel veri arasındaki ilişkinin veya doğrudan ilişkinin ortaya çıkarıldığı ikincil istatistiksel işleme yöntemine denir. korelasyon analizi yöntemi. Bir olgunun diğerini nasıl etkilediğini veya dinamikleri içinde onunla nasıl ilişkili olduğunu gösterir. Bu tür bağımlılıklar, örneğin birbiriyle nedensel ilişki içinde olan nicelikler arasında mevcuttur. İki fenomenin istatistiksel olarak anlamlı bir şekilde birbiriyle ilişkili olduğu ortaya çıkarsa ve aynı zamanda bunlardan birinin diğer fenomenin nedeni olabileceğine dair bir güven varsa, o zaman kesinlikle aralarında nedensel bir ilişki olduğu sonucu çıkar. .

Bu yöntemin birkaç çeşidi vardır:

Doğrusal korelasyon analizi, değişkenler arasında mutlak değerlerinde doğrudan bağlantılar kurmanıza olanak tanır. Bu bağlantılar grafiksel olarak düz bir çizgi ile ifade edilir, dolayısıyla "doğrusal" adı verilir.

Doğrusal korelasyon katsayısı, aşağıdaki formül 31 kullanılarak belirlenir:

nerede r xy - doğrusal korelasyon katsayısı;

x, y - karşılaştırılan değerlerin ortalama örnek değerleri;

X Ben y Ben - karşılaştırılan miktarların özel numune değerleri;

P - karşılaştırılan gösterge serisindeki toplam değer sayısı;

Dispersiyonlar, karşılaştırılan değerlerin ortalama değerlerden sapmaları.

Sıra korelasyonu, değişkenlerin mutlak değerleri arasındaki bağımlılığı değil, büyüklük sırasına göre bir dizide işgal ettikleri sıralı yerler veya sıralar arasındaki bağımlılığı belirler. Sıra korelasyon katsayısı için formül 32'dir:

nerede Rs - Spearman'a göre sıra korelasyon katsayısı;

D Ben - sıralı sıralarda aynı konuların göstergelerinin sıraları arasındaki fark;

P - ilişkili serideki deneklerin veya dijital verilerin (sıralar) sayısı.

Laboratuvar çalışması №3. MatLab sisteminde istatistiksel veri işleme

Sorunun genel ifadesi

Uygulamanın asıl amacı laboratuvar işi MatLAB ortamında istatistiksel veri işleme ile çalışmanın temellerini tanımaktır.

teorik kısım

Birincil istatistiksel veri işleme

Verilerin istatistiksel olarak işlenmesi, birincil ve ikincil nicel yöntemlere dayanmaktadır. İstatistiksel verilerin birincil olarak işlenmesinin amacı, alınan bilgileri yapılandırmaktır; bu, verilerin gruplara ayrılması anlamına gelir. pivot tablolarçeşitli parametrelere göre. Ham veriler, bir kişinin alınan veri setinin yaklaşık bir değerlendirmesini yapabileceği ve alınan veri örneğinin veri dağılımı hakkında, örneğin verilerin homojenliği veya kompaktlığı hakkında bilgileri ortaya çıkarabileceği bir formatta sunulmalıdır. Birincil veri analizinden sonra, mevcut veri setinde hangi istatistiksel modellerin belirlendiği temelinde ikincil istatistiksel veri işleme yöntemleri uygulanır.

Bir veri dizisinde birincil istatistiksel analiz yapmak, aşağıdakiler hakkında bilgi edinmenizi sağlar:

Numune için en tipik değer nedir? cevap için bu soru merkezi eğilim ölçüleri belirlenir.

Bu karakteristik değere göre büyük bir veri dağılımı var mı, yani verilerin "belirsizliği" nedir? Bu durumda, değişkenlik ölçüleri belirlenir.

Merkezi eğilim ve değişkenlik ölçüsünün istatistiksel göstergelerinin sadece nicel verilerle belirlendiğini belirtmekte fayda var.

Merkezi Eğilim Ölçüleri- verilerin geri kalanının etrafında gruplandığı bir grup değer Böylece, merkezi eğilim ölçüleri veri dizisini genelleştirir, bu da hem bir bütün olarak örnek hakkında çıkarımlar yapmayı hem de yürütmeyi mümkün kılar. Karşılaştırmalı analiz birbirinden farklı örnekler.

Diyelim ki bir veri örneği var , ardından merkezi eğilim ölçüleri aşağıdaki göstergelerle tahmin ediliyor:

1. örnek ortalama tüm örnek değerlerin toplamının sayılarına bölünmesinin sonucudur.Formül (3.1) ile belirlenir.

(3.1)

Nerede - Ben-inci örnek eleman;

Nörnek elemanların sayısıdır.

Örnek ortalama, merkezi eğilimi tahmin etme sürecinde en yüksek doğruluğu sağlar.

Diyelim ki 20 kişilik bir örneklemimiz var. Örnek öğeler, her bir kişinin ortalama aylık geliri hakkında bilgilerdir. 19 kişinin aylık ortalama 20 bin geliri olduğunu varsayalım. ve 300 tr geliri olan 1 kişi. Tüm örneklemin toplam aylık geliri 680 tr. Bu durumda örnek ortalama S=34'tür.


2. Medyan- farklı değerlerin sayısının aynı olduğu, üstünde ve altında bir değer üretir, yani bu sıralı bir veri serisindeki merkezi değerdir. Formül (3.2) veya (3.3) kullanılarak numunedeki eleman sayısının çiftliğine / tekliğine bağlı olarak belirlenir.Bir veri numunesi için medyanı tahmin etmek için algoritma:

Her şeyden önce, veriler artan/azalan düzende sıralanır (sıralanır).

Sıralı örnekte tek sayıda öğe varsa, medyan merkez değerle aynıdır.

(3.2)

Nerede N

Çift sayıda öğe olması durumunda, medyan iki merkezi değerin aritmetik ortalaması olarak tanımlanır.

(3.3)

sipariş edilen numunenin ortalama elemanı nerede;

- aşağıdaki sıralı seçim unsuru;

Örnek elemanların sayısı.

Numunenin tüm elemanlarının farklı olması durumunda, numunenin elemanlarının tam olarak yarısı medyandan büyük, diğer yarısı ise küçüktür. Örneğin, örneklem (1, 5, 9, 15, 16) için medyan, 9. öğe ile aynıdır.

İstatistiksel veri analizinde medyan, örnek ortalamasının değerini güçlü bir şekilde etkileyen örnek öğelerini belirlemenizi sağlar.

Diyelim ki 20 kişilik bir örneklemimiz var. Örnek öğeler, her bir kişinin ortalama aylık geliri hakkında bilgilerdir. 19 kişinin aylık ortalama 20 bin geliri olduğunu varsayalım. ve 300 tr geliri olan 1 kişi. Tüm örneklemin toplam aylık geliri 680 tr. Medyan, numuneyi sıraladıktan sonra, numunenin onuncu ve onbirinci elemanlarının aritmetik ortalaması olarak tanımlanır) ve Me = 20 tr'ye eşittir. Bu sonuçşu şekilde yorumlanır: medyan, örneği iki gruba ayırır, böylece birinci grupta her kişinin ortalama aylık gelirinin 20 bin ruble'den fazla olmadığı ve ikinci grupta 20 binden az olmadığı sonucuna varılabilir. ruble. İÇİNDE bu örnek medyanın "ortalama" kişinin ne kadar kazandığı ile karakterize edildiğini söyleyebiliriz. Örneklem ortalamasının değeri S=34'ten önemli ölçüde yüksek iken, bu, ortalama kazançları değerlendirirken bu özelliğin kabul edilemez olduğunu gösterir.

Bu nedenle, medyan ve örneklem ortalaması arasındaki fark ne kadar büyükse, örneklem verilerinin dağılımı da o kadar büyük olur (incelenen örnekte, 300 tr. kazancı olan bir kişi, belirli bir örneklemdeki ortalama insanlardan açıkça farklıdır ve ortalama gelir tahmini üzerinde önemli bir etki). Bu tür unsurlarla ne yapılacağına her durumda karar verilir. Ancak genel durumda, örneğin güvenilirliğini sağlamak için, istatistiksel göstergelerin değerlendirilmesi üzerinde güçlü bir etkiye sahip oldukları için geri çekilirler.

3. Moda (Mo)- örnekte en sık meydana gelen değeri, yani en yüksek frekansa sahip değeri üretir Mod tahmin algoritması:

Numunenin eşit sıklıkta meydana gelen öğeleri içermesi durumunda, böyle bir numunede mod olmadığını söyleriz.

İki bitişik bölme, diğer bölmelerin frekansından daha yüksek olan aynı frekansa sahipse, mod iki değerin ortalaması olarak tanımlanır.

Numunenin iki elemanı, numunenin geri kalan elemanlarının frekansından daha büyük olan aynı frekansa sahipse ve aynı zamanda bu elemanlar bitişik değilse, o zaman bu numunede iki mod olduğunu söyleriz.

İstatistiksel analizde mod, merkezi eğilim ölçüsünü hızlı bir şekilde tahmin etmenin gerekli olduğu ve yüksek doğruluğun gerekli olmadığı durumlarda kullanılır. Örneğin, alıcılar arasında en çok talep gören giysi ve ayakkabıları belirlemek için moda (beden veya marka açısından) uygundur.

Dağılım ölçüleri (değişkenlik)- arasındaki farkları karakterize eden bir grup istatistiksel gösterge bireysel değerlerörnekler. Dağılım ölçümlerinin göstergelerine dayanarak, numune elemanlarının homojenlik ve kompaktlık derecesini değerlendirmek mümkündür. Dağılım ölçümleri, aşağıdaki gösterge seti ile karakterize edilir:

1. Tokatlamak - bu, gözlem sonuçlarının (örnek öğeler) maksimum ve minimum değerleri arasındaki aralıktır. Aralık göstergesi, bir veri kümesindeki değerlerin dağılımını gösterir. Aralık büyükse, popülasyondaki değerler çok dağınıktır, aksi takdirde (aralık küçüktür), popülasyondaki değerlerin birbirine yakın olduğu söylenir. Aralık, formül (3.4) ile belirlenir.

(3.4)

Nerede - numunenin maksimum elemanı;

numunenin minimum elemanıdır.

2.ortalama sapma numunedeki her bir değer ile numune ortalaması arasındaki aritmetik ortalama farktır (mutlak değer olarak). Ortalama sapma, formül (3.5) ile belirlenir.

(3.5)

Nerede - Ben-inci örnek eleman;

Formül (3.1) ile hesaplanan numune ortalamasının değeri;

Örnek elemanların sayısı.

Modül her bir belirli öğe için ortalamadan sapmaların hem pozitif hem de negatif olabilmesi nedeniyle gereklidir. Bu nedenle, modül alınmazsa, tüm sapmaların toplamı sıfıra yakın olacak ve veri değişkenliğinin derecesini yargılamak imkansız olacaktır (örnek ortalama etrafında toplanan veriler). İstatistiksel analizde, numune ortalaması yerine mod ve medyan alınabilir.

3. Dağılım veri değerleri ile ortalama arasındaki göreli sapmayı açıklayan bir dağılım ölçüsüdür. Her bir numune öğesinin ortalama değerden sapmalarının karelerinin toplamı olarak hesaplanır. Örnek büyüklüğüne bağlı olarak, varyans tahmin edilir Farklı yollar:

Büyük numuneler için (n>30) formül (3.6)'ya göre

(3.6)

Küçük numuneler için (n<30) по формуле (3.7)

(3.7)

nerede X ben - numunenin i-inci elemanı;

S, numunenin ortalama değeridir;

Örnek eleman sayısı;

(X i – S) - veri setinin her değeri için ortalama değerden sapma.

4. Standart sapma veri noktalarının ortalamalarına göre ne kadar geniş bir alana dağıldığının bir ölçüsüdür.

Varyansın hesaplanmasında bireysel sapmaların karesini alma işlemi, elde edilen sapma değerinin orijinal sapmalardan sapma derecesini arttırır ve bu da ek hatalar getirir. Böylece, veri noktalarının dağılımının ortalamaları hakkındaki tahminini ortalama sapmanın değerine yaklaştırmak için, varyanstan karekök çıkarılır. Varyansın çıkarılan kökü, kök ortalama kare veya standart sapma (3.8) olarak adlandırılan bir değişkenlik ölçüsünü karakterize eder.

(3.8)

Diyelim ki bir yazılım geliştirme proje yöneticisisiniz. Gözetiminiz altında beş programcınız var. Proje yürütme sürecini yöneterek, görevleri programcılar arasında dağıtırsınız. Örneği basitleştirmek için, görevlerin karmaşıklık ve yürütme süresi açısından eşdeğer olduğu gerçeğinden hareket edeceğiz. Son 10 hafta boyunca her programcının çalışmasını (hafta boyunca tamamlanan görevlerin sayısı) analiz etmeye karar verdiniz ve bunun sonucunda aşağıdaki örnekleri aldınız:

Hafta Adı

Ortalama tamamlanan görev sayısını değerlendirdikten sonra aşağıdaki sonucu elde ettiniz:

Hafta Adı S
22,3
22,4
22,2
22,1
22,5

S göstergesine göre, ortalama olarak tüm programcılar aynı verimlilikle çalışır (haftada yaklaşık 22 görev). Bununla birlikte, değişkenlik göstergesi (aralık) çok yüksektir (dördüncü programcı için 5 görevden beşinci programcı için 24 göreve).

Hafta Adı S P
22,3
22,4
22,2
22,1
22,5

Örneklerde değerlerin ortalamaya göre nasıl dağıldığını gösteren standart sapmayı tahmin edelim, yani bizim durumumuzda, görev tamamlama dağılımının haftadan haftaya ne kadar büyük olduğunu tahmin etmek için.

Hafta Adı S P BU YÜZDEN
22,3 1,56
22,4 1,8
22,2 2,84
22,1 1,3
22,5 5,3

Ortaya çıkan standart sapma tahmini şunu söylüyor (programcılar 4 ve 5 numaralı iki uç durumu değerlendirelim):

Ortalama olarak 4 programcıdan oluşan bir örneklemdeki her değer, ortalamadan 1,3 iş kadar sapma gösterir.

Programcının 5 örneğindeki her değer, ortalamadan ortalama 5,3 iş sapma gösterir.

Standart sapma 0'a ne kadar yakınsa, örneklemdeki her bir değerin ortalamaya neredeyse eşit olduğunu gösterdiği için ortalama o kadar güvenilirdir (örneğimizde 22,5 madde). Bu nedenle, 4. programcı, 5. programcının aksine en tutarlı olanıdır. 5. programcı için görev tamamlamanın haftadan haftaya değişkenliği 5.3 görevdir, bu da önemli bir yayılımı gösterir. 5. programcı söz konusu olduğunda, ortalamaya güvenilemez ve bu nedenle önümüzdeki hafta için tamamlanan görevlerin sayısını tahmin etmek zordur, bu da planlamayı ve çalışma programlarına bağlı kalmayı zorlaştırır. Bu kursta hangi yönetimsel kararı verdiğiniz önemli değildir. Hangi uygun yönetim kararlarının alınabileceği temelinde bir değerlendirme almanız önemlidir.

Böylece, ortalamanın verileri her zaman doğru bir şekilde tahmin etmediğine dair genel bir sonuç çıkarılabilir. Ortalama tahmininin doğruluğu, standart sapmanın değeri ile değerlendirilebilir.

Anlatım 12. Sonuçların istatistiksel olarak işlenmesi yöntemleri.

Sonuçların istatistiksel olarak işlenmesine yönelik yöntemlere, deney sırasında elde edilen göstergelerin genelleştirilebildiği, bir sisteme getirilebildiği ve içlerinde gizli kalıpları ortaya çıkarabildiği matematiksel teknikler, formüller, nicel hesaplama yöntemleri denir. Deneyde incelenen değişkenler arasında var olan istatistiksel nitelikteki bu tür düzenliliklerden bahsediyoruz.

1. Deneysel sonuçların birincil istatistiksel işleme yöntemleri

Tüm matematiksel ve istatistiksel analiz yöntemleri şartlı olarak birincil ve ikincil olarak ayrılmıştır. Deneyde yapılan ölçümlerin sonuçlarını doğrudan yansıtan göstergeler elde etmenin mümkün olduğu yöntemlere birincil denir. Buna göre, birincil istatistiksel göstergeler, psikoteşhis yöntemlerinin kendisinde kullanılanlar anlamına gelir ve psikodiagnostik sonuçlarının ilk istatistiksel işlenmesinin sonucudur. İkincil yöntemlere, birincil verilere dayanarak içlerinde gizli olan istatistiksel kalıpların ortaya çıkarıldığı istatistiksel işleme denir.

Birincil istatistiksel işleme yöntemleri, örneğin, numune ortalamasının, numune varyansının, numune modunun ve numune medyanının belirlenmesini içerir. İkincil yöntemler genellikle korelasyon analizini, regresyon analizini, iki veya daha fazla örnekteki birincil istatistikleri karşılaştırma yöntemlerini içerir.

Temel matematiksel istatistikleri hesaplama yöntemlerini düşünün.

Modaörnekte en yaygın olan, çalışılan özelliğin nicel değeri olarak adlandırılır.

Medyançalışılan özelliğin değeri, bu özelliğin değerine göre sıralanan örneği ikiye bölen olarak adlandırılır.

örnek ortalamaİstatistiksel bir gösterge olarak (aritmetik ortalama) değer, deneyde incelenen psikolojik kalitenin ortalama değerlendirmesidir.

saçmak(bazen bu değer aralık olarak adlandırılır) numunenin R harfi ile gösterilir. Bu, numune için elde edilebilecek en basit göstergedir - bu özel varyasyon serisinin maksimum ve minimum değerleri arasındaki fark .

Dağılım bir değişkenin değerlerinin ortalama değerinden sapmalarının karelerinin aritmetik ortalamasıdır.

2. Deneysel sonuçların ikincil istatistiksel işleme yöntemleri

Deneysel verilerin ikincil istatistiksel işleme yöntemlerinin yardımıyla, deneyle ilgili hipotezler doğrudan doğrulanır, kanıtlanır veya çürütülür. Bu yöntemler, kural olarak, birincil istatistiksel işleme yöntemlerinden daha karmaşıktır ve araştırmacının temel matematik ve istatistik konusunda iyi eğitimli olmasını gerektirir.

Tartışılan yöntem grubu birkaç alt gruba ayrılabilir:

1 regresyon hesabı

Regresyon hesabı, özel, farklı verileri iç ilişkilerini yaklaşık olarak yansıtan belirli bir doğrusal grafiğe indirgemenize ve değişkenlerden birinin değeriyle başka bir değişkenin olası değerini yaklaşık olarak tahmin edebilmenize olanak tanıyan bir matematiksel istatistik yöntemidir. .

2. Korelasyon

İki dizi deneysel veri arasındaki bağlantıyı veya doğrudan bağımlılığı ortaya çıkaran bir sonraki ikincil istatistiksel işleme yöntemine korelasyon yöntemi denir. Bir olgunun diğerini nasıl etkilediğini veya dinamikleri içinde onunla nasıl ilişkili olduğunu gösterir. Bu tür bağımlılıklar, örneğin birbiriyle nedensel ilişki içinde olan nicelikler arasında mevcuttur. İki fenomenin istatistiksel olarak anlamlı bir şekilde birbiriyle ilişkili olduğu ortaya çıkarsa ve aynı zamanda bunlardan birinin diğer fenomenin nedeni olabileceğine dair bir güven varsa, o zaman kesinlikle aralarında nedensel bir ilişki olduğu sonucu çıkar. .

3 Faktör analizi

Faktör analizi, büyük miktarda deneysel veriyi işlerken kullanılan istatistiksel bir yöntemdir. Faktör analizinin görevleri şunlardır: değişken sayısını azaltmak (veri azaltmak) ve değişkenler arasındaki ilişkilerin yapısını belirlemek, yani. değişkenlerin sınıflandırılması, yani faktör analizi bir veri indirgeme yöntemi veya yapısal bir sınıflandırma yöntemi olarak kullanılır.

Soruları inceleyin

1.İstatistiksel işleme yöntemleri nelerdir?

2. İkincil istatistiksel işleme yöntemleri hangi alt gruplara ayrılır?

3. Korelasyon yönteminin özünü açıklar mısınız?

4. İstatistiksel işleme yöntemleri hangi durumlarda kullanılır?

5. İstatistiksel işleme yöntemlerinin bilimsel araştırmalarda kullanılması sizce ne kadar etkilidir?

2. İstatistiksel veri işleme yöntemlerinin özelliklerini göz önünde bulundurun.

Edebiyat

1.. Gorbatov D.S. Psikolojik araştırma çalıştayı: Proc. ödenek. - Samara: "BAHRAKH - M", 2003. - 272 s.

2. Ermolaev A.Yu. Psikologlar için matematiksel istatistikler. - M .: Moskova Psikolojik ve Sosyal Enstitüsü: Flint, 2003.336s.

3. Kornilova T.V. Psikolojik deneye giriş. Üniversiteler için ders kitabı. M.: CheRo Yayınevi, 2001.