Елементи на статистическата обработка на данни. Статистическа обработка на данни и нейните особености Затвърдяване на изучения материал

Елементи на статистическата обработка на данни.  Статистическа обработка на данни и нейните особености Затвърдяване на изучения материал
Елементи на статистическата обработка на данни. Статистическа обработка на данни и нейните особености Затвърдяване на изучения материал

слайд 1

слайд 2

Статистиката е точна наука, която изучава методите за събиране, анализиране и обработка на данни, които описват масови действия, явления и процеси Математическата статистика е дял от математиката, който изучава методите за събиране, систематизиране и обработка на резултатите от наблюдения на случайни масови явления в за да се идентифицират съществуващите модели.

слайд 3

Статистиката изучава: броя на отделните групи от населението на страната и нейните региони, производството и потреблението на различни видове продукти, транспортирането на стоки и пътници с различни видове транспорт, природните ресурси и много други. Резултатите от статистическите изследвания се използват широко за практически и научни заключения. В момента статистиката започва да се изучава още в гимназията, в университетите тя е задължителен предмет, защото е свързана с много науки и отрасли. За да се увеличи броят на продажбите в магазина, да се подобри качеството на знанията в училище, да се придвижи страната в икономически растеж, е необходимо да се проведат статистически изследвания и да се направят подходящи изводи. И всеки трябва да може да прави това.

слайд 4

Основните цели на изучаването на елементите на статистиката Формиране на умения за първична обработка на статистически данни; изображение и анализ на количествена информация, представена в различни форми (под формата на таблици, диаграми, графики на реални зависимости); формирането на идеи за важни статистически идеи, а именно: идеята за оценка и идеята за тестване на статистически хипотези; формиране на умения за сравняване на вероятностите за възникване на случайни събития с резултатите от конкретни експерименти.

слайд 5

Съдържание Серия от данни Обем на серия от данни Обхват на серия от данни Режим на серия от данни Медиана на серия Средна аритметична подредена серия от данни Таблица на разпределение на данни Обобщаване Номинативна серия от данни Честота на резултата Процентна честота Групиране на данни Методи за обработка на данни Обобщаване

слайд 6

Определение Поредица от данни е поредица от резултати от някакъв вид измерване. Например: 1) измерване на височината на човек 2) измерване на теглото на човек (животно) 3) показания на измервателния уред (електричество, вода, топлина ...) 4) резултати от бягане на сто метра и др.

Слайд 7

Определение Размерът на серия от данни е количеството на всички данни. Например: дадена е поредица от числа 1; 3; 6; -4; 0 неговият обем ще бъде равен на 5. Защо?

Слайд 8

Изпълнете задачата: В института преминаха тест по висша математика. В групата имаше 10 души и те получиха съответните оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определете силата на звука този ред. Отговор: 10

Слайд 9

Определение Диапазонът е разликата между най-голямото и най-малкото число в набор от данни. Например: ако е дадена поредица от числа 1; 3; 6; -4; 0; 2, тогава диапазонът на тази поредица от данни ще бъде равен на 6 (защото 6 - 0 = 6)

слайд 10

Изпълнете задачата: В института преминаха тест по висша математика. В групата имаше 10 души и те получиха съответните оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определете обхвата на тази серия. Отговор: 3

слайд 11

Определение Режимът на серия от данни е номерът на серията, който се среща най-често в тази серия. Набор от данни може или не може да има режим. И така, в сериите от данни 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 всяко от числата 47 и 52 се среща два пъти, а останалите числа - по-малко от два пъти. В такива случаи беше договорено, че серията има два режима: 47 и 52.

слайд 12

Изпълнете задачата: И така, в сериите от данни 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 всяко от числата 47 и 52 се среща два пъти, а останалите числа - по-малко от два пъти. В такива случаи беше договорено да се счита, че серията има два режима: 47 и 52. В института те преминаха тест по висша математика. В групата имаше 10 души и те получиха съответните оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определете режима на тази серия. Отговор: 4

слайд 13

Определение Медианата с нечетен брой членове е числото, записано в средата. Медиана с четен брой членове е средноаритметичното на две числа, записани в средата. Например: определете медианата на редица от числа 1) 6; -4; 5; -2; -3; 3; 3; -2; 3. Отговор: -3 2) -1; 0; 2; 1; -1; 0;2; -1. Отговор: 0

слайд 14

Изпълнете задачата: В института преминаха тест по висша математика. В групата имаше 10 души и те получиха съответните точки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определете медианата на тази серия. Отговор: 4

слайд 15

Определение Средно аритметичното е частното от разделянето на сбора от числата в редица на техния брой. Например: дадена е поредица от числа -1; 0; 2; 1; -1; 0; 2; -1. Тогава средноаритметичната стойност ще бъде: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0,25

слайд 16

Изпълнете задачата: В института преминаха тест по висша математика. В групата имаше 10 човека, които получиха съответните оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определете средноаритметичното на тази редица. Отговор: 3.9

слайд 17

ПРАКТИЧЕСКА РАБОТА Задача: да се характеризира напредъка на ученика Иванов по математика за четвъртото тримесечие. ИЗПЪЛНЕНИЕ НА РАБОТА: 1. Събиране на информация: Изписват се оценки от списанието: 5,4,5,3,3,5,4,4,4. 2. Обработка на получените данни: обем = 9 обхват = 5 - 3 = 2 режим = 4 медиана = 3 средно аритметично = (5+4+5+3+3+5+4+4+4) : 9 ≈ 4 : ученикът не винаги е готов за урока. Основно учи на "4". За една четвърт идва "4".

слайд 18

Самостоятелно: Необходимо е да се намери обемът на серията, диапазонът на серията, модата, медианата и средното аритметично: Карта 1. 22.5; 23; 21,5; 22; 23. Карточка 2. 6; -4; 5; -2; -3; 3; 3; -2; 3. Карточка 3. 12.5; 12; 12; 12,5; 13; 12,5; 13. Карта 4. -1; 0; 2; 1; -1; 0; 2; -1. Картон 5. 125; 130; 124; 131. Картон 6. 120; 100; 110.

слайд 19

Нека проверим Карта 1. обем на сериите = 5 диапазон на сериите = 10 режим = 23 медиана = 21,5 средно аритметично = 13,3 Карта 3. обем на сериите = 7 диапазон на сериите = 1 режим = 12,5 медиана = 12,5 средно аритметично = 12,5 Карта 2 .обем на серия = 9 диапазон на серия = 10 режим = 3 медиана = -3 средно аритметично = 1 карта 4. обем на серия = 8 диапазон на серия = 3 режим = -1 медиана = 0 средно аритметично = 0,25

слайд 20

Нека проверим карта 5. Обем на серия = 4 серия диапазон = 7 режим = без медиана = 127 средно аритметично = 127,5 Карта 6. Обем на серия = 3 серия диапазон = 20 режим = без медиана = 100 средно аритметично = 110

слайд 21

Определение Подредена поредица от данни е поредица, в която данните са подредени според някакъв вид правило Как да подредите поредица от числа? (Запишете числата така, че всяко следващо число да не е по-малко (не повече) от предишното); или запишете някои имена "по азбучен ред" ...

слайд 22

Изпълнете задачата: Дадена е поредица от числа: -1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1 Подреди във възходящ ред на числата. Решение: -3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3 Резултатът е подредена серия. Самите данни не са се променили, промени се само редът, в който се показват.

слайд 23

Определение Таблица за разпределение на данни е таблица от подредена поредица, в която се записва броят на повторенията вместо повторенията на същия брой. Обратно, ако таблицата за разпределение е известна, тогава може да се състави подредена поредица от данни. Например: Произвежда такава подредена серия: -3; -3; -3; -1; -1; -1; -1; 5; 5; 7; 8; 8; 8; 8; 8

слайд 24

Изпълнете задачата: В магазин за дамски обувки те проведоха статистически изследвания и съставиха подходяща таблица за цената на обувките и броя на продажбите: Цена (руб.): 500 1200 1500 1800 2000 2500 Количество: 8 9 14 15 3 1 подредена серия от данни размер на серията от данни обхват на серията режим на серията медиана на серията средно аритметично на серията данни

слайд 25

И отговорете на следните въпроси: От данните ценови категории, обувки на каква цена не трябва да се продават на магазина? Обувки, на каква цена трябва да се разпространяват? Каква е най-добрата цена, към която да се стремите?

слайд 26

За да обобщим: Запознахме се с първоначалните концепции за това как се извършва статистическата обработка на данни: данните винаги са резултат от някакво измерване в поредица от някои данни, които могат да бъдат намерени: обем, обхват, режим, медиана и средно аритметично 3) всяка серия от данни може да се поръча и състави таблица за разпределение на данни

слайд 27

Определение Именните редове от данни НЕ СА ЧИСЛОВИ ДАННИ, а например имена; заглавия; номинации ... Например: списък на финалистите на Световното първенство от 1930 г. насам: Аржентина, Чехословакия, Унгария, Бразилия, Унгария, Швеция, Чехословакия, Германия, Италия, Холандия, Холандия, Германия, Германия, Аржентина, Италия, Бразилия, Германия, Франция

слайд 28

Изпълнете задачата: Намерете от предишния пример: обема на серията 2) режима на серията 3) направете таблица за разпределение Решение: обем \u003d 18; fashion е немски отбор.

слайд 29

Методите за статистическа обработка на резултатите от експеримента са математически методи, формули, методи за количествени изчисления, с помощта на които показателите, получени по време на експеримента, могат да бъдат обобщени, въведени в системата, разкривайки закономерностите, скрити в тях.

Говорим за такива закономерности от статистическо естество, които съществуват между променливите, изследвани в експеримента.

Данни са основните елементи, които трябва да бъдат класифицирани или категоризирани за целите на обработката 26 .

Някои от методите на математическия и статистически анализ позволяват да се изчисли така наречената елементарна математическа статистика, която характеризира извадковото разпределение на данните, например:

извадкова средна стойност,

Дисперсия на извадката,

Медиана и др.

Други методи на математическата статистика позволяват да се прецени динамиката на промените в индивидуалните статистики на извадката, например:

дисперсионен анализ,

Регресионен анализ.

Използвайки третата група методи за вземане на проби, човек може надеждно да прецени статистическите връзки, които съществуват между променливите, които се изследват в този експеримент:

Корелационен анализ;

Факторен анализ;

методи за сравнение.

Всички методи на математико-статистическия анализ условно се разделят на първични и вторични 27 .

Методите се наричат ​​първични, с помощта на които е възможно да се получат показатели, които пряко отразяват резултатите от измерванията, направени в експеримента.

Вторичните методи се наричат ​​статистическа обработка, с помощта на която въз основа на първични данни се разкриват скрити в тях статистически закономерности.

Първичните методи за статистическа обработка включват например:

Определяне на средната стойност на извадката;

Дисперсия на извадката;

Селективна мода;

Примерна медиана.

Вторичните методи обикновено включват:

Корелационен анализ;

Регресионен анализ;

Методи за сравняване на първични статистики за две или повече проби.

Нека разгледаме методите за изчисляване на елементарна математическа статистика, като започнем от средната стойност на извадката.

Средноаритметично - е съотношението на сумата от всички стойности на данните към броя на членовете 28.

Средната стойност като статистически показател е средната оценка на изследваното в експеримента психологическо качество.

Тази оценка характеризира степента на неговото развитие като цяло в групата субекти, подложени на психодиагностичен преглед. Сравнявайки директно средните стойности на две или повече проби, можем да преценим относителната степен на развитие на хората, които съставляват тези проби, на оценяваното качество.

Средната стойност на извадката се определя, като се използва следната формула 29:

където x cf е средната стойност на извадката или средноаритметичното на извадката;

n - броят на субектите в извадката или частните психодиагностични показатели, въз основа на които се изчислява средната стойност;

x k - частни стойности на показателите за отделните субекти. Има n такива индикатори, така че индексът k на тази променлива приема стойности от 1 до n;

∑ - приет в математиката знак за сумиране на стойностите на тези променливи, които са вдясно от този знак.

дисперсия е мярка за разсейването на данните за средната стойност от 30 .

Колкото по-голяма е дисперсията, толкова по-голяма е дисперсията или разсейването в данните. Определя се, за да могат да се разграничат една от друга величини, които имат еднаква средна стойност, но различен спред.

Дисперсията се определя по следната формула:

къде е дисперсията на извадката или просто дисперсията;

Израз, означаващ, че за всички x k от първия до последния в тази извадка е необходимо да се изчислят разликите между частни и средни стойности, да се повдигнат на квадрат тези разлики и да се сумират;

n е броят на субектите в извадката или първичните стойности, за които се изчислява дисперсията.

Медиана се нарича стойността на изследваната характеристика, която разделя извадката, подредена по стойността на тази характеристика, наполовина.

Познаването на медианата е полезно, за да се установи дали разпределението на определени стойности на изследвания признак е симетрично и се доближава до така нареченото нормално разпределение. Средната стойност и медианата за нормално разпределение обикновено са еднакви или се различават много малко една от друга.

Ако извадковото разпределение на характеристиките е нормално, тогава към него могат да се приложат вторични статистически изчислителни методи, базирани на нормалното разпределение на данните. В противен случай това не може да се направи, тъй като в изчисленията могат да се промъкнат сериозни грешки.

Мода още една елементарна математическа статистика и характеристика на разпределението на експерименталните данни. Модата е количествената стойност на изследваната характеристика, която най-често се среща в извадката.

За симетрични разпределения на характеристиките, включително нормалното разпределение, стойностите на режима съвпадат със средните и средните стойности. За други видове разпределения, асиметрични, това не е характерно.

Методът на вторична статистическа обработка, чрез който се открива връзката или пряката връзка между две серии от експериментални данни, се нарича метод на корелационен анализ. Той показва как едно явление влияе на друго или е свързано с него в своята динамика. Зависимости от този вид съществуват например между величини, които са в причинно-следствена връзка помежду си. Ако се окаже, че две явления са статистически значимо свързани помежду си и ако в същото време има увереност, че едно от тях може да действа като причина за другото явление, то това определено води до заключението, че има причинно-следствена връзка. връзка между тях.

Има няколко разновидности на този метод:

Линейният корелационен анализ ви позволява да установите директни връзки между променливите в техните абсолютни стойности. Тези връзки се изразяват графично с права линия, откъдето идва и наименованието "линейни".

Коефициентът на линейна корелация се определя по следната формула 31:

където r xy - коефициент на линейна корелация;

x, y -средни извадкови стойности на сравнявани стойности;

х аз аз - частни извадкови стойности на сравнявани количества;

П -общият брой стойности в сравнената серия от индикатори;

Дисперсии, отклонения на сравнените стойности от средните стойности.

Ранговата корелация определя зависимостта не между абсолютните стойности на променливите, а между редовите места или ранговете, заети от тях в серия, подредена по величина. Формулата за коефициента на рангова корелация е 32:

където R s - коефициент на рангова корелация според Spearman;

д аз - разликата между ранговете на показателите на едни и същи предмети в подредени редове;

П -броя на субектите или цифровите данни (класове) в корелираната серия.

Лабораторна работа №3. Статистическа обработка на данни в системата MatLab

Обща постановка на проблема

Основната цел на изпълнението лабораторна работае да се запознаят с основите на работа със статистическа обработка на данни в среда MatLAB.

Теоретична част

Първична статистическа обработка на данни

Статистическата обработка на данните се основава на първични и вторични количествени методи. Целта на първичната обработка на статистическите данни е структурирането на получената информация, което предполага групиране на данните в осеви таблициспоред различни параметри. Суровите данни трябва да бъдат представени в такъв формат, че човек да може да направи приблизителна оценка на получения набор от данни и да разкрие информация за разпределението на данните в получената извадка от данни, например хомогенността или компактността на данните. След първичния анализ на данните се прилагат методи за вторична статистическа обработка на данни, въз основа на които се определят статистически модели в съществуващия набор от данни.

Провеждането на първичен статистически анализ на масив от данни ви позволява да придобиете знания за следното:

Коя е най-типичната стойност за извадката? За отговор на този въпросопределят се мерки на централната тенденция.

Има ли голямо разсейване на данните по отношение на тази характерна стойност, т.е. каква е „размитостта“ на данните? В този случай се определят мерките за променливост.

Заслужава да се отбележи фактът, че статистическите показатели на мярката за централна тенденция и променливост се определят само от количествени данни.

Мерки за централна тенденция- група от стойности, около които са групирани останалите данни.По този начин мерките на централната тенденция обобщават масива от данни, което позволява да се формират изводи както за извадката като цяло, така и за провеждане сравнителен анализразлични проби една с друга.

Да предположим, че има извадка от данни, тогава мерките на централната тенденция се оценяват чрез следните показатели:

1. извадкова средна стойносте резултатът от разделянето на сумата от всички стойности на извадката на техния брой.Определя се по формула (3.1).

(3.1)

Където - аз-ти примерен елемент;

не броят на пробните елементи.

Средната стойност на извадката осигурява най-голяма точност в процеса на оценяване на централната тенденция.

Да кажем, че имаме извадка от 20 души. Примерни елементи са информация за средния месечен доход на всяко лице. Да предположим, че 19 души имат среден месечен доход от 20 хиляди. и 1 човек с доход от 300 тр. Общият месечен доход на цялата извадка е 680 тр. Средната стойност на извадката в този случай е S=34.


2. Медиана- генерира стойност над и под която броят на различните стойности е еднакъв, т.е. това е централната стойност в последователна поредица от данни. Определя се в зависимост от четността / нечетността на броя на елементите в извадката с помощта на формули (3.2) или (3.3) Алгоритъм за оценка на медианата за извадка от данни:

Първо, данните се класират (подреждат) във възходящ/низходящ ред.

Ако подредената проба има нечетен брой елементи, тогава медианата е същата като централната стойност.

(3.2)

Където н

В случай на четен брой елементи, медианата се определя като средноаритметично на двете централни стойности.

(3.3)

където е средният елемент от поръчаната проба;

- елемент на подредена селекция;

Броят на примерните елементи.

В случай, че всички елементи на извадката са различни, тогава точно половината от елементите на извадката са по-големи от медианата, а другата половина са по-малки. Например за извадката (1, 5, 9, 15, 16) медианата е същата като елемент 9.

При анализ на статистически данни медианата ви позволява да идентифицирате елементите на извадката, които силно влияят върху стойността на средната стойност на извадката.

Да кажем, че имаме извадка от 20 души. Примерни елементи са информация за средния месечен доход на всяко лице. Да предположим, че 19 души имат среден месечен доход от 20 хиляди. и 1 човек с доход от 300 тр. Общият месечен доход на цялата извадка е 680 тр. Медианата, след подреждане на извадката, се определя като средноаритметично на десетия и единадесетия елемент на извадката) и е равна на Me = 20 tr. Този резултатсе тълкува по следния начин: медианата разделя извадката на две групи, така че може да се заключи, че в първата група всяко лице има среден месечен доход не повече от 20 хиляди рубли, а във втората група не по-малко от 20 хиляди рубли. рубли. IN този примерможем да кажем, че медианата се характеризира с това колко печели „средният“ човек. Докато средната стойност на извадката е значително по-висока от S=34, което показва неприемливостта на тази характеристика при оценка на средните доходи.

По този начин, колкото по-голяма е разликата между медианата и средната стойност на извадката, толкова по-голямо е разсейването на данните от извадката (в разглеждания пример човек с печалба от 300 тр. е ясно различен от средните хора в конкретна извадка и има значително въздействие върху оценката на средния доход). Какво да правим с такива елементи се решава във всеки отделен случай. Но в общия случай, за да се гарантира надеждността на извадката, те се оттеглят, тъй като имат силно влияние върху оценката на статистическите показатели.

3. Мода (Mo)- генерира стойността, която се среща най-често в извадката, т.е. стойността с най-висока честота Алгоритъм за оценка на режима:

В случай, че извадката съдържа елементи, които се срещат еднакво често, тогава казваме, че в такава извадка няма режим.

Ако два съседни бина имат една и съща честота, която е по-голяма от честотата на другите бинове, тогава режимът се определя като средната стойност на двете стойности.

Ако два елемента от извадката имат еднаква честота, която е по-голяма от честотата на останалите елементи от извадката, и в същото време тези елементи не са съседни, тогава казваме, че в тази извадка има два режима.

Режимът в статистическия анализ се използва в ситуации, когато е необходимо бързо да се оцени мярката на централната тенденция и не се изисква висока точност. Например модата (по отношение на размер или марка) е удобна за използване, за да се определят дрехите и обувките, които са най-търсени сред купувачите.

Мерки за разсейване (променливост)- група статистически показатели, характеризиращи разликите между отделни стойностипроби. Въз основа на показателите за дисперсионни мерки е възможно да се оцени степента на хомогенност и компактност на елементите на пробата. Мерките за разсейване се характеризират със следния набор от индикатори:

1. Плъзнете -това е интервалът между максималните и минималните стойности на резултатите от наблюденията (елементи на извадката). Индикаторът за обхват показва разпространението на стойностите в набор от данни. Ако диапазонът е голям, тогава стойностите в популацията са много разпръснати, в противен случай (диапазонът е малък), се казва, че стойностите в популацията са близо една до друга. Диапазонът се определя по формула (3.4).

(3.4)

Където - максималният елемент на извадката;

е минималният елемент от извадката.

2.Средно отклонениее средната аритметична разлика (в абсолютна стойност) между всяка стойност в извадката и нейната средна извадка. Средното отклонение се определя по формула (3.5).

(3.5)

Където - аз-ти примерен елемент;

Стойността на извадковата средна, изчислена по формула (3.1);

Броят на примерните елементи.

Модул необходимо поради факта, че отклоненията от средната стойност за всеки конкретен елемент могат да бъдат както положителни, така и отрицателни. Следователно, ако модулът не бъде взет, тогава сумата от всички отклонения ще бъде близо до нула и ще бъде невъзможно да се прецени степента на променливост на данните (струпване на данни около средната стойност на извадката). При статистически анализ модата и медианата могат да бъдат взети вместо средната стойност на извадката.

3. дисперсияе мярка за разсейване, която описва относителното отклонение между стойностите на данните и средната стойност. Изчислява се като сбор от квадратите на отклоненията на всеки елемент от пробата от средната стойност. В зависимост от размера на извадката се оценява дисперсията различни начини:

За големи проби (n>30) по формулата (3.6)

(3.6)

За малки проби (n<30) по формуле (3.7)

(3.7)

където X i - i-тият елемент от извадката;

S е средната стойност на извадката;

Брой на пробните елементи;

(X i – S) - отклонение от средната стойност за всяка стойност от набора от данни.

4. Стандартно отклонениее мярка за това колко широко са разпръснати точките от данни спрямо тяхната средна стойност.

Процесът на повдигане на квадрат на индивидуалните отклонения при изчисляване на дисперсията увеличава степента на отклонение на получената стойност на отклонението от първоначалните отклонения, което от своя страна внася допълнителни грешки. По този начин, за да се приближи оценката на разпространението на точките от данни относно тяхната средна стойност до стойността на средното отклонение, квадратният корен се извлича от дисперсията. Извлеченият корен на дисперсията характеризира мярка на променливостта, наречена средно квадратично или стандартно отклонение (3.8).

(3.8)

Да приемем, че сте ръководител на проекти за разработка на софтуер. Имате петима програмисти под ваше ръководство. Като управлявате процеса на изпълнение на проекта, вие разпределяте задачите между програмистите. За простота на примера ще изхождаме от факта, че задачите са еквивалентни по сложност и време за изпълнение. Решихте да анализирате работата на всеки програмист (броя изпълнени задачи през седмицата) за последните 10 седмици, в резултат на което получихте следните проби:

Име на седмицата

След като оценихте средния брой изпълнени задачи, получихте следния резултат:

Име на седмицата С
22,3
22,4
22,2
22,1
22,5

Въз основа на показателя S всички програмисти средно работят с еднаква ефективност (около 22 задачи на седмица). Показателят за вариативност (диапазон) обаче е много висок (от 5 задачи за четвъртия програмист до 24 задачи за петия програмист).

Име на седмицата С П
22,3
22,4
22,2
22,1
22,5

Нека оценим стандартното отклонение, което показва как стойностите са разпределени в извадките спрямо средната стойност, а именно, в нашия случай, за да оценим колко голямо е разпространението на изпълнението на задачата от седмица на седмица.

Име на седмицата С П ТАКА
22,3 1,56
22,4 1,8
22,2 2,84
22,1 1,3
22,5 5,3

Получената оценка на стандартното отклонение казва следното (нека оценим двата крайни случая 4 и 5 програмисти):

Всяка стойност в извадка от 4 програмисти средно се отклонява с 1,3 работни места от средната стойност.

Всяка стойност в извадка 5 на програмиста се отклонява средно с 5,3 работни места от средната стойност.

Колкото по-близо е стандартното отклонение до 0, толкова по-надеждна е средната стойност, тъй като показва, че всяка стойност в извадката е почти равна на средната (22,5 елемента в нашия пример). Следователно 4-тият програмист е най-последователен за разлика от 5-ия. Променливостта на изпълнението на задачите от седмица до седмица за 5-ия програмист е 5,3 задачи, което показва значително разпространение. В случая на 5-ия програмист не може да се вярва на средната стойност и следователно е трудно да се предвиди броят на изпълнените задачи за следващата седмица, което от своя страна затруднява планирането и спазването на работните графици. Какво управленско решение ще вземете в този курс е маловажно. Важно е да получите оценка, въз основа на която да се вземат подходящи управленски решения.

По този начин може да се направи общо заключение, че средната стойност не винаги правилно оценява данните. Правилността на оценката на средната стойност може да се съди по стойността на стандартното отклонение.

Лекция 12. Методи за статистическа обработка на резултатите.

Методи за статистическа обработка на резултатите се наричат ​​математически техники, формули, методи за количествени изчисления, с помощта на които показателите, получени по време на експеримента, могат да бъдат обобщени, въведени в система, разкривайки закономерностите, скрити в тях. Говорим за такива закономерности от статистическо естество, които съществуват между променливите, изследвани в експеримента.

1. Методи за първична статистическа обработка на експериментални резултати

Всички методи за математически и статистически анализ са условно разделени на първични и вторични. Методите се наричат ​​първични, с помощта на които е възможно да се получат показатели, които пряко отразяват резултатите от измерванията, направени в експеримента. Съответно под първични статистически показатели се разбират тези, които се използват в самите психодиагностични методи и са резултат от първоначалната статистическа обработка на резултатите от психодиагностиката. Вторичните методи се наричат ​​статистическа обработка, с помощта на която въз основа на първични данни се разкриват скрити в тях статистически закономерности.

Първичните методи за статистическа обработка включват, например, определяне на средната стойност на извадката, дисперсия на извадката, режим на извадка и медиана на извадката. Вторичните методи обикновено включват корелационен анализ, регресионен анализ, методи за сравняване на първични статистики в две или повече проби.

Обмислете методите за изчисляване на елементарна математическа статистика.

Моданаречена количествена стойност на изследваната черта, най-често срещана в извадката.

Медианасе нарича стойността на изследваната характеристика, която разделя извадката, подредена по стойността на тази характеристика, наполовина.

извадкова средна стойност(средноаритметична) стойност като статистически показател е средната оценка на психологическото качество, изследвано в експеримента.

разпръсквам(понякога тази стойност се нарича диапазон) на пробата се обозначава с буквата R. Това е най-простият индикатор, който може да бъде получен за извадката - разликата между максималните и минималните стойности на тази конкретна серия от вариации .

дисперсияе средноаритметичната стойност на квадратите на отклоненията на стойностите на променлива от нейната средна стойност.

2. Методи за вторична статистическа обработка на експериментални резултати

С помощта на вторични методи за статистическа обработка на експериментални данни пряко се проверяват, доказват или опровергават хипотези, свързани с експеримента. Тези методи, като правило, са по-сложни от методите за първична статистическа обработка и изискват от изследователя добра подготовка по елементарна математика и статистика.

Обсъжданата група методи може да се раздели на няколко подгрупи:

1 регресионно смятане

Регресионното смятане е метод на математическата статистика, който ви позволява да редуцирате лични, разнородни данни до определена линейна графика, която приблизително отразява тяхната вътрешна връзка, и да можете приблизително да оцените вероятната стойност на друга променлива по стойността на една от променливите .

2. Корелация

Следващият метод на вторична статистическа обработка, чрез който се открива връзката или пряката зависимост между две серии от експериментални данни, се нарича метод на корелации. Той показва как едно явление влияе на друго или е свързано с него в своята динамика. Зависимости от този вид съществуват например между величини, които са в причинно-следствена връзка помежду си. Ако се окаже, че две явления са статистически значимо свързани помежду си и ако в същото време има увереност, че едно от тях може да действа като причина за другото явление, тогава определено следва, че има причинно-следствена връзка между тях .

3 Факторен анализ

Факторният анализ е статистически метод, който се използва при обработката на големи количества експериментални данни. Задачите на факторния анализ са: намаляване на броя на променливите (намаляване на данните) и определяне на структурата на връзките между променливите, т.е. класификация на променливи, така че факторният анализ се използва като метод за редуциране на данни или като метод за структурна класификация.

Въпроси за преглед

1. Какво представляват методите за статистическа обработка?

2. На какви подгрупи се делят вторичните методи за статистическа обработка?

3. Обяснете същността на корелационния метод?

4. В какви случаи се използват методи за статистическа обработка?

5. Според вас колко ефективно е използването на методи за статистическа обработка в научните изследвания?

2. Разгледайте характеристиките на методите за обработка на статистически данни.

Литература

1.. Горбатов Д.С. Семинар по психологически изследвания: Proc. надбавка. - Самара: "BAHRAKH - M", 2003. - 272 с.

2. Ермолаев А.Ю. Математическа статистика за психолози. - М .: Московски психологически и социален институт: Флинт, 2003.336s.

3. Корнилова Т.В. Въведение в психологическия експеримент. Учебник за ВУЗ. М .: Издателство ЧеРо, 2001.