Основні категорії математичної статистики.
Закономірність – це повторюваність, послідовність і порядок у масових явищах. Статистична закономірність – форма виявлення причинного зв'язку, який відбивається у послідовних, повторюваних, регулярних діях із достатньо високим ступенем імовірності при незначних змінах причин, що породжують події. Форми виявлення закономірностей спостерігаються у: а) динаміці явищ; б) розподілі елементів чи інтенсивності ознаки; в) структурних змінах; г) зв'язках між явищами.
Статистична сукупність – це безліч одиниць, які характеризуються масовістю, однорідністю, цілісністю, взаємозалежністю станів окремих одиниць. Одиниця статистичної сукупності – це первинні конкретні елементи будь-якої сукупності, яким притаманні певні ознаки.
Ознака – це загальна властивість, характерна риса одиниць сукупності, яку можна спостерігати та вимірювати. Ознаками у психологічному дослідженні можуть виступати психологічні процеси, психологічні властивості, психологічні стани. Психологічні змінні або ознаки є випадковими величинами, оскільки заздалегідь невідомо, які значення вони набувають. Варіація – це коливання, зміни у значеннях ознаки.
Математична обробка – це оперування (зведення, групування, інтерпретація) даних, одержаних в результаті проведення психологічних досліджень (заміри, діагностування, анкетування, інтерв'ювання тощо). Дані у статистиці – основні елементи, які підлягають статистичному аналізу. Дані можуть бути: а) кількісними; б) порядковими; в) якісними. Кількісні дані характеризують певні індивідуальні ознаки, процеси чи явища, тобто це будь-яка інформація, яку отримуємо при вимірах певних ознак. Порядкові – це дані, що упорядковані за зростанням чи спаданням ознаки. Якісні дані описують властивості елементів, процесів чи явищ. Між такими поняттями як „дані” та „значення” існує відмінність, яка полягає у тому, що перші є „сирими” даними і можуть повторюватися на відміну від значень. Приклад 1. Дані: 56, 77, 34, 56, 89, 77, 56, 22, 66, 56, 88, 77, 22.
Значення: 56, 77, 34, 22, 89, 88, 66.
Популяція – термін, яким позначається будь-яка сукупність, що має спільну або системотвірну ознаку. Вибірка – це незначна кількість елементів популяції, яка визначається за допомогою наукових методів так, щоб відбивати всю популяцію. Подамо класифікацію вибірок. Незалежна вибірка, коли дослідження впливу одного фактора перевіряється на двох і більше вибірках. Залежна вибірка - коли дослідження впливу кількох факторів перевіряється на одній і тій же вибірці. Розподіл – це поділ первинних даних, одержаних на вибірках, на класи або категорії з метою отримання узагальненої картини, яка дозволяє їх аналізувати. Частота – кількісна характеристика повторюваності ознаки. Варіанта – окремі значення ознаки, яких вона набуває у варіаційному ряді. Моніторинг – це спеціально організоване систематичне спостереження за станом певного психологічного феномена.
Шкали вимірювання.
Функція вимірювання полягає у наданні числових значень об'єктам, явищам чи процесам за певними правилами. Задання функції вимірювання передбачає: а) наявність вибірки; б) формулювання правила, за яким певним характеристикам ознаки встановлюється відповідність з множиною цілих невід'ємних чисел. Розглянемо види шкал:
Номінальна – це шкала найменувань. Розрізняють дихотомічну та альтернативну шкали.
Приклад 2. Результати голосування за кандидатів на посаду були такими: за кандидата А проголосувало 14 осіб, за кандидата Б – 11 осіб, за кандидата С – 16 осіб, а за кандидата Д – 22 особи. Оформити дані за допомогою номінальної шкали. Шкала результатів голосування.
Прізвище Результати голосування 1 Кандидат А 14 2 Кандидат Б 11 3 Кандидат С 16 4 Кандидат Д 22
Дані номінальної шкали можуть бути використані для визначення моди, медіани, середньої простої, дисперсії, середнього квадратичного відхилення та підлягають обробці методами χ2-Пірсона, лінійної та рангової кореляції, Q- критерія Розенбаума.
Порядкова або рангова – це шкала, що дозволяє класифікувати та упорядковувати дані. У порядковій шкалі класифікаційні групи (класи) утворюють послідовність від „меншого” до „більшого”, тобто у порядку зростання ознаки (або спадання). У порядковій шкалі має бути не менше 3-х груп (класів). Дані порядкової шкали можуть бути використані для визначення моди, медіани, середньої зваженої, дисперсії, середнього квадратичного відхилення та підлягають обробці методами t-Стьюдента, F-Фішера, U-Манна-Уітні, χ2-Пірсона, лінійної та рангової кореляції. Подамо зразки порядкових шкал.
Приклад 3. При проведенні анкетування вчителі обирали один із 18 варіантів відповідей. Усього в анкетуванні взяли участь 142 учителі. Під час первинної статистичної обробки номеру відповіді анкети, який обирали вчителі, присвоєно термін „позиція”, а кількість учителів, котрі обирали один і той же номер варіанту відповіді, визначалася як частота.
Позиція 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Частота 1 1 2 3 5 9 12 16 22 18 14 10 9 8 6 3 2 1
Приклад 4. Студентами психолого-педагогічного факультету були проведені заміри інтелектуального розвитку дітей 12 років за допомогою тесту CFIT (культурно-вільний тест на інтелект). Були отримані такі дані: 72, 61, 42, 32, 72, 65, 99, 47, 61, 42, 69, 61, 53, 72, 65, 83, 47, 69, 72, 53, 82, 69, 47, 53, 98, 92, 77, 65, 77, 69, 72, 53, 82, 83, 65, 69, 72. Виконати обробку даних та оформити їх у порядкову шкалу. Всього діагностовано 37 учнів.
Значення ознаки 32 42 47 53 61 65 69 72 77 82 83 92 98 99 Частоти 1 2 3 4 3 4 5 6 2 2 2 1 1 1 Інтервальна – це шкала поділу одиниць сукупності на класи, однорідні за певними ознаками. Якщо значень ознаки у дослідженні виявиться дуже багато, то подання статистичного матеріалу за допомогою порядкової шкали може бути громіздким та незручним для подальшої обробки, тому частоти розбиваються на кілька класів або інтервалів. Інтервал – це значення варіативної ознаки у певних межах. Кількість інтервалів (класів) залежить як від обсягу вибірки, так і від розмаху варіації (R): На практиці для визначення кількості інтервалів (k)користуються емпіричною формулою Стерджеса або за таблицею:
Обсяг вибірки 25-40 40-60 60-100 100-200 >200 Число класів ( k) 5-6 6-8 7-10 8-12 10-15 Ширина рівних інтервалів визначається за формулою, де значення найбыльшого та найменшого значень ознаки ділиться на кількість класів (k).
Приклад 5. Побудувати інтервальну шкалу за даними прикладу 3 (для порядкової шкали). Обчислимо ширину інтервалу: h = 2,13.
Інтерв.1–3,13 3,13–5,26 5,25–7,38 7,38–9,51 9,51–11,66 11,66–13,79 13,79–15,92 15,92–18,0 Частоти 4 8 21 38 32 19 14 6 Приклад 6. Студентами психолого-педагогічного факультету були проведені заміри загальних здібностей учнів 8-х класів за тестом Г. Айзенка. На виконання 40 завдань відводилося 30 хвилин. Були отримані такі дані: 41, 19, 31, 22, 31, 34, 34, 31, 44, 37, 45, 22, 37, 29, 37, 25, 29, 34, 37, 37, 41, 46, 34, 29, 37, 31, 25, 37. Подати результати замірів у інтервальній шкалі.
Спочатку упорядкуємо дані про загальні здібності 28 учнів та оформимо у порядкову шкалу.
Варіанти 19 22 25 29 31 34 37 41 44 45 46 Частота 1 2 2 3 5 3 7 3 1 1 1 Обчислимо ширину інтервалу: 46 – 19 = 27 h = 27:5 = 5,4
Побудуємо інтервальну шкалу.
Інтервали 19–24,4 24,4–29,8 29,8–35,2 35,2 – 40,6 40,6 – 46 Частоти 3 5 8 7 5
|