Допомогою методів математичної статистики. Основи математичної статистики. вибірковий коефіцієнт регресії V на H

Методи математичної статистики


1. Введення

Математичною статистикою називається наука, що займається розробкою методів отримання, опису та обробки дослідних даних з метою вивчення закономірностей випадкових масових явищ.

У математичній статистиці можна назвати два напрями: описову статистику і індуктивну статистику (статистичний висновок). Описова статистика займається накопиченням, систематизацією та поданням досвідчених даних у зручній формі. Індуктивна статистика на основі цих даних дозволяє зробити певні висновки щодо об'єктів, про які зібрані дані або оцінки їх параметрів.

Типовими напрямками математичної статистики є:

1) теорія вибірок;

2) теорія оцінок;

3) перевірка статистичних гіпотез;

4) регресійний аналіз;

5) дисперсійний аналіз.

В основі математичної статистики лежить ряд вихідних понять, без яких неможливе вивчення сучасних методів обробки досвідчених даних. У перших їх можна поставити поняття генеральної сукупності і вибірки.

При масовому промисловому виробництві часто потрібно без перевірки кожного виробу встановити, чи відповідає якість продукції стандартам. Так як кількість продукції дуже велика або перевірка продукції пов'язана з приведенням її в непридатність, то перевіряється невелика кількість виробів. На основі цієї перевірки потрібно дати висновок про всю серію виробів. Звичайно не можна стверджувати, що всі транзистори з партії в 1 млн штук придатні або непридатні, перевіривши один з них. З іншого боку, оскільки процес відбору зразків для випробувань і самі випробування можуть виявитися тривалими за часом і призвести до великих витрат, то обсяг перевірки виробів повинен бути таким, щоб він зміг дати достовірне уявлення про всю партію виробів, будучи мінімальним розміром. З цією метою введемо низку понять.

Вся сукупність об'єктів, що вивчаються, або експериментальних даних називається генеральною сукупністю. Будемо позначати через N число об'єктів чи кількість даних, що становлять генеральну сукупність. Величину N називають обсягом генеральної сукупності. Якщо N>>1, тобто N дуже велике, то зазвичай вважають N = ¥.

Випадковою вибіркою або просто вибіркою називають частину генеральної сукупності, навмання відібрану з неї. Слово " навмання " означає, що можливість вибору будь-якого об'єкта з генеральної сукупності однакова. Це важливе припущення, однак, часто важко перевірити на практиці.

Об'ємом вибірки називають кількість об'єктів або кількість даних, що становлять вибірку, і позначають n. Надалі вважатимемо, що елементам вибірки можна приписати відповідно числові значення х 1, х 2, ... х n. Наприклад, у процесі контролю якості вироблених біполярних транзисторів це можуть бути вимірювання їхнього коефіцієнта посилення по постійному струму.


2. Числові характеристики вибірки

2.1 Вибіркове середнє

Для конкретної вибірки обсягу n її вибіркове середнє

визначається співвідношенням

де х i – значення елементів вибірки. Зазвичай потрібно описати статистичні властивості довільних випадкових вибірок, а чи не однієї з них. Це означає, що розглядається математична модель, яка передбачає досить велику кількість вибірок обсягу n. У цьому випадку елементи вибірки розглядаються як випадкові величини Х i , що приймають значення х i з густиною ймовірностей f(x), що є густиною ймовірностей генеральної сукупності. Тоді вибіркове середнє також є випадковою величиною

рівною

Як і раніше позначатимемо випадкові величини великими літерами, а значення випадкових величин - малими.

Середнє значення генеральної сукупності, з якої проводиться вибірка, називатимемо генеральним середнім і позначатим m x . Очікується, що якщо обсяг вибірки значний, то вибіркове середнє не помітно відрізнятиметься від генерального середнього. Оскільки вибіркове середнє є випадковою величиною, для неї можна знайти математичне очікування:

Таким чином, математичне очікування вибіркового середнього дорівнює генеральному середньому. І тут кажуть, що вибіркове середнє є незміщеною оцінкою генерального середнього. Надалі ми повернемось до цього терміну. Так як вибіркове середнє є випадковою величиною, що флуктує навколо генерального середнього, то бажано оцінити цю флуктуацію за допомогою дисперсії вибіркового середнього. Розглянемо вибірку, обсяг якої n значно менший за обсяг генеральної сукупності N (n<< N). Предположим, что при формировании выборки характеристики генеральной совокупности не меняются, что эквивалентно предположению N = ¥. Тогда

Випадкові величини Х i і X j (i¹j) можна вважати незалежними, отже,

Підставимо отриманий результат у формулу для дисперсії:

де s 2 - Дисперсія генеральної сукупності.

З цієї формули випливає, що зі збільшенням обсягу вибірки флуктуації середнього вибіркового близько середнього генерального зменшуються як s 2 /n. Проілюструємо сказане прикладом. Нехай є випадковий сигнал з математичним очікуванням та дисперсією відповідно рівними m x = 10, s 2 = 9.

Відліки сигналу беруться в рівновіддалені моменти часу t 1 , t 2 , ... ,

X(t)

X 1

t 1 t 2 . . . t n t

Оскільки відліки є випадковими величинами, їх позначатимемо X(t 1), X(t 2), . . . , X(t n).

Визначимо кількість відліків, щоб середнє відхилення оцінки математичного очікування сигналу не перевищило 1% його математичного очікування. Оскільки m x = 10, потрібно, щоб

З іншого боку, тому або Звідси отримуємо, що n ³ 900 відліків.

2.2 Вибіркова дисперсія

За вибірковими даними важливо знати як вибіркове середнє, а й розкид вибіркових значень біля вибіркового середнього. Якщо вибіркове середнє є оцінкою генерального середнього, то вибіркова дисперсія має бути оцінкою генеральної дисперсії. Вибіркова дисперсія

для вибірки, що складається з випадкових величин, визначається наступним чином

Використовуючи це представлення вибіркової дисперсії, знайдемо її математичне очікування

Одеський національний медичний університет Кафедра біофізики, інформатики та медичної апаратури Методичні вказівкистудентам 1 курсу на тему “Основи математичної статистики” Одеса 2009 р.

1.Тема: "Основи математичної статистики".

2. Актуальність теми.

Математична статистика – це розділ математики, яка вивчає методи збирання, систематизації та обробки результатів спостережень масових випадкових подій з метою з'ясування та практичного застосування існуючих закономірностей. Методи математичної статистики знайшли широке застосування у клінічній медицині та охороні здоров'я. Вони використовуються, зокрема, при розробці математичних методів медичної діагностики, теорії епідемій, в плануванні та обробці результатів медичного експерименту, в організації охорони здоров'я. Статистичні концепції, свідомо чи несвідомо, використовуються при прийнятті рішень у таких питаннях, як клінічний діагноз, прогнозування перебігу хвороби у окремого хворого, прогнозування можливих результатів здійснення тих чи інших програм у цій групі населення та вибір належної програми у конкретних обставинах. Знайомство з ідеями та методами математичної статистики є необхідним елементом професійної освіти кожного працівника охорони здоров'я.

3. Цілі заняття. Загальна мета заняття є навчитися студентам свідомо використовувати математичну статистику під час вирішення завдань медико-біологічного профілю. Конкретні цілі заняття:
  1. ознайомити студентів з основними ідеями, поняттями та методами математичної статистики, приділяючи увагу, головним чином, питанням, пов'язаним з опрацюванням результатів спостережень масових випадкових подій з метою з'ясування та практичного застосування існуючих закономірностей;
  2. навчити студентам свідомо застосовувати основні поняття математичної статистики під час вирішення найпростіших проблем, що виникають у професійній діяльності лікаря.
Студент повинен знати (2 рівень):
  1. визначення частоти класу (абсолютної та відносної)
  2. визначення генеральної сукупності та вибірки, обсягу вибірки
  3. точкове та інтервальне оцінювання
  4. надійний інтервал та достовірність
  5. визначення моди, медіани та вибіркового середнього
  6. визначення розмаху, міжквартильного розмаху, квартильного відхилення
  7. визначення середнього абсолютного відхилення
  8. визначення вибіркової коваріації та дисперсії
  9. визначення вибіркових стандартного відхилення та коефіцієнта варіації
  10. визначення вибіркових коефіцієнтів регресії
  11. емпіричні рівняння лінійної регресії
  12. визначення вибіркового кореляційного коефіцієнта
Студент повинен опанувати елементарні звички обчислення (3 рівень):
  1. моди, медіани та вибіркового середнього
  2. розмаху, міжквартильного розмаху, квартильного відхилення
  3. середнього абсолютного відхилення
  4. вибіркової коваріації та дисперсії
  5. вибіркових стандартного відхилення та коефіцієнта варіації
  6. надійного інтервалу для математичного очікування та дисперсії
  7. вибіркових коефіцієнтів регресії
  8. вибіркового кореляційного коефіцієнта.
4. Шляхи реалізації цілей заняття: Для реалізації цілей заняття Вам необхідні такі вихідні знання:
  1. Визначення розподілу, ряд розподілу та багатокутника розподілу дискретної випадкової величини
  2. Визначення функціональної залежності між випадковими величинами
  3. Визначення кореляційної залежності між випадковими величинами
Вам також необхідно вміти обчислювати ймовірності несумісних і спільних подій за допомогою відповідних правил. 5. Завдання для перевірки студентами свого початкового рівня знань. Контрольні питання
  1. Визначення випадкової події, її відносну частоту та ймовірність.
  2. Теорема складання ймовірностей несумісних подій
  3. Теорема складання ймовірностей спільних подій
  4. Теорема множення ймовірностей незалежних подій
  5. Теорема множення ймовірностей залежних подій
  6. Теорема повної ймовірності
  7. Теорема Байєса
  8. Визначення випадкових величин: дискретної та безперервної
  9. Визначення розподілу, ряд розподілу та багатокутника розподілу дискретної випадкової величини
  10. Визначення функції розподілу
  11. Визначення заходів положення центру розподілу
  12. Визначення заходів варіабельності значень випадкової величини
  13. Визначення щільності розподілу та кривої розподілу безперервної випадкової величини
  14. Визначення функціональної залежності між випадковими величинами
  15. Визначення кореляційної залежності між випадковими величинами
  16. Визначення регресії, рівняння та лінії регресії
  17. Визначення коваріації та коефіцієнта кореляції
  18. Визначення рівняння лінійної регресії.
6. Інформацію для зміцнення вихідних знань-умінь можна знайти у посібниках:
  1. Жуматій П.Г. Лекція "Теорія ймовірностей". Одеса, 2009.
  2. Жуматій П.Г. "Основи теорії ймовірностей". Одеса, 2009.
  3. Жуматій П.Г., Сеницька Я.Р. Елементи теорії ймовірностей. Методичні вказівки для студентів медичного інституту. Одеса, 1981.
  4. Чалий О.В., Агапов Б.Т., Цехмістер Я.В. Медична та біологічна фізика. Київ, 2004.
7. Зміст навчального матеріалу з цієї теми з виділенням основних вузлових питань.

Математична статистика - це розділ математики, яка вивчає методи збирання, систематизації, обробки, зображення, аналізу та інтерпретації результатів спостережень з метою виявлення існуючих закономірностей.

Застосування статистики в охороні здоров'я необхідне як на рівні спільноти, так і на окремих пацієнтів. Медицина має справу з індивідуумами, які відрізняються один від одного за багатьма характеристиками, і значення показників, на основі яких людину вважатимуться здоровою, варіюються від одного індивідуума до іншого. Немає двох абсолютно однакових пацієнтів чи двох груп пацієнтів, тому рішення, що стосуються окремих хворих чи груп населення, доводиться приймати, виходячи з досвіду, накопиченого на інших хворих чи популяціних групах зі схожими біологічними характеристиками. Необхідно усвідомлювати, що з огляду на існуючі розбіжності ці рішення неможливо знайти абсолютно точними - завжди пов'язані з деякою невизначеністю. Саме в цьому полягає імовірна природа медицини.

Деякі приклади застосування статистичних методів у медицині:

трактування варіації (варіабельність характеристик організму при вирішенні питання про те, яке значення тієї чи іншої характеристики буде ідеальним, нормальним, середнім тощо, робить необхідним використання відповідних статистичних методів).

діагностика захворювань у окремих хворих та оцінка стану здоров'я групи населення.

прогнозування кінця хвороби в окремих хворих чи можливого результату програми боротьби з тією чи іншою хворобою у будь-якій групі населення.

вибір придатного впливу хворого чи групу населення .

планування та проведення медичних досліджень, аналіз та публікація результатів, їх читання та критична оцінка.

планування охорони здоров'я та керівництво ім.

Корисна медична інформація зазвичай прихована у масі необроблених даних. Необхідно сконцентрувати інформацію, що міститься в них, та подати дані так, щоб структуру варіації було добре видно, а потім уже вибрати конкретні методи аналізу.

Зображення даних передбачає знайомство з такими поняттями та термінами:

Варіаційний ряд (упорядковане розташування) - просте впорядкування окремих спостережень за величиною.

клас - одне із інтервалів, куди ділять весь діапазон значень випадкової величини.

крайні точки класу – значення, які обмежують клас, наприклад 2,5 та 3,0, нижня та верхня межі класу 2,5 – 3,0.

(Абсолютна) частота класу - число спостережень у класі.

відносна частота класу - абсолютна частота класу, виражена як приватні загального числа спостережень.

Кумулятивна (накопичена) частота класу - число спостережень, яке дорівнює сумі частот усіх попередніх класів та даного класу.

Стовпцева діаграма - графічне зображення частот даних для номінальних класів за допомогою стовпців, висоти яких прямо пропорційні частотам класів.

Кругова діаграма – графічне зображення частот даних для номінальних класів за допомогою секторів кола, площі яких прямо пропорційні частотам класів.

гістограма - графічне зображення частотного розподілу кількісних даних площами прямокутників, що прямо пропорційні частотам класів.

полігон частот – графік частотного розподілу кількісних даних; точку, що відповідає частоті класу, розташовують над серединою інтервалу, кожне дві сусідні точки з'єднують відрізком прямої.

огива (кумулятивна крива) – графік розподілу кумулятивних відносних частот.

Всім медичним даним властивий варіабельність, тому аналіз результатів вимірювань заснований на вивченні відомостей про те, яких значеннях набувала випадкова величина, що досліджується.

Сукупність всіх можливих значень випадкової величини називається генеральною.

Частина генеральної сукупності, зареєстрована в результаті випробувань, зветься виборкою.

Число спостережень, включене у вибірку, називають обсягом вибірки (зазвичай позначається n).

Завдання вибіркового методу у тому, щоб у отриманої виборцю зробити правильну оцінку випадкової величини, яка вивчається. Тому основна вимога, яка пред'являється до вибірки, це максимальне відображення всіх рис генеральної сукупності. Вибірка, що задовольняє цій вимогі, називається репрезентативною. Від репрезентативності вибірки залежить обгрунтованість оцінки, тобто ступінь відповідності оцінки параметру, який вона характеризує.

При оцінюванні параметрів генеральної сукупності за виборцем (параметричне оцінювання) користуються такими поняттями:

точкове оцінювання - оцінка параметра генеральної сукупності як одиничного значення, яке може прийняти з найбільшою ймовірністю.

Інтервальне оцінювання - оцінка параметра генеральної сукупності у вигляді інтервалу значень, який має задану ймовірність накрити його справжнє значення.

При інтервальному оцінюванні використовують поняття:

надійний інтервал - інтервал значень, що має задану можливість накрити справжнє значення параметра генеральної сукупності при інтервальному оцінюванні.

достовірність (надійна ймовірність) – ймовірність, з якою надійний інтервал накриває справжнє значення параметра генеральної сукупності.

надійні межі - нижня та верхня межі надійного інтервалу.

Висновки, які виходять методами математичної статистики, завжди ґрунтуються на обмеженій, вибірковій кількості спостережень, тому природно, що для другої вибірки результати можуть бути іншими. Ця обставина визначає ймовірнісний характер висновків математичної статистики і, як наслідок, широке використання теорії ймовірностей у практиці статистичного дослідження.

Типовий шлях статистичного дослідження такий:

оцінивши величини чи залежності між ними за даними спостережень, висувають припущення про те, що явище, яке вивчається, можна описати тією чи іншою стохастичною моделлю

використовуючи статистичні методи, можна це припущення підтвердити чи відкинути; при підтвердженні мети досягнуто - знайдено модель, яка описує досліджувані закономірності, у протилежному випадку продовжують роботу, висуваючи та перевіряючи нову гіпотезу.

Визначення вибіркових статистичних оцінок:

мода - це значення, яке найчастіше зустрічається у виборці,

медіана - центральне (середнє) значення варіаційного ряду

розмах R - різниця між найбільшим і найменшим значеннями у серії спостережень

процентилі - значення в варіаційному ряді, які ділять розподіл на 100 рівних частин (отже медіана буде п'ятдесятим процентилем)

перший квартиль - 25-ий процентиль

третій квартиль - 75-ий процентиль

міжквартильний розмах - різниця між першим та третім квартилями (охоплює центральних 50% спостережень)

квартильне відхилення - половина міжквартильного розмаху

вибіркове середнє - середнє арифметичне всіх вибіркових значень (вибіркова оцінка математичного очікування)

середнє абсолютне відхилення - сума відхилень від відповідного початку (без урахування знака), поділена на обсяг вибірки

середнє абсолютне відхилення від вибіркового середнього обчислюють за формулою

вибіркова дисперсія ( X ) - (вибіркова оцінка дисперсії) визначається формулою

вибіркова коваріація -- (вибіркова оцінка коваріації К ( Х, Y )) дорівнює

вибірковий коефіцієнт регресії Y на X (вибіркова оцінка коефіцієнта регресії Y на X) дорівнює

емпіричне рівняння лінійної регресії Y на X має вигляд

вибірковий коефіцієнт регресії X на Y (вибіркова оцінка коефіцієнта регресії X на Y) дорівнює

емпіричне рівняння лінійної регресії X на Y має вигляд

вибіркове стандартне відхилення s(Х) - (вибіркова оцінка стандартного відхилення) дорівнює кореню квадратному з вибіркової дисперсії

вибірковий кореляційний коефіцієнт - (вибіркова оцінка кореляційного коефіцієнта) дорівнює

вибірковий коефіцієнт варіації  - (вибіркова оцінка коефіцієнта варіації CV) дорівнює

.

8. Завдання для самостійної підготовки студентів. 8.1 Завдання для самостійного вивчення матеріалу на тему.

8.1.1 Практичне обчислення вибіркових оцінок

Практичне обчислення вибіркових точкових оцінок

приклад 1 .

Тривалість захворювання (у днях) у 20 випадках пневмонії склала:

10, 11, 6, 16, 7, 13, 15, 8, 9, 10, 11, 13, 7, 8, 13, 15, 16, 13, 14, 15

Визначити моду, медіану, розмах, міжквартильний розмах, вибіркове середнє, середнє абсолютне відхилення від вибіркового середнього, вибіркову дисперсію, вибірковий коефіцієнт варіації.

Розв"зок.

Варіаційний ряд для вибірки має вигляд

6, 7, 7, 8, 8, 9, 10, 10, 11, 11, 13, 13, 13, 13, 14, 15, 15, 15, 16, 16

Мода

Найчастіше у виборці зустрічається число 13. Тому значенням моди у виборці буде це число.

Медіана

Коли варіаційний ряд містить парне число спостережень, медіана дорівнює середньому двох центральних членів ряду, у разі це 11 і 13, тому медіана дорівнює 12.

Розмах

Мінімальне значення у виборці дорівнює 6, а максимальне 16, отже, R = 10.

Міжквартильний розмах, квартильне відхилення

У варіаційному ряді чверть всіх даних має значення менші, або на рівні 8, тому перший квартиль 8, а 75% усіх даних мають значення менші, або на рівні 12, тому третій квартиль 14. Отже, міжквартильний розмах дорівнює 6, а квартильне відхилення становить 3.

Вибіркове середнє

Середнє арифметичне всіх вибіркових значень дорівнює

.

Середнє абсолютне відхилення від вибіркового середнього

.

Вибіркова дисперсія

Вибіркове стандартне відхилення

.

Bібірковий коефіцієнт варіації

.

У наступному прикладі розглянемо найпростіші засоби вивчення стохастичної залежності між двома випадковими величинами.

Приклад 2 .

При обстеженні групи пацієнтів отримані дані про зростання Н(см) та об'єм циркулюючої крові V(л):

Знайти емпіричні рівняння лінійної регресії.

Розв"зок.

Перше, що необхідно обчислити, це:

вибіркове середнє

вибіркове середнє

.

Друге, що необхідно підрахувати, це:

вибіркову дисперсію (Н)

вибіркову дисперсію (V)

вибіркову коваріацію

Третє, це обчислення вибіркових коефіцієнтів регресії:

вибірковий коефіцієнт регресії V на H

вибірковий коефіцієнт регресії H на V

.

Четверте, записати шукані рівняння:

емпіричне рівняння лінійної регресії V на H має вигляд

емпіричне рівняння лінійної регресії H на V має вигляд

.

Приклад 3 .

Використовуючи умови та результати прикладу 2, вирахувати коефіцієнт кореляції та перевірити достовірність існування кореляційної залежності між зростанням людини та обсягом циркулюючої крові з 95% надійною ймовірністю.

Розв"зок.

Коефіцієнт кореляції пов'язаний з коефіцієнтами регресії та практично корисною формулою

.

Для вибіркової оцінки коефіцієнта кореляції ця формула має вигляд

.

Використовуючи вираховані у прикладі 2 значення вибіркових коефіцієнтів регресії та отримаємо

.

Перевірка достовірності кореляційної залежності між випадковими величинами (належить до нормального розподілу в кожній з них) здійснюється таким чином:

  • обчислюють величину Т

  • знаходять у таблиці розподілу Стьюдента коефіцієнт

  • існування кореляційної залежності між випадковими величинами підтверджується під час виконання нерівності

.

Оскільки 3,5 > 2,26, то з 95% надійною ймовірністю існування кореляційної залежності між зростанням пацієнта та обсягом циркулюючої крові можна вважати встановленим.

Інтервальні оцінки для математичного очікування та дисперсії

Якщо випадкова величина має нормальний розподіл, то інтервальні оцінки для математичного очікування та дисперсії обчислюють у такій послідовності:

1.знаходять вибіркове середнє;

2. підраховують вибіркову дисперсію та вибіркове стандартне відхилення s;

3. у таблиці розподілу Стьюдента за надійною ймовірністю  та обсягом вибірки n знаходять коефіцієнт Стьюдента;

4. надійний інтервал для математичного очікування записують як

5. у таблиці розподілу "> та обсягом вибіркиn знаходять коефіцієнти

;

6.надійний інтервал для дисперсії записують у вигляді

Величина надійного інтервалу, надійна ймовірність і обсяг вибірки залежать один від одного. Насправді ставлення

зменшується зі зростаннямn, отже, при постійній величинінадійного інтервалу зі зростаннямn росте і. При постійній надійній ймовірності зі зростанням обсягу вибіркип зменшується величина надійного інтервалу. При плануванні медичних досліджень цей зв'язок використовують для визначення мінімального обсягу вибірки, який забезпечить потрібні за умовами завдання величини надійного інтервалу і надійної ймовірності.

Приклад 5.

Використовуючи умови та результати прикладу 1, знайдіть інтервальні оцінки математичного очікування та дисперсії для 95% надійної ймовірності.

Розв"зок.

У прикладі 1 вираховані точкові оцінки математичного очікування (вибіркове середнє =12), дисперсії (вибіркова дисперсія =10,7) та стандартного відхилення (вибіркове стандартне відхилення). Обсяг вибірки дорівнює п = 20.

З таблиці розподілу Стьюдента знайдемо значення коефіцієнта

далі обчислимо напівширину надійного інтервалу

та запишемо інтервальну оцінку математичного очікування

10,5 < < 13,5 при = 95%

З таблиці розподілу Пірсона "хі-квадрат" знайдемо коефіцієнти

обчислимо нижню та верхню надійні межі

та запишемо інтервальну оцінку для дисперсії у вигляді

6,2 23 при  = 95%.

8.1.2. Завдання для самостійного вирішення

Для самостійного вирішення пропонуються задачі5.4 З 1 – 8 (П.Г.Жуматій. “Математична обробка медико-біологічних даних. Завдання та приклади”. Одеса, 2009, с. 24-25)

8.1.3. Контрольні питання
  1. Частота класу (абсолютна та відносна).
  2. Генеральна сукупність та вибірка, обсяг вибірки.
  3. Точкове та інтервальне оцінювання.
  4. Надійний інтервал та достовірність.
  5. Мода, медіана та вибіркове середнє.
  6. Розмах, міжквартальний розмах, квартальне відхилення.
  7. Середнє абсолютне відхилення.
  8. Вибіркова коваріація та дисперсія.
  9. Вибіркові стандартне відхилення та коефіцієнт варіації.
  10. Вибіркові коефіцієнти регресії.
  11. Емпіричні рівняння регресії.
  12. Обчислення кореляційного коефіцієнта та достовірності кореляційного зв'язку.
  13. Побудова інтервальних оцінок нормально розподілених випадкових величин.
8.2 Основна література
  1. Жуматій П.Г. “Математична обробка медико-біологічних даних. Завдання та приклади”. Одеса, 2009.
  2. Жуматій П.Г. Лекція "Математична статистика". Одеса, 2009.
  3. Жуматій П.Г. "Основи математичної статистики". Одеса, 2009.
  4. Жуматій П.Г., Сеницька Я.Р. Елементи теорії ймовірностей. Методичні вказівки для студентів медичного інституту. Одеса, 1981.
  5. Чалий О.В., Агапов Б.Т., Цехмістер Я.В. Медична та біологічна фізика. Київ, 2004.
8.3 Додаткова література
  1. Ремізов О.M. Медична та біологічна фізика. М., “ вища школа”, 1999.
  2. Ремізов О.M., Ісакова Н.Х., Максіна О.Г.. Збірник завдань із медичної та біологічної фізики. М., ., "Вища школа", 1987.
Методичні вказівки склав доц. П. Г. Жуматій.

Методи математичної статистики застосовуються, як правило, на всіх етапах аналізу дослідницьких матеріалів для вибору стратегії вирішення задач за конкретними вибірковими даними, оцінювання отриманих результатів. Для обробки матеріалу використовувалися методи математичної статистики. Математична обробка матеріалів дозволяє з усією чіткістю виділити та оцінити кількісні параметри об'єктивної інформації, проаналізувати та подати їх у різних співвідношеннях та залежностях. Вони дозволяють визначити міру варіювання величин у зібраних матеріалах, що містять кількісну інформацію про деяку множину випадків, частина з яких підтверджує передбачувані зв'язки, а частина не виявляє їх, обчислити достовірність кількісних відмінностей між виділеними сукупностями випадків, отримати інші математичні характеристики, необхідні для правильного тлумачення фактів . Достовірність відмінностей отриманих під час дослідження визначалася за t-критерієм Стьюдента.

Розраховувалися такі величини.

1. Середнє арифметичне значеннявибірки.

Характеризує середнє значення аналізованої сукупності. Позначимо результати вимірів. Тоді:

де У - сума всіх значень, коли поточний індекс i змінюється від 1 до n.

2. Середнє квадратичне відхилення (стандартне відхилення), що характеризує розсіювання, розкиданість аналізованої сукупності щодо середнього арифметичного значення.

= (x max - x min) / k

де – середнє квадратичне відхилення

хmaх - максимальне значення таблиці;

хmin – мінімальне значення таблиці;

k - коефіцієнт

3. Стандартна помилка середньої арифметичної або помилка репрезентативності (m). Стандартна помилка середньої арифметичної характеризує ступінь відхилення вибіркової середньої арифметичної від середньої генеральної арифметичної сукупності.

Стандартна помилка середньої арифметичної обчислюється за такою формулою:

де у - стандартне відхилення результатів вимірів,

n – обсяг вибірки. Чим менше m, тим вище стабільність, стійкість результатів.

4. Критерій Стьюдента.

(у чисельнику - різниця середніх значень двох груп, у знаменнику - квадратний коріньіз суми квадратів стандартних помилок цих середніх).

При обробці лікуваних результатів дослідження використовували комп'ютерну програмуіз пакетом Excel.

Організація дослідження

Дослідження проводилося нами за загальноприйнятими правилами, та здійснювалося у 3 етапи.

На першому етапі було зібрано та проаналізовано отриманий матеріал з аналізованої проблеми дослідження. Формувався предмет наукового дослідження. Проведений аналіз літератури на даному етапі дозволив конкретизувати мету та завдання дослідження. Проведено первинне тестування техніки бігу на 30 метрів.<... class="gads_sm">

На третьому етапі було систематизовано отриманий у результаті наукового дослідження матеріал, узагальнено всю наявну інформацію з проблеми дослідження.

Експериментальне дослідження проводилося з урахуванням ГУО «Ляховичська Середня школа», Загалом вибірка склала 20 учнів 6 класів (11-12 років).

Розділ 3. Аналіз результатів дослідження

В результаті педагогічного експерименту нами було виявлено вихідний рівень техніки бігу на 30 м учнів у контрольній та експериментальній групах (Додатки 1-2). Статистична обробка одержаних результатів дозволила отримати такі дані (таблиця 6).

Таблиця 6. Вихідний рівень якості бігу

Як видно з таблиці 6 середня кількість балів у спортсменів контрольної та експериментальної групи статистично не відрізняються, в експериментальній групі середній бал становив 3,6 бали, а в контрольній 3,7 бали. T-критерій в обох групах tемп=0,3; Р?0,05, при tкрит=2,1; Результати вихідного тестування показали, що показники не залежать від навченості та мають випадковий характер. По початковому тестуванню показники якості бігу у контрольної групи трохи перевищували показники експериментальної групи. Але не було виявлено статистично достовірних відмінностей у групах, що є доказом ідентичності учнів контрольної та експериментальної груп з техніки бігу 30м.

За час експерименту в обох групах покращали показники, що характеризують ефективність техніки бігу. Однак це поліпшення в різних групах учасників експерименту мало різний характер. Внаслідок навчання виявлено закономірний невеликий приріст показників у контрольній групі (3,8 бала). Як видно з Додатка 2 в експериментальній групі було виявлено великий приріст показників. Учні займалися за запропонованою нами програмою, що достовірно покращило показники.

Таблиця 7. Зміни якості бігу у випробуваних експериментальної групи

В ході експерименту ми встановили, що підвищені навантаження в експериментальній групі дали значні покращення розвитку швидкості, ніж у контрольній групі.

У підлітковому віці доцільно розвивати швидкість шляхом переважного використання засобів фізичного виховання, вкладених у підвищення частоти рухів. У віці 12-15 років підвищуються швидкісні здібності, в результаті застосування головним чином швидкісно-силових та силових вправ, які використані нами в процесі проведення уроків фізичної культурита позакласних занять спортивної секції баскетболу та легкої атлетики.

При проведенні занять в експериментальній групі велася строга етапність ускладнення та рухового досвіду. Своєчасно велася робота над помилками. Як показав аналіз фактичних даних, експериментальна методика навчання мало істотну зміну на якість виконання техніки бігу (tемп=2,4). Аналіз отриманих результатів в експериментальній групі та порівняння їх із даними, отриманими в контрольній групі при використанні загальноприйнятої методики навчання, дають підстави стверджувати, що запропонована нами методика підвищить ефективність навчання.

Таким чином, на етапі вдосконалення методики бігу 30м у школі ми виявили динаміку зміни показників тестування в експериментальній та контрольній групі. Після проведеного експерименту якість виконання прийому підвищилася експериментальної групі до 4,9 балів (t=3,3; Р?0,05). До кінця експерименту якість володіння технікою бігу в експериментальній групі виявилося вищим, ніж у контрольній групі.

Математична статистика- це сучасна галузь математичної науки, яка займається статистичним описом результатів експериментів та спостережень, а також побудовою математичних моделей, що містять поняття імовірності.Теоретичною базою математичної статистики є теорія імовірності.

У структурі математичної статистики традиційно виділяють два основні розділи: описова статистиката статистичні висновки (рис. 1.1).

Рис. 1.1. Основні розділи математичної статистики

Описова статистикавикористовується для:

o узагальнення показників однієї змінної (статистика випадкової вибірки);

o виявлення взаємозв'язків між двома та більш змінними (кореляційно-регресійний аналіз).

Описова статистика дає змогу отримати нову інформаціюшвидше зрозуміти і всебічно оцінити її, тобто виконує наукову функцію опису об'єктів дослідження, чим і виправдовує свою назву. Методи описової статистики покликані перетворити сукупність окремих емпіричних даних на систему наочних сприйняття форм і чисел: розподілу частот; показники тенденцій, варіативності, зв'язку. Цими методами розраховуються статистики випадкової вибірки, які є основою здійснення статистичних висновків.

Статистичні висновкидають можливість:

o оцінити точність, надійність та ефективність вибіркових статистик, знайти помилки, що виникають у процесі статистичних досліджень(Статистичне оцінювання)

o узагальнити параметри генеральної сукупності, отримані виходячи з вибіркових статистик (перевірка статистичних гіпотез).

Головна мета наукових досліджень - це здобуття нового знання про великі класи явищ, осіб або подій, які прийнято називати генеральною сукупністю.

Генеральна сукупність- це повна сукупність об'єктів дослідження, вибірка- її частина, яка сформована у певний науково обґрунтований спосіб 2.

Термін "генеральна сукупність" використовується тоді, коли йдеться про велику, але кінцеву сукупність досліджуваних об'єктів. Наприклад, про сукупність абітурієнтів України у 2009 році чи сукупність дітей дошкільного віку міста Рівного. Генеральні сукупності можуть досягати значних обсягів, бути кінцевим та нескінченним. Насправді, зазвичай, мають справу з кінцевим сукупностями. І якщо відношення обсягу генеральної сукупності до обсягу вибірки становить понад 100, то, за словами Гласса і Стенлі, методи оцінки для кінцевих і нескінченних сукупностей дають по суті однакові результати. Генеральною сукупністю можна і повну сукупність значень якогось ознаки. Приналежність вибірки до генеральної сукупності є основною підставою для оцінки характеристик генеральної сукупності за характеристиками вибірки.

Основна ідеяМатематична статистика базується на переконанні про те, що повне вивчення всіх об'єктів генеральної сукупності в більшості наукових завдань або практично неможливо, або економічно недоцільне, оскільки потребує багато часу і значних матеріальних витрат. Тому в математичній статистиці застосовується вибірковий підхід,принцип якого показано на схемі рис. 1.2.

Наприклад, за технологією формування розрізняють вибірки рандомізовані (прості та систематичні), стратифіковані, кластерні (див. Розділ 4).

Рис. 1.2. Схема застосування методів математичної статистики Згідно вибірковим підходомвикористання математико- статистичних методівможе проводитися в такій послідовності (див. мал. 1.2):

o з генеральної сукупності,властивості якої підлягають дослідженню, визначеним методами формують вибірку- типову та обмежену кількість об'єктів, до яких застосовують дослідницькі методи;

o в результаті методів спостережень, експериментальних дій та вимірювань над об'єктами вибірки отримують емпіричні дані;

o обробка емпіричних даних з допомогою методів описової статистики дає показники вибірки, які називаються статистиками - як і назва дисципліни, до речі;

o застосовуючи методи статистичних висновків до статистика,одержують параметри, які характеризують властивості генеральної сукупності.

приклад 1.1.З метою оцінки стабільності рівня знань (змінна X)проведено тестування рандомізованої вибірки 3 студентів обсягом n.Тести містили по m завдань, кожне з яких оцінювалося за системою балів: "виконано" - 1, "не виконано" - 0. залишилися середні поточні досягнення студентів X

3 рандомізована вибірка(від англ. Random – випадковий) – це репрезентативна вибірка, яка сформована за стратегією випадкових випробувань.

на рівні минулих років/год? Послідовність рішення:

o з'ясувати змістовну гіпотезу типу: "якщо поточні результатитестування не відрізнятимуться від минулих, то можна вважати рівень знань студентів незмінним, а навчальний процес – стабільним”;

o сформулювати адекватну статистичну гіпотезу, наприклад, нуль-гіпотезу Н 0про те, що "поточний середній бал X статистично не відрізняється від середнього показника минулих років/год", тобто Н 0: X = / г проти відповідної альтернативної гіпотези X Ф ^;

o побудуватиемпіричні розподіли досліджуваної змінної X;

o визначити(при необхідності) кореляційні зв'язки, наприклад, між змінною Xта іншими показниками, побудувати лінії регресії;

o перевірити відповідність емпіричного розподілу нормальному закону;

o оцінити значення точкових показників та довірчий інтервал параметрів, наприклад, середнього;

o визначити критерій для перевірки статистичних гіпотез;

o виконати перевірку статистичних гіпотез на основі вибраних критеріїв;

o сформулювати рішення про статистичну нуль-гіпотезу на певному рівні значимості;

o перейти від рішення про прийняття чи відхилення статистичної нуль-гіпотези інтерпретації висновків щодо змістовної гіпотези;

o сформулювати змістовні висновки.

Отже, якщо узагальнити перераховані вище процедури, застосування статистичних методів складається з трьох основних блоків:

Перехід від об'єкта реальності до абстрактної математико-статистичної схеми, тобто побудова імовірнісної моделі явища, процесу, властивості;

Проведення розрахункових дій власне математичними засобамиу рамках імовірнісної моделі за результатами вимірювань, спостережень, експерименту та формулювання статистичних висновків;

Інтерпретація статистичних висновків про реальної ситуаціїта прийняття відповідного рішення.

Статистичні методи обробки та інтерпретації даних спираються на теорію ймовірностей. Теорія ймовірностей є основою методів математичної статистики. Без використання фундаментальних понять та законів теорії ймовірностей неможливе узагальнення висновків математичної статистики, а значить і обґрунтованого їх використання для наукових та практичних цілей.

Так, завданням описової статистики є перетворення сукупності вибіркових даних на систему показників – статистик – розподілів частот, заходів центральної тенденції та мінливості, коефіцієнтів зв'язку тощо. Проте, статистики є характеристиками, власне, конкретної вибірки. Звісно, ​​можна розраховувати вибіркові розподіли, вибіркові середні, дисперсії тощо. буд., але такий " аналіз даних " має обмежену науково-пізнавальну цінність. "Механічне" перенесення будь-яких висновків, зроблених на основі таких показників, на інші сукупності не є коректним.

Щоб мати можливість перенесення вибіркових показників чи інші, чи більш поширені сукупності, необхідно мати математично обгрунтовані положенняпро відповідність і можливість вибіркових характеристик характеристиками цих поширених про генеральних сукупностей. Такі положення базуються на теоретичних підходах та схемах, пов'язаних з ймовірнісними моделями реальності, наприклад, на аксіоматичному підході, у законі великих чисел тощо. Тільки з їх допомогою можна переносити властивості, встановлені за результатами аналізу обмеженої емпіричної інформації, або інші або поширені сукупності. Таким чином, побудова, закони функціонування, використання імовірнісних моделей є предметом математичної області під назвою "теорія ймовірностей", стає суттю статистичних методів.

Таким чином, у математичній статистиці використовуються два паралельні рядки показників: перший рядок, що має відношення до практики (це вибіркові показники) та другий, заснований на теорії (це показники імовірнісної моделі). Наприклад, емпіричним частотам, що визначені на вибірці, відповідають поняття теоретичної ймовірності; вибірковому середньому (практика) відповідає математичне очікування (теорія) тощо. Причому у дослідженнях вибіркові характеристики, як правило, є первинними. Вони розраховуються на основі спостережень, вимірювань, експериментів, після чого проходять статистичне оцінювання здатності та ефективності, перевірку статистичних гіпотез відповідно до цілей досліджень і наприкінці приймаються з певною ймовірністю як показники властивостей досліджуваних сукупностей.

Запитання. Завдання.

1. Охарактеризуйте основні розділи математичної статистики.

2. У чому основна ідея математичної статистики?

3. Охарактеризуйте співвідношення генеральної та вибіркової сукупностей.

4. Поясніть схему застосування методів математичної статистики.

5. Вкажіть перелік основних завдань математичної статистики.

6. Із яких основних блоків складається застосування статистичних методів? Охарактеризуйте їх.

7. Розкрийте зв'язок математичної статистики з теорією ймовірностей.

Математична статистика одна із основних розділів такий науки, як математика, і є галузь, вивчаючу методи і правила обробки певних даних. Іншими словами, вона досліджує способи розкриття закономірностей, які властиві великим сукупностям однакових об'єктів, ґрунтуючись на їхньому вибірковому обстеженні.

Завдання даного розділу полягає у побудові методів оцінки ймовірності чи прийнятті певного рішенняпро характер подій, що розвиваються, спираючись на отримані результати. Для опису даних використовуються таблиці, діаграми та кореляційні поля. застосовуються рідко.

Математична статистика використовують у різних галузях науки. Наприклад, для економіки важливо обробляти відомості про однорідні сукупності явищ та об'єктів. Ними можуть бути вироби, що випускаються промисловістю, персонал, дані про прибуток і т. д. Залежно від математичної природи результатів спостережень, можна виділити статистику чисел, аналіз функцій та об'єктів нечислової природи, багатовимірний аналіз. Крім цього, розглядають загальні та приватні (пов'язані з відновленням залежностей, використанням класифікацій, вибірковими дослідженнями) завдання.

Автори деяких підручників вважають, що теорія математичної статистики є лише розділом теорії ймовірності, інші – що це самостійна наука, що має власні цілі, завдання та методи. Однак у будь-якому випадку її використання дуже широке.

Так, найбільш яскраво математична статистиказастосовна у психології. Її використання дозволить фахівцеві правильно обґрунтувати знайти залежність між даними, узагальнити їх, уникнути багатьох логічних помилок та багато іншого. Слід зазначити, що виміряти той чи інший психологічний феномен чи властивість особистості без обчислювальних процедур часто просто неможливо. Це свідчить, що ази цієї науки необхідні. Іншими словами, її можна назвати джерелом та базою теорії ймовірностей.

p align="justify"> Метод дослідження, який спирається на розгляд статистичних даних, використовується і в інших областях. Однак відразу слід зазначити, що його риси щодо об'єктів, що мають різну природу походження, завжди своєрідні. Тому об'єднувати в одну науку фізичну чи немає сенсу. Загальні ж риси даного методу зводяться до підрахунку певної кількості об'єктів, що входять до тієї чи іншої групи, а також до вивчення розподілу кількісних ознак та застосування теорії ймовірностей для отримання тих чи інших висновків.

Елементи математичної статистики використовуються в таких галузях, як фізика, астрономія і т. д. Тут можуть розглядатися значення характеристик та параметрів, гіпотези про збіг будь-яких характеристик у двох вибірках, про симетрію розподілу та багато іншого.

Велику роль математична статистика грає у проведенні Їх метою найчастіше є побудова адекватних методів оцінювання та перевірка гіпотез. Нині велике значення у цій науці мають комп'ютерні технології. Вони дозволяють як значно спростити процес розрахунку, а й створити для розмноження вибірок чи щодо придатності отриманих результатів практично.

У загальному випадку методи математичної статистики допомагають зробити два висновки: або прийняти судження про характер або властивості досліджуваних даних та їх взаємозв'язків, або довести, що отриманих результатів недостатньо для того, щоб робити висновки.



Подібні публікації