Помощью методов математической статистики что. Основы математической статистики. выборочный коэффициент регрессии V на H

Методы математической статистики


1. Введение

Математической статистикой называется наука, занимающаяся разработкой методов получения, описания и обработки опытных данных с целью изучения закономерностей случайных массовых явлений.

В математической статистике можно выделить два направления: описательную статистику и индуктивную статистику (статистический вывод). Описательная статистика занимается накоплением, систематизацией и представлением опытных данных в удобной форме. Индуктивная статистика на основе этих данных позволяет сделать определенные выводы относительно объектов, о которых собраны данные, или оценки их параметров.

Типичными направлениями математической статистики являются:

1) теория выборок;

2) теория оценок;

3) проверка статистических гипотез;

4) регрессионный анализ;

5) дисперсионный анализ.

В основе математической статистики лежит ряд исходных понятий без которых невозможно изучение современных методов обработки опытных данных. В ряд первых из них можно поставить понятие генеральной совокупности и выборки.

При массовом промышленном производстве часто нужно без проверки каждого выпускаемого изделия установить, соответствует ли качество продукции стандартам. Так как количество выпускаемой продукции очень велико или проверка продукции связана с приведением ее в негодность, то проверяется небольшое количество изделий. На основе этой проверки нужно дать заключение о всей серии изделий. Конечно нельзя утверждать, что все транзисторы из партии в 1 млн. штук годны или негодны, проверив один из них. С другой стороны, поскольку процесс отбора образцов для испытаний и сами испытания могут оказаться длительными по времени и привести к большим затратам, то объем проверки изделий должен быть таким, чтобы он смог дать достоверное представление о всей партии изделий, будучи минимальных размеров. С этой целью введем ряд понятий.

Вся совокупность изучаемых объектов или экспериментальных данных называется генеральной совокупностью. Будем обозначать через N число объектов или количество данных, составляющих генеральную совокупность. Величину N называют объемом генеральной совокупности. Если N>>1, то есть N очень велико, то обычно считают N = ¥.

Случайной выборкой или просто выборкой называют часть генеральной совокупности, наугад отобранную из нее. Слово "наугад" означает, что вероятности выбора любого объекта из генеральной совокупности одинакова. Это важное предположение, однако, часто трудно это проверить на практике.

Объемом выборки называют число объектов или количество данных, составляющих выборку, и обозначают n . В дальнейшем будем считать, что элементам выборки можно приписать соответственно числовые значения х 1 , х 2 , ... х n . Например, в процессе контроля качества производимых биполярных транзисторов это могут быть измерения их коэффициента усиления по постоянному току.


2. Числовые характеристики выборки

2.1 Выборочное среднее

Для конкретной выборки объема n ее выборочное среднее

определяется соотношением

где х i – значение элементов выборки. Обычно требуется описать статистические свойства произвольных случайных выборок, а не одной из них. Это значит, что рассматривается математическая модель, которая предполагает достаточно большое количество выборок объема n. В этом случае элементы выборки рассматриваются как случайные величины Х i , принимающие значения х i с плотностью вероятностей f(x), являющейся плотностью вероятностей генеральной совокупности. Тогда выборочное среднее также является случайной величиной

равной

Как и ранее будем обозначать случайные величины прописными буквами, а значения случайных величин – строчными.

Среднее значение генеральной совокупности, из которой производится выборка, будем называть генеральным средним и обозначать m x . Можно ожидать, что если объем выборки значителен, то выборочное среднее не будет заметно отличаться от генерального среднего. Поскольку выборочное среднее является случайной величиной, для нее можно найти математическое ожидание:

Таким образом, математическое ожидание выборочного среднего равно генеральному среднему. В этом случае говорят, что выборочное среднее является несмещенной оценкой генерального среднего. В дальнейшем мы вернемся к этому термину. Так как выборочное среднее является случайной величиной, флуктуирующей вокруг генерального среднего, то желательно оценить эту флуктуацию с помощью дисперсии выборочного среднего. Рассмотрим выборку, объем которой n значительно меньше объема генеральной совокупности N (n << N). Предположим, что при формировании выборки характеристики генеральной совокупности не меняются, что эквивалентно предположению N = ¥. Тогда

Случайные величины Х i и X j (i¹j) можно считать независимыми, следовательно,

Подставим полученный результат в формулу для дисперсии:

где s 2 – дисперсия генеральной совокупности.

Из этой формулы следует, что с увеличением объема выборки флуктуации среднего выборочного около среднего генерального уменьшаются как s 2 /n. Проиллюстрируем сказанное примером. Пусть имеется случайный сигнал с математическим ожиданием и дисперсией соответственно равными m x = 10, s 2 = 9.

Отсчеты сигнала берутся в равноотстоящие моменты времени t 1 , t 2 , ... ,

X(t)

X 1

t 1 t 2 . . . t n t

Так как отсчеты являются случайными величинами, то будем их обозначать X(t 1), X(t 2), . . . , X(t n).

Определим количество отсчетов, чтобы среднее квадратическое отклонение оценки математического ожидания сигнала не превысило 1% его математического ожидания. Поскольку m x = 10, то нужно, чтобы

С другой стороны поэтому или Отсюда получаем, что n ³ 900 отсчетов.

2.2 Выборочная дисперсия

По выборочным данным важно знать не только выборочное среднее, но и разброс выборочных значений около выборочного среднего. Если выборочное среднее является оценкой генерального среднего, то выборочная дисперсия должна быть оценкой генеральной дисперсии. Выборочная дисперсия

для выборки, состоящей из случайных величин определяется следующим образом

Используя это представление выборочной дисперсии, найдем ее математическое ожидание

Одесский национальный медицинский университет Кафедра биофизики, информатики и медицинской аппаратуры Методические указания студентам 1 курса по теме “Основы математической статистики” Одесса 2009 г.

1.Тема: “ Основы математической статистики”.

2. Актуальность темы.

Математическая статистика – это раздел математики, которая изучает методы собирания, систематизации и обработки результатов наблюдений массовых случайных событий с целью выяснения и практического применения существующих закономерностей. Методы математической статистики нашли широкое применение в клинической медицине и здравоохранении. Они используются, в частности, при разработке математических методов медицинской диагностики, в теории эпидемий, в планировании и обработке результатов медицинского эксперимента, в организации здравоохранения. Статистические концепции, сознательно или бессознательно, используются при принятии решений в таких вопросах, как клинический диагноз, прогнозирование течения болезни у отдельного больного, прогнозирование возможных результатов осуществления тех или других программ в данной группе населения и выбор надлежащей программы в конкретных обстоятельствах. Знакомство с идеями и методами математической статистики является необходимым элементом профессионального образования каждого работника здравоохранения.

3. Целые занятия. Общая цель занятия есть научиться студентам сознательно использовать математическую статистику при решении задач медико-биологического профиля. Конкретные целые занятия:
  1. ознакомить студентов с основными идеями, понятиями и методами математической статистики, уделяя внимание, главным образом, вопросам, по"язанним с обработкой результатов наблюдений массовых случайных событий с целью выяснения и практического применения существующих закономерностей;
  2. научить студентам сознательно применять основные понятия математической статистики при решении простейших проблем, которые возникают в профессиональной деятельности врача.
Студент должен знать (2 уровень):
  1. определение частоты класса (абсолютной и относительной)
  2. определение генеральной сукупністі и виборки, объема виборки
  3. точечное и інтервальне оценивание
  4. надежный интервал и достоверность
  5. определение моды, медианы и выборочного среднего
  6. определение размаха, міжквартильного размаха, квартильного отклонение
  7. определение среднего абсолютного отклонения
  8. определение выборочной коваріації и дисперсии
  9. определение выборочных стандартного отклонения и коэффициенту вариации
  10. определение выборочных коэффициентов регрессії
  11. эмпирические уравнения линейной регрессії
  12. определение выборочного корреляційного коэффициенту.
Студент должен овладеть элементарными привычками вычисления (3 уровень):
  1. моды, медианы и выборочного среднего
  2. размаха, міжквартильного размаха, квартильного отклонение
  3. среднего абсолютного отклонения
  4. выборочной коваріації и дисперсии
  5. выборочных стандартного отклонения и коэффициенту вариации
  6. надежного интервала для математического ожидания и дисперсии
  7. выборочных коэффициентов регрессії
  8. выборочного корреляційного коэффициенту.
4. Пути реализации целей занятия: Для реализации целей занятия Вам необходимые такие исходные знания:
  1. Определение распределения, ряд распределения и многокутника распределения дискретной случайной величины
  2. Определение функциональной залежністі между случайными величинами
  3. Определение корреляционной залежністі между случайными величинами
Вам необходимые также уметь вычислять вероятностей несовместимых и совместных событий с помощью соответствующих правил. 5. Задача для проверки студентами своего исходного уровня знаний . Контрольные вопросы
  1. Определение випадковоі события, ее относительную частоту и вероятность.
  2. Теорема составления вероятностей несовместимых событий
  3. Теорема составления вероятностей совместных событий
  4. Теорема умножения вероятностей независимых событий
  5. Теорема умножения вероятностей зависимых событий
  6. Теорема полной вероятности
  7. Теорема Байеса
  8. Определение случайных величин: дискретной и непрерывной
  9. Определение распределения, ряд распределения и многоугольника распределения дискретной случайной величины
  10. Определение функции распределения
  11. Определение мер положения центра распределения
  12. Определение мер вариабельности значений случайной величины
  13. Определение щільністі распределения и кривой распределения непрерывной случайной величины
  14. Определение функциональной зависимости между случайными величинами
  15. Определение корреляционной зависимости между случайными величинами
  16. Определение регрессии, уравнение и линии регрессии
  17. Определение коваріації и коэффициента корреляции
  18. Определение уравнения линейной регрессии.
6. Информацию для упрочения исходных знаний-умений можно найти в пособиях:
  1. Жуматій П.Г. Лекция “Теория вероятностей”. Одесса, 2009.
  2. Жуматій П.Г. “ Основы теории вероятностей”. Одесса, 2009.
  3. Жуматій П.Г., Сеницька Я.Р. Элементы теории вероятностей. Методические указания для студентов медицинского института. Одесса, 1981.
  4. Чалый О.В., Агапов Б.Т., Цехмістер Я.В. Медицинская и биологическая физика. Киев, 2004.
7. Содержание учебного материала из данной темы с выделением основных узловых вопросов.

Математическая статистика - это раздел математики, которая изучает методы сбора, систематизации, обработки, изображение, анализа и интерпретации результатов наблюдений с целью выявления существующих закономерностей.

Применение статистики в здравоохранении необходимо как на уровне сообщества, так и на уровне отдельных пациентов. Медицина имеет дело с индивидуумами, которые отличаются друг от друга по многим характеристикам, и значение показателей, на основе которых человека можно считать здоровой, варьируются от одного индивидуума к другому. Нет двух абсолютно одинаковых пациентов или двух групп пациентов, поэтому решение, которые касаются отдельных больных или групп населень, приходится принимать, исходя из опыта, накопленного на других больных или популяціних группах с похожими биологическими характеристиками. Необходимо осознавать, что учитывая существующие расхождения эти решения не могут быть абсолютно точными - они всегда связаны с некоторой неопределенностью. Именно в этом состоит ймовірносна природа медицины.

Некоторые примеры применения статистических методов в медицине:

трактовка вариации (вариабельность характеристик организма при решении вопроса о том, какое значение той или другой характеристики будет идеальным, нормальным, средним и т.і., делает необходимым использование соответствующих статистических методов).

диагностика заболеваний в отдельных больных и оценка состояния здоровья группы населения.

прогнозирование конца болезни в отдельных больных или возможного результата программы борьбы по той или другой болезнью в любой группе населения.

выбор пригодного влияния на больного или на группу населения .

планирование и проведение медицинских исследований , анализ и публикація результатов, их чтение и критическая оценка.

планирование здравоохранения и руководство им .

Полезная медицинская информация обычно скрыта в массе необработанных данных. Необходимо сконцентрировать информацию, которая содержится в них, и представить данные так, чтобы структуру вариации было хорошо видно, а потом уже выбрать конкретные методы анализа.

Изображение данных предусматривает знакомство с такими понятиями и сроками:

вариационный ряд (упорядоченное расположение) - простое упорядочение отдельных наблюдений за величиной.

класс - один из интервалов, на которые делят весь диапазон значений случайной величины.

крайние точки класса - значение, которые ограничивают класс, например 2,5 и 3,0, нижняя и верхняя границы класса 2,5 - 3,0.

(абсолютная) частота класса - число наблюдений в классе.

относительная частота класса - абсолютная частота класса, выраженная в виде частные общего числа наблюдений.

кумулятивная (накопленная) частота класса - число наблюдений, которое равняется сумме частот всех предыдущих классов и данного класса .

стовпцева диаграмма - графическое изображение частот данных для номинальных классов с помощью столбцов, высоты которых прямо пропорциональные частотам классов.

круговая диаграмма - графическое изображение частот данных для номинальных классов с помощью секторов круга, площади которых прямо пропорциональные частотам классов.

гістограма - графическое изображение частотного распределения количественных данных площадями прямоугольников, прямо пропорциональных частотам классов.

полигон частот - график частотного распределения количественных данных; точку, соответствующую частоте класса, располагают над серединой интервала, каждое две соседние точки соединяют отрезком прямой.

огива (кумулятивная кривая) - график распределения кумулятивных относительных частот.

Всем медицинским данным присущий вариабельность, тому анализ результатов измерений основанный на изучении сведений о том, каких значениях принимала случайная величина, которая исследуется.

Совокупность всех возможных значений случайной величины называется генеральной.

Часть генеральной совокупности, зарегистрированная в результате испытаний, носит название виборкою.

Число наблюдений, включенное в виборку, зовут объемом виборки (обычно обозначается n ) .

Задача выборочного метода заключается в том, чтобы по полученной избирателю сделать правильную оценку случайной величины, которая изучается. Поэтому основное требование, которое пред"яв-ляється к виборки, это максимальное отображение всех черт генеральной совокупности. Виборка, что удовлетворяет этому требованию, называется репрезентативной. От репрезентативности виборки зависит обгрунтованість оценки, то есть степень соответствия оценки параметру, который она характеризует .

При оценивании параметров генеральной совокупности по избирателю (параметрическом оценивании) пользуются такими понятиями:

точечное оценивание - оценка параметра генеральной совокупности в виде единичного значения, которое он может принять с самой большой вероятностью.

интервальне оценивание - оценка параметра генеральной совокупности в виде интервала значений, который имеет заданную вероятность накрыть его истинное значение.

При інтервальному оценивании используют понятие:

надежный интервал - интервал значений, который имеет заданную вероятность накрыть истинное значение параметра генеральной совокупности при інтервальному оценивании.

достоверность (надежная вероятность) - вероятность, с которой надежный интервал накрывает истинное значение параметра генеральной совокупности.

надежные границы - нижняя и верхняя границы надежного интервала.

Выводы, которые получаются методами математической статистики, всегда основываются на ограниченном, выборочном числе наблюдений, поэтому природньо, что для второй виборки результаты могут быть другими. Это обстоятельство определяет ймовірносний характер выводов математической статистики и, как следствие, широкое использование теории вероятностей в практике статистического исследования.

Типичный путь статистического исследования такой :

оценивши величины или зависимости между ними по данным наблюдений, выдвигают допущение о том, что явление, которое изучается, можно описать той или другой стохастичною моделью

используя статистические методы, можно это предположение подтвердить или отвергнуть; при подтверждении цель достигнута - найдена модель, которая описывает исследуемые закономерности, в противоположном случае продолжают работу, выдвигая и проверяя новую гипотезу.

Определение выборочных статистических оценок:

мода - это значения, которое чаще всего встречается в избирателе ,

медиана - центральное (срединное) значение вариационного ряда

размах R - разность между самым большим и наименьшим значениями в серии наблюдений

процентилі - значение в вариационном ряде, которые делят распределение на 100 равных частей (таким образом, медиана будет п"ятидесятим процентилем)

первый квартиль - 25- ий процентиль

третий квартиль - 75- ий процентиль

міжквартильний размах - разность между первым и третьим квартилями (охватывает центральных 50% наблюдений)

квартильне отклонение - половина міжквартильного размаха

выборочное среднее - среднее арифметическое всех выборочных значений (выборочная оценка математического ожидания)

среднее абсолютное отклонение - сумма отклонений от соответствующего начала (без учета знака), разделенная на объем виборки

среднее абсолютное отклонение от выборочного среднего вычисляют за формулой

выборочная дисперсия ( X ) - (выборочная оценка дисперсии) определяется формулой

выборочная коваріація -- (выборочная оценка коваріації К ( Х,Y )) равняется

выборочный коэффициент регрессии Y на X (выборочная оценка коэффициента регрессии Y на X ) равняется

эмпирическое уравнение линейной регрессии Y на X имеет вид

выборочный коэффициент регрессии X на Y (выборочная оценка коэффициента регрессии X на Y) равняется

эмпирическое уравнение линейной регрессии X на Y имеет вид

выборочное стандартное отклонение s(Х) - (выборочная оценка стандартного отклонения) равняется корню квадратному из выборочной дисперсии

выборочный корреляційний коэффициент - (выборочная оценка корреляционного коэффициента) равняется

выборочный коэффициент вариации  - (выборочная оценка коэффициента вариации CV) равняется

.

8. Задача для самостоятельной подготовки студентов . 8.1 Задача для самостоятельного изучения материала с темы.

8.1.1 Практическое вычисление выборочных оценок

Практическое вычисление выборочных точечных оценок

Пример 1 .

Продолжительность заболевания (в днях) в 20 случаях пневмонии сложила:

10, 11, 6, 16, 7, 13, 15, 8, 9, 10, 11, 13, 7, 8, 13, 15, 16, 13, 14, 15

Определить моду, медиану, размах, міжквартильний размах, выборочное среднее, среднее абсолютное отклонение от выборочного среднего, выборочную дисперсию, выборочный коэффициент вариации.

Розв"зок.

Вариационный ряд для виборки имеет вид

6, 7, 7, 8, 8, 9, 10, 10, 11, 11, 13, 13, 13, 13, 14, 15, 15, 15, 16, 16

Мода

Наиболее часто в избирателе встречается число 13. Поэтому значением моды в избирателе будет это число.

Медиана

Когда вариационный ряд содержит парное число наблюдений, медиана равняется среднему двух центральных членов ряда, в данном случае это 11 и 13, поэтому медиана равняется 12.

Размах

Минимальное значение в избирателе равняется 6, а максимальное 16, итак, R = 10.

Міжквартильний размах, квартильне отклонение

В вариационном ряде четверть всех данных имеет значение меньшие, или уровне 8, поэтому первый квартиль 8, а 75% всех данных имеют значение меньшие, или уровне 12, поэтому третий квартиль 14. Итак, міжквартильний размах равняется 6, а квартильне отклонение составляет 3.

Выборочное среднее

Среднее арифметическое всех выборочных значений равняется

.

Среднее абсолютное отклонение от выборочного среднего

.

Выборочная дисперсия

Выборочное стандартное отклонение

.

Bибірковий коэффициент вариации

.

В следующем примере рассмотрим простейшие средства изучения стохастичної зависимости между двумя случайными величинами.

Пример 2 .

При обследовании группы пациентов получены данные о росте Н (см) и объем циркулирующей крови V (л) :

Найти эмпирические уравнения линейной регрессії.

Розв"зок.

Первое, что необходимо вычислить, это:

выборочное среднее

выборочное среднее

.

Второе, что необходимо подсчитать, это:

выборочную дисперсию (Н)

выборочную дисперсию (V)

выборочную коваріацію

Третье, это вычисления выборочных коэффициентов регрессии:

выборочный коэффициент регрессии V на H

выборочный коэффициент регрессии H на V

.

Четвертое, записать искомые уравнения:

эмпирическое уравнение линейной регрессии V на H имеет вид

эмпирическое уравнение линейной регрессии H на V имеет вид

.

Пример 3 .

Используя условия и результаты примера 2, высчитать коэффициент корреляции и проверить достоверность существования корреляционной зависимости между ростом человека и объемом циркулирующей крови с 95% надежной вероятностью.

Розв"зок.

Коэффициент корреляції связан с коэффициентами регрессии и практически полезной формулой

.

Для выборочной оценки коэффициента корреляції эта формула имеет вид

.

Используя вираховані в примере 2 значение выборочных коэффициентов регрессії и, получим

.

Проверка достоверности корреляційної зависимости между случайными величинами (полагает нормальное распределение у каждой из них) осуществляется таким образом:

  • вычисляют величину Т

  • находят в таблице распределения Стьюдента коэффициент

  • существование корреляционной зависимости между случайными величинами подтверждается при выполнении неровности

.

Поскольку 3,5 > 2,26, то с 95% надежной вероятностью существования корреляционной зависимости между ростом пациента и объемом циркулирующей крови можно считать установленным.

Інтервальні оценки для математического ожидания и дисперсии

Если случайная величина имеет нормальное распределение, то інтервальні оценки для математического ожидания и дисперсии вычисляют в такой последовательности:

1.находят выборочное среднее;

2.подсчитывают выборочную дисперсию и выборочное стандартное отклонение s ;

3.в таблице распределения Стьюдента за надежной вероятностью  и объемом виборки n находят коэффициент Стьюдента;

4.надежный интервал для математического ожидания записывают в виде

5.в таблице распределения "> и объемом виборкиn находят коэффициенты

;

6.надежный интервал для дисперсии записывают в виде

Величина надежного интервала, надежная вероятность и объем виборкиn зависят друг от друга. На самом деле, отношение

уменьшается с ростомn, итак, при постоянной величине надежного интервала с ростомn растет и . При постоянной надежной вероятности с ростом объема виборкип уменьшается величина надежного интервала. При планировании медицинских исследований эта связь используют для определения минимального объема виборки, который обеспечит нужны по условиям решаемой задачи величины надежного интервала и надежной вероятности.

Пример 5.

Используя условия и результаты примера 1, найдите інтервальні оценки математического ожидания и дисперсии для 95% надежной вероятности.

Розв"зок.

В примере 1 вираховані точечные оценки математического ожидания (выборочное среднее =12), дисперсии (выборочная дисперсия =10,7) и стандартного отклонения (выборочное стандартное отклонение). Объем виборки равняетсяп = 20.

Из таблицы распределения Стьюдента найдем значение коэффициента

дальше вычислим полуширинуd надежного интервала

и запишем інтервальну оценку математического ожидания

10,5 < < 13,5 при = 95%

Из таблицы распределения Пірсона " хи-квадрат " найдем коэффициенты

вычислим нижнюю и верхнюю надежные границы

и запишем інтервальну оценку для дисперсии в виде

6,2 23 при = 95% .

8.1.2. Задачи для самостоятельного решения

Для самостоятельногорешения предлагаются задачи5.4 С 1 – 8 (П.Г.Жуматій. “Математическая обработка медико-биологических данных. Задачи и примеры”. Одесса, 2009, с. 24-25)

8.1.3. Контрольные вопросы
  1. Частота класса (абсолютная и относительная).
  2. Генеральная совокупность и выборка, объем выборки.
  3. Точечное и інтервальне оценивание.
  4. Надежный интервал и достоверность.
  5. Мода, медиана и выборочное среднее.
  6. Размах, міжквартільний размах, квартальное отклонение.
  7. Среднее абсолютное отклонение.
  8. Выборочные коваріація и дисперсия.
  9. Выборочные стандартное отклонение и коэффициент вариации.
  10. Выборочные коэффициенты регрессии.
  11. Эмпирические уравнения регрессии.
  12. Вычисление корреляционного коэффициента и достоверности корреляционной связи.
  13. Построение інтервальних оценок нормально распределенных случайных величин.
8.2 Основная литература
  1. Жуматій П.Г. “Математическая обработка медико-биологических данных. Задачи и примеры”. Одесса, 2009.
  2. Жуматій П.Г. Лекция “Математическая статистика”. Одесса, 2009.
  3. Жуматій П.Г. “ Основы математической статистики”. Одесса, 2009.
  4. Жуматій П.Г., Сеницька Я.Р. Элементы теории вероятностей. Методические указания для студентов медицинского института. Одесса, 1981.
  5. Чалый О.В., Агапов Б.Т., Цехмістер Я.В. Медицинская и биологическая физика. Киев, 2004.
8.3 Дополнительная литература
  1. Ремізов О.M. Медицинская и биологическая физика. М., “Высшая школа”, 1999.
  2. Ремізов О.M., Ісакова Н.Х., Максіна О.Г.. Сборник задач из медицинской и биологической физики. М., .,“Высшая школа”, 1987.
Методические указания сложилдоц. П. Г. Жуматій.

Методы математической статистики применяются, как правило, на всех этапах анализа исследовательских материалов для выбора стратегии решения задач по конкретным выборочным данным, оценивания полученных результатов. Для обработки материала использовались методы математической статистики. Математическая обработка материалов позволяет со всей четкостью выделить и оценить количественные параметры объективной информации, проанализировать и представить их в различных соотношениях и зависимостях. Они позволяют определить меру варьирования величин в собранных материалах, содержащих количественную информацию о некотором множестве случаев, часть из которых подтверждает предполагаемые связи, а часть не выявляет их, вычислить достоверность количественных различий между выделенными совокупностями случаев, получить другие математические характеристики, необходимые для верного истолкования фактов. Достоверность различий полученных в ходе исследования определялась по t-критерию Стьюдента.

Рассчитывались следующие величины.

1. Среднее арифметическое значение выборки.

Характеризует среднее значение рассматриваемой совокупности. Обозначим результаты измерений. Тогда:

где У- сумма всех значений, когда текущий индекс i изменяется от 1 до n.

2. Среднее квадратическое отклонение (стандартное отклонение) , характеризующее рассеивание, разбросанность рассматриваемой совокупности относительно среднего арифметического значения.

= (x max - x min)/ k

где - среднее квадратическое отклонение

хmaх - максимальное значение таблицы;

хmin - минимальное значение таблицы;

k - коэффициент

3. Стандартная ошибка средней арифметической или ошибка репрезентативности (m). Стандартная ошибка средней арифметической характеризует степень отклонения выборочной средней арифметической от средней арифметической генеральной совокупности.

Стандартная ошибка средней арифметической вычисляется по формуле:

где у - стандартное отклонение результатов измерений,

n - объем выборки. Чем меньше m тем выше стабильность, устойчивость результатов.

4. Критерий Стьюдента.

(в числителе - разность средних значений двух групп, в знаменателе - квадратный корень из суммы квадратов стандартных ошибок этих средних).

При обработке полеченных результатов исследования использовали компьютерную программу с пакетом Excel.

Организация исследования

Исследование проводилось нами по общепринятым правилам, и осуществлялось в 3 этапа.

На первом этапе был собран и проанализирован полученный материал по рассматриваемой проблеме исследования. Формировался предмет научного исследования. Проведенный анализ литературы на данном этапе позволил конкретизировать цель и задачи исследования. Проведено первичное тестирование техники бега на 30 м.<... class="gads_sm">

На третьем этапе был систематизирован полученный в результате научного исследования материал, обобщена вся имеющаяся информация по проблеме исследования.

Экспериментальное исследование проводилось на базе ГУО «Ляховичская средняя школа», в общей сложности выборка составила 20 учащихся 6 классов (11-12 лет).

Глава 3. Анализ результатов исследования

В результате педагогического эксперимента нами были выявлен исходный уровень техники бега на 30 м учащихся в контрольной и экспериментальной группах (Приложения 1-2). Статистическая обработка полученных результатов позволила получить следующие данные (таблица 6).

Таблица 6. Исходный уровень качества бега

Как видно из таблицы 6 среднее количество баллов у спортсменов контрольной и экспериментальной группы статистически не отличаются, в экспериментальной группе средний бал составил 3,6 балла, а в контрольной 3,7 балла. T-критерий в обеих группах tэмп=0,3; Р?0,05, при tкрит=2,1; Результаты исходного тестирования показали, что показатели не зависят от обученности и носят случайный характер. По первоначальному тестированию показатели качества бега у контрольной группы немного превышали показатели экспериментальной группы. Но не было выявлено статистически достоверных различий в группах, что является доказательством идентичности учащихся контрольной и экспериментальной групп по технике бега 30м.

За время эксперимента в обеих группах улучшились показатели, характеризующие эффективность техники бега. Однако это улучшение в разных группах участников эксперимента носило разный характер. В результате обучения выявлен закономерный небольшой прирост показателей в контрольной группе (3,8 балла). Как видно из Приложения 2 в экспериментальной группе был выявлен большой прирост показателей. Учащиеся занимались по предложенной нами программе, что достоверно улучшило показатели.

Таблица 7. Изменения качества бега у испытуемых экспериментальной группы

В ходе эксперимента мы установили, что повышенные нагрузки в экспериментальной группе дали значительные улучшения развития быстроты, нежели в контрольной группе.

В подростковом возрасте целесообразно развивать быстроту путем преимущественного использования средств физического воспитания, направленных на повышение частоты движений. В возрасте 12-15 лет повышаются скоростные способности, в результате применения главным образом скоростно-силовых и силовых упражнений которые использованы нами в процессе проведения уроков физической культуры и внеклассных занятий спортивной секции баскетбола и лёгкой атлетики.

При проведении занятий в экспериментальной группе велась строгая этапность усложнения и двигательного опыта. Своевременно велась работа над ошибками. Как показал анализ фактических данных, экспериментальная методика обучения оказало существенное изменение на качество выполнения техники бега (tэмп=2,4). Анализ полученных результатов в экспериментальной группе и сравнение их с данными, полученными в контрольной группе при использовании общепринятой методики обучения, дают основание утверждать, что предложенная нами методика повысит эффективность обучения.

Таким образом, на этапе совершенствования методики бега 30м в школе мы выявили динамику изменения показателей тестирования в экспериментальной и контрольной группе. После проведенного эксперимента качество выполнение приема повысилась в экспериментальной группе до 4,9 баллов (t=3,3; Р?0,05). К концу эксперимента качество владения техникой бега в экспериментальной группе оказалось выше, чем в контрольной группе.

Математическая статистика - это современная отрасль математической науки, которая занимается статистическим описанием результатов экспериментов и наблюдений, а также построением математических моделей, содержащих понятия вероятности. Теоретической базой математической статистики служит теория вероятностей.

В структуре математической статистики традиционно выделяют два основных раздела: описательная статистика и статистические выводы (рис. 1.1).

Рис. 1.1. Основные разделы математической статистики

Описательная статистика используется для:

o обобщение показателей одной переменной (статистика случайной выборки);

o выявление взаимосвязей между двумя и более переменными (корреляционно-регрессионный анализ).

Описательная статистика дает возможность получить новую информацию, быстрее понять и всесторонне оценить ее, то есть выполняет научную функцию описания объектов исследования, чем и оправдывает свое название. Методы описательной статистики призваны превратить совокупность отдельных эмпирических данных на систему наглядных для восприятия форм и чисел: распределения частот; показатели тенденций, вариативности, связи. Этими методами рассчитываются статистики случайной выборки, которые служат основанием для осуществления статистических выводов.

Статистические выводы дают возможность:

o оценить точность, надежность и эффективность выборочных статистик, найти ошибки, которые возникают в процессе статистических исследований (статистическое оценивание)

o обобщить параметры генеральной совокупности, полученные на основании выборочных статистик (проверка статистических гипотез).

Главная цель научных исследований - это получение нового знания о больших класса явлений, лиц или событий, которые принято называть генеральной совокупности.

Генеральная совокупность - это полная совокупность объектов исследования, выборка - ее часть, которая сформирована определенным научно обоснованным способом 2.

Термин "генеральная совокупность" используется тогда, когда речь идет о большой, но конечную совокупность исследуемых объектов. Например, о совокупности абитуриентов Украины в 2009 году или совокупность детей дошкольного возраста города Ровно. Генеральные совокупности могут достигать значительных объемов, быть конечным и бесконечным. На практике, как правило, имеют дело с конечным совокупностями. И если отношение объема генеральной совокупности к объему выборки составляет более 100, то, по словам Гласса и Стэнли методы оценки для конечных и бесконечных совокупностей дают в сущности одинаковые результаты . Генеральной совокупностью можно называть и полную совокупность значений какого-то признака. Принадлежность выборки к генеральной совокупности является главным основанием для оценки характеристик генеральной совокупности по характеристикам выборки.

Основная идея математической статистики базируется на убеждении о том, что полное изучение всех объектов генеральной совокупности в большинстве научных задач или практически невозможно, или экономически нецелесообразно, поскольку требует много времени и значительных материальных затрат. Поэтому в математической статистике применяется выборочный подход, принцип которого показано на схеме рис. 1.2.

Например, по технологии формирования различают выборки рандомизированы (простые и систематические), стратифицированные, кластерные (см. Раздел 4).

Рис. 1.2. Схема применения методов математической статистики Согласно выборочным подходом использования математико-статистических методов может проводиться в такой последовательности (см. Рис. 1.2):

o с генеральной совокупности, свойства которой подлежат исследованию, определенными методами формируют выборку - типичную но ограниченное количество объектов, к которым применяют исследовательские методы;

o в результате методов наблюдений, экспериментальных действий и измерений над объектами выборки получают эмпирические данные;

o обработка эмпирических данных с помощью методов описательной статистики дает показатели выборки, которые называются статистиками - как и название дисциплины, кстати;

o применяя методы статистических выводов к статистик, получают параметры, которые характеризуют свойства генеральной совокупности.

Пример 1.1. С целью оценки стабильности уровня знаний (переменная X) проведено тестирование рандомизированной выборки 3 студентов объемом n. Тесты содержали по m заданий, каждое из которых оценивалось по системе баллов: "выполнено" "- 1," не выполнено "- 0. остались средние текущие достижения студентов X

3 рандомизированных выборка (от англ. Random - случайный) - это репрезентативная выборка, которая сформирована по стратегии случайных испытаний.

на уровне прошлых лет / ч? Последовательность решения:

o выяснить содержательную гипотезу типа: "если текущие результаты тестирования не будут отличаться от прошлых, то можно считать уровень знаний студентов неизменным, а учебный процесс - стабильным";

o сформулировать адекватную статистическую гипотезу, например, нуль-гипотезу Н 0 о том, что "текущий средний балл X статистически не отличается от среднего показателя прошлых лет / ч", то есть Н 0: X = / г, против соответствующей альтернативной гипотезы X Ф ^ ;

o построить эмпирические распределения исследуемой переменной X;

o определить (при необходимости) корреляционные связи, например, между переменной X и другими показателями, построить линии регрессии;

o проверить соответствие эмпирического распределения нормальному закону;

o оценить значение точечных показателей и доверительный интервал параметров, например, среднего;

o определить критерий для проверки статистических гипотез;

o выполнить проверку статистических гипотез на основе выбранных критериев;

o сформулировать решение о статистической нуль-гипотезы на определенном уровне значимости;

o перейти от решения о принятии или отклонении статистической нуль-гипотезы интерпретации выводов относительно гипотезы содержательной;

o сформулировать содержательные выводы.

Итак, если обобщить вышеперечисленные процедуры, применение статистических методов состоит из трех основных блоков:

Переход от объекта реальности к абстрактной математико-статистической схемы, то есть построение вероятностной модели явления, процесса, свойства;

Проведение расчетных действий собственно математическими средствами в рамках вероятностной модели по результатам измерений, наблюдений, эксперимента и формулировки статистических выводов;

Интерпретация статистических выводов о реальной ситуации и принятия соответствующего решения.

Статистические методы обработки и интерпретации данных опираются на теорию вероятностей. Теория вероятностей является основой методов математической статистики. Без использования фундаментальных понятий и законов теории вероятностей невозможно обобщения выводов математической статистики, а значит и обоснованного их использования для научных и практических целей.

Так, задачей описательной статистики является превращение совокупности выборочных данных на систему показателей - статистик - распределений частот, мер центральной тенденции и изменчивости, коэффициентов связи и тому подобное. Однако, статистики являются характеристиками, по сути, конкретной выборки. Конечно, можно рассчитывать выборочные распределения, выборочные средние, дисперсии и т. Д., Но подобный "анализ данных" имеет ограниченную научно-познавательную ценность. "Механическое" перенос каких-либо выводов, сделанных на основе таких показателей, на другие совокупности не является корректным.

Для того, чтобы иметь возможность переноса выборочных показателей или другие, или на более распространены совокупности, необходимо иметь математически обоснованные положения о соответствии и способности выборочных характеристик характеристиками этих распространенных так называемых генеральных совокупностей. Такие положения базируются на теоретических подходах и схемах, связанных с вероятностными моделях реальности, например, на аксиоматическом подходе, в законе больших чисел и т.д. Только с их помощью можно переносить свойства, которые установлены по результатам анализа ограниченной эмпирической информации, или на другие или на распространенные совокупности. Таким образом, построение, законы функционирования, использование вероятностных моделей, является предметом математической области под названием "теория вероятностей", становится сутью статистических методов.

Таким образом, в математической статистике используются два параллельных строки показателей: первая строка, что имеет отношение к практике (это выборочные показатели) и второй, основанный на теории (это показатели вероятностной модели). Например, эмпирическим частотам, которые определены на выборке, соответствуют понятия теоретической вероятности; выборочном среднем (практика) соответствует математическое ожидание (теория) и т.д. Причем, в исследованиях выборочные характеристики, как правило, являются первичными. Они рассчитываются на основе наблюдений, измерений, экспериментов, после чего проходят статистическое оценивание способности и эффективности, проверку статистических гипотез в соответствии с целями исследований и в конце принимаются с определенной вероятностью как показатели свойств исследуемых совокупностей.

Вопрос. Задача.

1. Охарактеризуйте основные разделы математической статистики.

2. В чем заключается основная идея математической статистики?

3. Охарактеризуйте соотношение генеральной и выборочной совокупностей.

4. Объясните схему применения методов математической статистики.

5. Укажите перечень основных задач математической статистики.

6. Из каких основных блоков состоит применения статистических методов? Охарактеризуйте их.

7. Раскройте связь математической статистики с теорией вероятностей.

Математическая статистика является одним из основных разделов такой науки, как математика, и представляет собой отрасль, изучающую методы и правила обработки определенных данных. Иными словами, она исследует способы раскрытия закономерностей, которые свойственны большим совокупностям одинаковых объектов, основываясь на их выборочном обследовании.

Задача данного раздела состоит в построении методов оценки вероятности или принятии определенного решения о характере развивающихся событий, опираясь на полученные результаты. Для описания данных используются таблицы, диаграммы, а также корреляционные поля. применяются редко.

Математическая статистика используются в различных областях науки. К примеру, для экономики важно обрабатывать сведения об однородных совокупностях явлений и объектов. Ими могут являться изделия, выпускаемые промышленностью, персонал, данные о прибыли и т. д. В зависимости от математической природы результатов наблюдений, можно выделить статистику чисел, анализ функций и объектов нечисловой природы, многомерный анализ. Помимо этого, рассматривают общие и частные (связанные с восстановлением зависимостей, использованием классификаций, выборочными исследованиями) задачи.

Авторы некоторых учебников считают, что теория математической статистики является лишь разделом теории вероятности, другие - что это самостоятельная наука, имеющая собственные цели, задачи и методы. Однако в любом случае ее использование очень обширно.

Так, наиболее ярко математическая статистика применима в психологии. Ее использование позволит специалисту правильно обосновать найти зависимость между данными, обобщить их, избежать многих логических ошибок и многое другое. Нужно отметить, что измерить тот или иной психологический феномен или свойство личности без вычислительных процедур часто просто невозможно. Это говорит о том, что азы данной науки необходимы. Иными словами, ее можно назвать источником и базой теории вероятностей.

Метод исследования, который опирается на рассмотрение статистических данных, используется и в других областях. Однако сразу необходимо отметить, что его черты в применении к объектам, имеющим различную природу происхождения, всегда своеобразны. Поэтому объединять в одну науку физическую или не имеет смысла. Общие же черты данного метода сводятся к подсчету определенного числа объектов, которые входят в ту или иную группу, а также изучению распределения количественных признаков и применению теории вероятностей для получения тех или иных выводов.

Элементы математической статистики используются в таких областях, как физика, астрономия и т. д. Здесь могут рассматриваться значения характеристик и параметров, гипотезы о совпадении каких-либо характеристик в двух выборках, о симметрии распределения и многое другое.

Большую роль математическая статистика играет в проведении Их целью чаще всего является построение адекватных методов оценивания и проверка гипотез. В настоящее время огромное значение в данной науке имеют компьютерные технологии. Они позволяют не только значительно упростить процесс расчета, но и создать для размножения выборок или при изучении пригодности полученных результатов на практике.

В общем случае методы математической статистики помогают сделать два вывода: или принять искомое суждение о характере или свойствах изучаемых данных и их взаимосвязей, или доказать, что полученных результатов недостаточно для того, чтобы делать выводы.



Похожие публикации