Mit Hilfe von Methoden der mathematischen Statistik, die. Grundlagen der mathematischen Statistik. SV auf H

Methoden der mathematischen Statistik


1. Einleitung

Die mathematische Statistik ist eine Wissenschaft, die Methoden zur Gewinnung, Beschreibung und Verarbeitung experimenteller Daten entwickelt, um die Muster zufälliger Massenphänomene zu untersuchen.

In der mathematischen Statistik lassen sich zwei Bereiche unterscheiden: die deskriptive Statistik und die induktive Statistik (statistische Inferenz). Die deskriptive Statistik befasst sich mit der Akkumulation, Systematisierung und Präsentation experimenteller Daten in einer geeigneten Form. Induktive Statistiken auf Basis dieser Daten erlauben uns bestimmte Rückschlüsse auf die Objekte, über die die Daten erhoben werden, oder Schätzungen ihrer Parameter.

Typische Bereiche der mathematischen Statistik sind:

1) Sampling-Theorie;

2) die Theorie der Schätzungen;

3) Testen statistischer Hypothesen;

4) Regressionsanalyse;

5) Varianzanalyse.

Die mathematische Statistik basiert auf einer Reihe von Anfangskonzepten, ohne die es unmöglich ist, moderne Methoden zur Verarbeitung experimenteller Daten zu untersuchen. In einigen der ersten von ihnen können wir das Konzept der allgemeinen Bevölkerung und der Stichprobe verwenden.

In der industriellen Massenproduktion ist es oft notwendig festzustellen, ob die Qualität des Produkts den Standards entspricht, ohne jedes hergestellte Produkt zu überprüfen. Da die Anzahl der hergestellten Produkte sehr groß ist oder die Überprüfung von Produkten mit deren Indienststellung verbunden ist, wird eine kleine Anzahl von Produkten überprüft. Anhand dieser Prüfung muss ein Rückschluss auf die gesamte Produktserie gezogen werden. Natürlich kann man nicht sagen, dass alle Transistoren aus einer Charge von 1 Million Stück gut oder schlecht sind, indem man einen von ihnen überprüft. Da andererseits der Prozess der Auswahl von Proben für die Prüfung und die Prüfungen selbst zeitaufwändig sein und zu hohen Kosten führen können, sollte der Umfang der Produktprüfung so bemessen sein, dass sie eine zuverlässige Darstellung der gesamten Produktcharge geben kann der Mindestgröße. Dazu führen wir einige Konzepte ein.

Die Gesamtheit der untersuchten Objekte oder experimentellen Daten wird als allgemeine Population bezeichnet. Wir bezeichnen mit N die Anzahl der Objekte oder die Datenmenge, die die allgemeine Population ausmachen. Der Wert von N wird als Bevölkerungsgröße bezeichnet. Wenn N>>1, also N sehr groß ist, dann wird üblicherweise N = ¥ betrachtet.

Eine Zufallsstichprobe oder einfach eine Stichprobe ist ein Teil der Allgemeinbevölkerung, der zufällig aus dieser ausgewählt wird. Das Wort "zufällig" bedeutet, dass die Wahrscheinlichkeit, irgendein Objekt aus der Allgemeinbevölkerung auszuwählen, gleich ist. Dies ist eine wichtige Annahme, die jedoch in der Praxis oft nur schwer zu überprüfen ist.

Als Stichprobenumfang wird die Anzahl der Objekte oder die Datenmenge, aus der die Stichprobe besteht, bezeichnet und bezeichnet n. In Zukunft gehen wir davon aus, dass den Elementen der Stichprobe jeweils Zahlenwerte x 1 , x 2 , ... x n zugeordnet werden können. Dies können beispielsweise bei der Qualitätskontrolle von gefertigten Bipolartransistoren Messungen ihrer DC-Verstärkung sein.


2. Numerische Merkmale der Probe

2.1 Stichprobenmittelwert

Für eine bestimmte Stichprobe der Größe n der Stichprobenmittelwert

wird durch die Relation bestimmt

wobei x i der Wert der Probenelemente ist. Normalerweise ist es erforderlich, die statistischen Eigenschaften beliebiger Stichproben zu beschreiben, und nicht eine von ihnen. Das bedeutet, dass ein mathematisches Modell betrachtet wird, das von einer ausreichend großen Anzahl von Stichproben der Größe n ausgeht. In diesem Fall werden die Stichprobenelemente als Zufallsvariablen X i betrachtet, wobei Werte x i mit einer Wahrscheinlichkeitsdichte f(x) angenommen werden, die die Wahrscheinlichkeitsdichte der allgemeinen Bevölkerung ist. Dann ist auch der Stichprobenmittelwert eine Zufallsvariable

gleich

Wie zuvor werden wir Zufallsvariablen mit Großbuchstaben und die Werte von Zufallsvariablen mit Kleinbuchstaben bezeichnen.

Der Durchschnittswert der Gesamtbevölkerung, aus der die Stichprobe gezogen wird, wird als allgemeiner Durchschnitt bezeichnet und mit m x bezeichnet. Es ist zu erwarten, dass bei einem signifikanten Stichprobenumfang der Stichprobenmittelwert nicht deutlich vom allgemeinen Mittelwert abweicht. Da der Stichprobenmittelwert eine Zufallsvariable ist, kann man ihn finden erwarteter Wert:

Somit ist die mathematische Erwartung des Stichprobenmittelwerts gleich dem allgemeinen Mittelwert. In diesem Fall ist der Stichprobenmittelwert eine unverzerrte Schätzung des Mittelwerts der Grundgesamtheit. Wir werden später auf diesen Begriff zurückkommen. Da der Stichprobenmittelwert eine Zufallsvariable ist, die um den allgemeinen Mittelwert schwankt, ist es wünschenswert, diese Schwankung anhand der Varianz des Stichprobenmittelwerts zu schätzen. Stellen Sie sich eine Stichprobe vor, deren Größe n viel kleiner ist als die Größe der Allgemeinbevölkerung N (n<< N). Предположим, что при формировании выборки характеристики генеральной совокупности не меняются, что эквивалентно предположению N = ¥. Тогда

Die Zufallsvariablen X i und X j (i¹j) können als unabhängig betrachtet werden, daher

Ersetzen Sie das Ergebnis in der Formel für die Varianz:

wobei s 2 die Populationsvarianz ist.

Aus dieser Formel folgt, dass mit zunehmendem Stichprobenumfang die Schwankungen des Stichprobenmittelwerts um den allgemeinen Mittelwert mit s 2 /n abnehmen. Lassen Sie uns das Obige an einem Beispiel veranschaulichen. Es gebe ein Zufallssignal mit mathematischem Erwartungswert bzw. Varianz gleich m x = 10, s 2 = 9.

Die Signalabtastwerte werden zu gleich beabstandeten Zeitpunkten t 1 , t 2 , ... genommen.

X(t)

x1

t 1 t 2 . . . t n t

Da die Messwerte Zufallsvariablen sind, bezeichnen wir sie als X(t 1), X(t 2), . . . ,X(tn).

Lassen Sie uns die Anzahl der Samples so bestimmen, dass die Standardabweichung der Schätzung der mathematischen Erwartung des Signals 1% seiner mathematischen Erwartung nicht überschreitet. Da m x = 10 ist, ist es notwendig, dass

Andererseits erhalten wir daher oder Daher, dass n ³ 900 zählt.

2.2 Stichprobenabweichung

Aus Stichprobendaten ist es wichtig, nicht nur den Stichprobenmittelwert zu kennen, sondern auch die Streuung der Stichprobenwerte um den Stichprobenmittelwert. Wenn der Stichprobenmittelwert eine Schätzung des allgemeinen Mittelwerts ist, muss die Stichprobenvarianz eine Schätzung der allgemeinen Varianz sein. Stichprobenabweichung

für eine aus Zufallsvariablen bestehende Stichprobe wird wie folgt bestimmt

Unter Verwendung dieser Darstellung der Stichprobenvarianz finden wir ihren mathematischen Erwartungswert

Abteilung für Biophysik, Informatik und medizinische Geräte der Nationalen Medizinischen Universität Odessa Richtlinien Studierende des 1. Studienjahres zum Thema „Grundlagen der mathematischen Statistik“ Odessa, 2009

1. Thema: „Grundlagen der mathematischen Statistik“.

2. Relevanz des Themas.

Die mathematische Statistik ist ein Zweig der Mathematik, der die Methoden zum Sammeln, Systematisieren und Verarbeiten der Ergebnisse von Beobachtungen massiver zufälliger Ereignisse untersucht, um bestehende Muster zu verdeutlichen und in der Praxis anzuwenden. Methoden der mathematischen Statistik sind in der klinischen Medizin und im öffentlichen Gesundheitswesen weit verbreitet. Sie werden insbesondere bei der Entwicklung mathematischer Methoden für die medizinische Diagnostik, in der Epidemietheorie, bei der Planung und Verarbeitung von Ergebnissen eines medizinischen Experiments sowie bei der Organisation des Gesundheitswesens eingesetzt. Statistische Konzepte werden bewusst oder unbewusst verwendet, um Entscheidungen in solchen Angelegenheiten wie der klinischen Diagnose, der Vorhersage des Krankheitsverlaufs eines einzelnen Patienten, der Vorhersage der wahrscheinlichen Ergebnisse bestimmter Programme in einer bestimmten Population und der Auswahl des geeigneten Programms unter bestimmten Umständen zu treffen. Die Vertrautheit mit den Ideen und Methoden der mathematischen Statistik ist ein notwendiges Element der beruflichen Ausbildung jedes Gesundheitspersonals.

3. Ganze Klassen. Das allgemeine Ziel der Lektion ist es, den Schülern beizubringen, mathematische Statistiken bewusst zur Lösung von Problemen mit biomedizinischem Profil einzusetzen. Spezifische ganze Klassen:
  1. die Studierenden mit den grundlegenden Ideen, Konzepten und Methoden der mathematischen Statistik vertraut zu machen, wobei vor allem Fragen im Zusammenhang mit der Verarbeitung der Ergebnisse von Beobachtungen massiver zufälliger Ereignisse zu beachten sind, um bestehende Muster zu verdeutlichen und in der Praxis anzuwenden;
  2. die Studierenden zu lehren, die Grundkonzepte der mathematischen Statistik bewusst anzuwenden, um einfachste Probleme zu lösen, die in der beruflichen Tätigkeit eines Arztes auftreten.
Der Schüler muss wissen (Stufe 2):
  1. Klassenhäufigkeitsdefinition (absolut und relativ)
  2. Bestimmung der allgemeinen Reihenfolge und Auswahl, Umfang der Auswahl
  3. Punkt- und Intervallschätzung
  4. zuverlässiges Intervall und Gültigkeit
  5. Bestimmung von Modus, Median und Stichprobenmittelwert
  6. Bestimmung von Spannweite, Interquartilsabstand, Quartilsabweichung
  7. Bestimmung der mittleren absoluten Abweichung
  8. Bestimmung der Stichprobenkovarianz und -varianz
  9. Bestimmung der Standardabweichung und des Variationskoeffizienten der Stichprobe
  10. Bestimmung von Stichproben-Regressionskoeffizienten
  11. empirische lineare Regressionsgleichungen
  12. Bestimmung des Probenkorrelationskoeffizienten.
Der Schüler muss elementare Rechengewohnheiten beherrschen (Stufe 3):
  1. Modus, Median und Stichprobenmittelwert
  2. Bereich, Quartilsabstand, Quartilsabweichung
  3. mittlere absolute Abweichung
  4. Stichprobenkovarianz und -varianz
  5. Stichprobenstandardabweichung und Variationskoeffizient
  6. zuverlässiges Intervall für mathematische Erwartung und Varianz
  7. Stichprobenregressionskoeffizienten
  8. Probenkorrelationskoeffizient.
4. Wege zum Erreichen der Unterrichtsziele: Um die Unterrichtsziele zu erreichen, benötigen Sie folgende Grundkenntnisse:
  1. Definition von Verteilung, Verteilungsreihe und Verteilungspolyeder einer diskreten Zufallsvariablen
  2. Bestimmung der funktionellen Ablagerung zwischen Zufallsvariablen
  3. Bestimmung der Korrelation zwischen Zufallsvariablen
Außerdem müssen Sie in der Lage sein, die Wahrscheinlichkeiten von unvereinbaren und gemeinsamen Ereignissen mit den entsprechenden Regeln zu berechnen. 5. Eine Aufgabe für die Schüler, um ihren anfänglichen Wissensstand zu überprüfen. Kontrollfragen
  1. Definition eines Vipadical-Ereignisses, seiner relativen Häufigkeit und Wahrscheinlichkeit.
  2. Der Wahrscheinlichkeitssatz für inkompatible Ereignisse
  3. Das Theorem zur Zusammenstellung der Wahrscheinlichkeiten gemeinsamer Ereignisse
  4. Der Satz der Multiplikation der Wahrscheinlichkeiten unabhängiger Ereignisse
  5. Der Satz der Multiplikation der Wahrscheinlichkeiten abhängiger Ereignisse
  6. Gesamtwahrscheinlichkeitssatz
  7. Satz von Bayes
  8. Definition von Zufallsvariablen: diskret und stetig
  9. Verteilungsdefinition, Verteilungsreihe und Verteilungspolygon einer diskreten Zufallsvariablen
  10. Definition der Verteilungsfunktion
  11. Bestimmung von Standortmaßnahmen für Verteilzentren
  12. Bestimmung von Maßen der Variabilität von Werten einer Zufallsvariablen
  13. Bestimmung der Breite der Verteilung und der Verteilungskurve einer kontinuierlichen Zufallsvariablen
  14. Definition der funktionalen Abhängigkeit zwischen Zufallsvariablen
  15. Bestimmung der Korrelation zwischen Zufallsvariablen
  16. Regressionsdefinition, Gleichung und Regressionslinien
  17. Bestimmung von Kovarianz und Korrelationskoeffizient
  18. Definition einer linearen Regressionsgleichung.
6. Informationen zur Stärkung der Grundkenntnisse finden Sie in den Handbüchern:
  1. Zhumatiy P.G. Vorlesung „Wahrscheinlichkeitstheorie“. Odessa, 2009.
  2. Zhumatiy P.G. "Grundlagen der Wahrscheinlichkeitstheorie". Odessa, 2009.
  3. Zhumatiy P.G., Senytska Ya.R. Elemente der Wahrscheinlichkeitstheorie. Methodische Anweisungen für Studenten des medizinischen Instituts. Odessa, 1981.
  4. Chaly O.V., Agapov B.T., Tsekhmister Ya.V. Medizinische und biologische Physik. Kiew, 2004.
7. Der Inhalt des Unterrichtsmaterials zu diesem Thema unter Hervorhebung der wichtigsten Schlüsselthemen.

Mathematische Statistik ist ein Zweig der Mathematik, der Methoden zum Sammeln, Systematisieren, Verarbeiten, Anzeigen, Analysieren und Interpretieren von Beobachtungsergebnissen untersucht, um bestehende Muster zu identifizieren.

Die Anwendung von Statistiken im Gesundheitswesen ist sowohl auf kommunaler Ebene als auch auf der Ebene einzelner Patienten erforderlich. Die Medizin befasst sich mit Individuen, die sich in vielerlei Hinsicht voneinander unterscheiden, und die Werte der Indikatoren, anhand derer eine Person als gesund angesehen werden kann, sind von Individuum zu Individuum unterschiedlich. Keine zwei Patienten oder zwei Patientengruppen sind genau gleich, daher müssen Entscheidungen bezüglich einzelner Patienten oder Populationen auf der Grundlage von Erfahrungen mit anderen Patienten oder Populationen mit ähnlichen biologischen Merkmalen getroffen werden. Dabei ist zu beachten, dass diese Entscheidungen angesichts der bestehenden Diskrepanzen nicht absolut zutreffend sein können – sie sind immer mit einer gewissen Unsicherheit verbunden. Darin besteht die moderne Natur der Medizin.

Einige Anwendungsbeispiele statistischer Methoden in der Medizin:

Interpretation der Variation (die Variabilität der Merkmale eines Organismus bei der Entscheidung, welcher Wert eines bestimmten Merkmals ideal, normal, durchschnittlich usw. ist, macht die Verwendung geeigneter statistischer Methoden erforderlich).

Diagnose von Krankheiten bei einzelnen Patienten und Beurteilung des Gesundheitszustands einer Bevölkerungsgruppe.

Vorhersage des Endes einer Krankheit bei einzelnen Patienten oder des möglichen Ergebnisses eines Krankheitskontrollprogramms in einer beliebigen Bevölkerungsgruppe.

Auswahl geeigneter Beeinflussung des Patienten oder der Bevölkerungsgruppe.

Planung und Durchführung medizinischer Forschung, Analyse und Veröffentlichung von Ergebnissen, deren Lektüre und kritische Bewertung.

Gesundheitsplanung und -management.

Nützliche medizinische Informationen verstecken sich meist in einer Masse von Rohdaten. Es ist notwendig, die darin enthaltenen Informationen zu konzentrieren und die Daten so darzustellen, dass die Struktur der Variation klar erkennbar ist, und dann spezifische Analysemethoden auszuwählen.

Die Darstellung von Daten macht Sie mit den folgenden Konzepten und Begriffen vertraut:

Variationsreihe (geordnete Anordnung) - eine einfache Ordnung einzelner Beobachtungen einer Größe.

Klasse - eines der Intervalle, in die der gesamte Wertebereich einer Zufallsvariablen unterteilt ist.

Extrempunkte der Klasse - der Wert, der die Klasse begrenzt, zum Beispiel 2,5 und 3,0, die unteren und oberen Grenzen der Klasse 2,5 - 3,0.

Die (absolute) Klassenhäufigkeit ist die Anzahl der Beobachtungen in der Klasse.

relative Klassenhäufigkeit – die absolute Häufigkeit einer Klasse, ausgedrückt als Bruchteil der Gesamtzahl der Beobachtungen.

kumulative (akkumulierte) Klassenhäufigkeit - die Anzahl der Beobachtungen, die gleich der Summe der Häufigkeiten aller vorherigen Klassen und dieser Klasse ist.

Säulendiagramm – eine grafische Darstellung der Datenhäufigkeiten für nominale Klassen unter Verwendung von Säulen, deren Höhe direkt proportional zu den Klassenhäufigkeiten ist.

Tortendiagramm - eine grafische Darstellung der Datenhäufigkeiten für nominale Klassen unter Verwendung von Kreissektoren, deren Flächen direkt proportional zu den Häufigkeiten der Klassen sind.

Histogramm - eine grafische Darstellung der Häufigkeitsverteilung quantitativer Daten durch die Flächen von Rechtecken, die direkt proportional zu den Häufigkeiten der Klassen sind.

Häufigkeitspolygon - ein Diagramm der Häufigkeitsverteilung quantitativer Daten; der der Häufigkeit der Klasse entsprechende Punkt wird über der Mitte des Intervalls platziert, jeweils zwei benachbarte Punkte werden durch ein gerades Liniensegment verbunden.

Ogive (kumulative Kurve) - Diagramm der Verteilung der kumulativen relativen Häufigkeiten.

Variabilität ist allen medizinischen Daten inhärent, dh die Analyse von Messergebnissen basierend auf der Untersuchung von Informationen darüber, welche Werte die untersuchte Zufallsvariable angenommen hat.

Die Menge aller möglichen Werte einer Zufallsvariablen wird allgemein genannt.

Der als Ergebnis der Tests erfasste Teil der Allgemeinbevölkerung wird als Stichprobe bezeichnet.

Die Anzahl der in einer Stichprobe enthaltenen Beobachtungen wird als Stichprobenumfang bezeichnet (normalerweise mit n bezeichnet).

Die Aufgabe des Stichprobenverfahrens besteht darin, anhand des erhaltenen Wählers eine korrekte Schätzung der untersuchten Zufallsvariablen vorzunehmen. Daher ist die Hauptanforderung, die an die Auswahl gestellt wird, die maximale Darstellung aller Merkmale der Allgemeinbevölkerung. Die Auswahl, die diese Anforderung erfüllt, wird als repräsentativ bezeichnet. Die Bewertung der Bewertung hängt von der Repräsentativität der Auswahl ab, d. der Grad der Übereinstimmung der Bewertung mit dem Parameter, den sie charakterisiert.

Bei der Schätzung der Parameter der Allgemeinbevölkerung durch den Wähler (parametrische Schätzung) werden die folgenden Konzepte verwendet:

Punktschätzung - eine Schätzung des Parameters der Allgemeinbevölkerung in Form eines einzelnen Werts, den er mit der höchsten Wahrscheinlichkeit annehmen kann.

Intervallschätzung - Schätzung eines Populationsparameters in Form eines Werteintervalls, das mit einer bestimmten Wahrscheinlichkeit seinen wahren Wert abdeckt.

Bei der Intervallschätzung wird das Konzept verwendet:

zuverlässiges Intervall - ein Intervall von Werten, das mit einer bestimmten Wahrscheinlichkeit den wahren Wert des Populationsparameters in der Intervallschätzung abdeckt.

Zuverlässigkeit (zuverlässige Wahrscheinlichkeit) - die Wahrscheinlichkeit, mit der das zuverlässige Intervall den wahren Wert des Populationsparameters abdeckt.

zuverlässige Grenzen - die unteren und oberen Grenzen des zuverlässigen Intervalls.

Die Schlussfolgerungen, die durch die Methoden der mathematischen Statistik gewonnen werden, basieren immer auf einer begrenzten, selektiven Anzahl von Beobachtungen, so dass es natürlich ist, dass die Ergebnisse für die zweite Stichprobe anders sein können. Dieser Umstand bestimmt den phantasievollen Charakter der Schlussfolgerungen der mathematischen Statistik und folglich die weit verbreitete Verwendung der Wahrscheinlichkeitstheorie in der Praxis der statistischen Forschung.

Eine typische Art der statistischen Forschung ist wie folgt:

Nachdem sie die Größenordnungen oder Abhängigkeiten zwischen ihnen anhand von Beobachtungsdaten abgeschätzt haben, stellen sie die Annahme auf, dass das untersuchte Phänomen durch das eine oder andere stochastische Modell beschrieben werden kann

mit statistischen Methoden kann diese Annahme bestätigt oder widerlegt werden; Bei der Bestätigung ist das Ziel erreicht - es wird ein Modell gefunden, das die untersuchten Muster beschreibt, ansonsten arbeiten sie weiter, stellen eine neue Hypothese auf und testen sie.

Definition von statistischen Stichprobenschätzungen:

der Modus ist der Wert, der im Wähler am häufigsten vorkommt,

Median - der zentrale (Median) Wert der Variationsreihe

Bereich R - die Differenz zwischen den größten und kleinsten Werten in einer Reihe von Beobachtungen

Perzentile - der Wert in der Variationsreihe, der die Verteilung in 100 gleiche Teile teilt (daher ist der Median das 50. Perzentil)

erstes Quartil - 25. Perzentil

drittes Quartil - 75. Perzentil

Interquartilbereich – die Differenz zwischen dem ersten und dritten Quartil (deckt die mittleren 50 % der Beobachtungen ab)

Quartilabweichung - die Hälfte des Interquartilbereichs

Stichprobenmittelwert - arithmetisches Mittel aller Stichprobenwerte (Stichprobenschätzung der mathematischen Erwartung)

mittlere absolute Abweichung - die Summe der Abweichungen vom entsprechenden Anfang (ohne Berücksichtigung des Vorzeichens), dividiert durch das Volumen der Probe

Die durchschnittliche absolute Abweichung vom Stichprobenmittelwert wird anhand der Formel berechnet

Stichprobenvarianz ( X ) - (Stichprobenschätzer der Varianz) ist gegeben durch

Stichprobenkovarianz -- (Stichprobenschätzung der Kovarianz K ( X,Y )) gleich

Svon Y auf X (Stichprobenschätzung des Regressionskoeffizienten von Y auf X ) gleich

die empirische lineare Regressionsgleichung für Y auf X ist

der Stichproben-X-auf-Y-Regressionskoeffizient (die Stichprobenschätzung des X-auf-Y-Regressionskoeffizienten) ist

die empirische lineare Regressionsgleichung X auf Y hat die Form

Stichprobenstandardabweichung s(X) - (Stichprobenschätzung der Standardabweichung) ist gleich der Quadratwurzel der Stichprobenvarianz

St– ​​(Stichprobenschätzung des Korrelationskoeffizienten) gleich

Stichprobenvariationskoeffizient  - (Stichprobenschätzung des Variationskoeffizienten CV) gleich

.

8. Aufgabe zum Selbststudium der Schüler. 8.1 Aufgabe zum selbstständigen Erarbeiten von Stoffen aus dem Thema.

8.1.1 Praktische Berechnung von Stichprobenschätzungen

Praktische Berechnung von Stichprobenpunktschätzungen

Beispiel 1 .

Die Krankheitsdauer (in Tagen) bei 20 Lungenentzündungen summierte sich zu:

10, 11, 6, 16, 7, 13, 15, 8, 9, 10, 11, 13, 7, 8, 13, 15, 16, 13, 14, 15

Bestimmen Sie den Modus, den Median, die Spannweite, den Interquartilsabstand, den Stichprobenmittelwert, die mittlere absolute Abweichung vom Stichprobenmittelwert, die Stichprobenvarianz, den Stichprobenvariationskoeffizienten.

Rozv "zok.

Die Variationsreihe für die Auswahl hat die Form

6, 7, 7, 8, 8, 9, 10, 10, 11, 11, 13, 13, 13, 13, 14, 15, 15, 15, 16, 16

Mode

Die häufigste Zahl im Selektor ist 13. Daher ist der Wert des Modus im Selektor diese Zahl.

Median

Wenn eine Variationsreihe eine gepaarte Anzahl von Beobachtungen enthält, ist der Median der Durchschnitt der beiden zentralen Mitglieder der Reihe, in diesem Fall 11 und 13, also ist der Median 12.

Umfang

Der Mindestwert im Selektor ist 6 und der Höchstwert 16, also R = 10.

Interquartilbereich, Quartilabweichung

In einer Variationsreihe ist ein Viertel aller Daten kleiner als oder Stufe 8, also ist das erste Quartil 8, und 75 % aller Daten sind kleiner als oder Stufe 12, also ist das dritte Quartil 14. Also das Interquartil Bereich ist 6, und die Quartilabweichung ist 3.

Stichprobenmittelwert

Das arithmetische Mittel aller Abtastwerte ist gleich

.

Durchschnittliche absolute Abweichung vom Stichprobenmittelwert

.

Stichprobenabweichung

Stichproben-Standardabweichung

.

Schwingungsvariationskoeffizient

.

Im folgenden Beispiel betrachten wir die einfachste Möglichkeit, einen stochastischen Zusammenhang zwischen zwei Zufallsvariablen zu untersuchen.

Beispiel 2 .

Bei der Untersuchung einer Patientengruppe wurden Daten zum Wachstum von H (cm) und zum Volumen des zirkulierenden Blutes V (l) erhalten:

Finden Sie empirische lineare Regressionsgleichungen.

Rozv "zok.

Das erste, was zu berechnen ist:

Stichprobenmittelwert

Stichprobenmittelwert

.

Das zweite, was zu berechnen ist, ist:

Stichprobenvarianz (N)

Stichprobenvarianz (V)

Probenkovarianz

Die dritte ist die Berechnung von Stichproben-Regressionskoeffizienten:

SV auf H

Stichproben-Regressionskoeffizient H auf V

.

Schreiben Sie viertens die gewünschten Gleichungen auf:

die empirische lineare Regressionsgleichung für V auf H hat die Form

die empirische lineare Regressionsgleichung für H auf V ist

.

Beispiel 3 .

Berechnen Sie unter Verwendung der Bedingungen und Ergebnisse von Beispiel 2 den Korrelationskoeffizienten und testen Sie die Existenz einer Korrelation zwischen der menschlichen Größe und dem zirkulierenden Blutvolumen mit einer zuverlässigen Wahrscheinlichkeit von 95 %.

Rozv "zok.

Der Korrelationskoeffizient steht im Zusammenhang mit den Regressionskoeffizienten und einer praktisch brauchbaren Formel

.

Für eine selektive Schätzung des Korrelationskoeffizienten hat diese Formel die Form

.

Unter Verwendung der Werte der Probenregressionskoeffizienten und in Beispiel 2 erhalten wir

.

Die Überprüfung der Zuverlässigkeit der Korrelationsabhängigkeit zwischen Zufallsvariablen (unter Annahme einer Normalverteilung für jede von ihnen) wird auf diese Weise durchgeführt:

  • Berechnen Sie den Wert von T

  • Finden Sie den Koeffizienten in der Verteilungstabelle des Schülers

  • die Existenz einer Korrelationsabhängigkeit zwischen Zufallsvariablen wird bestätigt, wenn die Rauhigkeit durchgeführt wird

.

Da 3,5 > 2,26, dann kann mit einer zuverlässigen Wahrscheinlichkeit von 95 % das Bestehen einer Korrelation zwischen der Körpergröße des Patienten und dem Volumen des zirkulierenden Blutes als gesichert angesehen werden.

Intervallschätzungen für Mittelwert und Varianz

Wenn die Zufallsvariable normalverteilt ist, werden die Intervallschätzungen für den mathematischen Erwartungswert und die Varianz in der folgenden Reihenfolge berechnet:

1. Finden Sie den Stichprobenmittelwert;

2. Berechnen Sie die Stichprobenvarianz und die Stichprobenstandardabweichung s;

3. in der Tabelle der Student-Verteilung wird für die zuverlässige Wahrscheinlichkeit  und das Volumen der Stichprobe n der Student-Koeffizient gefunden;

4. Das zuverlässige Intervall für die mathematische Erwartung wird geschrieben als

5. in der Verteilungstabelle ">  und dem Volumen der Probe n die Koeffizienten finden

;

6. Das zuverlässige Intervall für die Streuung wird geschrieben als

Der Wert des zuverlässigen Intervalls, die zuverlässige Wahrscheinlichkeit  und der Stichprobenumfang n hängen voneinander ab. In der Tat die Beziehung

nimmt ab, wenn n zunimmt, also konstanter Wert zuverlässiges Intervall mit dem Wachstum von n steigt und  . Bei konstanter zuverlässiger Wahrscheinlichkeit nimmt mit zunehmendem Volumen von Viborkp die Größe des zuverlässigen Intervalls ab. Bei der Planung der medizinischen Forschung wird diese Beziehung verwendet, um das minimale Probenvolumen zu bestimmen, das die Werte des zuverlässigen Intervalls und der zuverlässigen Wahrscheinlichkeit liefert, die für die Bedingungen des zu lösenden Problems erforderlich sind.

Beispiel 5

Ermitteln Sie unter Verwendung der Bedingungen und Ergebnisse von Beispiel 1 die Intervallschätzungen des Mittelwerts und der Varianz für die 95 % zuverlässige Wahrscheinlichkeit.

Rozv "zok.

In Beispiel 1 werden die Punktschätzungen von Mittelwert (Stichprobenmittelwert = 12), Varianz (Stichprobenvarianz = 10,7) und Standardabweichung (Stichprobenstandardabweichung) getestet. Das Volumen der Probe ist gleich n = 20.

Aus der Verteilungstabelle des Studenten finden wir den Wert des Koeffizienten

dann berechnen wir die halbe Breite d des zuverlässigen Intervalls

und notieren Sie die Intervallschätzung der Erwartung

10,5 < < 13,5 при = 95%

Aus der Pearson-Verteilungstabelle „Chi-Quadrat“ finden wir die Koeffizienten

Berechnen Sie die untere und obere zuverlässige Grenze

und schreiben Sie die Intervallschätzung für die Varianz in das Formular

6,2 23 bei  = 95 %.

8.1.2. Aufgaben zur selbstständigen Lösung

Zur selbstständigen Lösung werden die Aufgaben 5.4 C 1 - 8 vorgeschlagen (P.G. Zhumatiy. „Mathematical processing of biomedical data. Tasks and example“. Odessa, 2009, p. 24-25)

8.1.3. Kontrollfragen
  1. Klassenhäufigkeit (absolut und relativ).
  2. Allgemeinbevölkerung und Stichprobe, Stichprobengröße.
  3. Punkt- und Intervallschätzung.
  4. Zuverlässiges Intervall und Zuverlässigkeit.
  5. Modus, Median und Stichprobenmittelwert.
  6. Spannweite, Quartilsabstand, vierteljährliche Abweichung.
  7. Durchschnittliche absolute Abweichung.
  8. Stichprobenkovarianz und -varianz.
  9. Stichprobenstandardabweichung und Variationskoeffizient.
  10. Beispiele für Regressionskoeffizienten.
  11. Empirische Regressionsgleichungen.
  12. Berechnung des Korrelationskoeffizienten und der Zuverlässigkeit der Korrelation.
  13. Konstruktion von Intervallschätzungen für normalverteilte Zufallsvariablen.
8.2 Hauptliteratur
  1. Zhumatiy P.G. „Mathematische Verarbeitung biomedizinischer Daten. Aufgaben und Beispiele“. Odessa, 2009.
  2. Zhumatiy P.G. Vorlesung „Mathematische Statistik“. Odessa, 2009.
  3. Zhumatiy P.G. "Grundlagen der mathematischen Statistik". Odessa, 2009.
  4. Zhumatiy P.G., Senytska Ya.R. Elemente der Wahrscheinlichkeitstheorie. Methodische Anweisungen für Studenten des medizinischen Instituts. Odessa, 1981.
  5. Chaly O.V., Agapov B.T., Tsekhmister Ya.V. Medizinische und biologische Physik. Kiew, 2004.
8.3 Weiterführende Literatur
  1. Remizov O.M. Medizinische und biologische Physik. M., Gymnasium, 1999.
  2. Remizov O.M., Isakova N.Kh., Maksina O.G. Sammlung von Problemen aus der medizinischen und biologischen Physik. M., ., „Höhere Schule“, 1987.
Methodische Anleitungen wurden von Assoc. P. G. Zhumatiy.

Die Methoden der mathematischen Statistik werden in der Regel in allen Phasen der Analyse von Forschungsmaterialien verwendet, um eine Strategie zur Lösung von Problemen mit bestimmten Beispieldaten auszuwählen und die erzielten Ergebnisse auszuwerten. Zur Bearbeitung des Materials wurden Methoden der mathematischen Statistik eingesetzt. Die mathematische Bearbeitung von Materialien ermöglicht es, die quantitativen Parameter objektiver Informationen eindeutig zu identifizieren, zu bewerten, zu analysieren und in verschiedenen Verhältnissen und Abhängigkeiten darzustellen. Sie ermöglichen es Ihnen, das Maß der Variation der Werte in den gesammelten Materialien zu bestimmen, die quantitative Informationen zu einer bestimmten Gruppe von Fällen enthalten, von denen einige die angeblichen Verbindungen bestätigen und andere sie nicht aufdecken, und die Zuverlässigkeit quantitativer Unterschiede zwischen ihnen berechnen die ausgewählten Fallkonstellationen und erhalten andere mathematische Merkmale, die für die korrekte Interpretation des Sachverhalts erforderlich sind. Die Signifikanz der während der Studie erhaltenen Unterschiede wurde durch den Student's t-Test bestimmt.

Folgende Werte wurden errechnet.

1. Arithmetisches Mittel der Stichprobe.

Charakterisiert den Durchschnittswert der betrachteten Grundgesamtheit. Lassen Sie uns die Messergebnisse bezeichnen. Dann:

wobei Y die Summe aller Werte ist, wenn sich der aktuelle Index i von 1 auf n ändert.

2. Standardabweichung (Standardabweichung), die die Streuung charakterisiert, Streuung der betrachteten Grundgesamtheit relativ zum arithmetischen Mittel.

= (xmax – xmin)/k

wo ist die standardabweichung

хmax - Maximalwert der Tabelle;

xmin - der Mindestwert der Tabelle;

k - Koeffizient

3. Standardfehler des arithmetischen Mittels oder Repräsentativitätsfehler (m). Der Standardfehler des arithmetischen Mittels charakterisiert den Grad der Abweichung des arithmetischen Mittels der Stichprobe vom arithmetischen Mittel der Allgemeinbevölkerung.

Der Standardfehler des arithmetischen Mittels wird nach folgender Formel berechnet:

wobei y die Standardabweichung der Messergebnisse ist,

n - Stichprobengröße. Je kleiner m, desto höher die Stabilität, Stabilität der Ergebnisse.

4. Schülerkriterium.

(im Zähler - die Differenz zwischen den Durchschnittswerten der beiden Gruppen, im Nenner - Quadratwurzel aus der Summe der Quadrate der Standardfehler dieser Mittelwerte).

Bei der Verarbeitung der erhaltenen Ergebnisse der Studie haben wir verwendet Computer Programm mit dem Excel-Paket.

Organisation des Studiums

Die Studie wurde von uns nach allgemein anerkannten Regeln durchgeführt und erfolgte in 3 Stufen.

In der ersten Phase wurde das erhaltene Material zum betrachteten Forschungsproblem gesammelt und analysiert. Der Gegenstand der wissenschaftlichen Forschung wurde gebildet. Die Analyse der Literatur in diesem Stadium ermöglichte es, den Zweck und die Ziele der Studie zu spezifizieren. Die erste Erprobung der 30-Meter-Lauftechnik wurde durchgeführt.<... class="gads_sm">

In der dritten Stufe wurde das als Ergebnis der wissenschaftlichen Forschung gewonnene Material systematisiert und alle verfügbaren Informationen zum Forschungsproblem zusammengefasst.

Die experimentelle Studie wurde auf der Grundlage der staatlichen Bildungseinrichtung "Lyakhovichskaya Mittelschule“, insgesamt bestand die Stichprobe aus 20 Schülern der 6. Klasse (11-12 Jahre).

Kapitel 3. Analyse der Ergebnisse der Studie

Als Ergebnis des pädagogischen Experiments haben wir das Anfangsniveau der 30-Meter-Lauftechnik bei den Schülern der Kontroll- und Versuchsgruppe ermittelt (Anhänge 1-2). Statistische Verarbeitung die erhaltenen Ergebnisse ermöglichten es uns, die folgenden Daten zu erhalten (Tabelle 6).

Tabelle 6. Anfangsniveau der Laufqualität

Wie aus Tabelle 6 ersichtlich ist, unterscheidet sich die durchschnittliche Punktzahl der Athleten in der Kontroll- und Experimentalgruppe statistisch nicht, in der Experimentalgruppe betrug die durchschnittliche Punktzahl 3,6 Punkte und in der Kontrollgruppe 3,7 Punkte. T-Test in beiden Gruppen temp=0,3; Р?0,05, bei tcrit=2,1; Die Ergebnisse der ersten Tests zeigten, dass die Indikatoren trainingsunabhängig und zufällig sind. Nach den ersten Tests übertrafen die Laufqualitätsindikatoren der Kontrollgruppe leicht jene der Versuchsgruppe. Aber es gab keine statistisch signifikanten Unterschiede in den Gruppen, was die Identität der Schüler in der Kontroll- und Versuchsgruppe in der Technik des 30-Meter-Laufs beweist.

Während des Experiments verbesserten sich in beiden Gruppen die Indikatoren, die die Effektivität der Lauftechnik charakterisieren. Allerdings war diese Verbesserung bei verschiedenen Teilnehmergruppen des Experiments unterschiedlicher Natur. Als Ergebnis des Trainings wurde ein regelmäßiger leichter Anstieg der Indikatoren in der Kontrollgruppe (3,8 Punkte) festgestellt. Wie aus Anhang 2 ersichtlich ist, zeigte sich in der Versuchsgruppe ein starker Anstieg der Indikatoren. Die Schüler lernten nach dem von uns vorgeschlagenen Programm, was ihre Leistungen deutlich verbesserte.

Tabelle 7. Veränderungen der Laufqualität bei den Probanden der Versuchsgruppe

Während des Experiments stellten wir fest, dass erhöhte Belastungen in der Versuchsgruppe zu deutlichen Verbesserungen der Geschwindigkeitsentwicklung führten als in der Kontrollgruppe.

Im Jugendalter ist es ratsam, Schnelligkeit durch den überwiegenden Einsatz von Sportunterrichtsmitteln zu entwickeln, die darauf abzielen, die Bewegungsfrequenz zu erhöhen. Im Alter von 12-15 Jahren steigen die Schnelligkeitsfähigkeiten aufgrund der Verwendung von hauptsächlich Schnellkraft- und Kraftübungen, die wir im Verlauf des Unterrichts verwendet haben Bewegungserziehung, Körpererziehung, Leibeserziehung und außerschulische Aktivitäten im Sportbereich Basketball und Leichtathletik.

Bei der Durchführung des Unterrichts in der Experimentalgruppe wurde eine strenge Staffelung von Komplikation und motorischer Erfahrung durchgeführt. Fehler wurden zeitnah behoben. Wie die Analyse der Ist-Daten zeigte, hatte die experimentelle Lehrmethodik eine signifikante Veränderung in der Qualität der Lauftechnik (temp=2,4). Die Analyse der in der Experimentalgruppe erzielten Ergebnisse und deren Vergleich mit den in der Kontrollgruppe unter Verwendung der allgemein anerkannten Lehrmethoden gewonnenen Daten geben Anlass zu der Annahme, dass die von uns vorgeschlagene Methode die Effektivität des Unterrichts erhöhen wird.

So haben wir in der Phase der Verbesserung der Methodik des 30-Meter-Laufs in der Schule die Dynamik der Änderungen der Testindikatoren in den Versuchs- und Kontrollgruppen aufgezeigt. Nach dem Experiment stieg die Qualität der Rezeptionsleistung in der Experimentalgruppe auf 4,9 Punkte (t=3,3; P?0,05). Am Ende des Experiments war die Qualität der Lauftechnik in der Experimentalgruppe höher als in der Kontrollgruppe.

Mathematische Statistiken ist ein moderner Zweig der mathematischen Wissenschaft, der sich mit der statistischen Beschreibung der Ergebnisse von Experimenten und Beobachtungen beschäftigt, sowie Gebäude Mathematische Modelle Konzepte enthalten Wahrscheinlichkeiten. Die theoretische Grundlage der mathematischen Statistik ist Wahrscheinlichkeitstheorie.

In der Struktur der mathematischen Statistik werden traditionell zwei Hauptabschnitte unterschieden: beschreibende Statistik und statistische Inferenz (Abbildung 1.1).

Reis. 1.1. Hauptabschnitte der mathematischen Statistik

Beschreibende Statistik wird verwendet für:

o Verallgemeinerung von Indikatoren einer Variablen (Statistik einer Zufallsstichprobe);

o Identifizierung von Beziehungen zwischen zwei oder mehr Variablen (Korrelations-Regressions-Analyse).

Beschreibende Statistiken machen es möglich, zu erhalten neue Informationen, schnell verstehen und umfassend auswerten, das heißt, es erfüllt die wissenschaftliche Funktion der Beschreibung der Untersuchungsgegenstände, die seinen Namen rechtfertigt. Die Methoden der deskriptiven Statistik zielen darauf ab, aus einer Menge empirischer Einzeldaten ein für die Wahrnehmung sichtbares System von Formen und Zahlen zu machen: Häufigkeitsverteilungen; Indikatoren für Trends, Variabilität, Kommunikation. Diese Methoden berechnen die Statistik einer Stichprobe, die als Grundlage für die Umsetzung statistischer Inferenzen dient.

Statistische Inferenz Gelegenheit geben:

o die Genauigkeit, Zuverlässigkeit und Wirksamkeit von Stichprobenstatistiken zu bewerten, Fehler zu finden, die im Prozess der statistischen Forschung auftreten (statistische Auswertung)

o Verallgemeinerung der anhand von Stichprobenstatistiken ermittelten Parameter der Allgemeinbevölkerung (Testung statistischer Hypothesen).

Das Hauptziel der wissenschaftlichen Forschung ist es, neue Erkenntnisse über eine große Klasse von Phänomenen, Personen oder Ereignissen zu gewinnen, die als allgemeine Bevölkerung bezeichnet werden.

Bevölkerung ist die Gesamtheit der Untersuchungsgegenstände, Probe- sein Teil, der in einer bestimmten wissenschaftlich fundierten Weise gebildet wird 2.

Der Begriff „allgemeine Population“ wird verwendet, wenn es sich um eine große, aber begrenzte Menge von untersuchten Objekten handelt. Zum Beispiel über die Bevölkerung der ukrainischen Bewerber im Jahr 2009 oder die Bevölkerung der Vorschulkinder in der Stadt Riwne. Allgemeine Populationen können beträchtliche Volumina erreichen, endlich und unendlich sein. In der Praxis handelt es sich in der Regel um endliche Mengen. Und wenn das Verhältnis der Größe der Allgemeinbevölkerung zur Größe der Stichprobe mehr als 100 beträgt, dann liefern die Schätzmethoden für endliche und unendliche Populationen nach Glass und Stanley im Wesentlichen die gleichen Ergebnisse. Der allgemeine Satz kann auch als vollständiger Satz von Werten eines Attributs bezeichnet werden. Die Zugehörigkeit der Stichprobe zur Allgemeinbevölkerung ist die Hauptgrundlage für die Bewertung der Merkmale der Allgemeinbevölkerung nach den Merkmalen der Stichprobe.

Hauptsächlich Idee Die mathematische Statistik basiert auf der Überzeugung, dass eine vollständige Untersuchung aller Objekte der allgemeinen Bevölkerung bei den meisten wissenschaftlichen Problemen entweder praktisch unmöglich oder wirtschaftlich nicht praktikabel ist, da sie viel Zeit und erhebliche Materialkosten erfordert. Daher wird es in der mathematischen Statistik verwendet selektiver Ansatz, Das Prinzip ist im Diagramm in Abb. 1.2.

Zum Beispiel werden die Proben gemäß der Formationstechnologie randomisiert (einfach und systematisch), geschichtet, gruppiert (siehe Abschnitt 4).

Reis. 1.2. Schema der Anwendung von Methoden der mathematischen Statistik gem selektiver Ansatz der Einsatz mathematisch-statistischer Methoden kann in folgender Reihenfolge erfolgen (siehe Abb. 1.2):

o mit Durchschnittsbevölkerung, deren Eigenschaften Gegenstand der Forschung sind, bestimmte Methoden bilden eine Stichprobe- eine typische, aber begrenzte Anzahl von Objekten, auf die Forschungsmethoden angewendet werden;

o durch Beobachtungsmethoden, experimentelle Maßnahmen und Messungen an Musterobjekten empirische Daten gewonnen werden;

o die Verarbeitung empirischer Daten mit Methoden der deskriptiven Statistik liefert Stichprobenindikatoren, die Statistiker genannt werden - übrigens wie der Name der Disziplin;

o Anwendung statistischer Inferenzmethoden auf Statistiker, Parameter erhalten, die die Eigenschaften charakterisieren die allgemeine Bevölkerung.

Beispiel 1.1. Um die Stabilität des Wissensstandes (Variable x) Prüfung einer randomisierten Stichprobe von 3 Studenten mit einem Volumen von n. Die Tests enthielten m Aufgaben, die jeweils nach dem Punktesystem bewertet wurden: "erledigt" - 1, "nicht erfüllt" - 0. Durchschnittliche aktuelle Leistungen der Schüler blieben X

3 randomisierte Stichprobe(von engl. random – random) ist eine repräsentative Stichprobe, die nach der Strategie der Zufallstests gebildet wird.

auf dem Niveau der Vorjahre / h? Lösungsreihenfolge:

o Finden Sie eine aussagekräftige Hypothese wie: „Wenn aktuelle Ergebnisse Tests werden sich nicht von der Vergangenheit unterscheiden, dann können wir den Wissensstand der Schüler unverändert berücksichtigen, und Studienverlauf- stabil";

o eine adäquate statistische Hypothese, wie die Nullhypothese, zu formulieren H 0 dass "der aktuelle Durchschnittswert von X statistisch nicht vom Durchschnitt der Vorjahre / h abweicht", d.h. H0: X = ⁄ r, gegen die entsprechende Alternativhypothese X Ф ^ ;

o bauen empirische Verteilungen der untersuchten Variablen X;

o definieren(falls erforderlich) Korrelationen, zum Beispiel zwischen einer Variablen x und andere Indikatoren, bauen Regressionslinien;

o Einhaltung prüfen Empirische Verteilung normales Recht;

o Bewertung des Werts von Punktindikatoren und des Konfidenzintervalls von Parametern, z. B. des Durchschnitts;

o Definition von Kriterien zum Testen statistischer Daten Hypothesen;

o statistische Hypothesen basierend auf den ausgewählten Kriterien testen;

o eine Entscheidung über die statistische Nullhypothese zu einem bestimmten Zeitpunkt zu formulieren Signifikanzniveau;

o von der Entscheidung, die statistische Nullhypothese zu akzeptieren oder abzulehnen, zur Interpretation der Schlussfolgerungen in Bezug auf die sinnvolle Hypothese übergehen;

o aussagekräftige Schlussfolgerungen formulieren.

Wenn wir also die obigen Verfahren zusammenfassen, besteht die Anwendung statistischer Methoden aus drei Hauptblöcken:

Der Übergang von einem Objekt der Realität zu einem abstrakten mathematischen und statistischen Schema, dh die Konstruktion eines probabilistischen Modells eines Phänomens, Prozesses, einer Eigenschaft;

Ansiedlungshandlungen tatsächlich ausführen mathematische Mittel im Rahmen eines probabilistischen Modells basierend auf den Ergebnissen von Messungen, Beobachtungen, Experimenten und der Formulierung statistischer Schlussfolgerungen;

Interpretation statistischer Erkenntnisse über reale Situation und eine angemessene Entscheidung treffen.

Statistische Methoden zur Verarbeitung und Interpretation von Daten basieren auf der Wahrscheinlichkeitstheorie. Die Wahrscheinlichkeitstheorie ist die Grundlage der Methoden der mathematischen Statistik. Ohne die Verwendung grundlegender Konzepte und Gesetze der Wahrscheinlichkeitstheorie ist es unmöglich, die Schlussfolgerungen der mathematischen Statistik zu verallgemeinern und damit ihre sinnvolle Verwendung für wissenschaftliche und praktische Zwecke.

Die Aufgabe der deskriptiven Statistik besteht also darin, einen Satz von Stichprobendaten in ein System von Indikatoren umzuwandeln – Statistiken – Häufigkeitsverteilungen, Maße der zentralen Tendenz und Variabilität, Kopplungskoeffizienten und dergleichen. Statistiken sind jedoch tatsächlich Merkmale einer bestimmten Stichprobe. Natürlich ist es möglich, Stichprobenverteilungen, Stichprobenmittelwerte, Varianzen usw. zu berechnen, aber eine solche "Datenanalyse" ist von begrenztem wissenschaftlichem und pädagogischem Wert. Die „mechanische“ Übertragung von Schlussfolgerungen, die auf der Grundlage solcher Indikatoren gezogen werden, auf andere Bevölkerungsgruppen ist nicht korrekt.

Um Stichprobenindikatoren oder andere oder auf häufigere Populationen übertragen zu können, ist eine mathematische Begründung erforderlich Bestimmungenüber die Übereinstimmung und Eignung von Stichprobenmerkmalen mit den Merkmalen dieser gemeinsamen sogenannten Allgemeinpopulationen. Solche Bestimmungen basieren auf theoretischen Ansätzen und Schemata, die mit probabilistischen Realitätsmodellen verbunden sind, beispielsweise auf dem axiomatischen Ansatz, im Gesetz der großen Zahl usw. Nur mit ihrer Hilfe ist es möglich, die Eigenschaften, die durch die Ergebnisse der Analyse begrenzter empirischer Informationen festgestellt werden, entweder auf andere oder auf weit verbreitete Mengen zu übertragen. Somit ist die Konstruktion, die Funktionsgesetze, die Verwendung probabilistischer Modelle Gegenstand eines mathematischen Feldes namens "Wahrscheinlichkeitstheorie", das zum Wesen statistischer Methoden wird.

In der mathematischen Statistik werden also zwei parallele Reihen von Indikatoren verwendet: die erste Reihe, die praxisrelevant ist (das sind Musterindikatoren) und die zweite, die auf der Theorie basiert (das sind Indikatoren eines probabilistischen Modells). Beispielsweise entsprechen die an der Stichprobe ermittelten empirischen Häufigkeiten den Begriffen der theoretischen Wahrscheinlichkeit; der Stichprobenmittelwert (Praxis) entspricht der mathematischen Erwartung (Theorie) usw. Darüber hinaus stehen in Studien in der Regel selektive Merkmale im Vordergrund. Sie werden auf der Grundlage von Beobachtungen, Messungen und Experimenten berechnet, danach einer statistischen Bewertung der Fähigkeit und Wirksamkeit unterzogen, statistischen Hypothesen in Übereinstimmung mit den Forschungszielen getestet und am Ende mit einer bestimmten Wahrscheinlichkeit als akzeptiert Indikatoren für die Eigenschaften der untersuchten Populationen.

Frage. Aufgabe.

1. Beschreiben Sie die Hauptabschnitte der mathematischen Statistik.

2. Was ist die Grundidee der mathematischen Statistik?

3. Beschreiben Sie das Verhältnis der Grundgesamtheit und der Stichprobenpopulation.

4. Erläutern Sie das Schema zur Anwendung der Methoden der mathematischen Statistik.

5. Geben Sie die Liste der Hauptaufgaben der mathematischen Statistik an.

6. Was sind die Hauptblöcke der Anwendung statistischer Methoden? Beschreibe sie.

7. Erweitern Sie die Verbindung zwischen mathematischer Statistik und Wahrscheinlichkeitstheorie.

Die mathematische Statistik ist einer der Hauptbereiche einer Wissenschaft wie der Mathematik und ein Zweig, der die Methoden und Regeln für die Verarbeitung bestimmter Daten untersucht. Mit anderen Worten, es untersucht Wege, um Muster aufzudecken, die großen Sammlungen identischer Objekte auf der Grundlage ihrer Stichprobenerhebung innewohnen.

Der Zweck dieses Abschnitts besteht darin, Methoden zum Schätzen der Wahrscheinlichkeit oder zum Akzeptieren zu konstruieren bestimmte Entscheidungüber die Art der Entwicklung von Ereignissen, basierend auf den erzielten Ergebnissen. Zur Beschreibung der Daten werden Tabellen, Diagramme und Korrelationsfelder verwendet. selten angewandt.

Mathematische Statistik wird in verschiedenen Wissenschaftsbereichen eingesetzt. Beispielsweise ist es für die Wirtschaft wichtig, Informationen über homogene Mengen von Phänomenen und Objekten zu verarbeiten. Dies können Produkte sein, die von der Industrie hergestellt werden, Personal, Gewinndaten usw. Je nach mathematischer Natur der Beobachtungsergebnisse kann man die Statistik der Zahlen, die Analyse von Funktionen und Objekten nicht-numerischer Natur und mehrdimensional herausgreifen Analyse. Darüber hinaus berücksichtigen sie allgemeine und besondere Aufgaben (in Bezug auf die Wiederherstellung von Abhängigkeiten, die Verwendung von Klassifikationen, selektive Studien).

Die Autoren einiger Lehrbücher glauben, dass die Theorie der mathematischen Statistik nur ein Ausschnitt der Wahrscheinlichkeitstheorie ist, während andere glauben, dass es sich um eine unabhängige Wissenschaft mit eigenen Zielen, Zielen und Methoden handelt. In jedem Fall ist seine Verwendung jedoch sehr umfangreich.

Ja, der hellste mathematische Statistiken auf die Psychologie anwendbar. Seine Verwendung ermöglicht es dem Spezialisten, die Daten korrekt zu begründen, die Beziehung zwischen den Daten zu finden, sie zu verallgemeinern, viele logische Fehler zu vermeiden und vieles mehr. Es sei darauf hingewiesen, dass es ohne rechnerische Verfahren oft einfach unmöglich ist, dieses oder jenes psychologische Phänomen oder Persönlichkeitsmerkmal zu messen. Dies deutet darauf hin, dass die Grundlagen dieser Wissenschaft notwendig sind. Mit anderen Worten, es kann als Quelle und Grundlage der Wahrscheinlichkeitstheorie bezeichnet werden.

Die Forschungsmethode, die auf der Berücksichtigung statistischer Daten beruht, findet auch in anderen Bereichen Anwendung. Es sollte jedoch sofort darauf hingewiesen werden, dass seine Eigenschaften, wenn sie auf Objekte unterschiedlicher Herkunft angewendet werden, immer einzigartig sind. Daher ist es nicht sinnvoll, die Naturwissenschaften zu einer Wissenschaft zusammenzufassen. Die allgemeinen Merkmale dieser Methode beschränken sich auf das Zählen einer bestimmten Anzahl von Objekten, die in einer bestimmten Gruppe enthalten sind, sowie auf das Untersuchen der Verteilung quantitativer Merkmale und das Anwenden der Wahrscheinlichkeitstheorie, um bestimmte Schlussfolgerungen zu ziehen.

Elemente der mathematischen Statistik werden in Bereichen wie Physik, Astronomie usw. verwendet. Hier können die Werte von Merkmalen und Parametern, Hypothesen über die Koinzidenz beliebiger Merkmale in zwei Stichproben, über die Symmetrie der Verteilung und vieles mehr sein berücksichtigt.

Bei ihrer Umsetzung spielt die mathematische Statistik eine wichtige Rolle, deren Ziel es meist ist, geeignete Methoden zum Schätzen und Testen von Hypothesen zu entwickeln. Derzeit von großer Bedeutung in dieser Wissenschaft sind Computertechnologien. Sie ermöglichen nicht nur eine erhebliche Vereinfachung des Berechnungsprozesses, sondern auch die Erstellung von Mustern zur Replikation oder zur Untersuchung der Praxistauglichkeit der erzielten Ergebnisse.

Im Allgemeinen helfen die Methoden der mathematischen Statistik dabei, zwei Schlussfolgerungen zu ziehen: entweder das gewünschte Urteil über die Art oder Eigenschaften der untersuchten Daten und ihre Beziehungen zu fällen oder zu beweisen, dass die erhaltenen Ergebnisse nicht ausreichen, um Schlussfolgerungen zu ziehen.



Ähnliche Beiträge