Baris distribusi dan pengelompokan. Variasi dan rentang statistik dari seri variasi distribusi dan metode pemrosesan statistik mereka

  • Pelajaran Pengantar gratis;
  • Sejumlah besar guru berpengalaman (neatal dan berbahasa Rusia);
  • Kursus bukan untuk periode tertentu (bulan, enam bulan, tahun), tetapi pada jumlah kelas tertentu (5, 10, 20, 50);
  • Lebih dari 10.000 pelanggan yang puas.
  • Biaya satu kelas dengan guru berbahasa Rusia - dari 600 rubel, dengan penutur asli - dari 1500 rubel

Konsep seri variasi. Langkah pertama dalam sistematisasi bahan observasi statistik adalah penghitungan jumlah unit dengan satu atau fitur lain. Dengan menempatkan unit dalam urutan menaik atau turun dari fitur kuantitatif mereka dan menghitung jumlah unit dengan nilai tanda tertentu, kami memperoleh kisaran variasi. Seri variasi mengkarakterisasi distribusi unit agregat statistik tertentu sesuai dengan basis kuantitatif.

Rentang variasi adalah dua kolom, di kolom kiri, nilai-nilai fitur yang bervariasi disebut sebagai opsi dan yang ditunjuk (x), dan dalam angka kanan - absolut menunjukkan berapa kali setiap opsi ditemukan. Indikator kolom ini disebut frekuensi dan menunjuk (F).

Secara skematis, rentang variasi dapat direpresentasikan sebagai tabel.1:

Tabel 5.1.

Jenis baris variasi

Opsi (x)

Frekuensi (f)

Kolom kanan juga dapat menggunakan indikator relatif yang mengkarakterisasi fraksi frekuensi opsi individu dalam jumlah frekuensi total. Indikator relatif ini dinamai secara umum dan secara konvensional dilambangkan oleh, I.E. . Jumlah dari semua frekuensi sama dengan satu. Frekuensi dapat dinyatakan dalam persen, dan kemudian jumlahnya akan 100%.

Berbagai tanda bisa berbeda. Pilihan untuk beberapa tanda diekspresikan dalam bilangan bulat, seperti jumlah kamar di apartemen, jumlah buku yang diterbitkan, dll. Tanda-tanda ini disebut terputus, atau diskrit. Opsi untuk fitur lain dapat mengambil nilai apa pun dalam batas-batas tertentu, sebagai, misalnya, pelaksanaan tugas yang direncanakan, upah, dll. Fitur-fitur ini disebut kontinu.

Variasien diskrit. Jika varian dari seri variasi dinyatakan dalam bentuk nilai-nilai diskrit, maka rentang variasi semacam itu disebut diskrit, penampilannya disajikan dalam tabel. 5.2:

Tabel 5.2.

Distribusi siswa yang diperkirakan ujian

Estimasi (x)

Jumlah siswa (F)

Dalam% ke hasil ()

Sifat distribusi dalam baris diskrit digambarkan secara grafis dalam bentuk poligon distribusi, Gambar.5.1.

Ara. 5.1. Distribusi siswa sesuai dengan perkiraan yang diterima pada ujian.

Variasioner interval. Untuk tanda-tanda terus menerus, variasi dibangun interval, A.E. Nilai-nilai atribut di dalamnya dinyatakan dalam bentuk interval "dari dan ke". Pada saat yang sama, nilai minimum fitur dalam interval ini disebut batas bawah interval, dan maksimum - batas atas interval.

Variasi interval dibangun baik untuk tanda-tanda terputus (discrete) dan untuk bervariasi dalam jangkauan besar. Baris interval dapat sama dan interval yang tidak sama. Dalam praktik ekonomi, sebagian besar menerapkan interval yang tidak sama, semakin meningkat atau menurun. Kebutuhan seperti itu muncul terutama dalam kasus-kasus di mana bagian-bagian dari sifat dilakukan secara tidak merata dan dalam batas besar.

Pertimbangkan bentuk baris interval dengan interval yang sama, tabel. 5.3:

Tabel 5.3.

Distribusi pekerja untuk berolahraga

Pengembangan, Tr. (x)

Jumlah pekerja (f)

Frekuensi kumulatif (F ')

Rentang distribusi interval digambarkan secara grafis dalam bentuk histogram, Gambar.5.2.

Gbr.5.2. Distribusi pekerja untuk berolahraga

Akumulasi frekuensi (kumulatif). Dalam praktiknya, ada kebutuhan untuk mengubah deretan distribusi di baris kumulatifakumulasi frekuensi dalam konstruksi. Dengan bantuan mereka, Anda dapat mendefinisikan rata-rata struktural, yang memfasilitasi analisis deretan distribusi ini.

Akumulasi frekuensi ditentukan oleh penambahan berurutan ke frekuensi (atau frekuensi internal) dari kelompok pertama indikator ini dari kelompok-kelompok selanjutnya dari sejumlah distribusi. Untuk mengilustrasikan baris distribusi, kerumulan dan baris digunakan. Untuk membangunnya pada sumbu absis, nilai-nilai fitur diskrit (atau akhir interval) dicatat, dan pada sumbu ordinat - semakin banyak hasil frekuensi (cumulat), Gambar.5.3

Ara. 5.3. Distribusi Latihan Berkumulasi

Jika timbangan frekuensi dan opsi mengubah tempat, I.E. Pada sumbu absis, mencerminkan frekuensi akumulasi, dan pada sumbu ordinat - nilai-nilai opsi, kurva yang mengkarakterisasi perubahan frekuensi dari grup ke grup akan disebut baris distribusi, Gambar. 5.4.

Ara. 5.4. Distribusi pekerja Ohiva untuk berolahraga

Seri variasi dengan interval yang sama memberikan salah satu persyaratan terpenting untuk baris statistik distribusi, memastikan komparabilitas mereka dalam waktu dan ruang.

Kepadatan distribusi. Namun, frekuensi interval yang tidak merata individu dalam peringkat ini tidak sebanding secara langsung. Dalam kasus seperti itu, kepadatan distribusi dihitung untuk memastikan keterbandingan yang diperlukan, I.E. Tentukan berapa unit di setiap akun grup untuk unit ukuran interval.

Saat membangun grafik distribusi seri variasi dengan interval yang tidak sama, ketinggian persegi panjang ditentukan secara proporsi dengan non-frekuensi, tetapi indikator kepadatan distribusi nilai atribut yang terkait dalam interval yang sesuai.

Kompilasi seri variasi dan gambar grafiknya adalah langkah pertama dalam memproses data sumber dan tahap pertama analisis agregat yang diteliti. Langkah selanjutnya dalam analisis seri variasi adalah definisi indikator generalisasi dasar yang disebut karakteristik seri. Karakteristik ini harus memberikan gagasan tentang tanda rata-rata tanda dalam unit agregat.

nilai rata-rata. Nilai rata-rata adalah karakteristik umum dari atribut yang dipelajari dalam penelitian yang ditangani, mencerminkan tingkat khasnya per unit pembakaran pada kondisi tempat dan waktu tertentu.

Nilai rata-rata selalu dinamai, memiliki dimensi yang sama dengan tanda dalam unit agregat individu.

Sebelum menghitung nilai rata-rata, perlu untuk mengelompokkan unit agregat total, alokasi kelompok homogen berkualitas tinggi.

Rata-rata, dihitung pada totalitas secara keseluruhan disebut rata-rata umum, dan untuk setiap grup - rata-rata kelompok.

Ada dua varietas nilai rata-rata: daya (aritmatika rata-rata, harmonik rata-rata, geometris sedang, kuadrat sedang); Struktural (mode, median, kuartil, decil).

Pilihan media untuk menghitung tergantung pada target.

Jenis rata-rata dan metode daya untuk perhitungannya.Dalam praktik pemrosesan statistik bahan yang dirakit, berbagai tugas muncul, untuk memecahkan berbagai rata-rata.

Statistik matematika menampilkan berbagai rata-rata dari rumus media daya:

di mana nilai rata-rata; X - opsi terpisah (tanda-tanda tanda); Z adalah indikator derajat (pada z \u003d 1 - rata-rata aritmatika, z \u003d 0 rata-rata geometrik, z \u003d - 1 adalah harmonik rata-rata, z \u003d 2 adalah kuadratis rata-rata).

Namun, pertanyaan tentang jenis media mana yang harus diterapkan dalam setiap kasus individu diizinkan oleh analisis spesifik dari agregat yang diteliti.

Paling umum dalam statistik, jenis nilai rata-rata adalah aritmatika tengah.. Ini dihitung dalam kasus-kasus di mana volume fitur rata-rata terbentuk sebagai jumlah dari nilai-nilainya dalam unit individu dari agregat statistik yang dipelajari.

Tergantung pada sifat data sumber, aritmatika rata-rata ditentukan dengan berbagai cara:

Jika data non-utama, maka perhitungan dilakukan oleh rumus ukuran sedang sederhana

Perhitungan aritmatika sedang di baris diskritdatang oleh Formula 3.4.

Perhitungan aritmatika sedang dalam baris interval. Dalam seri variasi interval, di mana pertengahan interval diterima secara kondisional pada setiap kelompok, aritmatika rata-rata mungkin berbeda dari rata-rata yang dihitung pada data non-utama. Selain itu, semakin besar besarnya interval dalam kelompok, semakin besar penyimpangan yang mungkin dari rata-rata yang dihitung oleh data yang dikelompokkan, dari rata-rata yang dihitung dengan data non-utama.

Saat menghitung rata-rata pada seri variasi interval, untuk melakukan perhitungan yang diperlukan dari interval ke middings mereka. Dan kemudian menghitung nilai rata-rata sesuai dengan rumus rata-rata aritmatika tertimbang.

Sifat aritmatika sedang.Aritmatika rata-rata memiliki beberapa sifat yang memungkinkan Anda untuk menyederhanakan perhitungan, pertimbangkan mereka.

1. Aritmatika rata-rata angka konstan sama dengan angka konstan ini.

Jika x \u003d a. Kemudian .

2. Jika bobot semua varian sebanding dengan perubahan, I.E. Tambah atau kurangi dalam berapa kali yang sama, maka rata-rata baris baru aritmatika dari ini tidak akan berubah.

Jika semua beratnya mengurangi pada K kali, lalu .

3. Jumlah deviasi positif dan negatif dari varian individu dari rata-rata dikalikan berat badan adalah nol, mis.

Jika kemudian. Dari sini.

Jika semua opsi untuk mengurangi atau meningkatkan jumlah apa pun, maka baris baru aritmatika rata-rata akan berkurang atau menambah yang sama.

Kurangi semua opsi x. pada sEBUAH.. x.´ = x.sebuah.

Kemudian

Seri awal aritmatika rata-rata dapat diperoleh dengan menambah media yang dikurangi yang sebelumnya dikurangi dari opsi jumlah. sEBUAH.. .

5. Jika semua opsi mengurangi atau meningkat k. Sekali, baris baru aritmatika rata-rata akan mengurangi atau meningkatkan jumlah yang sama, I.E. di k. waktu.

Biarkan, Then. .

Dari sini, aku. Untuk mendapatkan rentang awal matang, baris baru aritmatika rata-rata (dengan opsi berkurang) harus ditingkatkan k.waktu.

Harmonik tengah.Harmonik rata-rata adalah nilai aritmatika tengah. Ini digunakan ketika informasi statistik tidak mengandung frekuensi dalam varian totalitas tertentu, dan diwakili sebagai produk mereka (m \u003d xf). Harmonik rata-rata akan dihitung oleh Formula 3.5

Aplikasi praktis harmonik menengah - untuk menghitung beberapa indeks, khususnya, indeks harga.

Geometris sedang.Saat menggunakan geometris sedang, nilai karakteristik individu, sebagai aturan, nilai relatif speaker yang dibangun dalam bentuk nilai rantai sebagai hubungan dengan tingkat sebelumnya dari setiap level dalam deretan speaker. Rata-rata mencirikan, dengan demikian, koefisien pertumbuhan rata-rata.

Nilai geometrik rata-rata juga digunakan untuk menentukan nilai ekuidistant dari nilai maksimum dan tanda minimum. Misalnya, sebuah perusahaan asuransi menyimpulkan kontrak untuk penyediaan layanan asuransi mobil. Bergantung pada peristiwa Tertanggung Spesifik, pembayaran asuransi dapat bervariasi dari $ 10.000 hingga $ 100.000 per tahun. Jumlah rata-rata pembayaran asuransi akan menjadi dolar.

Geometris rata-rata adalah nilai yang digunakan sebagai rata-rata hubungan atau dalam baris distribusi yang disajikan dalam bentuk perkembangan geometrik, ketika z \u003d 0. Rata-rata ini nyaman digunakan ketika perhatian dibayar untuk tidak ada perbedaan absolut, tetapi dua angka hubungan .

Formula untuk menghitung yang berikut ini

dimana - opsi tanda rata-rata; - Opsi kerja; f.- Opsi frekuensi.

Geometris rata-rata digunakan dalam perhitungan tingkat pertumbuhan tahunan rata-rata.

Kuadrat tengah.Rumus quadratic rata-rata digunakan untuk mengukur derajat jumlah nilai-nilai individu atribut di sekitar aritmatika rata-rata dalam deretan distribusi. Dengan demikian, ketika menghitung indikator variasi, rata-rata dihitung dari kuadrat deviasi nilai individu fitur dari nilai aritmatika tengah.

Nilai kuadrat rata-rata dihitung dengan rumus

Dalam studi ekonomi, rata-rata kuadratik dalam bentuk yang dimodifikasi banyak digunakan ketika menghitung indikator karakterisasi fitur, seperti dispersi, rata-rata penyimpangan kuadratik.

Aturan majorah. Antara rata-rata yang kuat ada ketergantungan berikut - semakin besar indikator, semakin besar nilai rata-rata, tabel.5.4:

Tabel 5.4.

Rasio antara nilai rata-rata

Z Value.

Rasio antara medium

Rasio ini disebut aturan mayoritas.

Nilai rata-rata struktural.Indikator khusus digunakan untuk mengkarakterisasi struktur set, yang dapat disebut rata-rata struktural. Indikator semacam itu termasuk mode, median, kuartil dan desil.

Mode. Moda (MO) disebut makna paling umum dari tanda dalam unit agregat. Mode ini disebut nilai fitur yang sesuai dengan titik maksimum kurva distribusi teoritis.

Mode banyak digunakan dalam praktik komersial ketika mempelajari permintaan pelanggan (ketika menentukan ukuran pakaian dan sepatu yang secara umum diminati), pendaftaran harga. Mod dalam agregat dapat beberapa.

Perhitungan mode dalam baris diskrit. Di baris diskrit mode adalah pilihan dengan frekuensi tertinggi. Pertimbangkan untuk menemukan mode di baris diskrit.

Perhitungan mode dalam baris interval. Dalam baris variasi interval, interval modal kira-kira dianggap kira-kira, mis. dari interval itu yang memiliki frekuensi terbesar (frekuensi). Dalam interval, perlu untuk menemukan nilai tanda yang fashion. Untuk serangkaian interval mode akan ditentukan oleh rumus

di mana batas bawah interval modal; - Besarnya interval modal; - frekuensi yang sesuai dengan interval modal; - frekuensi sebelum interval modal; - Frekuensi interval berikut modal.

Median.Median () disebut arti dari unit tengah dari seri peringkat. Baris peringkat adalah serangkaian tanda-tanda yang direkam dalam urutan menaik atau urutan menurun. Atau median adalah nilai yang membagi jumlah seri variasi yang dipesan menjadi dua bagian yang sama: satu bagian memiliki nilai fitur yang bervariasi lebih kecil dari opsi rata-rata, dan yang lainnya besar.

Untuk menemukan median, nomor urutannya ditentukan terlebih dahulu. Untuk ini, dengan jumlah unit ganjil dengan jumlah semua frekuensi, unit ditambahkan dan semuanya dibagi menjadi dua. Pada angka genap, unit median ditemukan sebagai nilai tanda masuk satu, nomor urut yang ditentukan oleh jumlah total frekuensi dibagi dua. Mengetahui urutan jumlah median, dengan mudah pada frekuensi akumulasi untuk menemukan maknanya.

Perhitungan median dalam baris diskrit.Menurut pemeriksaan selektif, data tentang distribusi keluarga dalam jumlah anak, meja. 5.5. Untuk menentukan median, pertama-tama mendefinisikan nomor urutnya

=

Kemudian kita akan membangun sejumlah frekuensi akumulasi (, dengan nomor urutan dan akumulasi frekuensi kita akan menemukan median. Akumulasi frekuensi 33 menunjukkan bahwa pada 33 keluarga jumlah anak tidak melebihi 1 anak, tetapi sejak rata-rata akan berada dalam interval dari 34 hingga 55 keluarga.

Tabel 5.5.

Distribusi jumlah keluarga dari jumlah anak

Jumlah anak dalam keluarga

Jumlah keluarga, memperluas interval median;

Semua bentuk rata-rata daya yang dipertimbangkan memiliki properti penting (berbeda dengan rata-rata struktural) - dalam rumus untuk menentukan rata-rata mencakup semua nilai seri IE. Ukuran rata-rata dipengaruhi oleh nilai masing-masing opsi.

Di satu sisi, ini adalah properti yang sangat positif. Dalam hal ini, tindakan semua alasan untuk mempengaruhi semua unit agregat umum diperhitungkan. Di sisi lain, bahkan satu pengamatan yang jatuh ke dalam data awal secara acak, dapat secara signifikan mendistorsi gagasan tingkat pengembangan atribut yang diteliti dalam kombinasi yang dipertimbangkan (terutama dalam peringkat pendek).

Perempat dan decil.Dengan analogi dengan menemukan median dalam seri variasi, Anda dapat menemukan nilai fitur dari setiap unit peringkat. Jadi, khususnya, Anda dapat menemukan nilai karakterisasi dalam unit yang membagi baris menjadi 4 bagian yang sama, sebesar 10, dll.

Perempat. Opsi yang membagi baris peringkat menjadi empat bagian yang sama disebut perempat.

Pada saat yang sama membedakan: kuartet (Q1) yang lebih rendah (atau pertama) adalah nilai tanda dalam satu unit seri peringkat, membagi kombinasi dalam rasio ¼ hingga ¾ dan kuartil atas (atau ketiga) (Q3) ) - Nilai tanda di unit seri peringkat, membagi totalitas dalam rasio ¾ ke ¼.

Kuartal kedua, ada median Q2 \u003d saya. Perkecetan bawah dan atas dalam baris interval dihitung oleh rumus yang sama dengan median.

di mana batas bawah interval yang masing-masing berisi kuartal bawah dan atas;

- Akumulasi frekuensi interval sebelum interval yang mengandung kuartil bawah atau atas;

- Frekuensi interval kuartil (bawah dan atas)

Interval yang mengandung Q1 dan Q3 ditentukan oleh akumulasi frekuensi (atau secara umum).

Decil. Selain kuartal, desil dihitung - opsi yang membagi baris peringkat pada 10 bagian yang sama.

Mereka dilambangkan dengan D, decil pertama D1 membagi angka dalam rasio 1/10 dan 9/10, D2 - 2/10 dan 8/10, dll. Mereka dihitung dengan skema yang sama dengan median dan kuartil.

Mediana, dan Quartered, dan Destile berasal dari statistik ordinal yang disebut, di mana mereka memahami opsi yang menempati urutan tertentu di baris peringkat.

Pengelompokan - Ini adalah pemisahan totalitas pada kelompok, homogen pada tanda apa pun.

Pengangkatan layanan. Dengan bantuan kalkulator online, Anda dapat:

  • membangun variasiasional, Bangun histogram dan TPA;
  • temukan indikator variasi (tengah, mode (termasuk dan grafis), median, ruang lingkup variasi, kuartil, pemecatan, koefisien diferensiasi penahan, rasio variasi dan indikator lainnya);

Petunjuk. Untuk mengelompokkan nomor, perlu untuk memilih jenis rentang variasi (diskrit atau interval) dan menentukan jumlah data (jumlah string). Solusi yang dihasilkan disimpan dalam file kata (lihat contoh pengelompokan data statistik).

Jika pengelompokan telah diimplementasikan dan diatur variasien diskrit atau seri Interval.Anda harus menggunakan indikator variasi kalkulator online. Memeriksa hipotesis tentang bentuk distribusi Dilakukan menggunakan studi tentang bentuk distribusi.

Jenis Kelompok Statistik

Seri variasi. Dalam hal pengamatan variabel acak diskrit, satu dan nilai yang sama dapat ditemukan beberapa kali. Nilai-nilai X I dari varian acak dicatat dengan indikasi n i dari jumlah penampilannya dalam pengamatan N, ini adalah frekuensi nilai ini.
Dalam hal variabel acak terus menerus dalam praktiknya, pengelompokan digunakan.
  1. Pengelompokan Tipologi. - Ini adalah pemisahan totalitas heterogen kualitatif yang dipelajari dari kelas, jenis sosial-ekonomi, kelompok-kelompok yang homogen. Untuk membangun grup ini, gunakan parameter seri variasi diskrit.
  2. Struktural disebut pengelompokanDi mana pemisahan agregat homogen pada kelompok-kelompok tersebut mengkarakterisasi strukturnya sesuai dengan fitur yang bervariasi. Untuk membangun grup ini, gunakan parameter interval baris.
  3. Pengelompokan, mengungkapkan hubungan antara fenomena yang dipelajari dan tanda-tanda mereka, disebut pengelompokan analitik (Lihat pengelompokan analitik angka).

Contoh nomor 1. Menurut Tabel 2, bangun baris distribusi lebih dari 40 bank komersial Federasi Rusia. Menurut baris distribusi yang diperoleh, tentukan: pendapatan rata-rata untuk satu bank komersial, kredit kredit rata-rata untuk satu bank komersial, modal dan nilai median laba; Kuartil, desil, ruang lingkup variasi, deviasi linier rata-rata, rata-rata penyimpangan kuadratik, koefisien variasi.

Keputusan:
Dalam Bab. "Jenis Seri Statistik" Pilih baris diskrit. Klik Sisipkan dari Excel. Jumlah Grup: Menurut Formula Stargessa

Prinsip-prinsip membangun kelompok statistik

Sejumlah pengamatan, dipesan naik, disebut variasi. Kelompokkan tanda Tanda itu disebut rusak dari totalitas untuk kelompok individu. Ini disebut dasar pengelompokan. Di dasar pengelompokan, baik tanda kuantitatif dan kualitatif dapat diletakkan.
Setelah menentukan dasar pengelompokan, itu harus diselesaikan tentang jumlah kelompok yang dapat dibalakan tes harus rusak.

Saat menggunakan komputer pribadi untuk memproses data statistik, pengelompokan unit objek dibuat menggunakan prosedur standar.
Salah satu prosedur ini didasarkan pada penggunaan rumus stur untuk menentukan jumlah kelompok yang optimal:

k \u003d 1 + 3,322 * lg (n)

Di mana K adalah jumlah kelompok, n adalah jumlah unit agregat.

Panjang interval parsial dihitung sebagai h \u003d (x max -x min) / k

Kemudian hitung jumlah pengamatan dalam interval ini, yang diambil sebagai frekuensi n i. Frekuensi kecil yang nilainya kurang dari 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Sebagai nilai-nilai baru, opsi diambil oleh tengah x i \u003d (c i - 1 + c i) / 2 interval.

Contoh nomor 3. Sebagai hasil dari sampel random self-acak 5%, distribusi kadar air berikut diperoleh. Hitung: 1) Persentase rata-rata kelembaban; 2) Indikator mengkarakterisasi variasi kelembaban.
Solusinya diperoleh dengan menggunakan kalkulator: Contoh No. 1

Membangun seri variasi. Menurut baris yang ditemukan, buat poligon distribusi, histogram, kumulatif. Tentukan mode dan median.
Unduh Keputusan

Contoh. Menurut hasil pengamatan sampel (sampel dan aplikasi):
a) membuat seri variasi;
b) menghitung frekuensi relatif dan akumulasi frekuensi relatif;
c) Bangun TPA;
d) membuat fungsi distribusi empiris;
e) Bangun grafik fungsi distribusi empiris;
e) Hitung karakteristik numerik: Rata-rata aritmatika, dispersi, penyimpangan kuadrat sekunder. Keputusan

Berdasarkan data yang diberikan pada Tabel 4 (Lampiran 1) dan yang sesuai dengan opsi Anda, jalankan:

  1. Berdasarkan pengelompokan struktural, kami membangun frekuensi variasi dan baris kumulatif distribusi menggunakan interval yang sama tertutup dengan mengambil jumlah kelompok menjadi 6. Hasil untuk mengirimkan dalam bentuk tabel dan digambarkan secara grafis.
  2. Menganalisis rentang distribusi variasi, dihitung:
    • nilai aritmatika rata-rata fitur;
    • mode, median, kuartil 1, decil 1 dan 9;
    • penyimpangan kuadrat sekunder;
    • koefisien variasi.
  3. Menarik kesimpulan.

Diperlukan: batang rentang, membangun rentang distribusi interval, menghitung nilai rata-rata, jumlah rata-rata, mode dan median untuk baris peringkat dan interval.

Berdasarkan data sumber untuk membangun seri variasi diskrit; Kirimkan dalam bentuk tabel statistik dan grafik statistik. 2). Berdasarkan data sumber untuk membangun seri variasi interval dengan interval yang sama. Jumlah interval memilih secara independen dan menjelaskan pilihan ini. Mewakili seri variasi yang diperoleh dalam bentuk tabel statistik dan grafik statistik. Tentukan jenis tabel dan grafik yang diterapkan.

Untuk menentukan rata-rata durasi layanan pelanggan dalam dana pensiun, jumlah klien yang sangat besar, 100 pelanggan diperiksa sesuai dengan skema sampel yang tidak disengaja secara acak. Hasil survei disajikan dalam tabel. Mencari:
a) Perbatasan di mana waktu layanan rata-rata semua pelanggan dari Dana Pensiun disimpulkan dengan probabilitas 0,9946;
b) Kemungkinan bahwa bagian dari semua pelanggan dana dengan durasi layanan kurang dari 6 menit berbeda dari bagian dari klien tersebut dalam sampel tidak lebih dari 10% (dengan nilai absolut);
c) volume sampel ulang, di mana probabilitas 0,9907 dapat dikatakan bahwa bagian dari semua pelanggan yayasan dengan durasi layanan kurang dari 6 menit berbeda dari bagian dari klien tersebut dalam sampel dengan tidak lebih dari 10% (dengan nilai absolut).
2. Menurut masalah 1, menggunakan x 2, kriteria Pearson, pada tingkat signifikansi α \u003d 0,05, periksa hipotesis bahwa jumlah acak X adalah waktu layanan pelanggan didistribusikan sesuai dengan hukum normal. Bangun pada satu gambar histogram distribusi empiris dan kurva normal yang sesuai.
Unduh Keputusan

Sampel Dana dari 100 elemen. Perlu:

  1. Bangun variasi peringkat;
  2. Temukan anggota maksimum dan minimum baris;
  3. Temukan ruang lingkup variasi dan jumlah interval optimal untuk konstruksi baris interval. Temukan panjang rentang interval;
  4. Membangun baris interval. Temukan frekuensi elemen pengambilan sampel dalam interval yang diserap. Temukan titik menengah dari setiap celah;
  5. Bangun frekuensi histogram dan poligon. Bandingkan dengan distribusi normal (analitis dan grafis);
  6. Membangun grafik fungsi distribusi empiris;
  7. Hitung karakteristik numerik selektif: momen selektif tengah dan tengah selektif;
  8. Hitung nilai perkiraan rata-rata deviasi kuadratik, asimetri dan ekses (menggunakan paket analisis MS Excel). Bandingkan perkiraan nilai perhitungan dengan akurat (dihitung menggunakan formula MS Excel);
  9. Bandingkan karakteristik grafik selektif dengan teoretis yang sesuai.
Unduh Keputusan

Ada data sampel berikut (sampel 10%, mekanis) pada produksi produk dan jumlah laba, juta rubel. Menurut data sumber:
Tugas 13.1.
13.1.1. Bangun sejumlah statistik distribusi perusahaan atas jumlah laba dengan membentuk lima kelompok dengan interval yang sama. Membangun grafik sejumlah distribusi.
13.1.2. Hitung karakteristik numerik dari sejumlah distribusi perusahaan dalam jumlah laba: aritmatika rata-rata, rata-rata penyimpangan kuadratik, dispersi, koefisien variasi V. Membuat kesimpulan.
TUGAS 13.2.
13.2.1. Tentukan batas-batas di mana jumlah satu perusahaan dalam agregat umum dilampirkan dengan probabilitas 0,997.
13.2.2. Menggunakan x2-kriteria Pearson, pada tingkat signifikansi α, periksa hipotesis bahwa nilai acak X adalah jumlah laba - didistribusikan sesuai dengan hukum normal.
Tugas 13.3.
13.3.1. Tentukan koefisien persamaan regresi selektif.
13.3.2. Tetapkan kehadiran dan sifat korelasi antara biaya produk yang diproduksi (X) dan jumlah laba per perusahaan (Y). Bangun diagram hamburan dan garis regresi.
13.3.3. Hitung koefisien korelasi linear. Menggunakan kriteria T siswa, periksa signifikansi koefisien korelasi. Ambil kesimpulan tentang sesak antara faktor-faktor X dan Y menggunakan Chedocheus.
Pedoman.. Tugas 13.3 dilakukan dengan menggunakan layanan ini.
Unduh Keputusan

Sebuah tugas. Data berikut adalah biaya waktu klien untuk menyimpulkan kontrak. Membangun serangkaian variasi interval data yang disajikan, histogram, untuk menemukan penilaian yang tidak konsisten dari ekspektasi matematika, offset dan evaluasi dispersi yang tidak tersebar.

Contoh. Menurut Tabel 2:
1) Bangun deretan distribusi 40 bank komersial Federasi Rusia:
A) keuntungan terbesar;
B) Investasi kredit terbesar.
2) Untuk baris distribusi yang dihasilkan menentukan:
A) Rata-rata untung untuk satu bank komersial;
B) rata-rata investasi kredit untuk satu bank komersial;
C) nilai laba modal dan median; kuartil, desil;
D) Nilai modal dan median investasi kredit.
3) Hitung: Hitung:
a) variasi variasi;
b) deviasi linier rata-rata;
c) deviasi kuadrat sekunder;
d) Koefisien variasi.
Tempat perhitungan yang diperlukan dalam bentuk tabel. Analisis hasil. Membuat kesimpulan.
Membangun grafik dari baris distribusi yang dihasilkan. Tentukan fashion dan median secara grafis.

Keputusan:
Untuk membangun pengelompokan dengan interval yang sama, kami menggunakan data statistik pengelompokan layanan.

Gambar 1 - Masukkan parameter

Deskripsi parameter
Jumlah baris: Jumlah data sumber. Jika dimensi baris kecil, tentukan nomornya. Jika sampelnya cukup banyak, lalu klik tombol Sisipkan Excel.
Jumlah kelompok: 0 - Jumlah kelompok akan ditentukan oleh rumus Stargess.
Jika sejumlah kelompok tertentu ditentukan, tentukan (misalnya, 5).
Lihat baris: Baris diskrit.
Tingkat signifikansi: Misalnya, 0,954. Parameter ini diatur untuk menentukan interval rahasia dari nilai rata-rata.
Sampel: Misalnya, sampel mekanik 10% dilakukan. Menunjukkan angka 10. Untuk data kami, kami menentukan 100.

Kelompok angka, dikombinasikan dengan tanda apa pun, disebut agregat.

Seperti disebutkan di atas, bahan olahraga statistik primer adalah sekelompok angka yang tersebar yang tidak memberikan pelatih ide tentang esensi fenomena atau proses. Tugasnya adalah mengubah totalitas ini ke sistem dan menggunakannya dengan indikator untuk mendapatkan informasi yang diperlukan.

Persiapan seri variasi justru pembentukan matematika tertentu

Contoh 2. Pada 34 atlet pemain ski telah mendaftarkan waktu pemulihan pulsa setelah jarak yang lewat (dalam detik):

81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

Seperti yang dapat dilihat, kelompok angka ini tidak menanggung informasi apa pun.

Untuk persiapan nomor variasi, operasi produksi pertama peringkat - Lokasi jumlahnya dalam urutan menaik atau turun. Misalnya, dalam urutan menaik, peringkat mengarah ke yang berikut;

78; 78; 78; 78; 78; 78;

81; 81; 81; 81; 81; 81; 81; 81; 81;

84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

Dalam urutan menurun, peringkat mengarah pada kelompok angka seperti itu:

84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

81; 81; 81; 81; 8!; 81: 81; 81; 81;

78; 78; 78; 78; 78; 78;

Setelah peringkat, bentuk rekaman yang tidak rasional dari kelompok jumlah angka ini dan angka yang sama menjadi angka yang sama berulang kali. Oleh karena itu, sebuah pemikiran alami terjadi untuk mengkonversi perekaman sedemikian rupa untuk menentukan angka mana berapa kali diulang. Misalnya, mempertimbangkan peringkat dalam urutan menaik:

Di sini, jumlahnya dicatat oleh angka yang menunjukkan waktu pemulihan pulsa atlet, di sebelah kanan pengulangan kesaksian ini pada kelompok 34 atlet ini.

Sesuai dengan konsep-konsep di atas tentang simbol matematika, kelompok pengukuran yang dipertimbangkan akan menunjuk huruf apa saja, misalnya x. Mengingat meningkatnya urutan angka dalam kelompok ini: x 1 -74 c; x 2 - 78 s; x 3 - 81 s; x 4 - 84 s; x 5 - 85 s; X 6 N - 90 s, masing-masing Nomor yang dianggap dapat ditetapkan oleh Simbol X I.

Menunjukkan jumlah pengulangan pengukuran huruf n. Kemudian:

n 1 \u003d 4; N 2 \u003d 6; N 3 \u003d 9; N 4 \u003d 11; N 5 \u003d 3; n 6 \u003d n n \u003d 1, dan setiap jumlah pengulangan dapat dilambangkan sebagai n i.

Jumlah total pengukuran dilakukan, sebagai berikut dari kondisi contoh, adalah 34. Ini berarti bahwa jumlah semua n sama dengan 34. atau dalam ekspresi simbolis:

Menunjukkan jumlah ini dengan satu huruf - n. Kemudian data awal dari contoh yang dipertimbangkan dapat direkam dalam bentuk ini (Tabel 1).

Kelompok angka yang dihasilkan adalah serangkaian kesaksian berserakan kacau yang ditransformasikan yang diperoleh pelatih di awal pekerjaan.

Tabel 1

X I. N.
N \u003d 34.

Grup seperti itu adalah sistem tertentu yang parameternya mencirikan pengukuran dilakukan. Angka yang mewakili hasil pengukuran (x i) panggilan pilihan; N. I - jumlah pengulangan mereka - disebut frekuensi; n - jumlah semua frekuensi - di sana volume totalitas.

Seluruh sistem yang diperoleh disebut variasi dekat. Kadang-kadang baris ini disebut empiris atau statistik.

Mudah diperhatikan bahwa kasus tertentu dari seri variasi dimungkinkan, ketika semua frekuensi sama dengan satu n i \u003d\u003d 1, yaitu, setiap pengukuran dalam kelompok angka ini hanya bertemu satu kali.

Seri variasi yang dihasilkan, seperti yang lain, dapat diwakili secara grafis. Untuk membangun grafik seri yang dihasilkan, Anda harus terlebih dahulu berada pada skala pada sumbu horizontal dan vertikal.

Dalam tugas ini, pada sumbu horizontal, kita akan menyetor waktu pemulihan pulsa (x 1) sedemikian rupa sehingga panjang panjang terpilih secara sewenang-wenang sesuai dengan nilai satu detik. Ini akan mulai menunda nilai-nilai ini dari 70 detik, secara konvensional mundur dari persimpangan dua sumbu 0.

Pada sumbu vertikal, menunda nilai frekuensi baris kami (n i), mengambil skala: satuan panjang sama dengan satuan frekuensi.

Siapkan kondisi untuk membangun jadwal, lanjutkan untuk bekerja dengan variasi yang diperoleh.

Pasangan pertama angka x 1 \u003d 74, n 1 \u003d 4 diterapkan pada grafik seperti ini: pada sumbu x; Kami menemukan x 1 =74 Dan kami mengembalikan tegak lurus dari titik ini, pada sumbu N kami menemukan n 1 \u003d 4 dan melaksanakan garis horizontal darinya ke persimpangan dengan tegak lurus yang dipulihkan. Kedua garis vertikal dan horizontal adalah garis bantu dan karenanya diterapkan pada gambar garis putus-putus. Titik persimpangan mereka adalah rasio x 1 \u003d 74 dan n 1 \u003d 4 pada skala grafik ini.

Dengan cara yang sama, semua poin lain dari jadwal diterapkan. Kemudian mereka dihubungkan oleh bagian garis lurus. Agar jadwal memiliki tampilan tertutup, titik-titik ekstrem menghubungkan segmen dengan titik-titik yang berdekatan dari sumbu horizontal.

Angka yang dihasilkan adalah grafik dari seri variasi kami (Gbr. 1).

Cukup jelas bahwa setiap seri variasi tampaknya menjadi jadwal mereka sendiri.

Ara. 1. Representasi grafis dari seri variasi.

Pada Gambar. 1 menunjukkan:

1) Dari semua yang paling disurvei kelompok terbesar menyumbang atlet, waktu pemulihan pulsa, yang 84 s;

2) Banyak kali ini adalah 81 s;

3) Grup terkecil adalah atlet dengan waktu pemulihan pulsa kecil - 74 S dan besar - 90 s.

Dengan demikian, dengan melakukan serangkaian tes, jumlah yang diperoleh harus diberi peringkat dan menyusun seri variasi, yang merupakan sistem matematika tertentu. Untuk kejelasan, variasiennya dapat diilustrasikan oleh jadwal.

Rentang variasi di atas disebut diskrit Selanjutnya - ini, di mana setiap opsi dinyatakan dalam satu angka.

Mari kita berikan beberapa contoh lagi untuk mengkompilasi seri variasi.

Contoh 3. 12 penembak, melakukan latihan berbaring dari 10 tembakan, menunjukkan hasil seperti itu (dalam gelas):

94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

Untuk membentuk rentang variasi, kami akan peringkat nomor data;

94; 94; 94; 94; 94;

Setelah peringkat, kami membuat seri variasi (Tabel 3).

Kombinasi objek atau fenomena yang dikombinasikan oleh fitur umum atau properti yang berkualitas tinggi atau sifat kuantitatif disebut object Observation. .

Objek pengamatan statistik apa pun terdiri dari elemen individu - pengamatan Unit .

Hasil pengamatan statistik adalah informasi numerik - data . Data statistik - Ini adalah informasi tentang nilai-nilai apa yang diteliti penelitian ini pada peneliti dalam agregat statistik.

Jika nilai karakter dinyatakan dengan angka, tanda disebut kuantitatif .

Jika fitur tersebut mencirikan beberapa properti atau kondisi elemen agregat, maka tanda itu disebut kualitatif .

Jika penelitian ini tunduk pada semua elemen agregat (pengamatan padat), maka agregat statistik disebut umum.

Jika suatu studi tunduk pada bagian dari unsur-unsur populasi umum, maka agregat statistik disebut selektif (pengambilan sampel) . Pemilihan dari populasi umum diekstraksi secara acak, sehingga masing-masing elemen sampel memiliki peluang yang sama untuk dipilih.

Nilai atribut selama transisi dari satu elemen diatur ke yang lain diubah (bervariasi), oleh karena itu, dalam statistik, berbagai tanda juga disebut pilihan . Pilihan biasanya ditunjukkan oleh huruf Latin kecil X, Y, Z.

Nomor urutan opsi (nilai tanda) disebut pangkat . x 1 - perwujudan 1 (tanda 1), opsi X 2 - 2 (nilai tanda 2), varian X I - I-th (I-E sign).

Dipesan untuk meningkatkan atau mengurangi sejumlah tanda (opsi) dengan bobot yang sesuai yang disebut mereka disebut variasi dekat (distribusi terdekat).

Sebagai beratnya Frekuensi atau frekuensi.

Frekuensi(M i) menunjukkan berapa kali satu atau lain (nilai tanda) dalam agregat statistik ditemui.

Frekuensi atau frekuensi relatif (W i) menunjukkan bagian mana dari unit kombinasi yang memiliki satu atau yang lain. Frekuensi dihitung sebagai rasio frekuensi satu atau opsi lain dengan jumlah semua frekuensi baris.

. (6.1)

Jumlah dari semua frekuensi sama dengan 1.

. (6.2)

Baris variasi adalah diskrit dan interval.

Baris variasi diskrit Biasanya dibangun dalam acara bahwa nilai-nilai tanda yang diteliti mungkin berbeda satu sama lain dengan tidak kurang dari beberapa nilai akhir.

Dalam baris variasi diskrit, nilai titik ditetapkan.

Pandangan umum dari nomor variasi diskrit ditentukan pada Tabel 6.1.

Tabel 6.1.

dimana saya \u003d 1, 2, ..., l.

Dalam baris variasi interval dalam setiap interval, batas atas dan bawah interval dibedakan.

Perbedaan antara batas atas dan bawah interval disebut perbedaan interval atau interval panjang (nilai) .

Besarnya interval pertama K 1 ditentukan oleh rumus:

k 1 \u003d. a 2 - A 1;

kedua: K 2 \u003d dan 3 - a 2; ...

terakhir: K L \u003d a l - a l -1.

Secara umum perbedaan interval K I dihitung oleh rumus:

k i \u003d x i (maks) - x i (min). (6.3)

Jika intervalnya memiliki batas, maka itu disebut tutup .

Interval pertama dan terakhir bisa buka . hanya memiliki satu perbatasan.

Misalnya, interval pertama dapat ditetapkan sebagai "hingga 100", yang kedua - "100-110", ..., Penultimate - "190-200", yang terakhir - "200 dan lebih". Jelas, interval pertama tidak memiliki batas bawah, dan atasan terakhir, keduanya terbuka.

Seringkali interval terbuka harus dikuduskan. Untuk tujuan ini, interval pertama biasanya diambil sama dengan nilai yang kedua, dan besarnya yang terakhir adalah besarnya kedua dari belakang. Dalam contoh kita, besarnya interval kedua adalah 110-100 \u003d 10, oleh karena itu, batas bawah interval pertama adalah syarat syarat 100-10 \u003d 90; Besarnya interval kedua dari belakang adalah 200-190 \u003d 10, oleh karena itu, batas atas interval terakhir tergantung pada 200 + 10 \u003d 210.

Selain itu, gugus variasi interval dapat menghadapi interval dengan panjang yang berbeda. Jika interval dalam kisaran variasi memiliki panjang yang sama (perbedaan interval), mereka dipanggil isometrik. , jika tidak - tidak seragam.

Saat membangun rentang variasi interval, masalah pemilihan ukuran interval (perbedaan interval) sering dihadapi.

Untuk menentukan ukuran optimal interval (dalam hal itu baris dengan interval yang sama dibangun) berlaku formula Stargessa:

, (6.4)

di mana n adalah jumlah unit agregat,

x (maks) dan x (min) - nilai terbesar dan terkecil dari varian baris.

Untuk karakteristik seri variasi, bersama dengan frekuensi dan partai, akumulasi frekuensi dan frekuensi digunakan.

Akumulasi frekuensi (frekuensi) Tunjukkan berapa banyak unit agregat (bagian mana dari mereka) tidak melebihi nilai yang ditentukan (opsi) x.

Frekuensi akumulasi ( v I.) Menurut seri diskrit, adalah mungkin untuk menghitung sesuai dengan formula berikut:

. (6.5)

Untuk seri variasi interval - ini adalah jumlah frekuensi (frekuensi) dari semua interval yang tidak melebihi ini.

Variasien diskrit dapat diwakili secara grafis menggunakan distribusi atau frekuensi frekuensi poligon.

Saat membangun poligon distribusi di sepanjang sumbu absis, nilai-nilai fitur (varian) ditunda, dan sepanjang sumbu ordinat atau frekuensi. Pada persimpangan nilai fitur dan frekuensi yang sesuai (frekuensi), titik ditunda, yang, pada gilirannya, dihubungkan oleh segmen. Kebocoran yang dihasilkan disebut poligon distribusi frekuensi (frekuensi).

X K.
x 2.
x 1 x i


Ara. 6.1.

Variasioner interval secara grafis dapat diwakili menggunakan histogram. Bagan film.

Saat membangun histogram sepanjang sumbu absis, nilai atribut yang diteliti (batas interval) ditunda.

Dalam hal intervalnya adalah nilai yang sama, ordinat atau frekuensi atau frekuensi dapat ditunda di sepanjang sumbu ordinat.

Jika interval memiliki magnitudo yang berbeda, di sepanjang sumbu ordinat, perlu untuk menunda nilai-nilai kepadatan distribusi absolut atau relatif.

Kepadatan absolut - Rasio frekuensi interval ke ukuran interval:

; (6.6)

di mana: F (a) I adalah kepadatan absolut dari interval I-th;

m i - frekuensi interval I-th;

k Saya adalah nilai interval I-th (perbedaan interval).

Kepadatan absolut menunjukkan berapa banyak unit agregat per unit interval.

Kepadatan relatif - Rasio frekuensi interval ke ukuran interval:

; (6.7)

di mana: f (o) I adalah kepadatan relatif dari interval I-th;

w Saya adalah frekuensi interval I-th.

Kepadatan relatif menunjukkan bagian mana dari unit agregat adalah per unit interval.

AL.
A 1 x i
A 2.

Dan diskrit dan seri variasi interval secara grafis dapat direpresentasikan sebagai kumulatif dan rig.

Saat dibangun. cumulats. Menurut seri diskrit, nilai-nilai fitur (opsi) ditunda di sepanjang sumbu absis, dan akumulasi frekuensi atau frekuensi terakumulasi pada sumbu. Di persimpangan tanda-tanda (opsi) dan akumulasi frekuensi (frekuensi) yang sesuai, poin dibangun, yang pada gilirannya, dihubungkan oleh segmen atau kurva. Yang dihasilkan rusak (kurva) disebut terawat (kurva kumulatif).

Saat membangun kerumulan sesuai dengan seri interval di sepanjang sumbu absis, batas-batas interval ditunda. Abscissi Poin adalah batas atas interval. The Ordinates membentuk akumulasi frekuensi (frekuensi) dari interval yang sesuai. Sering menambahkan poin lain, absis di mana batas bawah interval pertama, dan ordinat adalah nol. Menghubungkan poin dengan bagian atau kurva, kami mendapatkan akulasi.

Ogiva. Ini dibangun dengan cara yang sama dengan kumulatif dengan perbedaan yang diterapkan sumbu absis, sesuai dengan akumulasi frekuensi (jenderal), dan sesuai dengan sumbu ordinat - nilai tanda (opsi).

Distribusi statistik - Ini adalah distribusi unit agregat pada grup pada grup pada fitur variasi tertentu.
Bergantung pada basis, dasar untuk pembentukan sejumlah distribusi dibedakan atribut dan rentang variasi distribusi.

Keberadaan fitur umum adalah dasar untuk pembentukan agregat statistik, yang mewakili hasil dari deskripsi atau pengukuran tanda-tanda umum objek penelitian.

Subjek penelitian dalam statistik adalah mengubah (memvariasikan) fitur atau tanda-tanda statistik.

Jenis Tanda Statistik.

Atribut panggilan baris distribusiDibangun oleh fitur-fitur berkualitas. Atributif - Ini adalah tanda yang memiliki nama, (misalnya, profesi: seamstress, guru, dll.).
Nomor distribusi dibuat dalam bentuk tabel. Di tab. 2.8 menunjukkan jumlah atribut distribusi.
Tabel 2.8 - Distribusi jenis bantuan hukum yang diberikan kepada pengacara kepada warga dari salah satu wilayah Federasi Rusia.

Seri variasi - Ini adalah nilai dari fitur (atau interval nilai) dan frekuensinya.
Deretan panggilan seri variasi distribusidibangun secara kuantitatif. Setiap seri variasi terdiri dari dua elemen: opsi dan frekuensi.
Opsi dianggap sebagai nilai terpisah dari fitur yang dibutuhkan di baris variasi.
Frekuensi adalah jumlah varian individu atau masing-masing kelompok seri variasi, I.E. Ini adalah angka yang menunjukkan seberapa sering opsi tertentu ditemukan dalam sejumlah distribusi. Jumlah dari semua frekuensi menentukan jumlah seluruh totalitas, volumenya.
Bagian-bagian yang disebut frekuensi dinyatakan dalam fraksi unit atau persen pada hasilnya. Dengan demikian, jumlah frekuensi sama dengan 1 atau 100%. Rentang variasi memungkinkan data aktual untuk mengevaluasi bentuk hukum distribusi.

Tergantung pada sifat variasi fitur yang membedakan seri Variasi Diskrit dan Interval.
Contoh seri variasi diskrit diberikan dalam tabel. 2.9.
Tabel 2.9 - Distribusi keluarga di jumlah kamar yang diduduki di apartemen terpisah pada tahun 1989 di Federasi Rusia.

Di kolom pertama tabel, varian seri variasi diskrit disajikan, pada detik - frekuensi kisaran variasi ditempatkan, pada indikator frekuensi ketiga.

Seri variasi

Dalam populasi umum, beberapa tanda kuantitatif diselidiki. Ini secara acak menghapus sampel volume n., yaitu, jumlah elemen sampling sama n.. Pada tahap pertama pemrosesan statistik yang dihasilkan mulai sampel, mis. Memesan angka x 1, x 2, ..., x n Naik. Setiap nilai yang diamati x I.dipanggil pilihan. Frekuensi m. - Ini adalah jumlah pengamatan nilai x I. Dalam sampel. Frekuensi relatif (frekuensi) i.- Ini adalah rasio frekuensi m.untuk volume sampel n.: .
Saat mempelajari seri variasi juga menggunakan konsep akumulasi frekuensi dan akumulasi frekuensi. Biarkan menjadi x. Beberapa nomor. Kemudian jumlah opsi , Nilai-nilai yang kurang x.disebut akumulasi frekuensi: untuk x i n. Ini disebut frekuensi akumulasi w i max.
Fitur ini disebut secara tidak bervariasi jika nilai-nilai individu (opsi) berbeda satu sama lain dengan nilai terbatas (biasanya bilangan bulat). Seri variasi dari tanda seperti itu disebut variasi diskrit.

Tabel 1. Tampilan umum dari rentang frekuensi variasi diskrit

Nilai tandax I. x 1. x 2. x n.
Frekuensim. m 1. m 2. m N.

Tanda ini disebut secara terus-menerus variasi jika nilai-nilainya berbeda satu sama lain pada nilai kecil yang sewenang-wenang, I.E. Tanda dapat mengambil nilai apa pun dalam beberapa interval. Seri variasi kontinu untuk fitur seperti itu disebut interval.

Tabel 2. Tampilan umum dari rentang frekuensi variasi interval

Tabel 3. Gambar grafis dari seri variasi

BarisPoligon atau histogramFungsi distribusi empiris
Diskrit
Selang
Melihat melalui hasil pengamatan yang dilakukan, tentukan berapa nilai opsi yang jatuh ke dalam setiap interval spesifik. Diasumsikan bahwa setiap interval memiliki salah satu ujungnya: baik dalam semua kasus tersisa (lebih sering), atau dalam semua kasus, hak, dan frekuensi atau frekuensi menunjukkan jumlah opsi yang ditutup dalam batas-batas yang ditentukan. Perbedaan a I - A I +1disebut interval parsial. Untuk menyederhanakan perhitungan selanjutnya, variasioner interval dapat diganti dengan diskrit secara konvensional. Dalam hal ini, nilai tengah sAYA.- Interval diambil untuk opsi x I., dan frekuensi interval yang sesuai m. - Untuk frekuensi interval ini.
Untuk gambar grafis dari seri variasi, poligon, histogram, kurva kumulatif dan fungsi distribusi empiris paling umum.

Di tab. 2.3 (pengelompokan populasi Rusia dalam hal pendapatan per kapita rata-rata pada April 1994) disajikan seri variasi interval.
Baris distribusi yang nyaman untuk dianalisis dengan gambar grafis yang memungkinkan Anda menilai dan pada bentuk distribusi. Gagasan visual tentang sifat perubahan dalam rentang variasi frekuensi diberikan polygon dan histogram.
Polygon digunakan dalam gambar seri variasi diskrit.
Tampilkan, misalnya, mendistribusikan dana perumahan secara grafis berdasarkan jenis apartemen, (Tabel 2.10).
Tabel 2.10 - Distribusi landasan perumahan daerah perkotaan berdasarkan jenis apartemen (angka kondisional).


Ara. Distribusi poligon stok perumahan


Pada sumbu ordinat, tidak hanya nilai frekuensi, tetapi juga frekuensi dari seri variasi dapat diterapkan.
Histogram diterima untuk gambar seri variasi interval. Saat membangun histogram pada sumbu absis, ukuran interval disimpan, dan frekuensi digambarkan oleh persegi panjang yang dibangun pada interval yang sesuai. Ketinggian kolom dalam kasus interval yang sama harus sebanding dengan frekuensi. Histogram adalah grafik di mana baris digambarkan dalam bentuk yang terkontaminasi satu sama lain.
Saya akan menunjukkan rentang distribusi interval grafis yang diberikan dalam tabel. 2.11.
Tabel 2.11 - Distribusi keluarga dalam ukuran ruang hidup per orang (angka bersyarat).
N p / n Kelompok keluarga dalam ukuran ruang tamu per orang Jumlah keluarga dengan ruang tamu tertentu Akumulasi Jumlah Keluarga
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Ara. 2.2. Distribusi histogram keluarga dalam ukuran ruang hidup per orang


Menggunakan data seri akumulasi (Tabel 2.11), Bangun distribusi Berkumulasi.


Ara. 2.3. Mengumulkan Distribusi Keluarga dalam ukuran ruang hidup per orang


Gambar baris variasi dalam bentuk akumulasi sangat efektif untuk seri variasi, frekuensi yang dinyatakan dalam fraksi atau persentase dengan jumlah frekuensi baris.
Jika dengan gambar grafis dari seri variasi dalam bentuk kerumulan untuk mengubah sumbu, maka kita akan mendapatkannya ogiva.. Pada Gambar. 2.4 menunjukkan bajingan berdasarkan tabel data. 2.11.
Histogram dapat dikonversi ke poligon distribusi jika Anda menemukan bagian tengah sisi persegi panjang dan kemudian menghubungkan titik-titik ini dengan garis lurus. Polygon distribusi yang dihasilkan ditunjukkan pada Gambar. 2.2 garis putus-putus.
Saat membangun histogram distribusi variasi rentang dengan interval yang tidak merata di sepanjang sumbu ordinat, itu bukan frekuensi yang diterapkan, tetapi kepadatan distribusi fitur dalam interval yang sesuai.
Kepadatan distribusi adalah frekuensi yang dihitung per unit lebar interval, I.E. Berapa banyak unit di setiap kelompok yang menyumbang unit ukuran interval. Contoh penghitungan kepadatan distribusi disajikan dalam tabel. 2.12.
Tabel 2.12 - Distribusi perusahaan dengan jumlah yang dipekerjakan (angka kondisional)
N p / n Kelompok perusahaan dalam jumlah yang dipekerjakan, orang Jumlah perusahaan Besarnya interval, orang Distribusi kepadatan
TAPI 1 2 3=1/2
1 Sampai 20. 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Gambar grafis dari seri variasi juga dapat digunakan. kurva kumulatif. Dengan bantuan kerumulan (jumlah kurva), sejumlah frekuensi akumulasi digambarkan. Akumulasi frekuensi ditentukan oleh penjumlahan yang konsisten dari frekuensi dalam kelompok dan menunjukkan berapa banyak unit yang ditetapkan memiliki nilai atribut tidak lebih dari nilai yang dipertimbangkan.


Ara. 2.4. Distribusi keluarga nakal dalam ukuran ruang hidup per orang

Saat membangun kumulasi seri variasi interval di sepanjang sumbu absis, varian baris ditunda, dan frekuensi akumulasi terakumulasi di sepanjang sumbu.

Seri variasi kontinu.

Seri variasi kontinu - serangkaian yang dibangun berdasarkan fitur statistik kuantitatif. Contoh. Durasi rata-rata penyakit narapidana (hari per orang) pada periode musim gugur musim dingin pada tahun berjalan sebesar:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5


Publikasi serupa.