แถวของการกระจายและการจัดกลุ่ม การเปลี่ยนแปลงและช่วงสถิติของชุดรูปแบบการกระจายและวิธีการประมวลผลทางสถิติของพวกเขา
- บทเรียนเบื้องต้น ฟรี;
- ครูที่มีประสบการณ์จำนวนมาก (Neutiv และภาษารัสเซีย);
- หลักสูตรที่ไม่ได้อยู่ในช่วงเวลาหนึ่ง (เดือนหกเดือนปี) แต่ในจำนวนชั้นเรียนที่เฉพาะเจาะจง (5, 10, 20, 50);
- ลูกค้าที่พึงพอใจมากกว่า 10,000 คน
- ค่าใช้จ่ายของหนึ่งชั้นเรียนกับครูสอนภาษารัสเซีย - จาก 600 รูเบิลกับเจ้าของภาษา - จาก 1,500 รูเบิล
แนวคิดของชุดแปรผัน ขั้นตอนแรกในการจัดระบบวัสดุของการสังเกตทางสถิติคือการนับจำนวนหน่วยที่มีคุณสมบัติหนึ่งหรืออื่น โดยการวางยูนิตในลำดับจากน้อยไปมากหรือน้อยลงของคุณสมบัติเชิงปริมาณของพวกเขาและคำนวณจำนวนหน่วยที่มีค่าการลงชื่อเฉพาะเราได้รับช่วงรูปแบบ ชุดรูปแบบการเปลี่ยนแปลงมีลักษณะการกระจายของหน่วยของการรวมสถิติบางอย่างตามพื้นฐานเชิงปริมาณใด ๆ
ช่วงรูปแบบคือสองคอลัมน์ในคอลัมน์ด้านซ้ายค่าของคุณสมบัติที่แตกต่างกันซึ่งอ้างถึงเป็นตัวเลือกและที่กำหนด (x) และในขวา - หมายเลขสัมบูรณ์แสดงให้เห็นว่ามีกี่ครั้งที่พบตัวเลือกแต่ละครั้ง ตัวบ่งชี้ของคอลัมน์นี้เรียกว่าความถี่และกำหนด (F)
แผนผังช่วงรูปแบบสามารถแสดงเป็นตาราง 5.1:
ตารางที่ 5.1
ประเภทของการเปลี่ยนแปลงแถว
ตัวเลือก (x) |
ความถี่ (f) |
คอลัมน์ที่เหมาะสมยังสามารถใช้ตัวบ่งชี้สัมพัทธ์ที่มีลักษณะส่วนของความถี่ของตัวเลือกแต่ละตัวในผลรวมความถี่ทั้งหมด ตัวบ่งชี้สัมพัทธ์เหล่านี้มีชื่อโดยทั่วไปและแสดงตามอัตภาพโดย I.e . ผลรวมของความถี่ทั้งหมดเท่ากับหนึ่ง ความถี่สามารถแสดงเป็นเปอร์เซ็นต์จากนั้นจำนวนเงินของพวกเขาจะเป็น 100%
สัญญาณต่าง ๆ อาจแตกต่างกัน ตัวเลือกสำหรับสัญญาณบางอย่างจะแสดงในจำนวนเต็มเช่นจำนวนห้องในอพาร์ทเมนท์จำนวนหนังสือที่ตีพิมพ์ ฯลฯ สัญญาณเหล่านี้เรียกว่าถูกขัดจังหวะหรือไม่ต่อเนื่อง ตัวเลือกสำหรับคุณสมบัติอื่น ๆ สามารถใช้ค่าใด ๆ ภายในข้อ จำกัด บางอย่างเช่นการดำเนินการของงานที่วางแผนไว้ค่าจ้าง ฯลฯ คุณสมบัติเหล่านี้เรียกว่าต่อเนื่อง
รูปแบบที่ไม่ต่อเนื่อง หากตัวแปรของชุดรูปแบบจะแสดงในรูปแบบของค่าที่ไม่ต่อเนื่องแล้วช่วงรูปแบบที่เรียกว่าไม่ต่อเนื่องลักษณะของมันจะถูกนำเสนอในตาราง 5.2:
ตารางที่ 5.2
การกระจายของนักเรียนในการประมาณการสอบ
ประมาณการ (x) |
จำนวนนักเรียน (F) |
% เป็นผลลัพธ์ () |
ลักษณะของการกระจายในแถวที่ไม่ต่อเนื่องนั้นเป็นภาพกราฟิกในรูปแบบของรูปหลายเหลี่ยมการกระจายรูปที่ 5.1
รูปที่. 5.1 การกระจายของนักเรียนตามการประมาณการที่ได้รับจากการสอบ
ชุดรูปแบบช่วงเวลา สำหรับสัญญาณต่อเนื่องการเปลี่ยนแปลงจะถูกสร้างขึ้นในช่วงเวลา I.e. ค่าของแอตทริบิวต์ในนั้นจะแสดงในรูปแบบของช่วงเวลา "จากและไปยัง" ในเวลาเดียวกันค่าต่ำสุดของคุณสมบัติในช่วงนี้เรียกว่าขอบเขตล่างของช่วงเวลาและค่าสูงสุด - ขอบเขตบนของช่วงเวลา
การเปลี่ยนแปลงช่วงเวลาถูกสร้างขึ้นทั้งสัญญาณที่ถูกขัดจังหวะ (ไม่ต่อเนื่อง) และสำหรับการแตกต่างกันไปในช่วงใหญ่ แถวช่วงสามารถมีช่วงเวลาเท่ากันและไม่เท่ากัน ในการปฏิบัติทางเศรษฐกิจส่วนใหญ่ใช้ช่วงเวลาที่ไม่เท่ากันเพิ่มขึ้นเรื่อย ๆ หรือลดลง ความต้องการดังกล่าวเกิดขึ้นโดยเฉพาะอย่างยิ่งในกรณีที่ส่วนของลักษณะถูกดำเนินการไม่สม่ำเสมอและเป็นข้อ จำกัด ขนาดใหญ่
พิจารณารูปแบบของแถวช่วงเวลาที่มีช่วงเวลาเท่ากันตาราง 5.3:
ตารางที่ 5.3
การกระจายแรงงานให้ทำงาน
การพัฒนา, TR (x) |
จำนวนคนงาน (F) |
ความถี่สะสม (f ') |
ช่วงการแจกแจงช่วงเวลานั้นแสดงภาพกราฟิกในรูปแบบของฮิสโตแกรมรูปที่ 5.2
รูปที่ 5.2 การกระจายแรงงานให้ทำงาน
ความถี่สะสม (สะสม) ในทางปฏิบัติมีความจำเป็นในการเปลี่ยนแถวของการกระจายใน แถวสะสมความถี่สะสมภายใต้การก่อสร้าง ด้วยความช่วยเหลือของพวกเขาคุณสามารถกำหนดค่าเฉลี่ยของโครงสร้างซึ่งอำนวยความสะดวกในการวิเคราะห์แถวของการกระจายเหล่านี้
ความถี่สะสมจะถูกกำหนดโดยการเพิ่มลำดับตามลำดับความถี่ (หรือความถี่ภายใน) ของกลุ่มแรกของตัวบ่งชี้เหล่านี้ของกลุ่มที่ตามมาของจำนวนการกระจาย เพื่อแสดงให้เห็นถึงแถวการกระจายการสะสมสะสมและแถว ในการสร้างพวกเขาบน Abscissa Axis ค่าของคุณสมบัติที่ไม่ต่อเนื่อง (หรือจุดสิ้นสุดของช่วงเวลา) จะถูกบันทึกไว้และบนแกนของการคาดการณ์ - ผลลัพธ์ที่เพิ่มขึ้นของความถี่ (Cumulat), รูปที่ 5.3
รูปที่. 5.3 การกระจายการออกกำลังกายสะสม
หากเครื่องชั่งของความถี่และตัวเลือกเปลี่ยนสถานที่ I.e บนแกน Abscissa สะท้อนความถี่สะสมและบนแกนของการบวช - ค่าของตัวเลือกเส้นโค้งลักษณะการเปลี่ยนแปลงความถี่จากกลุ่มไปยังกลุ่มจะถูกเรียกว่าแถวของการแจกจ่ายรูปที่ 5.4
รูปที่. 5.4 การกระจาย Ohiva ของคนงานที่จะออกกำลังกาย
ชุดรูปแบบที่มีช่วงเวลาที่เท่ากันให้หนึ่งในข้อกำหนดที่สำคัญที่สุดสำหรับแถวของการกระจายสถิติทำให้มั่นใจในการเปรียบเทียบเวลาและพื้นที่
ความหนาแน่นของการกระจาย อย่างไรก็ตามความถี่ของช่วงเวลาที่ไม่เท่ากันของแต่ละช่วงในอันดับเหล่านี้ไม่สามารถเทียบเคียงได้โดยตรง ในกรณีเช่นนี้ความหนาแน่นของการกระจายจะถูกคำนวณเพื่อให้แน่ใจว่าการเปรียบเทียบที่จำเป็นเช่นกัน กำหนดจำนวนหน่วยในแต่ละกลุ่มบัญชีสำหรับหน่วยของขนาดของช่วงเวลา
เมื่อสร้างกราฟของการกระจายของชุดรูปแบบที่มีช่วงเวลาที่ไม่เท่ากันความสูงของสี่เหลี่ยมจะถูกกำหนดในสัดส่วนกับความถี่ที่ไม่ใช่ความถี่ แต่ตัวบ่งชี้ความหนาแน่นของการกระจายของค่าของแอตทริบิวต์ที่เกี่ยวข้องในช่วงเวลาที่สอดคล้องกัน
การรวบรวมชุดรูปแบบและภาพกราฟิกเป็นขั้นตอนแรกในการประมวลผลข้อมูลต้นฉบับและขั้นตอนแรกของการวิเคราะห์การรวมการศึกษา ขั้นตอนต่อไปในการวิเคราะห์ชุดแปรผันคือคำจำกัดความของตัวบ่งชี้ทั่วไปพื้นฐานที่เรียกว่าลักษณะของซีรีส์ ลักษณะเหล่านี้จะต้องให้ความคิดเกี่ยวกับสัญลักษณ์เฉลี่ยของการลงชื่อเข้าใช้หน่วยรวมของการรวม
ค่าเฉลี่ย. ค่าเฉลี่ยเป็นลักษณะทั่วไปของแอตทริบิวต์ที่ศึกษาในการศึกษาสะท้อนให้เห็นถึงระดับทั่วไปต่อหน่วยของการเผาไหม้ในเงื่อนไขเฉพาะของสถานที่และเวลา
ค่าเฉลี่ยเสมอชื่อเสมอมีมิติเหมือนกับเครื่องหมายในแต่ละหน่วยของการรวม
ก่อนที่จะคำนวณค่าเฉลี่ยจำเป็นต้องจัดกลุ่มหน่วยของการรวมทั้งหมดการจัดสรรกลุ่มที่มีคุณภาพสูง
ค่าเฉลี่ยที่คำนวณจากจำนวนทั้งสิ้นโดยรวมเรียกว่าค่าเฉลี่ยทั่วไปและสำหรับแต่ละกลุ่ม - ค่าเฉลี่ยของกลุ่ม
มีสองค่าเฉลี่ย: พลังงาน (เลขคณิตเฉลี่ย, ฮาร์มอนิกเฉลี่ย, เรขาคณิตปานกลาง, กำลังสองปั่นป่วนขนาดกลาง); โครงสร้าง (แฟชั่น, มัธยฐาน, ควอไทล์, Decil)
ตัวเลือกของสื่อในการคำนวณขึ้นอยู่กับเป้าหมาย
ประเภทของค่าเฉลี่ยพลังงานและวิธีการคำนวณของพวกเขาในการปฏิบัติของการประมวลผลทางสถิติของวัสดุประกอบงานต่าง ๆ เกิดขึ้นเพื่อแก้ค่าเฉลี่ยต่าง ๆ
สถิติทางคณิตศาสตร์แสดงค่าเฉลี่ยต่าง ๆ จากสูตรของสื่อพลังงาน:
ที่ค่าเฉลี่ย; x - ตัวเลือกแยกต่างหาก (สัญญาณของสัญญาณ); Z เป็นตัวบ่งชี้ของการศึกษาระดับปริญญา (ที่ z \u003d 1 - arithmetic เฉลี่ย, z \u003d 0 เฉลี่ย geometric, z \u003d - 1 คือค่าเฉลี่ยฮาร์มอนิก, Z \u003d 2 เป็นกำลังสองเฉลี่ย)
อย่างไรก็ตามคำถามที่ต้องใช้สื่อประเภทใดในแต่ละกรณีที่ได้รับอนุญาตจากการวิเคราะห์เฉพาะของการรวมการศึกษา
ที่พบบ่อยที่สุดในสถิติประเภทของค่าเฉลี่ยคือ เลขคณิตกลาง. มีการคำนวณในกรณีที่มีการสร้างวอลุ่มของคุณสมบัติโดยเฉลี่ยเป็นผลรวมของค่าในแต่ละหน่วยของการรวมสถิติที่ศึกษา
ขึ้นอยู่กับลักษณะของข้อมูลต้นฉบับเลขคณิตเฉลี่ยจะถูกกำหนดในรูปแบบต่าง ๆ :
หากข้อมูลไม่ใช่เรื่องสำคัญการคำนวณจะดำเนินการโดยสูตรของขนาดกลางที่เรียบง่าย
การคำนวณเลขคณิตปานกลางในแถวที่ไม่ต่อเนื่องมาจากสูตร 3.4
การคำนวณเลขคณิตปานกลางในแถวช่วงเวลา ในชุดรูปแบบช่วงเวลาที่ตรงกลางของช่วงเวลาที่ได้รับการยอมรับในแต่ละกลุ่มค่าทางคณิตศาสตร์เฉลี่ยอาจแตกต่างจากค่าเฉลี่ยที่คำนวณจากข้อมูลที่ไม่สำคัญ ยิ่งไปกว่านั้นยิ่งมีขนาดเท่ากันของช่วงเวลาในกลุ่มเท่าใดการเบี่ยงเบนที่เป็นไปได้ของค่าเฉลี่ยที่คำนวณได้มากขึ้นจากข้อมูลที่จัดกลุ่มตามค่าเฉลี่ยที่คำนวณจากข้อมูลที่ไม่สำคัญ
เมื่อคำนวณค่าเฉลี่ยในซีรี่ส์ Varriational ช่วงเวลาเพื่อทำการคำนวณที่จำเป็นจากช่วงเวลาถึงสื่อกลางของพวกเขา จากนั้นคำนวณค่าเฉลี่ยตามสูตรของคณิตศาสตร์เฉลี่ยถ่วงน้ำหนัก
คุณสมบัติของเลขคณิตปานกลางเลขคณิตเฉลี่ยมีคุณสมบัติบางอย่างที่ช่วยให้คุณสามารถทำให้การคำนวณง่ายขึ้น
1. เลขคณิตเฉลี่ยของตัวเลขคงที่เท่ากับจำนวนคงที่นี้
ถ้า x \u003d a จากนั้น .
2. หากน้ำหนักตัวแปรทั้งหมดเป็นสัดส่วนที่จะเปลี่ยนแปลง I.e. เพิ่มหรือลดจำนวนครั้งเท่ากันจากนั้นแถวใหม่ทางคณิตศาสตร์เฉลี่ยจากนี้จะไม่เปลี่ยนแปลง
หากทุกคนมีน้ำหนักลดลงใน k ครั้งแล้ว .
3. ผลรวมของการเบี่ยงเบนบวกและลบของแต่ละตัวแปรจากค่าเฉลี่ยคูณด้วยน้ำหนักเป็นศูนย์, I.e.
ถ้าแล้ว จากที่นี่.
หากตัวเลือกทั้งหมดลดหรือเพิ่มขึ้นในจำนวนใด ๆ แถวใหม่ทางคณิตศาสตร์จะลดลงหรือเพิ่มขึ้นเหมือนกัน
ลดตัวเลือกทั้งหมด เอ็กซ์ บน ก.. เอ็กซ์´ = เอ็กซ์– .
จากนั้น
ชุดเริ่มต้นทางคณิตศาสตร์เฉลี่ยสามารถรับได้โดยการเพิ่มเป็นสื่อกลางที่ลดลงก่อนหน้านี้หักจากตัวเลือกตัวเลข ก.. .
5. หากตัวเลือกทั้งหมดลดหรือเพิ่มขึ้น เค. หนึ่งครั้งแถวใหม่ค่าเฉลี่ยเลขคณิตจะลดลงหรือเพิ่มจำนวนเท่ากัน I.E ใน เค. เวลา.
ปล่อยให้แล้ว .
จากที่นี่ I.e. ในการรับช่วงเริ่มต้นปานกลางแถวใหม่ค่าเฉลี่ยเลขคณิต (พร้อมตัวเลือกที่ลดลง) จะต้องเพิ่มขึ้น เค.เวลา.
ฮาร์มอนิกกลางฮาร์มอนิกโดยเฉลี่ยคือค่าของเลขคณิตกลาง มันถูกใช้เมื่อข้อมูลทางสถิติไม่มีความถี่ในหลาย ๆ ชนิดของจำนวนทั้งสิ้นและแสดงเป็นผลิตภัณฑ์ของพวกเขา (m \u003d xf) ค่าเฉลี่ยฮาร์มอนิกจะคำนวณโดยสูตร 3.5
การใช้งานจริงของฮาร์มอนิกกลาง - เพื่อคำนวณดัชนีบางอย่างโดยเฉพาะดัชนีราคา
เรขาคณิตปานกลางเมื่อใช้รูปทรงเรขาคณิตขนาดกลางค่าลักษณะส่วนบุคคลเป็นไปตามกฎค่าสัมพัทธ์ของลำโพงที่สร้างขึ้นในรูปแบบของค่าโซ่เป็นความสัมพันธ์กับระดับก่อนหน้าของแต่ละระดับในแถวของลำโพง ลักษณะเฉลี่ยดังนั้นค่าสัมประสิทธิ์การเติบโตเฉลี่ย
ค่าทางเรขาคณิตเฉลี่ยยังใช้เพื่อกำหนดค่าเท่ากับจากค่าการลงชื่อสูงสุดและต่ำสุด ตัวอย่างเช่น บริษัท ประกันภัยสรุปสัญญาสำหรับการให้บริการประกันภัยรถยนต์ ขึ้นอยู่กับเหตุการณ์ประกันที่เฉพาะเจาะจงการชำระเงินประกันอาจแตกต่างกันไปจาก $ 10,000 ถึง $ 100,000 ต่อปี จำนวนเงินเฉลี่ยของการชำระเงินประกันจะเป็นดอลลาร์
เรขาคณิตเฉลี่ยคือค่าที่ใช้เป็นค่าเฉลี่ยของความสัมพันธ์หรือในแถวของการกระจายที่นำเสนอในรูปแบบของความก้าวหน้าทางเรขาคณิตเมื่อ z \u003d 0 ค่าเฉลี่ยนี้มีความสะดวกในการใช้งานเมื่อมีการจ่ายความแตกต่างอย่างแน่นอน แต่มีความแตกต่างอย่างแน่นอน .
สูตรสำหรับการคำนวณดังต่อไปนี้
ที่ไหน - ตัวเลือกของเครื่องหมายเฉลี่ย; - ตัวเลือกการทำงาน f.- ตัวเลือกความถี่
เรขาคณิตเฉลี่ยใช้ในการคำนวณอัตราการเติบโตเฉลี่ยต่อปี
กำลังสองปอดร์สูตรของการเลี้ยงกำลังสองโดยเฉลี่ยใช้เพื่อวัดระดับของจำนวนของค่าของแต่ละค่าของแอตทริบิวต์รอบ ๆ เลขคณิตเฉลี่ยในแถวของการกระจาย ดังนั้นเมื่อคำนวณตัวบ่งชี้การเปลี่ยนแปลงค่าเฉลี่ยจะคำนวณจากกำลังสองของค่าเบี่ยงเบนของค่าแต่ละค่าของคุณลักษณะจากค่าเลขคณิตกลาง
ค่ากำลังสองเฉลี่ยคำนวณโดยสูตร
ในการศึกษาทางเศรษฐกิจการเลี้ยงกำลังสองโดยเฉลี่ยในรูปแบบการดัดแปลงนั้นใช้กันอย่างแพร่หลายเมื่อคำนวณตัวบ่งชี้ของการจำแนกลักษณะของคุณสมบัติเช่นการกระจายตัวเฉลี่ยการเบี่ยงเบนเฉลี่ยกำลังสอง
กฎขั้นสูง ระหว่างค่าเฉลี่ยที่ทรงพลังมีการพึ่งพาต่อไปนี้ - ตัวบ่งชี้มากขึ้นค่าเฉลี่ยค่าเฉลี่ยตาราง 1.4:
ตารางที่ 5.4
อัตราส่วนระหว่างค่าเฉลี่ย
ค่า z |
||||
อัตราส่วนระหว่างสื่อ |
อัตราส่วนนี้เรียกว่ากฎของเสียงข้างมาก
ค่าเฉลี่ยโครงสร้างตัวบ่งชี้พิเศษใช้เพื่อกำหนดลักษณะโครงสร้างของชุดซึ่งสามารถเรียกว่าค่าเฉลี่ยของโครงสร้าง ตัวชี้วัดดังกล่าวรวมถึงแฟชั่นค่ามัธยฐานควอไทล์และ Desil
แฟชั่น. Moda (MO) เรียกว่าความหมายที่พบบ่อยที่สุดของการลงชื่อเข้าใช้หน่วยรวม แฟชั่นเรียกว่ามูลค่าของคุณสมบัติที่สอดคล้องกับจุดสูงสุดของเส้นโค้งการกระจายทางทฤษฎี
แฟชั่นใช้กันอย่างแพร่หลายในการปฏิบัติงานเชิงพาณิชย์เมื่อศึกษาความต้องการของลูกค้า (เมื่อพิจารณาขนาดของเสื้อผ้าและรองเท้าที่อยู่ในความต้องการทั่วไป) การลงทะเบียนราคา mod ในการรวมสามารถเป็นได้หลายอย่าง
การคำนวณแฟชั่นในแถวที่ไม่ต่อเนื่อง ในแถวที่ไม่ต่อเนื่องของแฟชั่นเป็นตัวเลือกที่มีความถี่สูงสุด ลองค้นหาแฟชั่นในแถวที่ไม่ต่อเนื่อง
การคำนวณแฟชั่นในแถวช่วงเวลา ในแถว Varriational ช่วงเวลา Modal จะถือว่าประมาณ I.e ของช่วงเวลานั้นที่มีความถี่ที่ยิ่งใหญ่ที่สุด (ความถี่) ภายในช่วงเวลามีความจำเป็นต้องค้นหาค่าของสัญญาณที่เป็นแฟชั่น สำหรับชุดช่วงเวลาของแฟชั่นจะถูกกำหนดโดยสูตร
ขีด จำกัด ล่างของช่วงเวลาที่ต่ำกว่าอยู่ที่ไหน - ขนาดของช่วงเวลากิริยา; - ความถี่ที่สอดคล้องกับช่วง modal; - ความถี่ก่อนช่วงเวลากิริยา; - ความถี่ของช่วงเวลาต่อไปนี้ modal
ค่ามัธยฐานค่ามัธยฐาน () เรียกว่าความหมายของหน่วยกลางของชุดอันดับ แถวอันดับหนึ่งคือชุดที่มีการบันทึกสัญญาณในลำดับจากน้อยไปมากหรือลำดับจากมากไปน้อย หรือค่ามัธยฐานคือค่าที่แบ่งจำนวนชุดรูปแบบที่สั่งซื้อเป็นสองส่วนเท่า ๆ กัน: ส่วนหนึ่งมีค่าของคุณสมบัติที่แตกต่างกันน้อยกว่าตัวเลือกเฉลี่ยและอื่น ๆ มีขนาดใหญ่
เพื่อค้นหาค่ามัธยฐานหมายเลขลำดับจะถูกกำหนดก่อน สำหรับสิ่งนี้มีจำนวนหน่วยคี่ต่อผลรวมของความถี่ทั้งหมดหน่วยจะถูกเพิ่มและทุกอย่างแบ่งออกเป็นสอง ที่จำนวนคู่หน่วยของค่ามัธยฐานจะพบเป็นค่าของการลงชื่อเข้าใช้หมายเลขลำดับที่กำหนดโดยจำนวนความถี่ทั้งหมดหารด้วยสอง การรู้หมายเลขลำดับของค่ามัธยฐานได้อย่างง่ายดายที่ความถี่สะสมเพื่อค้นหาความหมายของมัน
การคำนวณค่ามัธยฐานในแถวที่ไม่ต่อเนื่องตามการตรวจสอบการเลือกข้อมูลเกี่ยวกับการกระจายของครอบครัวในจำนวนเด็กตาราง 5.5 เพื่อกำหนดค่ามัธยฐานก่อนกำหนดหมายเลขลำดับ
=
จากนั้นเราจะสร้างความถี่สะสมจำนวนมาก (ตามลำดับหมายเลขและความถี่สะสมเราจะพบค่ามัธยฐานความถี่สะสม 33 แสดงให้เห็นว่าใน 33 ครอบครัวจำนวนเด็กไม่เกิน 1 ลูก แต่ตั้งแต่หมายเลข 50 ค่ามัธยฐาน จะอยู่ในช่วงเวลาจาก 34 ถึง 55 ครอบครัว
ตารางที่ 5.5
การกระจายของจำนวนครอบครัวจากจำนวนเด็ก
จำนวนเด็กในครอบครัว |
จำนวนครอบครัวขยายช่วงมัธยฐาน รูปแบบที่พิจารณาทั้งหมดของพลังงานเฉลี่ยมีคุณสมบัติที่สำคัญ (ตรงกันข้ามกับค่าเฉลี่ยโครงสร้าง) - ในสูตรสำหรับการกำหนดค่าเฉลี่ยรวมถึงค่าทั้งหมดของซีรีส์เช่น ขนาดของค่าเฉลี่ยได้รับอิทธิพลจากมูลค่าของแต่ละตัวเลือก ในมือข้างหนึ่งนี่เป็นทรัพย์สินที่เป็นบวกมาก ในกรณีนี้การกระทำของเหตุผลทั้งหมดที่จะส่งผลกระทบต่อทุกหน่วยของการรวมทั่วไปที่นำมาพิจารณา ในทางกลับกันแม้แต่การสังเกตครั้งเดียวที่ตกลงไปในข้อมูลเริ่มต้นจะสุ่มแบบสุ่มสามารถบิดเบือนความคิดของระดับการพัฒนาของคุณลักษณะที่ศึกษาในการรวมกันภายใต้การพิจารณา (โดยเฉพาะในระดับสั้น) ไตรมาสและมลรัฐโดยการเปรียบเทียบกับการค้นหาค่ามัธยฐานในชุดรูปแบบที่หลากหลายคุณสามารถค้นหาคุณค่าของคุณสมบัติใด ๆ ตามลำดับของหน่วยของชุดอันดับ โดยเฉพาะอย่างยิ่งคุณสามารถค้นหาค่าลักษณะในหน่วยที่แบ่งแถวออกเป็น 4 ส่วนเท่า ๆ กันโดย 10 ฯลฯ ไตรมาส ตัวเลือกที่แบ่งแถวที่จัดอันดับออกเป็นสี่ส่วนเท่า ๆ กันเรียกว่าไตรมาส ในเวลาเดียวกันแยกความแตกต่าง: สี่อันต่ำกว่า (หรือครั้งแรก) สี่ (Q1) เป็นค่าของการลงชื่อในหน่วยของชุดของการจัดอันดับการแบ่งส่วนผสมในอัตราส่วนของ¼ถึง¾และควอไทล์ (หรือสาม) บน (หรือสาม) ) - ค่าของการลงชื่อเข้าใช้หน่วยของซีรีย์อันดับการแบ่งจำนวนทั้งสิ้นในอัตราส่วน¾ถึง¼ ไตรมาสที่สองมีค่ามัธยฐาน Q2 \u003d ฉัน ไตรมาสที่ต่ำกว่าและบนในแถวช่วงถูกคำนวณโดยสูตรคล้ายกับค่ามัธยฐาน อยู่ที่ไหนขอบเขตล่างของช่วงเวลาที่มีไตรมาสที่ต่ำกว่าและส่วนบนตามลำดับ - ความถี่สะสมของช่วงเวลาก่อนหน้าช่วงเวลาที่มีควอไทล์ล่างหรือบน; - ความถี่ของช่วงเวลาควอไทล์ (ล่างและด้านบน) ช่วงเวลาที่มี Q1 และ Q3 กำหนดโดยความถี่สะสม (หรือโดยทั่วไป) มลรัฐ นอกเหนือไปจากไตรมาสแล้วใบแล้วคำนวณ - ตัวเลือกการแบ่งแถวที่อยู่ในอันดับที่สองเท่ากัน พวกเขาถูกแสดงโดย D Decil D1 แรกแบ่งจำนวนในอัตราส่วน 1/10 และ 9/10, D2 - 2/10 และ 8/10 เป็นต้น พวกเขาคำนวณโดยโครงการเดียวกันกับค่ามัธยฐานและควอไทล์ ทั้งมัธยฐานและไตรมาสและปั่นป่วนเป็นของสถิติลำดับที่เรียกว่าซึ่งพวกเขาเข้าใจว่าตัวเลือกที่ครอบครองลำดับที่แน่นอนในแถวที่ติดอันดับ |
การแต่งตั้งให้บริการ. ด้วยความช่วยเหลือของเครื่องคิดเลขออนไลน์คุณสามารถ:
- สร้างชุดรูปแบบสร้างฮิสโตแกรมและหลุมฝังกลบ;
- ค้นหาตัวบ่งชี้การเปลี่ยนแปลง (กลางแฟชั่น (รวมถึงและกราฟิก), ค่ามัธยฐาน, ขอบเขตของการเปลี่ยนแปลง, ควอไทล์, การลดปริมาณสัมประสิทธิ์การรักษาความแตกต่างอัตราส่วนการเปลี่ยนแปลงและตัวบ่งชี้อื่น ๆ );
คำแนะนำ. ในการจัดกลุ่มหมายเลขที่จำเป็นในการเลือกประเภทของช่วงรูปแบบ (ไม่ต่อเนื่องหรือช่วงเวลา) และระบุจำนวนข้อมูล (จำนวนสตริง) โซลูชันที่ได้จะถูกบันทึกไว้ในไฟล์ Word (ดูตัวอย่างของข้อมูลสถิติการจัดกลุ่ม)
หากการจัดกลุ่มถูกนำไปใช้แล้วและตั้งค่าแล้ว รูปแบบที่ไม่ต่อเนื่อง หรือ ช่วงเวลาคุณต้องใช้ตัวบ่งชี้รูปแบบเครื่องคิดเลขออนไลน์ ตรวจสอบสมมติฐานเกี่ยวกับรูปแบบของการกระจาย มันดำเนินการโดยใช้การศึกษาแบบฟอร์มการกระจาย
ประเภทของกลุ่มสถิติ
ชุดรูปแบบ. ในกรณีของการสังเกตของตัวแปรสุ่มแบบแยกส่วนหนึ่งและค่าเดียวกันสามารถพบได้หลายครั้ง ค่าดังกล่าวของ X i ของความแปรปรวนแบบสุ่มจะถูกบันทึกด้วยตัวบ่งชี้ของ n i ของจำนวนที่ปรากฏในการสังเกต n นี่คือความถี่ของค่านี้ในกรณีของตัวแปรสุ่มอย่างต่อเนื่องในทางปฏิบัติจะใช้การจัดกลุ่ม
- การจัดกลุ่มประเภท - นี่คือการแบ่งแยกของจำนวนทั้งสิ้นที่แตกต่างกันการศึกษาของชั้นเรียนประเภททางเศรษฐกิจและสังคมกลุ่มหน่วยที่เป็นเนื้อเดียวกัน ในการสร้างกลุ่มนี้ให้ใช้พารามิเตอร์ชุดรูปแบบที่ไม่ต่อเนื่อง
- โครงสร้างเรียกว่าการจัดกลุ่มในกรณีที่การแยกการรวมกันเป็นเนื้อเดียวกันกับกลุ่มที่มีลักษณะโครงสร้างตามคุณสมบัติที่แตกต่างกัน ในการสร้างกลุ่มนี้ให้ใช้พารามิเตอร์แถวช่วง
- การจัดกลุ่มเผยให้เห็นความสัมพันธ์ระหว่างปรากฏการณ์ศึกษาและสัญญาณของพวกเขาเรียกว่า การจัดกลุ่มการวิเคราะห์ (ดูการจัดกลุ่มการวิเคราะห์ของตัวเลข)
ตัวอย่างหมายเลข 1 ตามตารางที่ 2 สร้างแถวของการจัดจำหน่ายมากกว่า 40 ธนาคารพาณิชย์ของสหพันธรัฐรัสเซีย ตามแถวการกระจายที่ได้รับกำหนด: รายได้โดยเฉลี่ยสำหรับธนาคารพาณิชย์แห่งหนึ่งการลงทุนสินเชื่อโดยเฉลี่ยสำหรับธนาคารพาณิชย์หนึ่งรายความนิยมและค่ามัธยฐานของผลกำไร ควอไทล์, deciles, ขอบเขตของการเปลี่ยนแปลง, ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย, ค่าเบี่ยงเบนกำลังเฉลี่ยกำลังสอง, ค่าสัมประสิทธิ์ของการเปลี่ยนแปลง
การตัดสินใจ:
ในบท "ประเภทของชุดสถิติ" เลือกแถวที่ไม่ต่อเนื่อง คลิกแทรกจาก Excel จำนวนกลุ่ม: ตามสูตร Stargessa
หลักการของกลุ่มสถิติการสร้าง
จำนวนการสังเกตการสั่งซื้อจากน้อยไปมากเรียกว่าการแปรปรวน. สัญญาณการจัดกลุ่ม สัญลักษณ์เรียกว่าการแบ่งย่อยของจำนวนทั้งสิ้นสำหรับแต่ละกลุ่ม มันเรียกว่าพื้นฐานของการจัดกลุ่ม ในฐานของการจัดกลุ่มทั้งสัญญาณเชิงปริมาณและเชิงคุณภาพสามารถวางได้หลังจากพิจารณาพื้นฐานของการจัดกลุ่มแล้วควรได้รับการแก้ไขเกี่ยวกับจำนวนกลุ่มที่การทดสอบการเผาไหม้ควรจะแตกหัก
เมื่อใช้คอมพิวเตอร์ส่วนบุคคลสำหรับการประมวลผลข้อมูลสถิติการจัดกลุ่มของวัตถุวัตถุจะถูกสร้างขึ้นตามขั้นตอนมาตรฐาน
หนึ่งในขั้นตอนเหล่านี้ขึ้นอยู่กับการใช้สูตร Sturges เพื่อกำหนดจำนวนกลุ่มที่ดีที่สุด:
k \u003d 1 + 3,322 * LG (N)
โดยที่ K คือจำนวนของกลุ่ม N คือจำนวนหน่วยของการรวม
ความยาวของช่วงเวลาบางส่วนคำนวณเป็น h \u003d (x สูงสุด -x นาที) / k
จากนั้นคำนวณจำนวนการสังเกตในช่วงเวลาเหล่านี้ซึ่งใช้เป็นความถี่ n i ความถี่เล็ก ๆ ที่มีค่าน้อยกว่า 5 (n ฉัน< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
เป็นค่าใหม่ตัวเลือกจะถูกถ่ายโดยตรงกลางของ x i \u003d (c i - 1 + c i) / 2 ช่วงเวลา
ตัวอย่างหมายเลข 3 อันเป็นผลมาจากตัวอย่างสุ่มตัวอย่าง 5% การกระจายสินค้าความชื้นต่อไปนี้ คำนวณ: 1) เปอร์เซ็นต์เฉลี่ยของความชื้น; 2) ตัวบ่งชี้ลักษณะการเปลี่ยนแปลงของความชื้น
ได้รับสารละลายโดยใช้เครื่องคิดเลข: ตัวอย่างหมายเลข 1
สร้างชุดที่หลากหลาย ตามแถวที่พบสร้างรูปหลายเหลี่ยมการกระจายฮิสโตแกรมสะสม กำหนดแฟชั่นและค่ามัธยฐาน
การตัดสินใจดาวน์โหลด
ตัวอย่าง. ตามผลลัพธ์ของการสังเกตตัวอย่าง (ตัวอย่างและแอปพลิเคชัน):
a) ทำชุดรูปแบบที่หลากหลาย
b) คำนวณความถี่สัมพัทธ์และความถี่สัมพัทธ์สะสม;
c) สร้างหลุมฝังกลบ;
d) ประกอบไปด้วยฟังก์ชั่นการกระจายเชิงประจักษ์
e) สร้างกราฟของฟังก์ชั่นการกระจายเชิงประจักษ์
e) คำนวณลักษณะตัวเลข: ค่าเฉลี่ยทางคณิตศาสตร์การกระจายตัวเบี่ยงเบนสองกำลังสอง การตัดสินใจ
ขึ้นอยู่กับข้อมูลที่กำหนดในตารางที่ 4 (ภาคผนวก 1) และตัวเลือกที่สอดคล้องกับของคุณให้ดำเนินการ:
- ขึ้นอยู่กับการจัดกลุ่มโครงสร้างเราสร้างความถี่ที่หลากหลายและแถวสะสมของการกระจายโดยใช้ช่วงเวลาปิดที่เท่ากันโดยการรับจำนวนกลุ่มถึง 6. ผลลัพธ์ที่จะส่งในรูปแบบของตารางและภาพวาดกราฟิก
- วิเคราะห์ช่วงการกระจายแบบแปรผันจากการคำนวณ:
- ค่าเลขคณิตเฉลี่ยของคุณลักษณะ;
- แฟชั่น, มัธยฐาน, ควอลิส 1st, 1 และ 9 decil;
- เบี่ยงเบนสองกำลังสอง;
- สัมประสิทธิ์การเปลี่ยนแปลง
- สรุปการสรุป
ต้องใช้: แท่งช่วงสร้างช่วงการกระจายช่วงเวลาคำนวณค่าเฉลี่ยจำนวนเฉลี่ยแฟชั่นและค่ามัธยฐานสำหรับแถวที่จัดอันดับและช่วงเวลา
ขึ้นอยู่กับข้อมูลแหล่งที่มาเพื่อสร้างชุดรูปแบบที่ไม่ต่อเนื่อง ส่งในรูปแบบของตารางสถิติและกราฟสถิติ 2) ขึ้นอยู่กับข้อมูลต้นฉบับในการสร้างชุดรูปแบบช่วงเวลาที่มีช่วงเวลาเท่ากัน จำนวนช่วงเวลาที่เลือกอย่างอิสระและอธิบายตัวเลือกนี้ เป็นตัวแทนชุดรูปแบบที่ได้รับในรูปแบบของตารางสถิติและกราฟสถิติ ระบุประเภทของตารางและกราฟที่ใช้
เพื่อกำหนดระยะเวลาการบริการลูกค้าโดยเฉลี่ยในกองทุนบำเหน็จบำนาญจำนวนลูกค้าที่มีขนาดใหญ่มาก 100 ลูกค้าถูกตรวจสอบตามรูปแบบของตัวอย่างที่ไม่ได้ตั้งใจแบบสุ่ม ผลการสำรวจจะถูกนำเสนอในตาราง การค้นหา:
a) พรมแดนที่เวลาการให้บริการโดยเฉลี่ยของลูกค้าทั้งหมดของกองทุนบำเหน็จบำนาญได้ข้อสรุปถึงความน่าจะเป็น 0.9946;
b) ความน่าจะเป็นที่ส่วนแบ่งของลูกค้าทั้งหมดของกองทุนที่มีระยะเวลาการให้บริการน้อยกว่า 6 นาทีแตกต่างจากส่วนแบ่งของลูกค้าดังกล่าวในตัวอย่างไม่เกิน 10% (โดยค่าสัมบูรณ์);
c) ปริมาณของตัวอย่างอีกครั้งซึ่งความน่าจะเป็นที่ 0.9907 สามารถเป็นที่ถกเถียงกันอยู่ว่าส่วนแบ่งของลูกค้าทั้งหมดของมูลนิธิที่มีระยะเวลาการให้บริการน้อยกว่า 6 นาทีแตกต่างจากส่วนแบ่งของลูกค้าดังกล่าวในตัวอย่างไม่เกิน 10% (โดยค่าสัมบูรณ์)
2. ตามปัญหา 1 โดยใช้ X 2 เกณฑ์เพียร์สันที่ระดับความสำคัญα \u003d 0.05 ตรวจสอบสมมติฐานว่าจำนวนสุ่ม x เป็นเวลาการบริการลูกค้าที่แจกจ่ายตามกฎหมายปกติ สร้างภาพวาดฮิสโตแกรมของการกระจายเชิงประจักษ์และเส้นโค้งปกติที่สอดคล้องกัน
การตัดสินใจดาวน์โหลด
Dana ตัวอย่างจาก 100 องค์ประกอบ ความต้องการ:
- สร้างชุดรูปแบบการจัดอันดับ
- ค้นหาสมาชิกสูงสุดและขั้นต่ำของแถว
- ค้นหาขอบเขตของความแปรปรวนและจำนวนช่วงเวลาที่เหมาะสมสำหรับการก่อสร้างแถวช่วงเวลา ค้นหาความยาวของช่วงช่วงเวลา;
- สร้างแถวช่วงเวลา ค้นหาความถี่ขององค์ประกอบการสุ่มตัวอย่างในช่วงที่ดูดซึม ค้นหาจุดปานกลางของแต่ละช่องว่าง;
- สร้างฮิสโตแกรมและความถี่หลายเหลี่ยม เปรียบเทียบกับการกระจายปกติ (วิเคราะห์และกราฟิก);
- สร้างกราฟของฟังก์ชั่นการกระจายเชิงประจักษ์
- คำนวณลักษณะตัวเลขที่เลือก: ช่วงเวลาที่เลือกกลางและกลางเลือก;
- คำนวณค่าโดยประมาณของการเบี่ยงเบนกำลังสองโดยเฉลี่ยความไม่สมดุลและส่วนเกิน (ใช้แพ็คเกจการวิเคราะห์ MS Excel) เปรียบเทียบค่าการคำนวณโดยประมาณด้วยความแม่นยำ (คำนวณโดยใช้สูตร MS Excel);
- เปรียบเทียบลักษณะกราฟิกที่เลือกได้ด้วยทฤษฎีที่เหมาะสม
มีข้อมูลตัวอย่างต่อไปนี้ (ตัวอย่าง 10%, เครื่องจักรกล) ในการผลิตผลิตภัณฑ์และจำนวนกำไรล้านรูเบิล ตามข้อมูลแหล่งที่มา:
ภารกิจ 13.1
13.1.1 สร้างจำนวนสถิติของการกระจายของผู้ประกอบการเหนือจำนวนกำไรโดยการขึ้นรูปห้ากลุ่มด้วยช่วงเวลาที่เท่ากัน สร้างกราฟิกของการกระจายจำนวนมาก
13.1.2 คำนวณลักษณะเชิงตัวเลขของจำนวนการกระจายขององค์กรในจำนวนกำไร: เลขคณิตเฉลี่ยส่วนเบี่ยงเบนกำลังสองการกระจายตัว, ค่าสัมประสิทธิ์การเปลี่ยนแปลง v. ทำให้ข้อสรุป
ภารกิจ 13.2
13.2.1 กำหนดขอบเขตที่จำนวนขององค์กรหนึ่งในการรวมทั่วไปนั้นล้อมรอบด้วยความน่าจะเป็น 0.997
13.2.2 การใช้ X2-criterion ของเพียร์สันที่ระดับความสำคัญαตรวจสอบสมมติฐานว่าค่าสุ่ม x คือจำนวนกำไร - แจกจ่ายตามกฎหมายปกติ
ภารกิจ 13.3
13.3.1 กำหนดค่าสัมประสิทธิ์ของสมการการถดถอยแบบเลือก
13.3.2 กำหนดสถานะและลักษณะของความสัมพันธ์ระหว่างต้นทุนของผลิตภัณฑ์ที่ผลิต (x) และจำนวนกำไรต่อองค์กร (Y) สร้างแผนภาพการกระเจิงและสายการถดถอย
13.3.3 คำนวณสัมประสิทธิ์สหสัมพันธ์เชิงเส้น การใช้ T-criterion ของนักเรียนตรวจสอบความสำคัญของสัมประสิทธิ์สหสัมพันธ์ รับบทสรุปเกี่ยวกับความหนาแน่นระหว่างปัจจัย X และ Y โดยใช้ Chedocheus
แนวทาง. งาน 13.3 ดำเนินการโดยใช้บริการนี้
การตัดสินใจดาวน์โหลด
งาน. ข้อมูลต่อไปนี้เป็นค่าใช้จ่ายของเวลาของลูกค้าในการสรุปสัญญา สร้างชุดรูปแบบต่าง ๆ ของข้อมูลที่นำเสนอฮิสโตแกรมเพื่อค้นหาการประเมินที่ไม่สอดคล้องกันของความคาดหวังทางคณิตศาสตร์ชดเชยและการประเมินที่ไม่กระจายของการกระจายตัวของการกระจายตัว
ตัวอย่าง. ตามตารางที่ 2:
1) สร้างแถวของการกระจายของ 40 ธนาคารพาณิชย์ของสหพันธรัฐรัสเซีย:
a) กำไรที่ใหญ่ที่สุด;
b) การลงทุนสินเชื่อที่ใหญ่ที่สุด
2) สำหรับแถวการกระจายที่เกิดขึ้นกำหนด:
ก) กำไรโดยเฉลี่ยสำหรับธนาคารพาณิชย์แห่งหนึ่ง
b) การลงทุนสินเชื่อเฉลี่ยสำหรับธนาคารพาณิชย์แห่งหนึ่ง
c) มูลค่ากำไร Modal and Median; ควอไทล์, Desil;
d) มูลค่า Modal and Median ของการลงทุนสินเชื่อ
3) คำนวณ: คำนวณ:
a) รูปแบบการเปลี่ยนแปลง;
b) ค่าเบี่ยงเบนเชิงเส้นโดยเฉลี่ย;
c) เบี่ยงเบนกำลังสองกำลังสอง;
d) ค่าสัมประสิทธิ์การเปลี่ยนแปลง
การคำนวณที่จำเป็นในรูปแบบตาราง วิเคราะห์ผลลัพธ์ ทำข้อสรุป
สร้างกราฟิกของแถวการกระจายที่เกิดขึ้น นิยามแบบกราฟิกแฟชั่นและค่ามัธยฐาน
การตัดสินใจ:
ในการสร้างการจัดกลุ่มด้วยช่วงเวลาที่เท่ากันเราใช้ข้อมูลสถิติการจัดกลุ่มบริการ
รูปที่ 1 - ป้อนพารามิเตอร์
คำอธิบายของพารามิเตอร์จำนวนบรรทัด: จำนวนข้อมูลแหล่งข้อมูล หากมิติของแถวมีขนาดเล็กให้ระบุจำนวนของมัน หากตัวอย่างค่อนข้างยอดเยี่ยมจากนั้นคลิกปุ่มแทรก Excel
จำนวนกลุ่ม: 0 - จำนวนกลุ่มจะถูกกำหนดโดยสูตรของ Stargess
หากมีการระบุจำนวนกลุ่มที่เฉพาะเจาะจงให้ระบุ (ตัวอย่างเช่น 5)
มุมมองของแถว: แถวที่ไม่ต่อเนื่อง
ระดับนัยสำคัญ: ตัวอย่างเช่น 0.954 พารามิเตอร์นี้ถูกตั้งค่าเพื่อกำหนดช่วงเวลาที่เป็นความลับของค่าเฉลี่ย
ตัวอย่าง: ตัวอย่างเช่นตัวอย่างเครื่องกล 10% ถูกดำเนินการ ระบุหมายเลข 10 สำหรับข้อมูลของเราเราระบุ 100
กลุ่มตัวเลขรวมกันโดยสัญลักษณ์ใด ๆ เรียกว่า รวม
ดังที่ระบุไว้ข้างต้นวัสดุกีฬาทางสถิติหลักเป็นกลุ่มของตัวเลขที่กระจัดกระจายที่ไม่ให้โค้ชของความคิดเกี่ยวกับสาระสำคัญของปรากฏการณ์หรือกระบวนการ งานคือการเปลี่ยนจำนวนทั้งสิ้นนี้ให้กับระบบและใช้กับตัวบ่งชี้เพื่อให้ได้ข้อมูลที่จำเป็น
การเตรียมชุดรูปแบบการเปลี่ยนแปลงนั้นเป็นการก่อตัวของคณิตศาสตร์บางอย่างอย่างแม่นยำ
ตัวอย่างที่ 2 ใน 34 นักกีฬาของนักเล่นสกีได้รับการลงทะเบียนเวลาการกู้คืนชีพจรหลังจากผ่านระยะทาง (เป็นวินาที):
81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;
85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;
ดังที่สามารถมองเห็นได้ตัวเลขกลุ่มนี้ไม่ได้รับข้อมูลใด ๆ
สำหรับการเตรียมการของจำนวนความแปรปรวนการดำเนินงานผลิตครั้งแรก การจัดอันดับ - ตำแหน่งของตัวเลขอยู่ในลำดับจากน้อยไปมากหรือน้อยลง ตัวอย่างเช่นในลำดับจากน้อยไปหามากการจัดอันดับนำไปสู่สิ่งต่อไปนี้;
78; 78; 78; 78; 78; 78;
81; 81; 81; 81; 81; 81; 81; 81; 81;
84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;
ในการสั่งซื้อจากมากไปน้อยการจัดอันดับนำไปสู่กลุ่มของตัวเลขดังกล่าว:
84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;
81; 81; 81; 81; 8!; 81: 81; 81; 81;
78; 78; 78; 78; 78; 78;
หลังจากการจัดอันดับรูปแบบที่ไม่มีเหตุผลของการบันทึกจำนวนตัวเลขและตัวเลขเดียวกันกำลังกลายเป็นหมายเลขเดียวกันซ้ำหลายครั้ง ดังนั้นความคิดตามธรรมชาติจึงเกิดขึ้นเพื่อแปลงการบันทึกในลักษณะดังกล่าวเพื่อระบุหมายเลขใดที่ซ้ำหลายครั้ง ตัวอย่างเช่นการพิจารณาการจัดอันดับในลำดับจากน้อยไปมาก:
ที่นี่จำนวนจะถูกบันทึกโดยหมายเลขที่ระบุเวลาการกู้คืนของพัลส์ของนักกีฬาไปทางขวาของการทำซ้ำของประจักษ์พยานนี้ในกลุ่มนักกีฬา 34 คนนี้
ตามแนวคิดดังกล่าวเกี่ยวกับสัญลักษณ์ทางคณิตศาสตร์กลุ่มการวัดที่ถือว่าจะกำหนดตัวอักษรใด ๆ เช่น x รับลำดับที่เพิ่มขึ้นของตัวเลขในกลุ่มนี้: x 1 -74 c; x 2 - 78 s; x 3 - 81 s; x 4 - 84 s; x 5 - 85 s; x 6 n - 90 s, แต่ละหมายเลขถือว่าสามารถกำหนดได้โดยสัญลักษณ์ x i
แสดงจำนวนการทำซ้ำของการวัดที่พิจารณาของตัวอักษร n จากนั้น:
n 1 \u003d 4; n 2 \u003d 6; n 3 \u003d 9; n 4 \u003d 11; n 5 \u003d 3; n 6 \u003d n n \u003d 1 และแต่ละจำนวนการทำซ้ำสามารถแสดงเป็น n i
จำนวนการวัดทั้งหมดที่ดำเนินการดังต่อไปนี้จากสภาพของตัวอย่างคือ 34 ซึ่งหมายความว่าผลรวมของทั้งหมด n เท่ากับ 34 หรือในการแสดงออกเชิงสัญลักษณ์:
แสดงจำนวนนี้ด้วยตัวอักษรหนึ่งตัว - n จากนั้นข้อมูลเริ่มต้นของตัวอย่างภายใต้การพิจารณาสามารถบันทึกในแบบฟอร์มนี้ (ตารางที่ 1)
กลุ่มของตัวเลขที่เกิดขึ้นคือชุดประจักษ์พยานที่มีการเปลี่ยนแปลงที่กระจัดกระจายที่ได้รับจากโค้ชที่จุดเริ่มต้นของการทำงาน
ตารางที่ 1
x I. | n ฉัน |
n \u003d 34 |
กลุ่มดังกล่าวเป็นระบบเฉพาะที่พารามิเตอร์อธิบายลักษณะการวัดที่ดำเนินการ ตัวเลขที่แสดงถึงการเรียกการวัด (x i) ตัวเลือก; น. I - จำนวนการทำซ้ำของพวกเขา - เรียกว่า ความถี่; N - ผลรวมของความถี่ทั้งหมด - ที่นั่น ปริมาตรของจำนวนทั้งสิ้น
ระบบที่ได้รับทั้งหมดเรียกว่า ความแปรปรวนอยู่ใกล้ บางครั้งแถวเหล่านี้เรียกว่าเชิงประจักษ์หรือสถิติ
มันเป็นเรื่องง่ายที่จะสังเกตเห็นว่ามีบางกรณีของชุดรูปแบบที่เป็นไปได้เมื่อความถี่ทั้งหมดเท่ากับหนึ่ง n i \u003d\u003d 1 นั่นคือการวัดแต่ละครั้งในกลุ่มนี้พบเพียงครั้งเดียว
ชุดรูปแบบที่เป็นผลลัพธ์เช่นอื่น ๆ สามารถแสดงกราฟิกได้ ในการสร้างกราฟของซีรีย์ที่เกิดขึ้นคุณต้องก่อนอื่นให้อยู่ในระดับบนแกนแนวนอนและแนวตั้ง
ในภารกิจนี้บนแกนแนวนอนเราจะฝากเวลาการกู้คืนชีพจร (x 1) ในลักษณะที่ความยาวของความยาวที่การเลือกตั้งตามอำเภอใจสอดคล้องกับค่าหนึ่งวินาที มันจะเริ่มเลื่อนค่าเหล่านี้จาก 70 วินาทีการถอยตามอัตภาพจากจุดตัดของสองแกน 0
บนแกนแนวตั้งเลื่อนค่าของความถี่ของแถวของเรา (n i) การสเกล: หน่วยความยาวเท่ากับหน่วยของความถี่
เตรียมเงื่อนไขสำหรับการสร้างตารางให้ดำเนินการกับการเปลี่ยนแปลงที่ได้รับ
คู่แรกของตัวเลข x 1 \u003d 74, n 1 \u003d 4 ถูกนำไปใช้กับแผนภูมิเช่นนี้: บนแกน x; เราพบ x 1 =74 และเราฟื้นฟูเส้นตั้งฉากจากจุดนี้บนแกน N เราพบ n 1 \u003d 4 และดำเนินการเส้นแนวนอนจากจุดตัดด้วยการตั้งฉากที่เรียกคืน ทั้งแนวตั้งแนวตั้งและแนวนอนเป็นเส้นเสริมและจึงนำไปใช้กับภาพวาดของเส้นประ จุดตัดของพวกเขาคืออัตราส่วน X 1 \u003d 74 และ N 1 \u003d 4 ในระดับของกราฟนี้
ในทำนองเดียวกันประเด็นอื่น ๆ ของตารางทั้งหมดจะถูกนำไปใช้ จากนั้นพวกเขาก็เชื่อมต่อกันโดยส่วนของเส้นตรง เพื่อให้มีการปิดตารางเวลาปิดจุดสุดขั้วเชื่อมต่อเซ็กเมนต์ที่มีจุดที่อยู่ติดกันของแกนแนวนอน
ตัวเลขที่เกิดขึ้นคือกราฟของซีรี่ส์ชุดรูปแบบของเรา (รูปที่ 1)
เป็นที่ชัดเจนว่าแต่ละชุดรูปแบบแต่ละชุดดูเหมือนจะเป็นตารางของตัวเอง
รูปที่. 1. การแสดงกราฟิกของชุดรูปแบบที่หลากหลาย
ในรูปที่ 1 แสดง:
1) จากการสำรวจมากที่สุดกลุ่มที่ใหญ่ที่สุดคิดเป็นนักกีฬาเวลาการฟื้นตัวของชีพจรซึ่ง 84 S;
2) หลายครั้งนี้คือ 81 วินาที;
3) กลุ่มที่เล็กที่สุดคือนักกีฬาที่มีเวลาฟื้นตัวของชีพจรขนาดเล็ก - 74 S และใหญ่ - 90 วินาที
ดังนั้นโดยการดำเนินการทดสอบชุดตัวเลขที่ได้รับควรจัดอันดับและวาดชุดรูปแบบที่หลากหลายซึ่งเป็นระบบทางคณิตศาสตร์ที่เฉพาะเจาะจง เพื่อความชัดเจนชุดรูปแบบสามารถแสดงได้ตามกำหนดเวลา
ช่วงการเปลี่ยนแปลงข้างต้นเรียกว่า ไม่ต่อเนื่องกัน ถัดไป - สิ่งนี้ซึ่งแต่ละตัวเลือกจะแสดงในหนึ่งหมายเลข
ให้เรายกตัวอย่างอีกสองสามอย่างเพื่อรวบรวมชุดรูปแบบที่หลากหลาย
ตัวอย่างที่ 3 12 นักกีฬาทำการออกกำลังกายที่อยู่นอก 10 นัดแสดงผลลัพธ์ดังกล่าว (ในแว่นตา):
94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.
ในการสร้างช่วงรูปแบบเราจะจัดอันดับหมายเลขข้อมูล
94; 94; 94; 94; 94;
หลังจากการจัดอันดับเราทำชุดรูปแบบ (ตารางที่ 3)
การรวมกันของวัตถุหรือปรากฏการณ์ที่รวมกันโดยคุณสมบัติทั่วไปหรือคุณสมบัติที่มีคุณภาพสูงหรือลักษณะเชิงปริมาณ การสังเกตวัตถุ .
วัตถุใด ๆ ของการสังเกตทางสถิติประกอบด้วยองค์ประกอบของแต่ละบุคคล - การสังเกตหน่วย .
ผลการสังเกตทางสถิติเป็นข้อมูลเชิงตัวเลข - ข้อมูล . ข้อมูลสถิติ - นี่คือข้อมูลเกี่ยวกับค่าที่การวิจัยมีความสนใจในนักวิจัยในการรวมสถิติ
หากค่าอักขระถูกแสดงโดยตัวเลขเครื่องหมายถูกเรียกว่า เกี่ยวกับปริมาณ .
หากคุณสมบัติมีคุณสมบัติบางอย่างหรือเงื่อนไขขององค์ประกอบของการรวมแล้วเครื่องหมายจะถูกเรียก เกี่ยวกับคุณภาพ .
หากการศึกษาขึ้นอยู่กับองค์ประกอบทั้งหมดของการรวม (การสังเกตที่มั่นคง) การรวมสถิติเรียกว่า ทั่วไป.
หากการศึกษาอยู่ภายใต้ส่วนหนึ่งขององค์ประกอบของประชากรทั่วไปจะเรียกว่าการรวมสถิติ เลือก (การสุ่มตัวอย่าง) . การเลือกจากประชากรทั่วไปสุ่มสลายสุ่มเพื่อให้องค์ประกอบตัวอย่างแต่ละรายการมีโอกาสเท่ากันในการเลือก
ค่าของแอตทริบิวต์ในระหว่างการเปลี่ยนแปลงจากองค์ประกอบหนึ่งของชุดหนึ่งไปยังอีกการเปลี่ยนแปลง (แตกต่างกันไป) ดังนั้นในสถิติสัญญาณต่าง ๆ เรียกอีกอย่างว่า ตัวเลือก . ตัวเลือกมักจะระบุด้วยตัวอักษรละตินขนาดเล็ก x, y, z
หมายเลขลำดับของตัวเลือก (ค่าเครื่องหมาย) เรียกว่า จัดอันดับ . X 1 - ศูนย์รวมที่ 1 (เครื่องหมายที่ 1), ตัวเลือก x 2 - 2nd (ค่าลงชื่อ 2), x i - i-th variant (I-E Sign)
สั่งซื้อตามลำดับการเพิ่มหรือลดลงจำนวนสัญญาณ (ตัวเลือก) ด้วยน้ำหนักที่เกี่ยวข้องเรียกว่าพวกเขาเรียกว่า รูปแบบใกล้เคียง (การกระจายในบริเวณใกล้เคียง)
เช่น ชั่งน้ำหนัก ความถี่หรือความถี่
ความถี่(m i) แสดงจำนวนครั้งที่หนึ่งหรืออีกจำนวนหนึ่ง (ค่าลงชื่อ) ในการรวมทางสถิติที่พบ
ความถี่หรือความถี่สัมพัทธ์ (w i) แสดงส่วนใดของหน่วยรวมกันที่มีหนึ่งหรืออื่น คำนวณความถี่เป็นอัตราส่วนของความถี่ของหนึ่งหรือตัวเลือกอื่นกับผลรวมของความถี่ทั้งหมดของแถว
. (6.1)
ผลรวมของความถี่ทั้งหมดเท่ากับ 1
. (6.2)
แถวรูปแบบจะไม่ต่อเนื่องและช่วงเวลา
แถวแปรปรวนแบบไม่ต่อเนื่อง โดยทั่วไปแล้วจะสร้างในกรณีที่ค่าของเครื่องหมายที่ศึกษาอาจแตกต่างกันไปไม่น้อยกว่าค่าสุดท้าย
ในแถวรูปแบบที่ไม่ต่อเนื่องค่าคะแนนจะถูกตั้งค่า
มุมมองทั่วไปของจำนวนรูปแบบที่ไม่ต่อเนื่องถูกระบุในตารางที่ 6.1
ตารางที่ 6.1
ที่ฉัน \u003d 1, 2, ... , l.
ในแถวรูปแบบช่วงเวลาในแต่ละช่วงเวลาขอบเขตบนและล่างของช่วงเวลานั้นแตกต่างกัน
ความแตกต่างระหว่างขอบเขตบนและล่างของช่วงเวลาเรียกว่า ช่วงเวลาต่าง ๆ หรือ ช่วงเวลาความยาว (ค่า) .
ขนาดของช่วงเวลาแรก K 1 ถูกกำหนดโดยสูตร:
k 1 \u003d 2 - a 1;
ที่สอง: K 2 \u003d และ 3 - 2; ...
ล่าสุด: k l \u003d a l - a l -1
โดยทั่วไป ช่วงเวลาต่าง ๆ k ฉันคำนวณโดยสูตร:
k i \u003d x i (สูงสุด) - x i (นาที) (6.3)
หากช่วงเวลามีทั้งสองเส้นขอบแล้วก็เรียกว่า ปิด .
ช่วงแรกและช่วงสุดท้ายสามารถเป็นได้ เปิด . มีเพียงหนึ่งพรมแดน
ตัวอย่างเช่นช่วงแรกสามารถตั้งค่าเป็น "สูงถึง 100", ที่สอง - "100-110", ... , สุดท้าย - "190-200", สุดท้าย - "200 และอื่น ๆ " เห็นได้ชัดว่าช่วงเวลาแรกไม่มีขอบเขตที่ต่ำกว่าและด้านบนสุดท้ายทั้งคู่เปิดอยู่
ช่วงเวลาที่เปิดมักจะต้องถวาย เพื่อจุดประสงค์นี้ช่วงเวลาแรกมักจะมีค่าเท่ากับค่าที่สองและขนาดของตัวสุดท้ายคือขนาดของเอกสารสุดท้าย ในตัวอย่างของเราขนาดของช่วงเวลาที่สองคือ 110-100 \u003d 10 ดังนั้นขอบเขตล่างของช่วงเวลาแรกคือเงื่อนไข 100-10 \u003d 90; ขนาดของช่วงเวลาสุดท้ายคือ 200-190 \u003d 10 ดังนั้นขอบเขตบนของช่วงเวลาสุดท้ายคือเงื่อนไขใน 200 + 10 \u003d 210
นอกจากนี้กลุ่มรูปแบบช่วงเวลาอาจพบช่วงเวลาที่แตกต่างกัน หากช่วงเวลาในช่วงการเปลี่ยนแปลงมีความยาวเท่ากัน (ช่วงเวลาต่าง ๆ ) พวกเขาเรียกว่า มีมิติเท่ากัน , มิฉะนั้น - ไม่สม่ำเสมอ
เมื่อสร้างช่วงการเปลี่ยนแปลงช่วงเวลาปัญหาในการเลือกขนาดของช่วงเวลา (ช่วงเวลาต่าง ๆ ) มักจะต้องเผชิญ
ในการกำหนดขนาดที่เหมาะสมที่สุดของช่วงเวลา (ในกรณีที่มีการสร้างแถวที่มีช่วงเวลาเท่ากัน) ใช้ formula Stargessa:
, (6.4)
โดยที่ n คือจำนวนหน่วยของการรวม
x (สูงสุด) และ x (นาที) - ค่าที่ใหญ่ที่สุดและเล็กที่สุดของตัวแปรของแถว
สำหรับลักษณะของชุดแปรผันพร้อมกับความถี่และปาร์ตี้ความถี่สะสมและความถี่ที่ใช้
ความถี่สะสม (ความถี่) แสดงจำนวนหน่วยรวม (ส่วนใดของพวกเขา) ไม่เกินค่าที่ระบุ (ตัวเลือก) x
ความถี่สะสม ( v ฉัน) ตามชุดที่ไม่ต่อเนื่องเป็นไปได้ที่จะคำนวณตามสูตรต่อไปนี้:
. (6.5)
สำหรับชุดรูปแบบช่วงเวลา - นี่คือผลรวมของความถี่ (ความถี่) ของช่วงเวลาทั้งหมดไม่เกินนี้
รูปแบบที่ไม่ต่อเนื่องสามารถแสดงกราฟิกโดยใช้ การกระจายความถี่หรือความถี่รูปหลายเหลี่ยม.
เมื่อสร้างรูปหลายเหลี่ยมการกระจายตามแกน Abscissa ค่าของคุณสมบัติ (Variants) จะถูกเลื่อนออกไปและตามแนวอวัยวะหรือแกนความถี่ ที่จุดตัดของค่าของคุณสมบัติและความถี่ที่สอดคล้องกัน (ความถี่) คะแนนจะถูกเลื่อนออกไปซึ่งในทางกลับกันเชื่อมต่อกันตามส่วน การรั่วไหลที่เกิดขึ้นเรียกว่ารูปหลายเหลี่ยมของการกระจายความถี่ (ความถี่)
|
|
|
รูปที่. 6.1
ช่วงเวลาที่หลากหลายสามารถแสดงกราฟิกได้โดยใช้ ฮิสโตแกรม. แผนภูมิฟิล์ม
เมื่อสร้างฮิสโตแกรมตามแกน Abscissa ค่าของแอตทริบิวต์ที่ศึกษา (ขอบเขตช่วงเวลา) จะถูกเลื่อนออกไป
ในกรณีที่ระยะเวลาเป็นค่าเดียวกันการคาดการณ์หรือความถี่หรือความถี่สามารถเลื่อนออกไปตามแกนบวช
หากช่วงเวลามีขนาดที่แตกต่างกันไปตามแกนทดสอบมันเป็นสิ่งจำเป็นที่จะเลื่อนค่าของความหนาแน่นของการกระจายแบบสัมบูรณ์หรือแบบสัมพัทธ์
ความหนาแน่นแน่นอน - อัตราส่วนของความถี่ของช่วงเวลากับขนาดของช่วงเวลา:
; (6.6)
สถานที่: F (a) ฉันเป็นความหนาแน่นแน่นอนของช่วงเวลาที่ฉันเป็น;
m i - ความถี่ของช่วง I-th;
k ฉันคือค่าของช่วง I-TH (ช่วงเวลาต่าง ๆ )
ความหนาแน่นแน่นอนแสดงจำนวนหน่วยรวมทั้งหมดต่อหน่วยของช่วงเวลา
ความหนาแน่นสัมพัทธ์ - อัตราส่วนของความถี่ของช่วงเวลากับขนาดของช่วงเวลา:
; (6.7)
สถานที่: F (O) ฉันเป็นความหนาแน่นสัมพัทธ์ของช่วงเวลาที่ฉันเป็น;
w ฉันเป็นความถี่ของช่วงเวลาที่ฉันเป็น
ความหนาแน่นสัมพัทธ์แสดงให้เห็นว่าส่วนใดของหน่วยของการรวมคือต่อหน่วยของช่วงเวลา
|
|
|
และชุดรูปแบบที่หลากหลายและช่วงเวลาที่แตกต่างกันสามารถแสดงเป็นสะสมและแท่นขุดเจาะ
เมื่อสร้าง คัคคี ตามชุดที่ไม่ต่อเนื่องค่าของคุณสมบัติ (ตัวเลือก) จะถูกเลื่อนออกไปตามแกน Abscissa และความถี่สะสมหรือความถี่สะสมอยู่บนแกน ที่จุดตัดของสัญญาณ (ตัวเลือก) และความถี่สะสมที่สอดคล้องกัน (ความถี่) คะแนนจะถูกสร้างขึ้นซึ่งในทางกลับกันเชื่อมต่อกันด้วยเซ็กเมนต์หรือเส้นโค้ง ผลเสีย (เส้นโค้ง) เรียกว่า cumulated (curve curve)
เมื่อสร้างชุดสะสมตามช่วงเวลาตามแนวแกน Abscissa ขอบเขตของช่วงเวลาจะถูกเลื่อนออกไป ข้อผิดพลาดของจุดคือขอบเขตสูงสุดของช่วงเวลา รูปแบบการกำหนดความถี่สะสม (ความถี่) ของช่วงเวลาที่สอดคล้องกัน มักจะเพิ่มจุดอื่น Abscissa ซึ่งเป็นขอบเขตที่ต่ำกว่าของช่วงเวลาแรกและการบวชเป็นศูนย์ จุดเชื่อมต่อกับส่วนหรือโค้งเราได้รับการสะสม
ogiva มันถูกสร้างขึ้นในทำนองเดียวกันกับความแตกต่างที่แกน abscissa ถูกนำไปใช้ซึ่งสอดคล้องกับความถี่สะสม (Generals) และตามแกน ordinate - ค่าเครื่องหมาย (ตัวเลือก)
การกระจายสถิติ - นี่คือการแจกจ่ายการกระจายหน่วยของการรวมในกลุ่มในคุณสมบัติการแปรปรวนเฉพาะขึ้นอยู่กับพื้นฐานพื้นฐานสำหรับการก่อตัวของจำนวนการกระจายเป็นที่โดดเด่น แอตทริบิวต์และช่วงการกระจายของการกระจาย.
การดำรงอยู่ของคุณสมบัติทั่วไปเป็นพื้นฐานสำหรับการก่อตัวของการรวมทางสถิติซึ่งแสดงถึงผลลัพธ์ของคำอธิบายหรือการวัดสัญญาณทั่วไปของวัตถุวิจัย
เรื่องของการศึกษาในสถิติกำลังเปลี่ยนแปลงคุณสมบัติ (แตกต่างกัน) หรือสัญญาณทางสถิติ
ประเภทของสัญญาณสถิติ.
แอตทริบิวต์เรียกแถวของการกระจายสร้างขึ้นตามคุณสมบัติคุณภาพ ที่แสดงที่แสดง - นี่คือสัญญาณที่มีชื่อ (ตัวอย่างเช่นอาชีพ: ช่างเย็บครู ฯลฯ )
หมายเลขการแจกจ่ายทำในรูปแบบของตาราง ในแท็บ 2.8 แสดงจำนวนแอตทริบิวต์ของการกระจาย
ตารางที่ 2.8 - การกระจายของประเภทของความช่วยเหลือทางกฎหมายที่มีให้แก่นักกฎหมายต่อพลเมืองของหนึ่งในภูมิภาคของสหพันธรัฐรัสเซีย
ชุดรูปแบบการเรียกของการกระจายของการกระจายสร้างขึ้นบนพื้นฐานเชิงปริมาณ ชุดแปรผันใด ๆ ประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่
ตัวเลือกถือเป็นค่าที่แยกต่างหากของคุณสมบัติที่ใช้ในแถวที่แปรผัน
ความถี่เป็นตัวเลขของตัวแปรส่วนบุคคลหรือแต่ละกลุ่มของชุดรูปแบบ I.e เหล่านี้เป็นตัวเลขที่แสดงให้เห็นว่ามีตัวเลือกบางอย่างที่พบในการกระจายจำนวนมาก ผลรวมของความถี่ทั้งหมดกำหนดจำนวนของจำนวนทั้งสิ้นทั้งหมดปริมาณของมัน
ชิ้นส่วนเรียกว่าความถี่ที่แสดงในเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์เป็นผล ดังนั้นจำนวนความถี่เท่ากับ 1 หรือ 100% ช่วงรูปแบบช่วยให้ข้อมูลจริงเพื่อประเมินรูปแบบของกฎหมายการจัดจำหน่าย
ขึ้นอยู่กับลักษณะของการเปลี่ยนแปลงของคุณสมบัติแยกต่างหาก ชุดแปรปรวนและช่วงเวลาที่ไม่ต่อเนื่อง.
ตัวอย่างของชุดรูปแบบที่ไม่ต่อเนื่องจะได้รับในตาราง 2.9
ตารางที่ 2.9 - การกระจายครอบครัวในจำนวนห้องพักในอพาร์ทเมนท์แยกต่างหากในปี 1989 ในสหพันธรัฐรัสเซีย
ชุดรูปแบบ
ในประชากรทั่วไปมีการตรวจสอบสัญญาณเชิงปริมาณบางอย่าง มันสุ่มลบตัวอย่างของปริมาตร น.นั่นคือจำนวนองค์ประกอบการสุ่มตัวอย่างเท่ากับ น.. ในขั้นตอนแรกของการประมวลผลทางสถิติที่ผลิต มากมาย ตัวอย่าง, I.e. หมายเลขสั่งซื้อ x 1, x 2, ... , x n จากน้อยไปมาก. แต่ละค่าสังเกต x I.เรียกว่า ตัวเลือก. ความถี่ m i. - นี่คือจำนวนการสังเกตของมูลค่า x I. ในตัวอย่าง ความถี่สัมพัทธ์ (ความถี่) w i.- นี่คืออัตราส่วนความถี่ m i.ในปริมาณของตัวอย่าง น.: .เมื่อศึกษาชุดแปรผันยังใช้แนวคิดของความถี่สะสมและความถี่สะสม อนุญาต เอ็กซ์ บางหมายเลข จากนั้นจำนวนตัวเลือก , ค่าที่น้อยกว่า เอ็กซ์เรียกว่าความถี่สะสม: สำหรับ x i
คุณสมบัตินี้เรียกว่าแตกต่างกันไปอย่างแตกต่างกันหากค่าแต่ละค่า (ตัวเลือก) แตกต่างจากกันกับค่า จำกัด บางอย่าง (โดยปกติจะเป็นจำนวนเต็ม) ชุดที่หลากหลายของสัญลักษณ์ดังกล่าวเรียกว่าการแปรปรวนแบบไม่ต่อเนื่อง
ตารางที่ 1. มุมมองทั่วไปของช่วงความถี่ที่แตกต่างกัน
ค่าลงชื่อ | x I. | x 1 | x 2 | … | x N |
ความถี่ | m i. | m 1. | m 2. | … | m n |
เครื่องหมายถูกเรียกว่า variating อย่างต่อเนื่องหากค่าของมันแตกต่างจากกันที่ค่าขนาดเล็กโดยพลการ i.e. เครื่องหมายสามารถใช้ค่าใด ๆ ในบางช่วงเวลา ชุด Varrational แบบต่อเนื่องสำหรับคุณสมบัติดังกล่าวเรียกว่าช่วงเวลา
ตารางที่ 2. มุมมองทั่วไปของช่วงความถี่แปรผันช่วงเวลา
ตารางที่ 3. รูปภาพกราฟิกของชุดรูปแบบการแปรปรวน
แถว | รูปหลายเหลี่ยมหรือฮิสโตแกรม | ฟังก์ชั่นการกระจายเชิงประจักษ์ | |
ไม่ต่อเนื่องกัน | |||
ช่วงเวลา |
สำหรับภาพกราฟิกของชุดรูปแบบการเปลี่ยนแปลงรูปหลายเหลี่ยมฮิสโตแกรมเส้นโค้งสะสมและฟังก์ชั่นการกระจายเชิงประจักษ์เป็นเรื่องปกติมากที่สุด
ในแท็บ 2.3 (การจัดกลุ่มของประชากรรัสเซียในแง่ของรายได้เฉลี่ยต่อคนในเดือนเมษายน 1994) ถูกนำเสนอ ชุด Varrational ช่วงเวลา.
แถวการกระจายที่สะดวกในการวิเคราะห์ด้วยภาพกราฟิกที่ช่วยให้คุณสามารถตัดสินและในรูปแบบของการกระจาย แนวคิดการมองเห็นของธรรมชาติของการเปลี่ยนแปลงในช่วงการเปลี่ยนแปลงความถี่จะได้รับ รูปหลายเหลี่ยมและฮิสโตแกรม.
รูปหลายเหลี่ยมใช้ในภาพของชุดรูปแบบที่ไม่ต่อเนื่อง.
แสดงตัวอย่างเช่นการกระจายกองทุนที่อยู่อาศัยแบบกราฟิกตามประเภทของอพาร์ทเมนท์ (ตารางที่ 2.10)
ตารางที่ 2.10 - การกระจายของมูลนิธิที่อยู่อาศัยของเขตเมืองจำแนกตามประเภทของอพาร์ทเมนท์ (ตัวเลขตามเงื่อนไข)
รูปที่. การกระจายรูปหลายเหลี่ยมของหุ้นที่อยู่อาศัย
บนแกน ordinate ไม่เพียง แต่ค่าความถี่เท่านั้น แต่ยังสามารถใช้ความถี่ของชุดรูปแบบการเปลี่ยนแปลงได้
ฮิสโตแกรมได้รับการยอมรับสำหรับรูปภาพของชุดรูปแบบช่วงเวลา. เมื่อสร้างฮิสโตแกรมใน Abscissa Axis ขนาดของช่วงเวลาจะถูกฝากและความถี่ที่ปรากฎโดยสี่เหลี่ยมที่สร้างขึ้นตามช่วงเวลาที่สอดคล้องกัน ความสูงของคอลัมน์ในกรณีที่มีช่วงเวลาเท่ากันควรเป็นสัดส่วนกับความถี่ ฮิสโตแกรมเป็นกราฟที่แถวที่ปรากฎในรูปแบบของการปนเปื้อนซึ่งกันและกัน
ฉันจะแสดงช่วงการกระจายช่วงรูปแบบกราฟิกที่กำหนดในตาราง 2.11
ตารางที่ 2.11 - การกระจายของครอบครัวในขนาดของพื้นที่ใช้สอยต่อคน (จำนวนตามเงื่อนไข)
n p / n | กลุ่มของครอบครัวในขนาดของพื้นที่ใช้สอยต่อคน | จำนวนครอบครัวที่มีพื้นที่นั่งเล่นที่กำหนด | จำนวนครอบครัวสะสม |
1 | 3 – 5 | 10 | 10 |
2 | 5 – 7 | 20 | 30 |
3 | 7 – 9 | 40 | 70 |
4 | 9 – 11 | 30 | 100 |
5 | 11 – 13 | 15 | 115 |
รวม | 115 | ---- |
รูปที่. 2.2 การกระจายฮิสโตแกรมของครอบครัวในขนาดของพื้นที่ใช้สอยต่อคน
การใช้ข้อมูลซีรี่ส์สะสม (ตารางที่ 2.11) สร้าง การกระจายการสะสม
รูปที่. 2.3 การกระจายการกระจายของครอบครัวในขนาดของพื้นที่ใช้สอยต่อคน
ภาพของแถวที่แปรผันในรูปแบบของสะสมนั้นมีประสิทธิภาพโดยเฉพาะอย่างยิ่งสำหรับชุดรูปแบบความถี่ที่แสดงในเศษส่วนหรือเปอร์เซ็นต์ต่อผลรวมของความถี่ของแถว
หากมีภาพกราฟิกของซีรี่ส์รุ่นแปรผันในรูปแบบของสะสมเพื่อเปลี่ยนแกนแล้วเราจะได้รับ ogiva. ในรูปที่ 2.4 แสดงให้เห็นถึงการโกงตามตารางข้อมูล 2.11
ฮิสโตแกรมสามารถแปลงเป็นรูปหลายเหลี่ยมการกระจายหากคุณพบกลางของสี่เหลี่ยมแล้วเชื่อมต่อจุดเหล่านี้ด้วยเส้นตรง รูปหลายเหลี่ยมการกระจายที่เกิดขึ้นจะแสดงในรูปที่ 2.2 เส้นประ
เมื่อสร้างฮิสโตแกรมของการกระจายของช่วงรูปแบบที่มีช่วงเวลาที่ไม่เท่ากันตามแนวแกน ordinate มันไม่ได้ใช้ความถี่ที่ใช้ แต่ความหนาแน่นของการกระจายของคุณลักษณะในช่วงเวลาที่สอดคล้องกัน
ความหนาแน่นของการกระจายเป็นความถี่ที่คำนวณต่อความกว้างของหน่วยของช่วงเวลา, I.e. กี่หน่วยในแต่ละกลุ่มคิดเป็นหน่วยของขนาดของช่วงเวลา ตัวอย่างของการคำนวณความหนาแน่นของการกระจายจะถูกนำเสนอในตาราง 2.12
ตารางที่ 2.12 - การกระจายของผู้ประกอบการตามจำนวนลูกจ้าง (ตัวเลขตามเงื่อนไข)
n p / n | กลุ่มของผู้ประกอบการในจำนวนลูกจ้าง | จำนวนผู้ประกอบการ | ขนาดของช่วงเวลาผู้คน | ความหนาแน่นของการกระจาย |
แต่ | 1 | 2 | 3=1/2 | |
1 | มากถึง 20 | 15 | 20 | 0,75 |
2 | 20 – 80 | 27 | 60 | 0,25 |
3 | 80 – 150 | 35 | 70 | 0,5 |
4 | 150 – 300 | 60 | 150 | 0,4 |
5 | 300 – 500 | 10 | 200 | 0,05 |
รวม | 147 | ---- | ---- |
ภาพกราฟิกของซีรี่ส์ชุดรูปแบบสามารถใช้ได้ โค้งสะสม. ด้วยความช่วยเหลือของคณาม่วง (SUMS Curve) จำนวนของความถี่สะสมที่ปรากฎ ความถี่สะสมจะถูกกำหนดโดยการรวมความถี่ที่สอดคล้องกันในกลุ่มและแสดงจำนวนหน่วยของชุดที่มีค่าของแอตทริบิวต์ไม่เกินมูลค่าที่พิจารณา
รูปที่. 2.4 การแจกจ่ายอันธพาลของครอบครัวในขนาดของพื้นที่ใช้สอยต่อคน
เมื่อสร้างชุดของชุดรูปแบบช่วงเวลาตามแกน Abscissa ตัวแปรของแถวจะถูกเลื่อนออกไปและความถี่สะสมจะถูกสะสมตามแนวแกน
ชุดรูปแบบต่อเนื่อง
ชุด Varricational อย่างต่อเนื่อง - ซีรีส์ที่สร้างขึ้นบนพื้นฐานของคุณสมบัติทางสถิติเชิงปริมาณ ตัวอย่าง. ระยะเวลาเฉลี่ยของโรคของนักโทษ (วันต่อคน) ในช่วงฤดูใบไม้ร่วงฤดูหนาวในปีปัจจุบันมีจำนวน:7,0 | 6,0 | 5,9 | 9,4 | 6,5 | 7,3 | 7,6 | 9,3 | 5,8 | 7,2 |
7,1 | 8,3 | 7,5 | 6,8 | 7,1 | 9,2 | 6,1 | 8,5 | 7,4 | 7,8 |
10,2 | 9,4 | 8,8 | 8,3 | 7,9 | 9,2 | 8,9 | 9,0 | 8,7 | 8,5 |