แถวของการกระจายและการจัดกลุ่ม การเปลี่ยนแปลงและช่วงสถิติของชุดรูปแบบการกระจายและวิธีการประมวลผลทางสถิติของพวกเขา

  • บทเรียนเบื้องต้น ฟรี;
  • ครูที่มีประสบการณ์จำนวนมาก (Neutiv และภาษารัสเซีย);
  • หลักสูตรที่ไม่ได้อยู่ในช่วงเวลาหนึ่ง (เดือนหกเดือนปี) แต่ในจำนวนชั้นเรียนที่เฉพาะเจาะจง (5, 10, 20, 50);
  • ลูกค้าที่พึงพอใจมากกว่า 10,000 คน
  • ค่าใช้จ่ายของหนึ่งชั้นเรียนกับครูสอนภาษารัสเซีย - จาก 600 รูเบิลกับเจ้าของภาษา - จาก 1,500 รูเบิล

แนวคิดของชุดแปรผัน ขั้นตอนแรกในการจัดระบบวัสดุของการสังเกตทางสถิติคือการนับจำนวนหน่วยที่มีคุณสมบัติหนึ่งหรืออื่น โดยการวางยูนิตในลำดับจากน้อยไปมากหรือน้อยลงของคุณสมบัติเชิงปริมาณของพวกเขาและคำนวณจำนวนหน่วยที่มีค่าการลงชื่อเฉพาะเราได้รับช่วงรูปแบบ ชุดรูปแบบการเปลี่ยนแปลงมีลักษณะการกระจายของหน่วยของการรวมสถิติบางอย่างตามพื้นฐานเชิงปริมาณใด ๆ

ช่วงรูปแบบคือสองคอลัมน์ในคอลัมน์ด้านซ้ายค่าของคุณสมบัติที่แตกต่างกันซึ่งอ้างถึงเป็นตัวเลือกและที่กำหนด (x) และในขวา - หมายเลขสัมบูรณ์แสดงให้เห็นว่ามีกี่ครั้งที่พบตัวเลือกแต่ละครั้ง ตัวบ่งชี้ของคอลัมน์นี้เรียกว่าความถี่และกำหนด (F)

แผนผังช่วงรูปแบบสามารถแสดงเป็นตาราง 5.1:

ตารางที่ 5.1

ประเภทของการเปลี่ยนแปลงแถว

ตัวเลือก (x)

ความถี่ (f)

คอลัมน์ที่เหมาะสมยังสามารถใช้ตัวบ่งชี้สัมพัทธ์ที่มีลักษณะส่วนของความถี่ของตัวเลือกแต่ละตัวในผลรวมความถี่ทั้งหมด ตัวบ่งชี้สัมพัทธ์เหล่านี้มีชื่อโดยทั่วไปและแสดงตามอัตภาพโดย I.e . ผลรวมของความถี่ทั้งหมดเท่ากับหนึ่ง ความถี่สามารถแสดงเป็นเปอร์เซ็นต์จากนั้นจำนวนเงินของพวกเขาจะเป็น 100%

สัญญาณต่าง ๆ อาจแตกต่างกัน ตัวเลือกสำหรับสัญญาณบางอย่างจะแสดงในจำนวนเต็มเช่นจำนวนห้องในอพาร์ทเมนท์จำนวนหนังสือที่ตีพิมพ์ ฯลฯ สัญญาณเหล่านี้เรียกว่าถูกขัดจังหวะหรือไม่ต่อเนื่อง ตัวเลือกสำหรับคุณสมบัติอื่น ๆ สามารถใช้ค่าใด ๆ ภายในข้อ จำกัด บางอย่างเช่นการดำเนินการของงานที่วางแผนไว้ค่าจ้าง ฯลฯ คุณสมบัติเหล่านี้เรียกว่าต่อเนื่อง

รูปแบบที่ไม่ต่อเนื่อง หากตัวแปรของชุดรูปแบบจะแสดงในรูปแบบของค่าที่ไม่ต่อเนื่องแล้วช่วงรูปแบบที่เรียกว่าไม่ต่อเนื่องลักษณะของมันจะถูกนำเสนอในตาราง 5.2:

ตารางที่ 5.2

การกระจายของนักเรียนในการประมาณการสอบ

ประมาณการ (x)

จำนวนนักเรียน (F)

% เป็นผลลัพธ์ ()

ลักษณะของการกระจายในแถวที่ไม่ต่อเนื่องนั้นเป็นภาพกราฟิกในรูปแบบของรูปหลายเหลี่ยมการกระจายรูปที่ 5.1

รูปที่. 5.1 การกระจายของนักเรียนตามการประมาณการที่ได้รับจากการสอบ

ชุดรูปแบบช่วงเวลา สำหรับสัญญาณต่อเนื่องการเปลี่ยนแปลงจะถูกสร้างขึ้นในช่วงเวลา I.e. ค่าของแอตทริบิวต์ในนั้นจะแสดงในรูปแบบของช่วงเวลา "จากและไปยัง" ในเวลาเดียวกันค่าต่ำสุดของคุณสมบัติในช่วงนี้เรียกว่าขอบเขตล่างของช่วงเวลาและค่าสูงสุด - ขอบเขตบนของช่วงเวลา

การเปลี่ยนแปลงช่วงเวลาถูกสร้างขึ้นทั้งสัญญาณที่ถูกขัดจังหวะ (ไม่ต่อเนื่อง) และสำหรับการแตกต่างกันไปในช่วงใหญ่ แถวช่วงสามารถมีช่วงเวลาเท่ากันและไม่เท่ากัน ในการปฏิบัติทางเศรษฐกิจส่วนใหญ่ใช้ช่วงเวลาที่ไม่เท่ากันเพิ่มขึ้นเรื่อย ๆ หรือลดลง ความต้องการดังกล่าวเกิดขึ้นโดยเฉพาะอย่างยิ่งในกรณีที่ส่วนของลักษณะถูกดำเนินการไม่สม่ำเสมอและเป็นข้อ จำกัด ขนาดใหญ่

พิจารณารูปแบบของแถวช่วงเวลาที่มีช่วงเวลาเท่ากันตาราง 5.3:

ตารางที่ 5.3

การกระจายแรงงานให้ทำงาน

การพัฒนา, TR (x)

จำนวนคนงาน (F)

ความถี่สะสม (f ')

ช่วงการแจกแจงช่วงเวลานั้นแสดงภาพกราฟิกในรูปแบบของฮิสโตแกรมรูปที่ 5.2

รูปที่ 5.2 การกระจายแรงงานให้ทำงาน

ความถี่สะสม (สะสม) ในทางปฏิบัติมีความจำเป็นในการเปลี่ยนแถวของการกระจายใน แถวสะสมความถี่สะสมภายใต้การก่อสร้าง ด้วยความช่วยเหลือของพวกเขาคุณสามารถกำหนดค่าเฉลี่ยของโครงสร้างซึ่งอำนวยความสะดวกในการวิเคราะห์แถวของการกระจายเหล่านี้

ความถี่สะสมจะถูกกำหนดโดยการเพิ่มลำดับตามลำดับความถี่ (หรือความถี่ภายใน) ของกลุ่มแรกของตัวบ่งชี้เหล่านี้ของกลุ่มที่ตามมาของจำนวนการกระจาย เพื่อแสดงให้เห็นถึงแถวการกระจายการสะสมสะสมและแถว ในการสร้างพวกเขาบน Abscissa Axis ค่าของคุณสมบัติที่ไม่ต่อเนื่อง (หรือจุดสิ้นสุดของช่วงเวลา) จะถูกบันทึกไว้และบนแกนของการคาดการณ์ - ผลลัพธ์ที่เพิ่มขึ้นของความถี่ (Cumulat), รูปที่ 5.3

รูปที่. 5.3 การกระจายการออกกำลังกายสะสม

หากเครื่องชั่งของความถี่และตัวเลือกเปลี่ยนสถานที่ I.e บนแกน Abscissa สะท้อนความถี่สะสมและบนแกนของการบวช - ค่าของตัวเลือกเส้นโค้งลักษณะการเปลี่ยนแปลงความถี่จากกลุ่มไปยังกลุ่มจะถูกเรียกว่าแถวของการแจกจ่ายรูปที่ 5.4

รูปที่. 5.4 การกระจาย Ohiva ของคนงานที่จะออกกำลังกาย

ชุดรูปแบบที่มีช่วงเวลาที่เท่ากันให้หนึ่งในข้อกำหนดที่สำคัญที่สุดสำหรับแถวของการกระจายสถิติทำให้มั่นใจในการเปรียบเทียบเวลาและพื้นที่

ความหนาแน่นของการกระจาย อย่างไรก็ตามความถี่ของช่วงเวลาที่ไม่เท่ากันของแต่ละช่วงในอันดับเหล่านี้ไม่สามารถเทียบเคียงได้โดยตรง ในกรณีเช่นนี้ความหนาแน่นของการกระจายจะถูกคำนวณเพื่อให้แน่ใจว่าการเปรียบเทียบที่จำเป็นเช่นกัน กำหนดจำนวนหน่วยในแต่ละกลุ่มบัญชีสำหรับหน่วยของขนาดของช่วงเวลา

เมื่อสร้างกราฟของการกระจายของชุดรูปแบบที่มีช่วงเวลาที่ไม่เท่ากันความสูงของสี่เหลี่ยมจะถูกกำหนดในสัดส่วนกับความถี่ที่ไม่ใช่ความถี่ แต่ตัวบ่งชี้ความหนาแน่นของการกระจายของค่าของแอตทริบิวต์ที่เกี่ยวข้องในช่วงเวลาที่สอดคล้องกัน

การรวบรวมชุดรูปแบบและภาพกราฟิกเป็นขั้นตอนแรกในการประมวลผลข้อมูลต้นฉบับและขั้นตอนแรกของการวิเคราะห์การรวมการศึกษา ขั้นตอนต่อไปในการวิเคราะห์ชุดแปรผันคือคำจำกัดความของตัวบ่งชี้ทั่วไปพื้นฐานที่เรียกว่าลักษณะของซีรีส์ ลักษณะเหล่านี้จะต้องให้ความคิดเกี่ยวกับสัญลักษณ์เฉลี่ยของการลงชื่อเข้าใช้หน่วยรวมของการรวม

ค่าเฉลี่ย. ค่าเฉลี่ยเป็นลักษณะทั่วไปของแอตทริบิวต์ที่ศึกษาในการศึกษาสะท้อนให้เห็นถึงระดับทั่วไปต่อหน่วยของการเผาไหม้ในเงื่อนไขเฉพาะของสถานที่และเวลา

ค่าเฉลี่ยเสมอชื่อเสมอมีมิติเหมือนกับเครื่องหมายในแต่ละหน่วยของการรวม

ก่อนที่จะคำนวณค่าเฉลี่ยจำเป็นต้องจัดกลุ่มหน่วยของการรวมทั้งหมดการจัดสรรกลุ่มที่มีคุณภาพสูง

ค่าเฉลี่ยที่คำนวณจากจำนวนทั้งสิ้นโดยรวมเรียกว่าค่าเฉลี่ยทั่วไปและสำหรับแต่ละกลุ่ม - ค่าเฉลี่ยของกลุ่ม

มีสองค่าเฉลี่ย: พลังงาน (เลขคณิตเฉลี่ย, ฮาร์มอนิกเฉลี่ย, เรขาคณิตปานกลาง, กำลังสองปั่นป่วนขนาดกลาง); โครงสร้าง (แฟชั่น, มัธยฐาน, ควอไทล์, Decil)

ตัวเลือกของสื่อในการคำนวณขึ้นอยู่กับเป้าหมาย

ประเภทของค่าเฉลี่ยพลังงานและวิธีการคำนวณของพวกเขาในการปฏิบัติของการประมวลผลทางสถิติของวัสดุประกอบงานต่าง ๆ เกิดขึ้นเพื่อแก้ค่าเฉลี่ยต่าง ๆ

สถิติทางคณิตศาสตร์แสดงค่าเฉลี่ยต่าง ๆ จากสูตรของสื่อพลังงาน:

ที่ค่าเฉลี่ย; x - ตัวเลือกแยกต่างหาก (สัญญาณของสัญญาณ); Z เป็นตัวบ่งชี้ของการศึกษาระดับปริญญา (ที่ z \u003d 1 - arithmetic เฉลี่ย, z \u003d 0 เฉลี่ย geometric, z \u003d - 1 คือค่าเฉลี่ยฮาร์มอนิก, Z \u003d 2 เป็นกำลังสองเฉลี่ย)

อย่างไรก็ตามคำถามที่ต้องใช้สื่อประเภทใดในแต่ละกรณีที่ได้รับอนุญาตจากการวิเคราะห์เฉพาะของการรวมการศึกษา

ที่พบบ่อยที่สุดในสถิติประเภทของค่าเฉลี่ยคือ เลขคณิตกลาง. มีการคำนวณในกรณีที่มีการสร้างวอลุ่มของคุณสมบัติโดยเฉลี่ยเป็นผลรวมของค่าในแต่ละหน่วยของการรวมสถิติที่ศึกษา

ขึ้นอยู่กับลักษณะของข้อมูลต้นฉบับเลขคณิตเฉลี่ยจะถูกกำหนดในรูปแบบต่าง ๆ :

หากข้อมูลไม่ใช่เรื่องสำคัญการคำนวณจะดำเนินการโดยสูตรของขนาดกลางที่เรียบง่าย

การคำนวณเลขคณิตปานกลางในแถวที่ไม่ต่อเนื่องมาจากสูตร 3.4

การคำนวณเลขคณิตปานกลางในแถวช่วงเวลา ในชุดรูปแบบช่วงเวลาที่ตรงกลางของช่วงเวลาที่ได้รับการยอมรับในแต่ละกลุ่มค่าทางคณิตศาสตร์เฉลี่ยอาจแตกต่างจากค่าเฉลี่ยที่คำนวณจากข้อมูลที่ไม่สำคัญ ยิ่งไปกว่านั้นยิ่งมีขนาดเท่ากันของช่วงเวลาในกลุ่มเท่าใดการเบี่ยงเบนที่เป็นไปได้ของค่าเฉลี่ยที่คำนวณได้มากขึ้นจากข้อมูลที่จัดกลุ่มตามค่าเฉลี่ยที่คำนวณจากข้อมูลที่ไม่สำคัญ

เมื่อคำนวณค่าเฉลี่ยในซีรี่ส์ Varriational ช่วงเวลาเพื่อทำการคำนวณที่จำเป็นจากช่วงเวลาถึงสื่อกลางของพวกเขา จากนั้นคำนวณค่าเฉลี่ยตามสูตรของคณิตศาสตร์เฉลี่ยถ่วงน้ำหนัก

คุณสมบัติของเลขคณิตปานกลางเลขคณิตเฉลี่ยมีคุณสมบัติบางอย่างที่ช่วยให้คุณสามารถทำให้การคำนวณง่ายขึ้น

1. เลขคณิตเฉลี่ยของตัวเลขคงที่เท่ากับจำนวนคงที่นี้

ถ้า x \u003d a จากนั้น .

2. หากน้ำหนักตัวแปรทั้งหมดเป็นสัดส่วนที่จะเปลี่ยนแปลง I.e. เพิ่มหรือลดจำนวนครั้งเท่ากันจากนั้นแถวใหม่ทางคณิตศาสตร์เฉลี่ยจากนี้จะไม่เปลี่ยนแปลง

หากทุกคนมีน้ำหนักลดลงใน k ครั้งแล้ว .

3. ผลรวมของการเบี่ยงเบนบวกและลบของแต่ละตัวแปรจากค่าเฉลี่ยคูณด้วยน้ำหนักเป็นศูนย์, I.e.

ถ้าแล้ว จากที่นี่.

หากตัวเลือกทั้งหมดลดหรือเพิ่มขึ้นในจำนวนใด ๆ แถวใหม่ทางคณิตศาสตร์จะลดลงหรือเพิ่มขึ้นเหมือนกัน

ลดตัวเลือกทั้งหมด เอ็กซ์ บน ก.. เอ็กซ์´ = เอ็กซ์.

จากนั้น

ชุดเริ่มต้นทางคณิตศาสตร์เฉลี่ยสามารถรับได้โดยการเพิ่มเป็นสื่อกลางที่ลดลงก่อนหน้านี้หักจากตัวเลือกตัวเลข ก.. .

5. หากตัวเลือกทั้งหมดลดหรือเพิ่มขึ้น เค. หนึ่งครั้งแถวใหม่ค่าเฉลี่ยเลขคณิตจะลดลงหรือเพิ่มจำนวนเท่ากัน I.E ใน เค. เวลา.

ปล่อยให้แล้ว .

จากที่นี่ I.e. ในการรับช่วงเริ่มต้นปานกลางแถวใหม่ค่าเฉลี่ยเลขคณิต (พร้อมตัวเลือกที่ลดลง) จะต้องเพิ่มขึ้น เค.เวลา.

ฮาร์มอนิกกลางฮาร์มอนิกโดยเฉลี่ยคือค่าของเลขคณิตกลาง มันถูกใช้เมื่อข้อมูลทางสถิติไม่มีความถี่ในหลาย ๆ ชนิดของจำนวนทั้งสิ้นและแสดงเป็นผลิตภัณฑ์ของพวกเขา (m \u003d xf) ค่าเฉลี่ยฮาร์มอนิกจะคำนวณโดยสูตร 3.5

การใช้งานจริงของฮาร์มอนิกกลาง - เพื่อคำนวณดัชนีบางอย่างโดยเฉพาะดัชนีราคา

เรขาคณิตปานกลางเมื่อใช้รูปทรงเรขาคณิตขนาดกลางค่าลักษณะส่วนบุคคลเป็นไปตามกฎค่าสัมพัทธ์ของลำโพงที่สร้างขึ้นในรูปแบบของค่าโซ่เป็นความสัมพันธ์กับระดับก่อนหน้าของแต่ละระดับในแถวของลำโพง ลักษณะเฉลี่ยดังนั้นค่าสัมประสิทธิ์การเติบโตเฉลี่ย

ค่าทางเรขาคณิตเฉลี่ยยังใช้เพื่อกำหนดค่าเท่ากับจากค่าการลงชื่อสูงสุดและต่ำสุด ตัวอย่างเช่น บริษัท ประกันภัยสรุปสัญญาสำหรับการให้บริการประกันภัยรถยนต์ ขึ้นอยู่กับเหตุการณ์ประกันที่เฉพาะเจาะจงการชำระเงินประกันอาจแตกต่างกันไปจาก $ 10,000 ถึง $ 100,000 ต่อปี จำนวนเงินเฉลี่ยของการชำระเงินประกันจะเป็นดอลลาร์

เรขาคณิตเฉลี่ยคือค่าที่ใช้เป็นค่าเฉลี่ยของความสัมพันธ์หรือในแถวของการกระจายที่นำเสนอในรูปแบบของความก้าวหน้าทางเรขาคณิตเมื่อ z \u003d 0 ค่าเฉลี่ยนี้มีความสะดวกในการใช้งานเมื่อมีการจ่ายความแตกต่างอย่างแน่นอน แต่มีความแตกต่างอย่างแน่นอน .

สูตรสำหรับการคำนวณดังต่อไปนี้

ที่ไหน - ตัวเลือกของเครื่องหมายเฉลี่ย; - ตัวเลือกการทำงาน f.- ตัวเลือกความถี่

เรขาคณิตเฉลี่ยใช้ในการคำนวณอัตราการเติบโตเฉลี่ยต่อปี

กำลังสองปอดร์สูตรของการเลี้ยงกำลังสองโดยเฉลี่ยใช้เพื่อวัดระดับของจำนวนของค่าของแต่ละค่าของแอตทริบิวต์รอบ ๆ เลขคณิตเฉลี่ยในแถวของการกระจาย ดังนั้นเมื่อคำนวณตัวบ่งชี้การเปลี่ยนแปลงค่าเฉลี่ยจะคำนวณจากกำลังสองของค่าเบี่ยงเบนของค่าแต่ละค่าของคุณลักษณะจากค่าเลขคณิตกลาง

ค่ากำลังสองเฉลี่ยคำนวณโดยสูตร

ในการศึกษาทางเศรษฐกิจการเลี้ยงกำลังสองโดยเฉลี่ยในรูปแบบการดัดแปลงนั้นใช้กันอย่างแพร่หลายเมื่อคำนวณตัวบ่งชี้ของการจำแนกลักษณะของคุณสมบัติเช่นการกระจายตัวเฉลี่ยการเบี่ยงเบนเฉลี่ยกำลังสอง

กฎขั้นสูง ระหว่างค่าเฉลี่ยที่ทรงพลังมีการพึ่งพาต่อไปนี้ - ตัวบ่งชี้มากขึ้นค่าเฉลี่ยค่าเฉลี่ยตาราง 1.4:

ตารางที่ 5.4

อัตราส่วนระหว่างค่าเฉลี่ย

ค่า z

อัตราส่วนระหว่างสื่อ

อัตราส่วนนี้เรียกว่ากฎของเสียงข้างมาก

ค่าเฉลี่ยโครงสร้างตัวบ่งชี้พิเศษใช้เพื่อกำหนดลักษณะโครงสร้างของชุดซึ่งสามารถเรียกว่าค่าเฉลี่ยของโครงสร้าง ตัวชี้วัดดังกล่าวรวมถึงแฟชั่นค่ามัธยฐานควอไทล์และ Desil

แฟชั่น. Moda (MO) เรียกว่าความหมายที่พบบ่อยที่สุดของการลงชื่อเข้าใช้หน่วยรวม แฟชั่นเรียกว่ามูลค่าของคุณสมบัติที่สอดคล้องกับจุดสูงสุดของเส้นโค้งการกระจายทางทฤษฎี

แฟชั่นใช้กันอย่างแพร่หลายในการปฏิบัติงานเชิงพาณิชย์เมื่อศึกษาความต้องการของลูกค้า (เมื่อพิจารณาขนาดของเสื้อผ้าและรองเท้าที่อยู่ในความต้องการทั่วไป) การลงทะเบียนราคา mod ในการรวมสามารถเป็นได้หลายอย่าง

การคำนวณแฟชั่นในแถวที่ไม่ต่อเนื่อง ในแถวที่ไม่ต่อเนื่องของแฟชั่นเป็นตัวเลือกที่มีความถี่สูงสุด ลองค้นหาแฟชั่นในแถวที่ไม่ต่อเนื่อง

การคำนวณแฟชั่นในแถวช่วงเวลา ในแถว Varriational ช่วงเวลา Modal จะถือว่าประมาณ I.e ของช่วงเวลานั้นที่มีความถี่ที่ยิ่งใหญ่ที่สุด (ความถี่) ภายในช่วงเวลามีความจำเป็นต้องค้นหาค่าของสัญญาณที่เป็นแฟชั่น สำหรับชุดช่วงเวลาของแฟชั่นจะถูกกำหนดโดยสูตร

ขีด จำกัด ล่างของช่วงเวลาที่ต่ำกว่าอยู่ที่ไหน - ขนาดของช่วงเวลากิริยา; - ความถี่ที่สอดคล้องกับช่วง modal; - ความถี่ก่อนช่วงเวลากิริยา; - ความถี่ของช่วงเวลาต่อไปนี้ modal

ค่ามัธยฐานค่ามัธยฐาน () เรียกว่าความหมายของหน่วยกลางของชุดอันดับ แถวอันดับหนึ่งคือชุดที่มีการบันทึกสัญญาณในลำดับจากน้อยไปมากหรือลำดับจากมากไปน้อย หรือค่ามัธยฐานคือค่าที่แบ่งจำนวนชุดรูปแบบที่สั่งซื้อเป็นสองส่วนเท่า ๆ กัน: ส่วนหนึ่งมีค่าของคุณสมบัติที่แตกต่างกันน้อยกว่าตัวเลือกเฉลี่ยและอื่น ๆ มีขนาดใหญ่

เพื่อค้นหาค่ามัธยฐานหมายเลขลำดับจะถูกกำหนดก่อน สำหรับสิ่งนี้มีจำนวนหน่วยคี่ต่อผลรวมของความถี่ทั้งหมดหน่วยจะถูกเพิ่มและทุกอย่างแบ่งออกเป็นสอง ที่จำนวนคู่หน่วยของค่ามัธยฐานจะพบเป็นค่าของการลงชื่อเข้าใช้หมายเลขลำดับที่กำหนดโดยจำนวนความถี่ทั้งหมดหารด้วยสอง การรู้หมายเลขลำดับของค่ามัธยฐานได้อย่างง่ายดายที่ความถี่สะสมเพื่อค้นหาความหมายของมัน

การคำนวณค่ามัธยฐานในแถวที่ไม่ต่อเนื่องตามการตรวจสอบการเลือกข้อมูลเกี่ยวกับการกระจายของครอบครัวในจำนวนเด็กตาราง 5.5 เพื่อกำหนดค่ามัธยฐานก่อนกำหนดหมายเลขลำดับ

=

จากนั้นเราจะสร้างความถี่สะสมจำนวนมาก (ตามลำดับหมายเลขและความถี่สะสมเราจะพบค่ามัธยฐานความถี่สะสม 33 แสดงให้เห็นว่าใน 33 ครอบครัวจำนวนเด็กไม่เกิน 1 ลูก แต่ตั้งแต่หมายเลข 50 ค่ามัธยฐาน จะอยู่ในช่วงเวลาจาก 34 ถึง 55 ครอบครัว

ตารางที่ 5.5

การกระจายของจำนวนครอบครัวจากจำนวนเด็ก

จำนวนเด็กในครอบครัว

จำนวนครอบครัวขยายช่วงมัธยฐาน

รูปแบบที่พิจารณาทั้งหมดของพลังงานเฉลี่ยมีคุณสมบัติที่สำคัญ (ตรงกันข้ามกับค่าเฉลี่ยโครงสร้าง) - ในสูตรสำหรับการกำหนดค่าเฉลี่ยรวมถึงค่าทั้งหมดของซีรีส์เช่น ขนาดของค่าเฉลี่ยได้รับอิทธิพลจากมูลค่าของแต่ละตัวเลือก

ในมือข้างหนึ่งนี่เป็นทรัพย์สินที่เป็นบวกมาก ในกรณีนี้การกระทำของเหตุผลทั้งหมดที่จะส่งผลกระทบต่อทุกหน่วยของการรวมทั่วไปที่นำมาพิจารณา ในทางกลับกันแม้แต่การสังเกตครั้งเดียวที่ตกลงไปในข้อมูลเริ่มต้นจะสุ่มแบบสุ่มสามารถบิดเบือนความคิดของระดับการพัฒนาของคุณลักษณะที่ศึกษาในการรวมกันภายใต้การพิจารณา (โดยเฉพาะในระดับสั้น)

ไตรมาสและมลรัฐโดยการเปรียบเทียบกับการค้นหาค่ามัธยฐานในชุดรูปแบบที่หลากหลายคุณสามารถค้นหาคุณค่าของคุณสมบัติใด ๆ ตามลำดับของหน่วยของชุดอันดับ โดยเฉพาะอย่างยิ่งคุณสามารถค้นหาค่าลักษณะในหน่วยที่แบ่งแถวออกเป็น 4 ส่วนเท่า ๆ กันโดย 10 ฯลฯ

ไตรมาส ตัวเลือกที่แบ่งแถวที่จัดอันดับออกเป็นสี่ส่วนเท่า ๆ กันเรียกว่าไตรมาส

ในเวลาเดียวกันแยกความแตกต่าง: สี่อันต่ำกว่า (หรือครั้งแรก) สี่ (Q1) เป็นค่าของการลงชื่อในหน่วยของชุดของการจัดอันดับการแบ่งส่วนผสมในอัตราส่วนของ¼ถึง¾และควอไทล์ (หรือสาม) บน (หรือสาม) ) - ค่าของการลงชื่อเข้าใช้หน่วยของซีรีย์อันดับการแบ่งจำนวนทั้งสิ้นในอัตราส่วน¾ถึง¼

ไตรมาสที่สองมีค่ามัธยฐาน Q2 \u003d ฉัน ไตรมาสที่ต่ำกว่าและบนในแถวช่วงถูกคำนวณโดยสูตรคล้ายกับค่ามัธยฐาน

อยู่ที่ไหนขอบเขตล่างของช่วงเวลาที่มีไตรมาสที่ต่ำกว่าและส่วนบนตามลำดับ

- ความถี่สะสมของช่วงเวลาก่อนหน้าช่วงเวลาที่มีควอไทล์ล่างหรือบน;

- ความถี่ของช่วงเวลาควอไทล์ (ล่างและด้านบน)

ช่วงเวลาที่มี Q1 และ Q3 กำหนดโดยความถี่สะสม (หรือโดยทั่วไป)

มลรัฐ นอกเหนือไปจากไตรมาสแล้วใบแล้วคำนวณ - ตัวเลือกการแบ่งแถวที่อยู่ในอันดับที่สองเท่ากัน

พวกเขาถูกแสดงโดย D Decil D1 แรกแบ่งจำนวนในอัตราส่วน 1/10 และ 9/10, D2 - 2/10 และ 8/10 เป็นต้น พวกเขาคำนวณโดยโครงการเดียวกันกับค่ามัธยฐานและควอไทล์

ทั้งมัธยฐานและไตรมาสและปั่นป่วนเป็นของสถิติลำดับที่เรียกว่าซึ่งพวกเขาเข้าใจว่าตัวเลือกที่ครอบครองลำดับที่แน่นอนในแถวที่ติดอันดับ

การจัดกลุ่ม - นี่คือการแยกจำนวนทั้งสิ้นในกลุ่มที่เป็นเนื้อเดียวกันในสัญลักษณ์ใด ๆ

การแต่งตั้งให้บริการ. ด้วยความช่วยเหลือของเครื่องคิดเลขออนไลน์คุณสามารถ:

  • สร้างชุดรูปแบบสร้างฮิสโตแกรมและหลุมฝังกลบ;
  • ค้นหาตัวบ่งชี้การเปลี่ยนแปลง (กลางแฟชั่น (รวมถึงและกราฟิก), ค่ามัธยฐาน, ขอบเขตของการเปลี่ยนแปลง, ควอไทล์, การลดปริมาณสัมประสิทธิ์การรักษาความแตกต่างอัตราส่วนการเปลี่ยนแปลงและตัวบ่งชี้อื่น ๆ );

คำแนะนำ. ในการจัดกลุ่มหมายเลขที่จำเป็นในการเลือกประเภทของช่วงรูปแบบ (ไม่ต่อเนื่องหรือช่วงเวลา) และระบุจำนวนข้อมูล (จำนวนสตริง) โซลูชันที่ได้จะถูกบันทึกไว้ในไฟล์ Word (ดูตัวอย่างของข้อมูลสถิติการจัดกลุ่ม)

หากการจัดกลุ่มถูกนำไปใช้แล้วและตั้งค่าแล้ว รูปแบบที่ไม่ต่อเนื่อง หรือ ช่วงเวลาคุณต้องใช้ตัวบ่งชี้รูปแบบเครื่องคิดเลขออนไลน์ ตรวจสอบสมมติฐานเกี่ยวกับรูปแบบของการกระจาย มันดำเนินการโดยใช้การศึกษาแบบฟอร์มการกระจาย

ประเภทของกลุ่มสถิติ

ชุดรูปแบบ. ในกรณีของการสังเกตของตัวแปรสุ่มแบบแยกส่วนหนึ่งและค่าเดียวกันสามารถพบได้หลายครั้ง ค่าดังกล่าวของ X i ของความแปรปรวนแบบสุ่มจะถูกบันทึกด้วยตัวบ่งชี้ของ n i ของจำนวนที่ปรากฏในการสังเกต n นี่คือความถี่ของค่านี้
ในกรณีของตัวแปรสุ่มอย่างต่อเนื่องในทางปฏิบัติจะใช้การจัดกลุ่ม
  1. การจัดกลุ่มประเภท - นี่คือการแบ่งแยกของจำนวนทั้งสิ้นที่แตกต่างกันการศึกษาของชั้นเรียนประเภททางเศรษฐกิจและสังคมกลุ่มหน่วยที่เป็นเนื้อเดียวกัน ในการสร้างกลุ่มนี้ให้ใช้พารามิเตอร์ชุดรูปแบบที่ไม่ต่อเนื่อง
  2. โครงสร้างเรียกว่าการจัดกลุ่มในกรณีที่การแยกการรวมกันเป็นเนื้อเดียวกันกับกลุ่มที่มีลักษณะโครงสร้างตามคุณสมบัติที่แตกต่างกัน ในการสร้างกลุ่มนี้ให้ใช้พารามิเตอร์แถวช่วง
  3. การจัดกลุ่มเผยให้เห็นความสัมพันธ์ระหว่างปรากฏการณ์ศึกษาและสัญญาณของพวกเขาเรียกว่า การจัดกลุ่มการวิเคราะห์ (ดูการจัดกลุ่มการวิเคราะห์ของตัวเลข)

ตัวอย่างหมายเลข 1 ตามตารางที่ 2 สร้างแถวของการจัดจำหน่ายมากกว่า 40 ธนาคารพาณิชย์ของสหพันธรัฐรัสเซีย ตามแถวการกระจายที่ได้รับกำหนด: รายได้โดยเฉลี่ยสำหรับธนาคารพาณิชย์แห่งหนึ่งการลงทุนสินเชื่อโดยเฉลี่ยสำหรับธนาคารพาณิชย์หนึ่งรายความนิยมและค่ามัธยฐานของผลกำไร ควอไทล์, deciles, ขอบเขตของการเปลี่ยนแปลง, ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย, ค่าเบี่ยงเบนกำลังเฉลี่ยกำลังสอง, ค่าสัมประสิทธิ์ของการเปลี่ยนแปลง

การตัดสินใจ:
ในบท "ประเภทของชุดสถิติ" เลือกแถวที่ไม่ต่อเนื่อง คลิกแทรกจาก Excel จำนวนกลุ่ม: ตามสูตร Stargessa

หลักการของกลุ่มสถิติการสร้าง

จำนวนการสังเกตการสั่งซื้อจากน้อยไปมากเรียกว่าการแปรปรวน. สัญญาณการจัดกลุ่ม สัญลักษณ์เรียกว่าการแบ่งย่อยของจำนวนทั้งสิ้นสำหรับแต่ละกลุ่ม มันเรียกว่าพื้นฐานของการจัดกลุ่ม ในฐานของการจัดกลุ่มทั้งสัญญาณเชิงปริมาณและเชิงคุณภาพสามารถวางได้
หลังจากพิจารณาพื้นฐานของการจัดกลุ่มแล้วควรได้รับการแก้ไขเกี่ยวกับจำนวนกลุ่มที่การทดสอบการเผาไหม้ควรจะแตกหัก

เมื่อใช้คอมพิวเตอร์ส่วนบุคคลสำหรับการประมวลผลข้อมูลสถิติการจัดกลุ่มของวัตถุวัตถุจะถูกสร้างขึ้นตามขั้นตอนมาตรฐาน
หนึ่งในขั้นตอนเหล่านี้ขึ้นอยู่กับการใช้สูตร Sturges เพื่อกำหนดจำนวนกลุ่มที่ดีที่สุด:

k \u003d 1 + 3,322 * LG (N)

โดยที่ K คือจำนวนของกลุ่ม N คือจำนวนหน่วยของการรวม

ความยาวของช่วงเวลาบางส่วนคำนวณเป็น h \u003d (x สูงสุด -x นาที) / k

จากนั้นคำนวณจำนวนการสังเกตในช่วงเวลาเหล่านี้ซึ่งใช้เป็นความถี่ n i ความถี่เล็ก ๆ ที่มีค่าน้อยกว่า 5 (n ฉัน< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
เป็นค่าใหม่ตัวเลือกจะถูกถ่ายโดยตรงกลางของ x i \u003d (c i - 1 + c i) / 2 ช่วงเวลา

ตัวอย่างหมายเลข 3 อันเป็นผลมาจากตัวอย่างสุ่มตัวอย่าง 5% การกระจายสินค้าความชื้นต่อไปนี้ คำนวณ: 1) เปอร์เซ็นต์เฉลี่ยของความชื้น; 2) ตัวบ่งชี้ลักษณะการเปลี่ยนแปลงของความชื้น
ได้รับสารละลายโดยใช้เครื่องคิดเลข: ตัวอย่างหมายเลข 1

สร้างชุดที่หลากหลาย ตามแถวที่พบสร้างรูปหลายเหลี่ยมการกระจายฮิสโตแกรมสะสม กำหนดแฟชั่นและค่ามัธยฐาน
การตัดสินใจดาวน์โหลด

ตัวอย่าง. ตามผลลัพธ์ของการสังเกตตัวอย่าง (ตัวอย่างและแอปพลิเคชัน):
a) ทำชุดรูปแบบที่หลากหลาย
b) คำนวณความถี่สัมพัทธ์และความถี่สัมพัทธ์สะสม;
c) สร้างหลุมฝังกลบ;
d) ประกอบไปด้วยฟังก์ชั่นการกระจายเชิงประจักษ์
e) สร้างกราฟของฟังก์ชั่นการกระจายเชิงประจักษ์
e) คำนวณลักษณะตัวเลข: ค่าเฉลี่ยทางคณิตศาสตร์การกระจายตัวเบี่ยงเบนสองกำลังสอง การตัดสินใจ

ขึ้นอยู่กับข้อมูลที่กำหนดในตารางที่ 4 (ภาคผนวก 1) และตัวเลือกที่สอดคล้องกับของคุณให้ดำเนินการ:

  1. ขึ้นอยู่กับการจัดกลุ่มโครงสร้างเราสร้างความถี่ที่หลากหลายและแถวสะสมของการกระจายโดยใช้ช่วงเวลาปิดที่เท่ากันโดยการรับจำนวนกลุ่มถึง 6. ผลลัพธ์ที่จะส่งในรูปแบบของตารางและภาพวาดกราฟิก
  2. วิเคราะห์ช่วงการกระจายแบบแปรผันจากการคำนวณ:
    • ค่าเลขคณิตเฉลี่ยของคุณลักษณะ;
    • แฟชั่น, มัธยฐาน, ควอลิส 1st, 1 และ 9 decil;
    • เบี่ยงเบนสองกำลังสอง;
    • สัมประสิทธิ์การเปลี่ยนแปลง
  3. สรุปการสรุป

ต้องใช้: แท่งช่วงสร้างช่วงการกระจายช่วงเวลาคำนวณค่าเฉลี่ยจำนวนเฉลี่ยแฟชั่นและค่ามัธยฐานสำหรับแถวที่จัดอันดับและช่วงเวลา

ขึ้นอยู่กับข้อมูลแหล่งที่มาเพื่อสร้างชุดรูปแบบที่ไม่ต่อเนื่อง ส่งในรูปแบบของตารางสถิติและกราฟสถิติ 2) ขึ้นอยู่กับข้อมูลต้นฉบับในการสร้างชุดรูปแบบช่วงเวลาที่มีช่วงเวลาเท่ากัน จำนวนช่วงเวลาที่เลือกอย่างอิสระและอธิบายตัวเลือกนี้ เป็นตัวแทนชุดรูปแบบที่ได้รับในรูปแบบของตารางสถิติและกราฟสถิติ ระบุประเภทของตารางและกราฟที่ใช้

เพื่อกำหนดระยะเวลาการบริการลูกค้าโดยเฉลี่ยในกองทุนบำเหน็จบำนาญจำนวนลูกค้าที่มีขนาดใหญ่มาก 100 ลูกค้าถูกตรวจสอบตามรูปแบบของตัวอย่างที่ไม่ได้ตั้งใจแบบสุ่ม ผลการสำรวจจะถูกนำเสนอในตาราง การค้นหา:
a) พรมแดนที่เวลาการให้บริการโดยเฉลี่ยของลูกค้าทั้งหมดของกองทุนบำเหน็จบำนาญได้ข้อสรุปถึงความน่าจะเป็น 0.9946;
b) ความน่าจะเป็นที่ส่วนแบ่งของลูกค้าทั้งหมดของกองทุนที่มีระยะเวลาการให้บริการน้อยกว่า 6 นาทีแตกต่างจากส่วนแบ่งของลูกค้าดังกล่าวในตัวอย่างไม่เกิน 10% (โดยค่าสัมบูรณ์);
c) ปริมาณของตัวอย่างอีกครั้งซึ่งความน่าจะเป็นที่ 0.9907 สามารถเป็นที่ถกเถียงกันอยู่ว่าส่วนแบ่งของลูกค้าทั้งหมดของมูลนิธิที่มีระยะเวลาการให้บริการน้อยกว่า 6 นาทีแตกต่างจากส่วนแบ่งของลูกค้าดังกล่าวในตัวอย่างไม่เกิน 10% (โดยค่าสัมบูรณ์)
2. ตามปัญหา 1 โดยใช้ X 2 เกณฑ์เพียร์สันที่ระดับความสำคัญα \u003d 0.05 ตรวจสอบสมมติฐานว่าจำนวนสุ่ม x เป็นเวลาการบริการลูกค้าที่แจกจ่ายตามกฎหมายปกติ สร้างภาพวาดฮิสโตแกรมของการกระจายเชิงประจักษ์และเส้นโค้งปกติที่สอดคล้องกัน
การตัดสินใจดาวน์โหลด

Dana ตัวอย่างจาก 100 องค์ประกอบ ความต้องการ:

  1. สร้างชุดรูปแบบการจัดอันดับ
  2. ค้นหาสมาชิกสูงสุดและขั้นต่ำของแถว
  3. ค้นหาขอบเขตของความแปรปรวนและจำนวนช่วงเวลาที่เหมาะสมสำหรับการก่อสร้างแถวช่วงเวลา ค้นหาความยาวของช่วงช่วงเวลา;
  4. สร้างแถวช่วงเวลา ค้นหาความถี่ขององค์ประกอบการสุ่มตัวอย่างในช่วงที่ดูดซึม ค้นหาจุดปานกลางของแต่ละช่องว่าง;
  5. สร้างฮิสโตแกรมและความถี่หลายเหลี่ยม เปรียบเทียบกับการกระจายปกติ (วิเคราะห์และกราฟิก);
  6. สร้างกราฟของฟังก์ชั่นการกระจายเชิงประจักษ์
  7. คำนวณลักษณะตัวเลขที่เลือก: ช่วงเวลาที่เลือกกลางและกลางเลือก;
  8. คำนวณค่าโดยประมาณของการเบี่ยงเบนกำลังสองโดยเฉลี่ยความไม่สมดุลและส่วนเกิน (ใช้แพ็คเกจการวิเคราะห์ MS Excel) เปรียบเทียบค่าการคำนวณโดยประมาณด้วยความแม่นยำ (คำนวณโดยใช้สูตร MS Excel);
  9. เปรียบเทียบลักษณะกราฟิกที่เลือกได้ด้วยทฤษฎีที่เหมาะสม
การตัดสินใจดาวน์โหลด

มีข้อมูลตัวอย่างต่อไปนี้ (ตัวอย่าง 10%, เครื่องจักรกล) ในการผลิตผลิตภัณฑ์และจำนวนกำไรล้านรูเบิล ตามข้อมูลแหล่งที่มา:
ภารกิจ 13.1
13.1.1 สร้างจำนวนสถิติของการกระจายของผู้ประกอบการเหนือจำนวนกำไรโดยการขึ้นรูปห้ากลุ่มด้วยช่วงเวลาที่เท่ากัน สร้างกราฟิกของการกระจายจำนวนมาก
13.1.2 คำนวณลักษณะเชิงตัวเลขของจำนวนการกระจายขององค์กรในจำนวนกำไร: เลขคณิตเฉลี่ยส่วนเบี่ยงเบนกำลังสองการกระจายตัว, ค่าสัมประสิทธิ์การเปลี่ยนแปลง v. ทำให้ข้อสรุป
ภารกิจ 13.2
13.2.1 กำหนดขอบเขตที่จำนวนขององค์กรหนึ่งในการรวมทั่วไปนั้นล้อมรอบด้วยความน่าจะเป็น 0.997
13.2.2 การใช้ X2-criterion ของเพียร์สันที่ระดับความสำคัญαตรวจสอบสมมติฐานว่าค่าสุ่ม x คือจำนวนกำไร - แจกจ่ายตามกฎหมายปกติ
ภารกิจ 13.3
13.3.1 กำหนดค่าสัมประสิทธิ์ของสมการการถดถอยแบบเลือก
13.3.2 กำหนดสถานะและลักษณะของความสัมพันธ์ระหว่างต้นทุนของผลิตภัณฑ์ที่ผลิต (x) และจำนวนกำไรต่อองค์กร (Y) สร้างแผนภาพการกระเจิงและสายการถดถอย
13.3.3 คำนวณสัมประสิทธิ์สหสัมพันธ์เชิงเส้น การใช้ T-criterion ของนักเรียนตรวจสอบความสำคัญของสัมประสิทธิ์สหสัมพันธ์ รับบทสรุปเกี่ยวกับความหนาแน่นระหว่างปัจจัย X และ Y โดยใช้ Chedocheus
แนวทาง. งาน 13.3 ดำเนินการโดยใช้บริการนี้
การตัดสินใจดาวน์โหลด

งาน. ข้อมูลต่อไปนี้เป็นค่าใช้จ่ายของเวลาของลูกค้าในการสรุปสัญญา สร้างชุดรูปแบบต่าง ๆ ของข้อมูลที่นำเสนอฮิสโตแกรมเพื่อค้นหาการประเมินที่ไม่สอดคล้องกันของความคาดหวังทางคณิตศาสตร์ชดเชยและการประเมินที่ไม่กระจายของการกระจายตัวของการกระจายตัว

ตัวอย่าง. ตามตารางที่ 2:
1) สร้างแถวของการกระจายของ 40 ธนาคารพาณิชย์ของสหพันธรัฐรัสเซีย:
a) กำไรที่ใหญ่ที่สุด;
b) การลงทุนสินเชื่อที่ใหญ่ที่สุด
2) สำหรับแถวการกระจายที่เกิดขึ้นกำหนด:
ก) กำไรโดยเฉลี่ยสำหรับธนาคารพาณิชย์แห่งหนึ่ง
b) การลงทุนสินเชื่อเฉลี่ยสำหรับธนาคารพาณิชย์แห่งหนึ่ง
c) มูลค่ากำไร Modal and Median; ควอไทล์, Desil;
d) มูลค่า Modal and Median ของการลงทุนสินเชื่อ
3) คำนวณ: คำนวณ:
a) รูปแบบการเปลี่ยนแปลง;
b) ค่าเบี่ยงเบนเชิงเส้นโดยเฉลี่ย;
c) เบี่ยงเบนกำลังสองกำลังสอง;
d) ค่าสัมประสิทธิ์การเปลี่ยนแปลง
การคำนวณที่จำเป็นในรูปแบบตาราง วิเคราะห์ผลลัพธ์ ทำข้อสรุป
สร้างกราฟิกของแถวการกระจายที่เกิดขึ้น นิยามแบบกราฟิกแฟชั่นและค่ามัธยฐาน

การตัดสินใจ:
ในการสร้างการจัดกลุ่มด้วยช่วงเวลาที่เท่ากันเราใช้ข้อมูลสถิติการจัดกลุ่มบริการ

รูปที่ 1 - ป้อนพารามิเตอร์

คำอธิบายของพารามิเตอร์
จำนวนบรรทัด: จำนวนข้อมูลแหล่งข้อมูล หากมิติของแถวมีขนาดเล็กให้ระบุจำนวนของมัน หากตัวอย่างค่อนข้างยอดเยี่ยมจากนั้นคลิกปุ่มแทรก Excel
จำนวนกลุ่ม: 0 - จำนวนกลุ่มจะถูกกำหนดโดยสูตรของ Stargess
หากมีการระบุจำนวนกลุ่มที่เฉพาะเจาะจงให้ระบุ (ตัวอย่างเช่น 5)
มุมมองของแถว: แถวที่ไม่ต่อเนื่อง
ระดับนัยสำคัญ: ตัวอย่างเช่น 0.954 พารามิเตอร์นี้ถูกตั้งค่าเพื่อกำหนดช่วงเวลาที่เป็นความลับของค่าเฉลี่ย
ตัวอย่าง: ตัวอย่างเช่นตัวอย่างเครื่องกล 10% ถูกดำเนินการ ระบุหมายเลข 10 สำหรับข้อมูลของเราเราระบุ 100

กลุ่มตัวเลขรวมกันโดยสัญลักษณ์ใด ๆ เรียกว่า รวม

ดังที่ระบุไว้ข้างต้นวัสดุกีฬาทางสถิติหลักเป็นกลุ่มของตัวเลขที่กระจัดกระจายที่ไม่ให้โค้ชของความคิดเกี่ยวกับสาระสำคัญของปรากฏการณ์หรือกระบวนการ งานคือการเปลี่ยนจำนวนทั้งสิ้นนี้ให้กับระบบและใช้กับตัวบ่งชี้เพื่อให้ได้ข้อมูลที่จำเป็น

การเตรียมชุดรูปแบบการเปลี่ยนแปลงนั้นเป็นการก่อตัวของคณิตศาสตร์บางอย่างอย่างแม่นยำ

ตัวอย่างที่ 2 ใน 34 นักกีฬาของนักเล่นสกีได้รับการลงทะเบียนเวลาการกู้คืนชีพจรหลังจากผ่านระยะทาง (เป็นวินาที):

81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

ดังที่สามารถมองเห็นได้ตัวเลขกลุ่มนี้ไม่ได้รับข้อมูลใด ๆ

สำหรับการเตรียมการของจำนวนความแปรปรวนการดำเนินงานผลิตครั้งแรก การจัดอันดับ - ตำแหน่งของตัวเลขอยู่ในลำดับจากน้อยไปมากหรือน้อยลง ตัวอย่างเช่นในลำดับจากน้อยไปหามากการจัดอันดับนำไปสู่สิ่งต่อไปนี้;

78; 78; 78; 78; 78; 78;

81; 81; 81; 81; 81; 81; 81; 81; 81;

84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

ในการสั่งซื้อจากมากไปน้อยการจัดอันดับนำไปสู่กลุ่มของตัวเลขดังกล่าว:

84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

81; 81; 81; 81; 8!; 81: 81; 81; 81;

78; 78; 78; 78; 78; 78;

หลังจากการจัดอันดับรูปแบบที่ไม่มีเหตุผลของการบันทึกจำนวนตัวเลขและตัวเลขเดียวกันกำลังกลายเป็นหมายเลขเดียวกันซ้ำหลายครั้ง ดังนั้นความคิดตามธรรมชาติจึงเกิดขึ้นเพื่อแปลงการบันทึกในลักษณะดังกล่าวเพื่อระบุหมายเลขใดที่ซ้ำหลายครั้ง ตัวอย่างเช่นการพิจารณาการจัดอันดับในลำดับจากน้อยไปมาก:

ที่นี่จำนวนจะถูกบันทึกโดยหมายเลขที่ระบุเวลาการกู้คืนของพัลส์ของนักกีฬาไปทางขวาของการทำซ้ำของประจักษ์พยานนี้ในกลุ่มนักกีฬา 34 คนนี้

ตามแนวคิดดังกล่าวเกี่ยวกับสัญลักษณ์ทางคณิตศาสตร์กลุ่มการวัดที่ถือว่าจะกำหนดตัวอักษรใด ๆ เช่น x รับลำดับที่เพิ่มขึ้นของตัวเลขในกลุ่มนี้: x 1 -74 c; x 2 - 78 s; x 3 - 81 s; x 4 - 84 s; x 5 - 85 s; x 6 n - 90 s, แต่ละหมายเลขถือว่าสามารถกำหนดได้โดยสัญลักษณ์ x i

แสดงจำนวนการทำซ้ำของการวัดที่พิจารณาของตัวอักษร n จากนั้น:

n 1 \u003d 4; n 2 \u003d 6; n 3 \u003d 9; n 4 \u003d 11; n 5 \u003d 3; n 6 \u003d n n \u003d 1 และแต่ละจำนวนการทำซ้ำสามารถแสดงเป็น n i

จำนวนการวัดทั้งหมดที่ดำเนินการดังต่อไปนี้จากสภาพของตัวอย่างคือ 34 ซึ่งหมายความว่าผลรวมของทั้งหมด n เท่ากับ 34 หรือในการแสดงออกเชิงสัญลักษณ์:

แสดงจำนวนนี้ด้วยตัวอักษรหนึ่งตัว - n จากนั้นข้อมูลเริ่มต้นของตัวอย่างภายใต้การพิจารณาสามารถบันทึกในแบบฟอร์มนี้ (ตารางที่ 1)

กลุ่มของตัวเลขที่เกิดขึ้นคือชุดประจักษ์พยานที่มีการเปลี่ยนแปลงที่กระจัดกระจายที่ได้รับจากโค้ชที่จุดเริ่มต้นของการทำงาน

ตารางที่ 1

x I. n ฉัน
n \u003d 34

กลุ่มดังกล่าวเป็นระบบเฉพาะที่พารามิเตอร์อธิบายลักษณะการวัดที่ดำเนินการ ตัวเลขที่แสดงถึงการเรียกการวัด (x i) ตัวเลือก; น. I - จำนวนการทำซ้ำของพวกเขา - เรียกว่า ความถี่; N - ผลรวมของความถี่ทั้งหมด - ที่นั่น ปริมาตรของจำนวนทั้งสิ้น

ระบบที่ได้รับทั้งหมดเรียกว่า ความแปรปรวนอยู่ใกล้ บางครั้งแถวเหล่านี้เรียกว่าเชิงประจักษ์หรือสถิติ

มันเป็นเรื่องง่ายที่จะสังเกตเห็นว่ามีบางกรณีของชุดรูปแบบที่เป็นไปได้เมื่อความถี่ทั้งหมดเท่ากับหนึ่ง n i \u003d\u003d 1 นั่นคือการวัดแต่ละครั้งในกลุ่มนี้พบเพียงครั้งเดียว

ชุดรูปแบบที่เป็นผลลัพธ์เช่นอื่น ๆ สามารถแสดงกราฟิกได้ ในการสร้างกราฟของซีรีย์ที่เกิดขึ้นคุณต้องก่อนอื่นให้อยู่ในระดับบนแกนแนวนอนและแนวตั้ง

ในภารกิจนี้บนแกนแนวนอนเราจะฝากเวลาการกู้คืนชีพจร (x 1) ในลักษณะที่ความยาวของความยาวที่การเลือกตั้งตามอำเภอใจสอดคล้องกับค่าหนึ่งวินาที มันจะเริ่มเลื่อนค่าเหล่านี้จาก 70 วินาทีการถอยตามอัตภาพจากจุดตัดของสองแกน 0

บนแกนแนวตั้งเลื่อนค่าของความถี่ของแถวของเรา (n i) การสเกล: หน่วยความยาวเท่ากับหน่วยของความถี่

เตรียมเงื่อนไขสำหรับการสร้างตารางให้ดำเนินการกับการเปลี่ยนแปลงที่ได้รับ

คู่แรกของตัวเลข x 1 \u003d 74, n 1 \u003d 4 ถูกนำไปใช้กับแผนภูมิเช่นนี้: บนแกน x; เราพบ x 1 =74 และเราฟื้นฟูเส้นตั้งฉากจากจุดนี้บนแกน N เราพบ n 1 \u003d 4 และดำเนินการเส้นแนวนอนจากจุดตัดด้วยการตั้งฉากที่เรียกคืน ทั้งแนวตั้งแนวตั้งและแนวนอนเป็นเส้นเสริมและจึงนำไปใช้กับภาพวาดของเส้นประ จุดตัดของพวกเขาคืออัตราส่วน X 1 \u003d 74 และ N 1 \u003d 4 ในระดับของกราฟนี้

ในทำนองเดียวกันประเด็นอื่น ๆ ของตารางทั้งหมดจะถูกนำไปใช้ จากนั้นพวกเขาก็เชื่อมต่อกันโดยส่วนของเส้นตรง เพื่อให้มีการปิดตารางเวลาปิดจุดสุดขั้วเชื่อมต่อเซ็กเมนต์ที่มีจุดที่อยู่ติดกันของแกนแนวนอน

ตัวเลขที่เกิดขึ้นคือกราฟของซีรี่ส์ชุดรูปแบบของเรา (รูปที่ 1)

เป็นที่ชัดเจนว่าแต่ละชุดรูปแบบแต่ละชุดดูเหมือนจะเป็นตารางของตัวเอง

รูปที่. 1. การแสดงกราฟิกของชุดรูปแบบที่หลากหลาย

ในรูปที่ 1 แสดง:

1) จากการสำรวจมากที่สุดกลุ่มที่ใหญ่ที่สุดคิดเป็นนักกีฬาเวลาการฟื้นตัวของชีพจรซึ่ง 84 S;

2) หลายครั้งนี้คือ 81 วินาที;

3) กลุ่มที่เล็กที่สุดคือนักกีฬาที่มีเวลาฟื้นตัวของชีพจรขนาดเล็ก - 74 S และใหญ่ - 90 วินาที

ดังนั้นโดยการดำเนินการทดสอบชุดตัวเลขที่ได้รับควรจัดอันดับและวาดชุดรูปแบบที่หลากหลายซึ่งเป็นระบบทางคณิตศาสตร์ที่เฉพาะเจาะจง เพื่อความชัดเจนชุดรูปแบบสามารถแสดงได้ตามกำหนดเวลา

ช่วงการเปลี่ยนแปลงข้างต้นเรียกว่า ไม่ต่อเนื่องกัน ถัดไป - สิ่งนี้ซึ่งแต่ละตัวเลือกจะแสดงในหนึ่งหมายเลข

ให้เรายกตัวอย่างอีกสองสามอย่างเพื่อรวบรวมชุดรูปแบบที่หลากหลาย

ตัวอย่างที่ 3 12 นักกีฬาทำการออกกำลังกายที่อยู่นอก 10 นัดแสดงผลลัพธ์ดังกล่าว (ในแว่นตา):

94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

ในการสร้างช่วงรูปแบบเราจะจัดอันดับหมายเลขข้อมูล

94; 94; 94; 94; 94;

หลังจากการจัดอันดับเราทำชุดรูปแบบ (ตารางที่ 3)

การรวมกันของวัตถุหรือปรากฏการณ์ที่รวมกันโดยคุณสมบัติทั่วไปหรือคุณสมบัติที่มีคุณภาพสูงหรือลักษณะเชิงปริมาณ การสังเกตวัตถุ .

วัตถุใด ๆ ของการสังเกตทางสถิติประกอบด้วยองค์ประกอบของแต่ละบุคคล - การสังเกตหน่วย .

ผลการสังเกตทางสถิติเป็นข้อมูลเชิงตัวเลข - ข้อมูล . ข้อมูลสถิติ - นี่คือข้อมูลเกี่ยวกับค่าที่การวิจัยมีความสนใจในนักวิจัยในการรวมสถิติ

หากค่าอักขระถูกแสดงโดยตัวเลขเครื่องหมายถูกเรียกว่า เกี่ยวกับปริมาณ .

หากคุณสมบัติมีคุณสมบัติบางอย่างหรือเงื่อนไขขององค์ประกอบของการรวมแล้วเครื่องหมายจะถูกเรียก เกี่ยวกับคุณภาพ .

หากการศึกษาขึ้นอยู่กับองค์ประกอบทั้งหมดของการรวม (การสังเกตที่มั่นคง) การรวมสถิติเรียกว่า ทั่วไป.

หากการศึกษาอยู่ภายใต้ส่วนหนึ่งขององค์ประกอบของประชากรทั่วไปจะเรียกว่าการรวมสถิติ เลือก (การสุ่มตัวอย่าง) . การเลือกจากประชากรทั่วไปสุ่มสลายสุ่มเพื่อให้องค์ประกอบตัวอย่างแต่ละรายการมีโอกาสเท่ากันในการเลือก

ค่าของแอตทริบิวต์ในระหว่างการเปลี่ยนแปลงจากองค์ประกอบหนึ่งของชุดหนึ่งไปยังอีกการเปลี่ยนแปลง (แตกต่างกันไป) ดังนั้นในสถิติสัญญาณต่าง ๆ เรียกอีกอย่างว่า ตัวเลือก . ตัวเลือกมักจะระบุด้วยตัวอักษรละตินขนาดเล็ก x, y, z

หมายเลขลำดับของตัวเลือก (ค่าเครื่องหมาย) เรียกว่า จัดอันดับ . X 1 - ศูนย์รวมที่ 1 (เครื่องหมายที่ 1), ตัวเลือก x 2 - 2nd (ค่าลงชื่อ 2), x i - i-th variant (I-E Sign)

สั่งซื้อตามลำดับการเพิ่มหรือลดลงจำนวนสัญญาณ (ตัวเลือก) ด้วยน้ำหนักที่เกี่ยวข้องเรียกว่าพวกเขาเรียกว่า รูปแบบใกล้เคียง (การกระจายในบริเวณใกล้เคียง)

เช่น ชั่งน้ำหนัก ความถี่หรือความถี่

ความถี่(m i) แสดงจำนวนครั้งที่หนึ่งหรืออีกจำนวนหนึ่ง (ค่าลงชื่อ) ในการรวมทางสถิติที่พบ

ความถี่หรือความถี่สัมพัทธ์ (w i) แสดงส่วนใดของหน่วยรวมกันที่มีหนึ่งหรืออื่น คำนวณความถี่เป็นอัตราส่วนของความถี่ของหนึ่งหรือตัวเลือกอื่นกับผลรวมของความถี่ทั้งหมดของแถว

. (6.1)

ผลรวมของความถี่ทั้งหมดเท่ากับ 1

. (6.2)

แถวรูปแบบจะไม่ต่อเนื่องและช่วงเวลา

แถวแปรปรวนแบบไม่ต่อเนื่อง โดยทั่วไปแล้วจะสร้างในกรณีที่ค่าของเครื่องหมายที่ศึกษาอาจแตกต่างกันไปไม่น้อยกว่าค่าสุดท้าย

ในแถวรูปแบบที่ไม่ต่อเนื่องค่าคะแนนจะถูกตั้งค่า

มุมมองทั่วไปของจำนวนรูปแบบที่ไม่ต่อเนื่องถูกระบุในตารางที่ 6.1

ตารางที่ 6.1

ที่ฉัน \u003d 1, 2, ... , l.

ในแถวรูปแบบช่วงเวลาในแต่ละช่วงเวลาขอบเขตบนและล่างของช่วงเวลานั้นแตกต่างกัน

ความแตกต่างระหว่างขอบเขตบนและล่างของช่วงเวลาเรียกว่า ช่วงเวลาต่าง ๆ หรือ ช่วงเวลาความยาว (ค่า) .

ขนาดของช่วงเวลาแรก K 1 ถูกกำหนดโดยสูตร:

k 1 \u003d 2 - a 1;

ที่สอง: K 2 \u003d และ 3 - 2; ...

ล่าสุด: k l \u003d a l - a l -1

โดยทั่วไป ช่วงเวลาต่าง ๆ k ฉันคำนวณโดยสูตร:

k i \u003d x i (สูงสุด) - x i (นาที) (6.3)

หากช่วงเวลามีทั้งสองเส้นขอบแล้วก็เรียกว่า ปิด .

ช่วงแรกและช่วงสุดท้ายสามารถเป็นได้ เปิด . มีเพียงหนึ่งพรมแดน

ตัวอย่างเช่นช่วงแรกสามารถตั้งค่าเป็น "สูงถึง 100", ที่สอง - "100-110", ... , สุดท้าย - "190-200", สุดท้าย - "200 และอื่น ๆ " เห็นได้ชัดว่าช่วงเวลาแรกไม่มีขอบเขตที่ต่ำกว่าและด้านบนสุดท้ายทั้งคู่เปิดอยู่

ช่วงเวลาที่เปิดมักจะต้องถวาย เพื่อจุดประสงค์นี้ช่วงเวลาแรกมักจะมีค่าเท่ากับค่าที่สองและขนาดของตัวสุดท้ายคือขนาดของเอกสารสุดท้าย ในตัวอย่างของเราขนาดของช่วงเวลาที่สองคือ 110-100 \u003d 10 ดังนั้นขอบเขตล่างของช่วงเวลาแรกคือเงื่อนไข 100-10 \u003d 90; ขนาดของช่วงเวลาสุดท้ายคือ 200-190 \u003d 10 ดังนั้นขอบเขตบนของช่วงเวลาสุดท้ายคือเงื่อนไขใน 200 + 10 \u003d 210

นอกจากนี้กลุ่มรูปแบบช่วงเวลาอาจพบช่วงเวลาที่แตกต่างกัน หากช่วงเวลาในช่วงการเปลี่ยนแปลงมีความยาวเท่ากัน (ช่วงเวลาต่าง ๆ ) พวกเขาเรียกว่า มีมิติเท่ากัน , มิฉะนั้น - ไม่สม่ำเสมอ

เมื่อสร้างช่วงการเปลี่ยนแปลงช่วงเวลาปัญหาในการเลือกขนาดของช่วงเวลา (ช่วงเวลาต่าง ๆ ) มักจะต้องเผชิญ

ในการกำหนดขนาดที่เหมาะสมที่สุดของช่วงเวลา (ในกรณีที่มีการสร้างแถวที่มีช่วงเวลาเท่ากัน) ใช้ formula Stargessa:

, (6.4)

โดยที่ n คือจำนวนหน่วยของการรวม

x (สูงสุด) และ x (นาที) - ค่าที่ใหญ่ที่สุดและเล็กที่สุดของตัวแปรของแถว

สำหรับลักษณะของชุดแปรผันพร้อมกับความถี่และปาร์ตี้ความถี่สะสมและความถี่ที่ใช้

ความถี่สะสม (ความถี่) แสดงจำนวนหน่วยรวม (ส่วนใดของพวกเขา) ไม่เกินค่าที่ระบุ (ตัวเลือก) x

ความถี่สะสม ( v ฉัน) ตามชุดที่ไม่ต่อเนื่องเป็นไปได้ที่จะคำนวณตามสูตรต่อไปนี้:

. (6.5)

สำหรับชุดรูปแบบช่วงเวลา - นี่คือผลรวมของความถี่ (ความถี่) ของช่วงเวลาทั้งหมดไม่เกินนี้

รูปแบบที่ไม่ต่อเนื่องสามารถแสดงกราฟิกโดยใช้ การกระจายความถี่หรือความถี่รูปหลายเหลี่ยม.

เมื่อสร้างรูปหลายเหลี่ยมการกระจายตามแกน Abscissa ค่าของคุณสมบัติ (Variants) จะถูกเลื่อนออกไปและตามแนวอวัยวะหรือแกนความถี่ ที่จุดตัดของค่าของคุณสมบัติและความถี่ที่สอดคล้องกัน (ความถี่) คะแนนจะถูกเลื่อนออกไปซึ่งในทางกลับกันเชื่อมต่อกันตามส่วน การรั่วไหลที่เกิดขึ้นเรียกว่ารูปหลายเหลี่ยมของการกระจายความถี่ (ความถี่)

x เค
x 2
x 1 x ฉัน


รูปที่. 6.1

ช่วงเวลาที่หลากหลายสามารถแสดงกราฟิกได้โดยใช้ ฮิสโตแกรม. แผนภูมิฟิล์ม

เมื่อสร้างฮิสโตแกรมตามแกน Abscissa ค่าของแอตทริบิวต์ที่ศึกษา (ขอบเขตช่วงเวลา) จะถูกเลื่อนออกไป

ในกรณีที่ระยะเวลาเป็นค่าเดียวกันการคาดการณ์หรือความถี่หรือความถี่สามารถเลื่อนออกไปตามแกนบวช

หากช่วงเวลามีขนาดที่แตกต่างกันไปตามแกนทดสอบมันเป็นสิ่งจำเป็นที่จะเลื่อนค่าของความหนาแน่นของการกระจายแบบสัมบูรณ์หรือแบบสัมพัทธ์

ความหนาแน่นแน่นอน - อัตราส่วนของความถี่ของช่วงเวลากับขนาดของช่วงเวลา:

; (6.6)

สถานที่: F (a) ฉันเป็นความหนาแน่นแน่นอนของช่วงเวลาที่ฉันเป็น;

m i - ความถี่ของช่วง I-th;

k ฉันคือค่าของช่วง I-TH (ช่วงเวลาต่าง ๆ )

ความหนาแน่นแน่นอนแสดงจำนวนหน่วยรวมทั้งหมดต่อหน่วยของช่วงเวลา

ความหนาแน่นสัมพัทธ์ - อัตราส่วนของความถี่ของช่วงเวลากับขนาดของช่วงเวลา:

; (6.7)

สถานที่: F (O) ฉันเป็นความหนาแน่นสัมพัทธ์ของช่วงเวลาที่ฉันเป็น;

w ฉันเป็นความถี่ของช่วงเวลาที่ฉันเป็น

ความหนาแน่นสัมพัทธ์แสดงให้เห็นว่าส่วนใดของหน่วยของการรวมคือต่อหน่วยของช่วงเวลา

A L.
1 x i
2.

และชุดรูปแบบที่หลากหลายและช่วงเวลาที่แตกต่างกันสามารถแสดงเป็นสะสมและแท่นขุดเจาะ

เมื่อสร้าง คัคคี ตามชุดที่ไม่ต่อเนื่องค่าของคุณสมบัติ (ตัวเลือก) จะถูกเลื่อนออกไปตามแกน Abscissa และความถี่สะสมหรือความถี่สะสมอยู่บนแกน ที่จุดตัดของสัญญาณ (ตัวเลือก) และความถี่สะสมที่สอดคล้องกัน (ความถี่) คะแนนจะถูกสร้างขึ้นซึ่งในทางกลับกันเชื่อมต่อกันด้วยเซ็กเมนต์หรือเส้นโค้ง ผลเสีย (เส้นโค้ง) เรียกว่า cumulated (curve curve)

เมื่อสร้างชุดสะสมตามช่วงเวลาตามแนวแกน Abscissa ขอบเขตของช่วงเวลาจะถูกเลื่อนออกไป ข้อผิดพลาดของจุดคือขอบเขตสูงสุดของช่วงเวลา รูปแบบการกำหนดความถี่สะสม (ความถี่) ของช่วงเวลาที่สอดคล้องกัน มักจะเพิ่มจุดอื่น Abscissa ซึ่งเป็นขอบเขตที่ต่ำกว่าของช่วงเวลาแรกและการบวชเป็นศูนย์ จุดเชื่อมต่อกับส่วนหรือโค้งเราได้รับการสะสม

ogiva มันถูกสร้างขึ้นในทำนองเดียวกันกับความแตกต่างที่แกน abscissa ถูกนำไปใช้ซึ่งสอดคล้องกับความถี่สะสม (Generals) และตามแกน ordinate - ค่าเครื่องหมาย (ตัวเลือก)

การกระจายสถิติ - นี่คือการแจกจ่ายการกระจายหน่วยของการรวมในกลุ่มในคุณสมบัติการแปรปรวนเฉพาะ
ขึ้นอยู่กับพื้นฐานพื้นฐานสำหรับการก่อตัวของจำนวนการกระจายเป็นที่โดดเด่น แอตทริบิวต์และช่วงการกระจายของการกระจาย.

การดำรงอยู่ของคุณสมบัติทั่วไปเป็นพื้นฐานสำหรับการก่อตัวของการรวมทางสถิติซึ่งแสดงถึงผลลัพธ์ของคำอธิบายหรือการวัดสัญญาณทั่วไปของวัตถุวิจัย

เรื่องของการศึกษาในสถิติกำลังเปลี่ยนแปลงคุณสมบัติ (แตกต่างกัน) หรือสัญญาณทางสถิติ

ประเภทของสัญญาณสถิติ.

แอตทริบิวต์เรียกแถวของการกระจายสร้างขึ้นตามคุณสมบัติคุณภาพ ที่แสดงที่แสดง - นี่คือสัญญาณที่มีชื่อ (ตัวอย่างเช่นอาชีพ: ช่างเย็บครู ฯลฯ )
หมายเลขการแจกจ่ายทำในรูปแบบของตาราง ในแท็บ 2.8 แสดงจำนวนแอตทริบิวต์ของการกระจาย
ตารางที่ 2.8 - การกระจายของประเภทของความช่วยเหลือทางกฎหมายที่มีให้แก่นักกฎหมายต่อพลเมืองของหนึ่งในภูมิภาคของสหพันธรัฐรัสเซีย

ชุดรูปแบบ - นี่คือค่าของคุณสมบัติ (หรือช่วงเวลาของค่า) และความถี่ของพวกเขา
ชุดรูปแบบการเรียกของการกระจายของการกระจายสร้างขึ้นบนพื้นฐานเชิงปริมาณ ชุดแปรผันใด ๆ ประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่
ตัวเลือกถือเป็นค่าที่แยกต่างหากของคุณสมบัติที่ใช้ในแถวที่แปรผัน
ความถี่เป็นตัวเลขของตัวแปรส่วนบุคคลหรือแต่ละกลุ่มของชุดรูปแบบ I.e เหล่านี้เป็นตัวเลขที่แสดงให้เห็นว่ามีตัวเลือกบางอย่างที่พบในการกระจายจำนวนมาก ผลรวมของความถี่ทั้งหมดกำหนดจำนวนของจำนวนทั้งสิ้นทั้งหมดปริมาณของมัน
ชิ้นส่วนเรียกว่าความถี่ที่แสดงในเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์เป็นผล ดังนั้นจำนวนความถี่เท่ากับ 1 หรือ 100% ช่วงรูปแบบช่วยให้ข้อมูลจริงเพื่อประเมินรูปแบบของกฎหมายการจัดจำหน่าย

ขึ้นอยู่กับลักษณะของการเปลี่ยนแปลงของคุณสมบัติแยกต่างหาก ชุดแปรปรวนและช่วงเวลาที่ไม่ต่อเนื่อง.
ตัวอย่างของชุดรูปแบบที่ไม่ต่อเนื่องจะได้รับในตาราง 2.9
ตารางที่ 2.9 - การกระจายครอบครัวในจำนวนห้องพักในอพาร์ทเมนท์แยกต่างหากในปี 1989 ในสหพันธรัฐรัสเซีย

ในคอลัมน์แรกของตารางตัวแปรของชุดรูปแบบการแยกจะถูกนำเสนอในวินาที - ความถี่ของช่วงรูปแบบจะถูกวางในตัวบ่งชี้ความถี่ที่สาม

ชุดรูปแบบ

ในประชากรทั่วไปมีการตรวจสอบสัญญาณเชิงปริมาณบางอย่าง มันสุ่มลบตัวอย่างของปริมาตร น.นั่นคือจำนวนองค์ประกอบการสุ่มตัวอย่างเท่ากับ น.. ในขั้นตอนแรกของการประมวลผลทางสถิติที่ผลิต มากมาย ตัวอย่าง, I.e. หมายเลขสั่งซื้อ x 1, x 2, ... , x n จากน้อยไปมาก. แต่ละค่าสังเกต x I.เรียกว่า ตัวเลือก. ความถี่ m i. - นี่คือจำนวนการสังเกตของมูลค่า x I. ในตัวอย่าง ความถี่สัมพัทธ์ (ความถี่) w i.- นี่คืออัตราส่วนความถี่ m i.ในปริมาณของตัวอย่าง น.: .
เมื่อศึกษาชุดแปรผันยังใช้แนวคิดของความถี่สะสมและความถี่สะสม อนุญาต เอ็กซ์ บางหมายเลข จากนั้นจำนวนตัวเลือก , ค่าที่น้อยกว่า เอ็กซ์เรียกว่าความถี่สะสม: สำหรับ x i น. มันเรียกว่าความถี่สะสม w ฉันแม็กซ์
คุณสมบัตินี้เรียกว่าแตกต่างกันไปอย่างแตกต่างกันหากค่าแต่ละค่า (ตัวเลือก) แตกต่างจากกันกับค่า จำกัด บางอย่าง (โดยปกติจะเป็นจำนวนเต็ม) ชุดที่หลากหลายของสัญลักษณ์ดังกล่าวเรียกว่าการแปรปรวนแบบไม่ต่อเนื่อง

ตารางที่ 1. มุมมองทั่วไปของช่วงความถี่ที่แตกต่างกัน

ค่าลงชื่อx I. x 1 x 2 x N
ความถี่m i. m 1. m 2. m n

เครื่องหมายถูกเรียกว่า variating อย่างต่อเนื่องหากค่าของมันแตกต่างจากกันที่ค่าขนาดเล็กโดยพลการ i.e. เครื่องหมายสามารถใช้ค่าใด ๆ ในบางช่วงเวลา ชุด Varrational แบบต่อเนื่องสำหรับคุณสมบัติดังกล่าวเรียกว่าช่วงเวลา

ตารางที่ 2. มุมมองทั่วไปของช่วงความถี่แปรผันช่วงเวลา

ตารางที่ 3. รูปภาพกราฟิกของชุดรูปแบบการแปรปรวน

แถวรูปหลายเหลี่ยมหรือฮิสโตแกรมฟังก์ชั่นการกระจายเชิงประจักษ์
ไม่ต่อเนื่องกัน
ช่วงเวลา
การดูผลลัพธ์ของการสังเกตที่ดำเนินการกำหนดจำนวนค่าของตัวเลือกที่ลดลงในช่วงเวลาที่เฉพาะเจาะจง สันนิษฐานว่าแต่ละช่วงเวลาเป็นเจ้าของหนึ่งในปลายของมัน: ในทุกกรณีที่เหลือ (บ่อยขึ้น) หรือในทุกกรณีที่ถูกต้องและความถี่หรือความถี่แสดงจำนวนตัวเลือกที่อยู่ในขอบเขตที่ระบุ ความแตกต่าง a I - A I +1เรียกว่าช่วงเวลาบางส่วน เพื่อลดความซับซ้อนของการคำนวณที่ตามมาความแปรปรวนช่วงเวลาสามารถถูกแทนที่ด้วยการแยกตามอัตภาพ ในกรณีนี้ค่ากลาง ผม.- ช่วงเวลาถูกนำไปใช้สำหรับตัวเลือก x I.และความถี่ช่วงเวลาที่สอดคล้องกัน m i. - สำหรับความถี่ของช่วงเวลานี้
สำหรับภาพกราฟิกของชุดรูปแบบการเปลี่ยนแปลงรูปหลายเหลี่ยมฮิสโตแกรมเส้นโค้งสะสมและฟังก์ชั่นการกระจายเชิงประจักษ์เป็นเรื่องปกติมากที่สุด

ในแท็บ 2.3 (การจัดกลุ่มของประชากรรัสเซียในแง่ของรายได้เฉลี่ยต่อคนในเดือนเมษายน 1994) ถูกนำเสนอ ชุด Varrational ช่วงเวลา.
แถวการกระจายที่สะดวกในการวิเคราะห์ด้วยภาพกราฟิกที่ช่วยให้คุณสามารถตัดสินและในรูปแบบของการกระจาย แนวคิดการมองเห็นของธรรมชาติของการเปลี่ยนแปลงในช่วงการเปลี่ยนแปลงความถี่จะได้รับ รูปหลายเหลี่ยมและฮิสโตแกรม.
รูปหลายเหลี่ยมใช้ในภาพของชุดรูปแบบที่ไม่ต่อเนื่อง.
แสดงตัวอย่างเช่นการกระจายกองทุนที่อยู่อาศัยแบบกราฟิกตามประเภทของอพาร์ทเมนท์ (ตารางที่ 2.10)
ตารางที่ 2.10 - การกระจายของมูลนิธิที่อยู่อาศัยของเขตเมืองจำแนกตามประเภทของอพาร์ทเมนท์ (ตัวเลขตามเงื่อนไข)


รูปที่. การกระจายรูปหลายเหลี่ยมของหุ้นที่อยู่อาศัย


บนแกน ordinate ไม่เพียง แต่ค่าความถี่เท่านั้น แต่ยังสามารถใช้ความถี่ของชุดรูปแบบการเปลี่ยนแปลงได้
ฮิสโตแกรมได้รับการยอมรับสำหรับรูปภาพของชุดรูปแบบช่วงเวลา. เมื่อสร้างฮิสโตแกรมใน Abscissa Axis ขนาดของช่วงเวลาจะถูกฝากและความถี่ที่ปรากฎโดยสี่เหลี่ยมที่สร้างขึ้นตามช่วงเวลาที่สอดคล้องกัน ความสูงของคอลัมน์ในกรณีที่มีช่วงเวลาเท่ากันควรเป็นสัดส่วนกับความถี่ ฮิสโตแกรมเป็นกราฟที่แถวที่ปรากฎในรูปแบบของการปนเปื้อนซึ่งกันและกัน
ฉันจะแสดงช่วงการกระจายช่วงรูปแบบกราฟิกที่กำหนดในตาราง 2.11
ตารางที่ 2.11 - การกระจายของครอบครัวในขนาดของพื้นที่ใช้สอยต่อคน (จำนวนตามเงื่อนไข)
n p / n กลุ่มของครอบครัวในขนาดของพื้นที่ใช้สอยต่อคน จำนวนครอบครัวที่มีพื้นที่นั่งเล่นที่กำหนด จำนวนครอบครัวสะสม
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
รวม 115 ----


รูปที่. 2.2 การกระจายฮิสโตแกรมของครอบครัวในขนาดของพื้นที่ใช้สอยต่อคน


การใช้ข้อมูลซีรี่ส์สะสม (ตารางที่ 2.11) สร้าง การกระจายการสะสม


รูปที่. 2.3 การกระจายการกระจายของครอบครัวในขนาดของพื้นที่ใช้สอยต่อคน


ภาพของแถวที่แปรผันในรูปแบบของสะสมนั้นมีประสิทธิภาพโดยเฉพาะอย่างยิ่งสำหรับชุดรูปแบบความถี่ที่แสดงในเศษส่วนหรือเปอร์เซ็นต์ต่อผลรวมของความถี่ของแถว
หากมีภาพกราฟิกของซีรี่ส์รุ่นแปรผันในรูปแบบของสะสมเพื่อเปลี่ยนแกนแล้วเราจะได้รับ ogiva. ในรูปที่ 2.4 แสดงให้เห็นถึงการโกงตามตารางข้อมูล 2.11
ฮิสโตแกรมสามารถแปลงเป็นรูปหลายเหลี่ยมการกระจายหากคุณพบกลางของสี่เหลี่ยมแล้วเชื่อมต่อจุดเหล่านี้ด้วยเส้นตรง รูปหลายเหลี่ยมการกระจายที่เกิดขึ้นจะแสดงในรูปที่ 2.2 เส้นประ
เมื่อสร้างฮิสโตแกรมของการกระจายของช่วงรูปแบบที่มีช่วงเวลาที่ไม่เท่ากันตามแนวแกน ordinate มันไม่ได้ใช้ความถี่ที่ใช้ แต่ความหนาแน่นของการกระจายของคุณลักษณะในช่วงเวลาที่สอดคล้องกัน
ความหนาแน่นของการกระจายเป็นความถี่ที่คำนวณต่อความกว้างของหน่วยของช่วงเวลา, I.e. กี่หน่วยในแต่ละกลุ่มคิดเป็นหน่วยของขนาดของช่วงเวลา ตัวอย่างของการคำนวณความหนาแน่นของการกระจายจะถูกนำเสนอในตาราง 2.12
ตารางที่ 2.12 - การกระจายของผู้ประกอบการตามจำนวนลูกจ้าง (ตัวเลขตามเงื่อนไข)
n p / n กลุ่มของผู้ประกอบการในจำนวนลูกจ้าง จำนวนผู้ประกอบการ ขนาดของช่วงเวลาผู้คน ความหนาแน่นของการกระจาย
แต่ 1 2 3=1/2
1 มากถึง 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
รวม 147 ---- ----

ภาพกราฟิกของซีรี่ส์ชุดรูปแบบสามารถใช้ได้ โค้งสะสม. ด้วยความช่วยเหลือของคณาม่วง (SUMS Curve) จำนวนของความถี่สะสมที่ปรากฎ ความถี่สะสมจะถูกกำหนดโดยการรวมความถี่ที่สอดคล้องกันในกลุ่มและแสดงจำนวนหน่วยของชุดที่มีค่าของแอตทริบิวต์ไม่เกินมูลค่าที่พิจารณา


รูปที่. 2.4 การแจกจ่ายอันธพาลของครอบครัวในขนาดของพื้นที่ใช้สอยต่อคน

เมื่อสร้างชุดของชุดรูปแบบช่วงเวลาตามแกน Abscissa ตัวแปรของแถวจะถูกเลื่อนออกไปและความถี่สะสมจะถูกสะสมตามแนวแกน

ชุดรูปแบบต่อเนื่อง

ชุด Varricational อย่างต่อเนื่อง - ซีรีส์ที่สร้างขึ้นบนพื้นฐานของคุณสมบัติทางสถิติเชิงปริมาณ ตัวอย่าง. ระยะเวลาเฉลี่ยของโรคของนักโทษ (วันต่อคน) ในช่วงฤดูใบไม้ร่วงฤดูหนาวในปีปัจจุบันมีจำนวน:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5


สิ่งพิมพ์ที่คล้ายกัน