พื้นฐานของการวิจัยแบบคัดเลือกและการสร้างกลุ่มตัวอย่างสุ่มอย่างง่าย ประชากรทั่วไปและการศึกษาตัวอย่าง ความถูกต้องทางสถิติ เกณฑ์การสุ่มตัวอย่างข้อมูล

ตัวอย่างหรือ กรอบตัวอย่าง- ชุดของกรณี (วิชา, วัตถุ, เหตุการณ์, ตัวอย่าง) โดยใช้ขั้นตอนบางอย่างซึ่งคัดเลือกจากประชากรทั่วไปเพื่อเข้าร่วมในการศึกษา

ลักษณะตัวอย่าง:

§ ลักษณะเชิงคุณภาพของกลุ่มตัวอย่าง - เราเลือกใครกันแน่ และเราใช้วิธีใดในการสร้างตัวอย่าง

§ ลักษณะเชิงปริมาณของกลุ่มตัวอย่าง - จำนวนตัวอย่างที่เราเลือก กล่าวคือ ขนาดกลุ่มตัวอย่าง

ต้องการตัวอย่าง

§ วัตถุประสงค์ของการศึกษานั้นกว้างขวางมาก ตัวอย่างเช่น ผู้บริโภคผลิตภัณฑ์ของบริษัทระดับโลกนั้นเป็นตลาดที่มีการกระจายตัวทางภูมิศาสตร์จำนวนมาก

§ มีความจำเป็นต้องรวบรวมข้อมูลเบื้องต้น

ขนาดตัวอย่าง

ขนาดตัวอย่าง- จำนวนเคสที่รวมอยู่ในกลุ่มตัวอย่าง ด้วยเหตุผลทางสถิติ ขอแนะนำให้จำนวนคดีเป็นอย่างน้อย 30-35

ตัวอย่างขึ้นอยู่กับและอิสระ

เมื่อเปรียบเทียบตัวอย่างสองตัวอย่าง (หรือมากกว่า) การพึ่งพาอาศัยกันนั้นเป็นพารามิเตอร์ที่สำคัญ หากเป็นไปได้ที่จะสร้างคู่ homomorphic (นั่นคือเมื่อกรณีหนึ่งจากตัวอย่าง X สอดคล้องกับหนึ่งกรณีและเพียงหนึ่งกรณีจากตัวอย่าง Y และในทางกลับกัน) สำหรับแต่ละกรณีในสองตัวอย่าง (และพื้นฐานของความสัมพันธ์นี้มีความสำคัญสำหรับลักษณะ วัดในตัวอย่าง) ตัวอย่างดังกล่าวเรียกว่า ขึ้นอยู่กับ. ตัวอย่างการเลือกขึ้นอยู่กับ:

§ คู่แฝด

§ การวัดคุณลักษณะใดๆ สองครั้งก่อนและหลังการทดลอง

§ สามีและภริยา

หากไม่มีความสัมพันธ์ดังกล่าวระหว่างกลุ่มตัวอย่าง ให้พิจารณาตัวอย่างเหล่านี้ เป็นอิสระ, ตัวอย่างเช่น:

§ ผู้ชายและผู้หญิง,

§ นักจิตวิทยาและนักคณิตศาสตร์

ดังนั้น ตัวอย่างอิสระจะมีขนาดเท่ากัน ในขณะที่ขนาดของตัวอย่างอิสระอาจแตกต่างกัน

ตัวอย่างจะถูกเปรียบเทียบโดยใช้เกณฑ์ทางสถิติต่างๆ:

§ แบบทดสอบของนักเรียน

§ การทดสอบวิลคอกสัน

§ Mann-Whitney U-test

§ เกณฑ์การลงนาม

การเป็นตัวแทน

ตัวอย่างอาจถือได้ว่าเป็นตัวแทนหรือไม่เป็นตัวแทน

ตัวอย่างของตัวอย่างที่ไม่เป็นตัวแทน

ในสหรัฐอเมริกา ตัวอย่างทางประวัติศาสตร์ที่มีชื่อเสียงที่สุดเรื่องหนึ่งของการสุ่มตัวอย่างแบบไม่เป็นตัวแทนถือเป็นกรณีที่เกิดขึ้นระหว่างการเลือกตั้งประธานาธิบดีในปี 2479 The Litrery Digest ซึ่งทำนายเหตุการณ์ในการเลือกตั้งครั้งก่อนได้สำเร็จหลายครั้ง ตัดสินการทำนายผิดโดยส่งบัตรลงคะแนนทดสอบ 10 ล้านใบไปยังสมาชิก เช่นเดียวกับผู้ที่ได้รับเลือกจากสมุดโทรศัพท์ของคนทั้งประเทศและผู้คนจากรายชื่อทะเบียนรถ ใน 25% ของบัตรลงคะแนนที่ส่งคืน (เกือบ 2.5 ล้าน) ลงคะแนนเสียงดังนี้:

§ 57% ชื่นชอบผู้สมัครพรรครีพับลิกัน Alf Landon

§ 40% เลือกประธานาธิบดี Franklin Roosevelt ที่เป็นประชาธิปไตยในขณะนั้น

ดังที่ทราบกันดีว่า Roosevelt ชนะการเลือกตั้งจริงด้วยคะแนนเสียงมากกว่า 60% ความผิดพลาดของ Litreary Digest คือ: ต้องการเพิ่มความเป็นตัวแทนของกลุ่มตัวอย่าง - เพราะพวกเขารู้ว่าสมาชิกส่วนใหญ่ของพวกเขาคิดว่าตัวเองเป็นพรรครีพับลิกัน - พวกเขาขยายตัวอย่างด้วยผู้คนที่เลือกจากสมุดโทรศัพท์และรายการลงทะเบียน อย่างไรก็ตาม พวกเขาไม่ได้คำนึงถึงความเป็นจริงร่วมสมัยและในความเป็นจริงคัดเลือกพรรครีพับลิกันมากขึ้น: ในช่วงภาวะเศรษฐกิจตกต่ำครั้งใหญ่ ส่วนใหญ่เป็นชนชั้นกลางและชั้นสูง (นั่นคือ รีพับลิกันส่วนใหญ่ ไม่ใช่พรรคเดโมแครต) ที่สามารถเป็นเจ้าของโทรศัพท์และรถยนต์ได้

แบบแปลนกลุ่มอาคารจากตัวอย่าง

แผนการสร้างกลุ่มมีหลายประเภทหลัก:

1. ศึกษากับกลุ่มทดลองและกลุ่มควบคุมที่อยู่ในสภาวะต่างๆ

§ ศึกษากับกลุ่มทดลองและกลุ่มควบคุมโดยใช้กลยุทธ์การเลือกคู่

2. วิจัยโดยใช้เพียงกลุ่มเดียว - ทดลอง

3. การวิจัยโดยใช้แผนแบบผสม (แฟกทอเรียล) - ทุกกลุ่มอยู่ในเงื่อนไขที่แตกต่างกัน

]ประเภทการสุ่มตัวอย่าง

ตัวอย่างแบ่งออกเป็นสองประเภท:

§ ความน่าจะเป็น

§ ความเป็นไปไม่ได้

ตัวอย่างความน่าจะเป็น

1. การสุ่มตัวอย่างความน่าจะเป็นอย่างง่าย:

§ การสุ่มตัวอย่างอย่างง่าย การใช้ตัวอย่างดังกล่าวมีพื้นฐานอยู่บนสมมติฐานที่ว่าผู้ตอบแต่ละรายมีแนวโน้มที่จะรวมอยู่ในกลุ่มตัวอย่างเท่าๆ กัน จากรายชื่อประชากรทั่วไป จะมีการรวบรวมการ์ดที่มีจำนวนผู้ตอบแบบสอบถาม พวกเขาจะถูกวางไว้ในสำรับ สับไพ่ และนำไพ่ออกจากไพ่โดยสุ่ม ตัวเลขจะถูกเขียนลงไป แล้วส่งคืนกลับ นอกจากนี้ ทำซ้ำขั้นตอนหลายๆ ครั้งตามขนาดตัวอย่างที่เราต้องการ ลบ: การทำซ้ำของหน่วยการเลือก

ขั้นตอนการสร้างตัวอย่างสุ่มอย่างง่ายประกอบด้วยขั้นตอนต่อไปนี้:

1. ต้องได้รับ รายการทั้งหมดสมาชิกของประชากรทั่วไปและหมายเลขรายการนี้ รายการดังกล่าว การเรียกคืน เรียกว่ากรอบการสุ่มตัวอย่าง

2. กำหนดขนาดกลุ่มตัวอย่างที่คาดหวัง นั่นคือ จำนวนผู้ตอบแบบสำรวจที่คาดหวัง

3. แยกตัวเลขออกจากตารางตัวเลขสุ่มตามที่เราต้องการหน่วยตัวอย่าง หากกลุ่มตัวอย่างควรมี 100 คน จะมีการสุ่มตัวเลข 100 ตัวจากตาราง ตัวเลขสุ่มเหล่านี้สามารถสร้างขึ้นได้ด้วยโปรแกรมคอมพิวเตอร์

4. เลือกจากรายการฐานการสังเกตที่มีตัวเลขตรงกับตัวเลขสุ่มที่เขียนไว้

§ การสุ่มตัวอย่างอย่างง่ายมีข้อดีที่ชัดเจน วิธีนี้เข้าใจง่ายมาก สามารถขยายผลการศึกษาไปยังประชากรที่ศึกษาได้ วิธีการอนุมานทางสถิติส่วนใหญ่เกี่ยวข้องกับการรวบรวมข้อมูลโดยใช้ตัวอย่างสุ่มอย่างง่าย อย่างไรก็ตาม วิธีการสุ่มตัวอย่างอย่างง่ายมีข้อจำกัดที่สำคัญอย่างน้อยสี่ประการ:

1. มักเป็นเรื่องยากที่จะสร้างกรอบการสุ่มตัวอย่างที่จะยอมให้สุ่มตัวอย่างอย่างง่าย

2. ผลลัพธ์ของการใช้ตัวอย่างสุ่มอย่างง่ายอาจเป็นประชากรจำนวนมาก หรือประชากรที่กระจายไปทั่วกลุ่มใหญ่ พื้นที่ทางภูมิศาสตร์ซึ่งเพิ่มเวลาและค่าใช้จ่ายในการรวบรวมข้อมูลอย่างมาก

3. ผลลัพธ์ของการใช้ตัวอย่างสุ่มอย่างง่ายมักมีลักษณะเฉพาะด้วยความแม่นยำต่ำและข้อผิดพลาดมาตรฐานที่ใหญ่กว่าผลลัพธ์ของการใช้วิธีความน่าจะเป็นแบบอื่น

4. อันเป็นผลมาจากการใช้ SRS อาจมีการสร้างตัวอย่างที่ไม่เป็นตัวแทน แม้ว่าตัวอย่างที่ได้จากการคัดเลือกแบบสุ่มอย่างง่าย โดยเฉลี่ยแล้ว แสดงถึงประชากรทั่วไปอย่างเพียงพอ แต่บางตัวอย่างก็แสดงถึงประชากรที่อยู่ระหว่างการศึกษาอย่างไม่ถูกต้องอย่างยิ่ง ความน่าจะเป็นนี้สูงโดยเฉพาะอย่างยิ่งกับกลุ่มตัวอย่างขนาดเล็ก

§ การสุ่มตัวอย่างแบบไม่ซ้ำแบบง่าย ขั้นตอนการสร้างตัวอย่างเหมือนกัน เฉพาะการ์ดที่มีหมายเลขของผู้ตอบแบบสอบถามเท่านั้นที่จะไม่ส่งคืนกลับไปที่สำรับ

1. การสุ่มตัวอย่างความน่าจะเป็นอย่างเป็นระบบ เป็นรุ่นที่เรียบง่ายของตัวอย่างความน่าจะเป็นอย่างง่าย ตามรายชื่อประชากรทั่วไป ผู้ตอบจะถูกเลือกในช่วงเวลาหนึ่ง (K) ค่าของ K ถูกกำหนดแบบสุ่ม ผลลัพธ์ที่น่าเชื่อถือที่สุดเกิดขึ้นได้จากประชากรทั่วไปที่เป็นเนื้อเดียวกัน มิฉะนั้น ขนาดขั้นตอนและรูปแบบวัฏจักรภายในของตัวอย่างอาจตรงกัน (การผสมตัวอย่าง) ข้อเสีย: เหมือนกับในตัวอย่างความน่าจะเป็นอย่างง่าย

2. การสุ่มตัวอย่างแบบอนุกรม (ซ้อนกัน) หน่วยสุ่มตัวอย่างเป็นชุดข้อมูลทางสถิติ (ครอบครัว โรงเรียน ทีม ฯลฯ) องค์ประกอบที่เลือกจะต้องได้รับการตรวจสอบอย่างต่อเนื่อง การเลือกหน่วยสถิติสามารถจัดตามประเภทของการสุ่มตัวอย่างแบบสุ่มหรือเป็นระบบ จุดด้อย: มีความเป็นไปได้ที่จะมีความเป็นเนื้อเดียวกันมากกว่าในประชากรทั่วไป

3. การสุ่มตัวอย่างแบบแบ่งโซน ในกรณีของประชากรที่ต่างกัน ก่อนที่จะใช้การสุ่มตัวอย่างความน่าจะเป็นกับเทคนิคการเลือกใดๆ ขอแนะนำให้แบ่งประชากรออกเป็นส่วนๆ ที่เป็นเนื้อเดียวกัน ตัวอย่างดังกล่าวเรียกว่าตัวอย่างแบบแบ่งโซน กลุ่มการแบ่งเขตสามารถเป็นได้ทั้งการก่อตัวตามธรรมชาติ (เช่น เขตเมือง) และลักษณะใดๆ ที่เป็นพื้นฐานของการศึกษา เครื่องหมายบนพื้นฐานของการแบ่งชั้นเรียกว่าเครื่องหมายของการแบ่งชั้นและการแบ่งเขต

4. การเลือก "สะดวก" ขั้นตอนการสุ่มตัวอย่าง "สะดวก" ประกอบด้วยการสร้างการติดต่อกับหน่วยสุ่มตัวอย่าง "สะดวก" - กับกลุ่มนักเรียน ทีมกีฬา กับเพื่อนและเพื่อนบ้าน หากคุณต้องการข้อมูลเกี่ยวกับปฏิกิริยาของผู้คนต่อ แนวคิดใหม่การเลือกดังกล่าวค่อนข้างสมเหตุสมผล การสุ่มตัวอย่างแบบ "สะดวก" มักใช้สำหรับการทดสอบแบบสอบถามเบื้องต้น

ตัวอย่างที่น่าทึ่ง

การคัดเลือกในตัวอย่างดังกล่าวไม่ได้ดำเนินการตามหลักการของโอกาส แต่เป็นไปตามเกณฑ์ส่วนตัว - การเข้าถึง ความธรรมดา การเป็นตัวแทนที่เท่าเทียมกัน ฯลฯ

1. ตัวอย่างโควต้า - ตัวอย่างถูกสร้างขึ้นเป็นแบบจำลองที่ทำซ้ำโครงสร้างของประชากรทั่วไปในรูปแบบของโควต้า (สัดส่วน) ของลักษณะการศึกษา จำนวนองค์ประกอบตัวอย่างที่มีลักษณะการผสมผสานที่แตกต่างกันระหว่างการศึกษาจะถูกกำหนดในลักษณะที่สอดคล้องกับสัดส่วน (สัดส่วน) ในประชากรทั่วไป ตัวอย่างเช่น ถ้าเรามีประชากรทั่วไป 5,000 คน ซึ่งผู้หญิง 2,000 คน และผู้ชาย 3,000 คน ในตัวอย่างโควตา เราจะมีผู้หญิง 20 คน ผู้ชาย 30 คน หรือผู้หญิง 200 คน และผู้ชาย 300 คน ตัวอย่างโควต้ามักขึ้นอยู่กับเกณฑ์ด้านประชากรศาสตร์ ได้แก่ เพศ อายุ ภูมิภาค รายได้ การศึกษา และอื่นๆ ข้อเสีย: โดยปกติตัวอย่างดังกล่าวจะไม่เป็นตัวแทนเพราะ เป็นไปไม่ได้ที่จะคำนึงถึงพารามิเตอร์ทางสังคมหลายอย่างพร้อมกัน ข้อดี: วัสดุที่เข้าถึงได้ง่าย

2. วิธีสโนว์บอล สร้างตัวอย่างได้ดังนี้ ขอให้ผู้ตอบแต่ละคนโดยเริ่มจากคนแรก ให้ติดต่อเพื่อน เพื่อนร่วมงาน คนรู้จัก ที่จะเข้าเงื่อนไขการคัดเลือกและสามารถมีส่วนร่วมในการศึกษาวิจัยได้ ดังนั้น ยกเว้นขั้นตอนแรก ตัวอย่างถูกสร้างขึ้นด้วยการมีส่วนร่วมของวัตถุที่ศึกษาด้วยตนเอง วิธีนี้มักใช้เมื่อจำเป็นต้องค้นหาและสัมภาษณ์กลุ่มผู้ตอบแบบสอบถามที่เข้าถึงยาก (เช่น ผู้ตอบแบบสอบถามที่มีรายได้สูง ผู้ตอบแบบสอบถามที่อยู่ในกลุ่มอาชีพเดียวกัน ผู้ตอบแบบสำรวจที่มีงานอดิเรก/ความสนใจคล้ายกัน เป็นต้น )

3. การสุ่มตัวอย่างที่เกิดขึ้นเอง - การสุ่มตัวอย่างที่เรียกว่า "ผู้มาก่อน" มักใช้ในการสำรวจทางโทรทัศน์และวิทยุ ขนาดและองค์ประกอบของตัวอย่างที่เกิดขึ้นเองไม่ทราบล่วงหน้าและถูกกำหนดโดยพารามิเตอร์เดียวเท่านั้น - กิจกรรมของผู้ตอบแบบสอบถาม ข้อเสีย: เป็นไปไม่ได้ที่จะระบุประเภทของประชากรทั่วไปที่ผู้ตอบแบบสอบถามเป็นตัวแทน และด้วยเหตุนี้จึงเป็นไปไม่ได้ที่จะระบุความเป็นตัวแทน

4. การสำรวจเส้นทาง - มักใช้ในกรณีที่หน่วยการศึกษาเป็นครอบครัว บนแผนที่ ท้องที่ที่ที่จะดำเนินการสำรวจ จะมีเลขที่ถนนทุกสาย โดยใช้ตาราง (ตัวสร้าง) ของตัวเลขสุ่ม ตัวเลขจำนวนมากจะถูกเลือก จำนวนมหาศาลแต่ละจำนวนจะพิจารณาจากองค์ประกอบ 3 ส่วน ได้แก่ เลขที่ถนน (2-3 ตัวแรก) เลขที่บ้าน เลขที่อพาร์ตเมนต์ ตัวอย่างเช่น หมายเลข 14832: 14 คือเลขที่ถนนบนแผนที่ 8 คือเลขที่บ้าน 32 คือเลขที่อพาร์ตเมนต์

5. การสุ่มตัวอย่างแบบแบ่งโซนพร้อมการเลือกวัตถุทั่วไป หากหลังจากแบ่งเขตแล้ว วัตถุทั่วไปจะถูกเลือกจากแต่ละกลุ่ม เช่น วัตถุที่เข้าใกล้ค่าเฉลี่ยในแง่ของคุณลักษณะส่วนใหญ่ที่ศึกษาในการศึกษา ตัวอย่างดังกล่าวเรียกว่าโซนที่มีการเลือกวัตถุทั่วไป

6.การเลือกโมดอล 7. ตัวอย่างผู้เชี่ยวชาญ 8. ตัวอย่างที่ต่างกัน

กลยุทธ์การสร้างกลุ่ม

การเลือกกลุ่มสำหรับการมีส่วนร่วมในการทดลองทางจิตวิทยานั้นดำเนินการโดยใช้กลยุทธ์ต่างๆ ซึ่งจำเป็นเพื่อให้แน่ใจว่าสอดคล้องกับความถูกต้องภายในและภายนอกมากที่สุด

§ การสุ่ม (สุ่มเลือก)

§ การเลือกคู่

§ การเลือก Stratometric

§ การสร้างแบบจำลองโดยประมาณ

§ ดึงดูดกลุ่มจริง

การสุ่มตัวอย่าง

การสุ่มตัวอย่าง, หรือ สุ่มเลือก, ใช้เพื่อสร้างตัวอย่างสุ่มอย่างง่าย การใช้ตัวอย่างดังกล่าวมีพื้นฐานอยู่บนสมมติฐานที่ว่าสมาชิกของประชากรแต่ละคนมีแนวโน้มที่จะถูกรวมไว้ในกลุ่มตัวอย่างเท่าๆ กัน ตัวอย่างเช่น ในการสุ่มตัวอย่างนักศึกษามหาวิทยาลัย 100 คน คุณสามารถใส่กระดาษที่มีชื่อนักศึกษามหาวิทยาลัยทุกคนใส่หมวก แล้วหยิบกระดาษ 100 แผ่นออกมา ซึ่งจะเป็นการสุ่มเลือก (Goodwin J. , หน้า 147).

การเลือกคู่

การเลือกคู่- กลยุทธ์สำหรับการสร้างกลุ่มตัวอย่าง ซึ่งกลุ่มวิชาประกอบด้วยอาสาสมัครที่เทียบเท่ากันในแง่ของพารามิเตอร์ข้างเคียงที่มีนัยสำคัญสำหรับการทดลอง กลยุทธ์นี้ใช้ได้ผลสำหรับการทดลองโดยใช้กลุ่มทดลองและกลุ่มควบคุมที่มีตัวเลือกที่ดีที่สุด - ดึงดูดคู่แฝด (โมโน- และไดไซโกติก) เนื่องจากช่วยให้คุณสร้าง ...

การเลือก Stratometric

การเลือก Stratometric- การสุ่มด้วยการจัดสรรชั้น (หรือกลุ่ม) ด้วยวิธีสุ่มตัวอย่างนี้ ประชากรทั่วไปจะถูกแบ่งออกเป็นกลุ่ม (ชั้น) ที่มีลักษณะเฉพาะ (เพศ อายุ ความชอบทางการเมือง การศึกษา ระดับรายได้ ฯลฯ) และเลือกกลุ่มตัวอย่างที่มีลักษณะที่สอดคล้องกัน

การสร้างแบบจำลองโดยประมาณ

การสร้างแบบจำลองโดยประมาณ- ร่างตัวอย่างที่จำกัดและสรุปข้อสรุปเกี่ยวกับกลุ่มตัวอย่างนี้ให้กับประชากรในวงกว้าง ตัวอย่างเช่น เมื่อเข้าร่วมการศึกษาของนักศึกษาชั้นปีที่ 2 ของมหาวิทยาลัย ข้อมูลของการศึกษานี้จะขยายไปถึง "ผู้ที่มีอายุ 17 ถึง 21 ปี" การยอมรับของลักษณะทั่วไปดังกล่าวมีจำกัดอย่างมาก

แบบจำลองโดยประมาณคือการก่อตัวของแบบจำลองสำหรับคลาสของระบบ (กระบวนการ) ที่กำหนดไว้อย่างชัดเจน อธิบายพฤติกรรมของมัน (หรือปรากฏการณ์ที่ต้องการ) ด้วยความแม่นยำที่ยอมรับได้

การสุ่มตัวอย่างใน 1C 8.2 และ 8.3 เป็นวิธีพิเศษในการจัดเรียงระเบียนของตาราง infobase มาดูกันดีกว่าว่าการสุ่มตัวอย่างคืออะไรและใช้งานอย่างไร

ตัวอย่างใน 1C คืออะไร?

ตัวอย่าง- วิธีการจัดเรียงข้อมูลใน 1C ซึ่งประกอบด้วยการวางเคอร์เซอร์ในระเบียนถัดไปตามลำดับ การเลือกใน 1C สามารถรับได้จากผลลัพธ์การสืบค้นและจากตัวจัดการวัตถุ เช่น เอกสารหรือไดเร็กทอรี

ตัวอย่างการรับและการวนซ้ำจากตัวจัดการวัตถุ:

การเลือก = ไดเรกทอรี ธนาคาร เลือก() ; ในขณะที่การเลือก ถัดไป() รอบ EndCycle ;

ตัวอย่างการรับการเลือกจากแบบสอบถาม:

รับบทเรียนวิดีโอ 267 1C ฟรี:

คำขอ = คำขอใหม่ ( "เลือกลิงค์ รหัส ชื่อจากไดเร็กทอรี ธนาคาร") ; ตัวอย่าง = คำขอ ดำเนินการ() . เลือก() ; ในขณะที่การเลือก ถัดไป() วนรอบ //ดำเนินการที่น่าสนใจด้วยไดเร็กทอรี "Banks"สิ้นสุดรอบ ;

ตัวอย่างทั้งสองข้างต้นได้รับชุดข้อมูลเดียวกันเพื่อทำซ้ำ

วิธีการสุ่มตัวอย่าง 1C 8.3

การเลือกมีหลายวิธี ลองพิจารณาในรายละเอียดเพิ่มเติม:

เลือก()- วิธีการที่ได้มาซึ่งตัวอย่างโดยตรง จากการเลือก คุณจะได้รับอีกรายการหนึ่ง ผู้ใต้บังคับบัญชา การเลือก หากระบุประเภทบายพาส "โดยการจัดกลุ่ม"
เจ้าของ()เป็นวิธีการย้อนกลับของ Select() ช่วยให้คุณได้รับการเลือกคิวรี "พาเรนต์"
ต่อไป()- วิธีการที่ย้ายเคอร์เซอร์ไปยังระเบียนถัดไป ส่งกลับค่า True หากมีเร็กคอร์ด, ค่าเท็จหากไม่มีเร็กคอร์ดเพิ่มเติม
ค้นหาถัดไป()- มาก วิธีที่เป็นประโยชน์ซึ่งคุณสามารถวนซ้ำได้เฉพาะฟิลด์ที่จำเป็นตามค่าของการเลือก (การเลือกคือโครงสร้างของฟิลด์)
ถัดไปByFieldValue()- ช่วยให้คุณได้รับบันทึกถัดไปด้วยค่าที่แตกต่างจากตำแหน่งปัจจุบัน ตัวอย่างเช่น มีความจำเป็นต้องวนซ้ำทุกระเบียนด้วย คุณค่าอันเป็นเอกลักษณ์ฟิลด์ "บัญชี": Selection.NextBy FieldValue ("บัญชี")
รีเซ็ต()- ให้คุณรีเซ็ตตำแหน่งปัจจุบันของเคอร์เซอร์และตั้งเป็นตำแหน่งเดิม
ปริมาณ()- ส่งกลับจำนวนเรคคอร์ดในส่วนที่เลือก
รับ()- ใช้วิธีการนี้คุณสามารถตั้งค่าเคอร์เซอร์บนระเบียนที่ต้องการด้วยค่าดัชนี
ระดับ() -ระดับในลำดับชั้นของรายการปัจจุบัน (หมายเลข)
ประเภทระเบียน ()— แสดงประเภทบันทึก — DetailRecord, GroupTotal, HierarchyTotal หรือ GrandTotal
การจัดกลุ่ม()- ส่งกลับชื่อของการจัดกลุ่มปัจจุบัน ถ้าเร็กคอร์ดไม่ใช่การจัดกลุ่ม - สตริงว่าง

หากคุณกำลังเริ่มเรียนรู้การเขียนโปรแกรม 1C เราขอแนะนำ คอร์สฟรี(อย่าลืม

ประชากร- ชุดของหน่วยที่มีลักษณะมวล ลักษณะเฉพาะ ความสม่ำเสมอเชิงคุณภาพ และการมีอยู่ของการแปรผัน

ประชากรทางสถิติประกอบด้วยวัตถุที่มีอยู่อย่างเป็นรูปธรรม (พนักงาน สถานประกอบการ ประเทศ ภูมิภาค) เป็นวัตถุ

หน่วยประชากร- แต่ละหน่วยเฉพาะของประชากรทางสถิติ

ประชากรทางสถิติเดียวกันสามารถเป็นเนื้อเดียวกันในลักษณะหนึ่งและต่างกันในอีกลักษณะหนึ่ง

ความสม่ำเสมอเชิงคุณภาพ- ความคล้ายคลึงกันของทุกหน่วยของประชากรสำหรับคุณลักษณะใด ๆ และความแตกต่างสำหรับส่วนที่เหลือทั้งหมด

ในประชากรทางสถิติ ความแตกต่างระหว่างหนึ่งหน่วยของประชากรกับอีกหน่วยหนึ่งมักจะมีลักษณะเชิงปริมาณมากกว่า การเปลี่ยนแปลงเชิงปริมาณในค่าแอตทริบิวต์ของหน่วยต่าง ๆ ของประชากรเรียกว่าการเปลี่ยนแปลง

รูปแบบคุณลักษณะ- การเปลี่ยนแปลงเชิงปริมาณของเครื่องหมาย (สำหรับเครื่องหมายเชิงปริมาณ) ระหว่างการเปลี่ยนจากหน่วยของประชากรหนึ่งไปยังอีกหน่วยหนึ่ง

เข้าสู่ระบบ- นี่คือคุณสมบัติ คุณลักษณะเฉพาะ หรือคุณลักษณะอื่น ๆ ของหน่วย วัตถุ และปรากฏการณ์ที่สามารถสังเกตหรือวัดได้ สัญญาณแบ่งออกเป็นเชิงปริมาณและเชิงคุณภาพ ความหลากหลายและความแปรปรวนของมูลค่าของคุณลักษณะในแต่ละหน่วยของประชากรเรียกว่า รูปแบบต่างๆ.

ลักษณะเฉพาะ (เชิงคุณภาพ) ไม่สามารถวัดได้ (องค์ประกอบของประชากรตามเพศ) ลักษณะเชิงปริมาณมีนิพจน์เชิงตัวเลข (องค์ประกอบของประชากรตามอายุ)

ดัชนี- เป็นลักษณะทั่วไปเชิงคุณภาพเชิงปริมาณของทรัพย์สินใด ๆ ของหน่วยหรือมวลรวมโดยรวมในเงื่อนไขเฉพาะของเวลาและสถานที่

ตารางสรุปสถิติเป็นชุดของตัวชี้วัดที่สะท้อนปรากฏการณ์ที่กำลังศึกษาอย่างครอบคลุม

ตัวอย่างเช่น พิจารณาเงินเดือน:

ลงชื่อ - ค่าจ้าง
สถิติประชากร - พนักงานทั้งหมด
หน่วยของประชากรคือคนงานแต่ละคน
ความสม่ำเสมอในเชิงคุณภาพ - เงินเดือนค้างจ่าย
รูปแบบคุณลักษณะ - ชุดตัวเลข

ประชากรทั่วไปและกลุ่มตัวอย่างจากมัน

พื้นฐานคือชุดข้อมูลที่ได้รับจากการวัดคุณสมบัติตั้งแต่หนึ่งอย่างขึ้นไป ชุดของวัตถุที่สังเกตได้จริง แทนด้วยชุดการสังเกตทางสถิติ ตัวแปรสุ่ม, เป็น การสุ่มตัวอย่างและสิ่งที่มีอยู่สมมุติ (คิดออก) - ประชากรทั่วไป. ประชากรทั่วไปสามารถมีได้จำกัด (จำนวนการสังเกต N = const) หรืออนันต์ ( ยังไม่มีข้อความ = ∞) และกลุ่มตัวอย่างจากประชากรทั่วไปมักเป็นผลจากการสังเกตจำนวนจำกัดเสมอ จำนวนการสังเกตที่ประกอบขึ้นเป็นตัวอย่างเรียกว่า ขนาดตัวอย่าง. ถ้าขนาดตัวอย่างใหญ่พอ n→∞) ถือว่าตัวอย่าง ใหญ่มิฉะนั้นจะเรียกว่าตัวอย่าง ปริมาณจำกัด. ถือว่าตัวอย่าง เล็กถ้าเมื่อวัดตัวแปรสุ่มแบบหนึ่งมิติ ขนาดตัวอย่างไม่เกิน 30 ( น<= 30 ) และเมื่อวัดพร้อมกันหลาย ๆ ( k) คุณสมบัติในความสัมพันธ์อวกาศหลายมิติ นถึง kน้อยกว่า 10 (n/k< 10) . แบบฟอร์มตัวอย่าง ซีรีส์รูปแบบต่างๆถ้าสมาชิกของมันคือ สถิติการสั่งซื้อนั่นคือ ค่าตัวอย่างของตัวแปรสุ่ม Xจะเรียงลำดับจากน้อยไปมาก (อันดับ) ค่าของแอตทริบิวต์เรียกว่า ตัวเลือก.

ตัวอย่าง. ชุดออบเจ็กต์ที่สุ่มเลือกเกือบเหมือนกัน - ธนาคารพาณิชย์ของเขตการปกครองแห่งหนึ่งของมอสโก ถือได้ว่าเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทั้งหมดในเขตนี้ และเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทั้งหมดในมอสโก ตลอดจนตัวอย่างธนาคารพาณิชย์ในประเทศ เป็นต้น

วิธีการสุ่มตัวอย่างพื้นฐาน

ความน่าเชื่อถือของข้อสรุปทางสถิติและการตีความผลลัพธ์ที่มีความหมายขึ้นอยู่กับ ตัวแทนตัวอย่าง เช่น ความครบถ้วนสมบูรณ์และความเพียงพอของการนำเสนอคุณสมบัติของประชากรทั่วไป โดยสัมพันธ์กับตัวอย่างนี้ถือได้ว่าเป็นตัวแทน การศึกษาคุณสมบัติทางสถิติของประชากรสามารถจัดได้ 2 วิธี คือ ใช้ ต่อเนื่องและ ไม่ต่อเนื่อง การสังเกตอย่างต่อเนื่องรวมถึงการตรวจสอบทั้งหมด หน่วยเรียน มวลรวม, แ การสังเกตแบบไม่ต่อเนื่อง (แบบเลือก)- เฉพาะบางส่วนเท่านั้น

มีห้าวิธีหลักในการจัดระเบียบการสุ่มตัวอย่าง:

1. สุ่มสุ่มง่ายๆซึ่งวัตถุจะถูกสุ่มเลือกจากประชากรทั่วไปของวัตถุ (เช่น โดยใช้ตารางหรือตัวสร้างตัวเลขสุ่ม) และตัวอย่างที่เป็นไปได้แต่ละรายการจะมีความน่าจะเป็นเท่ากัน ตัวอย่างดังกล่าวเรียกว่า สุ่มจริงๆ;

2. คัดเลือกอย่างง่ายผ่านขั้นตอนปกติดำเนินการโดยใช้ส่วนประกอบทางกล (เช่น วันที่ วันในสัปดาห์ หมายเลขอพาร์ตเมนต์ ตัวอักษรของตัวอักษร ฯลฯ) และเรียกตัวอย่างที่ได้รับในลักษณะนี้ เครื่องกล;

3. แบ่งชั้นการคัดเลือกประกอบด้วยความจริงที่ว่าประชากรทั่วไปของปริมาตรถูกแบ่งออกเป็นส่วนย่อยหรือชั้น (ชั้น) ของปริมาตรเพื่อให้ ชั้นเป็นวัตถุที่เป็นเนื้อเดียวกันในแง่ของลักษณะทางสถิติ (เช่น ประชากรแบ่งออกเป็นชั้นตามกลุ่มอายุหรือชนชั้นทางสังคม วิสาหกิจตามอุตสาหกรรม) ในกรณีนี้จะเรียกตัวอย่าง แบ่งชั้น(มิฉะนั้น, แบ่งชั้น, ตามแบบฉบับ, แบ่งโซน);

4. วิธีการ ซีเรียลการเลือกใช้ในการสร้าง ซีเรียลหรือ ตัวอย่างที่ซ้อนกัน. สะดวกหากจำเป็นต้องตรวจสอบ "บล็อก" หรือชุดของวัตถุในคราวเดียว (เช่น การส่งสินค้า ผลิตภัณฑ์บางชุด หรือจำนวนประชากรในแผนกปกครองและดินแดนของประเทศ) การเลือกซีรีส์สามารถทำได้แบบสุ่มหรือแบบกลไก ในเวลาเดียวกัน การสำรวจอย่างต่อเนื่องของสินค้าบางชุดหรือหน่วยอาณาเขตทั้งหมด (อาคารที่อยู่อาศัยหรือหนึ่งในสี่) จะดำเนินการ

5. รวมกัน(ขั้นตอน) การเลือกสามารถรวมวิธีการเลือกได้หลายแบบพร้อมกัน (เช่น การแบ่งชั้นและการสุ่มหรือสุ่มและทางกล) ตัวอย่างดังกล่าวเรียกว่า รวมกัน.

ประเภทการเลือก

โดย จิตใจมีทั้งแบบเดี่ยว แบบกลุ่ม และแบบรวม ที่ การเลือกรายบุคคลแต่ละหน่วยของประชากรทั่วไปถูกเลือกในชุดตัวอย่างด้วย การเลือกกลุ่มเป็นกลุ่มที่เป็นเนื้อเดียวกันในเชิงคุณภาพ (ชุด) ของหน่วยและ การเลือกแบบผสมผสานเกี่ยวข้องกับการรวมกันของประเภทที่หนึ่งและสอง

โดย กระบวนการการเลือกแยกแยะ ซ้ำแล้วซ้ำเล่าตัวอย่าง.

หยาบคายเรียกว่าการคัดเลือกซึ่งหน่วยที่ตกอยู่ในกลุ่มตัวอย่างจะไม่กลับสู่ประชากรเดิมและไม่มีส่วนร่วมในการเลือกต่อไป ในขณะที่จำนวนหน่วยประชากรทั่วไป นู๋ลดลงในระหว่างกระบวนการคัดเลือก ที่ ซ้ำการเลือก จับได้ในตัวอย่าง หน่วยหลังการลงทะเบียนจะถูกส่งคืนให้กับประชากรทั่วไปและด้วยเหตุนี้จึงยังคงรักษาโอกาสที่เท่าเทียมกันพร้อมกับหน่วยอื่น ๆ เพื่อใช้ในขั้นตอนการคัดเลือกต่อไป ในขณะที่จำนวนหน่วยประชากรทั่วไป นู๋ยังคงไม่เปลี่ยนแปลง (วิธีนี้ไม่ค่อยใช้ในการศึกษาทางสังคมและเศรษฐกิจ) อย่างไรก็ตามด้วยขนาดใหญ่ ไม่มี (N → ∞)สูตรสำหรับ ไม่ซ้ำการเลือกใกล้เคียงกับผู้ที่สำหรับ ซ้ำการเลือกและหลังใช้บ่อยกว่า ( N = const).

ลักษณะสำคัญของพารามิเตอร์ของประชากรทั่วไปและกลุ่มตัวอย่าง

พื้นฐานของข้อสรุปทางสถิติของการศึกษาคือการแจกแจงตัวแปรสุ่ม ในขณะที่ค่าที่สังเกตได้ (x 1, x 2, ..., xn)เรียกว่า การตระหนักรู้ของตัวแปรสุ่ม X(n คือขนาดตัวอย่าง) การกระจายตัวของตัวแปรสุ่มในกลุ่มประชากรทั่วไปเป็นไปตามทฤษฎี ธรรมชาติในอุดมคติ และตัวอย่างอะนาล็อกคือ เชิงประจักษ์การกระจาย. การแจกแจงทางทฤษฎีบางอย่างได้รับการวิเคราะห์เช่น พวกเขา ตัวเลือกกำหนดค่าของฟังก์ชันการกระจายในแต่ละจุดในช่องว่างของค่าที่เป็นไปได้ของตัวแปรสุ่ม สำหรับตัวอย่างจึงเป็นเรื่องยากและบางครั้งก็เป็นไปไม่ได้ที่จะกำหนดฟังก์ชันการกระจายดังนั้น ตัวเลือกประมาณจากข้อมูลเชิงประจักษ์ แล้วแทนที่ด้วยนิพจน์เชิงวิเคราะห์ที่อธิบายการแจกแจงเชิงทฤษฎี ในกรณีนี้ สมมติฐาน (หรือ สมมติฐาน) เกี่ยวกับประเภทของการแจกแจงสามารถเป็นได้ทั้งความถูกต้องทางสถิติและผิดพลาด แต่ในกรณีใด ๆ การแจกแจงเชิงประจักษ์ที่สร้างขึ้นใหม่จากตัวอย่างจะแสดงลักษณะเฉพาะคร่าวๆ เท่านั้น พารามิเตอร์การกระจายที่สำคัญที่สุดคือ มูลค่าที่คาดหวังและการกระจายตัว

โดยธรรมชาติแล้วการแจกแจงคือ ต่อเนื่องและ ไม่ต่อเนื่อง. การแจกแจงแบบต่อเนื่องที่รู้จักกันดีที่สุดคือ ปกติ. การเปรียบเทียบแบบเลือกพารามิเตอร์และสำหรับมันคือ: ค่าเฉลี่ยและความแปรปรวนเชิงประจักษ์ ในบรรดาการศึกษาทางสังคมและเศรษฐกิจที่ไม่ต่อเนื่องกันมักใช้บ่อยที่สุด ทางเลือก (dichotomous)การกระจาย. พารามิเตอร์ความคาดหวังของการแจกแจงนี้แสดงค่าสัมพัทธ์ (หรือ แบ่งปัน) หน่วยของประชากรที่มีคุณสมบัติตามการศึกษา (ระบุด้วยตัวอักษร ); สัดส่วนของประชากรที่ไม่มีคุณลักษณะนี้แสดงด้วยตัวอักษร q (q = 1 - p). ความแปรปรวนของการกระจายทางเลือกยังมีแอนะล็อกเชิงประจักษ์

ขึ้นอยู่กับประเภทของการกระจายและวิธีการเลือกหน่วยประชากร ลักษณะของพารามิเตอร์การกระจายจะถูกคำนวณแตกต่างกัน ตัวหลักสำหรับการแจกแจงเชิงทฤษฎีและเชิงประจักษ์แสดงไว้ในตาราง หนึ่ง.

แชร์ตัวอย่าง k nคืออัตราส่วนของจำนวนหน่วยของประชากรตัวอย่างต่อจำนวนหน่วยของประชากรทั่วไป:

k n = n/N.

แบ่งปันตัวอย่าง wคือ อัตราส่วนของหน่วยที่มีคุณสมบัติตามการศึกษา xขนาดตัวอย่าง น:

w = น n / n.

ตัวอย่าง.ในชุดสินค้าที่มี 1,000 หน่วย โดยมีตัวอย่าง 5% เศษส่วนตัวอย่าง k nในค่าสัมบูรณ์คือ 50 หน่วย (n = N*0.05); หากพบสินค้าชำรุด 2 ชิ้นในตัวอย่างนี้ เศษส่วนตัวอย่าง wจะเป็น 0.04 (w = 2/50 = 0.04 หรือ 4%)

เนื่องจากประชากรกลุ่มตัวอย่างแตกต่างจากประชากรทั่วไปจึงมี ข้อผิดพลาดในการสุ่มตัวอย่าง.

ตารางที่ 1. พารามิเตอร์หลักของประชากรทั่วไปและกลุ่มตัวอย่าง

ข้อผิดพลาดในการสุ่มตัวอย่าง

หากเกิดข้อผิดพลาด (แบบคงที่และแบบเลือก) ใด ๆ ของสองประเภท: การลงทะเบียนและการเป็นตัวแทน ความผิดพลาด การลงทะเบียนสามารถมี สุ่มและ เป็นระบบอักขระ. สุ่มข้อผิดพลาดเกิดจากสาเหตุที่ไม่สามารถควบคุมได้หลายอย่าง เกิดขึ้นโดยไม่ได้ตั้งใจ และมักจะสร้างสมดุลให้กันและกัน (เช่น การเปลี่ยนแปลงในการอ่านค่าเครื่องมือเนื่องจากความผันผวนของอุณหภูมิในห้อง)

เป็นระบบข้อผิดพลาดมีอคติ เนื่องจากเป็นการละเมิดกฎการเลือกวัตถุในตัวอย่าง (เช่น การเบี่ยงเบนในการวัดเมื่อเปลี่ยนการตั้งค่าของอุปกรณ์วัด)

ตัวอย่าง.เพื่อประเมินสถานะทางสังคมของประชากรในเมือง มีแผนจะตรวจสอบ 25% ของครอบครัว อย่างไรก็ตาม หากการเลือกอพาร์ทเมนต์ทุกสี่ห้องขึ้นอยู่กับจำนวน การเลือกอพาร์ทเมนท์ทั้งหมดประเภทเดียวเท่านั้น (เช่น อพาร์ตเมนต์แบบหนึ่งห้อง) มีความเสี่ยงที่จะเกิดข้อผิดพลาดอย่างเป็นระบบและบิดเบือนผลลัพธ์ ทางเลือกของหมายเลขอพาร์ตเมนต์จะดีกว่าเนื่องจากข้อผิดพลาดจะเป็นแบบสุ่ม

ข้อผิดพลาดในการเป็นตัวแทนมีอยู่ในการสังเกตแบบคัดเลือกเท่านั้นไม่สามารถหลีกเลี่ยงได้และเกิดขึ้นจากข้อเท็จจริงที่ว่ากลุ่มตัวอย่างไม่สามารถทำซ้ำได้อย่างสมบูรณ์ ค่าของตัวบ่งชี้ที่ได้จากตัวอย่างแตกต่างจากตัวบ่งชี้ของค่าเดียวกันในประชากรทั่วไป (หรือได้รับระหว่างการสังเกตอย่างต่อเนื่อง)

ข้อผิดพลาดในการสุ่มตัวอย่างคือความแตกต่างระหว่างค่าพารามิเตอร์ในกลุ่มประชากรทั่วไปกับค่าตัวอย่าง สำหรับค่าเฉลี่ยของแอตทริบิวต์เชิงปริมาณ จะเท่ากับ: และสำหรับส่วนแบ่ง (แอตทริบิวต์ทางเลือก) -

ข้อผิดพลาดในการสุ่มตัวอย่างมีอยู่ในการสังเกตตัวอย่างเท่านั้น ยิ่งข้อผิดพลาดเหล่านี้มากเท่าใด การแจกแจงเชิงประจักษ์ก็จะยิ่งแตกต่างจากข้อผิดพลาดทางทฤษฎีมากเท่านั้น พารามิเตอร์ของการแจกแจงเชิงประจักษ์และเป็นตัวแปรสุ่ม ดังนั้น ข้อผิดพลาดในการสุ่มตัวอย่างจึงเป็นตัวแปรสุ่มด้วย โดยสามารถนำค่าต่างๆ มาใช้กับตัวอย่างต่างๆ ได้ ดังนั้นจึงเป็นธรรมเนียมในการคำนวณ ข้อผิดพลาดเฉลี่ย.

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยเป็นค่าที่แสดงค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่างจากการคาดหมายทางคณิตศาสตร์ ค่านี้ขึ้นอยู่กับหลักการของการเลือกแบบสุ่ม ขึ้นอยู่กับขนาดกลุ่มตัวอย่างและระดับความแปรผันของคุณลักษณะเป็นหลัก: ยิ่งความแปรผันของลักษณะเฉพาะยิ่งมากยิ่งน้อย (ดังนั้น ค่าของ ) ค่าของ ข้อผิดพลาดในการสุ่มตัวอย่างเฉลี่ย อัตราส่วนระหว่างความแปรปรวนของประชากรทั่วไปและกลุ่มตัวอย่างแสดงโดยสูตร:

เหล่านั้น. สำหรับขนาดใหญ่เพียงพอ เราสามารถสรุปได้ว่า ข้อผิดพลาดในการสุ่มตัวอย่างเฉลี่ยแสดงความเบี่ยงเบนที่เป็นไปได้ของพารามิเตอร์ของประชากรตัวอย่างจากพารามิเตอร์ของประชากรทั่วไป ในตาราง. 2 แสดงนิพจน์สำหรับการคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับวิธีการต่างๆ ในการจัดระเบียบการสังเกต

ตารางที่ 2 ค่าคลาดเคลื่อนเฉลี่ย (m) ของค่าเฉลี่ยตัวอย่างและสัดส่วนของตัวอย่างประเภทต่างๆ

ค่าเฉลี่ยของความแปรปรวนตัวอย่างภายในกลุ่มสำหรับคุณลักษณะต่อเนื่องอยู่ที่ไหน

ค่าเฉลี่ยของการกระจายภายในกลุ่มของการแบ่งปัน

— จำนวนชุดที่เลือก — จำนวนชุดทั้งหมด;

ค่าเฉลี่ยของชุดที่ th อยู่ที่ไหน

- ค่าเฉลี่ยทั่วไปของตัวอย่างทั้งหมดสำหรับคุณลักษณะต่อเนื่อง

โดยที่สัดส่วนของคุณลักษณะในชุดที่ th คือ

— ส่วนแบ่งทั้งหมดของลักษณะเฉพาะในกลุ่มตัวอย่างทั้งหมด

อย่างไรก็ตาม ขนาดของข้อผิดพลาดเฉลี่ยสามารถตัดสินได้ด้วยความน่าจะเป็นที่แน่นอน Р (Р ≤ 1) Lyapunov A.M. พิสูจน์ว่าการกระจายตัวของค่าเฉลี่ยตัวอย่าง และด้วยเหตุนี้การเบี่ยงเบนจากค่าเฉลี่ยทั่วไปด้วยจำนวนที่มากพอ เป็นไปตามกฎการแจกแจงแบบปกติโดยประมาณ โดยมีเงื่อนไขว่าประชากรทั่วไปมีค่าเฉลี่ยจำกัดและความแปรปรวนจำกัด

ในทางคณิตศาสตร์ ข้อความสำหรับค่าเฉลี่ยนี้แสดงเป็น:

และสำหรับเศษส่วน นิพจน์ (1) จะอยู่ในรูปแบบ:

ที่ไหน - มี ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มซึ่งเป็นผลคูณของข้อผิดพลาดในการสุ่มตัวอย่างเฉลี่ย , และปัจจัยหลายหลากคือเกณฑ์ของนักเรียน ("ปัจจัยความเชื่อมั่น") ที่เสนอโดย W.S. Gosset (นามแฝง "นักเรียน"); ค่าสำหรับขนาดตัวอย่างต่างๆ จะถูกเก็บไว้ในตารางพิเศษ

ค่าของฟังก์ชัน Ф(t) สำหรับค่าบางค่าของ t คือ:

ดังนั้นนิพจน์ (3) สามารถอ่านได้ดังนี้: ด้วยความน่าจะเป็น พี = 0.683 (68.3%)เป็นที่ถกเถียงกันอยู่ว่าผลต่างระหว่างกลุ่มตัวอย่างกับค่าเฉลี่ยทั่วไปจะไม่เกินค่าความผิดพลาดเฉลี่ยหนึ่งค่า ม.(t=1), ด้วยความน่าจะเป็น พี = 0.954 (95.4%)— ว่าไม่เกินค่าของสองค่าเฉลี่ยข้อผิดพลาด ม. (เสื้อ = 2) ,ด้วยความน่าจะเป็น P = 0.997 (99.7%)- จะไม่เกินสามค่า ม. (เสื้อ = 3) .ดังนั้น ความน่าจะเป็นที่ความแตกต่างนี้จะเกินสามเท่าของค่าความผิดพลาดเฉลี่ยที่กำหนด ระดับความผิดพลาดและไม่เกิน 0,3% .

ในตาราง. 3 แสดงสูตรการคำนวณข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่ม

ตารางที่ 3 ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่ม (D) สำหรับค่าเฉลี่ยและสัดส่วน (p) สำหรับการสังเกตตัวอย่างประเภทต่างๆ

การขยายผลตัวอย่างสู่ประชากร

เป้าหมายสูงสุดของการสังเกตตัวอย่างคือการกำหนดลักษณะของประชากรทั่วไป สำหรับตัวอย่างขนาดเล็ก การประมาณค่าพารามิเตอร์เชิงประจักษ์ ( และ ) อาจเบี่ยงเบนไปจากค่าจริง ( และ ) อย่างมีนัยสำคัญ ดังนั้นจึงจำเป็นต้องกำหนดขอบเขตที่ค่าจริง ( และ ) อยู่ในค่าตัวอย่างของพารามิเตอร์ ( และ )

ช่วงความเชื่อมั่นของพารามิเตอร์บางตัว θ ของประชากรทั่วไปเรียกว่าช่วงสุ่มของค่าของพารามิเตอร์นี้ซึ่งมีความน่าจะเป็นใกล้เคียงกับ 1 ( ความน่าเชื่อถือ) มีค่าที่แท้จริงของพารามิเตอร์นี้

ข้อผิดพลาดเล็กน้อยตัวอย่าง Δ ช่วยให้คุณสามารถกำหนดค่าขีด จำกัด ของลักษณะของประชากรทั่วไปและของพวกเขา ช่วงความเชื่อมั่นซึ่งเท่ากับ:

บรรทัดล่าง ช่วงความมั่นใจได้จากการหักลบ ข้อผิดพลาดเล็กน้อยจากค่าเฉลี่ยตัวอย่าง (แชร์) และค่าสูงสุดโดยการเพิ่ม

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย จะใช้ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มและสำหรับระดับความเชื่อมั่นที่กำหนดจะถูกกำหนดโดยสูตร:

ซึ่งหมายความว่าด้วยความน่าจะเป็นที่กำหนด Rซึ่งเรียกว่าระดับความมั่นใจและถูกกำหนดโดยค่าที่ไม่ซ้ำกัน tมันสามารถโต้แย้งได้ว่าค่าที่แท้จริงของค่าเฉลี่ยอยู่ในช่วงตั้งแต่ และมูลค่าที่แท้จริงของหุ้นอยู่ในช่วงตั้งแต่

เมื่อคำนวณช่วงความเชื่อมั่นสำหรับระดับความเชื่อมั่นมาตรฐานสามระดับ P=95%, P=99% และ P=99.9%ค่าถูกเลือกโดย การใช้งานขึ้นอยู่กับจำนวนองศาอิสระ หากขนาดกลุ่มตัวอย่างมีขนาดใหญ่พอ แสดงว่าค่าที่สอดคล้องกับความน่าจะเป็นเหล่านี้ tเท่ากับ: 1,96, 2,58 และ 3,29 . ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มทำให้เราสามารถกำหนดค่าส่วนเพิ่มของลักษณะของประชากรทั่วไปและช่วงความเชื่อมั่นของพวกเขา:

การกระจายผลการสังเกตแบบคัดเลือกไปยังประชากรทั่วไปในการศึกษาทางสังคมและเศรษฐกิจมีลักษณะเฉพาะของตัวเอง เนื่องจากต้องมีความสมบูรณ์ของการเป็นตัวแทนของทุกประเภทและทุกกลุ่ม พื้นฐานสำหรับความเป็นไปได้ของการกระจายดังกล่าวคือการคำนวณ ข้อผิดพลาดสัมพัทธ์:

ที่ไหน Δ % - ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มสัมพัทธ์; , .

มีสองวิธีหลักในการขยายการสังเกตตัวอย่างไปยังประชากร: การแปลงโดยตรงและวิธีการสัมประสิทธิ์.

แก่นแท้ การแปลงโดยตรงคือการคูณค่าเฉลี่ยตัวอย่าง!!\overline(x) ด้วยขนาดของประชากร

ตัวอย่าง. ให้จำนวนเฉลี่ยของเด็กวัยหัดเดินในเมืองประมาณโดยวิธีการสุ่มตัวอย่างและจำนวนต่อคน หากมีครอบครัวอายุน้อย 1,000 ครอบครัวในเมือง จำนวนสถานที่ที่ต้องการในเรือนเพาะชำของเทศบาลจะได้จากการคูณค่าเฉลี่ยนี้ด้วยขนาดของประชากรทั่วไป N = 1,000 กล่าวคือ จะเป็น 1200 ที่นั่ง

วิธีการสัมประสิทธิ์ขอแนะนำให้ใช้ในกรณีที่ดำเนินการสังเกตแบบคัดเลือกเพื่อชี้แจงข้อมูลของการสังเกตอย่างต่อเนื่อง

ในการทำเช่นนั้นจะใช้สูตร:

โดยที่ตัวแปรทั้งหมดคือขนาดของประชากร:

ขนาดตัวอย่างที่ต้องการ

ตารางที่ 4. ขนาดตัวอย่างที่ต้องการ (n) สำหรับองค์กรสุ่มตัวอย่างประเภทต่างๆ

เมื่อวางแผนการสำรวจการสุ่มตัวอย่างด้วยค่าที่กำหนดไว้ล่วงหน้าของข้อผิดพลาดในการสุ่มตัวอย่างที่อนุญาต จำเป็นต้องประมาณค่าที่ต้องการให้ถูกต้อง ขนาดตัวอย่าง. จำนวนนี้สามารถกำหนดได้บนพื้นฐานของข้อผิดพลาดที่อนุญาตในระหว่างการสังเกตแบบเลือกตามความน่าจะเป็นที่ให้ซึ่งรับประกันระดับข้อผิดพลาดที่ยอมรับได้ (โดยคำนึงถึงวิธีการจัดระเบียบการสังเกต) สูตรสำหรับกำหนดขนาดตัวอย่างที่ต้องการ n สามารถหาได้โดยตรงจากสูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างส่วนขอบ จากนิพจน์สำหรับข้อผิดพลาดเล็กน้อย:

ขนาดตัวอย่างถูกกำหนดโดยตรง น:

สูตรนี้แสดงให้เห็นว่ามีข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มลดลง Δ เพิ่มขนาดกลุ่มตัวอย่างที่ต้องการอย่างมาก ซึ่งเป็นสัดส่วนกับความแปรปรวนและกำลังสองของการทดสอบ t ของนักเรียน

สำหรับวิธีการเฉพาะในการจัดสังเกต ขนาดตัวอย่างที่ต้องการจะคำนวณตามสูตรที่ให้ไว้ในตาราง 9.4.

ตัวอย่างการคำนวณเชิงปฏิบัติ

ตัวอย่างที่ 1 การคำนวณค่าเฉลี่ยและช่วงความเชื่อมั่นสำหรับคุณลักษณะเชิงปริมาณอย่างต่อเนื่อง

เพื่อประเมินความเร็วของการชำระหนี้กับเจ้าหนี้ในธนาคาร ได้ทำการสุ่มตัวอย่างเอกสารการชำระเงิน 10 ฉบับ ค่าของพวกเขากลายเป็นเท่ากัน (เป็นวัน): 10; 3; สิบห้า; สิบห้า; 22; 7; แปด; หนึ่ง; 19; ยี่สิบ.

จำเป็นด้วยความน่าจะเป็น P = 0.954กำหนดข้อผิดพลาดเล็กน้อย Δ ค่าเฉลี่ยตัวอย่างและขีดจำกัดความเชื่อมั่นของเวลาในการคำนวณเฉลี่ย

วิธีการแก้.ค่าเฉลี่ยคำนวณโดยสูตรจากตาราง 9.1 สำหรับประชากรกลุ่มตัวอย่าง

การกระจายตัวคำนวณตามสูตรจากตาราง 9.1.

ความคลาดเคลื่อนกำลังสองเฉลี่ยของวัน

ข้อผิดพลาดของค่าเฉลี่ยคำนวณโดยสูตร:

เหล่านั้น. ค่าเฉลี่ยคือ x ± m = 12.0 ± 2.3 วัน.

ความน่าเชื่อถือของค่าเฉลี่ยคือ

ข้อผิดพลาดการจำกัดคำนวณโดยสูตรจากตาราง 9.3 สำหรับการเลือกใหม่เนื่องจากไม่ทราบขนาดของประชากรและสำหรับ P = 0.954ระดับความเชื่อมั่น.

ดังนั้น ค่าเฉลี่ยคือ `x ± D = `x ± 2m = 12.0 ± 4.6 เช่น มูลค่าที่แท้จริงของมันอยู่ในช่วง 7.4 ถึง 16.6 วัน

การใช้โต๊ะนักเรียน แอปพลิเคชันช่วยให้เราสรุปได้ว่าสำหรับ n = 10 - 1 = 9 องศาอิสระ ค่าที่ได้รับมีความน่าเชื่อถือโดยมีระดับนัยสำคัญอยู่ที่ 0.001 ปอนด์ กล่าวคือ ค่าเฉลี่ยที่ได้จะแตกต่างจาก 0 อย่างมีนัยสำคัญ

ตัวอย่างที่ 2 การประมาณความน่าจะเป็น (ส่วนแบ่งทั่วไป) r.

ด้วยวิธีการสุ่มตัวอย่างแบบเครื่องกลในการสำรวจสถานภาพทางสังคม 1,000 ครอบครัว พบว่า สัดส่วนครอบครัวที่มีรายได้น้อยเป็น w = 0.3 (30%)(ตัวอย่างคือ 2% , เช่น. n/N = 0.02). จำเป็นด้วยระดับความมั่นใจ p = 0.997กำหนดตัวบ่งชี้ Rครอบครัวผู้มีรายได้น้อยทั่วภูมิภาค

วิธีการแก้.ตามค่าฟังก์ชันที่นำเสนอ เอฟ(เสื้อ)หาระดับความมั่นใจที่กำหนด P = 0.997ความหมาย t=3(ดูสูตร 3). ข้อผิดพลาดการแบ่งส่วนเพิ่ม wกำหนดโดยสูตรจากตาราง 9.3 สำหรับการสุ่มตัวอย่างแบบไม่ซ้ำ (การสุ่มตัวอย่างทางกลมักจะไม่ทำซ้ำ):

การจำกัดข้อผิดพลาดในการสุ่มตัวอย่างสัมพัทธ์ใน % จะ:

ความน่าจะเป็น (ส่วนแบ่งทั่วไป) ของครอบครัวที่มีรายได้ต่ำในภูมิภาคจะเป็น p=w±Δwและขีดจำกัดความเชื่อมั่น p คำนวณจากอสมการสองเท่า:

w — Δw ≤ p ≤ w — Δw, เช่น. ค่าที่แท้จริงของ p อยู่ภายใน:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

ดังนั้น ด้วยความน่าจะเป็นที่ 0.997 จึงสามารถโต้แย้งได้ว่าสัดส่วนของครอบครัวที่มีรายได้ต่ำในทุกครอบครัวในภูมิภาคมีตั้งแต่ 28.6% ถึง 31.4%

ตัวอย่างที่ 3การคำนวณค่าเฉลี่ยและช่วงความเชื่อมั่นสำหรับคุณลักษณะที่ไม่ต่อเนื่องซึ่งระบุโดยชุดช่วงเวลา

ในตาราง. 5. มีการกำหนดการแจกจ่ายแอปพลิเคชันสำหรับการผลิตคำสั่งซื้อตามระยะเวลาของการดำเนินการโดยองค์กร

ตารางที่ 5. การกระจายการสังเกตตามเวลาที่เกิด

วิธีการแก้. เวลาเสร็จสิ้นการสั่งซื้อโดยเฉลี่ยคำนวณโดยสูตร:

เวลาเฉลี่ยจะเป็น:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23.1 เดือน

เราจะได้คำตอบเดียวกันถ้าเราใช้ข้อมูลบน pi จากคอลัมน์สุดท้ายของตาราง 9.5 โดยใช้สูตร:

โปรดทราบว่าช่วงกลางของช่วงสำหรับการไล่สีครั้งสุดท้ายจะพบได้โดยการเสริมความกว้างของช่วงการไล่สีก่อนหน้าแบบเทียมกับ 60 - 36 = 24 เดือน

การกระจายตัวคำนวณโดยสูตร

ที่ไหน x ฉัน- ช่วงกลางของอนุกรมช่วง

ดังนั้น!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) และข้อผิดพลาดมาตรฐานคือ

ค่าความคลาดเคลื่อนของค่าเฉลี่ยคำนวณโดยสูตรสำหรับเดือน กล่าวคือ ค่าเฉลี่ยคือ!!\overline(x) ± m = 23.1 ± 13.4

ข้อผิดพลาดการจำกัดคำนวณโดยสูตรจากตาราง 9.3 สำหรับการเลือกใหม่เนื่องจากไม่ทราบขนาดของประชากร สำหรับระดับความเชื่อมั่น 0.954:

ดังนั้นค่าเฉลี่ยคือ:

เหล่านั้น. มูลค่าที่แท้จริงอยู่ในช่วง 0 ถึง 50 เดือน

ตัวอย่างที่ 4ในการกำหนดความเร็วของการชำระหนี้กับเจ้าหนี้ของ N = 500 องค์กรของ บริษัท ในธนาคารพาณิชย์จำเป็นต้องทำการศึกษาแบบคัดเลือกโดยใช้วิธีการสุ่มแบบไม่ซ้ำซ้อน กำหนดขนาดกลุ่มตัวอย่างที่ต้องการ n เพื่อให้ความน่าจะเป็น P = 0.954 ข้อผิดพลาดของค่าเฉลี่ยตัวอย่างไม่เกิน 3 วัน หากค่าประมาณของการทดลองแสดงให้เห็นว่าค่าเบี่ยงเบนมาตรฐานคือ 10 วัน

วิธีการแก้. เพื่อกำหนดจำนวนการศึกษาที่จำเป็น n เราใช้สูตรสำหรับการเลือกที่ไม่ซ้ำซ้อนจากตาราง 9.4:

ในนั้นค่าของ t ถูกกำหนดจากระดับความมั่นใจ P = 0.954 เท่ากับ 2 ค่ากำลังสองเฉลี่ย s = 10 ขนาดประชากร N = 500 และค่าคลาดเคลื่อนของค่าเฉลี่ย Δ x = 3 แทนค่าเหล่านี้ลงในสูตร เราได้รับ:

เหล่านั้น. เพียงพอที่จะทำตัวอย่าง 41 องค์กรเพื่อประเมินพารามิเตอร์ที่ต้องการ - ความเร็วในการชำระหนี้กับเจ้าหนี้

แนวความคิดของ "การเป็นตัวแทน" ที่เกี่ยวข้องกับการสำรวจทางสังคมวิทยา - การสำรวจความคิดเห็นของประชาชน - มีผลเกือบมหัศจรรย์ต่อผู้คน คำว่า "การเป็นตัวแทน" เองก็มีความหมายทางการเมืองที่ชัดเจนเช่นกัน นอกเหนือจากทางวิทยาศาสตร์แล้ว

เหตุผลคืออะไร? ประเด็นก็คือ สันนิษฐานว่ากลุ่มตัวอย่าง (กลุ่มคนที่เลือกทำแบบสำรวจ) สามารถเป็นตัวแทน (แสดง) ประชากรทั้งหมดได้ ประชากรทั่วไปในกรณีของการสำรวจทั้งหมดของรัสเซียคือประชากรทั้งหมดของประเทศ ทีนี้ ลองจินตนาการว่าเรากำลังพูดถึงการตัดสินใจทางการเมือง - สนับสนุนร่างกฎหมายหรือลงคะแนนเสียงในการเลือกตั้ง ด้วยความช่วยเหลือของการสำรวจตัวอย่าง เราได้กลไกที่ยอดเยี่ยมของการเป็นตัวแทนทางการเมือง ซึ่งเป็นกลไกที่คนกลุ่มเล็ก ๆ สามารถเป็นตัวแทนของความคิดเห็นหรือตำแหน่งของประชากรทั้งหมดในประเทศได้ ดังนั้นตัวแทนของการศึกษาจึงได้รับสถานที่สำคัญดังกล่าว

แนวคิดเรื่องความเป็นตัวแทนนั้นใช้ไม่ได้เฉพาะในการศึกษาทางการเมืองเท่านั้น คำนี้มักใช้เมื่อพูดถึงการศึกษาขนาดใหญ่ ไม่ว่าจะในด้านการตลาด พฤติกรรมทางเศรษฐกิจ หรือการศึกษา

วิธีการสำรวจตัวแทน

หลังจากสำรวจความคิดเห็น 1,500 คนแล้ว เราจะสรุปผลเกี่ยวกับชาวรัสเซียทั้งหมดได้อย่างไร ซึ่งในจำนวนนี้มีมากกว่า 140 ล้านคน (และแม้แต่ผู้มีสิทธิเลือกตั้งมากกว่า 110 ล้านคน) เทคโนโลยีที่อยู่เบื้องหลังการสำรวจความคิดเห็นนั้นเป็นไปตามกฎหมายทางสถิติ เหตุผลที่ใกล้ที่สุดคือกฎของจำนวนมากหรือทฤษฎีบทของเบอร์นูลลี

อย่างง่ายสามารถสื่อความหมายได้ดังนี้ สมมติว่าเรามีคุณลักษณะบางอย่าง เช่น ปริมาณน้ำฝนต่อวันในเยคาเตรินเบิร์กระหว่างศตวรรษที่ 20 หากเราเขียนค่าทั้งหมดพร้อมกับความถี่ (ซึ่งเรียกว่าการแจกแจง) จากนั้นสุ่มใช้กรณีจำนวนมากพอสมควร (นั่นคือไม่ใช่ทุกวันในศตวรรษที่ 20 แต่ค่อนข้างมาก) เราจะเห็นว่าการแจกแจงในตัวอย่างของเราจะคล้ายกันมากกับการแจกแจงตลอดศตวรรษที่ยี่สิบ ดังนั้น หากเราเลือกบางหน่วยจากประชากร หน่วยนั้นอาจเป็นตัวแทนของประชากรทั้งหมด และไม่จำเป็นต้องรวบรวมข้อมูลสำหรับทุกกรณีจริงๆ

อย่างไรก็ตาม มีเงื่อนไขสำคัญ: สิ่งนี้เป็นจริงก็ต่อเมื่อการเลือกนั้นสุ่มอย่างเคร่งครัด ปัญหาเดียวที่นี่อาจเป็นการเบี่ยงเบนจากการสุ่ม ดังนั้น หากเราใช้เฉพาะข้อมูลปริมาณน้ำฝนในช่วงไม่กี่ปีที่ผ่านมา (เช่น เนื่องจากข้อมูลเหล่านี้หาง่ายกว่า) หรือสัมภาษณ์คนรู้จักของเรา 1,500 คน (เพราะติดต่อง่ายกว่า) และไม่ใช่สุ่มคน ตัวอย่างจะไม่แน่นอน เป็นตัวแทน

ลองนึกภาพว่าในรัสเซีย 143.5 ล้านคน คุณสุ่มเลือก 1,500 คนที่คุณต้องการ ตัวอย่างเช่น สัดส่วนของผู้จัดการระดับกลางในหมู่พวกเขาจะเท่ากับสัดส่วนของผู้จัดการระดับกลางในประชากรทั่วไปโดยประมาณ ซึ่งแสดงให้เห็นว่ากลุ่มตัวอย่างของคุณสามารถเป็นตัวแทนของประชากรทั้งหมดได้ เป็นไปได้ไหมที่ตัวบ่งชี้ทั้งสองนี้จะแตกต่างกันมาก? ตัวอย่างเช่นในหมู่ชาวรัสเซียคือ 14% แต่ในตัวอย่างจะเป็นเพียง 1%? ในทางทฤษฎี เป็นไปได้ แต่ความเป็นไปได้น้อยมากจนมองข้ามไป (เหมือนการพบมังกรบนถนน)

ยิ่งไปกว่านั้น สิ่งที่น่ายินดีที่สุดเกี่ยวกับความน่าจะเป็นนี้ไม่ใช่แม้จะเล็กน้อย แต่สำหรับกระบวนการสุ่มความน่าจะเป็นนี้สามารถคำนวณได้ เราสามารถพูดได้ว่าค่าตัวอย่างของเราจะเบี่ยงเบนไปจากค่าในประชากรทั่วไปด้วยความน่าจะเป็น 13% (ดังในตัวอย่างด้านบน) และความน่าจะเป็น 2.5% อย่างไรก็ตาม โดยปกติแล้ว พวกมันทำสิ่งที่ตรงกันข้าม: อันดับแรก พวกมันกำหนดความน่าจะเป็นที่เราต้องการให้ค่าของเราไม่เบี่ยงเบนไปจากค่าในประชากรทั่วไป (ส่วนใหญ่มักจะถูกกำหนดไว้ที่ระดับ 95%) แล้วพวกเขาก็ดู ขนาดของส่วนเบี่ยงเบนสำหรับตัวอย่างที่มีขนาดเฉพาะ ส่วนเบี่ยงเบนนี้เรียกว่าช่วงความเชื่อมั่น ซึ่งบางครั้งเรียกว่าข้อผิดพลาดในการสุ่มตัวอย่างหรือข้อผิดพลาดทางสถิติ และมักแสดงควบคู่ไปกับผลการสำรวจ

ดังนั้น ความน่าจะเป็นของการเบี่ยงเบน ปริมาณของส่วนเบี่ยงเบน (ช่วงความเชื่อมั่น) และขนาดกลุ่มตัวอย่างจึงสัมพันธ์กัน ตามนี้ สูตรการคำนวณขนาดตัวอย่างมีดังนี้:

โดยที่ n คือขนาดตัวอย่าง Δ คือช่วงความเชื่อมั่น z คือค่าของฟังก์ชันการแจกแจงแบบปกติสำหรับความน่าจะเป็นของการปฏิเสธที่กำหนด (สำหรับความน่าจะเป็น 5% ค่านี้คือ 1.96)

นี่เป็นสูตรแบบง่าย แบบสำรวจจริงใช้สูตรที่ซับซ้อนกว่าเล็กน้อย สูตรนี้อาจล้มเหลวได้เช่นกันหากค่าของตัวบ่งชี้แตกต่างจาก 50% มาก (เช่น สูตรนี้ไม่เหมาะสำหรับการประมาณสัดส่วนของผู้ป่วยโรคหายากในประเทศ)

นี่คือสิ่งที่จะเกิดขึ้นหากคุณแทนที่ค่าบางค่าในสูตรนี้:

กล่าวอีกนัยหนึ่งถ้าเราสุ่มตัวอย่างชาวรัสเซียที่มีขนาด 1600 คนและประมาณการตัวบ่งชี้บางอย่างเช่นความเต็มใจที่จะลงคะแนนให้นักการเมืองบางคนด้วยความน่าจะเป็น 95% การประมาณของเราจะไม่แตกต่างจากความเต็มใจ เพื่อลงคะแนนให้เขาในหมู่ชาวรัสเซียทั้งหมดมากกว่า 2, 45%

ขนาดตัวอย่าง

ดังนั้น ยิ่งกลุ่มตัวอย่างมีขนาดใหญ่เท่าใด เราก็ยิ่งมีโอกาสเข้าใกล้ส่วนแบ่งในประชากรมากขึ้นเท่านั้น ดูเหมือนว่านี่หมายความว่าเราต้องพยายามทำให้กลุ่มตัวอย่างเข้าใกล้ 143.5 ล้าน อันที่จริงอย่างที่คุณเห็นจากตารางธรรมชาติของกระบวนการสุ่มนั้นมีความเป็นไปได้ที่จะตกในช่วงเวลาหนึ่ง เริ่มเพิ่มขึ้นช้ามาก (และช่วงเวลานี้มาเร็วมาก) หลังจากที่เราสุ่มตัวอย่าง 1500 หน่วย ไม่ว่าเราจะเพิ่มขนาดตัวอย่างมากแค่ไหน ความน่าจะเป็นที่ค่าตัวอย่างของเราจะตกลงไปในค่าประชากรจะเพิ่มขึ้นอย่างช้ามาก

อันที่จริง แทบไม่มีความแตกต่างระหว่างผู้ตอบแบบสอบถาม 1,500 ถึง 10,000 คน ที่ไหนสักแห่งภายในปี 1500 เราสามารถพูดได้ว่าค่าประมาณของเราจะแตกต่างจากส่วนแบ่งในประชากรทั่วไป 2-3% หากเราเพิ่มตัวอย่างเพิ่มเติม ข้อผิดพลาดที่เป็นไปได้นี้จะลดลงแต่เล็กน้อยมาก กล่าวอีกนัยหนึ่ง กลุ่มตัวอย่าง 100,000 ตัวอย่างดีกว่ากลุ่มตัวอย่าง 2500 แต่ความแตกต่างนั้นน้อยมากจนไม่สมเหตุสมผล และในกรณีของการสำรวจทางสังคมนั้นไม่สมเหตุสมผลทางเศรษฐกิจ โดยปกติ การเพิ่มตัวอย่างจะมีราคาแพง ดังนั้นจึงไม่สมเหตุสมผลที่จะขยายตัวอย่างเพื่อให้ได้ค่าช่วงความเชื่อมั่นหนึ่งจุดเปอร์เซ็นต์

เป็นสิ่งสำคัญที่ขนาดของประชากรทั่วไปจะไม่ปรากฏในสูตรเลย ความจริงก็คือเมื่อประชากรมีขนาดใหญ่ (มากกว่า 20,000 คน) จะมีผลกระทบต่อขนาดกลุ่มตัวอย่างเพียงเล็กน้อยหรือไม่มีเลย ดังนั้นเราจึงไม่จำเป็นต้องรู้ว่ามีผู้คนอาศัยอยู่ในรัสเซียกี่คนเพื่อสร้างตัวอย่างที่เป็นตัวแทน เป็นที่ชัดเจนว่าการเลือก 1500 จาก 2000 ไม่น่าจะสมเหตุสมผล - ง่ายกว่าที่จะตรวจสอบ 2000 และรับค่าประมาณที่แม่นยำ แต่ถ้าจำเป็น การสร้างตัวอย่าง เรามีโอกาสสรุปผลลัพธ์สำหรับประชากรทั่วไป และด้วยเหตุผลเดียวกัน ขนาดกลุ่มตัวอย่างจะไม่แตกต่างกันสำหรับประเทศขนาดใหญ่และขนาดเล็ก

ความเป็นตัวแทนและความถูกต้อง

เพื่อให้เข้าใจความหมายของแนวคิดเรื่อง "การเป็นตัวแทน" ให้พิจารณากลุ่มตัวอย่าง 15 คน น่าแปลกที่ถ้าคุณสร้างมันขึ้นมาโดยบังเอิญ มันก็เป็นตัวแทนเช่นกัน ยิ่งไปกว่านั้น คุณสามารถสร้างตัวอย่างจากหน่วยหนึ่งได้ ลองนึกภาพกล่องลูกบอลที่คุณสุ่มจั่วลูกบอลหนึ่งลูก หากเป็นลูกบอลที่สุ่มเลือกก็จะเป็นตัวแทนของลูกบอลทั้งหมดที่อยู่ในช่องนี้ เขาจะเป็นตัวแทนของพวกเขา ไม่แน่. ทำไม เพราะมีโอกาสผิดพลาดสูงมาก ครั้งต่อไปเราสามารถจั่วลูกบอลอีกลูกหนึ่งและได้แนวคิดที่แตกต่างออกไปเกี่ยวกับลูกบอลในกล่อง การแสดงที่ไม่ถูกต้องหมายถึงการมีค่าประมาณที่หลากหลาย

ในทำนองเดียวกัน 15 คนเป็นตัวแทนของประชากรทั่วไป แต่พวกเขาแสดงไม่ถูกต้อง เนื่องจากข้อผิดพลาด ช่วงความเชื่อมั่น นั้นใหญ่มาก เราจะต้องบวก +/- 33% เพื่อให้ได้โอกาส 95% ที่เราจะตกอยู่ในช่วงเวลา ถ้าเราพร้อมที่จะยอมรับ เราก็เอา 15 คนมาพบว่ามี 7 คนเป็นผู้จัดการระดับกลาง แล้วเราจะได้ค่าประมาณ 7/15 ของทั้งหมด นั่นคือ 47% +/- 33% คือ ส่วนแบ่งประมาณการของผู้จัดการในกลุ่มประชากรทั่วไป และนี่เป็นข้อสรุปที่ถูกต้องอย่างยิ่ง แค่มันไม่มีค่า นี้เราสามารถพูดได้โดยไม่ต้องตรวจสอบ ดังนั้น เมื่อวางแผนตัวอย่าง จำเป็นต้องได้รับปริมาณที่เหมาะสมในแง่ของความคุ้มค่า

ทั้งหมดข้างต้นมีจุดมุ่งหมายเพื่อถ่ายทอดแนวคิดง่ายๆ อย่างหนึ่ง ซึ่งมักไม่ค่อยเกิดขึ้น: ขนาดตัวอย่างไม่สัมพันธ์กับการเป็นตัวแทนของมัน.

ตัวอย่างเล็กๆ ไม่ชัดเจน แต่ก็ยังสามารถเป็นตัวแทนได้ ขนาดตัวอย่างที่ใช้ในการสำรวจมวลชนในรัสเซียในปัจจุบันมักมีความแม่นยำค่อนข้างสูง

ความเป็นตัวแทนของกลุ่มตัวอย่างไม่ได้ถูกคุกคามโดยขนาดของมัน แต่โดยอคตินั่นคือการเบี่ยงเบนจากหลักการของการสุ่ม

ละเมิดหลักการสุ่ม

หากเราเริ่มเลือกหน่วยโดยไม่สุ่มตัวอย่าง ตัวอย่างจะไม่เป็นตัวแทน ตัวอย่างเช่น หากมีสิ่งใดขัดขวางไม่ให้เราเลือกแบบสุ่ม ลองนึกภาพว่าเราต้องการสุ่มเลือกลูกบอลจากกล่องของเรา แต่กลับกลายเป็นว่าลูกบอลบางลูกกัด กลไกที่เราใช้เฉพาะลูกหินที่มอบให้เรานั้นเป็นกลไกที่ละเมิดการสุ่มและดังนั้นจึงละเมิดความเป็นตัวแทน ในกรณีนี้ ไม่ว่าเราจะหยิบลูกแก้วจากกล่องกี่ลูกก็ตาม (แม้ว่าเราจะเอาลูกแก้วที่ไม่กัดไปทั้งหมด) เราก็จะได้ตัวอย่างที่ไม่เป็นตัวแทน เพราะเราจะไม่นับลูกแก้วที่กัด - มันแค่เลี่ยง ตัวอย่างของเรา

ปัญหาที่ใหญ่ที่สุดของการกัดลูกบอลคือพวกมันสามารถแตกต่างจากที่เข้ามาอยู่ในมือของเรา และแตกต่างกันตรงที่เราสนใจ สถานการณ์นี้เรียกว่าอคติสุ่มตัวอย่าง

จำเป็นต้องแยกแยะสถานการณ์ของการเป็นตัวแทนที่ไม่ถูกต้องซึ่งเราอธิบายไว้ข้างต้นจากสถานการณ์ที่ไม่เป็นตัวแทน นี่เป็นปัญหาที่แตกต่างกันและมีวิธีแก้ปัญหาที่แตกต่างกัน คุณไม่สามารถแก้ปัญหาข้อใดข้อหนึ่งได้โดยการแก้ปัญหาอีกข้อหนึ่ง หากกลุ่มตัวอย่างขาดความเป็นตัวแทน ก็ไม่มีประโยชน์ที่จะเพิ่มตัวอย่าง นอกจากนี้ กลุ่มตัวอย่างจำนวนมากในการสำรวจทางสังคมมักจะสะสมข้อผิดพลาด ดังนั้นปัญหาของการเป็นตัวแทนจึงยิ่งรุนแรงขึ้นได้ด้วยการเพิ่มขึ้นอย่างมากในขนาดกลุ่มตัวอย่างเท่านั้น

ทำไมการเป็นตัวแทนจึงเป็นไปไม่ได้?

ในบันทึกย่อของตารางพร้อมผลการสำรวจ มักจะเห็นว่า "กลุ่มตัวอย่างคือ 1600 คน กลุ่มตัวอย่างเป็นตัวแทนของเพศและอายุ" จากที่กล่าวไว้ข้างต้น จะเห็นได้ชัดเจนว่าพารามิเตอร์เหล่านี้เป็นสองพารามิเตอร์ที่แตกต่างกัน: การบ่งชี้ความเป็นตัวแทนไม่เกี่ยวข้องกับขนาดกลุ่มตัวอย่าง ที่จริงแล้ว ความหมายในที่นี้คือมีการปฏิบัติตามขั้นตอนบางอย่างเพื่อให้แน่ใจว่ามีความสอดคล้องกันระหว่างกลุ่มตัวอย่างและประชากร ตัวอย่างเช่น เพื่อให้แน่ใจว่ามีการเป็นตัวแทนทางเพศ ผู้ชายและผู้หญิงจะถูกคัดเลือกในกลุ่มตัวอย่างในสัดส่วนเดียวกันกับที่มีอยู่ในหมู่ชาวรัสเซียตามข้อมูลการสำรวจสำมะโนประชากร แต่การเป็นตัวแทนตามเพศไม่ได้หมายถึงการเป็นตัวแทน ตัวอย่างเช่น โดยความเห็นทางการเมือง

เหตุใดจึงต้องจัดกลุ่มตัวอย่างตามเพศและหมวดหมู่ทางสังคมและประชากรอื่นๆ เนื่องจากมีเพียงกลุ่มตัวอย่างแบบสุ่มเท่านั้นที่สามารถให้ความเป็นตัวแทนที่แท้จริงได้ และเป็นไปไม่ได้ที่จะนำไปใช้ในทางปฏิบัติด้วยเหตุผลหลายประการ ทันทีที่คุณพยายามทำเช่นนี้ คุณจะประสบปัญหามากมาย ไม่ว่าคุณจะเลือกใช้วิธีการใด ผู้ตอบแบบสอบถามบางคนจะไม่พร้อมสำหรับวิธีการของคุณเลย (เช่น สำหรับการสัมภาษณ์ส่วนตัว บ้านที่มีอินเตอร์คอมและความปลอดภัยเป็นปัญหาใหญ่) อีกส่วนหนึ่งจะไม่อยู่ ไม่ตอบ หรือชอบทำธุรกิจของตน มีคนที่มีปัญหาด้านภาษาและไม่สามารถพูดกับเราได้ มีคนที่ไม่เข้าใจว่าทำไมสิ่งนี้จึงจำเป็น และพวกเขาไม่ต้องการคุยกับเรา ทั้งหมดนี้เป็นการละเมิดการสุ่มอย่างร้ายแรงซึ่งทำให้การตระหนักรู้เป็นไปไม่ได้

บรรดาผู้ที่ลดปัญหาการเป็นตัวแทนในการสำรวจมวลชนให้เหลือเพียงสถิติลืมไปว่าผู้คนเป็นลูกหินที่จำเพาะเจาะจงมาก มีลูกที่วิ่งและซ่อนอยู่ มีลูกที่กัด พวกมันไม่ใช่วัตถุแบบพาสซีฟ พวกมันตีกลับ พวกเขาพูดว่า "ฉันไม่ต้องการเข้าร่วมในแบบสำรวจของคุณ" ซึ่งเป็นการละเมิดการสุ่ม ดังนั้นในความหมายที่เข้มงวดของคำ การเป็นตัวแทนในการสำรวจจำนวนมากจึงเป็นไปไม่ได้ในทุกรูปแบบ

กลไกได้รับการพัฒนาโดยที่มักจะทำให้มั่นใจได้ถึงความเป็นตัวแทน: เราจัดกลุ่มตัวอย่างในบางหมวดหมู่และแสร้งทำเป็นว่ามีการจัดแนวในหมวดหมู่ที่เป็นไปได้อื่นๆ ทั้งหมดด้วย อันที่จริง เราไม่มีเหตุผลที่จะยืนยันเรื่องนี้ แต่ปัญหาคือไม่มีวิธีตรวจสอบ - อีกครั้งเนื่องจากมีลูกบอลกัด ในการตรวจสอบอคติ ผู้สอบจะต้องไปหาคนที่เราไม่ได้สัมภาษณ์และสัมภาษณ์พวกเขา แต่อย่างที่เราจำได้ พวกเขาไม่อยากถูกสอบสวนเลย เป็นไปไม่ได้ที่จะซักถามผู้ที่ไม่ตอบอย่างเด็ดขาด ดังนั้น ทุกคนทำงานบนสมมติฐานที่ว่าถ้าเราจัดกลุ่มตัวอย่างด้วยพารามิเตอร์สองหรือสามพารามิเตอร์ มันแสดงถึงประชากรทั้งหมด แม้ว่าจะไม่มีพื้นฐานที่จริงจังสำหรับสมมติฐานนี้

การสุ่มตัวอย่างตัวแทนเป็นเทคโนโลยีที่นักสังคมวิทยายืมมาจากสถิติ ดังนั้นจึงนำเอาองค์ประกอบของภาพทางคณิตศาสตร์และสถิติของโลกอย่างหลีกเลี่ยงไม่ได้ บางทีข้อสันนิษฐานที่หนักแน่นที่สุดคือการสำรวจตัวอย่างนั้นเป็นกลางทางการเมืองและสังคมวิทยา: การมีส่วนร่วมและการไม่เข้าร่วมในการสำรวจไม่มีความหมายทางการเมืองและไม่เกี่ยวข้องกับพารามิเตอร์ที่สำคัญทางสังคมวิทยาอื่นๆ แต่วันนี้ โพลได้กลายเป็นหนึ่งในสถาบันทางการเมืองหลักและกลายเป็นตัวกลางที่สำคัญระหว่างบริษัทขนาดใหญ่และผู้บริโภค ภายใต้เงื่อนไขเหล่านี้ เป็นไปไม่ได้ที่จะเชื่อในความเป็นหมันทางการเมืองอีกต่อไป อย่างไรก็ตาม เรายังรู้เพียงเล็กน้อยเกี่ยวกับความเข้าใจในการสำรวจความคิดเห็นในสังคมร่วมสมัยและสิ่งที่พวกเขาเป็นตัวแทน

จำนวนวัตถุสังเกตการณ์ทั้งหมด (คน ครัวเรือน สถานประกอบการ การตั้งถิ่นฐาน ฯลฯ) ที่มีลักษณะเฉพาะ (เพศ อายุ รายได้ จำนวน การหมุนเวียน ฯลฯ) ในพื้นที่และเวลาจำกัด ตัวอย่างประชากร

ชาวมอสโกทุกคน (10.6 ล้านคนตามสำมะโนปี 2545)
ผู้ชายชาวมอสโก (4.9 ล้านคนตามสำมะโนประชากร 2545)
นิติบุคคลของรัสเซีย (2.2 ล้านเมื่อต้นปี 2548)
ร้านค้าปลีกที่จำหน่ายผลิตภัณฑ์อาหาร (20,000 เมื่อต้นปี 2551) เป็นต้น

ตัวอย่าง (กลุ่มตัวอย่าง)

ส่วนหนึ่งของวัตถุจากประชากรที่เลือกเพื่อการศึกษาเพื่อสรุปเกี่ยวกับประชากรทั้งหมด เพื่อให้ข้อสรุปที่ได้จากการศึกษาตัวอย่างขยายไปสู่ประชากรทั้งหมด กลุ่มตัวอย่างต้องมีคุณสมบัติเป็นตัวแทน

ตัวแทนตัวอย่าง

คุณสมบัติของกลุ่มตัวอย่างที่สะท้อนถึงประชากรทั่วไปได้อย่างถูกต้อง กลุ่มตัวอย่างเดียวกันอาจเป็นตัวแทนของประชากรที่แตกต่างกันหรือไม่ก็ได้
ตัวอย่าง:

ตัวอย่างที่ประกอบด้วยชาวมอสโกทั้งหมดที่เป็นเจ้าของรถยนต์ไม่ได้เป็นตัวแทนของประชากรทั้งหมดของมอสโก
กลุ่มตัวอย่างวิสาหกิจของรัสเซียที่มีพนักงานไม่เกิน 100 คนไม่ได้เป็นตัวแทนขององค์กรทั้งหมดในรัสเซีย
ตัวอย่างของ Muscovites ที่ซื้อของในตลาดไม่ได้แสดงถึงพฤติกรรมการซื้อของชาว Muscovites ทั้งหมด

ในเวลาเดียวกัน ตัวอย่างเหล่านี้ (ขึ้นอยู่กับเงื่อนไขอื่น ๆ ) สามารถเป็นตัวแทนของเจ้าของรถ Muscovite วิสาหกิจรัสเซียขนาดกลางและขนาดย่อมและผู้ซื้อที่ทำการซื้อในตลาดตามลำดับ
สิ่งสำคัญคือต้องเข้าใจว่าความเป็นตัวแทนตัวอย่างและข้อผิดพลาดในการสุ่มตัวอย่างเป็นปรากฏการณ์ที่แตกต่างกัน ความเป็นตัวแทนซึ่งแตกต่างจากข้อผิดพลาดไม่ได้ขึ้นอยู่กับขนาดตัวอย่าง
ตัวอย่าง:
ไม่ว่าเราจะเพิ่มจำนวนเจ้าของรถ Muscovites ที่สำรวจมากเพียงใด เราก็ไม่สามารถแสดง Muscovites ทั้งหมดด้วยตัวอย่างนี้ได้

ข้อผิดพลาดในการสุ่มตัวอย่าง (ช่วงความเชื่อมั่น)

ความเบี่ยงเบนของผลลัพธ์ที่ได้จากการสังเกตตัวอย่างจากข้อมูลจริงของประชากรทั่วไป
ข้อผิดพลาดในการสุ่มตัวอย่างมีสองประเภท: ทางสถิติและเชิงระบบ ข้อผิดพลาดทางสถิติขึ้นอยู่กับขนาดกลุ่มตัวอย่าง ยิ่งขนาดกลุ่มตัวอย่างมากเท่าใด ก็ยิ่งต่ำลงเท่านั้น
ตัวอย่าง:
สำหรับตัวอย่างสุ่มอย่างง่าย 400 หน่วย ข้อผิดพลาดทางสถิติสูงสุด (ด้วยความมั่นใจ 95%) คือ 5% สำหรับตัวอย่าง 600 หน่วย - 4% สำหรับตัวอย่าง 1100 หน่วย - 3%
ข้อผิดพลาดอย่างเป็นระบบขึ้นอยู่กับปัจจัยต่าง ๆ ที่มีผลกระทบต่อการศึกษาอย่างต่อเนื่องและทำให้ผลการศึกษามีอคติไปในทิศทางที่แน่นอน
ตัวอย่าง:

การใช้ตัวอย่างความน่าจะเป็นจะประเมินสัดส่วนของผู้มีรายได้สูงที่กระตือรือร้นต่ำไป สิ่งนี้เกิดขึ้นเนื่องจากการที่คนเหล่านี้หาได้ยากกว่ามากในที่ใดที่หนึ่ง (เช่น ที่บ้าน)
ปัญหาของผู้ตอบแบบสอบถามที่ปฏิเสธที่จะตอบคำถาม (ส่วนแบ่งของ "refuseniks" ในมอสโกสำหรับการสำรวจที่แตกต่างกันมีตั้งแต่ 50% ถึง 80%)

ในบางกรณี เมื่อทราบการแจกแจงที่แท้จริง ความลำเอียงสามารถปรับระดับออกได้โดยการใส่โควต้าหรือปรับน้ำหนักข้อมูลใหม่ แต่ในการศึกษาจริงส่วนใหญ่ การประมาณการอาจเป็นปัญหาค่อนข้างมาก

ประเภทตัวอย่าง

ตัวอย่างแบ่งออกเป็นสองประเภท:

ความน่าจะเป็น
ความเป็นไปไม่ได้

1. ตัวอย่างความน่าจะเป็น
1.1 การสุ่มตัวอย่าง (การเลือกสุ่มอย่างง่าย)
ตัวอย่างดังกล่าวถือว่ามีความเป็นเนื้อเดียวกันของประชากรทั่วไป ความน่าจะเป็นเท่ากันของการมีอยู่ขององค์ประกอบทั้งหมด การมีอยู่ของรายการที่สมบูรณ์ขององค์ประกอบทั้งหมด เมื่อเลือกองค์ประกอบตามกฎแล้วจะใช้ตารางตัวเลขสุ่ม
1.2 การสุ่มตัวอย่างทางกล (อย่างเป็นระบบ)
ตัวอย่างแบบสุ่ม จัดเรียงตามคุณลักษณะบางอย่าง (ลำดับตามตัวอักษร หมายเลขโทรศัพท์ วันเดือนปีเกิด ฯลฯ) องค์ประกอบแรกจะถูกเลือกแบบสุ่ม จากนั้นทุกองค์ประกอบ 'k' จะถูกเลือกโดยเพิ่มขึ้นทีละ 'n' ขนาดของประชากรทั่วไป ในขณะที่ - N=n*k
1.3 แบ่งชั้น (แบ่งโซน)
ใช้ในกรณีที่มีความหลากหลายของประชากรทั่วไป ประชากรทั่วไปแบ่งออกเป็นกลุ่ม (ชั้น) ในแต่ละชั้น การคัดเลือกจะดำเนินการแบบสุ่มหรือโดยกลไก
1.4 การสุ่มตัวอย่างแบบอนุกรม (แบบซ้อนหรือแบบคลัสเตอร์)
ด้วยการสุ่มตัวอย่างแบบอนุกรม หน่วยของการเลือกไม่ใช่วัตถุ แต่เป็นกลุ่ม (คลัสเตอร์หรือรัง) กลุ่มจะถูกสุ่มเลือก วัตถุภายในกลุ่มจะถูกสำรวจไปทั่ว

2. ตัวอย่างที่เหลือเชื่อ
การคัดเลือกในตัวอย่างดังกล่าวไม่ได้ดำเนินการตามหลักการของโอกาส แต่เป็นไปตามเกณฑ์ส่วนตัว - การเข้าถึง ความธรรมดา การเป็นตัวแทนที่เท่าเทียมกัน ฯลฯ
2.1. การสุ่มตัวอย่างโควต้า
เริ่มแรกมีการจัดสรรกลุ่มวัตถุจำนวนหนึ่ง (เช่นผู้ชายอายุ 20-30 ปี, 31-45 ปีและ 46-60 ปี; บุคคลที่มีรายได้สูงถึง 30,000 rubles โดยมีรายได้ 30 ถึง 60 พันรูเบิลและมีรายได้มากกว่า 60,000 รูเบิล ) สำหรับแต่ละกลุ่มจะระบุจำนวนวัตถุที่จะสำรวจ จำนวนของอ็อบเจ็กต์ที่ควรตกอยู่ในแต่ละกลุ่มถูกกำหนด ส่วนใหญ่มักจะเป็นสัดส่วนกับส่วนแบ่งที่รู้จักก่อนหน้านี้ของกลุ่มในประชากรทั่วไป หรือเท่ากันสำหรับแต่ละกลุ่ม ภายในกลุ่ม วัตถุจะถูกสุ่มเลือก มีการสุ่มตัวอย่างโควต้าค่อนข้างบ่อย
2.2. วิธีสโนว์บอล
สร้างตัวอย่างได้ดังนี้ ขอให้ผู้ตอบแต่ละคนโดยเริ่มจากคนแรก ให้ติดต่อเพื่อน เพื่อนร่วมงาน คนรู้จัก ที่จะเข้าเงื่อนไขการคัดเลือกและสามารถมีส่วนร่วมในการศึกษาวิจัยได้ ดังนั้น ยกเว้นขั้นตอนแรก ตัวอย่างถูกสร้างขึ้นด้วยการมีส่วนร่วมของวัตถุที่ศึกษาด้วยตนเอง วิธีนี้มักใช้เมื่อจำเป็นต้องค้นหาและสัมภาษณ์กลุ่มผู้ตอบแบบสอบถามที่เข้าถึงยาก (เช่น ผู้ตอบแบบสอบถามที่มีรายได้สูง ผู้ตอบแบบสอบถามที่อยู่ในกลุ่มอาชีพเดียวกัน ผู้ตอบแบบสำรวจที่มีงานอดิเรก/ความสนใจคล้ายกัน เป็นต้น )
2.3 การสุ่มตัวอย่างที่เกิดขึ้นเอง
แบบสำรวจผู้ตอบที่เข้าถึงได้มากที่สุด ตัวอย่างทั่วไปของตัวอย่างที่เกิดขึ้นเองนั้นอยู่ในหนังสือพิมพ์/นิตยสารที่มอบให้กับผู้ตอบแบบสำรวจด้วยตนเอง ซึ่งส่วนใหญ่เป็นแบบสำรวจทางอินเทอร์เน็ต ขนาดและองค์ประกอบของตัวอย่างที่เกิดขึ้นเองไม่ทราบล่วงหน้าและถูกกำหนดโดยพารามิเตอร์เดียวเท่านั้น - กิจกรรมของผู้ตอบแบบสอบถาม
2.4 ตัวอย่างกรณีทั่วไป
หน่วยของประชากรทั่วไปถูกเลือกโดยมีค่าเฉลี่ย (ทั่วไป) ของแอตทริบิวต์ ทำให้เกิดปัญหาในการเลือกคุณลักษณะและกำหนดค่าทั่วไป

หลักสูตรการบรรยายเรื่องทฤษฎีสถิติ

สามารถดูข้อมูลรายละเอียดเพิ่มเติมเกี่ยวกับการสังเกตตัวอย่างได้โดยการดู