สูตรปัวซองและกฎการกระจายปัวซอง การกระจายปัวซอง ค่าเฉลี่ยการกระจายปัวซอง

ลองพิจารณาการแจกแจงแบบปัวซอง คำนวณค่าคาดหวังทางคณิตศาสตร์ ความแปรปรวน และโหมดของมัน การใช้ฟังก์ชัน MS EXCEL POISSON.DIST() เราจะสร้างกราฟของฟังก์ชันการแจกแจงและความหนาแน่นของความน่าจะเป็น ให้เราประมาณค่าพารามิเตอร์การแจกแจง ค่าคาดหวังทางคณิตศาสตร์ และค่าเบี่ยงเบนมาตรฐาน

ขั้นแรก เราจะให้คำจำกัดความอย่างเป็นทางการของการแจกแจงแบบแห้งๆ จากนั้นเราจะยกตัวอย่างสถานการณ์เมื่อใด การกระจายปัวซอง(ภาษาอังกฤษ) ปัวซองการกระจาย) เป็นแบบจำลองที่เพียงพอสำหรับการอธิบายตัวแปรสุ่ม

หากเหตุการณ์สุ่มเกิดขึ้นในช่วงเวลาที่กำหนด (หรือในปริมาตรของสสารจำนวนหนึ่ง) โดยมีความถี่เฉลี่ย แล( แลมบ์ดา) ตามด้วยจำนวนเหตุการณ์ x, ที่เกิดขึ้นในช่วงเวลานี้จะมี การกระจายปัวซอง.

การประยุกต์ใช้การกระจายปัวซง

ตัวอย่างเมื่อ การกระจายปัวซองเป็นแบบอย่างที่เหมาะสม:

  • จำนวนสายที่ได้รับจากการแลกเปลี่ยนโทรศัพท์ในช่วงระยะเวลาหนึ่ง
  • จำนวนอนุภาคที่ได้รับการสลายตัวของสารกัมมันตภาพรังสีในช่วงระยะเวลาหนึ่ง
  • จำนวนข้อบกพร่องในผืนผ้าที่มีความยาวคงที่

การกระจายปัวซองเป็นโมเดลที่เหมาะสมหากตรงตามเงื่อนไขต่อไปนี้:

  • เหตุการณ์ต่างๆ เกิดขึ้นอย่างเป็นอิสระต่อกัน เช่น ความน่าจะเป็นของเหตุการณ์ที่ตามมาไม่ได้ขึ้นอยู่กับเหตุการณ์ก่อนหน้า
  • อัตราเหตุการณ์เฉลี่ยคงที่ ด้วยเหตุนี้ ความน่าจะเป็นของเหตุการณ์จึงเป็นสัดส่วนกับความยาวของช่วงการสังเกต
  • สองเหตุการณ์ไม่สามารถเกิดขึ้นพร้อมกันได้
  • จำนวนเหตุการณ์ต้องใช้ค่า 0; 1; 2…

บันทึก: เบาะแสที่ดีคือตัวแปรสุ่มที่สังเกตได้มี การกระจายปัวซงคือความจริงที่ว่ามันมีค่าเท่ากันโดยประมาณ (ดูด้านล่าง)

ด้านล่างนี้เป็นตัวอย่างของสถานการณ์ที่ การกระจายปัวซอง ไม่ได้นำไปใช้:

  • จำนวนนักเรียนที่ออกจากมหาวิทยาลัยภายในหนึ่งชั่วโมง (เนื่องจากการไหลเวียนของนักเรียนโดยเฉลี่ยไม่คงที่: มีนักเรียนไม่กี่คนในระหว่างเรียนและในช่วงพักระหว่างชั้นเรียนจำนวนนักเรียนเพิ่มขึ้นอย่างรวดเร็ว)
  • จำนวนแผ่นดินไหวที่มีแอมพลิจูด 5 จุดต่อปีในแคลิฟอร์เนีย (เนื่องจากแผ่นดินไหวครั้งหนึ่งอาจทำให้เกิดอาฟเตอร์ช็อกในแอมพลิจูดที่คล้ายกัน - เหตุการณ์ไม่เป็นอิสระ)
  • จำนวนวันที่ผู้ป่วยอยู่ในหอผู้ป่วยหนัก (เนื่องจากจำนวนวันที่ผู้ป่วยอยู่ในหอผู้ป่วยหนักจะมากกว่า 0 เสมอ)

บันทึก: การกระจายปัวซองเป็นการประมาณของการแจกแจงแบบแยกส่วนที่แม่นยำยิ่งขึ้น: และ

บันทึก: เกี่ยวกับความสัมพันธ์ การกระจายปัวซองและ การแจกแจงแบบทวินามสามารถอ่านได้ในบทความ เกี่ยวกับความสัมพันธ์ การกระจายปัวซองและ การกระจายแบบเอ็กซ์โปเนนเชียลสามารถอ่านได้ในบทความเกี่ยวกับ

การกระจายปัวซองใน MS EXCEL

ใน MS EXCEL เริ่มตั้งแต่เวอร์ชัน 2010 สำหรับ การแจกแจง ปัวซองมีฟังก์ชัน POISSON.DIST() ชื่อภาษาอังกฤษ - POISSON.DIST() ซึ่งช่วยให้คุณคำนวณไม่เพียงแต่ความน่าจะเป็นที่จะเกิดขึ้นในช่วงเวลาที่กำหนดเท่านั้น เอ็กซ์เหตุการณ์ (ฟังก์ชั่น ความหนาแน่นของความน่าจะเป็น p(x) ดูสูตรด้านบน) แต่ยัง (ความน่าจะเป็นที่ในช่วงเวลาที่กำหนดอย่างน้อยที่สุด xเหตุการณ์)

ก่อน MS EXCEL 2010 EXCEL มีฟังก์ชัน POISSON() ซึ่งช่วยให้คุณสามารถคำนวณได้ ฟังก์ชั่นการกระจายและ ความหนาแน่นของความน่าจะเป็นพี(เอ็กซ์) POISSON() เหลืออยู่ใน MS EXCEL 2010 เพื่อความเข้ากันได้

ไฟล์ตัวอย่างประกอบด้วยกราฟ การกระจายความหนาแน่นของความน่าจะเป็นและ ฟังก์ชันการกระจายสะสม.

การกระจายปัวซองมีรูปร่างบิดเบี้ยว (หางยาวทางด้านขวาของฟังก์ชันความน่าจะเป็น) แต่เมื่อพารามิเตอร์ แล เพิ่มขึ้น ก็จะมีความสมมาตรมากขึ้นเรื่อยๆ

บันทึก: เฉลี่ยและ การกระจายตัว(สี่เหลี่ยมจัตุรัส) เท่ากับพารามิเตอร์ การกระจายปัวซอง– แล (ดู ตัวอย่างไฟล์ชีท ตัวอย่าง).

งาน

การใช้งานทั่วไป การแจกแจงแบบปัวซงในการควบคุมคุณภาพเป็นแบบจำลองของจำนวนข้อบกพร่องที่อาจปรากฏในเครื่องมือหรืออุปกรณ์

ตัวอย่างเช่น ด้วยจำนวนข้อบกพร่องโดยเฉลี่ยในชิป lambda (แลมบ์ดา) เท่ากับ 4 ความน่าจะเป็นที่ชิปที่เลือกแบบสุ่มจะมีข้อบกพร่อง 2 จุดหรือน้อยกว่าคือ: = ปัวซอง.DIST(2,4,จริง)=0.2381

พารามิเตอร์ตัวที่สามในฟังก์ชันคือ set = TRUE ดังนั้นฟังก์ชันจะส่งคืน ฟังก์ชันการกระจายสะสมนั่นคือความน่าจะเป็นที่จำนวนเหตุการณ์สุ่มจะอยู่ในช่วงตั้งแต่ 0 ถึง 4 รวม

การคำนวณในกรณีนี้ทำตามสูตร:

ความน่าจะเป็นที่ไมโครวงจรที่เลือกแบบสุ่มจะมีข้อบกพร่อง 2 จุดคือ: = POISSON.DIST(2,4,FALSE)=0.1465

พารามิเตอร์ตัวที่สามในฟังก์ชันคือ set = FALSE ดังนั้นฟังก์ชันจะส่งกลับความหนาแน่นของความน่าจะเป็น

ความน่าจะเป็นที่ไมโครวงจรที่เลือกแบบสุ่มจะมีข้อบกพร่องมากกว่า 2 ข้อเท่ากับ: =1-POISSON.DIST(2,4,จริง) =0.8535

บันทึก: ถ้า xไม่ใช่จำนวนเต็ม ดังนั้นเมื่อคำนวณสูตร . สูตร =POISSON.DIST( 2 ; 4; โกหก)และ =POISSON.DIST( 2,9 ; 4; โกหก)จะกลับมาผลลัพธ์เดียวกัน

การสร้างตัวเลขสุ่มและการประมาณค่า แล

สำหรับค่าของ แล >15 , การกระจายปัวซองประมาณอย่างดี การกระจายแบบปกติด้วยพารามิเตอร์ต่อไปนี้: μ , σ 2 .

รายละเอียดเพิ่มเติมเกี่ยวกับความสัมพันธ์ระหว่างการแจกแจงเหล่านี้สามารถพบได้ในบทความ นอกจากนี้ยังมีตัวอย่างของการประมาณ และเงื่อนไขว่าเมื่อใดที่เป็นไปได้และความแม่นยำใดบ้างที่อธิบายไว้

คำแนะนำ: คุณสามารถอ่านเกี่ยวกับการแจกแจง MS EXCEL อื่น ๆ ได้ในบทความ

กฎหมายการกระจายแบบทวินามใช้กับกรณีที่เก็บตัวอย่างในขนาดคงที่ การแจกแจงปัวซองใช้กับกรณีที่ จำนวนเหตุการณ์สุ่มที่เกิดขึ้นในช่วงความยาว พื้นที่ ปริมาตร หรือเวลาที่กำหนด ในขณะที่พารามิเตอร์ที่กำหนดของการแจกแจงคือจำนวนเหตุการณ์โดยเฉลี่ย ไม่ใช่ขนาดตัวอย่าง และความน่าจะเป็นของความสำเร็จ ร.ตัวอย่างเช่น จำนวนความไม่เป็นไปตามข้อกำหนดในตัวอย่าง หรือจำนวนความไม่เป็นไปตามข้อกำหนดต่อหน่วยการผลิต

การกระจายความน่าจะเป็นสำหรับจำนวนความสำเร็จ เอ็กซ์มีแบบฟอร์มดังนี้

หรือเราบอกได้ว่าตัวแปรสุ่มแบบไม่ต่อเนื่อง เอ็กซ์กระจายตามกฎของปัวซองหากค่าที่เป็นไปได้คือ 0.1, 2, ...ที, ...พี,และความน่าจะเป็นที่จะเกิดขึ้นของค่าดังกล่าวจะถูกกำหนดโดยความสัมพันธ์:

ที่ไหน หรือ แล คือค่าบวกที่เรียกว่าพารามิเตอร์การแจกแจงแบบปัวซอง

กฎของปัวซองใช้กับเหตุการณ์ที่เกิดขึ้น "ไม่บ่อยนัก" ในขณะที่ความเป็นไปได้ของความสำเร็จครั้งต่อไป (เช่น ความล้มเหลว) ยังคงมีอยู่อย่างต่อเนื่อง เป็นค่าคงที่ และไม่ขึ้นอยู่กับจำนวนความสำเร็จหรือความล้มเหลวครั้งก่อน (เมื่อเรากำลังพูดถึงกระบวนการที่พัฒนาไปมากกว่านั้น) เวลานี้เรียกว่า "ความเป็นอิสระจากอดีต") ตัวอย่างคลาสสิกที่กฎของปัวซองใช้คือจำนวนสายโทรศัพท์ที่ชุมสายโทรศัพท์ในช่วงเวลาที่กำหนด ตัวอย่างอื่นๆ อาจเป็นจำนวนจุดหมึกบนหน้าต้นฉบับที่เขียนอย่างเลอะเทอะ หรือจำนวนจุดที่ไปอยู่บนตัวรถขณะทาสี กฎหมายการกระจายปัวซองจะวัดจำนวนข้อบกพร่อง ไม่ใช่จำนวนผลิตภัณฑ์ที่มีข้อบกพร่อง

การแจกแจงแบบปัวซองถูกควบคุมโดยจำนวนเหตุการณ์สุ่มที่เกิดขึ้นในช่วงเวลาที่กำหนดหรือในพื้นที่คงที่ของอวกาศ สำหรับ แล<1 значение P(m) монотонно убывает с ростом m то, a при λ>1 ค่า P(m) เพิ่มขึ้น ผ่านจุดสูงสุดใกล้ /

คุณลักษณะของการแจกแจงปัวซองคือความแปรปรวนเท่ากับค่าคาดหวังทางคณิตศาสตร์ พารามิเตอร์การกระจายปัวซอง

M(x) = σ 2 = แล (15)

คุณลักษณะของการแจกแจงปัวซองนี้ช่วยให้เราสามารถระบุในทางปฏิบัติได้ว่าการแจกแจงของตัวแปรสุ่มที่ได้รับจากการทดลองจะขึ้นอยู่กับการแจกแจงแบบปัวซองหากค่าตัวอย่างของความคาดหวังและความแปรปรวนทางคณิตศาสตร์มีค่าเท่ากันโดยประมาณ

กฎของเหตุการณ์ที่หายากถูกนำมาใช้ในวิศวกรรมเครื่องกลสำหรับการควบคุมการคัดเลือกผลิตภัณฑ์สำเร็จรูป เมื่อตามเงื่อนไขทางเทคนิค อนุญาตให้มีเปอร์เซ็นต์ของข้อบกพร่อง (โดยปกติมีขนาดเล็ก) ในชุดผลิตภัณฑ์ที่ยอมรับ q<<0.1.

ถ้าความน่าจะเป็น q ของเหตุการณ์ A น้อยมาก (q≤0.1) และจำนวนการทดลองมีมาก ความน่าจะเป็นที่เหตุการณ์ A จะเกิดขึ้น m ครั้งใน n การทดลองจะเท่ากับ



โดยที่ แล = M(x) = nq

ในการคำนวณการแจกแจงปัวซอง คุณสามารถใช้ความสัมพันธ์ที่เกิดซ้ำต่อไปนี้

การแจกแจงแบบปัวซองมีบทบาทสำคัญในวิธีการประกันคุณภาพทางสถิติ เนื่องจากสามารถใช้เพื่อประมาณการแจกแจงแบบไฮเปอร์จีโอเมตริกและแบบทวินามได้

การประมาณดังกล่าวเป็นที่ยอมรับได้เมื่อ โดยมีเงื่อนไขว่า qn มีขีดจำกัดจำกัดและ q<0.1. Когда พี →∞, ก ร → 0, เฉลี่ย ไม่มี = เสื้อ =ค่าคงที่

เมื่อใช้กฎของเหตุการณ์ที่เกิดขึ้นได้ยาก คุณสามารถคำนวณความน่าจะเป็นที่ตัวอย่างที่มี n หน่วยจะมีได้ เช่น 0,1,2,3 เป็นต้น ชิ้นส่วนที่มีข้อบกพร่องเช่น ให้ m ครั้ง คุณยังสามารถคำนวณความน่าจะเป็นของชิ้นส่วนที่มีข้อบกพร่อง m หรือมากกว่านั้นที่ปรากฏในตัวอย่างดังกล่าวได้ ความน่าจะเป็นนี้ตามกฎของการเพิ่มความน่าจะเป็นจะเท่ากับ:

ตัวอย่างที่ 1. แบตช์ประกอบด้วยชิ้นส่วนที่ชำรุด โดยมีสัดส่วน 0.1 10 ชิ้นส่วนจะถูกนำมาตามลำดับและตรวจสอบ หลังจากนั้นจะถูกส่งกลับไปยังแบทช์ นั่นคือ การทดสอบมีความเป็นอิสระ ความน่าจะเป็นที่เมื่อตรวจสอบ 10 ชิ้นจะมีข้อบกพร่องเป็นเท่าใด?

สารละลายจากเงื่อนไขปัญหา q=0.1; n=10; m=1.แน่นอนว่า p=1-q=0.9

ผลลัพธ์ที่ได้ยังสามารถนำไปใช้กับเคสเมื่อนำชิ้นส่วน 10 ชิ้นออกติดต่อกันโดยไม่คืนกลับเข้าสู่แบตช์ หากมีจำนวนมากพอ เช่น 1,000 ชิ้น ความน่าจะเป็นในการแยกชิ้นส่วนจะเปลี่ยนแปลงไปเล็กน้อย ดังนั้นภายใต้เงื่อนไขดังกล่าว การถอดชิ้นส่วนที่ชำรุดออกจึงถือได้ว่าเป็นเหตุการณ์ที่ไม่ขึ้นอยู่กับผลการทดสอบครั้งก่อน

ตัวอย่างที่ 2ในชุดประกอบด้วยชิ้นส่วนที่มีข้อบกพร่อง 1% ความน่าจะเป็นที่เมื่อเก็บตัวอย่างสินค้า 50 หน่วยจากชุด จะมีชิ้นส่วนที่ชำรุด 0, 1, 2, 3, 4 ชิ้นเป็นเท่าใด

สารละลาย.ที่นี่ q=0.01, nq=50*0.01=0.5

ดังนั้น เพื่อใช้การแจกแจงปัวซองอย่างมีประสิทธิผลเป็นการประมาณทวินาม จึงจำเป็นที่ความน่าจะเป็นที่จะสำเร็จ น้อยลงอย่างเห็นได้ชัด ถามไม่มี = เสื้อเป็นลำดับหนึ่ง (หรือหลายหน่วย)

ดังนั้นวิธีการประกันคุณภาพทางสถิติ

กฎหมายไฮเปอร์เรขาคณิตใช้ได้กับตัวอย่างทุกขนาด และความไม่สอดคล้องในระดับใดๆ ถาม ,

กฎทวินามและกฎของปัวซอง เป็นกรณีพิเศษตามลำดับ โดยมีเงื่อนไขว่า n/N<0,1 и

การแนะนำ

ปรากฏการณ์สุ่มอยู่ภายใต้กฎหมายใดๆ หรือไม่? ใช่ แต่กฎหมายเหล่านี้แตกต่างจากกฎหมายทางกายภาพที่เราคุ้นเคย ไม่สามารถทำนายค่าของ SV ได้แม้ภายใต้เงื่อนไขการทดลองที่ทราบ เราสามารถระบุความน่าจะเป็นที่ SV จะใช้ค่าหนึ่งหรือค่าอื่นเท่านั้น แต่เมื่อทราบการกระจายความน่าจะเป็นของ SV เราสามารถสรุปเกี่ยวกับเหตุการณ์ที่ตัวแปรสุ่มเหล่านี้มีส่วนร่วมได้ จริงอยู่ ข้อสรุปเหล่านี้ก็มีความน่าจะเป็นเช่นกัน

ปล่อยให้ SV บางส่วนไม่ต่อเนื่องเช่น สามารถรับค่า Xi คงที่เท่านั้น ในกรณีนี้ ชุดของค่าความน่าจะเป็น P(Xi) สำหรับค่าที่อนุญาตทั้งหมด (i=1…n) ของปริมาณนี้เรียกว่า กฎการกระจาย

กฎการกระจายของ SV คือความสัมพันธ์ที่สร้างการเชื่อมโยงระหว่างค่าที่เป็นไปได้ของ SV และความน่าจะเป็นที่ค่าเหล่านี้ได้รับการยอมรับ กฎหมายการจำหน่ายระบุลักษณะเฉพาะของ SV อย่างสมบูรณ์

เมื่อสร้างแบบจำลองทางคณิตศาสตร์เพื่อทดสอบสมมติฐานทางสถิติ จำเป็นต้องแนะนำสมมติฐานทางคณิตศาสตร์เกี่ยวกับกฎการกระจายตัวของ SV (วิธีการสร้างแบบจำลองแบบพาราเมตริก)

วิธีการอธิบายแบบจำลองทางคณิตศาสตร์แบบไม่อิงพารามิเตอร์ (SV ไม่มีกฎการแจกแจงแบบอิงพารามิเตอร์) มีความแม่นยำน้อยกว่า แต่มีขอบเขตที่กว้างกว่า

เช่นเดียวกับความน่าจะเป็นของเหตุการณ์สุ่ม สำหรับกฎการกระจายของ SV มีเพียงสองวิธีในการค้นหา ไม่ว่าเราจะสร้างไดอะแกรมของเหตุการณ์สุ่มและค้นหานิพจน์เชิงวิเคราะห์ (สูตร) ​​เพื่อคำนวณความน่าจะเป็น (อาจมีคนทำไปแล้วหรือจะทำสิ่งนี้ให้เรา!) หรือเราจะต้องใช้การทดลองและขึ้นอยู่กับความถี่ จากการสังเกต ให้ตั้งสมมติฐาน (หยิบยกสมมติฐาน) เกี่ยวกับการแจกแจงกฎหมาย

แน่นอนว่า สำหรับการแจกแจงแบบ "คลาสสิก" แต่ละครั้ง งานนี้ทำกันมานานแล้ว - เป็นที่รู้จักอย่างกว้างขวางและมักใช้ในสถิติประยุกต์ ได้แก่ การแจกแจงแบบทวินามและพหุนาม เรขาคณิตและไฮเปอร์จีโอเมตริก การแจกแจงแบบปาสคาลและปัวซง และอื่นๆ อีกมากมาย

สำหรับการแจกแจงแบบคลาสสิกเกือบทั้งหมด ตารางสถิติพิเศษจะถูกสร้างขึ้นและเผยแพร่ทันที และปรับปรุงเมื่อความแม่นยำของการคำนวณเพิ่มขึ้น หากไม่มีการใช้ตารางเหล่านี้จำนวนมาก หากไม่มีการฝึกอบรมกฎเกณฑ์ในการใช้งาน การใช้สถิติในทางปฏิบัติจึงเป็นไปไม่ได้ในช่วงสองศตวรรษที่ผ่านมา

วันนี้สถานการณ์เปลี่ยนไป - ไม่จำเป็นต้องจัดเก็บข้อมูลการคำนวณโดยใช้สูตร (ไม่ว่าสูตรหลังจะซับซ้อนแค่ไหนก็ตาม!) เวลาในการใช้กฎการกระจายสำหรับการปฏิบัติลดลงเหลือเพียงนาทีหรือวินาที มีแพ็คเกจซอฟต์แวร์แอพพลิเคชั่นที่แตกต่างกันจำนวนเพียงพอสำหรับวัตถุประสงค์เหล่านี้

ในบรรดาการแจกแจงความน่าจะเป็นทั้งหมด มีการแจกแจงแบบที่ใช้บ่อยโดยเฉพาะในทางปฏิบัติ การแจกแจงเหล่านี้ได้รับการศึกษาอย่างละเอียดแล้วและทราบคุณสมบัติต่างๆ เป็นอย่างดี การแจกแจงเหล่านี้จำนวนมากรองรับความรู้ทั้งหมด เช่น ทฤษฎีคิว ทฤษฎีความน่าเชื่อถือ การควบคุมคุณภาพ ทฤษฎีเกม ฯลฯ

ในหมู่พวกเขาไม่มีใครช่วยได้ แต่ให้ความสนใจกับผลงานของปัวซอง (พ.ศ. 2324-2383) ซึ่งพิสูจน์รูปแบบทั่วไปของกฎจำนวนมากมากกว่าจาค็อบเบอร์นูลลีและเป็นครั้งแรกที่ใช้ทฤษฎีความน่าจะเป็นในการแก้ไขปัญหา . ชื่อของปัวซองมีความเกี่ยวข้องกับกฎการกระจายข้อหนึ่งซึ่งมีบทบาทสำคัญในทฤษฎีความน่าจะเป็นและการประยุกต์ของมัน

เป็นกฎหมายการแจกจ่ายที่งานหลักสูตรนี้อุทิศให้ เราจะพูดคุยโดยตรงเกี่ยวกับกฎ คุณลักษณะทางคณิตศาสตร์ คุณสมบัติพิเศษ และการเชื่อมโยงกับการแจกแจงแบบทวินาม จะมีการกล่าวถ้อยคำสองสามคำเกี่ยวกับการประยุกต์ใช้ในทางปฏิบัติและจะมีการยกตัวอย่างจากการปฏิบัติหลายประการ

จุดประสงค์ของการเขียนเรียงความของเราคือเพื่อชี้แจงสาระสำคัญของทฤษฎีบทการกระจายตัวของแบร์นูลลีและปัวซอง

ภารกิจคือศึกษาและวิเคราะห์วรรณกรรมในหัวข้อเรียงความ

1. การแจกแจงแบบทวินาม (การแจกแจงแบบแบร์นูลลี)

การแจกแจงแบบทวินาม (การแจกแจงแบบแบร์นูลลี) - การแจกแจงความน่าจะเป็นของจำนวนครั้งของเหตุการณ์บางอย่างระหว่างการทดลองอิสระซ้ำๆ หากความน่าจะเป็นของเหตุการณ์นี้ในการทดลองแต่ละครั้งเท่ากับ p (0

SV X ได้รับการแจกแจงตามกฎของเบอร์นูลลีด้วยพารามิเตอร์ p หากรับค่า 0 และ 1 ด้วยความน่าจะเป็น pX(x)ºP(X=x) = pxq1-x; พี+คิว=1; x=0.1

การแจกแจงแบบทวินามเกิดขึ้นในกรณีที่ถามคำถาม: เหตุการณ์บางอย่างเกิดขึ้นกี่ครั้งในชุดของการสังเกตอิสระ (การทดลอง) ที่ดำเนินการภายใต้เงื่อนไขเดียวกันจำนวนหนึ่ง

เพื่อความสะดวกและชัดเจน เราจะถือว่าเราทราบค่า p - ความน่าจะเป็นที่ผู้เยี่ยมชมเข้าร้านจะกลายเป็นผู้ซื้อ และ (1- p) = q - ความน่าจะเป็นที่ผู้เยี่ยมชมจะไม่เข้าร้าน ผู้ซื้อ

หาก X คือจำนวนผู้ซื้อจากจำนวนผู้เข้าชมทั้งหมด n ราย ความน่าจะเป็นที่จะมีผู้ซื้อ k รายในจำนวนผู้เยี่ยมชม n รายจะเท่ากับ

P(X= k) = , โดยที่ k=0,1,…n 1)

สูตร (1) เรียกว่า สูตรของเบอร์นูลลี จากการทดสอบจำนวนมาก การแจกแจงแบบทวินามมีแนวโน้มว่าจะเป็นเรื่องปกติ

การทดสอบเบอร์นูลลีคือการทดสอบความน่าจะเป็นที่มีผลลัพธ์ 2 รายการ ซึ่งมักเรียกว่า "ความสำเร็จ" (โดยปกติจะแสดงด้วยสัญลักษณ์ 1) และ "ความล้มเหลว" (แสดงตามลำดับด้วย 0) ความน่าจะเป็นของความสำเร็จมักจะแสดงด้วยตัวอักษร p ความล้มเหลว - ด้วยตัวอักษร q; แน่นอน q=1-p ค่า p เรียกว่าพารามิเตอร์การทดสอบ Bernoulli

ตัวแปรสุ่มทวินาม เรขาคณิต ปาสคาล และลบทวินามได้มาจากลำดับของการทดลองเบอร์นูลลีอิสระ ถ้าลำดับสิ้นสุดลงไม่ทางใดก็ทางหนึ่ง เช่น หลังจากการทดลองครั้งที่ n หรือความสำเร็จครั้งที่ x คำศัพท์ต่อไปนี้ใช้กันทั่วไป:

– พารามิเตอร์การทดสอบ Bernoulli (ความน่าจะเป็นที่จะสำเร็จในการทดสอบครั้งเดียว)

– จำนวนการทดสอบ

– จำนวนความสำเร็จ

– จำนวนความล้มเหลว

ตัวแปรสุ่มทวินาม (m|n,p) – จำนวน m ความสำเร็จในการทดลอง n ครั้ง

ตัวแปรสุ่มเชิงเรขาคณิต G(m|p) – จำนวน m ของการทดลองจนกระทั่งประสบความสำเร็จครั้งแรก (รวมถึงความสำเร็จครั้งแรกด้วย)

ตัวแปรสุ่มปาสคาล C(m|x,p) – จำนวน m ของการทดลองจนถึงความสำเร็จครั้งที่ x (แน่นอนว่าไม่รวมถึงความสำเร็จครั้งที่ x เองด้วย)

ตัวแปรสุ่มทวินามเชิงลบ Y(m|x,p) – จำนวน m ของความล้มเหลวก่อนความสำเร็จครั้งที่ x (ไม่รวมความสำเร็จครั้งที่ x)

หมายเหตุ: บางครั้งการแจกแจงแบบทวินามลบเรียกว่าการแจกแจงแบบปาสคาล และในทางกลับกัน


การกระจายปัวซอง

2.1. คำจำกัดความของกฎของปัวซอง

ในปัญหาเชิงปฏิบัติหลายๆ ปัญหา เราจะต้องจัดการกับตัวแปรสุ่มที่กระจายไปตามกฎเฉพาะ ซึ่งเรียกว่ากฎของปัวซอง

ลองพิจารณาตัวแปรสุ่มที่ไม่ต่อเนื่อง X ซึ่งสามารถรับได้เพียงจำนวนเต็มและค่าที่ไม่เป็นลบ: 0, 1, 2, ... , m, ... ; ยิ่งไปกว่านั้น ลำดับของค่าเหล่านี้ไม่มีขีดจำกัดในทางทฤษฎี ตัวแปรสุ่ม X ได้รับการแจกแจงตามกฎของปัวซอง หากความน่าจะเป็นที่ตัวแปรสุ่มจะใช้ค่า m ที่แน่นอนจะแสดงโดยสูตร:

โดยที่ a คือปริมาณบวกที่เรียกว่าพารามิเตอร์กฎของปัวซอง

อนุกรมการแจกแจงของตัวแปรสุ่ม X ซึ่งแจกแจงตามกฎของปัวซองมีลักษณะดังนี้:

xm
บ่ายโมง อีเอ

2.2.ลักษณะสำคัญของการกระจายปัวซอง

ขั้นแรก ตรวจสอบให้แน่ใจว่าลำดับของความน่าจะเป็นสามารถเป็นอนุกรมการแจกแจงได้ เช่น ว่าผลรวมของความน่าจะเป็นทั้งหมด Рm เท่ากับหนึ่ง

เราใช้ส่วนขยายของฟังก์ชัน ex ในซีรี่ส์ Maclaurin:

เป็นที่ทราบกันว่าอนุกรมนี้มาบรรจบกันสำหรับค่า x ใดๆ ก็ตาม ดังนั้นเมื่อรับ x = a เราก็จะได้

เพราะฉะนั้น

ให้เราพิจารณาคุณลักษณะหลัก - ความคาดหวังและการกระจายทางคณิตศาสตร์ - ของตัวแปรสุ่ม X ที่แจกแจงตามกฎของปัวซอง ความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่มแบบไม่ต่อเนื่องคือผลรวมของผลิตภัณฑ์ของค่าที่เป็นไปได้ทั้งหมดและความน่าจะเป็น ตามคำนิยาม เมื่อตัวแปรสุ่มแบบแยกรับชุดของค่าที่นับได้:

เทอมแรกของผลรวม (ตรงกับ m=0) เท่ากับศูนย์ ดังนั้นผลรวมจึงเริ่มต้นด้วย m=1:

ดังนั้น พารามิเตอร์ a จึงไม่มีอะไรมากไปกว่าความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม X

ความแปรปรวนของตัวแปรสุ่ม X คือค่าคาดหวังทางคณิตศาสตร์ของค่าเบี่ยงเบนกำลังสองของตัวแปรสุ่มจากค่าคาดหวังทางคณิตศาสตร์:

อย่างไรก็ตาม จะสะดวกกว่าในการคำนวณโดยใช้สูตร:

ดังนั้น ให้เราค้นหาโมเมนต์เริ่มต้นที่สองของค่า X ก่อน:

ตามที่พิสูจน์แล้วก่อนหน้านี้

นอกจาก,

2.3.ลักษณะเพิ่มเติมของการแจกแจงแบบปัวซอง

I. โมเมนต์เริ่มต้นของลำดับ k ของตัวแปรสุ่ม X คือความคาดหวังทางคณิตศาสตร์ของค่า Xk:

โดยเฉพาะอย่างยิ่ง ช่วงเริ่มต้นของลำดับแรกจะเท่ากับความคาดหวังทางคณิตศาสตร์:

ครั้งที่สอง โมเมนต์กลางของลำดับ k ของตัวแปรสุ่ม X คือความคาดหวังทางคณิตศาสตร์ของค่า k:

โดยเฉพาะอย่างยิ่ง โมเมนต์ศูนย์กลางลำดับที่ 1 คือ 0:

μ1=ม=0,

โมเมนต์กลางของลำดับที่ 2 เท่ากับการกระจายตัว:

μ2=M2=ก

สาม. สำหรับตัวแปรสุ่ม X ที่แจกแจงตามกฎของปัวซอง เราจะพบความน่าจะเป็นที่ตัวแปรสุ่มจะมีค่าไม่ต่ำกว่าค่า k ที่กำหนด เราแสดงความน่าจะเป็นนี้ด้วย Rk:

แน่นอนว่าความน่าจะเป็น Rk สามารถคำนวณเป็นผลรวมได้

อย่างไรก็ตาม การพิจารณาจากความน่าจะเป็นของเหตุการณ์ตรงกันข้ามจะง่ายกว่ามาก:

โดยเฉพาะอย่างยิ่ง ความน่าจะเป็นที่ค่า X จะเป็นค่าบวกจะแสดงโดยสูตร

ดังที่ได้กล่าวไปแล้ว ปัญหาการฝึกปฏิบัติหลายอย่างส่งผลให้เกิดการแจกแจงแบบปัวซง ลองพิจารณาหนึ่งในปัญหาทั่วไปประเภทนี้

รูปที่ 2

ให้จุดกระจายแบบสุ่มบนแกน x Ox (รูปที่ 2) สมมติว่าการแจกแจงคะแนนแบบสุ่มเป็นไปตามเงื่อนไขต่อไปนี้:

1) ความน่าจะเป็นที่จุดจำนวนหนึ่งจะตกลงบนส่วน l ขึ้นอยู่กับความยาวของส่วนนี้เท่านั้น แต่ไม่ขึ้นอยู่กับตำแหน่งบนแกน abscissa กล่าวอีกนัยหนึ่ง จุดต่างๆ จะถูกกระจายบนแกน x โดยมีความหนาแน่นเฉลี่ยเท่ากัน ให้เราแสดงถึงความหนาแน่นนี้เช่น ความคาดหวังทางคณิตศาสตร์ของจำนวนคะแนนต่อความยาวหน่วย แสดงผ่าน แล

2) จุดต่างๆ ถูกกระจายบนแกน x โดยแยกจากกัน เช่น ความน่าจะเป็นที่คะแนนจำนวนหนึ่งจะตกลงบนส่วนที่กำหนดนั้นไม่ได้ขึ้นอยู่กับจำนวนคะแนนที่ตกบนส่วนอื่น ๆ ที่ไม่ทับซ้อนกับจุดนั้น

3) ความน่าจะเป็นที่จุดสองจุดขึ้นไปจะตกลงไปในพื้นที่เล็กๆ ∆x นั้นน้อยมากเมื่อเทียบกับความน่าจะเป็นที่จุดหนึ่งจุดจะตกลงมา (เงื่อนไขนี้หมายถึงความเป็นไปไม่ได้ในทางปฏิบัติที่มีจุดสองจุดขึ้นไปที่ตรงกัน)

ให้เราเลือกส่วนของความยาว l บนแกน abscissa และพิจารณาตัวแปรสุ่มแบบไม่ต่อเนื่อง X - จำนวนจุดที่ตกลงบนส่วนนี้ ค่าที่เป็นไปได้ของปริมาณจะเป็น 0,1,2,...,m,... เนื่องจากจุดตกบนส่วนที่เป็นอิสระจากกันจึงเป็นไปได้ในทางทฤษฎีว่าจะมีจำนวนมากที่สุดเท่าที่จะเป็นไปได้ ต้องการเช่น ซีรีส์นี้ดำเนินต่อไปอย่างไม่มีกำหนด

ให้เราพิสูจน์ว่าตัวแปรสุ่ม X มีการกระจายตามกฎของปัวซอง ในการทำเช่นนี้ คุณต้องคำนวณความน่าจะเป็น Pm ที่จุด m จะตกบนส่วนนั้นอย่างแน่นอน

มาแก้ไขปัญหาที่ง่ายกว่านี้ก่อน ลองพิจารณาพื้นที่เล็กๆ ∆x บนแกน Ox แล้วคำนวณความน่าจะเป็นที่จุดจะตกบนพื้นที่นี้อย่างน้อยหนึ่งจุด เราจะให้เหตุผลดังนี้ ความคาดหวังทางคณิตศาสตร์ของจำนวนคะแนนที่ตกลงในส่วนนี้เห็นได้ชัดว่าเท่ากับ γ·Δх (เนื่องจากโดยเฉลี่ยแล้ว γ คะแนนจะลดลงต่อความยาวหน่วย) ตามเงื่อนไขที่ 3 สำหรับส่วนเล็กๆ Δx เราสามารถละเลยความเป็นไปได้ที่จุดสองจุดขึ้นไปจะตกลงไป ดังนั้น ความคาดหวังทางคณิตศาสตร์ γ·Δх ของจำนวนจุดที่ตกลงบนพื้นที่ Δх จะเท่ากับความน่าจะเป็นโดยประมาณที่จุดหนึ่งจะตกลงบนพื้นที่นั้น (หรืออย่างน้อยหนึ่งจุด ซึ่งเทียบเท่าในเงื่อนไขเหล่านี้)

ดังนั้น จนถึงลำดับที่สูงกว่าเล็กน้อย สำหรับ Δx→0 เราสามารถพิจารณาความน่าจะเป็นที่จุดหนึ่ง (อย่างน้อยหนึ่งจุด) จะตกบนส่วน Δx เท่ากับ แล·Δx และความน่าจะเป็นที่ไม่มีจุดใดจะตกเท่ากับ 1 -c ·∆x.

ลองใช้ค่านี้เพื่อคำนวณความน่าจะเป็น Pm ของจุด m ที่ตกลงบนส่วน l พอดี ให้เราแบ่งส่วน l ออกเป็นส่วน ๆ ของความยาวเท่า ๆ กัน เราตกลงที่จะเรียกเซ็กเมนต์พื้นฐาน Δx ว่า ​​“ว่างเปล่า” หากไม่มีจุดเดียว และ “ถูกครอบครอง” ถ้ามีอย่างน้อยหนึ่งจุดเกิดขึ้น จากที่กล่าวไว้ข้างต้น ความน่าจะเป็นที่ส่วน Δх จะถูก "ครอบครอง" มีค่าประมาณเท่ากับ lad·Δх=; ความน่าจะเป็นที่จะ "ว่างเปล่า" คือ 1- เนื่องจากตามเงื่อนไขที่ 2 จุดที่ตกอยู่ในส่วนที่ไม่ทับซ้อนกันมีความเป็นอิสระ ดังนั้นส่วนที่ n ของเราจึงถือเป็น "การทดลอง" อิสระ n ซึ่งในแต่ละส่วนสามารถ "ครอบครอง" ได้โดยมีความน่าจะเป็น p= มาหาความน่าจะเป็นที่ในกลุ่ม n กลุ่มจะมี "ถูกครอบครอง" อย่างแน่นอน ตามทฤษฎีบทของการทดลองอิสระซ้ำๆ ความน่าจะเป็นนี้มีค่าเท่ากับ

,

หรือให้เราแสดงว่า γl=a:

.

สำหรับ n ที่มีขนาดใหญ่เพียงพอ ความน่าจะเป็นนี้จะเท่ากับความน่าจะเป็นที่จุด m ตกลงบนส่วน l โดยประมาณ เนื่องจาก ความน่าจะเป็นที่จุดสองจุดขึ้นไปจะตกลงบนส่วน Δx นั้นน้อยมาก เพื่อที่จะหาค่าที่แน่นอนของ Рm คุณจะต้องไปถึงขีดจำกัดเป็น n→∞:

เมื่อพิจารณาแล้วว่า

,

เราพบว่าความน่าจะเป็นที่ต้องการแสดงโดยสูตร

โดยที่ a=γl คือ ค่าของ X จะถูกกระจายตามกฎของปัวซองโดยมีพารามิเตอร์ a=γl

ควรสังเกตว่าค่า a ในความหมายแสดงถึงจำนวนคะแนนเฉลี่ยต่อส่วน l ค่า R1 (ความน่าจะเป็นที่ค่า X จะเป็นค่าบวก) ในกรณีนี้แสดงความน่าจะเป็นที่อย่างน้อยหนึ่งจุดจะตกบนส่วน l: R1=1-e-a

ดังนั้นเราจึงมั่นใจว่าการแจกแจงแบบปัวซงเกิดขึ้นเมื่อจุดบางจุด (หรือองค์ประกอบอื่นๆ) ครอบครองตำแหน่งสุ่มที่แยกจากกัน และนับจำนวนจุดเหล่านี้ที่ตกไปในบางพื้นที่ ในกรณีของเรา พื้นที่ดังกล่าวคือส่วน l บนแกนแอบซิสซา อย่างไรก็ตาม ข้อสรุปนี้สามารถขยายไปยังกรณีของการกระจายจุดบนระนาบ (สนามจุดสุ่มแบบสุ่ม) และในอวกาศ (สนามจุดเชิงพื้นที่แบบสุ่ม) ได้อย่างง่ายดาย พิสูจน์ได้ไม่ยากว่าหากตรงตามเงื่อนไข:

1) คะแนนมีการกระจายอย่างสม่ำเสมอทางสถิติในสนามโดยมีความหนาแน่นเฉลี่ย แล;

2) คะแนนตกอยู่ในภูมิภาคที่ไม่ทับซ้อนกันอย่างอิสระ

3) จุดปรากฏเพียงจุดเดียว ไม่ใช่เป็นคู่ แฝดสาม ฯลฯ

จากนั้นจำนวนจุด X ที่ตกลงไปในพื้นที่ D ใดๆ (แฟลตหรือเชิงพื้นที่) จะถูกกระจายตามกฎของปัวซอง:

,

โดยที่ a คือจำนวนคะแนนเฉลี่ยที่ตกลงไปในพื้นที่ D

สำหรับกรณีแบน a=SD แล โดยที่ SD คือพื้นที่ของภูมิภาค D

สำหรับเชิงพื้นที่ a= VD แล โดยที่ VD คือปริมาตรของขอบเขต D

สำหรับการแจกแจงปัวซองของจำนวนจุดที่อยู่ในส่วนหรือภูมิภาค เงื่อนไขของความหนาแน่นคงที่ (แล = const) นั้นไม่สำคัญ หากตรงตามเงื่อนไขอีกสองข้อที่เหลือ กฎของปัวซองยังคงอยู่ มีเพียงพารามิเตอร์ a ในนิพจน์ที่ต่างกันเท่านั้น ซึ่งไม่ได้มาจากการคูณความหนาแน่น γ ด้วยความยาว พื้นที่ หรือปริมาตร แต่โดยการรวมความหนาแน่นของตัวแปรเข้าด้วยกัน เหนือส่วน พื้นที่ หรือปริมาตร

การแจกแจงแบบปัวซองมีบทบาทสำคัญในหลายประเด็นในวิชาฟิสิกส์ ทฤษฎีการสื่อสาร ทฤษฎีความน่าเชื่อถือ ทฤษฎีการเข้าคิว ฯลฯ ทุกที่ที่มีเหตุการณ์สุ่มจำนวน (การสลายกัมมันตรังสี โทรศัพท์ อุปกรณ์ขัดข้อง อุบัติเหตุ ฯลฯ) สามารถเกิดขึ้นได้ในช่วงเวลาหนึ่ง

ลองพิจารณาสถานการณ์โดยทั่วไปซึ่งเกิดการแจกแจงแบบปัวซอง ปล่อยให้เหตุการณ์บางอย่าง (การช้อปปิ้งในร้านค้า) เกิดขึ้นแบบสุ่ม ให้เรากำหนดจำนวนครั้งของเหตุการณ์ดังกล่าวในช่วงเวลาตั้งแต่ 0 ถึง T

จำนวนเหตุการณ์สุ่มที่เกิดขึ้นในช่วงเวลาตั้งแต่ 0 ถึง T จะถูกกระจายตามกฎของปัวซองด้วยพารามิเตอร์ l=aT โดยที่ a>0 เป็นพารามิเตอร์ปัญหาที่สะท้อนความถี่เฉลี่ยของเหตุการณ์ ความน่าจะเป็นของการซื้อ k ครั้งในช่วงเวลากว้างๆ (เช่น หนึ่งวัน) จะเป็นเช่นไร


บทสรุป

โดยสรุป ฉันต้องการทราบว่าการแจกแจงแบบปัวซองเป็นการแจกแจงที่ค่อนข้างธรรมดาและสำคัญซึ่งมีการนำไปใช้ทั้งในทฤษฎีความน่าจะเป็นและการประยุกต์ของมัน และในสถิติทางคณิตศาสตร์

ปัญหาในทางปฏิบัติหลายประการท้ายที่สุดก็เกิดขึ้นที่การแจกแจงปัวซอง คุณสมบัติพิเศษของมันซึ่งประกอบด้วยความเท่าเทียมกันของความคาดหวังและความแปรปรวนทางคณิตศาสตร์ มักใช้ในทางปฏิบัติเพื่อแก้ปัญหาว่าตัวแปรสุ่มถูกกระจายตามกฎของปัวซองหรือไม่

สิ่งสำคัญอีกอย่างคือความจริงที่ว่ากฎของปัวซองอนุญาตให้เราค้นหาความน่าจะเป็นของเหตุการณ์ในการทดลองอิสระซ้ำๆ โดยมีการทดลองซ้ำจำนวนมากและความน่าจะเป็นเพียงครั้งเดียวเพียงเล็กน้อย

อย่างไรก็ตาม การแจกแจงแบบแบร์นูลลีใช้ในการคำนวณทางเศรษฐศาสตร์ และโดยเฉพาะอย่างยิ่งในการวิเคราะห์เสถียรภาพนั้น แทบจะไม่เคยใช้เลย นี่เป็นเพราะทั้งความยากลำบากในการคำนวณและความจริงที่ว่าการแจกแจงเบอร์นูลลีมีไว้สำหรับปริมาณที่ไม่ต่อเนื่อง และจากข้อเท็จจริงที่ว่าเงื่อนไขของรูปแบบคลาสสิก (ความเป็นอิสระ จำนวนการทดสอบที่นับได้ ความคงที่ของเงื่อนไขที่ส่งผลต่อความเป็นไปได้ของเหตุการณ์ที่เกิดขึ้น) ไม่ได้พบในสถานการณ์จริงเสมอไป การวิจัยเพิ่มเติมในสาขาการวิเคราะห์โครงการเบอร์นูลลีซึ่งดำเนินการในศตวรรษที่ 18-19 Laplace, Moivre, Poisson และคนอื่นๆ มุ่งเป้าไปที่การสร้างความเป็นไปได้ในการใช้แผน Bernoulli ในกรณีที่มีการทดสอบจำนวนมากที่มีแนวโน้มว่าจะไม่มีที่สิ้นสุด


วรรณกรรม

1. เวนเซล อี.เอส. ทฤษฎีความน่าจะเป็น - ม. "โรงเรียนมัธยม" 2541

2. กรัมเมอร์มาน วี.อี. คู่มือการแก้ปัญหาทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ - ม. "โรงเรียนมัธยม" 2541

3. รวบรวมปัญหาทางคณิตศาสตร์สำหรับวิทยาลัย เอ็ด เอฟิโมวา เอ.วี. - วท.ม. วิทยาศาสตร์ 2533

ในปัญหาเชิงปฏิบัติหลายอย่าง เราจะต้องจัดการกับตัวแปรสุ่มที่กระจายไปตามกฎเฉพาะที่เรียกว่ากฎของปัวซอง

พิจารณาตัวแปรสุ่มที่ไม่ต่อเนื่องซึ่งสามารถรับได้เฉพาะค่าจำนวนเต็มที่ไม่ใช่ค่าลบ:

ยิ่งไปกว่านั้น ลำดับของค่าเหล่านี้ไม่มีขีดจำกัดในทางทฤษฎี

ตัวแปรสุ่มกล่าวกันว่ามีการกระจายตามกฎของปัวซอง ถ้าสูตรแสดงความน่าจะเป็นที่ตัวแปรสุ่มจะได้ค่าที่แน่นอน

โดยที่ a คือปริมาณบวกที่เรียกว่าพารามิเตอร์กฎของปัวซอง

อนุกรมการแจกแจงของตัวแปรสุ่มที่แจกแจงตามกฎของปัวซองมีรูปแบบดังนี้

ก่อนอื่น ให้เราตรวจสอบให้แน่ใจก่อนว่าลำดับความน่าจะเป็นที่กำหนดโดยสูตร (5.9.1) สามารถเป็นอนุกรมการแจกแจงได้ เช่น ว่าผลรวมของความน่าจะเป็นทั้งหมดเท่ากับหนึ่ง เรามี:

.

ในรูป 5.9.1 แสดงรูปหลายเหลี่ยมการกระจายของตัวแปรสุ่มที่กระจายตามกฎของปัวซองซึ่งสอดคล้องกับค่าต่างๆ ของพารามิเตอร์ ภาคผนวก ตารางที่ 8 แสดงค่าต่างๆ

ให้เราพิจารณาคุณลักษณะหลัก - ความคาดหวังทางคณิตศาสตร์และความแปรปรวน - ของตัวแปรสุ่มที่แจกแจงตามกฎของปัวซอง ตามคำจำกัดความของความคาดหวังทางคณิตศาสตร์

.

เทอมแรกของผลรวม (ตรงกับ ) เท่ากับศูนย์ ดังนั้นผลรวมจึงเริ่มต้นด้วย:

เรามาแสดงกัน ; แล้ว

. (5.9.2)

ดังนั้น พารามิเตอร์จึงไม่มีอะไรมากไปกว่าความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม

ในการหาการกระจายตัว เราจะหาโมเมนต์เริ่มต้นที่สองของปริมาณก่อน:

ตามที่พิสูจน์แล้วก่อนหน้านี้

นอกจาก,

ดังนั้น ความแปรปรวนของตัวแปรสุ่มที่แจกแจงตามกฎของปัวซองจึงเท่ากับค่าคาดหวังทางคณิตศาสตร์

คุณสมบัติของการแจกแจงแบบปัวซองนี้มักใช้ในทางปฏิบัติเพื่อตัดสินว่าสมมติฐานที่ว่าตัวแปรสุ่มถูกกระจายตามกฎของปัวซองนั้นเป็นไปได้หรือไม่ เมื่อต้องการทำเช่นนี้ คุณลักษณะทางสถิติ ได้แก่ ความคาดหวังและการกระจายทางคณิตศาสตร์ของตัวแปรสุ่มจะถูกกำหนดจากประสบการณ์ หากค่าของพวกเขาใกล้เคียงกันสิ่งนี้สามารถใช้เป็นข้อโต้แย้งเพื่อสนับสนุนสมมติฐานการแจกแจงปัวซอง ความแตกต่างที่ชัดเจนในลักษณะเหล่านี้ขัดแย้งกับสมมติฐาน

ให้เราพิจารณาความน่าจะเป็นที่ตัวแปรสุ่มจะแจกแจงตามกฎของปัวซองซึ่งมีค่าไม่น้อยกว่าค่าที่กำหนด ลองแสดงความน่าจะเป็นนี้:

แน่นอนว่าความน่าจะเป็นสามารถคำนวณเป็นผลรวมได้

อย่างไรก็ตาม การพิจารณาจากความน่าจะเป็นของเหตุการณ์ตรงกันข้ามจะง่ายกว่ามาก:

(5.9.4)

โดยเฉพาะอย่างยิ่ง ความน่าจะเป็นที่ปริมาณจะได้ค่าบวกจะแสดงโดยสูตร

(5.9.5)

เราได้กล่าวไปแล้วว่าปัญหาการปฏิบัติหลายอย่างส่งผลให้เกิดการแจกแจงแบบปัวซง ลองพิจารณาหนึ่งในปัญหาทั่วไปประเภทนี้

ให้จุดกระจายแบบสุ่มบนแกน x วัว (รูปที่ 5.9.2) สมมติว่าการแจกแจงคะแนนแบบสุ่มเป็นไปตามเงื่อนไขต่อไปนี้:

1. ความน่าจะเป็นที่จุดจำนวนหนึ่งจะตกลงบนส่วนนั้นขึ้นอยู่กับความยาวของส่วนนี้เท่านั้น แต่ไม่ได้ขึ้นอยู่กับตำแหน่งบนแกน abscissa กล่าวอีกนัยหนึ่ง จุดต่างๆ จะถูกกระจายบนแกน x โดยมีความหนาแน่นเฉลี่ยเท่ากัน ให้เราแสดงความหนาแน่นนี้ (เช่น ความคาดหวังทางคณิตศาสตร์ของจำนวนจุดต่อความยาวหน่วย) ด้วย

2. จุดต่างๆ จะถูกกระจายบนแกน x โดยแยกจากกัน เช่น ความน่าจะเป็นที่คะแนนหนึ่งหรืออีกจำนวนหนึ่งที่ตกลงบนส่วนที่กำหนดนั้นไม่ได้ขึ้นอยู่กับจำนวนคะแนนที่ตกอยู่ในส่วนอื่น ๆ ที่ไม่ทับซ้อนกับจุดนั้น

3. ความน่าจะเป็นที่จุดสองจุดขึ้นไปจะชนพื้นที่เล็กๆ นั้นน้อยมากเมื่อเทียบกับความน่าจะเป็นที่จุดหนึ่งจะชนกัน (เงื่อนไขนี้หมายถึงความเป็นไปไม่ได้ในทางปฏิบัติที่มีจุดสองจุดขึ้นไปปะติดปะต่อกัน)

ลองเลือกส่วนที่มีความยาวบนแกน abscissa และพิจารณาตัวแปรสุ่มแบบไม่ต่อเนื่อง - จำนวนจุดที่ตกลงบนส่วนนี้ ค่าที่เป็นไปได้จะเป็น

เนื่องจากคะแนนตกบนส่วนที่เป็นอิสระจากกัน จึงเป็นไปได้ในทางทฤษฎีว่าจะมีคะแนนมากเท่าที่ต้องการ เช่น ซีรีส์ (5.9.6) ดำเนินต่อไปอย่างไม่มีกำหนด

ให้เราพิสูจน์ว่าตัวแปรสุ่มมีกฎการแจกแจงแบบปัวซอง ในการทำเช่นนี้ เราจะคำนวณความน่าจะเป็นที่จะมีจุดบนส่วนนั้นอย่างแน่นอน

มาแก้ไขปัญหาที่ง่ายกว่านี้ก่อน ลองพิจารณาพื้นที่เล็กๆ บนแกน Ox แล้วคำนวณความน่าจะเป็นที่จุดจะตกบนพื้นที่นี้อย่างน้อยหนึ่งจุด เราจะให้เหตุผลดังนี้ ความคาดหวังทางคณิตศาสตร์ของจำนวนคะแนนที่ตกลงในส่วนนี้มีค่าเท่ากันอย่างเห็นได้ชัด (เนื่องจากค่าเฉลี่ยของคะแนนตกต่อความยาวหน่วย) ตามเงื่อนไขที่ 3 สำหรับส่วนเล็กๆ เราสามารถละเลยความเป็นไปได้ที่จุดสองจุดขึ้นไปจะตกลงไป ดังนั้นความคาดหวังทางคณิตศาสตร์ของจำนวนจุดที่ตกลงบนพื้นที่จะเท่ากับความน่าจะเป็นที่จุดหนึ่งจะตกลงไปโดยประมาณ (หรือซึ่งในเงื่อนไขของเราเทียบเท่ากันอย่างน้อยหนึ่งจุด)

ดังนั้น ด้วยความแม่นยำจนถึงระดับเล็กน้อยของลำดับที่สูงกว่า เราสามารถสันนิษฐานได้ว่าความน่าจะเป็นที่จุดหนึ่ง (อย่างน้อยหนึ่งจุด) จะตกบนไซต์นั้นเท่ากับ และความน่าจะเป็นที่จะไม่มีจุดใดตกเท่ากับ

ลองใช้สิ่งนี้เพื่อคำนวณความน่าจะเป็นของคะแนนที่ตกลงบนส่วนนั้น แบ่งส่วนออกเป็นส่วนความยาวเท่าๆ กัน ให้เราตกลงที่จะเรียกส่วนเบื้องต้นว่า "ว่างเปล่า" หากไม่มีจุดเดียว และ "ถูกครอบครอง" ถ้ามีอย่างน้อยหนึ่งจุดเกิดขึ้น จากที่กล่าวไว้ข้างต้น ความน่าจะเป็นที่กลุ่มจะ "ไม่ว่าง" มีค่าประมาณเท่ากับ ; ความน่าจะเป็นที่จะ "ว่างเปล่า" เท่ากับ เนื่องจากตามเงื่อนไขที่ 2 จุดที่ตกอยู่ในส่วนที่ไม่ทับซ้อนกันนั้นมีความเป็นอิสระ ดังนั้นส่วนที่ n ของเราจึงถือเป็น "การทดลอง" อิสระ ซึ่งแต่ละส่วนสามารถ "ครอบครอง" ด้วยความน่าจะเป็น มาดูความน่าจะเป็นที่จะมี "ครอบครอง" อย่างแน่นอนในกลุ่มต่างๆ ตามทฤษฎีบทว่าด้วยการทดลองซ้ำ ความน่าจะเป็นนี้มีค่าเท่ากับ

หรือหมายถึง ,

(5.9.7)

เมื่อมีมากพอ ความน่าจะเป็นนี้จะเท่ากับความน่าจะเป็นที่จุดจะตกลงบนส่วนนั้นโดยประมาณ เนื่องจากความน่าจะเป็นที่จุดสองจุดขึ้นไปจะตกลงบนส่วนนั้นน้อยมาก หากต้องการค้นหาค่าที่แน่นอน คุณต้องไปที่ขีดจำกัดในนิพจน์ (5.9.7) ที่:

(5.9.8)

มาแปลงนิพจน์ภายใต้เครื่องหมายจำกัด:

(5.9.9)

เศษส่วนแรกและตัวหารของเศษส่วนสุดท้ายในนิพจน์ (5.9.9) สำหรับ มีแนวโน้มที่จะมีความเป็นเอกภาพอย่างเห็นได้ชัด การแสดงออกไม่ได้ขึ้นอยู่กับ ตัวเศษของเศษส่วนสุดท้ายสามารถแปลงได้ดังนี้:

(5.9.10)

เมื่อ และนิพจน์ (5.9.10) มีแนวโน้มที่จะ ดังนั้นจึงได้รับการพิสูจน์แล้วว่าความน่าจะเป็นที่คะแนนจะตกอยู่ในส่วนนั้นแสดงโดยสูตร

ที่ไหน เช่น ค่าของ X จะถูกกระจายตามกฎปัวซองด้วยพารามิเตอร์

โปรดทราบว่าค่านี้คือจำนวนคะแนนเฉลี่ยต่อเซ็กเมนต์

ค่า (ความน่าจะเป็นที่ค่าของ X จะเป็นค่าบวก) ในกรณีนี้แสดงความน่าจะเป็นที่อย่างน้อยหนึ่งจุดจะตกบนส่วน:

ดังนั้นเราจึงมั่นใจว่าการแจกแจงแบบปัวซงเกิดขึ้นเมื่อจุดบางจุด (หรือองค์ประกอบอื่นๆ) ครอบครองตำแหน่งสุ่มที่แยกจากกัน และนับจำนวนจุดเหล่านี้ที่ตกไปในบางพื้นที่ ในกรณีของเรา “ภูมิภาค” ดังกล่าวเป็นส่วนบนแกนแอบซิสซา อย่างไรก็ตาม ข้อสรุปของเราสามารถขยายได้อย่างง่ายดายไปยังกรณีของการกระจายจุดบนระนาบ (สนามจุดแบนสุ่ม) และในอวกาศ (สนามจุดเชิงพื้นที่แบบสุ่ม) พิสูจน์ได้ไม่ยากว่าหากตรงตามเงื่อนไข:

1) คะแนนมีการกระจายเท่าๆ กันทางสถิติในสนามที่มีความหนาแน่นเฉลี่ย

2) คะแนนตกอยู่ในภูมิภาคที่ไม่ทับซ้อนกันอย่างอิสระ

3) คะแนนปรากฏเดี่ยวๆ ไม่ใช่คู่ แฝดสาม ฯลฯ จากนั้นจำนวนคะแนนที่ตกลงไปในพื้นที่ใด ๆ (แบนหรือเชิงพื้นที่) จะถูกกระจายตามกฎของปัวซอง:

โดยที่จำนวนคะแนนเฉลี่ยที่ตกลงสู่พื้นที่คือ

สำหรับเคสแบบแบน

พื้นที่ของภูมิภาคอยู่ที่ไหน สำหรับพื้นที่

ปริมาณของภูมิภาคอยู่ที่ไหน

โปรดทราบว่าสำหรับการแจกแจงปัวซองของจำนวนจุดที่อยู่ในส่วนหรือบริเวณนั้น เงื่อนไขของความหนาแน่นคงที่ () นั้นไม่สำคัญ หากตรงตามเงื่อนไขอีกสองข้อที่เหลือ กฎของปัวซองยังคงอยู่ มีเพียงพารามิเตอร์ a ในนิพจน์ที่ต่างกันเท่านั้น จะได้มาซึ่งไม่ได้มาจากการคูณความหนาแน่นด้วยความยาว พื้นที่ หรือปริมาตรของบริเวณนั้น แต่โดยการบูรณาการ ความหนาแน่นแปรผันตามส่วน พื้นที่ หรือปริมาตร (สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ ดูหมายเลข 19.4)

การมีอยู่ของจุดสุ่มที่กระจัดกระจายบนเส้น ระนาบ หรือปริมาตร ไม่ใช่เงื่อนไขเดียวที่ทำให้เกิดการแจกแจงแบบปัวซอง ตัวอย่างเช่น เราสามารถพิสูจน์ได้ว่ากฎของปัวซองมีข้อจำกัดสำหรับการแจกแจงแบบทวินาม:

, (5.9.12)

หากในเวลาเดียวกันจำนวนการทดลองมีแนวโน้มที่จะไม่มีที่สิ้นสุดและความน่าจะเป็นไปที่ศูนย์และผลิตภัณฑ์ของพวกเขายังคงค่าคงที่:

จริงๆ แล้ว คุณสมบัติจำกัดของการแจกแจงแบบทวินามนี้สามารถเขียนได้เป็น:

. (5.9.14)

แต่จากเงื่อนไข (5.9.13) เป็นไปตามนั้น

การแทนที่ (5.9.15) ลงใน (5.9.14) เราจะได้ความเท่าเทียมกัน

, (5.9.16)

ซึ่งเราได้พิสูจน์แล้วในโอกาสอื่น

สมบัติที่จำกัดของกฎทวินามนี้มักใช้ในทางปฏิบัติ ให้เราสมมติว่ามีการทดลองอิสระจำนวนมาก ซึ่งในแต่ละเหตุการณ์มีความน่าจะเป็นที่ต่ำมาก จากนั้น ในการคำนวณความน่าจะเป็นที่เหตุการณ์หนึ่งจะปรากฏขึ้นเพียงครั้งเดียว คุณสามารถใช้สูตรโดยประมาณได้:

, (5.9.17)

โดยที่ คือพารามิเตอร์ของกฎปัวซองที่แทนที่การแจกแจงแบบทวินามโดยประมาณ

จากคุณสมบัติของกฎของปัวซอง - เพื่อแสดงการแจกแจงแบบทวินามที่มีการทดลองจำนวนมากและความน่าจะเป็นของเหตุการณ์ต่ำ - เป็นชื่อของมันซึ่งมักใช้ในตำราเรียนสถิติ: กฎของปรากฏการณ์ที่หายาก

ลองดูตัวอย่างต่างๆ ที่เกี่ยวข้องกับการแจกแจงปัวซองจากแนวทางปฏิบัติต่างๆ

ตัวอย่างที่ 1 การแลกเปลี่ยนโทรศัพท์อัตโนมัติจะรับสายด้วยความหนาแน่นของการโทรโดยเฉลี่ยต่อชั่วโมง สมมติว่าจำนวนการโทรในช่วงเวลาใดๆ มีการกระจายตามกฎของปัวซอง จงหาความน่าจะเป็นที่การโทรสามครั้งจะมาถึงสถานีภายในสองนาที

สารละลาย. จำนวนการโทรโดยเฉลี่ยต่อสองนาทีคือ:

ตร.ม. หากต้องการโจมตีเป้าหมาย อย่างน้อยหนึ่งชิ้นส่วนก็เพียงพอที่จะโจมตีเป้าหมายได้ ค้นหาความน่าจะเป็นที่จะชนเป้าหมายที่ตำแหน่งที่กำหนดของจุดพัก

สารละลาย. . ใช้สูตร (5.9.4) เราค้นหาความน่าจะเป็นที่จะชนอย่างน้อยหนึ่งส่วน:

(ในการคำนวณค่าของฟังก์ชันเลขชี้กำลัง เราใช้ตารางที่ 2 ของภาคผนวก)

ตัวอย่างที่ 7 ความหนาแน่นเฉลี่ยของจุลินทรีย์ที่ทำให้เกิดโรคในอากาศหนึ่งลูกบาศก์เมตรคือ 100 เก็บตัวอย่าง 2 ลูกบาศก์เมตร ดีเอ็มของอากาศ ค้นหาความน่าจะเป็นที่จะพบจุลินทรีย์อย่างน้อยหนึ่งตัวในนั้น

สารละลาย. เมื่อยอมรับสมมติฐานของการกระจายปัวซองของจำนวนจุลินทรีย์ในปริมาตร เราพบว่า:

ตัวอย่างที่ 8 ยิงทีละนัด 50 นัดไปยังเป้าหมายที่กำหนด ความน่าจะเป็นที่จะยิงโดนเป้าหมายด้วยนัดเดียวคือ 0.04 ใช้คุณสมบัติจำกัดของการแจกแจงแบบทวินาม (สูตร (5.9.17)) หาความน่าจะเป็นโดยประมาณที่เป้าหมายจะถูกโจมตี ไม่ใช่กระสุนนัดเดียว กระสุนหนึ่งนัด หรือกระสุนสองนัด

สารละลาย. เรามี. การใช้ตารางที่ 8 ในภาคผนวกเราค้นหาความน่าจะเป็น

ทันทีที่คำขอเริ่มเข้ามา: “ปัวซองอยู่ไหน? ปัญหาในการใช้สูตรปัวซองอยู่ที่ไหน? และอื่น ๆ. ผมจะเริ่มต้นด้วย ของใช้ส่วนตัวการกระจายปัวซอง - เนื่องจากความต้องการวัสดุสูง

งานนี้คุ้นเคยอย่างเจ็บปวด:

และงานสองงานถัดไปนั้นแตกต่างโดยพื้นฐานจากงานก่อนหน้า:

ตัวอย่างที่ 4

ตัวแปรสุ่มจะขึ้นอยู่กับกฎของปัวซองด้วยความคาดหวังทางคณิตศาสตร์ ค้นหาความน่าจะเป็นที่ตัวแปรสุ่มที่กำหนดจะมีค่าน้อยกว่าที่คาดไว้ทางคณิตศาสตร์

ความแตกต่างก็คือว่าตรงนี้เรากำลังพูดถึงการกระจายตัวแบบปัวซงเป๊ะๆ

สารละลาย: ตัวแปรสุ่มรับค่า ด้วยความน่าจะเป็น:

ตามเงื่อนไข , และที่นี่ทุกอย่างเรียบง่าย: เหตุการณ์ประกอบด้วยสามเหตุการณ์ ผลลัพธ์ที่ไม่สอดคล้องกัน:

ความน่าจะเป็นที่ตัวแปรสุ่มจะได้ค่าน้อยกว่าที่คาดไว้ทางคณิตศาสตร์

คำตอบ:

งานทำความเข้าใจที่คล้ายกัน:

ตัวอย่างที่ 5

ตัวแปรสุ่มจะขึ้นอยู่กับกฎของปัวซองด้วยความคาดหวังทางคณิตศาสตร์ ค้นหาความน่าจะเป็นที่ตัวแปรสุ่มที่กำหนดจะได้ค่าบวก

คำตอบและคำตอบอยู่ท้ายบทเรียน

นอกจาก ใกล้เข้ามาการแจกแจงแบบทวินาม(ตัวอย่างที่ 1-3) การแจกแจงแบบปัวซองพบการใช้งานอย่างกว้างขวางใน ทฤษฎีการเข้าคิวสำหรับลักษณะความน่าจะเป็น ง่ายที่สุดกระแสของเหตุการณ์ ฉันจะพยายามกระชับ:

ให้บางระบบรับคำขอ (โทรศัพท์ ลูกค้าที่เข้ามา ฯลฯ) กระแสของแอพพลิเคชั่นนั้นเรียกว่า ง่ายที่สุดถ้ามันเป็นไปตามเงื่อนไข ความนิ่ง, ไม่มีผลที่ตามมาและ ความธรรมดา. ความคงตัวหมายถึงความรุนแรงของการร้องขอ คงที่และไม่ขึ้นอยู่กับเวลาของวัน วันในสัปดาห์ หรือกรอบเวลาอื่นๆ กล่าวอีกนัยหนึ่ง ไม่มี "ชั่วโมงเร่งด่วน" และไม่มี "ชั่วโมงแห่งความตาย" การไม่มีผลที่ตามมาหมายความว่าความน่าจะเป็นของแอปพลิเคชันใหม่ไม่ได้ขึ้นอยู่กับ "ยุคก่อนประวัติศาสตร์" กล่าวคือ ไม่มีสิ่งที่เรียกว่า "คุณยายคนหนึ่งบอก" และคนอื่น ๆ ก็ "วิ่งหนี" (หรือในทางกลับกันก็วิ่งหนี) และสุดท้าย คุณสมบัติของความธรรมดาก็มีลักษณะเฉพาะด้วยข้อเท็จจริงที่ว่า เล็กพอช่วงเวลา แทบจะเป็นไปไม่ได้เลย การปรากฏตัวของแอปพลิเคชันสองรายการขึ้นไป “ หญิงชราสองคนที่ประตู?” - ไม่ขอโทษนะ การสับตามลำดับจะสะดวกกว่า

ดังนั้นให้บางระบบได้รับแอพพลิเคชั่นที่ง่ายที่สุด ด้วยความเข้มข้นปานกลางแอปพลิเคชันในหน่วยเวลาหนึ่ง (นาที ชั่วโมง วัน หรืออื่นๆ). แล้วความน่าจะเป็นนั้น ในช่วงระยะเวลาหนึ่งระบบจะได้รับคำขออย่างแน่นอนเท่ากับ:

ตัวอย่างที่ 6

การโทรไปยังศูนย์จัดส่งรถแท็กซี่เป็นการโทรแบบปัวซองแบบง่ายๆ โดยมีความเข้มข้นการโทรเฉลี่ย 30 ครั้งต่อชั่วโมง ค้นหาความน่าจะเป็นที่: ก) ใน 1 นาที จะได้รับสาย 2-3 สาย b) จะมีสายเข้าอย่างน้อยหนึ่งครั้งภายในห้านาที

สารละลาย: เราใช้สูตรปัวซอง:

ก) โดยคำนึงถึงความคงที่ของการไหล เราคำนวณจำนวนการโทรโดยเฉลี่ยต่อ 1 นาที:
โทร - โดยเฉลี่ยในหนึ่งนาที

ตามทฤษฎีบทของการบวกความน่าจะเป็นของเหตุการณ์ที่เข้ากันไม่ได้:
– ความน่าจะเป็นที่ภายใน 1 นาที ห้องควบคุมจะได้รับสาย 2-3 สาย

b) คำนวณจำนวนการโทรโดยเฉลี่ยต่อห้านาที:



สิ่งพิมพ์ที่เกี่ยวข้อง