อะไรคือความแตกต่างระหว่างการแจกแจงทวินามลบและการแจกแจงทวินาม
ฉันลองอ่านออนไลน์และฉันพบว่าการแจกแจงทวินามลบเมื่อจุดข้อมูลไม่ต่อเนื่อง แต่ฉันคิดว่าแม้กระทั่งการแจกแจงทวินามก็สามารถใช้สำหรับจุดข้อมูลแบบแยก
อะไรคือความแตกต่างระหว่างการแจกแจงทวินามลบและการแจกแจงทวินาม
ฉันลองอ่านออนไลน์และฉันพบว่าการแจกแจงทวินามลบเมื่อจุดข้อมูลไม่ต่อเนื่อง แต่ฉันคิดว่าแม้กระทั่งการแจกแจงทวินามก็สามารถใช้สำหรับจุดข้อมูลแบบแยก
คำตอบ:
ความแตกต่างคือสิ่งที่เรากำลังสนใจใน. ทั้งการกระจายที่ถูกสร้างขึ้นจากการทดลอง Bernoulli อิสระที่มีความน่าจะเป็นคงที่ของความสำเร็จพี
ด้วยการแจกแจงแบบทวินามตัวแปรสุ่มXคือจำนวนความสำเร็จที่สังเกตได้จากการทดลองnครั้ง เนื่องจากมีจำนวนคงที่ของการทดลองค่าเป็นไปได้ของXคือ 0, 1, ... , n
ด้วยการแจกแจงลบแบบทวินามตัวแปรสุ่ม Y คือจำนวนการทดลองจนกว่าจะสังเกตได้ว่าความสำเร็จที่rถูกพบ ในกรณีนี้เราให้การเพิ่มจำนวนของการทดลองจนกว่าจะถึงRประสบความสำเร็จ ค่าที่เป็นไปได้ของ Y คือr , r + 1 , r + 2 , ... โดยไม่มีขอบเขตสูงสุด ลบทวินามนอกจากนี้ยังสามารถกำหนดในแง่ของจำนวนของความล้มเหลวจนRประสบความสำเร็จ, th แทนหมายเลขของการทดลองจนRความสำเร็จบริบูรณ์ วิกิพีเดียกำหนดการแจกแจงลบทวินามในลักษณะนี้
ดังนั้นเพื่อสรุป:
ทวินาม :
ทวินามลบ :
ขอบคุณ Ben Bolker ที่เตือนให้ฉันพูดถึงการสนับสนุนของการแจกแจงสองครั้ง เขาตอบคำถามที่เกี่ยวข้องที่นี่
การแจกแจงทวินามลบแม้ว่าจะมีความสัมพันธ์ที่ชัดเจนกับทวินามก็ยังดีกว่าการแจกแจงปัวซอง ทั้งสามไม่ต่อเนื่องกัน btw
หากข้อมูลของคุณแสดงให้เห็นว่าความแปรปรวนมากกว่าค่าเฉลี่ย (การกระจายเกินจริง) กฎนี้จะปัวซองออกดังนั้นค่าทวินามเชิงลบก็จะเป็นการกระจายตัวครั้งต่อไปเพื่อดู มันมีมากกว่าหนึ่งพารามิเตอร์ดังนั้นความแปรปรวนสามารถมากกว่าค่าเฉลี่ย
ความสัมพันธ์ของ NB กับทวินามนั้นมาจากกระบวนการพื้นฐานตามที่อธิบายไว้ในคำตอบของ @ Jelsema กระบวนการมีความสัมพันธ์กันดังนั้นการแจกแจงก็เหมือนกัน แต่เมื่อฉันอธิบายที่นี่ลิงก์ไปยังการแจกแจงปัวซงนั้นใกล้เคียงกับการใช้งานจริง
UPDATE: อีกแง่มุมหนึ่งคือการกำหนดพารามิเตอร์ การแจกแจงทวินามมีสองพารามิเตอร์: p และ n โดเมน bona fide คือ 0 ถึง n ในที่นี้มันไม่เพียง แต่ไม่ต่อเนื่อง แต่ยังกำหนดไว้ในจำนวนที่ จำกัด
ทั้งสองแยกกันและแสดงจำนวนเมื่อคุณสุ่มตัวอย่าง