การแจกแจงทวินามลบกับการแจกแจงทวินาม


22

อะไรคือความแตกต่างระหว่างการแจกแจงทวินามลบและการแจกแจงทวินาม

ฉันลองอ่านออนไลน์และฉันพบว่าการแจกแจงทวินามลบเมื่อจุดข้อมูลไม่ต่อเนื่อง แต่ฉันคิดว่าแม้กระทั่งการแจกแจงทวินามก็สามารถใช้สำหรับจุดข้อมูลแบบแยก


5
พวกเขาทั้งคู่ไม่ต่อเนื่อง
Glen_b -Reinstate Monica

5
ภาพประกอบง่าย ๆ : คุณกำลังขายลูกกวาดต่อหน้า ที่แต่ละประตูที่คุณเคาะคุณมีโอกาส 1/4 ในการขาย 1 แท่งขนมและโอกาส 3/4 หรือขาย 0 แท่งลูกกวาด ความน่าจะเป็นที่จะขายบาร์ของคุณถ้าคุณเคาะที่ 50 ประตูคือการกระจายตัวแบบทวินามใน n ความน่าจะเป็นที่คุณจะต้องเคาะที่ประตูเพื่อขาย 30 บาร์เป็นการกระจายแบบทวินามลบในหน่วยเมตร โปรดทราบว่าอดีตตัดที่ 50 เพราะคุณไม่สามารถขายมากกว่า 50 บาร์ในขณะที่หลังมีหางที่ไม่มีที่สิ้นสุดเพราะคุณอาจโชคดีในวันนั้นและไม่เคยขายแถบที่ 30
Jerry Guern

คำตอบ:


30

ความแตกต่างคือสิ่งที่เรากำลังสนใจใน. ทั้งการกระจายที่ถูกสร้างขึ้นจากการทดลอง Bernoulli อิสระที่มีความน่าจะเป็นคงที่ของความสำเร็จพี

ด้วยการแจกแจงแบบทวินามตัวแปรสุ่มXคือจำนวนความสำเร็จที่สังเกตได้จากการทดลองnครั้ง เนื่องจากมีจำนวนคงที่ของการทดลองค่าเป็นไปได้ของXคือ 0, 1, ... , n

ด้วยการแจกแจงลบแบบทวินามตัวแปรสุ่ม Y คือจำนวนการทดลองจนกว่าจะสังเกตได้ว่าความสำเร็จที่rถูกพบ ในกรณีนี้เราให้การเพิ่มจำนวนของการทดลองจนกว่าจะถึงRประสบความสำเร็จ ค่าที่เป็นไปได้ของ Y คือr , r + 1 , r + 2 , ... โดยไม่มีขอบเขตสูงสุด ลบทวินามนอกจากนี้ยังสามารถกำหนดในแง่ของจำนวนของความล้มเหลวจนRประสบความสำเร็จ, th แทนหมายเลขของการทดลองจนRความสำเร็จบริบูรณ์ วิกิพีเดียกำหนดการแจกแจงลบทวินามในลักษณะนี้

ดังนั้นเพื่อสรุป:

ทวินาม :

  • จำนวนการทดลองคงที่ ( n )
  • ความน่าจะเป็นคงที่ของความสำเร็จ ( p )
  • ตัวแปรสุ่มคือ X = จำนวนความสำเร็จ
  • ค่าที่เป็นไปได้คือ 0 ≤ Xn

ทวินามลบ :

  • จำนวนคงที่ของความสำเร็จ ( r )
  • ความน่าจะเป็นคงที่ของความสำเร็จ ( p )
  • ตัวแปรสุ่มคือ Y = จำนวนการทดลองจนถึงความสำเร็จที่r
  • ค่าที่เป็นไปได้คือrY

ขอบคุณ Ben Bolker ที่เตือนให้ฉันพูดถึงการสนับสนุนของการแจกแจงสองครั้ง เขาตอบคำถามที่เกี่ยวข้องที่นี่


4
การอภิปรายของ NB นี่: stats.stackexchange.com/questions/6728/... อาจเป็นที่น่าสังเกตว่าการตอบสนองแบบทวินามถูก จำกัด [0, N], การตอบกลับของ NB ไม่มีขอบเขต [0, ... ]
Ben Bolker

จุดดีฉันได้อัปเดตคำตอบเพื่อรวมสิ่งนี้แล้ว
Jelsema

jelsema ขอบคุณสำหรับคำตอบรายละเอียดของฉันสามารถเข้าใจได้ดีในขณะนี้
Alily

19

การแจกแจงทวินามลบแม้ว่าจะมีความสัมพันธ์ที่ชัดเจนกับทวินามก็ยังดีกว่าการแจกแจงปัวซอง ทั้งสามไม่ต่อเนื่องกัน btw

λλ

หากข้อมูลของคุณแสดงให้เห็นว่าความแปรปรวนมากกว่าค่าเฉลี่ย (การกระจายเกินจริง) กฎนี้จะปัวซองออกดังนั้นค่าทวินามเชิงลบก็จะเป็นการกระจายตัวครั้งต่อไปเพื่อดู มันมีมากกว่าหนึ่งพารามิเตอร์ดังนั้นความแปรปรวนสามารถมากกว่าค่าเฉลี่ย

ความสัมพันธ์ของ NB กับทวินามนั้นมาจากกระบวนการพื้นฐานตามที่อธิบายไว้ในคำตอบของ @ Jelsema กระบวนการมีความสัมพันธ์กันดังนั้นการแจกแจงก็เหมือนกัน แต่เมื่อฉันอธิบายที่นี่ลิงก์ไปยังการแจกแจงปัวซงนั้นใกล้เคียงกับการใช้งานจริง

UPDATE: อีกแง่มุมหนึ่งคือการกำหนดพารามิเตอร์ การแจกแจงทวินามมีสองพารามิเตอร์: p และ n โดเมน bona fide คือ 0 ถึง n ในที่นี้มันไม่เพียง แต่ไม่ต่อเนื่อง แต่ยังกำหนดไว้ในจำนวนที่ จำกัด

λn


3
ฉันไม่เข้าใจความหมายของคุณโดย "ดีกว่าเปรียบเทียบกับการแจกแจงปัวซง" คำถามดั้งเดิมไม่ได้บอกว่าต้องการแบบจำลองชนิดใด มันไม่ได้หมายความว่าใครสนใจในการสร้างแบบจำลองเลย
heropup

@heropup, OP สนใจแอพพลิเคชั่นอย่างชัดเจนและเปรียบเทียบ NB กับ Binomial โดยตรง ดังนั้นคำตอบของฉันเกี่ยวกับการเปรียบเทียบนั้นและการเปรียบเทียบกับปัวซองนั้นมีความเกี่ยวข้องมากกว่าในการใช้งานทั่วไป
Aksakal

7

ทั้งสองแยกกันและแสดงจำนวนเมื่อคุณสุ่มตัวอย่าง

Dยังไม่มีข้อความS=(DDD,DDยังไม่มีข้อความ,Dยังไม่มีข้อความD,Dยังไม่มีข้อความยังไม่มีข้อความ,ยังไม่มีข้อความDD,ยังไม่มีข้อความDยังไม่มีข้อความ,ยังไม่มีข้อความยังไม่มีข้อความD,ยังไม่มีข้อความยังไม่มีข้อความยังไม่มีข้อความ)

S=(D,ยังไม่มีข้อความD,ยังไม่มีข้อความยังไม่มีข้อความD,ยังไม่มีข้อความยังไม่มีข้อความยังไม่มีข้อความD,...)

พี

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.