เครื่องมือประมาณการสำหรับการแจกแจงแบบทวินาม


12

เราจะกำหนดตัวประมาณสำหรับข้อมูลที่มาจากการแจกแจงทวินามได้อย่างไร สำหรับเบอนูลลี่ฉันสามารถคิดถึงตัวประมาณค่าพารามิเตอร์ p แต่สำหรับทวินามฉันไม่สามารถดูพารามิเตอร์ที่จะประมาณได้เมื่อเรามีการแจกแจงคุณสมบัติ

ปรับปรุง:

โดยตัวประมาณฉันหมายถึงฟังก์ชันของข้อมูลที่สังเกตได้ ตัวประมาณจะใช้ในการประมาณค่าพารามิเตอร์ของการแจกแจงที่สร้างข้อมูล


คุณมีความเข้าใจเรื่อง "ตัวประมาณค่า" อย่างไร ฉันสงสัยว่าเนื่องจากตัวประมาณไม่มี "พารามิเตอร์" ทำให้ฉันกังวลว่าคุณไม่ได้สื่อสารคำถามของคุณอย่างชัดเจน บางทีคุณอาจให้ตัวอย่างที่ชัดเจนเกี่ยวกับสถานการณ์จริงที่คุณกำลังพิจารณา
whuber

@whuber เพิ่มข้อมูลเพิ่มเติม แจ้งให้เราทราบหากคุณต้องการให้ฉันเพิ่มรายละเอียดเพิ่มเติมหรือหากความเข้าใจของฉันไม่สมบูรณ์
Rohit Banga

การแก้ไขนั้นถูกต้อง แต่ตัวอย่างที่เป็นรูปธรรมก็ยังคงช่วยได้ ในแอปพลิเคชั่นหลายตัวของการแจกแจงแบบทวินามนั้นไม่ใช่พารามิเตอร์: มันถูกกำหนดและเป็นพารามิเตอร์เดียวที่จะถูกประมาณ ยกตัวอย่างเช่นการนับความสำเร็จในอิสระกระจายเหมือนการทดลอง Bernoulli มีทวินาม ( , ) การจัดจำหน่ายและเป็นหนึ่งในประมาณการของแต่เพียงผู้เดียวพารามิเตอร์คือ n p k n n p p k / nnpknnppk/n
whuber

2
ฉันชอบที่จะเห็นตัวอย่างแม้จะเป็นคนที่วางแผนไว้ในการประมาณทั้งและ (ในการตั้งค่าบ่อยครั้ง) คิดเกี่ยวกับมันคุณสังเกตเดียวนับkพูด 5 เราคาดว่าประมาณเท่ากับNPเราจะประมาณ ,หรือไม่ หรือบางที , ? หรือเกือบทุกอย่างอื่น? :-) หรือคุณกำลังแนะนำว่าคุณอาจมีชุดการสังเกตอิสระทั้งหมดจากการทวินามทั่วไปมีทั้งและp k = 5 k n p n = 10 p = 0.5 n = 5,000 p = 0.001 k 1 , k 2 , , k m ( n , p ) p nnpk=5knpn=10p=0.5n=5000p=0.001k1,k2,,km(n,p)pnไม่ทราบ?
whuber

1
ฉันแนะนำให้รู้จักกับหลัง - ทั้ง p และ n ไม่เป็นที่รู้จัก ฉันต้องการตัวประมาณค่าทั้ง n และ p เป็นฟังก์ชั่นของ N สังเกตจุดข้อมูล
Rohit Banga

คำตอบ:


12

ฉันเดาว่าสิ่งที่คุณกำลังมองหาคือฟังก์ชั่นสร้างความน่าจะเป็น ฟังก์ชันการสร้างความน่าจะเป็นที่ได้รับมาของการแจกแจงแบบทวินามสามารถดูได้ที่

http://economictheoryblog.com/2012/10/21/binomial-distribution/

อย่างไรก็ตามการได้ดูวิกิพีเดียในทุกวันนี้เป็นความคิดที่ดีอยู่เสมอแม้ว่าฉันต้องบอกว่าสเปคของทวินามสามารถปรับปรุงได้

https://en.wikipedia.org/wiki/Binomial_distribution#Specification


1

การแจกแจงทุกครั้งมีพารามิเตอร์ที่ไม่รู้จัก ตัวอย่างเช่นในการแจกแจงเบอร์นูลลีมีความน่าจะเป็นของพารามิเตอร์ที่ไม่ทราบแน่ชัดของความสำเร็จ (p) เช่นเดียวกันในการแจกแจงแบบทวินามมีพารามิเตอร์ที่ไม่รู้จักสองค่าคือ n และ p ขึ้นอยู่กับวัตถุประสงค์ซึ่งพารามิเตอร์ที่ไม่รู้จักที่คุณต้องการประเมิน คุณสามารถแก้ไขพารามิเตอร์หนึ่งและประมาณหนึ่งพารามิเตอร์ สำหรับข้อมูลเพิ่มเติมดูที่นี่


ถ้าฉันต้องการประเมินทั้งพารามิเตอร์
Rohit Banga

1
สำหรับการประมาณค่าความน่าจะเป็นสูงสุดคุณจะต้องหาอนุพันธ์ของฟังก์ชันความน่าจะเป็นด้วยความเคารพต่อพารามิเตอร์ที่สนใจและถือเอาสมการนั้นให้เป็นศูนย์และแก้สมการ ฉันหมายความว่าขั้นตอนนี้เหมือนกับที่คุณทำในขณะที่ประมาณ 'p' คุณต้องทำเช่นเดียวกันกับ 'n' ตรวจสอบอันนี้ www.montana.edu/rotella/502/binom_like.pdf
love-stats

@love ข้อมูลอ้างอิงของคุณประเมินเฉพาะโดยใช้เป็นค่าคงที่ NpN
whuber

-1 @ love-stats สำหรับตัวอย่างของสถานการณ์ที่การหาอนุพันธ์ของฟังก์ชันความน่าจะเป็นการทำให้มันเป็นและอื่น ๆใช้งานไม่ได้ให้ดูความพยายามนี้และวิธีแก้ปัญหาที่ถูกต้อง0
Dilip Sarwate

1

สมมติว่าคุณมีข้อมูลP)k1,,kmiid binomial(n,p)

คุณสามารถหาวิธีประมาณค่าเวลาได้อย่างง่ายดายโดยการตั้งค่าและและการแก้สำหรับและ{p} s 2 k = n P (1 - P ) n Pk¯=n^p^sk2=n^p^(1p^)n^p^

หรือคุณสามารถคำนวณ MLEs (อาจเป็นเพียงตัวเลข) เช่นใช้optimใน R


ปรากฎว่า MLEs นั้นน่ากลัวจริงๆสำหรับ - พวกเขามีความเอนเอียงและแปรปรวนอย่างมากถึงแม้จะมีกลุ่มตัวอย่างขนาดใหญ่ก็ตาม ฉันไม่ได้ศึกษาตัวประมาณ MM ส่วนหนึ่งเป็นเพราะพวกเขาไม่ได้กำหนดบ่อยครั้ง (เมื่อใดก็ตามที่ซึ่งเกิดขึ้น) s 2 / ˉ k > 1p<1/2s2/k¯>1
whuber

@whuber - เขาไม่ได้ขอตัวประมาณที่ดี ;)
Karl

1
ทำไมไม่เพียงเสนอ = 17 และไม่ว่าจะเกิดอะไรขึ้น :-) แต่คุณมีประเด็น: คำถามไม่ได้ระบุว่าจะต้องประมาณอะไร หากเราต้องการตัวประมาณค่าก็จะมีตัววัดที่ดีอย่างชัดเจน P =1/2nPn^p^=1/2np
whuber

@whuber - แน่นอน และฉันจะไม่แปลกใจที่พบสำหรับ MLE n^maxki
Karl

ถูกต้อง: โดยเฉพาะอย่างยิ่งเมื่อใกล้กับสูงสุดของการนับคือ MLE มันใช้งานได้ดีในกรณีเช่นนี้ตามที่คุณอาจจินตนาการ สำหรับขนาดเล็กแม้จะมีข้อมูลจำนวนมากมันยากที่จะแยกแยะความแตกต่างจากการกระจาย Poisson ซึ่งเป็นอนันต์ได้อย่างมีประสิทธิภาพนำไปสู่ความไม่แน่นอนอย่างมากในการประมาณการของnp1pnn
whuber

0

ฉันคิดว่าเราสามารถใช้วิธีการประมาณช่วงเวลาเพื่อประมาณค่าพารามิเตอร์ของการแจกแจงแบบทวินามด้วยค่าเฉลี่ยและความแปรปรวน


โดยใช้วิธีการประมาณช่วงเวลาในการประมาณพารามิเตอร์และม.[{\ hat {p}} _ n = \ frac {\ overline {X} -S ^ 2} {\ overline {X}}] [\ hat {m} _n = \ frac {\ overline {X} ^ 2} {\ overline {X} -S ^ 2}] พิสูจน์ตัวประมาณของพารามิเตอร์และโดยวิธีของช่วงเวลาเป็นวิธีการแก้ปัญหาของระบบสมการ ดังนั้นสมการของเราสำหรับวิธีการของช่วงเวลาคือ: [\ overline {X} = mp] [S ^ 2 = mp (1-p)]pmmp

mp=X¯,mp(1p)=S2.

การคำนวณทางคณิตศาสตร์อย่างง่ายแสดง: [S ^ 2 = mp \ left (1 - p \ right) = \ bar {X} \ left (1 - p \ right)] [S ^ 2 = \ bar {X} - \ bar {X } p] [\ bar {X} p = \ bar {X} -S ^ 2, \ mbox {ดังนั้น} \ hat {p} = \ frac {\ bar {X} -S ^ 2} {\ bar {X }}.] จากนั้น [\ bar {X} = mp, \ mbox {นั่นคือ} m \ left (\ frac {\ bar {X} -S ^ 2} {\ bar {X}} \ right)] [\ bar {X} = m \ left (\ frac {\ bar {X} -S ^ 2} {\ bar {X}} \ right), \ mbox {หรือ} \ hat {m} = \ frac {\ บาร์ {X} ^ 2} {\ bar {X} -S ^ 2} ]


1
มันจะดีถ้าคุณสามารถขยายในเรื่องนี้โดยการเขียนสูตรสำหรับตัวประมาณค่า MoM มิฉะนั้นคำตอบไม่ได้อยู่ในตัวเอง; คนอื่น ๆ (ที่ยังไม่รู้คำตอบ) จะต้องค้นหา "วิธีช่วงเวลา" ออนไลน์เป็นต้นจนกว่าพวกเขาจะพบคำตอบที่แท้จริง
jbowman

มีวิธีที่จะทำให้คณิตศาสตร์ที่นี่ถูกต้องหรือไม่?
David Refaeli
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.