เหตุผลที่เข้าใจได้ง่ายว่าเหตุใดข้อมูลฟิชเชอร์ของ Binomial จึงแปรผกผันกับ


12

มันสับสน / พัดใจของฉันที่มีความแปรปรวนทวินามสัดส่วนกับP) เท่าข้อมูลฟิชเชอร์เป็นสัดส่วนกับ(1-P)} อะไรคือสาเหตุของสิ่งนี้? ทำไมข้อมูลฟิชเชอร์ที่ลดลง ? นั่นคือเหตุผลว่าทำไมการอนุมานที่ยากที่สุดที่ ?1p(1p) p=0.5p=0.51p(1p)p=0.5p=0.5

บริบท:

ฉันกำลังทำงานกับเครื่องคิดเลขขนาดตัวอย่างและสูตรสำหรับขนาดตัวอย่างที่ต้องการเป็นปัจจัยที่เพิ่มขึ้นของซึ่งเป็นผลมาจากการประมาณค่าความแปรปรวนในการหาค่าp ( 1 - p )Np(1p)


3
ความแปรปรวนของตัวแปรสุ่มBernoulliพร้อมพารามิเตอร์คือและตัวแปรสุ่มแบบทวินามซึ่งเป็นผลรวมของตัวแปรสุ่มแบบอิสระของ Bernoulli มีความแปรปรวนซึ่งเป็นผลรวมของความแปรปรวน . สำหรับสาเหตุที่ให้พิจารณาความแปรปรวนเป็นโมเมนต์ความเฉื่อยเกี่ยวกับจุดศูนย์กลางมวลของมวลและที่และตามลำดับ p ( 1 - p ) N N p ( 1 - p ) N p ( 1 - p ) p 1 - p 1 0pp(1p)NNp(1p)N p(1p)p1p10
Dilip Sarwate

ใช่ฉันกล่าวว่าสัดส่วนกับ , ไม่สนใจNคุณสามารถอธิบายรายละเอียดในส่วนที่สองของคุณได้ไหมดูเหมือนว่าจะเป็นมุมมองที่น่าสนใจ Np(1p)N
Cam.Davidson.Pilon

คำตอบ:


13

หากต้องการดูด้วยวิธีการที่เข้าใจง่ายว่าความแปรปรวนถูกขยายให้ใหญ่สุดที่ให้ใช้เท่ากับ (resp. ) แล้วตัวอย่างจากมีแนวโน้มที่จะมีหลายคน 's (resp. ' s) และเพียงไม่กี่ 's (resp. ' s) มีการเปลี่ยนแปลงไม่มากมีp 0.99 p = 0.01 X Bernoulli ( p ) 1 0 0 1p=0.5p0.99p=0.01XBernoulli(p)1001


นั่นเป็นเรื่องจริง บางทีสิ่งที่ฉันควรจะถามคือทำไมข้อมูลฟิชเชอร์ที่ลดลง ? p=0.5คือทำไมการอนุมานที่ยากที่สุดที่ ? ฉันจะอัปเดตคำถามของฉันเพื่อสะท้อนสิ่งนั้น p=0.5
Cam.Davidson.Pilon

3
อีกครั้งในวิธีที่ใช้งานง่ายมาก: ยิ่งมีการเปลี่ยนแปลงมากเท่าใดคุณก็ยิ่งต้องการข้อมูลมากขึ้นเท่านั้น
ocram

9

ข้อสรุปคือ "ยาก" สำหรับ 'ที่อยู่ตรงกลางเพราะตัวอย่างมีใกล้ตรงกลางมีความสอดคล้องกับช่วงกว้างของหน้าใกล้ปลายมันไม่ไกลนัก - เพราะปลายเป็น "อุปสรรค" เกินกว่าที่ไม่สามารถไปได้พีพีพีpp^pp

ฉันคิดว่าสัญชาตญาณนั้นง่ายกว่าเมื่อมองในแง่ความแปรปรวน

สัญชาตญาณเกี่ยวกับความแปรปรวนของทวินามที่มีขนาดใหญ่อยู่ตรงกลางและขนาดเล็กที่ปลายค่อนข้างตรงไปตรงมา: ใกล้กับจุดสิ้นสุดไม่มีที่ว่างสำหรับข้อมูลที่จะ "กระจาย" พิจารณาขนาดเล็ก - เพราะค่าเฉลี่ยอยู่ใกล้กับ 0, รูปแบบที่ไม่สามารถจะมีขนาดใหญ่ - สำหรับข้อมูลที่เฉลี่ยก็สามารถได้รับเพื่อให้ห่างไกลจากค่าเฉลี่ยพีpp

ลองพิจารณาความแปรปรวนของสัดส่วนตัวอย่างในชุดการทดลองของ Bernoulli นี่ n ดังนั้นการถือคงที่และการเปลี่ยนแปลงการแปรผันนั้นเล็กกว่าสำหรับใกล้ 0:n พีพีVar(p^)=p(1p)/nnpp

สัดส่วนตัวอย่างในตัวอย่างทวินาม - ที่นี่เป็นเพียงชุดสุ่ม กล่องสีฟ้ามีค่าเฉลี่ย 0.03 ส่วนสีดำหมายถึง 0.5 (มีกระวนกระวายใจบางตัวเพิ่มเพื่อให้คะแนนไม่มากเกินไปและเสียรายละเอียด) yป้อนคำอธิบายรูปภาพที่นี่

ฟังก์ชันความน่าจะเป็นที่สอดคล้องกัน: ป้อนคำอธิบายรูปภาพที่นี่

ในแต่ละกรณีให้ความสนใจกับเส้นที่หมายถึงค่าเฉลี่ย ในขณะที่เส้นเฉลี่ยกลายเป็น 'ติดขัด' มากขึ้นกับสิ่งกีดขวางจุดที่ต่ำกว่าค่าเฉลี่ยจะมีเพียงเล็กน้อยด้านล่าง

ดังนั้นคะแนนเหนือค่าเฉลี่ยจึงไม่สามารถสูงกว่าค่าเฉลี่ยได้มากเกินไป (เพราะค่าเฉลี่ยจะเปลี่ยน!) ใกล้จุดสิ้นสุดไม่ได้ "ดันขึ้น" แบบเดียวกับที่มันทำเมื่อมีสิ่งกีดขวางอยู่ที่นั่นp=12

ป้อนคำอธิบายรูปภาพที่นี่

เราเห็นในเวลาเดียวกันว่าทำไมการแจกแจงต้องเบ้ปลาย สำหรับตัวแปรสุ่มถึงแม้บางครั้งจะมีค่ามากกว่าสูงกว่าค่าเฉลี่ยก็จะต้องมีความน่าจะเป็นที่จะถูกบีบให้ต่ำกว่าค่าเฉลี่ยเท่าที่จะเป็นไปได้ สิ่งกีดขวางที่ปรากฏที่ 0 ให้ทั้งขีดจำกัดความแปรปรวนและนำไปสู่ความเบ้พีp^p

[สัญชาตญาณรูปแบบนี้ไม่ได้บอกเราว่าเหตุใดจึงต้องใช้แบบฟอร์มการทำงานที่แน่นอน แต่มันทำให้ชัดเจนว่าทำไมความแปรปรวนจะต้องใกล้ถึงจุดสิ้นสุดเล็กน้อยและยิ่งเข้าใกล้จุดสิ้นสุดมากขึ้น]


ดังนั้นคะแนนเหนือค่าเฉลี่ยจึงไม่สามารถสูงกว่าค่าเฉลี่ยได้มากเกินไป (เพราะค่าเฉลี่ยจะเปลี่ยน!) ใกล้ p = 12 จุดสิ้นสุดไม่ได้ "ดันขึ้น" แบบเดียวกัน สมบูรณ์แบบเกินไป นี่คือคำอธิบายที่ดี
Cam.Davidson.Pilon

7

ข้อมูลชาวประมงเป็นความแปรปรวนของฟังก์ชั่นคะแนน และมันเกี่ยวข้องกับเอนโทรปี สำหรับการทดลองใช้ Bernoulli เราได้รับหนึ่งบิตสำหรับการทดลองแต่ละครั้ง ดังนั้นข้อมูลฟิชเชอร์นี้มีคุณสมบัติใกล้เคียงกับแชนนอนเอนโทรปีตามที่เราคาดหวัง โดยเฉพาะอย่างยิ่งเอนโทรปีมีค่าสูงสุดที่ 1/2 และข้อมูลมีค่าต่ำสุดที่ 1/2


อาอีกมุมมองที่ดี ฉันไม่ได้คิดถึงเรื่องนี้จากมุมมองแบบเอนโทรปิก!
Cam.Davidson.Pilon
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.