ผลลัพธ์ของการสอบนั้นเป็นแบบทวินามหรือไม่?


31

นี่เป็นคำถามเชิงสถิติอย่างง่ายที่ฉันได้รับ ฉันไม่แน่ใจจริงๆฉันเข้าใจ

X = จำนวนคะแนน aquired ในการสอบ (ตัวเลือกที่หลากหลายและคำตอบที่ถูกคือหนึ่งจุด) X มีการแจกแจงแบบทวินามหรือไม่

คำตอบของอาจารย์คือ:

ใช่เพราะมีเพียงคำตอบที่ถูกหรือผิด

คำตอบของฉัน:

ไม่เพราะคำถามแต่ละข้อมี "ความน่าจะเป็นที่ประสบความสำเร็จ" ที่แตกต่างกัน อย่างที่ฉันเข้าใจว่าการแจกแจงทวินามเป็นเพียงชุดของการทดลองของ Bernoulli ซึ่งแต่ละคนมีผลลัพธ์ที่เรียบง่าย เช่นการพลิกเหรียญ a (ยุติธรรม) 100 ครั้งนี่คือการทดลอง 100 Bernoulli และทั้งหมดมี p = 0.5 แต่ที่นี่คำถามมี p ที่แตกต่างกันใช่มั้ย


14
+1 ยิ่งกว่านั้น: หากเป็นการสอบที่แปลกจริง ๆ การตอบคำถามจะมีความสัมพันธ์กันอย่างมาก หากXคือคะแนนรวมของแต่ละบุคคลสิ่งนี้จะขัดขวางการกระจายแบบทวินาม เป็นไปได้หรือไม่ที่คำถามนั้นทำงานภายใต้สมมติฐาน "ว่างสมมติฐาน" ซึ่งผู้สอบทุกคนเป็นอิสระและคาดเดาคำตอบทั้งหมดทั้งหมด?
whuber

2
อย่างน้อยฉันก็จะกล่อมให้เครดิตบางส่วนในเรื่องนี้ แต่ "คำตอบ" ดูเหมือนจะสะท้อนความไม่ลงรอยกันเพื่อให้รางวัล :) (ฉันคิดว่าคุณอยู่ที่นี่)
AdamO

1
ใช่ขอบคุณ: D ฉันคิดว่ามันเป็นการกระจายตัวแบบปัวซงมากกว่า (ถ้ามี)
พอล

2
@Zahava ดูstats.stackexchange.com/search?q=poisson+binomial
whuber

2
ฉันเห็นด้วยกับทุกคนว่าคำถามนั้นแย่ แต่มีปัญหาเรื่องกรอบที่นี่ ถ้านี่เป็นหลักสูตรระดับประถมศึกษาและเป็นรูปแบบคำตอบสั้น ๆ (เพื่อให้คุณมีโอกาสอธิบายเหตุผลของคุณ) ฉันจะบอกว่าคำตอบที่ดีที่สุดน่าจะเป็น "ใช่ (สมมติว่ามีความเป็นอิสระและความยากลำบากเท่ากันสำหรับแต่ละคำถาม)"; ที่จะส่งสัญญาณไปยังศาสตราจารย์ว่า (1) คุณเข้าใจข้อ จำกัด ของคำถามและ (2) คุณไม่ได้พยายามเป็นคนฉลาด
Ben Bolker

คำตอบ:


25

ฉันจะเห็นด้วยกับคำตอบของคุณ โดยปกติข้อมูลประเภทนี้จะเป็นแบบอย่างในปัจจุบันมีชนิดของทฤษฎีการตอบสนองรูปแบบ ตัวอย่างเช่นถ้าคุณใช้แบบจำลอง Raschดังนั้นคำตอบแบบไบนารีคำตอบจะถูกจำลองเป็นXni

Pr{Xni=1}=eβnδi1+eβnδi

ที่อาจจะคิดว่าเป็นnความสามารถบุคคล -th และδ ฉันเป็นฉันยากลำบากคำถาม -th ดังนั้นโมเดลนี้ช่วยให้คุณสามารถจับความจริงที่ว่าคนที่แตกต่างกันมีความสามารถและคำถามต่างกันไปในความยากลำบากและนี่คือโมเดล IRT ที่ง่ายที่สุดβnnδii

อาจารย์ของคุณตอบว่าสมมติว่าคำถามทุกข้อมีความน่าจะเป็นเหมือนกันคือ "ความสำเร็จ" และเป็นอิสระเนื่องจากทวินามคือการแจกแจงผลรวมของการทดลอง iid Bernoulli ละเว้นการอ้างอิงสองชนิดที่อธิบายไว้ข้างต้นn

ดังที่สังเกตเห็นในความคิดเห็นหากคุณดูการกระจายคำตอบของบุคคลใดบุคคลหนึ่ง (ดังนั้นคุณไม่ต้องสนใจเรื่องความแปรปรวนระหว่างบุคคล) หรือคำตอบของคนอื่นในรายการเดียวกัน (ดังนั้นจึงไม่มี ความแปรปรวนของรายการ) จากนั้นการแจกแจงจะเป็น Poisson-binomial เช่นการกระจายของผลรวมของการทดลอง non-iid Bernoulli การกระจายตัวสามารถประมาณด้วยทวินามหรือปัวซอง แต่นั่นคือทั้งหมด มิฉะนั้นคุณจะทำสมมติฐานของ iidn

แม้ภายใต้สมมติฐาน "ว่าง" เกี่ยวกับการคาดเดานี่ก็ถือว่าไม่มีรูปแบบการเดาดังนั้นผู้คนจึงไม่ต่างกันในการเดาและรายการต่าง ๆ ไม่แตกต่างกันว่าเดาได้อย่างไร - ดังนั้นการเดาจึงเป็นการสุ่มแบบสุ่ม


นั่นทำให้รู้สึก! แม้ว่าฉันเดาว่าคุณสามารถคำนวณความน่าจะเป็นของความน่าจะเป็นที่ประสบความสำเร็จของคำถาม แต่ "ความสามารถของบุคคล" ฟังดูยาก :) อีกแนวคิดหนึ่งที่ฉันมีก็คือการทำแบบจำลองนี้เป็นผลรวมของ ตัวอย่างเช่นสมมติว่ามีคำถาม 2 ข้อดังนั้นจึงมีความน่าจะเป็นที่จะได้รับ 2 p1 และ p2 ตัวแปรสองตัวที่คล้ายคลึงกัน X1 และการนับ X2 (ดังนั้นการทดสอบ bernulli 2 ครั้ง) ตัวอย่างเช่นความน่าจะเป็นที่จะได้รับหนึ่งคะแนนรวมเท่ากับ 1 คือ P (X1 = 1) * P (X2 = 0) + P (X1 = 0) * P (X2 = 1) = p1 (1-p2) + (p1 -1) P2 เสียงนั้นสมเหตุสมผลหรือไม่
พอล

2
@ ผลรวมของ Paul สอง Bernoulli กับ p ที่แตกต่างกันคือ Poisson-binomial
ทิม

4
ข้อสันนิษฐาน "โมฆะ" นั้นเป็นสิ่งที่มีลักษณะเป็นทรงกลมวัวคุณสามารถพูดเล่น ๆ ว่าวัวเป็นทรงกลมได้อย่างไร
Hong Ooi

5

คำตอบของปัญหานี้ขึ้นอยู่กับกรอบของคำถามและเมื่อได้รับข้อมูล โดยรวมแล้วฉันมักจะเห็นด้วยกับอาจารย์ แต่คิดว่าคำอธิบายคำตอบของเขา / เธอแย่และคำถามของอาจารย์ควรรวมข้อมูลเพิ่มเติมไว้ล่วงหน้า

หากคุณพิจารณาคำถามที่อาจเป็นไปได้จำนวนไม่ จำกัด และคุณสุ่มหนึ่งคำถามสำหรับคำถามที่ 1 ให้วาดคำถามที่สุ่มสำหรับคำถามที่ 2 ฯลฯ จากนั้นจะเข้าสู่การสอบ:

  1. คำถามแต่ละข้อมีสองผลลัพธ์ (ถูกหรือผิด)
  2. มีจำนวนการทดลองที่แน่นอน (คำถาม)
  3. p

ภายใต้กรอบการทำงานนี้จะพบสมมติฐานของการทดลองแบบทวินาม

อนิจจาปัญหาทางสถิติที่นำเสนอไม่ดีนั้นเป็นเรื่องธรรมดามากในทางปฏิบัติไม่ใช่แค่เรื่องการสอบ ฉันจะไม่ลังเลที่จะปกป้องเหตุผลของคุณกับอาจารย์ของคุณ


ใช่ฉันเดาว่าก็ถูกเช่นกัน คำถามนั้นเป็นเพียง "ไม่ดี" เนื่องจากคุณสามารถโต้เถียงทั้งสองวิธีเนื่องจากได้รับข้อมูลเพียงเล็กน้อย แต่ฉันก็ไม่พอใจมากกับคำตอบที่ได้รับจากอาจารย์ของฉัน
พอล

4
@ พอลมันค่อนข้างยากที่จะเขียนคำถามเชิงสถิติที่ดี ฉันรู้ว่าฉันมีความผิดพลาดหลายครั้ง
gung - Reinstate Monica

1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.- ฉันคิดว่าคุณควรให้ข้อสันนิษฐานที่ชัดเจนว่าคำถามข้อสอบนั้นถูกแยกออกมาจากกลุ่มของคำถามที่อาจเป็นไปได้ มันจะเป็นจริงมากขึ้นสำหรับพวกเขาที่จะมีความสัมพันธ์: ถ้าคำถามที่ 1 เป็นเรื่องง่ายมีโอกาสที่คุณจะได้รับการสอบง่ายและคำถามที่ 2 จะง่าย
เอเดรียน

0

หากมีคำถาม n ข้อและฉันสามารถตอบคำถามใดคำถามหนึ่งได้อย่างถูกต้องด้วยความน่าจะเป็น p และมีเวลาพอที่จะตอบคำถามทุกข้อและฉันทำแบบทดสอบเหล่านี้ครบ 100 ครั้งคะแนนของฉันจะกระจายตามปกติด้วยค่าเฉลี่ย

แต่ไม่ใช่ว่าฉันจะทำซ้ำการทดสอบ 100 ครั้งมันเป็น 100 ผู้สมัครที่แตกต่างกันในการทำแบบทดสอบเดียวโดยแต่ละครั้งมีความน่าจะเป็นของตัวเอง การกระจายของ p เหล่านี้จะเป็นปัจจัยที่สำคัญ คุณอาจจะมีการทดสอบโดยที่ p = 0.9 ถ้าคุณศึกษาเรื่องนี้ได้ดี, p = 0.1 ถ้าคุณไม่ได้มีคนน้อยมากระหว่าง 0.1 ถึง 0.9 การกระจายของคะแนนจะมีค่าสูงสุดอย่างมากที่ 0.1n และ 0.9 n และจะไม่มีที่ไหนใกล้กับการแจกแจงแบบปกติ

ในทางตรงกันข้ามมีการทดสอบที่ทุกคนสามารถตอบคำถามใด ๆ แต่ใช้เวลาต่างกันดังนั้นบางคนจะตอบคำถาม n ทั้งหมดและคนอื่นจะตอบน้อยกว่าเพราะหมดเวลา หากเราสามารถสันนิษฐานได้ว่าความเร็วของผู้สมัครเป็นแบบกระจายปกติแล้วคะแนนจะใกล้เคียงกับการแจกแจงแบบปกติ

แต่การทดสอบจำนวนมากจะมีคำถามที่ยากมากและบางคำถามที่ง่ายมากโดยเจตนาเพื่อให้เราสามารถแยกแยะความแตกต่างระหว่างผู้สมัครที่ดีที่สุด (ผู้ที่จะตอบคำถามทุกข้อจนถึงระดับความยาก) และผู้สมัครที่แย่ที่สุด คำถามง่าย ๆ ) สิ่งนี้จะเปลี่ยนการกระจายตัวของคะแนนค่อนข้างมาก


2

2
@Tim แม้จะไม่จำเป็นต้องพึ่งการแจกแจงแบบปกติและความลึกลับของการทดสอบ 100 ครั้ง แต่คำตอบนี้มีประโยชน์ในการพยายามแสดงให้เห็นว่ากรณีใดสามารถนำไปสู่การแจกแจงแบบไม่ทวินามได้อย่างชัดเจน เช่นนี้อาจเป็นประโยชน์สำคัญต่อคำตอบหากปัญหาทางเทคนิคเหล่านี้ได้รับการแก้ไข
whuber

0

n n

n

  • 12
  • มีความเป็นอิสระ การสอบจำนวนมากถามคำถามที่สร้างขึ้นจากคำตอบของคำถามก่อนหน้า ใครจะบอกได้ว่าแน่นอนว่าจะไม่เกิดขึ้นกับการสอบในคำถามนี้ มีปัจจัยอื่น ๆ ที่สามารถตอบคำถามการสอบที่ไม่เป็นอิสระจากกัน แต่ฉันคิดว่าสิ่งนี้เป็นสิ่งที่ชัดเจนที่สุดโดยสัญชาตญาณ

ฉันเคยเห็นคำถามในชั้นเรียนสถิติที่วางแบบจำลองคำถามการสอบเป็นแบบทวินาม แต่พวกเขามีกรอบบางอย่างตาม:

การแจกแจงความน่าจะเป็นแบบใดที่จำลองจำนวนคำถามที่ตอบถูกต้องในการสอบแบบเลือกตอบโดยที่คำถามทุกข้อมีสี่ตัวเลือกและนักเรียนที่ทำการสอบจะเดาคำตอบทุกข้อโดยการสุ่ม

p=14


ไม่มีเหตุผลใดที่มีข้อเท็จจริงของคุณ แต่ตรรกะไม่ถูกต้อง: มันไม่พอเพียงที่จะแสดงให้เห็นว่าสมมติฐานบางอย่างอาจไม่ถือเพราะ (เหตุผล) การกระจายอาจยังคงเป็นแบบทวินามในทุกกรณี คุณต้องแสดงให้เห็นว่าสมมติฐานเหล่านี้อาจล้มเหลวในลักษณะที่ทำให้การแจกแจงคะแนนไม่เป็นแบบทวินามอย่างแน่นอน
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.