คุณสามารถอธิบายได้ว่าทำไมผูกสถิติไม่ได้ปฏิเสธอย่างไร้เดียงสาเมื่อ ?


12

ฉันต้องการความช่วยเหลือในการอธิบายและอ้างถึงข้อความสถิติพื้นฐานเอกสารหรือข้อมูลอ้างอิงอื่น ๆ ว่าทำไมจึงไม่ถูกต้องที่จะใช้สถิติขอบของข้อผิดพลาด (MOE) ที่รายงานในการลงคะแนนเลือกตั้งเพื่อประกาศผูกสถิติอย่างไร้เดียงสา

ตัวอย่าง: ผู้สมัคร A นำผู้สมัคร B ในแบบสำรวจความคิดเห็นเปอร์เซ็นต์, margin-of-error สำหรับผู้ลงคะแนนสำรวจคน4.5 % 50039314.5%500

เพื่อนของฉันชอบเหตุผลดังนี้:

เนื่องจากความซับซ้อนของการสร้างแบบจำลองทางสถิติระยะขอบของข้อผิดพลาดหมายความว่าการสนับสนุนที่แท้จริงของ A อาจต่ำถึง 34.5 เปอร์เซ็นต์และ B's อาจสูงถึง 35.5 เปอร์เซ็นต์ ดังนั้น A และ B จึงอยู่ในสภาพที่มีอุณหภูมิต่ำ

ความช่วยเหลือทั้งหมดชื่นชมอย่างชัดเจนในการใช้เหตุผลของเพื่อนฉันอย่างชัดเจน ฉันได้พยายามที่จะอธิบายว่ามันเป็นเรื่องที่ไม่ถูกต้องอย่างไร้เดียงสาปฏิเสธสมมติฐาน "นำไปสู่ B" ถ้า<2MOE pApB<2MOE


สำหรับการอภิปรายเพิ่มเติมนี้รวมทั้งวิธีการอย่างถูกต้องรวม Moes ดูstats.stackexchange.com/questions/18215
whuber

คำตอบ:


7

ความพยายามครั้งแรกของฉันที่คำตอบนั้นมีข้อบกพร่อง (ดูด้านล่างสำหรับคำตอบที่มีข้อบกพร่อง) สาเหตุที่มีข้อบกพร่องคือขอบของข้อผิดพลาด (MOE) ที่รายงานถูกนำไปใช้กับเปอร์เซ็นต์โพลของผู้สมัคร แต่ไม่ถึงความแตกต่างของเปอร์เซ็นต์ ความพยายามครั้งที่สองของฉันตอบคำถามอย่างถูกต้องโดย OP ที่ดีขึ้นเล็กน้อย

ความพยายามครั้งที่สอง

เหตุผลของเพื่อน OP ดังต่อไปนี้:

  1. สร้างช่วงความมั่นใจสำหรับผู้สมัครสอบ A และผู้สมัครสอบ B แยกต่างหากโดยใช้ MOE ที่กำหนด
  2. หากพวกเขาทับซ้อนกันเรามีสถิติการได้ยินที่ตายแล้วและหากพวกเขาไม่ทำเช่นนั้น A กำลังเป็นผู้นำในปัจจุบัน

ปัญหาหลักที่นี่คือขั้นตอนแรกไม่ถูกต้อง การสร้างช่วงความมั่นใจอย่างอิสระสำหรับผู้สมัครสองคนนั้นไม่ใช่ขั้นตอนที่ถูกต้องเพราะเปอร์เซ็นต์การทำโพลสำหรับผู้สมัครสองคนนั้นขึ้นอยู่กับตัวแปรสุ่ม กล่าวอีกนัยหนึ่งผู้มีสิทธิเลือกตั้งที่ตัดสินใจไม่ลงคะแนนให้ A อาจตัดสินใจลงคะแนนแทน B แทน ดังนั้นวิธีที่ถูกต้องในการประเมินว่าลูกค้าเป้าหมายมีความสำคัญหรือไม่คือการสร้างช่วงความมั่นใจสำหรับความแตกต่าง ดูวิกิว่าวิธีคำนวณข้อผิดพลาดมาตรฐานสำหรับความแตกต่างของเปอร์เซ็นต์การโพลภายใต้สมมติฐานบางข้อ

ข้อผิดพลาดด้านล่าง

ในความคิดของฉันวิธี 'ถูกต้อง' ในการคิดผลการสำรวจมีดังนี้

ในการสำรวจผู้ลงคะแนน 500 คนโอกาสที่เราจะเห็นความแตกต่างของสารตะกั่วสูงถึง 8% มากกว่า 5%

ไม่ว่าคุณจะเชื่อว่า 'A โอกาสในการขาย B' หรือ 'ความสัมพันธ์ B' นั้นขึ้นอยู่กับขอบเขตที่คุณยินดีที่จะยอมรับ 5% เป็นเกณฑ์การตัดบัญชีของคุณ


@Srikvant สมมติว่า 5% เป็นสิ่งสำคัญที่ยอมรับได้ ฉันกำลังค้นหาคำตอบที่แม่นยำยิ่งขึ้นซึ่งหนึ่งในนั้นเผยให้เห็นความคิดที่ว่า "A โอกาสในการขาย B" เป็นสถิติใหม่ความแตกต่างของ pA และ pB และความมั่นใจที่สอดคล้องกันไม่ใช่แค่ 2 * MOE

4

ง่ายต่อการอธิบายในแง่ของการเบี่ยงเบนมาตรฐานแทนที่จะเป็นช่วงความมั่นใจ

ข้อสรุปของเพื่อนของคุณนั้นถูกต้องภายใต้โมเดลที่ง่ายที่สุดที่คุณมีการสุ่มตัวอย่างอย่างง่ายและผู้สมัครสองคน ตอนนี้สัดส่วนกลุ่มตัวอย่างตอบสนองความเพื่อให้p_A ดังนั้น และ สิ่งที่ทำให้ความสัมพันธ์แบบเรียบง่ายนี้เป็นไปได้คือและมีความสัมพันธ์เชิงลบอย่างสมบูรณ์แบบเพราะโดยทั่วไป pA+pB=1pB=1pA

Var(pApB)=Var(2pA1)=4Var(pA)
SD(pApB)=2SD(pA).
pApB
Var(pApB)=Var(pA)+Var(pB)2Cov(pA,pB).

นอกโมเดลง่าย ๆ นี้ถ้าไม่ถือโดยทั่วไปคุณต้องคำนึงถึงความสัมพันธ์ระหว่างและที่ไม่รวมอยู่ในระยะขอบของข้อผิดพลาด มันเป็นไปได้สำหรับ(p_A)p A p B S D ( p A - p B ) 2 S D ( p A )pA+pB=1pApBSD(pApB)2SD(pA)

แต่สิ่งที่แตกต่างกันนิดหน่อยนี้ดูเหมือนจะบ่งบอกว่าหน่วยเลือกตั้งควรรายงานถึงขอบของความคลาดเคลื่อนในความแตกต่าง เนทซิลเวอร์อยู่ที่ไหน


4

ไม่เพียง แต่เป็นวิธีที่ไม่ดีในการบอกเล่าเรื่องราวเท่านั้น แต่นั่นไม่ใช่แม้แต่ความร้อนจากสถิติ

คุณไม่ได้ใช้ช่วงความเชื่อมั่นที่ทับซ้อนกันเช่นนั้น หากคุณต้องการเพียงบอกว่าผู้สมัครก. จะได้รับชัยชนะผู้สมัครกนั้นจะเป็นผู้นำแน่นอน นำไปสู่คือ 8% MOE 6.4% ช่วงความเชื่อมั่นของคะแนนการลบนั้นไม่ได้เป็นสองเท่าของช่วงความเชื่อมั่นของคะแนนแต่ละคะแนน ซึ่งมีนัยโดยอ้างว่าการทับซ้อนของ CIs (± MOE) รอบ ๆ การประมาณแต่ละครั้งนั้นเป็นความร้อนที่ตาย สมมติว่า N และความแปรปรวนเท่ากันกระทรวงศึกษาธิการของความแตกต่างคือ sqrt (2) คูณ 4.5 นั่นเป็นเพราะการค้นหาความแตกต่างระหว่างค่าจะเพิ่มความแปรปรวนเพียงสองเท่า (SD กำลังสอง) ช่วงความมั่นใจจะขึ้นอยู่กับ sqrt ของความแปรปรวนดังนั้นการรวมพวกมันคือค่าเฉลี่ย (4.5) * sqrt (2) เนื่องจากกระทรวงศึกษาธิการของสารตะกั่ว 8% ของคุณมีค่าประมาณ 6.4% ดังนั้นผู้สมัครสอบ A จึงเป็นผู้นำ

นอกเหนือจากนั้นกระทรวงศึกษาธิการยังคงอนุรักษ์นิยมและตั้งอยู่บนค่าทางเลือก 50% สูตรคือ sqrt (0.25 / n) * 2. มีสูตรสำหรับคำนวณข้อผิดพลาดมาตรฐานของคะแนนความแตกต่างที่เราสามารถใช้ได้เช่นกัน เราจะนำไปใช้โดยใช้ค่าที่พบมากกว่าการตัด 50% และยังคงให้โอกาสในการเป็นผู้นำที่สำคัญสำหรับผู้สมัครสอบ A (7.5% MOE) ฉันเชื่อว่าจากความคิดเห็นของผู้ถามและความใกล้เคียงของการตัดออกไปหนึ่งข้อที่เลือกไว้นั่นอาจเป็นสิ่งที่พวกเขากำลังมองหา

การแนะนำเกี่ยวกับช่วงความมั่นใจและอำนาจจะเป็นประโยชน์ที่นี่ แม้แต่บทความวิกิพีเดียใน MOE ก็ยังดูดีอยู่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.