เปรียบเทียบ 0/10 ถึง 0/20


10

เมื่อพูดถึงอัตราความสำเร็จของงานมีวิธีใดที่จะแสดงให้เห็นว่า 0 จาก 20 ครั้งคือ "แย่ลง" มากกว่า 0 จาก 10 ครั้ง?


1
คุณอาจลองใช้en.wikipedia.org/wiki/Additive_smoothingแต่จะค่อนข้างมือโบกมือมากกว่าหลักฐานที่เป็นของแข็ง
abukaj

คุณจะรู้ได้อย่างไรว่ามันแย่ลง? เช่นถ้ามีเพียง 10 ครั้งที่เป็นไปได้คุณจะไม่รู้ว่าคะแนนจะเป็นเท่าใด
ทิม

4
บางทีช่วงความเชื่อมั่นสำหรับสัดส่วนโดยประมาณ?
mdewey

5
ดูเหมือนว่าเป็นคำถามที่สมเหตุสมผลสำหรับฉัน มันขึ้นอยู่กับสัญชาตญาณปกติอย่างสมบูรณ์ที่สามารถพูดคุยและมีวิธีการทางสถิติ (เช่น Bayesian) เพื่อแก้ไขปัญหา ฉันลงคะแนนให้เปิดทิ้งไว้
gung - Reinstate Monica

1
ฉันเห็นด้วยกับ @gung นี่เป็นคำถามที่ดี
Alexis

คำตอบ:


3

สมมติว่าเรารู้ว่าความน่าจะเป็นที่จะประสบความสำเร็จในความพยายาม ในกรณีนี้เราคำนวณความน่าจะเป็นที่ 0 จาก 10 และ 0 จาก 20 ราย

อย่างไรก็ตามในกรณีนี้เราไปทางอื่น เราไม่รู้ความน่าจะเป็นเรามีข้อมูลและพยายามประเมินความน่าจะเป็น

ยิ่งมีกรณีมากเท่าไหร่เราก็ยิ่งมั่นใจได้มากขึ้นเท่านั้น ถ้าฉันจะพลิกหนึ่งเหรียญและมันจะเป็นหัวคุณจะไม่แน่ใจว่ามันเป็นสองหัว ถ้าฉันจะโยนมัน 1,000 ครั้งและมันจะเป็นหัวทั้งหมดมันไม่น่าเป็นไปได้ที่มันจะสมดุล

มีวิธีการที่ออกแบบมาเพื่อพิจารณาจำนวนเส้นทางเมื่อให้การประมาณ หนึ่งในนั้นคือสารเติมแต่งให้เรียบที่ @abukaj แสดงความคิดเห็นเกี่ยวกับข้างต้น ในการเสริมให้เรียบเราเพิ่มตัวอย่างหลอกเข้ามาพิจารณา ในกรณีของเราแทนเส้นทางที่เราเห็นเราเพิ่มอีกสอง - หนึ่งที่ประสบความสำเร็จและล้มเหลว

  • ในกรณีแรกความน่าจะเป็นแบบเรียบจะเป็น = ~ 8.3%1+010+1+1112
  • ในกรณีที่สองเราจะได้รับ = ~ 4.5%1+020+1+1122

โปรดทราบว่าการปรับให้เรียบเป็นส่วนเพิ่มเติมเป็นเพียงวิธีหนึ่งในการประมาณ คุณจะได้รับผลลัพธ์ที่แตกต่างด้วยวิธีการที่แตกต่างกัน ถึงแม้จะมีการเสริมให้เรียบตัวเองคุณจะได้รับผลลัพธ์ที่แตกต่างกันถ้าคุณเพิ่มตัวอย่างหลอก 4

อีกวิธีคือใช้ช่วงความมั่นใจตามที่ @mdewey แนะนำ ยิ่งเรามีตัวอย่างมากเท่าไหร่ช่วงความมั่นใจก็จะยิ่งสั้นลงเท่านั้น ขนาดของช่วงความเชื่อมั่นเป็นสัดส่วนกับรากที่สองของกลุ่มตัวอย่าง -{n}} ดังนั้นการเพิ่มจำนวนตัวอย่างเป็นสองเท่าจะนำไปสู่ช่วงความเชื่อมั่นที่สั้นลง1n2

ค่าเฉลี่ยในทั้งสองกรณีคือ 0 เราใช้ระดับความเชื่อมั่น 90% (z = 1.645)

  • ในกรณีแรกเราจะได้ 0 + ~ 52%1.64510
  • ในกรณีที่สองเราจะได้ 0 + ~ 36%1.64520

ในกรณีที่ข้อมูลสูญหายมีความไม่แน่นอน สมมติฐานที่คุณทำและข้อมูลภายนอกที่คุณจะใช้จะเปลี่ยนสิ่งที่คุณจะได้รับ


1
ขอบคุณมากแดนเลวิน คำตอบของคุณชัดเจนเพียงพอสำหรับผู้ที่ไม่ใช่นักคณิตศาสตร์ที่จะติดตามและยังแข็งแกร่งพอที่ฉันจะยอมรับคำอธิบายของคุณอย่างสังหรณ์ใจ ขอบคุณผู้แสดงความคิดเห็นทั้งหมดสำหรับการป้อนข้อมูลของคุณ
vinne

1

การขยายแนวคิดของการเรียกใช้ช่วงความมั่นใจมีแนวคิดของช่วงทวินามที่แน่นอน

การแจกแจงแบบทวินามคือจำนวนความสำเร็จทั้งหมดในการทดลองอิสระที่จบด้วย 0 (ความล้มเหลว) หรือ 1 (ความสำเร็จ) ความน่าจะเป็นของการได้รับ 1 (ความสำเร็จ) จะแสดงประเพณีและส่วนประกอบของมันคือ1-P จากนั้นผลลัพธ์ความน่าจะเป็นมาตรฐานคือความน่าจะเป็นที่ประสบความสำเร็จอย่างแน่นอนในการทดลองคือpq=1pkn

pn,k=(nk)pkqnk=n!k!(nk)!pkqnk

แนวคิดของช่วงความมั่นใจคือการกำหนดค่าที่เป็นไปได้ของพารามิเตอร์แบบจำลอง (ที่นี่, ความน่าจะเป็นของความสำเร็จ ) เพื่อให้เราสามารถสร้างความน่าจะเป็น (ดี, บ่อยครั้ง ) คำสั่งเกี่ยวกับค่าพารามิเตอร์ที่แท้จริงว่า ถ้าเราทำการทดสอบความน่าจะเป็นซ้ำของการทดลอง 10 หรือ 20 ครั้งและสร้างช่วงความมั่นใจตามวิธีที่กำหนดเราจะสังเกตว่ามูลค่าที่แท้จริงของพารามิเตอร์นั้นอยู่ในช่วง 95% ของเวลา)p

ในกรณีนี้เราสามารถหาในสูตรนั้นได้: p

pn,0=(1p)n

ดังนั้นหากเราต้องการช่วงเวลาด้านเดียว 95% เราจะตั้งค่าเพื่อแก้ความน่าจะเป็นของจำนวนศูนย์ที่สังเกตได้ที่ 5% สำหรับคำตอบคือ (เช่นสุดขั้วถ้าความน่าจะเป็นที่จะประสบความสำเร็จในการทดลองแต่ละครั้งคือ 13.9% ดังนั้นความน่าจะเป็นที่จะสังเกตความสำเร็จเป็นศูนย์ 5%) สำหรับคำตอบคือ\%] ดังนั้นจากตัวอย่างของเราเรียนรู้มากกว่าจากตัวอย่างของในแง่ที่ว่าเราสามารถ `` ยกเว้น '' ช่วงที่ตัวอย่างของยังคงทิ้งไว้อย่างน่าเชื่อถือpn,0=5%n=20[0%,13.9%]n=10[0%,25.9%]n=20n=10[13.9%,25.9%]n=10


0

แนวทางแบบเบย์

  • ให้สำหรับเป็นชุดของ IID ตัวแปรสุ่ม Bernoulliกับพารามิเตอร์พีXii=1,np
  • ขอให้เราเป็นตัวแทนของความไม่แน่นอนของพารามิเตอร์ของเราโดยสมมติว่ามันเป็นไปตามการกระจายเบต้ากับhyperparametersและ\p αβ

ฟังก์ชั่นความน่าจะเป็นและการกระจาย Bernoulli Beta เป็นคอนจูเกตก่อนสำหรับการกระจาย Bernoulli เพราะฉะนั้นหลังดังต่อไปนี้การกระจายเบต้า นอกจากนี้หลังถูกแปรโดย:

α^=α+i=1nXiβ^=β+ni=1nXi

ดังนั้น:

E[pX1,,Xn]=α^α^+β^=α+i=1nXiα+β+n

ดังนั้นหากคุณเห็นความล้มเหลว 10 ข้อความคาดหวังของคือและถ้าคุณเห็นความล้มเหลว 20 ข้อความคาดหวังของคือ20} ความล้มเหลวมากกว่าที่คุณเห็นลดความคาดหวังของคุณพีpαα+β+10pαα+β+20p

นี่เป็นข้อโต้แย้งที่สมเหตุสมผลหรือไม่? มันขึ้นอยู่กับว่าคุณรู้สึกอย่างไรเกี่ยวกับสถิติคชกรรมไม่ว่าคุณจะยินดีที่จะรูปแบบความไม่แน่นอนของพารามิเตอร์บางโดยใช้กลไกของความน่าจะเป็น และมันก็ขึ้นอยู่กับว่าคุณมีเหตุผลที่จะเลือกก่อนp

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.