จะสร้างช่วงความมั่นใจ 95% ของความแตกต่างระหว่างค่ามัธยฐานได้อย่างไร


27

ปัญหาของฉัน: กลุ่มทดลองแบบสุ่มมีการแจกแจงเบ้อย่างถูกต้องของผลลัพธ์หลัก ฉันไม่ต้องการใช้กฎเกณฑ์ปกติและใช้ CIs พื้นฐาน 95% (เช่นใช้ 1.96 X SE)

ฉันรู้สึกสะดวกสบายที่จะแสดงการวัดแนวโน้มกลางว่าเป็นค่ามัธยฐาน แต่คำถามของฉันคือวิธีการสร้าง 95% CI ของความแตกต่างในค่ามัธยฐานระหว่างสองกลุ่ม

สิ่งแรกที่อยู่ในใจคือ bootstrapping (ลองสุ่มใหม่พร้อมการแทนที่กำหนดค่ามัธยฐานในแต่ละกลุ่มและลบหนึ่งจากกลุ่มอื่นทำซ้ำ 1,000 ครั้งและใช้ Bias ที่ได้รับการแก้ไข 95%) นี่เป็นวิธีที่ถูกต้องหรือไม่? ข้อเสนอแนะอื่น ๆ ?


3
นั่นเป็นสิ่งแรกที่เข้ามาในใจฉันเช่นกัน คุณมีตัวอย่างมากแค่ไหน
jbowman

40 คนในแต่ละกลุ่ม = รวม 80 คน
pmgjones

3
คุณอาจมองเข้าไปในช่วงความเชื่อมั่นอิงพารามิเตอร์และประมาณการสำหรับความแตกต่างของพารามิเตอร์สถานที่ตั้งอยู่บนพื้นฐานของประมาณการฮอดจ์-มาห์ ดังที่อธิบายไว้ในหน้าช่วยเหลือสำหรับ R's wilcox.test()(ใต้Details) สิ่งนี้เกี่ยวข้องอย่างใกล้ชิดกับความแตกต่างของค่ามัธยฐาน แต่ไม่เหมือนกัน
caracal

2
เมื่อพิจารณาถึงการแบ่งส่วนข้อมูลกลางมันอาจจะคุ้มค่าที่จะอ่านเกี่ยวกับ bootstrap ที่ราบรื่น
caracal

@caracal: นี่เป็นจุดที่ดี ทั้ง bootstrap แบบปกติหรือแบบนิ่มมีความครอบคลุมแบบซีมโทติคที่ถูกต้อง แต่ความน่าจะเป็นแบบครอบคลุมของ bootstrap แบบสมูทจะแปรผันในอัตราที่เร็วขึ้น ถ้าฉันจำได้ถูกต้อง|P(mI^n)0.95|=O(n1/3)สำหรับบูตปกติและสำหรับบูตเรียบ มีการพูดคุยสั้น ๆ เกี่ยวกับเรื่องนี้โดยอ้างอิงเพิ่มเติมในQuantile Regressionโดย Koenker (2005)O(n2/5)
พอล

คำตอบ:


10

ขั้นตอนการบูตที่คุณอธิบายควรจะถูกต้อง อย่างไรก็ตามโปรดจำไว้ว่าเช่นเดียวกับ 95% CI ตามปกติช่วงความมั่นใจในการบูตจะรับประกันได้ว่าจะมีความคุ้มครองที่ถูกต้องเท่านั้น สิ่งหนึ่งที่ดีเกี่ยวกับการทำงานกับค่ามัธยฐานหรือปริมาณอื่น ๆ คือคุณสามารถสร้างช่วงความเชื่อมั่นตัวอย่าง จำกัด แน่นอนภายใต้สมมติฐานที่อ่อนแอมาก แนวคิดพื้นฐานคือภายใต้โมฆะที่ค่ามัธยฐานของคือmตัวบ่งชี้สำหรับy < mเป็นตัวแปรสุ่มของ Bernoulli 0.5 คุณสามารถใช้การสังเกตนี้เพื่อสร้างสถิติการทดสอบที่มีการแจกแจงตัวอย่างที่แน่นอน ดูChernozhukov, Hansen, Jansson (2009)สำหรับรายละเอียดเพิ่มเติมymy<m


1
คุณกรุณาอธิบายสิ่งที่คุณหมายถึงว่ามันใช้ได้เฉพาะ asymptotically ฉันไม่แน่ใจเป็นพิเศษว่าความหมายเชิงสัญลักษณ์ในบริบทนี้คืออะไร ขอบคุณ!
pmgjones

@pmgjones: เป็นช่วงความเชื่อมั่น สำหรับพารามิเตอร์บางเมตรเป็นเช่นนั้นP ( I n ) = 0.95 สำหรับเป็นไปได้ทั้งหมดเมตร (หรือจริงๆข้อมูลที่เป็นไปได้ทั้งหมดสร้างกระบวนการ) ฉันเขียนฉัน nจะเน้นว่าช่วงเวลาเป็นหน้าที่ของคุณตัวอย่างบางส่วน สำหรับบูตปกติหรือตามช่วงความเชื่อมั่นก็ไม่ได้เป็นความจริงที่ว่าP ( ฉัน(ยกเว้นสำหรับกระบวนการที่ก่อให้เกิดข้อมูลที่พิเศษมาก). อย่างไรก็ตามคุณสามารถแสดงให้เห็นว่าลิมn I^nmP(mI^n)=0.95ม.ผม^nP(ม.ผม^n)=0.95LimnP(ม.ผม^n)=0.95

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.