ผลกระทบของขอบเขตของถังขยะที่อิงกับข้อมูลต่อความดีของไคสแควร์พอดีหรือไม่


18

ออกจากประเด็นที่ชัดเจนของพลังงานต่ำของไคสแควร์ในสถานการณ์แบบนี้ลองจินตนาการถึงการทดสอบความดีของไคสแควร์สำหรับความหนาแน่นบางส่วนด้วยพารามิเตอร์ที่ไม่ระบุโดยการทำข้อมูล

สำหรับ concreteness สมมุติว่าการแจกแจงเลขชี้กำลังมีค่าเฉลี่ยไม่ทราบและขนาดตัวอย่างเท่ากับ 100

เพื่อให้ได้จำนวนการสังเกตที่คาดหวังต่อ bin จำนวนบัญชีที่เหมาะสมจะต้องมีการบันทึกข้อมูล (เช่นถ้าเราเลือกที่จะวาง 6 bins ต่ำกว่าค่าเฉลี่ยและ 4 ด้านบนนั้นจะยังคงใช้ขอบเขตของฐานข้อมูล) .

แต่การใช้ถังขยะโดยดูจากข้อมูลนี้น่าจะส่งผลต่อการแจกแจงสถิติการทดสอบภายใต้ค่า Null

ฉันได้เห็นการสนทนามากมายเกี่ยวกับความจริงที่ว่า - หากพารามิเตอร์ถูกประเมินโดยความน่าจะเป็นสูงสุดจากข้อมูลที่ถูกทำให้เป็นบ้าเป็นหลัง - คุณเสีย 1 df ต่อพารามิเตอร์โดยประมาณ (ปัญหาย้อนหลังไปถึง Fisher vs Karl Pearson) - แต่ฉันจำไม่ได้ อ่านอะไรก็ได้เกี่ยวกับการค้นหาขอบเขตของตัวถังขยะเองตามข้อมูล (หากคุณประเมินจากข้อมูลที่ไม่ได้รวมดังนั้นด้วยk bins การกระจายของสถิติการทดสอบจะอยู่ที่ไหนสักแห่งระหว่างและ a )χk2χkp2

การเลือกใช้ถังขยะแบบอิงข้อมูลนี้ส่งผลต่อระดับหรือกำลังสำคัญอย่างมีนัยสำคัญหรือไม่? มีวิธีการบางอย่างที่สำคัญกว่าวิธีอื่น ๆ หรือไม่? หากมีผลมากมันเป็นสิ่งที่หายไปในกลุ่มตัวอย่างขนาดใหญ่หรือไม่?

ถ้ามันมีผลกระทบที่สำคัญนี่จะทำให้การทดสอบแบบไคสแควร์เกิดขึ้นเมื่อพารามิเตอร์ไม่เป็นที่รู้จักเกือบไร้ประโยชน์ในหลาย ๆ กรณี (แม้ว่าจะยังคงได้รับการสนับสนุนในตำราค่อนข้างน้อย) เว้นแต่คุณจะมี -priori ของพารามิเตอร์

การอภิปรายปัญหาหรือตัวชี้ไปยังการอ้างอิง (ควรมีการกล่าวถึงข้อสรุปของพวกเขา) จะเป็นประโยชน์


แก้ไขนอกเหนือจากคำถามหลัก:

มันเกิดขึ้นกับฉันว่ามีวิธีแก้ปัญหาที่เป็นไปได้สำหรับกรณีเฉพาะของเอ็กซ์โพเนนเชียล * (และชุดเครื่องแบบคิดออกมา) แต่ฉันยังสนใจในปัญหาทั่วไปของขอบเขตการเลือกผลกระทบการเลือกเพิ่มเติม

ตัวอย่างเช่นสำหรับเอ็กซ์โพเนนเชียลเราอาจใช้การสังเกตที่เล็กที่สุด (บอกว่าเท่ากับ ) เพื่อให้ได้แนวคิดคร่าวๆว่าจะวางถังขยะอย่างไร (เนื่องจากการสังเกตที่น้อยที่สุดนั้นมีความหมายเป็น ) และ จากนั้นทดสอบความแตกต่างที่เหลือ( ) เพื่อหาเลขชี้กำลัง แน่นอนว่าอาจให้ผลการประเมินแย่มากและด้วยเหตุนี้ตัวเลือกถังขยะที่น่าสงสารแม้ว่าฉันคิดว่าใคร ๆ ก็อาจใช้การโต้เถียงแบบวนซ้ำเพื่อให้การสังเกตสองหรือสามครั้งที่ต่ำที่สุดเพื่อเลือกถังขยะที่สมเหตุสมผล การสังเกตที่เหลืออยู่เหนือสถิติการสั่งซื้อที่เล็กที่สุดที่ใหญ่ที่สุดสำหรับการอธิบาย)mn - 1 x i - m μμ/nn1ximμ


1
คำถามที่น่าสนใจ ฉันไม่รู้คำตอบ แต่ความคิดที่ว่าอิสรภาพบางส่วนควรหายไปนั้นสมเหตุสมผล ถ้าคุณไม่เคยเห็นมันแล้วคำตอบนี้โดย @whuber ควรจะกระตุ้นความคิด: วิธีการเข้าใจองศาของเสรีภาพ สำหรับผมแล้วดูเหมือนว่าการศึกษาแบบจำลองบางอย่างน่าจะช่วยให้คุณได้เท้าที่นี่อย่างน้อยก็ในบางกรณี
gung - Reinstate Monica

1
ไม่แน่ใจว่าสิ่งนี้มีประโยชน์เพียงใด แต่มีปัญหาที่คล้ายคลึงกันในด้านการประมาณค่าที่เข้มงวด โดยเฉพาะวิธีการประมาณค่าที่มีประสิทธิภาพ (เช่นค่าเฉลี่ยที่ถูกตัด) มักต้องการอินพุตแบบกำหนดพารามิเตอร์ (เช่นพารามิเตอร์ที่กำหนดว่าจะตัดแต่งเท่าใด) พารามิเตอร์นี้สามารถเลือกได้โดยวิธีการที่ขับเคลื่อนด้วยข้อมูล (เช่นดูว่าหางมีขนาดใหญ่เพียงใดก่อนเลือกพารามิเตอร์การตัดแต่ง) แต่การเลือกพารามิเตอร์การตัดแต่งก่อนส่งผลกระทบต่อการกระจายของค่าเฉลี่ยที่ถูกตัดแทนที่จะเปรียบเทียบกฎการแก้ไขแบบพารามิเตอร์ วิธีปกติในการจัดการกับวรรณกรรมนั้นคือผ่าน bootstrap
โคลิน T Bowers

@ColinTBowers - อาจมีประโยชน์บ้างขอบคุณ ไม่ได้คิดเกี่ยวกับความเป็นไปได้ของ bootstrapping
Glen_b -Reinstate Monica

1
เป็นเรื่องที่น่าสนใจที่จะแยกแยะปัญหาออกเป็นกรณีที่ง่ายที่สุด ลองนึกภาพบางสิ่งเช่นการสังเกตเพียง 5 ข้อจากการกระจายที่คุณโปรดปรานและวางตัวแบ่งเดียวไว้ในข้อมูลเพื่อสร้างเพียงสองถังขยะ
zkurtz

คำตอบ:


15

ผลการพื้นฐานของการทดสอบความดีของพอดีไคสแควร์สามารถเข้าใจลำดับชั้น

ระดับ 0 สถิติทดสอบไคสแควร์ของเพียร์สันเพียร์สันสำหรับการทดสอบกลุ่มตัวอย่างแบบหลายตัวอย่างกับเวกเตอร์ความน่าจะเป็นคงที่คือ X 2 ( p ) = k i = 1 ( X ( n ) i - n p i ) 2p ที่ X ( n )ฉันหมายถึงจำนวนของผลลัพธ์ในฉันเซลล์ TH ออกของกลุ่มตัวอย่างที่มีขนาดn นี่สามารถดูได้ผลเป็นบรรทัดฐานกำลังสองของเวกเตอร์ Y n = ( Y ( n ) 1 , , Y ( n ) k )โดยที่ Y ( n ) i = ( X ( n ) i - n p i ) /

X2(p)=i=1k(Xi(n)npi)2npidχk12,
Xi(n)inYn=(Y1(n),,Yk(n))ซึ่งโดยทฤษฎีบทขีด จำกัด กลางหลายตัวแปรมาบรรจบกันในการแจกแจงเมื่อ y n d N(0,I-Yผม(n)=(Xผม(n)-nพีผม)/nพีผม จากนี้เราจะเห็นว่า X 2 = Y n 2χ 2 k - 1ตั้งแต่ I -
Yndยังไม่มีข้อความ(0,ผม-พีพีT).
X2=Yn2χk12เป็น idempotent ยศk-1IppTk1

ระดับ 1 ในระดับถัดไปของลำดับชั้นเราจะพิจารณาสมมุติฐานเชิงประกอบพร้อมตัวอย่างหลายตัวอย่าง เนื่องจากไม่ทราบค่าที่แน่นอนภายใต้สมมติฐานว่างเราจึงต้องประมาณ ถ้าสมมุติฐานว่างประกอบขึ้นและประกอบด้วยส่วนย่อยเชิงเส้นของมิติmดังนั้นการประมาณความน่าจะเป็นสูงสุด (หรือตัวประมาณประสิทธิภาพอื่น ๆ ) ของp iสามารถใช้เป็นตัวประมาณ "plug-in" จากนั้นสถิติ X 2 1 = k Σฉัน= 1 ( X ( n )ฉัน - n Pฉัน) 2pmpi

X12=i=1k(Xi(n)np^i)2np^idχkm12,

λk

ถ้าจำนวนพารามิเตอร์สำหรับการจัดจำหน่ายเป็น (เช่นม. = 1ในกรณีที่ชี้แจง) แล้ว X 2 2 = k Σฉัน= 1 ( X ( n )ใน หน้าฉัน) 2mm=1 ที่นี่หน้าฉันสามารถนำไปเป็น MLEs ของความน่าจะเป็นมือถือคงที่เซลล์ที่รู้จักกันที่สอดคล้องกับการจัดจำหน่ายที่ได้รับที่น่าสนใจ

X22=i=1k(Xi(n)np^i)2np^idχkm12,
p^i

Z1,,ZnFλλχkm12χk12

YnN(0,IpλpλTA(λ))

λA(λ)

YnB(λ^)

YnTBTBYndχk-12,
k

ตัวอย่างเป็นสถิติราว-Robson-Nikulinและสถิติ Dzhaparidze-Nikulin

k1/kผม^J=μ^+σ^ผม0,Jผม0,J=[F-1((J-1)/k),F-1(J/k))

อ้างอิง

  1. ว. วชิรแวนเดอร์ Vaart (2541), สถิติเชิงซ้อน , สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ บทที่ 17 : การทดสอบไคสแควร์

  2. χ2

  3. FC Drost (1989), การทดสอบความดีที่พอดีไคสแควร์ทั่วไปสำหรับโมเดลระดับตำแหน่งเมื่อจำนวนคลาสมีแนวโน้มที่จะไม่มีสิ้นสุด , แอน สถิติฉบับ หมายเลข 17 3, 1285–1300

  4. MS Nikulin, MS (1973), การทดสอบไคสแควร์สำหรับการจัดจำหน่ายอย่างต่อเนื่องกับการเปลี่ยนแปลงและขนาดพารามิเตอร์ , ทฤษฎีความน่าจะเป็นและการประยุกต์ใช้ฉบับ 19, ไม่มี 3, 559–568

  5. KO Dzaparidze และ MS Nikulin (1973), ในการดัดแปลงสถิติมาตรฐานของ Pearson , ทฤษฎีความน่าจะเป็นและการประยุกต์ใช้ , ฉบับที่ 19, ไม่มี 4, 851–853

  6. KC Rao และ DS Robson (1974), สถิติไค - สแควร์สำหรับความดีของการทดสอบแบบพอดีภายในครอบครัวเลขชี้กำลัง , Comm statist เล่ม 3 หมายเลข 12, 1139–1153

  7. N. Balakrishnan, V. Voinov และ MS Nikulin (2013), ความดีแบบ Chi-Squared ของการทดสอบที่พอดีกับการใช้งาน , สื่อวิชาการ


5

ฉันพบคำตอบบางส่วนของคำถามของฉันด้านล่างแล้ว (ฉันยังต้องการให้โบนัสแก่ใครบางคนดังนั้นข้อมูลเพิ่มเติมที่ได้รับการชื่นชม)

χk-พี-12พี χ12kพีχk-พี2χk2พี

อ้างอิง

Moore DS (1971), สถิติ Chi-Square พร้อมขอบเขตเซลล์แบบสุ่ม , Ann. คณิตศาสตร์. สถิติ , ฉบับที่ 42, หมายเลข 1, 147–156

χ2สถิติกับช่วงเวลาตัวแปร , เทคนิคการรายงานครั้งที่ 1แผนกสถิติมหาวิทยาลัยสแตนฟอ

วัตสัน, GS (1957), Theχ2คุณงามความดีของพอดีสำหรับการทดสอบการแจกแจงปกติ , Biometrika , 44 , 336-348

วัตสัน, GS (1958), เปิดχ2คุณงามความดีของพอดีสำหรับการทดสอบการกระจายอย่างต่อเนื่อง , เจรอยัล Statist Soc B , 20 , 44–61

วัตสัน, GS (1959), ผลลัพธ์ล่าสุดบางอย่างในχ2การทดสอบความดีพอดี , ชีวภาพ , 15 , 440-468

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.