ออกจากประเด็นที่ชัดเจนของพลังงานต่ำของไคสแควร์ในสถานการณ์แบบนี้ลองจินตนาการถึงการทดสอบความดีของไคสแควร์สำหรับความหนาแน่นบางส่วนด้วยพารามิเตอร์ที่ไม่ระบุโดยการทำข้อมูล
สำหรับ concreteness สมมุติว่าการแจกแจงเลขชี้กำลังมีค่าเฉลี่ยไม่ทราบและขนาดตัวอย่างเท่ากับ 100
เพื่อให้ได้จำนวนการสังเกตที่คาดหวังต่อ bin จำนวนบัญชีที่เหมาะสมจะต้องมีการบันทึกข้อมูล (เช่นถ้าเราเลือกที่จะวาง 6 bins ต่ำกว่าค่าเฉลี่ยและ 4 ด้านบนนั้นจะยังคงใช้ขอบเขตของฐานข้อมูล) .
แต่การใช้ถังขยะโดยดูจากข้อมูลนี้น่าจะส่งผลต่อการแจกแจงสถิติการทดสอบภายใต้ค่า Null
ฉันได้เห็นการสนทนามากมายเกี่ยวกับความจริงที่ว่า - หากพารามิเตอร์ถูกประเมินโดยความน่าจะเป็นสูงสุดจากข้อมูลที่ถูกทำให้เป็นบ้าเป็นหลัง - คุณเสีย 1 df ต่อพารามิเตอร์โดยประมาณ (ปัญหาย้อนหลังไปถึง Fisher vs Karl Pearson) - แต่ฉันจำไม่ได้ อ่านอะไรก็ได้เกี่ยวกับการค้นหาขอบเขตของตัวถังขยะเองตามข้อมูล (หากคุณประเมินจากข้อมูลที่ไม่ได้รวมดังนั้นด้วย bins การกระจายของสถิติการทดสอบจะอยู่ที่ไหนสักแห่งระหว่างและ a )
การเลือกใช้ถังขยะแบบอิงข้อมูลนี้ส่งผลต่อระดับหรือกำลังสำคัญอย่างมีนัยสำคัญหรือไม่? มีวิธีการบางอย่างที่สำคัญกว่าวิธีอื่น ๆ หรือไม่? หากมีผลมากมันเป็นสิ่งที่หายไปในกลุ่มตัวอย่างขนาดใหญ่หรือไม่?
ถ้ามันมีผลกระทบที่สำคัญนี่จะทำให้การทดสอบแบบไคสแควร์เกิดขึ้นเมื่อพารามิเตอร์ไม่เป็นที่รู้จักเกือบไร้ประโยชน์ในหลาย ๆ กรณี (แม้ว่าจะยังคงได้รับการสนับสนุนในตำราค่อนข้างน้อย) เว้นแต่คุณจะมี -priori ของพารามิเตอร์
การอภิปรายปัญหาหรือตัวชี้ไปยังการอ้างอิง (ควรมีการกล่าวถึงข้อสรุปของพวกเขา) จะเป็นประโยชน์
แก้ไขนอกเหนือจากคำถามหลัก:
มันเกิดขึ้นกับฉันว่ามีวิธีแก้ปัญหาที่เป็นไปได้สำหรับกรณีเฉพาะของเอ็กซ์โพเนนเชียล * (และชุดเครื่องแบบคิดออกมา) แต่ฉันยังสนใจในปัญหาทั่วไปของขอบเขตการเลือกผลกระทบการเลือกเพิ่มเติม
ตัวอย่างเช่นสำหรับเอ็กซ์โพเนนเชียลเราอาจใช้การสังเกตที่เล็กที่สุด (บอกว่าเท่ากับ ) เพื่อให้ได้แนวคิดคร่าวๆว่าจะวางถังขยะอย่างไร (เนื่องจากการสังเกตที่น้อยที่สุดนั้นมีความหมายเป็น ) และ จากนั้นทดสอบความแตกต่างที่เหลือ( ) เพื่อหาเลขชี้กำลัง แน่นอนว่าอาจให้ผลการประเมินแย่มากและด้วยเหตุนี้ตัวเลือกถังขยะที่น่าสงสารแม้ว่าฉันคิดว่าใคร ๆ ก็อาจใช้การโต้เถียงแบบวนซ้ำเพื่อให้การสังเกตสองหรือสามครั้งที่ต่ำที่สุดเพื่อเลือกถังขยะที่สมเหตุสมผล การสังเกตที่เหลืออยู่เหนือสถิติการสั่งซื้อที่เล็กที่สุดที่ใหญ่ที่สุดสำหรับการอธิบาย)n - 1 x i - m μ