ความครอบคลุมช่วงความเชื่อมั่น 'กับการประมาณการปกติ


21

สมมติว่าฉันพยายามประเมินพารามิเตอร์จำนวนมากจากข้อมูลมิติสูงโดยใช้การประมาณปกติบางประเภท Regularizer แนะนำการตั้งค่าบางอย่างในการประมาณค่า แต่มันก็ยังคงเป็นเรื่องที่ดีเนื่องจากการลดความแปรปรวนควรจะชดเชยให้มากกว่า

ปัญหาเกิดขึ้นเมื่อฉันต้องการประเมินช่วงความมั่นใจ (เช่นใช้ Laplace Approve หรือ bootstrapping) โดยเฉพาะอคติในการประมาณการของฉันนำไปสู่การรายงานข่าวที่ไม่ดีในช่วงความเชื่อมั่นของฉันซึ่งทำให้ยากที่จะกำหนดคุณสมบัติของผู้ประเมินของฉัน

ฉันพบเอกสารบางส่วนที่พูดถึงปัญหานี้ (เช่น"ช่วงความเชื่อมั่นแบบ Asymptotic ในการถดถอยของสันเขาตามการขยายตัวของ Edgeworth" ) แต่คณิตศาสตร์ส่วนใหญ่อยู่เหนือหัวฉัน ในบทความที่เชื่อมโยงสมการ 92-93 ดูเหมือนจะให้ปัจจัยการแก้ไขสำหรับการประมาณที่ถูกทำให้เป็นมาตรฐานโดยการถดถอยของสันเขา แต่ฉันสงสัยว่ามีกระบวนการที่ดีที่จะทำงานกับช่วงของกฎเกณฑ์ต่าง ๆ ได้หรือไม่

แม้แต่การแก้ไขใบสั่งซื้อครั้งแรกก็มีประโยชน์อย่างยิ่ง


4
+1 คำถามที่ทันเวลาและสำคัญ - แม้ว่าฉันไม่แน่ใจว่าใคร ๆ ก็สามารถตอบคำถามนี้ได้ในตอนนี้ (ฉันเดาว่าเราแค่ไม่รู้วิธีการทำอย่างถูกต้องและถ้าฉันรู้ฉันก็มีพงศาวดารสองแห่ง เอกสารสถิติเรียงกัน) คำถามที่เกี่ยวข้อง: stats.stackexchange.com/questions/91462/ …เรารู้ว่าการบูตสแตรปทำได้อย่างหมดจดในสถานการณ์เช่นนี้ แต่นั่นไม่ได้ช่วยอะไร
Momo

ขอบคุณสำหรับลิงค์ คุณช่วยอธิบายสิ่งที่คุณต้องการเกี่ยวกับการบูตสแตรปได้หรือไม่?
David J. Harris

นอกจากนี้ฉันยังคงหวังว่าบางคนอาจมีวิธีการที่ใช้งานได้ดีสำหรับผู้ใช้ประจำที่ไม่กระจัดกระจาย ฉันคิดว่าการลงโทษ L1 ทำให้สิ่งต่าง ๆ เป็นเรื่องยากโดยเฉพาะอย่างยิ่งเนื่องจากการประมาณการทั้งหมดซ้อนขึ้นที่ศูนย์ ขอบคุณอีกครั้ง.
David J. Harris

1
d

1
บทความโดยRuben Dezeure, Peter Bühlmann, Lukas Meier และ Nicolai Meinshausenคือความรู้ที่ดีที่สุดของฉันเกี่ยวกับบัญชีล่าสุดและครอบคลุมเกี่ยวกับการอนุมานในมิติสูง
NRH

คำตอบ:


4

มีที่ผ่านมาเป็นกระดาษที่อยู่ได้อย่างแม่นยำคำถามของคุณ (ถ้าคุณต้องการที่จะดำเนินการถดถอยกับข้อมูลของคุณที่ผมเข้าใจ) และโชคดีที่ยังมีการแสดงออกซึ่งง่ายต่อการคำนวณ (ช่วงความเชื่อมั่นและการทดสอบสมมติฐานสำหรับการถดถอยมิติสูง)

นอกจากนี้คุณอาจสนใจงานล่าสุดโดยPeter Bühlmannในหัวข้อนั้น แต่ฉันเชื่อว่าบทความแรกให้สิ่งที่คุณต้องการและเนื้อหาย่อยง่ายกว่า (ฉันไม่ใช่นักสถิติด้วย)


+1 กระดาษที่น่าสนใจ ดังนั้นจึงปรากฏว่ามีแนวคิดการแข่งขันอย่างน้อยสามวิธีที่จะแก้ไขปัญหาเหล่านี้และจากสิ่งที่ฉันเห็นว่าพวกเขาไม่ได้เกี่ยวข้องอย่างใกล้ชิด จากนั้นก็มีทฤษฎีบทที่เป็นไปไม่ได้จากjournals.cambridge.org/action/ ......จะน่าสนใจที่จะเห็นว่าสิ่งนี้เกิดขึ้นได้อย่างไร
Momo

ขอบคุณ นี่อาจไม่ใช่สิ่งที่ฉันสามารถนำไปใช้ได้จริง แต่ดูเหมือนว่าคณิตศาสตร์จะใช้สำหรับการประเมินตามปกติหลายแบบ
David J. Harris

1

http://cran.r-project.org/web/packages/hdi/index.html

นี่คือสิ่งที่คุณกำลังมองหา?

Description
Computes confidence intervals for the l1-norm of groups of regression parameters in a hierarchical
clustering tree.

ฉันหวังว่าจะมีบางอย่างที่จะทำงานให้กับ regularizers (ส่วนใหญ่ไม่กระจัดกระจาย) ที่หลากหลาย ขอบคุณ
David J. Harris
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.