การเลือกลงโทษที่เหมาะสมที่สุดสำหรับบ่วงบาศ


15

มีผลการวิเคราะห์หรือเอกสารทดลองใด ๆ เกี่ยวกับตัวเลือกที่ดีที่สุดของสัมประสิทธิ์ของระยะเวลาการลงโทษตามความเหมาะสมฉันหมายถึงพารามิเตอร์ที่เพิ่มความน่าจะเป็นในการเลือกแบบจำลองที่ดีที่สุดหรือลดความสูญเสียที่คาดหวังให้น้อยที่สุด ฉันถามเพราะบ่อยครั้งที่มันเป็นไปไม่ได้ที่จะเลือกพารามิเตอร์โดยการตรวจสอบข้ามหรือ bootstrap เพราะทั้งสองกรณีมีปัญหาเป็นจำนวนมากหรือเนื่องจากขนาดของปัญหาในมือ เพียงผลบวกฉันรู้คือ Candes และวางแผนการคัดเลือกตัวแบบใกล้เหมาะโดย1ลด11


2
คุณทราบหรือไม่ว่าเอกสารที่สร้างผลลัพธ์ที่สอดคล้องกันสำหรับเชือก Knight & Fu (2000), Yu & Zhao (2006), และเอกสารต่าง ๆ โดย Meinshausen
พระคาร์ดินัล

ใช่ แต่คำถามของฉันไม่เกี่ยวกับความสอดคล้องเชิงเส้นกำกับซึ่งเป็นหัวข้อของเอกสารที่คุณพูดถึง
gappy

1
เอกสารเหล่านี้คือ (ส่วนใหญ่) เกี่ยวกับการคัดเลือกตัวแบบความสอดคล้องซึ่งผมว่าเป็นมากที่เกี่ยวข้องกับคำถามที่คุณถาม :)
พระคาร์ดินัล

คำตอบ:


2

Y-Y^(λ)22λ=Aσสัญญาณรบกวนเข้าสู่ระบบพีnA>22


นี้ไม่ได้ดูเหมือนจะค่อนข้างพอดีใบเสร็จเนื่องจากต้องการรู้อี ในความเป็นจริงมันเป็นปัญหาตรงนี้ที่สร้างแรงบันดาลใจให้กับสแควร์รูทบ์ ( arxiv.org/pdf/1009.5689.pdf )σnโอผมsอี
user795305

5

ฉันคิดว่าคุณส่วนใหญ่สนใจในการถดถอยเหมือนในเอกสารอ้างอิงและไม่ใช่แอปพลิเคชันอื่น ๆ ของจ่าย (กราฟิก lasso พูด)1

ฉันเชื่อว่าคำตอบบางอย่างสามารถพบได้ในบทความเรื่อง "องศาอิสระ" ของ Zasso และคณะ สั้น ๆ มันให้สูตรการวิเคราะห์สำหรับองศาอิสระที่มีประสิทธิภาพซึ่งสำหรับการสูญเสียข้อผิดพลาดกำลังสองช่วยให้คุณสามารถแทนที่ CV ด้วยสถิติการวิเคราะห์ -type สถิติกล่าวพี

สถานที่ที่ต้องดูอีกแห่งหนึ่งคือในตัวเลือก Dantzig: การประมาณทางสถิติเมื่อ p มีขนาดใหญ่กว่า nและเอกสารการอภิปรายในปัญหาเดียวกันของ Annals of Statistics ความเข้าใจของฉันคือพวกเขาแก้ปัญหาที่เกี่ยวข้องอย่างใกล้ชิดกับการถดถอยแบบ lasso แต่มีค่าสัมประสิทธิ์การลงโทษคงที่ แต่โปรดดูเอกสารการอภิปรายด้วย

หากคุณไม่ได้สนใจในการทำนาย แต่ในการเลือกรูปแบบฉันไม่ได้ตระหนักถึงผลลัพธ์ที่คล้ายกัน การทำนายตัวแบบที่เหมาะสมมักส่งผลให้เกิดตัวแปรที่เลือกมากเกินไปในตัวแบบการถดถอย ในการเลือกกระดาษที่มีเสถียรภาพ Meinshausen และBühlmannนำเสนอเทคนิคการย่อยตัวอย่างมีประโยชน์มากขึ้นสำหรับการเลือกรูปแบบ แต่มันอาจเรียกร้องให้คำนวณตามความต้องการของคุณมากเกินไป


(+1) บทความทั้งสามนี้มีค่าควรอ่านอย่างระมัดระวังสำหรับผู้ที่สนใจในหัวข้อนี้ กระดาษตัวเลือก Dantzig มีคณิตศาสตร์ที่ดีมาก อย่างไรก็ตามฉันไม่เห็นว่ามันจะมีแรงฉุดมากในแอปพลิเคชันและฉันไม่คาดหวัง ฉันคิดว่าเหนือสิ่งอื่นใดเส้นทางการทำให้เป็นระเบียบที่มีเสียงดังมากทำให้ผู้คนกังวลใจและอย่างนั้นโดยไม่มีประโยชน์อย่างชัดเจนต่อบ่วงบาศทำให้มันขายยาก
พระคาร์ดินัล

Hum, โปรดทราบว่าแม้ว่าจำนวนของค่าสัมประสิทธิ์ที่ไม่ใช่ศูนย์สำหรับค่าที่กำหนดของพารามิเตอร์การทำให้เป็นมาตรฐานนั้นเป็นค่าประมาณที่ไม่เอนเอียงสำหรับ DoFs ที่ค่านั้นการประมาณการนี้มีความแปรปรวนสูงมาก
dohmatob

1

ตั้งแต่มีการถามคำถามนี้ความก้าวหน้าที่น่าสนใจได้เกิดขึ้นแล้ว ตัวอย่างเช่นพิจารณาเอกสารนี้

Chichignoud, M. , Lederer, J. , & Wainwright, M. (2016) โครงการที่ใช้งานได้จริงและอัลกอริธึมที่รวดเร็วในการปรับแต่ง Lasso ด้วยการรับประกันที่ดีที่สุด วารสารวิจัยการเรียนรู้ของเครื่อง, 17, 1–17

พวกเขาเสนอวิธีการในการเลือกพารามิเตอร์การปรับแต่ง LASSO พร้อมตัวอย่างไฟไนต์ที่พิสูจน์ได้สำหรับการเลือกรุ่น ดังที่พวกเขากล่าวไว้ในบทความ "สำหรับรูปแบบการสอบเทียบมาตรฐานในหมู่พวกเขาการตรวจสอบข้ามไม่มีการรับรองที่เทียบเคียงกันได้ในวรรณคดีในความเป็นจริงเราไม่ได้ตระหนักถึงการรับประกันตัวอย่าง จำกัด ใด ๆ สำหรับแผนการสอบเทียบมาตรฐาน"


0

สิ่งนี้ไม่ได้ตอบคำถามของคุณ แต่: ในการตั้งค่าข้อมูลขนาดใหญ่อาจปรับจูนเนอร์ปกติโดยใช้การแบ่งรถไฟ / การทดสอบเดียวแทนที่จะทำ 10 ครั้งหรือมากกว่านั้นในการตรวจสอบความถูกต้องข้าม (หรือมากกว่าสำหรับ bootstrap) ขนาดและความเป็นตัวแทนของตัวอย่างที่เลือกสำหรับ devset จะกำหนดความแม่นยำของการประมาณค่าของเครื่องมือปรับสมดุลที่เหมาะสม

จากประสบการณ์ของฉันการสูญเสียที่ถือเอาไว้ค่อนข้างแบนในช่วง regularizer ที่สำคัญ ฉันแน่ใจว่าความจริงข้อนี้อาจไม่ถือเป็นปัญหาอื่น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.