อะไรคือข้อดีของการลดขนาดของตัวทำนายสำหรับวัตถุประสงค์ของการถดถอย


11

แอปพลิเคชันหรือข้อดีของการลดขนาดแบบถดถอย (DRR) หรือเทคนิคการลดขนาดแบบมิติ (SDR) ภายใต้เทคนิคแบบการถดถอยแบบดั้งเดิม (ไม่มีการลดขนาดแบบมิติ) คืออะไร? ระดับเทคนิคเหล่านี้ค้นหาการแทนค่ามิติต่ำของชุดคุณลักษณะสำหรับปัญหาการถดถอย ตัวอย่างของเทคนิคดังกล่าว ได้แก่ การถดถอยแบบผกผันแบบแบ่งส่วน, วิธีการหลักของ Hessian, การประมาณค่าความแปรปรวนเฉลี่ยแบบแบ่งส่วน, การถดถอยแบบผกผันเคอร์เนลแบบเคอร์เนล, การถดถอยส่วนประกอบหลักเป็นต้น

  1. ในแง่ของ RMSE ที่ผ่านการตรวจสอบความถูกต้องแล้วหากอัลกอริทึมทำงานได้ดีขึ้นในงานการถดถอยโดยไม่ลดมิติใด ๆ แล้วการใช้มิติลดจริงสำหรับการถดถอยคืออะไร? ฉันไม่เข้าใจเทคนิคเหล่านี้

  2. เทคนิคเหล่านี้มีโอกาสใช้เพื่อลดความซับซ้อนของพื้นที่และเวลาสำหรับการถดถอยหรือไม่? หากเป็นข้อได้เปรียบหลักทรัพยากรบางอย่างเกี่ยวกับการลดความซับซ้อนสำหรับชุดข้อมูลมิติสูงเมื่อใช้เทคนิคนี้จะมีประโยชน์ ฉันถกเถียงเรื่องนี้กับข้อเท็จจริงที่ว่าการใช้เทคนิค DRR หรือ SDR นั้นต้องใช้เวลาและพื้นที่ SDR / DRR + Regression นี้บนชุดข้อมูลที่มีความสลัวต่ำกว่าเร็วกว่าเฉพาะชุดข้อมูลที่มีความสลัวสูงหรือไม่

  3. การตั้งค่านี้ได้รับการพิจารณาจากความสนใจเชิงนามธรรมเท่านั้นและไม่มีแอปพลิเคชันที่ใช้งานได้จริงหรือไม่?

ตามความคิดด้านข้าง: บางครั้งมีข้อสันนิษฐานว่าการกระจายตัวของคุณสมบัติและการตอบสนองอยู่บนความหลากหลาย มันทำให้รู้สึกถึงการเรียนรู้หลากหลายจากตัวอย่างที่สังเกตในบริบทนี้สำหรับการแก้ปัญหาการถดถอยYXY


1
คุณพูดคุยเกี่ยวกับการเรียนรู้ที่หลากหลายเพื่อให้โพสต์บล็อกต่อไปนี้อาจช่วยได้: normaldeviate.wordpress.com/2012/09/08/hunting-for-manifolds
kjetil b halvorsen

คำตอบ:


5

ตามสมมติฐานที่หลากหลายข้อมูลจะถูกสมมติว่าอยู่บนท่อร่วมที่มีมิติต่ำความหมายที่เหลือคือเสียงดังนั้นหากคุณทำการลดขนาดอย่างถูกต้องคุณควรปรับปรุงประสิทธิภาพโดยการสร้างแบบจำลองสัญญาณแทนเสียงรบกวน มันไม่ใช่แค่คำถามเกี่ยวกับพื้นที่และความซับซ้อน


แต่ฉันไม่เห็นเทคนิคเช่น SIR ทำได้ดีขึ้นหลังจากการลดขนาดบนพื้นฐานที่แข็งแกร่ง แก้ไขให้ถูกต้องหากฉันผิดหรือถ้าคุณรู้เทคนิค SDR / DDR ที่สามารถค้นหาสัญญาณนี้ได้ดีขึ้นในการตั้งค่าการถดถอยให้ฉันรู้ว่าเทคนิค (ชื่อ) มันคืออะไร
ได้ยิน

แน่นอนว่ามันขึ้นอยู่กับอัลกอริธึมการถดถอยและมิติภายในของข้อมูล ฉันไม่สามารถพูดให้ SIR เป็นพิเศษได้ แต่นี่เป็นบทความที่เปรียบเทียบอัลกอริธึมการถดถอยที่หลากหลายในชุดข้อมูล MNIST ซึ่งมีมิติต่ำ บางทีคุณอาจแบ่งปันข้อมูลที่มีปัญหาบางอย่างเพื่อให้ผู้คนสามารถแยกแยะได้
เอ็ม

"สมมติฐานที่หลากหลาย" คืออะไร?
อะมีบา

1
สมมติฐานว่าข้อมูลมิติสูงมีแนวโน้มที่จะโกหกในบริเวณใกล้เคียงของนานามิติต่ำ
เอ็ม

ฉันสงสัยว่าสิ่งนี้คล้ายกับโครงข่ายประสาทและการวัดหลายมิติแบบไม่เชิงเส้นตรงที่มัน "ฟังดูเหมือน" มันน่าจะดีในทุกที่ แต่ในทางปฏิบัติมันทำได้ดีในกรณีที่ จำกัด มากขึ้น
shadowtalker

6

วัตถุประสงค์ของการลดขนาดในการถดถอยคือการทำให้เป็นปกติ

เทคนิคส่วนใหญ่ที่คุณระบุไว้ไม่เป็นที่รู้จัก ฉันไม่เคยได้ยินเกี่ยวกับสิ่งเหล่านี้นอกเหนือจากการวิเคราะห์ส่วนประกอบหลัก (PCR) ดังนั้นฉันจะตอบกลับเกี่ยวกับ PCR แต่คาดว่าจะใช้กับเทคนิคอื่นเช่นกัน

คำสองคำที่สำคัญที่นี่มีการoverfittingและกู สำหรับการรักษาระยะยาวและการอภิปรายฉันแนะนำคุณให้รู้จักกับ องค์ประกอบของการเรียนรู้ทางสถิติแต่สั้น ๆ จะเกิดอะไรขึ้นถ้าคุณมีตัวทำนายจำนวนมาก ( ) และตัวอย่างไม่เพียงพอ ( ) คือการถดถอยมาตรฐานจะเหมาะสมกับข้อมูลมากเกินไปสร้างแบบจำลองที่ดูเหมือนว่าจะมีประสิทธิภาพที่ดีในชุดฝึกอบรม แต่จริงๆแล้วมีประสิทธิภาพต่ำในชุดทดสอบใด ๆnpn

ในตัวอย่างมากเมื่อจำนวนของการพยากรณ์เกินกว่าจำนวนของกลุ่มตัวอย่าง (คนเรียกมันว่าจะปัญหา) คุณสามารถจริงอย่างสมบูรณ์แบบพอดีตัวแปรตอบสนองบรรลุดูเหมือนผลการดำเนินงาน นี่เป็นเรื่องไร้สาระอย่างชัดเจนY 100 %p>ny100%

เพื่อจัดการกับ overfitting หนึ่งต้องใช้normalizationและมีมากมาย normalization กลยุทธ์ ในบางวิธีเราพยายามลดจำนวนผู้ทำนายอย่างมากลดปัญหาให้กับสถานการณ์จากนั้นใช้การถดถอยมาตรฐาน นี่คือสิ่งที่การถดถอยองค์ประกอบหลักทำ โปรดดูองค์ประกอบส่วน 3.4--3.6 PCR นั้นมักจะไม่ดีพอและโดยส่วนใหญ่แล้ววิธีการทำให้เป็นมาตรฐานอื่น ๆ จะทำงานได้ดีกว่า แต่ก็ง่ายที่จะเข้าใจและตีความpn

โปรดทราบว่า PCR นั้นไม่ได้เป็นไปตามอำเภอใจเช่นกัน (เช่นการรักษาขนาดไว้โดยสุ่ม เหตุผลนี้เป็นเพราะ PCR เชื่อมต่ออย่างใกล้ชิดกับสันเขาถดถอยซึ่งเป็น regularizer การหดตัวมาตรฐานที่เป็นที่รู้จักกันว่าทำงานได้ดีในหลายกรณี ดูคำตอบของฉันที่นี่เพื่อเปรียบเทียบ: ความสัมพันธ์ระหว่างการถดถอยสันเขาและ PCA ถดถอยp

หากต้องการดูประสิทธิภาพเพิ่มขึ้นเมื่อเทียบกับการถดถอยมาตรฐานคุณต้องมีชุดข้อมูลที่มีตัวทำนายจำนวนมากและตัวอย่างไม่มากนักและคุณจำเป็นต้องใช้การตรวจสอบความถูกต้องข้ามหรือชุดการทดสอบอิสระอย่างแน่นอน หากคุณไม่เห็นประสิทธิภาพเพิ่มขึ้นชุดข้อมูลของคุณอาจมีขนาดไม่เพียงพอ

หัวข้อที่เกี่ยวข้องกับคำตอบที่ดี:


1
รับสิ่งพิมพ์ของเขามันปลอดภัยที่จะถือว่าเขารู้เรื่องนี้
Emre

ขอบคุณ @Emre ฉันไม่รู้ว่าใครเป็น OP ฉันอาจเข้าใจผิดคำถาม แต่หลังจากอ่านใหม่ตอนนี้ฉันไม่เห็นว่าฉันสามารถตีความมันแตกต่างกันอย่างไร หากมีการขอให้สิ่งที่เป็นประโยชน์ในทางปฏิบัติของ PCR แล้วคำตอบคือกู; PCR มีความสัมพันธ์อย่างใกล้ชิดกับการถดถอยของสันเขาซึ่งเป็นหนึ่งในวิธีการทำให้เป็นมาตรฐาน
อะมีบา

p>n

@ssdecontrol: ฉันเห็นด้วย ฉันคิดว่าฉันทามติคือ PCR นั้นไม่ค่อยมีการแข่งขันและเกือบจะมีวิธีที่ดีกว่าเสมอ นี่คือสิ่งที่ฉันเขียนไว้ในคำตอบของฉัน (ไม่ใช่ฉัน?) แต่คำถามนั้นเกี่ยวกับการลดขนาดของตัวทำนายและเกี่ยวกับจุดประสงค์ของมัน คำตอบของฉันคือวัตถุประสงค์คือการทำให้เป็นมาตรฐาน
อะมีบา

เข้าใจ แต่ฉันคิดว่าเราสามารถยอมรับได้ว่าคำถามนั้นถูกโหลดมาโดยเฉพาะเพื่อท้าทายประโยชน์ของมันเนื่องจากมันไม่ใช่วิธีที่ดีที่สุดในการทำให้เป็นปกติแม้จะมีการอุทธรณ์ที่ใช้งานง่าย
shadowtalker
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.