ไม่มีใครมีประสบการณ์กับวิธีการเลือกจำนวนขององค์ประกอบหลักที่กระจัดกระจายเพื่อรวมไว้ในแบบจำลองการถดถอยหรือไม่?
ไม่มีใครมีประสบการณ์กับวิธีการเลือกจำนวนขององค์ประกอบหลักที่กระจัดกระจายเพื่อรวมไว้ในแบบจำลองการถดถอยหรือไม่?
คำตอบ:
ในขณะที่ฉันไม่มีความเข้าใจอย่างถ่องแท้เกี่ยวกับคำถามของคุณ แต่ฉันพบบทความวิจัยบางเรื่องซึ่งอาจเป็นที่สนใจของคุณ นั่นคือแน่นอนถ้าผมเข้าใจอย่างถูกต้องว่าคุณกำลังพูดคุยเกี่ยวกับPCA เบาบาง , ถดถอยองค์ประกอบหลักและหัวข้อที่เกี่ยวข้อง ในกรณีนี้นี่คือเอกสาร:
ผลการตรวจสอบความถูกต้องไขว้ถูกใช้เพื่อกำหนดจำนวนมิติที่เหมาะสมที่สุดสำหรับพื้นที่ LSI มิติน้อยเกินไปไม่ได้ใช้ประโยชน์จากพลังการทำนายของข้อมูล ในขณะที่มีหลายมิติมากเกินไป รูปที่ 4 แสดงการกระจายของข้อผิดพลาดเฉลี่ยสำหรับรุ่นที่มีขนาด LSI แตกต่างกัน โมเดลที่มีช่องว่าง LSI สี่มิติให้ทั้งจำนวนข้อผิดพลาดเฉลี่ยน้อยที่สุดและจำนวนข้อผิดพลาดเฉลี่ยน้อยที่สุดดังนั้นโมเดลสุดท้ายจึงถูกสร้างโดยใช้พื้นที่ LSI สี่มิติ
ฉันสามารถโพสต์สำเนาได้หากคุณไม่ได้เป็นสมาชิกของ ieee
นี่คือจากกระดาษที่ฉันเขียนในระดับปริญญาตรี ฉันมีปัญหาที่ฉันต้องตัดสินใจว่าจะใช้มิติข้อมูลจำนวนเท่าใด (Latent Semantic Indexing คล้ายกับ PCA) เพื่อใช้ในโมเดลการถดถอยโลจิสติกของฉัน สิ่งที่ฉันทำคือเลือกตัวชี้วัด (เช่นอัตราความผิดพลาดเมื่อใช้ความน่าจะเป็นที่ตั้งค่าสถานะเป็น. 5) และดูการกระจายตัวของอัตราความผิดพลาดนี้สำหรับรุ่นต่างๆที่ผ่านการฝึกอบรมในมิติที่แตกต่างกัน ฉันเลือกรุ่นที่มีอัตราความผิดพลาดต่ำที่สุด คุณสามารถใช้เมตริกอื่น ๆ เช่นพื้นที่ใต้เส้นโค้ง ROC
คุณสามารถใช้บางอย่างเช่นการถดถอยแบบขั้นตอนเพื่อเลือกจำนวนมิติสำหรับคุณ การถดถอยแบบไหนที่คุณ preforming โดยเฉพาะ?
คุณหมายถึงอะไรโดย sparse btw?