ฉันได้รับจากการโพสต์อื่น ๆ ว่าไม่มีความสำคัญ 'ความสำคัญ' หรือ 'ความสำคัญ' เพื่อทำนายตัวแปรที่เข้าสู่แบบจำลองเชือกเนื่องจากการคำนวณค่า p หรือค่าเบี่ยงเบนมาตรฐานของตัวแปรเหล่านั้นยังคงทำงานอยู่
ภายใต้การใช้เหตุผลนั้นถูกต้องหรือไม่ที่จะยืนยันว่าไม่สามารถพูดได้ว่าตัวแปรที่ถูกแยกออกจากตัวแบบเชือกเป็น 'ไม่เกี่ยวข้อง' หรือ 'ไม่สำคัญ'?
ถ้าเป็นเช่นนั้นฉันสามารถเรียกร้องอะไรได้บ้างเกี่ยวกับตัวแปรที่ถูกแยกออกหรือรวมไว้ในแบบจำลองเชือก ในกรณีเฉพาะของฉันฉันเลือกแลมบ์ดาพารามิเตอร์การปรับแต่งโดยทำซ้ำการตรวจสอบความถูกต้องข้าม 10 เท่า 100 ครั้งเพื่อลด randonmess และเฉลี่ยโค้งข้อผิดพลาด
UPDATE1: ฉันได้ทำตามคำแนะนำด้านล่างและเรียกใช้ lasso อีกครั้งโดยใช้ตัวอย่าง bootstrap ฉันได้ไปกับตัวอย่าง 100 รายการ (จำนวนนั้นเป็นสิ่งที่พลังคอมพิวเตอร์ของฉันสามารถจัดการข้ามคืนได้) และรูปแบบบางอย่างก็ปรากฏ 2 ใน 41 ตัวแปรของฉันเข้าสู่โมเดลมากกว่า 95% ของเวลา, 3 ตัวแปรมากกว่า 90% และ 5 ตัวแปรมากกว่า 85% ตัวแปร 5 ตัวนั้นเป็นหนึ่งใน 9 ที่เข้าสู่แบบจำลองเมื่อฉันรันด้วยตัวอย่างดั้งเดิมและเป็นตัวแปรที่มีค่าสัมประสิทธิ์สูงสุดแล้ว หากฉันใช้บ่วงบาศพร้อมกับตัวอย่าง bootstrap 1,000 ตัวอย่างและรูปแบบเหล่านั้นได้รับการดูแลรักษาสิ่งที่จะเป็นวิธีที่ดีที่สุดในการนำเสนอผลลัพธ์ของฉันคืออะไร
ตัวอย่างบูต 1,000 อันมีเสียงดังเพียงพอหรือไม่ (ขนาดตัวอย่างของฉันคือ 116)
ฉันควรแสดงรายการตัวแปรทั้งหมดและความถี่ที่พวกเขาเข้าสู่แบบจำลองแล้วยืนยันว่าสิ่งที่ป้อนบ่อยขึ้นมีแนวโน้มที่จะมีความหมายมากกว่า?
นั่นคือเท่าที่ฉันสามารถไปกับการเรียกร้องของฉันได้อย่างไร เพราะมันเป็นงานที่อยู่ระหว่างดำเนินการ (ดูด้านบน) ฉันไม่สามารถใช้ค่าการตัดได้ใช่ไหม
UPDATE2: ทำตามคำแนะนำด้านล่างฉันได้คำนวณสิ่งต่อไปนี้: โดยเฉลี่ยแล้ว 78% ของตัวแปรในรูปแบบเดิมป้อนรุ่นที่สร้างขึ้นสำหรับตัวอย่าง bootstrap 100 ตัวอย่าง ในทางกลับกันเพียง 41% สำหรับวิธีอื่น ๆ สิ่งนี้จะต้องทำในส่วนที่ดีกับความจริงที่ว่ารูปแบบที่สร้างขึ้นสำหรับตัวอย่าง bootstrap มีแนวโน้มที่จะรวมตัวแปรมากขึ้น (17 โดยเฉลี่ย) กว่ารุ่นเดิม (9)
Update3: ถ้าคุณจะช่วยฉันในการแปลผลที่ฉันได้รับจากความร่วมมือและการจำลอง Monte Carlo, โปรดดูได้ที่นี้โพสต์อื่น ๆ