B-Splines VS พหุนามลำดับสูงในการถดถอย


10

ฉันไม่มีตัวอย่างหรืองานเฉพาะในใจ ฉันเพิ่งใหม่ในการใช้ b-splines และฉันต้องการทำความเข้าใจกับฟังก์ชันนี้ในบริบทการถดถอย

สมมติว่าเราต้องการที่จะประเมินความสัมพันธ์ระหว่างตัวแปรตอบสนองและพยากรณ์บางx 1 , x 2 , . . , xพี ตัวทำนายประกอบด้วยตัวแปรตัวเลขบางตัวและตัวแปรบางตัวyx1,x2,...,xp

สมมติว่าหลังจากปรับโมเดลการถดถอยแล้วหนึ่งในตัวแปรตัวเลขเช่นนั้นมีความสำคัญ ตรรกะขั้นตอนหลังจากนั้นคือการประเมินว่าคำสั่งชื่อพหุนามที่สูงขึ้นเช่น: x 2 1และx 3 1จะต้องอธิบายความสัมพันธ์อย่างเพียงพอโดยไม่ต้อง overfittingx1x12x13

คำถามของฉันคือ:

  1. คุณเลือกจุดไหนระหว่าง b-splines หรือพหุนามคำสั่งที่สูงขึ้นอย่างง่าย เช่นใน R:

    y ~ poly(x1,3) + x2 + x3
    

    VS

     y ~ bs(x1,3) + x2 + x3
    
  2. คุณจะใช้พล็อตเพื่อแจ้งการเลือกระหว่างสองสิ่งนี้กับสิ่งที่เกิดขึ้นได้อย่างไรหากไม่ชัดเจนจากพล็อต (เช่น: เนื่องจากจุดข้อมูลจำนวนมาก)

  3. คุณจะประเมินเงื่อนไขการโต้ตอบแบบสองทางระหว่างและสมมุติว่าx 3x2x3

  4. การเปลี่ยนแปลงด้านบนสำหรับรุ่นที่แตกต่างกันอย่างไร

  5. คุณจะพิจารณาที่จะไม่ใช้ชื่อพหุนามที่มีลำดับสูงและปรับ b-splines และลงโทษความยืดหยุ่นสูงเสมอหรือไม่


9
ฉันเขียนเกี่ยวกับเรื่องนี้อย่างกว้างขวางที่นี่: madrury.github.io/jekyll/update/statistics/2017/08/04/4 ...
Matthew Drury

เมื่อพิจารณาถึงการพัฒนาที่ดีmgcvทำไมไม่ใช้โมเดลเสริมทั่วไป การเลือกความนุ่มนวลเป็นไปโดยอัตโนมัติและวิธีการอนุมานนั้นได้รับการพัฒนาอย่างดี
generic_user

คำตอบ:


17

ฉันมักจะพิจารณา Splines มากกว่าพหุนาม พหุนามไม่สามารถสร้างแบบจำลองเกณฑ์และมักจะเป็นโลกที่ไม่พึงปรารถนาเช่นการสังเกตในช่วงหนึ่งของการทำนายมีอิทธิพลอย่างมากต่อสิ่งที่แบบจำลองนั้นทำในช่วงที่แตกต่างกัน ( Magee, 1998, สถิติอเมริกันและกลยุทธ์การถดถอยแบบจำลองของ Frank Harrell ) และแน่นอนว่าเส้นโค้งที่ จำกัด ซึ่งเป็นเส้นตรงนอกนอตสุดขั้วนั้นดีกว่าสำหรับการคาดการณ์หรือแม้แต่การคาดการณ์ที่ค่าที่สุดของตัวทำนาย

กรณีหนึ่งที่คุณอาจต้องการพิจารณาชื่อพหุนามคือเมื่อมีความสำคัญที่จะต้องอธิบายแบบจำลองของคุณต่อผู้ชมที่ไม่ใช้เทคนิค ผู้คนเข้าใจชื่อพหุนามดีกว่าเส้นโค้ง (แก้ไข: แมทธิวดรูรี่ชี้ให้เห็นว่าผู้คนอาจคิดว่าพวกเขาเข้าใจชื่อพหุนามดีกว่าเส้นโค้งฉันจะไม่เข้าข้างคำถามนี้)

พล็อตมักไม่ค่อยมีประโยชน์ในการตัดสินใจระหว่างวิธีต่างๆในการจัดการกับความไม่เชิงเส้น ดีกว่าที่จะทำการตรวจสอบข้าม สิ่งนี้จะช่วยให้คุณประเมินการโต้ตอบหรือหาบทลงโทษที่ดี

ในที่สุดคำตอบของฉันจะไม่เปลี่ยนแปลงตามประเภทของโมเดลเนื่องจากคะแนนด้านบนใช้ได้กับสถิติหรือ ML รุ่นใด ๆ


ขอบคุณมากสำหรับคำตอบของคุณมันมีประโยชน์มาก เป็นคำถามติดตามอย่างรวดเร็ว มีวิธี "ทันสมัยของศิลปะ" ในการค้นหาเงื่อนหรือไม่ การคาดเดาที่ดีที่สุดของฉันคือ 1) ใช้สัญชาตญาณเช่น: ถ้าตัวแปรแสดงเวลาในรูปของเดือนให้ใช้นอตทุก 6 หรือ 12 2) แนะนำลำดับที่ผ่านช่วงของตัวแปรและใช้การตรวจสอบความถูกต้องเพื่อค้นหา knots ที่ดีที่สุดหรือไม่?
Vasilis Vasileiou

8
ผู้คนคิดว่าพวกเขาเข้าใจพหุนามดีกว่าเส้นโค้ง
Matthew Drury

3
เกี่ยวกับการจัดวางปม: การตรวจสอบไขว้เป็นวิธีการหนึ่ง แต่ตามจริงแล้วฉันคิดว่าผลลัพธ์จะไม่มีความรู้สึกที่ค่อนข้างจะรู้ตำแหน่งตราบใดที่นอตถูกวางอย่างสมเหตุสมผลและไม่รวมกลุ่มกันมากเกินไป แฟรงก์ฮาร์เรลมีตารางที่มีตำแหน่งปมแก้ปัญหาในแง่ของการกระจาย quantiles ทำนายในการถดถอยกลยุทธ์การสร้างแบบจำลอง
เตฟาน Kolassa

1
ในขณะที่คำตอบของคุณใช้ได้อย่างสมบูรณ์ในบริบทนี้ข้อความของคุณแข็งแกร่งมากเมื่อพิจารณาว่ากระบวนการในโลกความจริงจำนวนมากสามารถสร้างแบบจำลองที่ดีขึ้นโดยชื่อพหุนาม
koalo

6

ในหัวข้อ 7.4.5 ของ "องค์ประกอบของการเรียนรู้ทางสถิติ" กล่าวว่าเส้นโค้งมักให้ผลลัพธ์ที่เหนือกว่าการถดถอยแบบพหุนามเพราะ:

  • มันให้ความยืดหยุ่นที่พอดี
  • สร้างการประมาณการที่มีเสถียรภาพมากขึ้น
  • พหุนามสามารถสร้างผลลัพธ์ที่ไม่พึงปรารถนาที่ขอบเขต
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.