ฉันใช้โมเดลการถดถอยแบบ LOESS ใน R และฉันต้องการเปรียบเทียบผลลัพธ์ของรุ่นที่แตกต่างกัน 12 แบบด้วยขนาดตัวอย่างที่แตกต่างกัน ฉันสามารถอธิบายรายละเอียดเพิ่มเติมของโมเดลจริง ๆ ได้ถ้ามันช่วยตอบคำถามได้
นี่คือขนาดตัวอย่าง:
Fastballs vs RHH 2008-09: 2002
Fastballs vs LHH 2008-09: 2209
Fastballs vs RHH 2010: 527
Fastballs vs LHH 2010: 449
Changeups vs RHH 2008-09: 365
Changeups vs LHH 2008-09: 824
Changeups vs RHH 2010: 201
Changeups vs LHH 2010: 330
Curveballs vs RHH 2008-09: 488
Curveballs vs LHH 2008-09: 483
Curveballs vs RHH 2010: 213
Curveballs vs LHH 2010: 162
แบบจำลองการถดถอยแบบ LOESS นั้นเหมาะสมกับพื้นผิวที่ตำแหน่ง X และตำแหน่ง Y ของแต่ละสนามเบสบอลถูกใช้ในการทำนายความน่าจะเป็นของการแกว่ง อย่างไรก็ตามฉันต้องการเปรียบเทียบระหว่างทั้ง 12 รุ่น แต่การตั้งค่าช่วงเดียวกัน (เช่นช่วง = 0.5) จะให้ผลลัพธ์ที่แตกต่างกันเนื่องจากมีขนาดตัวอย่างที่หลากหลาย
คำถามพื้นฐานของฉันคือคุณจะกำหนดช่วงของแบบจำลองของคุณได้อย่างไร ช่วงที่สูงขึ้นจะทำให้พอดีพอดีมากขึ้นในขณะที่ช่วงล่างจะจับแนวโน้มได้มากขึ้น แต่จะมีเสียงรบกวนทางสถิติหากมีข้อมูลน้อยเกินไป ฉันใช้ช่วงที่สูงขึ้นสำหรับขนาดตัวอย่างที่เล็กกว่าและช่วงที่ต่ำกว่าสำหรับขนาดตัวอย่างที่ใหญ่กว่า
ฉันควรทำอย่างไร? อะไรคือกฎของหัวแม่มือที่ดีเมื่อตั้งค่าขยายสำหรับแบบจำลองการถดถอย LOESS ใน R ขอบคุณล่วงหน้า!