แก้ไข: ตั้งแต่การทำโพสต์นี้ผมได้ตามมาด้วยการโพสต์เพิ่มเติมที่นี่
บทสรุปของข้อความด้านล่าง: ฉันกำลังทำงานกับแบบจำลองและได้ลองถดถอยเชิงเส้นการแปลงบ็อกซ์คอคส์และ GAM แต่ยังไม่คืบหน้ามากนัก
ใช้ตอนR
นี้ฉันกำลังทำงานกับแบบจำลองเพื่อทำนายความสำเร็จของผู้เล่นเบสบอลลีกในระดับเมเจอร์ลีก (MLB) ตัวแปรน่ารังเกียจอาชีพชนะเหนือทดแทน (oWAR) เป็นพร็อกซี่สำหรับความสำเร็จในระดับเอ็มและเป็นวัดที่เป็นผลรวมของผลงานที่น่ารังเกียจสำหรับการเล่นผู้เล่นที่มีส่วนเกี่ยวข้องในช่วงอาชีพของเขาทุกคน (รายละเอียดที่นี่ - http : //www.fangraphs.com/library/misc/war/) ตัวแปรอิสระคือคะแนนความไม่พอใจเล็กน้อยในลีกที่มีคะแนน z สำหรับสถิติที่คิดว่าเป็นตัวทำนายที่สำคัญของความสำเร็จในระดับเมเจอร์ลีกรวมถึงอายุ (ผู้เล่นที่ประสบความสำเร็จมากกว่าในวัยเยาว์มีแนวโน้มที่จะเป็นกลุ่มเป้าหมายที่ดีกว่า) ], อัตราการเดิน [BBrate] และการผลิตที่ปรับปรุงแล้ว (การวัดทั่วโลกของการผลิตที่น่ารังเกียจ) นอกจากนี้เนื่องจากมีลีกย่อยหลายระดับฉันจึงได้รวมตัวแปรจำลองสำหรับระดับการเล่นของลีกย่อย (Double A, High A, Low A, Rookie และ Short Season กับ Triple A [ระดับสูงสุดก่อนลีกใหญ่]] เป็นตัวแปรอ้างอิง]) หมายเหตุ: ฉันได้ปรับขนาด WAR ใหม่ให้เป็นตัวแปรที่เปลี่ยนจาก 0 เป็น 1
ตัวแปร scatterplot มีดังนี้:
สำหรับการอ้างอิงตัวแปรที่อ้างถึง oWAR มีพล็อตต่อไปนี้:
ฉันเริ่มต้นด้วยการถดถอยเชิงเส้นoWAR = B1zAge + B2zSOPct + B3zBBPct + B4zAdjProd + B5DoubleA + B6HighA + B7LowA + B8Rookie + B9ShortSeason
และได้รับแผนการวินิจฉัยต่อไปนี้:
มีปัญหาที่ชัดเจนเกี่ยวกับการขาดความเป็นกลางและไม่มีความแตกต่างแบบสุ่ม นอกจากนี้สารตกค้างไม่ปกติ ผลลัพธ์ของการถดถอยมีดังนี้:
ทำตามคำแนะนำในหัวข้อก่อนหน้านี้ฉันพยายามแปลง Box-Cox โดยไม่ประสบความสำเร็จ ต่อไปฉันลอง GAM โดยใช้ลิงค์บันทึกและได้รับแผนการเหล่านี้:
เป็นต้นฉบับ
พล็อตการวินิจฉัยใหม่
ดูเหมือนว่าเส้นโค้งช่วยให้พอดีกับข้อมูล แต่แผนการวินิจฉัยยังคงแสดงว่าพอดี แก้ไข: ฉันคิดว่าฉันกำลังดูส่วนที่เหลือเทียบกับค่าติดตั้งเดิม แต่ฉันไม่ถูกต้อง พล็อตที่ แต่เดิมแสดงถูกทำเครื่องหมายว่าเป็นต้นฉบับ (ด้านบน) และพล็อตที่ฉันอัปโหลดหลังจากนั้นถูกทำเครื่องหมายเป็นพล็อตการวินิจฉัยใหม่ (เช่นด้านบน)
รุ่นของรุ่นได้เพิ่มขึ้น
แต่ผลลัพธ์ที่เกิดจากคำสั่งgam.check(myregression, k.rep = 1000)
นั้นไม่ได้เป็นสิ่งที่ดี
ใครสามารถแนะนำขั้นตอนต่อไปสำหรับรุ่นนี้ได้บ้าง ฉันยินดีที่จะให้ข้อมูลอื่น ๆ ที่คุณคิดว่าอาจเป็นประโยชน์ในการทำความเข้าใจความคืบหน้าของฉัน ขอบคุณสำหรับความช่วยเหลือที่คุณสามารถให้ได้