ทุกคนที่ติดตามเบสบอลมีโอกาสได้ยินเกี่ยวกับการแสดง MVP นอกสมัยของ Jose Bautista ของโตรอนโต ในสี่ปีก่อนหน้านี้เขามีการวิ่งกลับบ้าน 15 ครั้งต่อฤดูกาล ปีที่แล้วเขาตี 54 ได้มีผู้เล่นมากกว่า 12 คนในประวัติศาสตร์เบสบอล
ในปี 2010 เขาได้รับเงิน 2.4 ล้านและเขาขอให้ทีม 10.5 ล้านคนในปี 2011 พวกเขาเสนอเงิน 7.6 ล้าน หากเขาสามารถทำซ้ำได้ในปี 2554 เขาจะมีมูลค่าทั้งสองอย่างง่ายดาย แต่โอกาสของเขาคือการทำซ้ำ? เราจะคาดหวังได้ยากแค่ไหนที่เขาจะถดถอย เราคาดหวังว่าการแสดงของเขาจะเกิดขึ้นได้เท่าไหร่เพราะโอกาส? เราคาดหวังได้อย่างไรว่ายอดรวม 2010 ที่ปรับแล้วของเขาการถดถอยจะเป็นอย่างไร ฉันจะทำงานออกมาได้อย่างไร
ฉันได้เล่นกับฐานข้อมูลเบสบอล Lahman และบีบเคียวรีที่ส่งคืนผลรวมการวิ่งกลับบ้านสำหรับผู้เล่นทั้งหมดในห้าฤดูกาลก่อนหน้านี้ซึ่งมีค้างคาวอย่างน้อย 50 ตัวต่อฤดูกาล
ตารางมีลักษณะเช่นนี้ (สังเกตเห็น Jose Bautista ในแถวที่ 10)
first last hr_2006 hr_2007 hr_2008 hr_2009 hr_2010
1 Bobby Abreu 15 16 20 15 20
2 Garret Anderson 17 16 15 13 2
3 Bronson Arroyo 2 1 1 0 1
4 Garrett Atkins 29 25 21 9 1
5 Brad Ausmus 2 3 3 1 0
6 Jeff Baker 5 4 12 4 4
7 Rod Barajas 11 4 11 19 17
8 Josh Bard 9 5 1 6 3
9 Jason Bartlett 2 5 1 14 4
10 Jose Bautista 16 15 15 13 54
และผลการเต็มรูปแบบ (232 แถว) มีให้บริการที่นี่
ฉันไม่รู้ว่าจะเริ่มจากตรงไหน ใครช่วยชี้ฉันในทิศทางที่ถูกต้องได้ไหม บางทฤษฎีที่เกี่ยวข้องและคำสั่ง R จะเป็นประโยชน์อย่างยิ่ง
ขอบคุณมาก
ทอมมี่
หมายเหตุ: ตัวอย่างมีการวางแผนเล็กน้อย การวิ่งกลับบ้านนั้นไม่ใช่ตัวบ่งชี้ที่ดีที่สุดสำหรับมูลค่าของผู้เล่นและผลรวมของการวิ่งกลับบ้านนั้นไม่ได้พิจารณาถึงจำนวนโอกาสที่แตกต่างกันในแต่ละฤดูกาลที่ผู้โจมตีมีโอกาสตีวิ่งกลับบ้าน และไม่ได้สะท้อนว่าผู้เล่นบางคนเล่นในสนามกีฬาที่เป็นที่นิยมมากขึ้นและบ้านโดยเฉลี่ยในลีกนั้นเปลี่ยนไปทุกปี อื่น ๆ หากฉันสามารถเข้าใจทฤษฎีที่อยู่เบื้องหลังการบัญชีสำหรับการถดถอยถึงค่าเฉลี่ยฉันสามารถใช้มันกับมาตรการที่เหมาะสมกว่า HRs