อะไรคือความแตกต่างระหว่างการคาดการณ์“ ในตัวอย่าง” และ“ ไม่อยู่ในตัวอย่าง”?


17

ฉันไม่เข้าใจว่าอะไรคือความแตกต่างระหว่างการทำนาย "ในตัวอย่าง" และ "จากตัวอย่าง" การพยากรณ์ในตัวอย่างใช้ชุดย่อยของข้อมูลที่มีอยู่เพื่อคาดการณ์ค่านอกระยะเวลาการประมาณ การคาดการณ์นอกกลุ่มตัวอย่างใช้ข้อมูลที่มีอยู่ทั้งหมดสิ่ง เหล่านี้ถูกต้องหรือไม่

คำจำกัดความต่อไปนี้ถูกต้องมากโดยเฉพาะถูกต้องหรือไม่

การคาดการณ์ภายในตัวอย่างใช้ชุดย่อยของข้อมูลที่มีอยู่เพื่อคาดการณ์ค่าภายนอกระยะเวลาการประมาณและเปรียบเทียบกับผลลัพธ์ที่ทราบหรือเป็นจริงที่สอดคล้องกัน สิ่งนี้ทำเพื่อประเมินความสามารถของแบบจำลองเพื่อคาดการณ์ค่าที่ทราบ ตัวอย่างเช่นการคาดการณ์ตัวอย่างภายในปี 1980 ถึง 2015 อาจใช้ข้อมูลจากปี 1980 ถึง 2012 เพื่อประเมินโมเดล เมื่อใช้โมเดลนี้ผู้พยากรณ์จะทำนายค่าสำหรับ 2013-2015 และเปรียบเทียบค่าที่คาดการณ์กับค่าที่ทราบจริง การคาดการณ์ไม่อยู่ตัวอย่างจะใช้ข้อมูลที่มีอยู่ทั้งหมดในตัวอย่างเพื่อประเมินโมเดล สำหรับตัวอย่างก่อนหน้าการประมาณจะดำเนินการในช่วงปี 1980-2015 และการคาดการณ์จะเริ่มในปี 2559


คุณช่วยอธิบายบริบทได้ไหม คำตอบที่คุณให้ไว้สำหรับคำถามของคุณดูเหมือนจะเป็นจริง แต่คำศัพท์อาจมีความเฉพาะเจาะจง
IWS

คุณได้คำจำกัดความเหล่านั้นมาจากที่ใด
gung - Reinstate Monica

ในตัวอย่างคือข้อมูลที่คุณรู้ในเวลาที่ modell builing และคุณใช้ในการสร้างแบบจำลองนั้น ตัวอย่างออกมาเป็นข้อมูลที่ไม่สามารถมองเห็นได้และคุณจะสร้างการทำนาย / การคาดการณ์เพียงอย่างเดียว ภายใต้สถานการณ์ส่วนใหญ่แบบจำลองจะทำงานได้แย่กว่าตัวอย่างในกรณีที่พารามิเตอร์ทั้งหมดได้รับการสอบเทียบ
Ric

@IWS ฉันได้เพิ่มคำถาม spesific :)
Engin YILMAZ

@Richard โปรดอ่านคำถาม spesific ใหม่ ...
Engin YILMAZ

คำตอบ:


32

โดย "ตัวอย่าง" มันหมายถึงตัวอย่างข้อมูลที่คุณใช้เพื่อให้พอดีกับแบบจำลอง

ครั้งแรก - คุณมีตัวอย่าง
ที่สอง - คุณพอดีกับรูปแบบในตัวอย่าง
ที่สาม - คุณสามารถใช้แบบจำลองสำหรับการพยากรณ์

หากคุณคาดการณ์สำหรับการสังเกตที่เป็นส่วนหนึ่งของตัวอย่างข้อมูล - เป็นการคาดการณ์ในตัวอย่าง

หากคุณคาดการณ์สำหรับการสังเกตที่ไม่ได้เป็นส่วนหนึ่งของตัวอย่างข้อมูล - เป็นการคาดการณ์ที่ไม่อยู่ในกลุ่มตัวอย่าง

ดังนั้นคำถามที่คุณต้องถามตัวเองก็คือ: การสังเกตแบบพิเศษนั้นถูกนำมาใช้เพื่อการประกอบหุ่นจำลองหรือไม่? ถ้ามันถูกใช้สำหรับการปรับโมเดลแล้วการคาดการณ์ของการสังเกตจะเป็นตัวอย่าง ไม่เช่นนั้นจะไม่อยู่ในกลุ่มตัวอย่าง

ถ้าคุณใช้ข้อมูลปี 1990-2013 เพื่อให้พอดีกับแบบจำลองและจากนั้นคุณคาดการณ์สำหรับ 2011-2013 มันเป็นการพยากรณ์ในตัวอย่าง แต่ถ้าคุณใช้ 1990-2010 เพื่อปรับโมเดลให้เหมาะสมและจากนั้นคุณคาดการณ์ 2011-2013 การคาดการณ์ที่ไม่อยู่ในตัวอย่าง


เรามีตัวอย่างตั้งแต่ปี 2533-2556 จากนั้นเราปรับโมเดลให้เข้ากับตัวอย่างจากนั้นเราคาดการณ์ 2011-2013 ว่านี่เป็นตัวอย่างหรือไม่ หรือเรามีตัวอย่างจากปี 1990 ถึง 2013 จากนั้นเราพอดีกับโมเดลปี 1990 ถึง 2010 กับตัวอย่างเราคาดการณ์ 2011-2013 ว่าเป็นตัวอย่างนี้หรือไม่
Engin YILMAZ

ใช่ถ้าคุณใช้ข้อมูล 2533-2556 ให้พอดีกับแบบจำลองและจากนั้นคุณคาดการณ์สำหรับ 2554-2556 มันเป็นการพยากรณ์ในตัวอย่าง - แต่ถ้าคุณใช้ 1990-2010 เพื่อปรับโมเดลให้เหมาะสมและจากนั้นคุณคาดการณ์ 2011-2013 การคาดการณ์ที่ไม่อยู่ในตัวอย่าง
ม้าของกษัตริย์โซโลมอน

3

สมมติว่าในตัวอย่างของคุณคุณมีลำดับของข้อมูล 10 จุด ข้อมูลนี้สามารถแบ่งออกเป็นสองส่วน - เช่นจุดข้อมูล 7 จุดแรกสำหรับการประเมินพารามิเตอร์ของแบบจำลองและจุดข้อมูล 3 จุดถัดไปเพื่อทดสอบประสิทธิภาพของแบบจำลอง การใช้ตัวแบบที่ถูกติดตั้งการคาดการณ์ที่ทำขึ้นสำหรับ 7 จุดข้อมูลแรกจะเรียกว่าการพยากรณ์ในตัวอย่างและที่เหมือนกันสำหรับ 3 จุดสุดท้ายของข้อมูลจะถูกเรียกว่าออกจากการคาดการณ์ตัวอย่าง นี่เป็นแนวคิดเดียวกับการแยกข้อมูลออกเป็นชุดฝึกอบรมและชุดตรวจสอบความถูกต้อง


1

การพยากรณ์ในตัวอย่างคือกระบวนการประเมินความสามารถในการทำนายอย่างเป็นทางการของแบบจำลองที่พัฒนาโดยใช้ข้อมูลที่สังเกตได้เพื่อดูว่าอัลกอริธึมที่มีประสิทธิภาพในการทำซ้ำข้อมูลเป็นอย่างไร มันคล้ายกับชุดการฝึกอบรมในอัลกอริทึมการเรียนรู้ของเครื่องและตัวอย่างนอกนั้นคล้ายกับชุดทดสอบ


คุณให้คำอธิบายสั้น ๆ เกี่ยวกับการคาดการณ์ในตัวอย่าง - คุณสามารถให้สิ่งเดียวกันกับตัวอย่าง (เช่นคำอธิบายสั้น ๆ ไม่ใช่แค่การเปรียบเทียบกับชุดทดสอบ)
ReneBt


-1

ในการพยากรณ์อนุกรมเวลา 'Insample' หมายถึงการฝึกอบรมข้อมูล 'Outsample' หมายถึงข้อมูลการทดสอบ

ในอนุกรมเวลาก่อนอื่นเราสามารถคาดการณ์ผลลัพธ์สำหรับข้อมูล 'Insample' (เช่นรถไฟ) ต่อมาเราสามารถคาดการณ์ผลลัพธ์สำหรับข้อมูล 'ตัวอย่าง' (เช่นการทดสอบ)

model = ARIMA(order = (p,d,q), seasonal_order=(P,D,Q,S))
model.fit(train_data)

train_predictions = model.predict_in_sample()
test_predictions = model.predict(n_periods=len(test_data.index))

predictions = pd.concatenate((train_predictions, test_predictions),axis=0)

ฉันคิดว่าคำตอบของคุณกำลังถูกลดระดับลงเนื่องจากไม่ตอบคำถาม - โดยเฉพาะ "คำจำกัดความต่อไปนี้ถูกต้องมากหรือไม่โดยเฉพาะ" ไม่ได้ adress
Martin Modrák
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.