เกิดอะไรขึ้นกับการคาดการณ์?


68

ฉันจำได้ว่านั่งอยู่ในหลักสูตรสถิติเนื่องจากการได้ยินในระดับปริญญาตรีว่าทำไมการคาดการณ์จึงเป็นความคิดที่ไม่ดี นอกจากนี้ยังมีแหล่งข้อมูลออนไลน์ที่หลากหลายซึ่งแสดงความคิดเห็นเกี่ยวกับเรื่องนี้ นอกจากนี้ยังมีการพูดถึงมันที่นี่นี่

ใครสามารถช่วยฉันเข้าใจว่าทำไมการอนุมานจึงเป็นความคิดที่ไม่ดี ถ้าเป็นเช่นนั้นเทคนิคการพยากรณ์ว่าไม่ถูกต้องทางสถิติอย่างไร


3
@ Firebug Mark Twain มีบางอย่างที่จะพูดเกี่ยวกับเรื่องนี้ ทางเดินที่เกี่ยวข้องจะยกมาใกล้ถึงจุดสิ้นสุดของคำตอบของฉันที่stats.stackexchange.com/a/24649/919
whuber

1
@ โฮเบอร์ฉันคิดว่าไม่ได้คาดการณ์ถึงความคิดเกี่ยวกับมันในตอนนี้ สมมติว่าเราฝึกอบรมและตรวจสอบอัลกอริทึมอย่างถูกต้องเพื่อทำนายข้อมูลหนึ่งสัปดาห์ในฟีเจอร์ ทำการ resampling ที่ถูกต้อง (และการจูนถ้ามี hyperparameters ที่ต้องปรับจูน) จากนั้นฉันไม่สามารถเห็นสิ่งที่ผิดถ้าคุณมีการตอบสนองและคุณควรรู้ถึงความมั่นใจของการตอบสนองนั้น ตอนนี้ถ้าคุณฝึกอัลกอริทึมของคุณในแต่ละสัปดาห์คุณไม่สามารถคาดการณ์ได้ว่าจะทำนายอนาคตหนึ่งปีได้อย่างแม่นยำ ขออภัยในความสับสนที่อาจเกิดขึ้น
Firebug

7
@Firebug ไม่จำเป็นต้องขอโทษ - หมายเหตุของคุณมีข้อมูลที่เป็นประโยชน์ในการชี้แจง เมื่อฉันอ่านพวกเขาพวกเขาแนะนำ "คาดการณ์" สามารถมีการตีความหลายอย่างในการตั้งค่าการพยากรณ์ หนึ่งคือมันเกี่ยวข้องกับ "การคาดการณ์" ของเวลา แต่เมื่อคุณมองไปที่รูปแบบอนุกรมเวลามาตรฐานโดยเฉพาะอย่างยิ่งผู้ที่เวลาไม่ได้เป็นตัวแปรร่วมที่ชัดเจนว่าพวกเขาคาดการณ์ค่าในอนาคตในแง่ของค่าก่อนหน้า เมื่อค่าก่อนหน้าเหล่านั้นยังคงอยู่ในช่วงของค่าก่อนหน้านี้ที่ผ่านมาแบบจำลองไม่มีการประมาณค่าเลย! ในนั้นอาจมีมติของความขัดแย้งที่ชัดเจน
whuber


2
ฉันผิดหวังที่ต้องใช้เวลานานกว่าที่ xkcd จะปรากฏให้เห็น
Duncan X Simpson

คำตอบ:


89

แบบจำลองการถดถอยมักจะใช้สำหรับการประมาณเช่นการทำนายการตอบสนองต่ออินพุตที่อยู่นอกช่วงของค่าของตัวแปรตัวทำนายที่ใช้เพื่อให้พอดีกับแบบจำลอง อันตรายที่เกี่ยวข้องกับการคาดการณ์แสดงไว้ในรูปต่อไปนี้ กราฟแสดงเส้นที่คาดการณ์ขึ้นไปเรื่อย ๆ โดยที่ค่า "true" ลดลง

แบบจำลองการถดถอยคือ“ โดยการสร้าง” แบบจำลองการประมาณค่าและไม่ควรใช้สำหรับการอนุมานนอกเสียจากว่าสิ่งนี้จะได้รับการพิสูจน์อย่างเหมาะสม


1
นี่เป็นตัวอย่างที่น่ากลัวสำหรับการคาดการณ์ เส้นการถดถอยตรงพอดีกับจุดข้อมูลที่ดีกว่าฟังก์ชั่นโค้งที่แท้จริงของคุณ
horaceT

9
"เส้นถดถอยตรงพอดีกับจุดข้อมูลดีกว่าฟังก์ชั่นโค้งจริงของคุณ" คำสั่งนี้เป็นเท็จ RSS สำหรับฟังก์ชั่นการถดถอยที่แท้จริงนั้นมีขนาดเล็กกว่า RSS สำหรับบรรทัดการถดถอยอย่างง่าย
Kostia

จุดที่คุณถ่ายและคุณอาจ (ควร) ถูก แต่การตัดสินจากชุดของคะแนนไม่มีวิธีใดที่จะอนุมานฟังก์ชันที่แท้จริงได้
horaceT

27
เผง และนี่คือเหตุผลที่การคาดการณ์อาจเป็นความคิดที่ไม่ดี
Kostia

"รูปแบบการถดถอยคือ" โดยการสร้าง "โมเดลการแก้ไข" -> ฉันเดาว่าเราสามารถมีปัญหาเดียวกันกับการแก้ไข (แม้ว่าจะมีโอกาสเกิดขึ้นน้อยกว่า)
Metariat

88

การ์ตูน xkcdนี้อธิบายทุกอย่าง

การ์ตูน xkcd

ด้วยการใช้จุดข้อมูล Cueball (ชายที่มีไม้เท้า) ได้เขาคาดการณ์ว่าผู้หญิงจะมีสามี "สี่โหล" ในปลายเดือนหน้าและใช้การอนุมานนี้เพื่อนำไปสู่ข้อสรุปของการซื้อเค้กแต่งงานจำนวนมาก

แก้ไข 3:สำหรับคนที่พูดว่า "เขามีจุดข้อมูลไม่เพียงพอ" นี่เป็นการ์ตูน xkcd อีกเรื่อง :

การ์ตูน xkcd

ที่นี่การใช้คำว่า "ยั่งยืน" เมื่อเวลาผ่านไปจะปรากฏบนพล็อตแบบล็อกและคาดการณ์จุดข้อมูลที่เราได้รับการประเมินที่ไม่สมเหตุสมผลว่าคำว่า "ยั่งยืน" จะเกิดขึ้นบ่อยแค่ไหนในอนาคต

แก้ไข 2:สำหรับผู้ที่พูดว่า "คุณต้องการจุดข้อมูลที่ผ่านมาทั้งหมดด้วย" แต่ยังเป็นการ์ตูน xkcd อีกเรื่อง: การ์ตูน xkcd

ที่นี่เรามีจุดข้อมูลที่ผ่านมาทั้งหมด แต่เราไม่สามารถคาดการณ์ความละเอียดของ Google Earth ได้อย่างแม่นยำ โปรดทราบว่านี่เป็นกราฟกึ่งล็อกด้วย

แก้ไข:บางครั้งความสัมพันธ์ที่แข็งแกร่งที่สุดของ (r = .9979 ในกรณีนี้) ก็ผิดธรรมดา


หากคุณคาดการณ์โดยไม่มีหลักฐานสนับสนุนอื่น ๆ คุณยังละเมิดความสัมพันธ์ไม่ได้หมายความว่าสาเหตุ ; อีกหนึ่งความบาปที่ยิ่งใหญ่ในโลกแห่งสถิติ

อย่างไรก็ตามหากคุณคาดการณ์ X กับ Y คุณต้องตรวจสอบให้แน่ใจว่าคุณสามารถแม่นยำ (เพียงพอที่จะตอบสนองความต้องการของคุณ) ทำนาย X ด้วยY เพียงอย่างเดียวเกือบทุกครั้งมีหลายปัจจัยมากกว่าผลกระทบ X

ฉันต้องการแชร์ลิงก์ไปยังคำตอบอื่นที่อธิบายไว้ในคำพูดของ Nassim Nicholas Taleb


14
xkcd มีเรื่องตลกเกี่ยวกับปัญหาทางคณิตศาสตร์ / สถิติที่เป็นไปได้ที่อาจเกิดขึ้นใช่ไหม?
Ander Biguri

24
ความคิดนี้อาจถูกนำมาใช้เป็นข้อโต้แย้งต่อต้านการสอดแทรก: "เมื่อคืนคุณมีสามี 0.5 คน"
JiK

3
@JiK หากสิ่งที่คุณรู้คือเธอมีหนึ่งตอนนี้และสองวันที่ผ่านมาเธอไม่มีเลยนั่นไม่ใช่การประเมินที่ไม่ดี ;-)
Dennis Jaheruddin

9
ยั่งยืนยั่งยืนยั่งยืนยั่งยืนยั่งยืนยั่งยืนยั่งยืนยั่งยืน en.wikipedia.org/wiki/…
Meni Rosenfeld

1
เพิ่มเติม xkcd, ผู้คน!
noɥʇʎԀʎzɐɹƆ

24

"การทำนายนั้นยากมากโดยเฉพาะอย่างยิ่งถ้ามันเกี่ยวกับอนาคต" คำพูดนั้นมาจากหลายคนในบางรูปแบบอ้างเป็นโทษกับคนจำนวนมากในรูปแบบบางส่วนฉัน จำกัด ใน "การคาดการณ์" ต่อไปนี้กับ "การคาดการณ์นอกช่วงที่รู้จัก" และในการตั้งค่าหนึ่งมิติการคาดการณ์จากอดีตที่รู้จักไปสู่อนาคตที่ไม่รู้จัก

ดังนั้นสิ่งที่ผิดปกติกับการคาดการณ์ ครั้งแรกมันไม่ได้เป็นเรื่องง่ายที่จะสร้างแบบจำลองที่ผ่านมา ประการที่สองเป็นการยากที่จะทราบว่าแบบจำลองจากอดีตสามารถนำไปใช้ในอนาคตได้หรือไม่ได้หรือไม่ เบื้องหลังการยืนยันทั้งสองอยู่คำถามเชิงลึกเกี่ยวกับสาเหตุหรือการยศาสตร์, ความเพียงพอของตัวแปรอธิบาย ฯลฯ ที่ค่อนข้างขึ้นอยู่กับกรณี มีอะไรผิดปกติคือมันเป็นการยากที่จะเลือกโครงร่างการอนุมานเดี่ยวที่ทำงานได้ดีในบริบทที่แตกต่างกันโดยไม่มีข้อมูลพิเศษมากมาย

x

Anscombe สี่

อย่างไรก็ตามการพยากรณ์สามารถแก้ไขเพื่อขยายบาง การเพิ่มไปยังคำตอบอื่น ๆ ส่วนผสมบางอย่างสามารถช่วยให้การคาดการณ์เชิงปฏิบัติ:

  1. nพีพี(n)พีn
  2. คุณสามารถใช้แบบจำลองการคาดการณ์หลายแบบและรวมเข้าด้วยกันหรือเลือกที่ดีที่สุด ( การรวมการคาดการณ์ , J. Scott Armstrong, 2001) เมื่อเร็ว ๆ นี้มีการทำงานหลายอย่างเกี่ยวกับชุดค่าผสมที่เหมาะสม (ฉันอาจให้การอ้างอิงหากจำเป็น)

เมื่อเร็ว ๆ นี้ฉันได้มีส่วนร่วมในโครงการสำหรับการประมาณค่าสำหรับการสื่อสารของระบบย่อยจำลองในสภาพแวดล้อมแบบเรียลไทม์ ความเชื่อในโดเมนนี้คือการคาดการณ์ที่อาจทำให้เกิดความไม่แน่นอน เรารู้ว่าการรวมสองส่วนผสมข้างต้นนั้นมีประสิทธิภาพมากโดยไม่มีความไม่แน่นอนที่เห็นได้ชัด (ยังไม่มีการพิสูจน์อย่างเป็นทางการและอยู่ระหว่างการตรวจสอบ ) และการคาดการณ์นั้นทำงานกับพหุนามอย่างง่ายโดยมีภาระการคำนวณต่ำมากการดำเนินการส่วนใหญ่ที่คำนวณไว้ล่วงหน้าและเก็บไว้ในตารางค้นหา

ในที่สุดเมื่อการคาดการณ์แนะนำการวาดภาพตลกต่อไปนี้คือผลย้อนกลับของการถดถอยเชิงเส้น:

สนุกกับความรักและการถดถอยเชิงเส้น


+1 คำตอบที่ดี ตามเว็บไซต์นี้ดูเหมือนว่าไม่น่าที่โบร์จะกล่าว ดูเหมือนว่าจะเป็นเรื่องธรรมดา แต่เป็นสุภาษิตเดนมาร์กทั่วไป
usεr11852พูดว่า Reinstate Monic

@ usεr11852ไม่น่าเป็นไปได้ที่เขา "เคยพูดอย่างนั้นหรือ" นั่นเป็นเหตุผลที่ฉันพูดว่า "บันทึก" ฉันควรจะระมัดระวังมากกว่านี้หรือไม่
Laurent Duval

2
ฉันไม่เคยพูดส่วนที่เคย ฉันได้แสดงความคิดเห็นนี้เนื่องจากระบุว่าคำพูดดูเหมือนจะเป็นสุภาษิตเดนมาร์กมากขึ้นเนื่องจากมีลักษณะพิเศษ (เป็นสัญลักษณ์อย่างยิ่ง) Dane ดูเหมือนจะมีการเรียกเก็บเงินเกินจริงโดยเฉพาะอย่างยิ่งเนื่องจากไม่มีบันทึกของบอร์ที่พูด ผู้เขียนต้นฉบับอาจเป็นชาวประมงที่ไม่มีชื่อแสดงความคิดเห็นในวันพรุ่งนี้! ฉันหยั่งรากลึกสำหรับผู้ชายตัวเล็ก ๆ ที่นี่! : D
usεr11852พูดว่า Reinstate Monic

2
ยากมากที่จะจำลองตำนานคำพูดที่ผ่านมาเช่นกัน
Laurent Duval

3
แน่นอนว่าคำถามใช้ทั้งสองคำ: ประเด็นทั้งหมดคือว่า "การคาดการณ์" จะต้องได้รับการพิจารณาในรูปแบบของ "การคาดการณ์" ตามความเห็นเบื้องต้นของคุณดูเหมือนว่าคุณจะนิยามการคาดการณ์ว่าใช้อดีตเพื่อ "สร้างอนาคต" จนกว่าคุณจะให้คำจำกัดความที่ชัดเจนและชัดเจนของแต่ละคำตอบของคุณอาจเข้าใจผิด
เสียงหวือ

17

แม้ว่าความพอดีของแบบจำลองอาจจะ " ดี " แต่การคาดการณ์นอกช่วงของข้อมูลจะต้องได้รับการปฏิบัติอย่างไม่น่าเชื่อ เหตุผลก็คือในหลาย ๆ กรณีการคาดการณ์ (น่าเสียดายและหลีกเลี่ยงไม่ได้) อาศัยสมมติฐานที่ไม่สามารถทดสอบได้เกี่ยวกับพฤติกรรมของข้อมูลที่นอกเหนือจากการสนับสนุนที่สังเกตได้

เมื่อคาดการณ์เราต้องใช้วิจารณญาณสองอย่างในการตัดสินใจ: ประการแรกจากมุมมองเชิงปริมาณรูปแบบที่ถูกต้องนั้นอยู่นอกขอบเขตของข้อมูลหรือไม่ ประการที่สองจากมุมมองเชิงคุณภาพความน่าเชื่อถือเป็นประเด็นxโอยูเสื้อ

ข้อแม้เพิ่มเติมคือเทคนิคการประมาณค่าแบบไม่อิงพารามิเตอร์หลายอย่างไม่อนุญาตให้มีการอนุมาน ปัญหานี้จะเห็นได้ชัดโดยเฉพาะอย่างยิ่งในกรณีของการทำให้เส้นโค้งเรียบขึ้นโดยที่ไม่มีปมที่จะยึดเส้นโค้งที่ติดตั้งไว้

ผมขอย้ำว่าการคาดการณ์นั้นห่างไกลจากความชั่วร้าย ตัวอย่างเช่นวิธีการเชิงตัวเลขที่ใช้กันอย่างแพร่หลายในสถิติ (ตัวอย่างเช่นกระบวนการ delta-squared ของ Aitkenร์ของและการคาดการณ์ของริชาร์ดสัน ) เป็นหลักการการคาดการณ์ขึ้นอยู่กับแนวคิดที่ว่าพฤติกรรมพื้นฐานของฟังก์ชันที่วิเคราะห์สำหรับข้อมูลที่สังเกตนั้น


εΔ2

15

ตรงกันข้ามกับคำตอบอื่น ๆ ฉันจะบอกว่าไม่มีอะไรผิดปกติกับการอนุมานเท่าที่มันไม่ได้ใช้อย่างไร้เหตุผล ก่อนอื่นให้สังเกตว่าคาดการณ์คือ :

กระบวนการประเมินนอกเหนือจากช่วงการสังเกตดั้งเดิมค่าของตัวแปรบนพื้นฐานของความสัมพันธ์กับตัวแปรอื่น

... ดังนั้นจึงเป็นคำที่กว้างมากและวิธีการที่แตกต่างกันมากมายตั้งแต่การประมาณเชิงเส้นอย่างง่ายไปจนถึงการถดถอยเชิงเส้นการถดถอยเชิงพหุนามหรือแม้แต่วิธีการพยากรณ์อนุกรมเวลาขั้นสูงบางอย่างที่เหมาะสม ในความเป็นจริงการคาดการณ์การคาดการณ์และการพยากรณ์มีความสัมพันธ์กันอย่างใกล้ชิด ในสถิติเรามักจะทำการคาดการณ์และการคาดการณ์ นี่คือสิ่งที่ลิงค์ที่คุณอ้างถึงพูดว่า:

เราได้รับการสอนตั้งแต่วันที่ 1 ของสถิติว่าการคาดการณ์เป็นสิ่งที่ไม่สำคัญ แต่นั่นคือสิ่งที่การคาดการณ์คือ

การคาดการณ์หลายวิธีใช้สำหรับการคาดการณ์นอกจากนี้วิธีการง่าย ๆบางวิธีก็ใช้งานได้ดีกับตัวอย่างขนาดเล็กดังนั้นจึงเป็นที่ต้องการมากกว่า ปัญหาดังที่สังเกตได้จากคำตอบอื่น ๆ เมื่อคุณใช้วิธีการอนุมานอย่างไม่เหมาะสม

ตัวอย่างเช่นการศึกษาจำนวนมากแสดงให้เห็นว่าอายุของการริเริ่มทางเพศลดลงเมื่อเวลาผ่านไปในประเทศตะวันตก ดูพล็อตด้านล่างเกี่ยวกับอายุของการมีเพศสัมพันธ์ครั้งแรกในสหรัฐอเมริกา หากเราใช้การถดถอยเชิงเส้นอย่างไม่คาดคิดในการทำนายอายุของการมีเพศสัมพันธ์ครั้งแรกเราจะทำนายให้ต่ำกว่าศูนย์ที่จำนวนปี (ตามด้วยการแต่งงานครั้งแรกและการเกิดครั้งแรกที่เกิดขึ้นในช่วงเวลาหลังจากความตาย) ... อย่างไรก็ตามถ้าคุณต้องการ การคาดการณ์ล่วงหน้าหนึ่งปีจากนั้นฉันเดาว่าการถดถอยเชิงเส้นจะนำไปสู่การคาดการณ์ระยะสั้นที่แม่นยำสำหรับแนวโน้ม

ป้อนคำอธิบายรูปภาพที่นี่

(แหล่งguttmacher.org )

แบบจำลองทั้งหมดผิดการคาดการณ์ก็ผิดเช่นกันเพราะมันจะไม่ช่วยให้คุณคาดการณ์ได้อย่างแม่นยำ เช่นเดียวกับเครื่องมือทางคณิตศาสตร์ / สถิติอื่น ๆ มันจะช่วยให้คุณทำการคาดคะเนโดยประมาณ ขอบเขตของความแม่นยำจะขึ้นอยู่กับคุณภาพของข้อมูลที่คุณใช้โดยใช้วิธีการที่เพียงพอสำหรับปัญหาของคุณสมมติฐานที่คุณทำขณะกำหนดแบบจำลองของคุณและปัจจัยอื่น ๆ แต่นี่ไม่ได้หมายความว่าเราไม่สามารถใช้วิธีการดังกล่าวได้ เราทำได้ แต่เราต้องจำข้อ จำกัด ของพวกเขาและควรประเมินคุณภาพของปัญหาที่ระบุ


4
เมื่อข้อมูลที่คุณใช้สำหรับการถดถอยสิ้นสุดลงในช่วงต้นทศวรรษ 1980 คุณสามารถทดสอบได้อย่างง่ายดายว่าการคาดการณ์วันที่นั้นจะใช้เวลานานเท่าใด
gerrit

@gerrit ฉันเห็นด้วย แต่น่าเสียดายที่ฉันไม่สามารถค้นหาข้อมูลที่เหมาะสมได้ แต่ถ้ามีคนสามารถชี้ให้ฉันฉันก็ยินดีที่จะปรับปรุงคำตอบของฉันสำหรับการเปรียบเทียบดังกล่าว
ทิม

ในกรณีนี้การคาดการณ์ล้มเหลวเนื่องจากอายุเพศครั้งแรกเพิ่มขึ้นในช่วงหลายปีที่ผ่านมา (แต่ข้อมูลสำหรับปีเกิดนี้ล่าช้าตลอดสองสามทศวรรษด้วยเหตุผลที่ควรชัดเจน)
David Manheim

13

ฉันชอบตัวอย่างโดย Nassim Taleb (ซึ่งเป็นการปรับตัวอย่างก่อนหน้านี้โดย Bertrand Russell):

พิจารณาไก่งวงที่ได้รับอาหารทุกวัน การให้อาหารทุกครั้งจะทำให้ความเชื่อของนกมั่นคงขึ้นว่าเป็นกฎทั่วไปของชีวิตที่จะได้รับอาหารทุกวันโดยสมาชิกที่เป็นมิตรของเผ่าพันธุ์มนุษย์ "มองหาผลประโยชน์ที่ดีที่สุด" ในฐานะนักการเมืองคนหนึ่ง ในตอนบ่ายของวันพุธก่อนวันขอบคุณพระเจ้ามีบางสิ่งที่ไม่คาดคิดเกิดขึ้นกับไก่งวง มันจะต้องมีการแก้ไขความเชื่อ

analogs เชิงคณิตศาสตร์บางตัวมีดังต่อไปนี้:

  • ความรู้เกี่ยวกับค่าสัมประสิทธิ์เทย์เลอร์สองสามคนแรกของฟังก์ชั่นไม่ได้รับประกันว่าค่าสัมประสิทธิ์ที่สำเร็จจะเป็นไปตามรูปแบบที่คุณคาดการณ์ไว้

  • ความรู้เกี่ยวกับเงื่อนไขเบื้องต้นของสมการเชิงอนุพันธ์นั้นไม่ได้รับประกันความรู้เกี่ยวกับพฤติกรรมเชิงเส้น (เช่นสมการของ Lorenz บางครั้งบิดเบี้ยวไปในสิ่งที่เรียกว่า "ผลกระทบผีเสื้อ")

นี่คือหัวข้อ MO ที่ดีในเรื่องนี้


3
…และแน่นอน Taleb ต้องชี้ให้เห็นบทเรียนเกี่ยวกับคุณธรรม: "อย่าเป็นไก่งวง"! ในบริบทนี้: อย่าเป็นผู้คาดหวังที่ประมาทและอย่ายอมแพ้ต่อบาปแห่งความโอหัง
JM ไม่ใช่นักสถิติ

@ uoɥʇʎPʎzɐɹCฉันไม่ได้ขอ แต่ขอขอบคุณ!
JM ไม่ใช่นักสถิติ

ไม่มีประโยชน์สำหรับชื่อเสียงที่ได้รับการตรวจสอบแล้ว - และไม่มีใครเห็นคำตอบของคุณและมันดีจริงๆ สนุก!
noɥʇʎԀʎzɐɹƆ

12

ไตร่ตรองเรื่องราวต่อไปนี้ถ้าคุณจะ

ฉันยังจำได้ว่านั่งอยู่ในหลักสูตรสถิติและอาจารย์บอกเราว่าการคาดการณ์เป็นความคิดที่ไม่ดี จากนั้นในช่วงชั้นต่อไปเขาบอกเราว่ามันเป็นความคิดที่ไม่ดีอีกครั้ง; ในความเป็นจริงเขาพูดมันสองครั้ง

ฉันป่วยสำหรับภาคการศึกษาที่เหลือ แต่ฉันมั่นใจว่าฉันไม่สามารถพลาดเนื้อหาได้มากมายเพราะเมื่อสัปดาห์ที่แล้วผู้ชายคนนั้นก็ไม่ได้ทำอะไรเลยนอกจากบอกคนอื่นว่าการคาดการณ์เป็นความคิดที่ไม่ดีอย่างแน่นอน .

แปลกมากฉันไม่ได้คะแนนสูงมากในการสอบ


6
คำถามถามว่า "มีอะไรผิดปกติกับการคาดการณ์?" เรากำลังมองหาคำตอบที่ให้เหตุผลว่าการคาดการณ์อาจเป็นความคิดที่ไม่ดี
Robert Long

8
@RobertLong: จริง ๆ แล้วมันเป็นคำตอบแบบ meta / joke และค่อนข้างคล้ายกับxkcd.com/605 - อาจจะดีกว่าความคิดเห็นมากกว่าคำตอบ
Neil Slater

@NeilSlater: คุณควรโพสต์ความคิดเห็นของคุณเป็นคำตอบ ... :)
usεr11852พูดว่า Reinstate Monic

@ RobertLong: นี่เป็นคำตอบแบบนั้น มันมีรูปแบบของคำอุปมา
einpoklum

2
ไม่ชัดเจนว่าแบบจำลองของคุณเป็นแบบยกกำลัง
gerrit

6

คำถามไม่ได้เป็นเพียงแค่ข้อมูลเชิงสถิติเท่านั้น แต่ยังเกี่ยวกับญาณวิทยาด้วย การอนุมานเป็นหนึ่งในวิธีที่เราเรียนรู้เกี่ยวกับธรรมชาติมันเป็นรูปแบบของการเหนี่ยวนำการเหนี่ยวนำสมมติว่าเรามีข้อมูลการนำไฟฟ้าของวัสดุในช่วงอุณหภูมิตั้งแต่ 0 ถึง 20 องศาเซลเซียสเราจะพูดอะไรเกี่ยวกับค่าการนำไฟฟ้าที่ 40 องศาเซลเซียส

มันเกี่ยวข้องอย่างใกล้ชิดกับการอนุมานตัวอย่างขนาดเล็ก: เราจะพูดอะไรเกี่ยวกับประชากรทั้งหมดจากการตรวจวัดที่ดำเนินการโดยกลุ่มตัวอย่างขนาดเล็ก? สิ่งนี้เริ่มต้นโดยGosset ในฐานะ Guinessซึ่งมาพร้อมกับการแจกแจงแบบ t ก่อนหน้าเขานักสถิติไม่ต้องกังวลกับตัวอย่างขนาดเล็กที่สมมติว่าขนาดตัวอย่างนั้นใหญ่เสมอ เขาอยู่ที่ Guinnes และต้องจัดการกับตัวอย่างเบียร์เพื่อตัดสินใจว่าจะทำอย่างไรกับเบียร์ทั้งชุดที่จะส่ง

ดังนั้นในทางปฏิบัติ (ธุรกิจ) วิศวกรรมและวิทยาศาสตร์เราต้องคาดการณ์ในบางวิธี มันอาจเป็นการคาดการณ์ตัวอย่างขนาดเล็กไปจนถึงขนาดใหญ่หรือจากเงื่อนไขการป้อนข้อมูลที่ จำกัด ไปจนถึงชุดเงื่อนไขที่กว้างขึ้นจากสิ่งที่เกิดขึ้นในเครื่องเร่งความเร็วไปจนถึงสิ่งที่เกิดขึ้นกับหลุมดำที่ห่างออกไปหลายพันล้านไมล์เป็นต้น ในขณะที่เราเรียนรู้โดยการศึกษาความแตกต่างระหว่างการประมาณค่าการประมาณและการวัดจริง บ่อยครั้งที่เราพบปรากฏการณ์ใหม่เมื่อความแตกต่างมีขนาดใหญ่หรือสอดคล้องกัน

ดังนั้นฉันบอกว่าไม่มีปัญหากับการคาดการณ์ มันเป็นสิ่งที่เราต้องทำทุกวัน มันยากมาก


4

การคาดการณ์นั้นไม่จำเป็นต้องชั่วร้าย แต่เป็นกระบวนการที่ให้ข้อสรุปที่ไม่มีเหตุผลมากกว่าที่คุณจะได้รับการแก้ไข

  • การคาดการณ์มักจะทำเพื่อสำรวจค่าที่ค่อนข้างไกลจากภูมิภาคตัวอย่าง ถ้าฉันสุ่มตัวอย่าง 100 ค่าจาก 0-10 แล้วคาดการณ์ออกมาเพียงเล็กน้อยถึง 11 จุดใหม่ของฉันน่าจะอยู่ห่างจากดาต้าพอยน์ใด ๆ มากกว่า 10 เท่าเมื่อเทียบกับการแก้ไขใด ๆ ซึ่งหมายความว่ามีพื้นที่ว่างมากขึ้นสำหรับตัวแปรที่จะออกไปจากมือ (เชิงคุณภาพ) โปรดทราบว่าฉันตั้งใจเลือกการคาดการณ์เล็กน้อย มันแย่ลงกว่าเดิม
  • การคาดการณ์จะต้องกระทำด้วยเส้นโค้งที่พอดีที่มีจุดประสงค์เพื่อทำการคาดการณ์ ยกตัวอย่างเช่นพหุนามมีหลายแบบไม่ดีสำหรับการคาดการณ์เนื่องจากคำศัพท์ที่ทำงานได้ดีในช่วงตัวอย่างสามารถระเบิดได้เมื่อคุณทิ้งไว้ การคาดการณ์ที่ดีขึ้นอยู่กับ "การคาดเดาที่ดี" ว่าเกิดอะไรขึ้นนอกภูมิภาคตัวอย่าง ซึ่งนำฉันไปที่ ...
  • มันมักจะเป็นเรื่องยากมากที่จะใช้การคาดการณ์เนื่องจากสถานะของการเปลี่ยนเฟส กระบวนการหลายอย่างที่หนึ่งอาจต้องการคาดการณ์มีคุณสมบัติไม่เชิงเส้นอย่างแน่นอนซึ่งไม่ได้รับการเปิดเผยอย่างเพียงพอในพื้นที่ตัวอย่าง วิชาการบินรอบ ๆ ความเร็วของเสียงเป็นตัวอย่างที่ดีเยี่ยม การคาดการณ์จำนวนมากจากความเร็วที่ต่ำกว่าจะแตกสลายเมื่อคุณไปถึงและเกินกว่าความเร็วของการถ่ายโอนข้อมูลในอากาศ สิ่งนี้เกิดขึ้นได้ค่อนข้างบ่อยกับวิทยาศาสตร์ที่ไม่รุนแรงซึ่งนโยบายเองสามารถส่งผลกระทบต่อความสำเร็จของนโยบาย เศรษฐศาสตร์ของเคนส์คาดการณ์ว่าเศรษฐกิจจะทำตัวอย่างไรกับระดับเงินเฟ้อที่แตกต่างกันและคาดการณ์ผลลัพธ์ที่ดีที่สุด น่าเสียดายที่มีผลกระทบเป็นลำดับที่สองและผลลัพธ์ไม่ใช่ความเจริญทางเศรษฐกิจ แต่เป็นอัตราเงินเฟ้อที่สูงที่สุดที่สหรัฐฯเห็น
  • คนชอบการคาดการณ์ โดยทั่วไปผู้คนต้องการให้ใครสักคนมองดูลูกบอลคริสตัลและบอกพวกเขาถึงอนาคต พวกเขาจะยอมรับการคาดการณ์ที่ไม่ดีอย่างน่าประหลาดใจเพียงเพราะมันเป็นข้อมูลทั้งหมดที่พวกเขามี สิ่งนี้อาจไม่ทำให้การคาดการณ์ผิดพลาด แต่อย่างใด แต่เป็นสิ่งที่ควรคำนึงถึงเมื่อใช้งาน

สำหรับการคาดการณ์ขั้นสุดท้ายให้พิจารณาโครงการแมนฮัตตัน นักฟิสิกส์ที่นั่นบังคับให้ทำงานกับการทดสอบขนาดเล็กมากก่อนที่จะสร้างสิ่งที่แท้จริง พวกเขามียูเรเนียมไม่เพียงพอที่จะเสียการทดสอบ พวกเขาทำสิ่งที่ดีที่สุดเท่าที่จะทำได้และพวกเขาก็ฉลาด อย่างไรก็ตามเมื่อการทดสอบครั้งสุดท้ายเกิดขึ้นก็มีการตัดสินใจว่านักวิทยาศาสตร์แต่ละคนจะตัดสินใจว่าห่างไกลจากการระเบิดที่พวกเขาต้องการเมื่อมันออกไป มีความคิดเห็นที่แตกต่างกันอย่างมากว่า "ปลอดภัย" อยู่ไกลแค่ไหนเพราะนักวิทยาศาสตร์ทุกคนรู้ว่าพวกเขาคาดการณ์ค่อนข้างไกลจากการทดสอบ แม้จะมีการพิจารณาที่ไม่สำคัญว่าพวกเขาอาจวางบรรยากาศบนกองไฟด้วยระเบิดนิวเคลียร์ปัญหาก็ทำให้เหลือด้วยการคาดการณ์อย่างมาก!


3

คำตอบที่ดีมากมายที่นี่ฉันแค่อยากลองและสังเคราะห์สิ่งที่ฉันเห็นว่าเป็นแกนหลักของปัญหา: มันเป็นสิ่งที่อันตรายที่จะคาดการณ์เกินกว่ากระบวนการสร้างข้อมูลที่ก่อให้เกิดตัวอย่างการประมาณค่า บางครั้งเรียกว่า 'การเปลี่ยนแปลงโครงสร้าง'

การคาดการณ์มาพร้อมกับสมมติฐานหลักที่ว่ากระบวนการสร้างข้อมูลคือ (ใกล้เคียงทำให้ไม่แตกต่างอย่างมีนัยสำคัญ) เหมือนกับที่สร้างตัวอย่าง (ยกเว้นตัวแปร rhs ซึ่งการเปลี่ยนแปลงที่คุณอธิบายไว้ในแบบจำลอง) . หากมีการเปลี่ยนแปลงโครงสร้างเกิดขึ้น (เช่นวันขอบคุณพระเจ้าในตัวอย่างของ Taleb) การเดิมพันทั้งหมดจะปิด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.