ทำไมเราถึงบอกว่าตัวแปรผลลัพธ์“ ถูกทำให้ถดถอย” ตัวทำนาย (s)?


16

มีคำอธิบายที่เข้าใจง่ายสำหรับคำศัพท์นี้หรือไม่? ทำไมจึงเป็นเช่นนี้และไม่ใช่ผู้ทำนายที่ได้ผลลัพธ์

ฉันหวังว่าคำอธิบายที่เหมาะสมว่าทำไมศัพท์นี้จึงช่วยให้นักเรียนจดจำได้และหยุดพวกเขาไม่ให้พูดผิดวิธี


1
ทำเรา ฉันไม่แน่ใจว่าฉันเคยพูดแบบนั้น - และฉันได้พูดถึงการถดถอยมาก ถ้าคุณรู้จักใครที่พูดออกมาคุณอาจจะถามเขาก็ได้ (ฉันมีในโอกาสกล่าวว่า " ถดถอยใน " - แต่บนจะเสียงค่อนข้างแปลกที่ฉัน)
Glen_b -Reinstate โมนิกา

ขอบคุณ - ฉันหมายถึง "เปิด" ไม่ใช่ "ลง" ตอนนี้ฉันคงที่แล้ว
user1205901 - Reinstate Monica

คำตอบ:


19

ฉันไม่ทราบว่านิรุกติศาสตร์ของ "ถดถอย" คืออะไร แต่นี่คือการตีความที่ฉันมีในใจเมื่อฉันพูดหรือได้ยินการแสดงออกนี้ พิจารณารูปจากองค์ประกอบของการเรียนรู้ทางสถิติโดย Hastie และคณะ:

การถดถอยคือการฉาย

ในหลักของการถดถอยเชิงเส้นจำนวนประมาณการมุมฉากของบน (บน) Xที่Yคือnเวกเตอร์มิติของการสังเกตของตัวแปรตามและXเป็นสเปซทอดเวกเตอร์ทำนายyXynX

อันนี้เป็นอย่างมากตีความที่มีประโยชน์ของการถดถอยเชิงเส้น

ตั้งแต่จะถูกฉายบนXว่าเป็นสิ่งที่ผมคิดว่าเมื่อผมได้ยินว่าปีคือ "ถดถอยใน" X จากมุมมองนี้ก็จะทำให้รู้สึกน้อยที่จะบอกว่าXจะถดถอยในปีหรือปีจะถดถอย "กับ" หรือ "กับ" XyXyXXyyX

ฉันหวังว่าคำอธิบายที่เหมาะสมว่าทำไมศัพท์นี้จึงช่วยให้นักเรียนจดจำได้และหยุดพวกเขาไม่ให้พูดผิดวิธี

ดังที่ฉันพูดฉันสงสัยว่านี่เป็นคำอธิบายว่าทำไมคำศัพท์นี้จึงมีอยู่ (บางทีอาจเป็นเพราะเหตุใดจึงยังคงอยู่?) แต่ฉันมั่นใจว่าจะสามารถช่วยให้นักเรียนจดจำได้


2
+1 ขึ้นอยู่กับนักเรียน! นี่เป็นวิธีที่ถูกต้องและเป็นประโยชน์อย่างมากในการพูดคุยและคิดในระดับกลางหรือระดับสูง ไม่ว่าจะเป็นความรับผิดชอบของคำศัพท์ "ใน" ฉันสงสัย เมื่อไม่นานที่ผ่านมาคุณสามารถหาตำราการถดถอยที่แทบจะไม่มีไดอะแกรมเลยแม้แต่น้อยวิธีการทางสายตาหรือเชิงเรขาคณิตแม้ว่ามันจะเป็นมาตรฐานที่สมบูรณ์ที่สุดในขณะที่ฉันคิดว่าคำศัพท์นี้กลับไปหลายทศวรรษ
Nick Cox

(+1) วิธีเดียวที่ฉันได้แนวคิดเกี่ยวกับการถดถอยผ่านหัวกะโหลกของฉันคือการคิดว่ามันคือการฉายภาพของบนพื้นที่คอลัมน์C ( A )ของแบบจำลองเมทริกซ์ซึ่งฉันคิดว่ามันเป็นการตีความเชิงเรขาคณิตที่คุณแสดง . yC(A)
Antoni Parellada

1
นี่เป็นเหตุผลทางสถิติที่ดีมากสำหรับการใช้คำศัพท์ เหตุผลทางสังคมหรือภาษาว่าทำไมความนิยมถึงแตกต่างกัน!
Nick Cox

เพื่อให้ชัดเจน: ฉันเห็นด้วยกับสิ่งที่ @NickCox พูดในความคิดเห็นที่นี่
อะมีบาพูดว่า Reinstate Monica

6

ฉันมักจะใช้และได้ยินวิธีการพูดนี้ ฉันเดาว่าลำดับที่กล่าวถึงผลลัพธ์หรือการตอบสนองก่อนที่ผู้ทำนายจะตามมาจากการประชุมเป็นลายลักษณ์อักษรการใช้คำหรือการใช้สัญกรณ์หรือการผสมทั้งสองไปจนถึง

Y=Xβ

ตั้งคำถามที่น่าสนใจอย่างเท่าเทียมกัน (หรือไม่น่าสนใจ!) ของสิ่งที่เราเรียกตัวแปรชนิดต่างๆ

แต่ดูเหมือนว่าถูกต้องทั้งในเชิงคณิตศาสตร์และสถิติเพื่อพูดถึงตัวทำนายก่อนเช่นเดียวกับที่นักคณิตศาสตร์หลายคนเขียนการแมปหรือฟังก์ชั่นที่มีข้อโต้แย้งก่อน

บ่อยครั้งที่สิ่งที่ขับเคลื่อนลำดับที่เราใช้ในการอภิปรายเชิงสถิติคือโดยทางวิทยาศาสตร์หรือในทางปฏิบัติเรามักจะมีความคิดที่ชัดเจนว่าเรากำลังพยายามทำนายอะไร - คือความตายหรือรายได้ผลผลิตข้าวสาลีหรือคะแนนเสียงในการเลือกตั้งหรืออะไรก็ตาม - ในขณะที่กลุ่มที่มีศักยภาพหรือตัวทำนายที่แท้จริงอาจไม่ชัดเจนนัก แม้ว่าจะชัดเจน แต่ก็สมเหตุสมผลที่จะพูดถึงสิ่งสำคัญก่อน คุณพยายามจะทำอะไร? ทำนายสิ่งที่ คุณจะทำอย่างไร ใช้ตัวแปรเหล่านี้บางส่วนหรือทั้งหมดตัวแปรเหล่านี้

ฉันไม่มีเรื่องราวเกี่ยวกับ "เปิด" มากกว่าคำอื่นใดที่เหมาะสม ฉันไม่ได้ยินคำว่า "ถดถอย" หรือ "ถดถอย" อาจไม่มีตรรกะนี่แค่มส์ส่งต่อในตำราเรียนการสอนและการอภิปราย

โดยทั่วไประวัง พิจารณาประเด็นที่เกี่ยวข้องกับความหมายของ "กับ" ฉันถูกนำขึ้นมาพูดว่า "แปลง [ตัวแปรแกนตั้ง] กับ (หรือกับ) x [ตัวแปรแกนนอน]" และสิ่งที่ตรงกันข้ามฟังดูแปลกประหลาดสำหรับฉัน อย่างไรก็ตามคนที่มีประสบการณ์และความเชี่ยวชาญเป็นอย่างมาก บางครั้งความแตกต่างแบบนี้อาจสืบเนื่องมาจากครูที่มีเสน่ห์และนิสัยแปลกประหลาดที่คุณลอกเลียนแบบมาตั้งแต่คุณนั่งที่เท้าyx


+1 แต่การตีความส่วนตัวของฉันเกี่ยวกับ "ถอยหลัง" เป็นผ่าน "ฉายใน" ดูคำตอบของฉัน ฉันสงสัยว่าหลายคนคิดเกี่ยวกับการแสดงออกนี้ด้วยวิธีนี้หรือเป็นฉันเท่านั้น
อะมีบาพูดว่า Reinstate Monica

3

1)คำว่าการถดถอยมาจากข้อเท็จจริงที่ว่าในรูปแบบการถดถอยเชิงเส้นอย่างง่ายตามปกติ:

y=α+βx+ϵ

yxy^y¯xx¯

|y^y¯|/sy<|xx¯|/sx

ตัวอย่างเช่นถ้าเราใช้กรอบข้อมูล BOD ที่สร้างขึ้นใน R แล้ว:

fm <- lm(demand ~ Time, BOD)
with(BOD, all( abs(fitted(fm) - mean(demand)) / sd(demand) < abs(scale(Time))))
## [1] TRUE

สำหรับการพิสูจน์ AA โปรดดู: https://en.wikipedia.org/wiki/Regression_toward_the_mean

2)คำที่มาจากความจริงที่ว่าค่าติดตั้งคือการคาดการณ์ของตัวแปรผลลัพธ์ลงในพื้นที่ย่อยที่ถูกครอบคลุมโดยตัวแปรทำนาย (รวมถึงการสกัดกั้น) ตามที่อธิบายเพิ่มเติมในหลาย ๆ แหล่งเช่นhttp: //people.eecs.ku .edu / ~ jhuan / EECS940_S12 / ภาพนิ่ง / linearRegression.pdf.edu

บันทึก

เกี่ยวกับความคิดเห็นด้านล่างสิ่งที่ผู้แสดงความคิดเห็นกำลังระบุคือสิ่งที่คำตอบระบุไว้ข้างต้นแล้วในรูปแบบสูตรยกเว้นว่าคำตอบระบุไว้อย่างถูกต้อง ในความเป็นจริงเนื่องจากความเสมอภาค:

(y^y¯)=β^(xx¯)

|β|<1ของมันมากกว่าตัวทำนายตามที่ระบุไว้ในสูตรในคำตอบ

beta>1


1
ฉันค่อนข้างแน่ใจว่านั่นไม่ใช่ที่มาของคำว่าถดถอย ในช่วงต้นของการใช้ความสูงของลูกชายระยะถูกถดถอยบนความสูงของพ่อ; เนื่องจากผลการพลิกกลับเฉลี่ยแสดงให้เห็นว่าลูกชายของพ่อที่สูงมักมีแนวโน้มถดถอยไปถึงค่าเฉลี่ย
PaulB

ในขณะที่เป็นจริงสำหรับชุดข้อมูลนั้นที่ไม่ได้เป็นจริงโดยทั่วไปเว้นแต่คุณวัดความใกล้ชิดในแง่ของการเบี่ยงเบนมาตรฐาน แต่นั่นคือสิ่งที่ความไม่เท่าเทียมกันในคำตอบทำเช่นนั้นบางทีคุณอาจไม่รู้จัก ในความเป็นจริงความคิดที่ทันสมัยขึ้นอยู่กับสูตรที่ถูกต้องซึ่งฉันได้ระบุไว้และไม่ได้อยู่ในสูตรที่ไม่ถูกต้องไม่เกี่ยวข้องกับส่วนเบี่ยงเบนมาตรฐาน ฉันได้ขยายเรื่องนี้ในหมายเหตุซึ่งฉันได้เพิ่มไว้ท้ายคำตอบ
G. Grothendieck

0

โดยส่วนตัวเมื่อมันมาถึงการอธิบายคำศัพท์ฉันพบคำจำกัดความของคำว่าตัวเองช่วยเสมอโดยเฉพาะอย่างยิ่งเมื่ออธิบายให้นักเรียน คำจำกัดความที่แท้จริงของคำว่า regress คือ:

"กลับไปสู่สภาวะที่พัฒนาแล้วในอดีตหรือน้อยกว่า"

ดังนั้นวิธีหนึ่งที่จะอธิบายฉันเดาว่าจะเป็นดังต่อไปนี้:

"การคิดผลลัพธ์เป็นสถานะที่พัฒนาเต็มที่เราพยายามอธิบายผลลัพธ์โดยใช้สถานะที่พัฒนาน้อยกว่านั่นคือตัวแปรอิสระดังนั้นผลลัพธ์จึงถดถอยลงเมื่อใช้ตัวทำนาย"

หวังว่าจะช่วย


1
มี "คำจำกัดความที่แท้จริง" มากกว่าหนึ่งรายการ ฉันอยากจะแนะนำว่าในทางสถิติวิทยาศาสตร์นิยามทางเทคนิคของการถดถอยเป็นแบบจำลอง (โดยค่าเริ่มต้นเป็นแบบจำลองเชิงเส้น) ตอนนี้หลักและความรู้สึกทางประวัติศาสตร์ถูกจับโดย "ถอยหลังถึงค่าเฉลี่ย" ซึ่งยังคงน่าสนใจและมีประโยชน์บางครั้งคือ รอง ฉันไม่คิดว่ามันจะมีประโยชน์หากคิดว่าตัวทำนายโดยทั่วไปคือ "สถานะที่พัฒนาน้อยกว่า" เช่นไม่มีความหมายใดที่ปริมาณน้ำฝนของตัวพยากรณ์เป็นสถานะที่พัฒนาน้อยกว่าของผลผลิตข้าวสาลี ไม่ว่าด้วยวิธีใดฉันไม่เห็นว่าสิ่งนี้จะอธิบายการแสดงออกได้อย่างไร
Nick Cox

ฉันเห็นจุดของคุณอย่างสมบูรณ์ มีวิธีที่คุณสามารถอธิบายการถดถอยผ่านคำจำกัดความที่ฉันโพสต์ได้หรือไม่? เพราะวิธีที่ฉันคิดว่า "การพัฒนาน้อยกว่า" ไม่ได้อยู่ในความหมายของปริมาณน้ำฝนที่พัฒนาน้อยกว่าผลผลิตของข้าวสาลี แต่เป็นสิ่งที่สามารถอธิบายผลผลิตข้าวสาลีได้บางส่วน
EhsanF

1
หาก "การพัฒนาน้อย" ไม่ได้หมายถึงการพัฒนาที่น้อยลงฉันไม่สามารถเห็นได้ว่าถ้อยคำช่วยได้เลย
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.