เหตุใดปัญหาการถดถอยจึงเรียกว่าปัญหา“ การถดถอย”


36

ฉันแค่สงสัยว่าทำไมปัญหาการถดถอยจึงถูกเรียกว่า "ปัญหาการถดถอย" เรื่องราวเบื้องหลังชื่อคืออะไร?

คำนิยามเดียวสำหรับการถดถอย: "กำเริบไปสู่สถานะที่ไม่สมบูรณ์หรือพัฒนาแล้ว"


1
ดูวรรคสองของ "ประวัติ" ส่วนen.m.wikipedia.org/wiki/Regression_analysis
Mark White

คำตอบ:


34

คำว่า "การถดถอย" ถูกนำมาใช้โดยฟรานซิสกัลตันในกระดาษ 2429 "การถดถอยสู่คนธรรมดาสามัญในสัดส่วนทางพันธุกรรม" ความรู้ของฉันเพียง แต่เขาจะใช้คำในบริบทของการถดถอยที่มีต่อค่าเฉลี่ย คำอื่น ๆ นั้นถูกนำมาใช้เพื่อให้ได้ความหมายที่มากขึ้นหรือน้อยลงในทุกวันนี้เป็นวิธีการทางสถิติทั่วไป


15
Galton ได้รับการประมาณเชิงเส้นเพื่อประมาณความสูงของลูกชายจากความสูงของพ่อในกระดาษนั้น สมการของเขาได้รับการติดตั้งเพื่อให้พ่อสูงโดยเฉลี่ยจะมีลูกชายสูงเฉลี่ย แต่สูงกว่าพ่อเฉลี่ยจะมีลูกชายที่สูงกว่าค่าเฉลี่ยโดย 2/3 จำนวนพ่อของเขาคือ เดียวกันกับที่สั้นกว่าค่าเฉลี่ย นี่อาจเป็นเรื่องง่ายที่จะถดถอยเชิงเส้น (ความหมายของวันนี้) และแน่นอนว่าการถดถอยในวันนี้มีความหมายที่กว้างกว่า: มันเป็นแบบจำลองใด ๆ ที่ทำการคาดการณ์อย่างต่อเนื่อง เป็นที่น่าสนใจว่าการใช้คำดั้งเดิมของเขาเปลี่ยนไปมากเพียงใด
rm999

3
ตอบโดย NRH ถูกต้อง ลิงค์ต่อไปนี้ให้รายละเอียดมากขึ้นบนกระดาษฟรานซิส Galton ของ "ถดถอยไปสู่สามัญในสัดส่วนทางพันธุกรรม" blog.minitab.com/blog/statistics-and-quality-data-analysis/...
Gaurav สิงคาล

ถึงเวลาที่ชุมชนสถิติจะแทนที่คำว่า 'การถดถอย' ด้วยคำที่ตรงไปตรงมาและชัดเจนมากขึ้นอาจเป็น 'ตัวทำนายสูตรสูตร' หรือไม่
Aviad Rozenhek

4

เมื่อเทียบกับความก้าวหน้าเรากำลังถอยกลับไปสู่ค่าเฉลี่ยนั่นคือการถดถอย ดังนั้นการถดถอยระยะ! ฉันคิดว่ามันเป็นสิ่งที่หยิบขึ้นมาและติดอยู่


2

@Mark White พูดถึงลิงค์แล้ว แต่สำหรับพวกคุณที่ไม่มีเวลามากในการตรวจสอบลิงค์นี่คือคำตอบที่ถูกต้องอ้างอิงที่ถูกต้อง:

ต้นกำเนิดของ 'การถดถอย'

คำว่า "การถดถอย" ประกาศเกียรติคุณจากฟรานซิสกัลตันในศตวรรษที่ 19 เพื่ออธิบายปรากฏการณ์ทางชีวภาพ ปรากฏการณ์คือความสูงของลูกหลานของบรรพบุรุษสูงมักจะถอยกลับไปสู่ค่าเฉลี่ยปกติ (ปรากฏการณ์ที่เรียกว่าการถดถอยไปสู่ค่าเฉลี่ย) (Galton, พิมพ์ซ้ำ 1989) สำหรับ Galton การถดถอยมีความหมายทางชีววิทยาเพียงอย่างเดียว(Galton, 1887)แต่งานของเขาได้ขยายออกไปโดย Udny Yule และ Karl Pearson ไปยังบริบททางสถิติทั่วไป(Pearson, 1903)

อ้างอิง

https://en.wikipedia.org/wiki/Regression_analysis#History

Galton, F. (1877) กฎหมายทั่วไปของกรรมพันธุ์ III ธรรมชาติ, 15 (389), 512-514

Galton, F. (พิมพ์ซ้ำ 1989) เครือญาติและสหสัมพันธ์ วิทยาศาสตร์สถิติ, 4 (2), 80–86

เพียร์สัน, K. (1903) กฎแห่งการถ่ายทอดทางพันธุกรรมของบรรพบุรุษ Biometrika, 2 (2), 211-228


การถดถอยของกัลตันเหมือนกับใน 'การถดถอยของค่าเฉลี่ย' นั้นสมเหตุสมผล แต่ฉันไม่เข้าใจการใช้คำว่า 'การถดถอย' เพื่อหมายถึง 'เรียนรู้สูตรจากตัวแปรอิสระถึงตัวแปรผลลัพธ์'
Aviad Rozenhek

1
โดยทั่วไปหมายถึงมากกว่านั้น แต่การเรียนรู้ของเครื่องใช้การถดถอย แต่การถดถอยไม่ใช่เทคนิคการเรียนรู้ของเครื่องแม้จะได้รับความนิยมและไม่ถูกต้องก็ตาม การเรียนรู้ทางสถิตินั้นแยกจากการเรียนรู้ของเครื่อง แต่โดยทั่วไปแล้วผู้เสนอ ML ใช้วิธีการทางสถิติและติดป้ายอย่างไม่ถูกต้องในฐานะ ML ดังนั้นความไม่สอดคล้องกันที่ปรากฏขึ้นจะปรากฏขึ้น การถดถอยของกัลตันคือการถดถอย มันเกี่ยวข้องกับการสร้างแบบจำลอง / การทำนายแนวโน้ม
LSC

0

"การถดถอย" มาจาก "การถดถอย" ซึ่งจะมาจากภาษาละติน "regressus" - เพื่อกลับไป (บางสิ่ง)

ในแง่ที่ว่าการถดถอยเป็นเทคนิคที่ช่วยให้ "ย้อนกลับ" จากความยุ่งเหยิงยากที่จะตีความข้อมูลเป็นรูปแบบที่ชัดเจนและมีความหมายมากขึ้น ในฐานะนักฟิสิกส์ฉันชอบความคิดเนื่องจากนักฟิสิกส์มองปรากฏการณ์ทางธรรมชาติว่าเป็นผลลัพธ์ที่เป็นไปได้หลายอย่างของกฎธรรมชาติที่ค่อนข้างเรียบง่าย

กล่าวอีกนัยหนึ่งการถดถอยของคำดูเหมือนจะแนะนำว่าข้อมูลเป็นเพียงผลที่เห็นได้ชัดเจนและเป็นรูปธรรมของ "ตัวแบบเชิงสถิติ" กล่าวอีกนัยหนึ่งแบบจำลองนั้นมาก่อนและความปรารถนาของคุณคือใช้ข้อมูล "เพื่อย้อนกลับ" กับสิ่งที่เกิดขึ้น


0

ดังที่ฉันทราบคำว่าregressionในความหมายทางสถิติคือการวัดความสัมพันธ์ระหว่างค่าเฉลี่ยของตัวแปรหนึ่งและค่าที่สอดคล้องกันของตัวแปรอื่น ๆ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.