การแก้ไขเกี่ยวข้องกับแนวคิดของการถดถอยอย่างไร


17

อธิบายสั้น ๆ การแก้ไขหมายถึงอะไรมันเกี่ยวข้องกับแนวคิดของการถดถอยอย่างไร?

การแก้ไขคือศิลปะของการอ่านระหว่างบรรทัดของตารางและในคณิตศาสตร์ระดับประถมศึกษาคำศัพท์มักจะหมายถึงกระบวนการคำนวณค่ากลางของฟังก์ชันจากชุดของค่าที่กำหนดหรือตารางของฟังก์ชันนั้น

ฉันไม่สามารถตอบคำถามที่สองได้ กรุณาช่วย


4
การถดถอยมีจุดมุ่งหมายในการระบุฟังก์ชั่นเพื่ออธิบายค่าที่คาดหวังของ (ตัวแปรตาม) ที่ได้รับX (ตัวแปรอิสระ) แก้ไขใช้การถดถอยสำหรับการทำนายค่าของYที่ค่ากำหนดของX ความแตกต่างนั้นบอบบาง แต่มาก่อนในรูปแบบที่Yมีความสัมพันธ์กันเพราะจากนั้นค่าที่คาดการณ์มักจะแตกต่างจากค่าการถดถอยของพวกเขา การถดถอยหรือการทำนายไม่สามารถนำไปใช้โดยตรงกับการประมาณค่าในตารางทางคณิตศาสตร์ซึ่งโดยปกติจะถือว่าไม่มีข้อผิดพลาดแบบสุ่ม แต่อัลกอริทึมของพวกเขายังคงสามารถใช้งานได้ YXYXY
whuber

2
ใช้งานได้กับบางห้องเรียนหรือไม่
Glen_b -Reinstate Monica

คำตอบ:


23

ความแตกต่างที่สำคัญระหว่างการแก้ไขและการถดถอยคือคำจำกัดความของปัญหาที่พวกเขาแก้

เมื่อกำหนดจุดข้อมูลเมื่อคุณแก้ไขคุณจะมองหาฟังก์ชันที่มีรูปแบบที่กำหนดไว้ล่วงหน้าบางอย่างที่มีค่าในจุดนั้นตามที่ระบุ นั่นหมายความว่าให้คู่( x ฉัน , Y ฉัน )ที่คุณมองหาFของแบบฟอร์มที่กำหนดไว้ล่วงหน้าบางอย่างที่น่าพอใจF ( x ฉัน ) = Yฉัน ฉันคิดว่าโดยทั่วไปแล้วFได้รับเลือกให้เป็นแบบพหุนามความโค้ง (พหุนามในระดับต่ำในช่วงเวลาระหว่างคะแนนที่กำหนด)n(xi,yi)FF(xi)=yiF

เมื่อคุณทำการถดถอยคุณมองหาฟังก์ชั่นที่ช่วยลดค่าใช้จ่ายให้น้อยที่สุดซึ่งมักจะเป็นผลรวมของความคลาดเคลื่อนกำลังสอง คุณไม่ต้องการให้ฟังก์ชันมีค่าที่แน่นอน ณ จุดที่กำหนดคุณเพียงต้องการการประมาณที่ดี โดยทั่วไปพบฟังก์ชั่นของคุณอาจจะไม่พอใจF ( x ฉัน ) = Y ฉันสำหรับจุดใดข้อมูล แต่ฟังก์ชั่นค่าใช้จ่ายเช่นΣ n ฉัน= 1 ( F ( x ฉัน ) - Y ฉัน) 2FF(xi)=yii=1n(F(xi)yi)2จะเป็นไปได้ที่มีขนาดเล็กที่สุด ของฟังก์ชั่นทั้งหมดของรูปแบบที่กำหนด

ตัวอย่างที่ดีสำหรับสาเหตุที่คุณอาจต้องการเพียง aproximate แทนที่จะเป็น interpolate คือราคาในตลาดหุ้น คุณสามารถกำหนดราคาในช่วงเวลาล่าสุดของหน่วยและลองทำการแก้ไขเพื่อให้ได้การคาดการณ์ราคาในหน่วยถัดไป นี่เป็นความคิดที่ไม่ดีเพราะไม่มีเหตุผลที่จะคิดว่าความสัมพันธ์ระหว่างราคาสามารถแสดงออกได้อย่างแน่นอนโดยพหุนาม แต่การถดถอยเชิงเส้นอาจทำเคล็ดลับเนื่องจากราคาอาจมี "ความชัน" บางส่วนและฟังก์ชันเชิงเส้นอาจเป็นการประมาณที่ดีอย่างน้อยในพื้นที่ (คำแนะนำ: มันไม่ใช่เรื่องง่าย แต่การถดถอยนั้นเป็นแนวคิดที่ดีกว่าการแก้ไขในกรณีนี้ )k


คำตอบที่ดี ฉันจะเพิ่มว่าด้วยการถดถอยมีโมเดลทางสถิติอยู่ข้างหลังซึ่งกำหนดความสัมพันธ์ระหว่างและXในแง่ของการแจกแจงบางอย่างที่เราประเมินว่ามันหมายถึง (หรือค่ามัธยฐานหรือควอไทล์ ฯลฯ ในรสชาติที่แตกต่างของการถดถอย) เช่นสถิติ .stackexchange.com / คำถาม / 173660 / …YX
ทิม

ตัวอย่างที่คุณอธิบายไว้ไม่ใช่การประมาณค่าแทนที่จะเป็นการประมาณค่าใช่หรือไม่
bi_scholar

6

คำตอบก่อนหน้านี้สองคำตอบได้อธิบายความสัมพันธ์ระหว่างการประมาณเชิงเส้นและการถดถอยเชิงเส้น (หรือแม้แต่การประมาณค่าทั่วไปและการถดถอยแบบพหุนาม) แต่การเชื่อมต่อที่สำคัญคือเมื่อคุณพอดีกับโมเดลการถดถอยคุณสามารถใช้มันเพื่อแก้ไขระหว่างจุดข้อมูลที่กำหนด


ดังนั้นเมื่อฉันพูดความสูงเทียบกับเพศฉันสามารถแก้ไขเพื่อค้นหาความสูงที่คาดหวังของชายครึ่งหญิงครึ่ง! ตัวอย่างเพ้อฝันนี้เน้นข้อบกพร่องพื้นฐานในการตอบสนองนี้ซึ่งเป็นข้อสันนิษฐานว่าผู้ถดถอยทั้งหมดในตัวแบบการถดถอยจะต้องเป็นตัวแปรต่อเนื่อง
whuber

2
คำตอบของฉันนำไปใช้เมื่อตัวแปรตัวทำนายทั้งหมดเป็นแบบต่อเนื่อง ..
Michael R. Chernick

4

หวังว่ามันจะมาค่อนข้างเร็วด้วยตัวอย่างและการสร้างภาพข้อมูล

สมมติว่าคุณมีข้อมูลต่อไปนี้:

X  Y
1  6
10 15
20 25
30 35
40 45
50 55

เราอาจใช้การถดถอยกับโมเดล Y เพื่อตอบสนอง X โดยใช้ R: lm(y ~ x)

ผลลัพธ์เป็นจุดตัดของ 5 และสัมประสิทธิ์สำหรับ x ของ 1 ซึ่งหมายความว่าสามารถคำนวณ Y ใดก็ได้สำหรับ X ที่กำหนดเป็น X + 5 ดังรูปคุณสามารถดูวิธีนี้:

enter image description here

สังเกตว่าถ้าคุณไปที่แกน X ที่ใดก็ได้ตามแนวนั้นและลากเส้นขึ้นไปที่เส้นที่ติดตั้งแล้วลากเส้นไปยังแกน Y คุณจะได้รับค่าไม่ว่าฉันจะให้ค่าจุดสำหรับ Y. การถดถอยนั้นทำให้บริเวณที่ไม่มีข้อมูลราบรื่นขึ้นโดยการประเมินความสัมพันธ์ที่เกี่ยวข้อง


2

ความแตกต่างพื้นฐาน b / w การแก้ไขและการถดถอยมีดังนี้: การแก้ไข: สมมติว่ามีจุด n (เช่น: 10 จุดข้อมูล) ในการแก้ไขเราจะพอดีกับเส้นโค้งผ่านจุดข้อมูลทั้งหมด (เช่นที่นี่ 10 จุดข้อมูล) ด้วย ระดับของพหุนาม (จำนวนจุดข้อมูล -1, นี่คือ 9) ทุกแห่งในการถดถอยไม่ใช่ทุกจุดข้อมูลเพียงชุดของพวกเขาที่จำเป็นสำหรับการปรับเส้นโค้ง

โดยทั่วไปคำสั่งของการแก้ไข & การถดถอยจะเป็น (1,2 หรือ 3) หากคำสั่งนั้นมีค่ามากกว่า 3 จะเห็นการแกว่งมากขึ้นในโค้ง


2
This implies that interpolation is based on polynomials, but there are several other methods, such as cubic spline, piecewise cubic Hermite, nearest neighbour, etc.
Nick Cox

@Nick Although you are correct, it is curious that every method you name actually is based on polynomials! Perhaps the simplest, best-known non-polynomial interpolator is inverse-distance weighting (IDW).
whuber

@whuber Agreed; if polynomials can be applied with constraints, then most methods qualify, e.g. nearest neighbour = piecewise constant, etc.
Nick Cox

2

Regression is the process of finding the line of best fit[1]. Interpolation is the process of using the line of best fit to estimate the value of one variable from the value of another, provided that the value you are using is within the range of your data. If it's outside the range, then you would be using Extrapolation[1].

[1] http://mathhelpforum.com/advanced-applied-math/182558-interpolation-vs-regression.html


2
This answer does not distinguish interpolation from extrapolation. Do you maintain they are the same thing? BTW, mathematics forums (and textbooks and papers, even) generally are not good sources of information about statistical issues, because they tend to focus on narrow mathematical meanings which--although correct and useful in purely mathematical applications--might not apply more widely.
whuber

1

With interpolation or spline fitting what we get is a numeric data (interpolated bet ween each pair of original data) of larger size, which when plotted generates the effect of a smooth curve. In actuality, between each pair of original data a different polynomial is fitted, therefore the entire curve after interpolation is a piece-wise continuous curve, where each piece is formed of a different polynomial.

If one is looking for parametric representation of the original numeric data, regression must be done. You can also try to fit a high degree polynomial to the spline. In any case, the representation is going to be an approximation. You can also check how accurate the approximation is.


It appears you did not have a chance yet to read Nick Cox's comment, which points out that not all interpolators are (local) polynomials.
whuber

0

Both regression and interpolation are used to predict values of a variable(Y) for a given value of another variable(X). In Regression we can predict any value of the dependent variable(Y) for a given value of the independent variable(X) Even if it is outside the range of tabulated values.But in case of Interpolation we can only predict the values of dependent variable(Y) for a value of independent variable(X) which is within the range of given values of X.


0

Interpolation is the process of fitting a number of points between x=a and x=b exactly to an interpolating polynomial. Interpolation can be used to find the approximate value (or the missing value) of y in the domain x=[a,b] with better accuracy than regression technique.

ในทางกลับกันการถดถอยเป็นกระบวนการของการปรับจำนวนจุดให้เป็นเส้นโค้งที่ผ่านหรือใกล้จุดที่มีข้อผิดพลาดกำลังสองน้อยที่สุด การถดถอยจะไม่ประมาณค่าของ y ในโดเมน x = [a, b] ที่ถูกต้องเท่ากับการแก้ไขอย่างไรก็ตามการถดถอยให้การคาดการณ์ที่ดีกว่าการประมาณค่าของ y ในโดเมนระหว่าง x = (- อนันต์, a) และ x = ( b, + อินฟินิตี้)

โดยสรุปการแก้ไขให้ความถูกต้องที่ดีขึ้นในค่าของ y ภายในโดเมนของช่วง x ที่รู้จักในขณะที่การถดถอยให้การคาดการณ์ที่ดีขึ้นของ y ในโดเมนด้านล่างและเกินกว่าช่วงที่รู้จักของ x


3
It's not a definition of interpolation that a polynomial is used. Other smooth functions could be appropriate.
Nick Cox

3
There are other issues with your claims. For instance, regression can be more accurate than interpolation. The statistical distinction between the two procedures is quite different from what you represent: please see the other posts in this thread.
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.