อธิบายความแตกต่างระหว่างการถดถอยหลายครั้งและการถดถอยหลายตัวแปรโดยใช้สัญลักษณ์ / คณิตศาสตร์น้อยที่สุด


คำตอบ:


54

อย่างรวดเร็วฉันจะพูดว่า: 'หลาย' นำไปใช้กับจำนวนของตัวทำนายที่เข้าสู่แบบจำลอง (หรือเทียบเท่าเมทริกซ์การออกแบบ) ด้วยผลลัพธ์เดียว (การตอบสนอง Y) ในขณะที่ 'หลายตัวแปร' หมายถึงเมทริกซ์ของเวกเตอร์การตอบสนอง จำไม่ได้ว่าผู้เขียนที่เริ่มส่วนเบื้องต้นในการสร้างแบบจำลองหลายตัวแปรกับการพิจารณาว่า แต่ฉันคิดว่ามันเป็นไบรอัน Everitt ในตำราเรียนของเขาR และ S-Plus Companion เพื่อการวิเคราะห์หลายตัวแปร สำหรับการอภิปรายอย่างละเอียดเกี่ยวกับเรื่องนี้ผมจะแนะนำให้ไปดูที่หนังสือเล่มล่าสุดของเขาหลายตัวแปรการสร้างแบบจำลองและการวิเคราะห์หลายตัวแปรสำหรับพฤติกรรมศาสตร์

สำหรับ 'ตัวแปร' ผมจะบอกว่านี้เป็นวิธีการทั่วไปในการอ้างถึงตัวแปรสุ่มใดที่เป็นไปตามการกระจายเป็นที่รู้จักหรือตั้งสมมติฐานเช่นเราพูดถึง variates เกาส์เป็นชุดของการสังเกตมาจากการกระจายปกติ (มีพารามิเตอร์μและσ 2 ) ในแง่ความน่าจะเป็นเรากล่าวว่าเหล่านี้คือบางสุ่มเข้าใจของเอ็กซ์ด้วยความคาดหวังทางคณิตศาสตร์μและประมาณ 95% ของพวกเขาที่คาดว่าจะอยู่ในช่วง[ μ - 2 σ ; μ + 2 σ ]Xผมμσ2μ[μ-2σ;μ+2σ]


1
แม้แต่coursera.org/learn/machine-learning/home/week/2ใช้คำว่าการถดถอยหลายตัวแปรแทนการถดถอยหลายครั้ง ...
Franck Dernoncourt

ฉันคิดว่าความสับสนแบบเดียวกันเกิดขึ้นกับคนที่ใช้คำว่า GLM สำหรับโมเดลเชิงเส้นทั่วไป (เช่นในการศึกษา neuroimaging) กับโมเดลเชิงเส้นทั่วไป ฉันเคยเห็นหลาย ๆ กรณีของ "การถดถอยแบบหลายตัวแปรโลจิสติกส์" ที่มีเพียงผลลัพธ์เดียวและฉันไม่คิดว่าเรื่องนี้จะยาวตราบใดที่คำนั้นถูกกำหนดโดยผู้เขียนอย่างชัดเจน
chl

39

นี่คือสองตัวอย่างที่เกี่ยวข้องอย่างใกล้ชิดซึ่งแสดงให้เห็นถึงความคิด ตัวอย่างเป็นศูนย์กลางของสหรัฐอเมริกา แต่ความคิดสามารถคาดการณ์ไปยังประเทศอื่น ๆ

ตัวอย่างที่ 1

สมมติว่ามหาวิทยาลัยต้องการที่จะปรับแต่งเกณฑ์การรับเข้าเรียนเพื่อให้พวกเขายอมรับนักศึกษาที่ดีขึ้น นอกจากนี้สมมติว่าเกรดเฉลี่ยของนักเรียน (GPA) เป็นสิ่งที่มหาวิทยาลัยต้องการใช้เป็นตัวชี้วัดประสิทธิภาพสำหรับนักเรียน พวกเขามีเกณฑ์หลายข้อเช่น GPA (HSGPA), SAT SAT (SAT), เพศและอื่น ๆ และต้องการทราบว่าหนึ่งในเกณฑ์เหล่านี้เกี่ยวข้องกับเกรดเฉลี่ย

การแก้ไข: การถดถอยหลายครั้ง

ในบริบทข้างต้นมีตัวแปรตามหนึ่งตัว (GPA) และคุณมีตัวแปรอิสระหลายตัว (HSGPA, SAT, เพศ ฯลฯ ) คุณต้องการค้นหาว่าตัวแปรอิสระตัวใดตัวหนึ่งเป็นตัวทำนายที่ดีสำหรับตัวแปรตามของคุณ คุณจะใช้การถดถอยหลายครั้งเพื่อทำการประเมินนี้

ตัวอย่างที่ 2

แทนที่จะเป็นสถานการณ์ที่กล่าวมาข้างต้นสมมติว่าฝ่ายธุรการต้องการติดตามผลการเรียนของนักเรียนตลอดเวลาและประสงค์จะกำหนดว่าเกณฑ์ใดเกณฑ์หนึ่งของพวกเขาจะผลักดันผลการปฏิบัติงานของนักเรียนข้ามเวลา กล่าวอีกนัยหนึ่งพวกเขามีคะแนนเกรดเฉลี่ยเป็นเวลาสี่ปีที่นักเรียนอยู่ในโรงเรียน (พูด GPA1, GPA2, GPA3, GPA4) และพวกเขาต้องการที่จะรู้ว่าตัวแปรอิสระตัวใดตัวหนึ่งทำนายคะแนน GPA ได้ดีขึ้นทุกปี ปีพื้นฐาน สำนักงานการรับสมัครหวังว่าจะพบว่าตัวแปรอิสระเดียวกันทำนายประสิทธิภาพตลอดทั้งสี่ปีเพื่อให้เกณฑ์การคัดเลือกของพวกเขามั่นใจได้ว่าผลการเรียนของนักเรียนจะสูงอย่างต่อเนื่องตลอดทั้งสี่ปี

วิธีแก้ปัญหา: การถดถอยหลายตัวแปร

ในตัวอย่างที่ 2 เรามีตัวแปรหลายตัว (เช่น GPA1, GPA2, GPA3, GPA4) และตัวแปรอิสระหลายตัว ในสถานการณ์เช่นนี้คุณจะใช้การถดถอยหลายตัวแปร


2
มีเสมอหนึ่งที่ต้องตอบคำถามกับตัวอย่าง :)
Tjorriemorrie

100% คำตอบที่ดีที่สุดที่คุณสามารถเข้าใจได้จริง ๆ
Alvis

21

YxY=(x)

Y=(x1,x2,...,xn)

Y1,Y2,...,Yม.=(x1,x2,...,xn)Y11,Y12,...x11,x12,...Y=(X)

อ่านเพิ่มเติม:


ฉันเข้าใจคำจำกัดความ แต่อะไรคือผลของการรักษาความถดถอยแบบหลายตัวแปรในฐานะที่เป็นระบบของการถดถอยแบบ uni-variate
LKS

@LKS: คุณอาจต้องการที่จะถามว่าในคำถามที่แยกต่างหากอย่างสมบูรณ์
stackoverflowuser2010


คำตอบใน Quora หมายถึงหน้านี้หรือไม่? : P
Habeeb Perwad

4

ฉันคิดว่าข้อมูลเชิงลึกที่สำคัญ (และความแตกต่าง) ที่นี่นอกเหนือจากจำนวนของตัวแปรทั้งสองข้างของสมการคือสำหรับกรณีของการถดถอยหลายตัวแปรเป้าหมายคือการใช้ประโยชน์จากความจริงที่ว่ามีความสัมพันธ์ระหว่างตัวแปรตอบสนอง (หรือโดยทั่วไป) ผล) ตัวอย่างเช่นในการทดลองทางการแพทย์ตัวทำนายอาจเป็นน้ำหนักอายุและเชื้อชาติและตัวแปรผลลัพธ์คือความดันโลหิตและคอเลสเตอรอล ในทางทฤษฎีเราสามารถสร้างแบบจำลอง "การถดถอยแบบหลายจุด" สองแบบแบบหนึ่งความดันโลหิตแบบหนึ่งต่อน้ำหนักอายุและเชื้อชาติและแบบจำลองที่สองที่ควบคุมระดับโคเลสเตอรอลในปัจจัยเดียวกัน อย่างไรก็ตามอีกวิธีหนึ่งเราสามารถสร้างแบบจำลองการถดถอยหลายตัวแปรเดียวที่ทำนายทั้งสองอย่างความดันโลหิตและคอเลสเตอรอลพร้อมกันขึ้นอยู่กับตัวแปรทำนายสามตัว แนวคิดที่ว่าแบบจำลองการถดถอยหลายตัวแปรอาจดีกว่า (คาดการณ์ได้มากกว่า) จนถึงระดับที่สามารถเรียนรู้เพิ่มเติมได้จากความสัมพันธ์ระหว่างความดันโลหิตและคอเลสเตอรอลในผู้ป่วย


จุดที่ดี ฉันสงสัยว่าการถดถอยหลายตัวแปรสามารถทำได้ด้วย R. โดยใช้ Manova ฉันสามารถทำ ANOVA หลายตัวแปร แต่ไม่สามารถรับค่าสัมประสิทธิ์เช่นการถดถอยเชิงเดี่ยว
KarthikS

1

ในการถดถอยหลายตัวแปรมีมากกว่าหนึ่งตัวแปรขึ้นอยู่กับความแปรปรวนที่แตกต่างกัน (หรือการกระจาย) ตัวแปรตัวทำนายอาจมากกว่าหนึ่งตัวหรือหลายตัว ดังนั้นมันอาจเป็นการถดถอยหลายครั้งพร้อมเมทริกซ์ของตัวแปรตามเช่นตัวแปรหลายตัว แต่เมื่อเราบอกว่าการถดถอยหลายครั้งเราหมายถึงเพียงหนึ่งตัวแปรขึ้นอยู่กับการกระจายหรือความแปรปรวนเดียว ตัวแปรตัวทำนายมีมากกว่าหนึ่งตัว เพื่อสรุปหลายรายการหมายถึงตัวแปรทำนายมากกว่าหนึ่งตัวแปร แต่หลายตัวแปรหมายถึงตัวแปรตามมากกว่าหนึ่งตัว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.