ในการวิเคราะห์การถดถอยทำไมเราจึงเรียกตัวแปรอิสระว่า "อิสระ"


30

ฉันหมายถึงตัวแปรบางตัวนั้นมีความสัมพันธ์กันอย่างมาก เรานิยามว่ามันเป็นตัวแปรอิสระอย่างไร / ทำไม / ในบริบทใด


1
นั่นเป็นประวัติศาสตร์และมาจากผลงานทางวิทยาศาสตร์ของฝรั่งเศส ฉันพยายามค้นหาข้อมูลอ้างอิง
Alecos Papadopoulos

1
ฉันจะเรียกชุดของตัวแปร "อาจขึ้นกับเพื่อนร่วม" เพื่อหลีกเลี่ยงการอนุมานสาเหตุ
QED

1
เป็นคำถามที่ดี!
Rafael Marazuela

คำตอบ:


29

หากเราดึงความสนใจไปที่การเรียนรู้ของเครื่องจักรในปัจจุบันและจำได้ว่าการวิเคราะห์ทางสถิติได้รับการพัฒนาสำหรับการศึกษาเชิงทดลองมากเพียงใดคำว่า "ตัวแปรอิสระ" นั้นสมเหตุสมผลดี

ในการศึกษาทดลองควบคุมตัวเลือกของยาเสพติดและความเข้มข้นของมันหรือตัวเลือกของปุ๋ยและปริมาณของมันต่อเอเคอร์ทำโดยอิสระจากผู้ตรวจสอบ สิ่งที่น่าสนใจคือการตอบสนองของตัวแปรที่น่าสนใจ (เช่นความดันโลหิตผลผลิตพืชผล) ขึ้นอยู่กับวิธีการทดลองเหล่านี้ เป็นการดีที่จะระบุลักษณะของตัวแปรอิสระอย่างแน่นหนาโดยไม่มีข้อผิดพลาดในการรู้ค่าของพวกเขา จากนั้นถดถอยเชิงเส้นมาตรฐานตัวอย่างแบบจำลองความแตกต่างระหว่างค่าของตัวแปรตามในแง่ของค่าของตัวแปรอิสระบวกข้อผิดพลาดที่เหลือ

แบบแผนทางคณิตศาสตร์แบบเดียวกับที่ใช้สำหรับการถดถอยในบริบทของการศึกษาเชิงทดลองที่ควบคุมสามารถนำไปใช้กับการวิเคราะห์ชุดข้อมูลที่สังเกตได้โดยไม่มีการจัดการทดลองน้อยดังนั้นจึงไม่น่าแปลกใจที่วลี "ตัวแปรอิสระ" ได้นำไปใช้กับประเภทของ การศึกษา แต่ดังที่คนอื่น ๆ ในหน้านี้บันทึกไว้นั่นอาจเป็นทางเลือกที่โชคร้ายโดยมี "ตัวทำนาย" หรือ "คุณสมบัติ" เหมาะสมกว่าในบริบทดังกล่าว


2
แต่การเลือกระดับของยานั้นขึ้นอยู่กับสิ่งที่ผู้ตรวจสอบทำซึ่งเป็นสาเหตุที่ทำให้ฉันจำไม่ได้ว่าตัวไหนเป็นยาตัวไหน
mdewey

ในการเรียนรู้ของเครื่อง "คุณสมบัติ" มักจะแฝงตัวแปรที่ไม่ได้สังเกต “ คุณสมบัติที่สังเกตได้” นั้นเป็นเรื่องปกติ
Neil G

18

ในหลาย ๆ ทาง "ตัวแปรอิสระ" เป็นตัวเลือกที่โชคร้าย ตัวแปรที่ไม่จำเป็นต้องมีความเป็นอิสระของแต่ละอื่น ๆ และแน่นอนไม่จำเป็นต้องเป็นอิสระจากตัวแปรYในการสอนและในหนังสือของฉันถดถอยการสร้างแบบจำลองกลยุทธ์ที่ผมใช้คำทำนาย ในบางสถานการณ์คำนั้นไม่แข็งแรงพอ แต่ก็ใช้งานได้ดีโดยเฉลี่ย คำอธิบายแบบเต็มเกี่ยวกับบทบาทของตัวแปร (ด้านขวามือ) ในแบบจำลองทางสถิติอาจใช้เวลานานเกินไปในแต่ละครั้ง: ชุดของตัวแปรหรือการวัดที่การกระจายของเป็นเงื่อนไข นี่เป็นอีกวิธีหนึ่งในการพูดถึงชุดของตัวแปรที่เราไม่สนใจ แต่เราให้คุณค่ากับค่าคงที่X YYXY


ดังนั้นคุณกำลังบอกว่าการเรียกตัวแปรอินพุทในฐานะ "อิสระ" เป็นการฝึกที่ผิด? @Frank
Amarpreet Singh

11
พวกเขาจะไม่ถือว่าเป็นอิสระจากสิ่งใดดังนั้นมันจึงเป็นการฝึกฝนที่ผิดใช้เฉพาะเพราะนิสัย
Frank Harrell

1
"ชุดของตัวแปรหรือการวัดที่การกระจายตัวของ Y เป็นเงื่อนไข" ... จริง ๆ แล้วฉันคิดว่าพวกเขาเป็น (และบางครั้งเรียกพวกเขา) "ตัวแปรปรับอากาศ" หรือ "ตัวแปรปรับอากาศ" ซึ่งไม่นาน คำอธิบายและทำงานตามธรรมชาติด้วยสัญกรณ์E(Y|X)
Silverfish

11

ฉันเห็นด้วยกับคำตอบอื่น ๆ ที่นี่ว่า "อิสระ" และ "ขึ้นอยู่กับ" เป็นคำศัพท์ที่ไม่ดี ในฐานะที่เป็นEdMอธิบายคำศัพท์นี้เกิดขึ้นในบริบทของการทดลองที่ควบคุมซึ่งนักวิจัยสามารถตั้งค่า regressors ให้เป็นอิสระจากกัน มีคำศัพท์ที่ดีกว่าหลายข้อที่ไม่ได้มีความหมายแฝงสาเหตุที่โหลดนี้และจากประสบการณ์ของฉันนักสถิติมักจะชอบคำที่เป็นกลางมากกว่า มีคำอื่น ๆ ที่ใช้ที่นี่รวมถึงต่อไปนี้:

Yixi,1,...,xi,mResponsePredictorsRegressandRegressorsOutput variableInput variablesPredicted variableExplanatory variables

โดยส่วนตัวแล้วฉันใช้คำอธิบายตัวแปรตัวแปรและตัวแปรตอบกลับเนื่องจากข้อกำหนดเหล่านั้นไม่มีความหมายแฝงของความเป็นอิสระทางสถิติหรือการควบคุม ฯลฯ (หนึ่งอาจโต้แย้งว่า 'การตอบสนอง' มีความหมายเชิงสาเหตุ แต่นี่เป็นความหมายแฝงที่ค่อนข้างอ่อนแอ ไม่พบปัญหา)


1
(+1) ฉันคิดว่า regressor / regressand เป็นคำที่เป็นกลางที่สุด แต่ฉันก็ชอบที่จะอธิบายโดยใช้คำอธิบาย / การตอบสนอง
Frans Rodenburg

2
ฉันเห็นด้วยกับแนวโน้มที่จะชอบคำที่เป็นกลาง แต่ "คำอธิบาย" ฟังดูเป็นสาเหตุที่น่าสนใจสำหรับฉันเช่นเดียวกับ: "ตัวแปร X อธิบายว่าทำไมตัวแปร Y ทำหน้าที่อย่างไร
timwiz

1
ฉันใช้มันเพื่ออธิบายความหมายในแง่ความน่าจะเป็น - มันอธิบายการเปลี่ยนแปลงในการกระจายตัวของตัวแปรตอบสนอง คุณอาจจะพูดถูก แต่ในทุกกรณีเหล่านี้ความหมายแฝงที่เป็นสาเหตุใด ๆ ที่อ่อนแอ
Reinstate Monica

2
คำอธิบายหมายถึงสาเหตุจึงไม่เหมาะสม
Frank Harrell

1
@ Frank: ฉันไม่จำเป็นต้องเห็นด้วยกับมุมมองนั้น คำอธิบายนั้นได้มาจากคำว่า "อธิบาย" ดังนั้นฉันจึงขอบอกเป็นนัยว่าตัวแปรอธิบายการตอบสนองของตัวแปรอย่างใด คำอธิบายนั้นอาจเป็นสาเหตุหรืออาจเป็นเพียงสถิติและฉันคิดว่ามันเป็นสิ่งสุดท้าย อย่างไรก็ตามปรากฏว่าผู้คนตีความความหมายของคำเหล่านี้แตกต่างกันดังนั้นฉันจะยอมรับว่าบางคนจะอ่านว่ามีความหมายเชิงสาเหตุ
Reinstate Monica

9

วิธีเพิ่มคำตอบของ Frank Harrell และ Peter Flom:

ฉันยอมรับว่าการเรียกตัวแปร "อิสระ" หรือ "ขึ้นอยู่กับ" มักทำให้เข้าใจผิด แต่บางคนก็ยังทำเช่นนั้น ฉันเคยได้ยินคำตอบว่าทำไม:

YXXYY X

Y


คุณกำลังบอกว่า Y ขึ้นอยู่กับ X (ดังนั้น Y เรียกว่าตัวแปรตาม) และโดยที่คุณหมายความว่า X ไม่ได้ขึ้นอยู่กับ Y แต่อาจมีกรณีที่ X สามารถพึ่งพา Y หรือสัมพันธ์กับ Y (ดังนั้นจึงสามารถ ไม่ถูกเรียกว่า "อิสระ" อีกต่อไป) มุมมองใด ๆ เกี่ยวกับเรื่องนี้?
Amarpreet Singh

ไม่ฉันไม่ได้หมายความว่า X ไม่ได้ขึ้นอยู่กับ Y ฉันแค่หมายความว่าคำอธิบายพื้นฐานที่สุดของการวิเคราะห์การถดถอยคือมันอธิบายว่า Y ขึ้นอยู่กับ X ดังนั้นชื่อพื้นฐานที่สุดสำหรับ Y จะเป็น "ขึ้นอยู่กับ" "
ŁukaszDeryło

6
ฉันไม่ได้พยายามตอบคำถามว่า "เราควรโทรหา X อิสระหรือไม่" แต่ค่อนข้าง "ทำไมเราถึงเรียกมันว่าเป็นอิสระ?" เช่นเดียวกับในชื่อโพสต์ของคุณ
ŁukaszDeryło

5

"ขึ้นอยู่กับ" และ "อิสระ" อาจทำให้คำศัพท์สับสน ความรู้สึกหนึ่งคือการหลอกสาเหตุหรือแม้กระทั่งสาเหตุและนี่คือสิ่งที่มีความหมายเมื่อพูดว่า "ตัวแปรอิสระ" และ "ตัวแปรตาม" เราหมายถึงว่า DV ในบางแง่ขึ้นอยู่กับ IV ตัวอย่างเช่นเมื่อสร้างแบบจำลองความสัมพันธ์ของความสูงและน้ำหนักในมนุษย์ที่เป็นผู้ใหญ่เราบอกว่าน้ำหนักคือ DV และส่วนสูงคือ IV

สิ่งนี้จับภาพบางสิ่งที่ "ตัวทำนาย" ไม่ได้ - คือทิศทางของความสัมพันธ์ ส่วนสูงทำนายน้ำหนัก แต่น้ำหนักก็ทำนายส่วนสูง นั่นคือถ้าคุณถูกบอกให้เดาความสูงของคนและบอกน้ำหนักของพวกเขานั่นจะเป็นประโยชน์

แต่เราจะไม่พูดว่าความสูงนั้นขึ้นอยู่กับน้ำหนัก


คุณมีความเฉพาะเจาะจงเกี่ยวกับรูปแบบ SEM หรือไม่?
Amarpreet Singh

ไม่ฉันคิดถึงการถดถอย
Peter Flom - Reinstate Monica

ตกลงดังนั้นมันเป็นเพียงชื่อ ฉันสับสนว่าการเรียกตัวแปรอินพุตเป็น "อิสระ" หมายถึงบางสิ่ง
Amarpreet Singh

12
DV และ IV เป็นตัวย่อทั่วไป (ซึ่งโดยส่วนตัวแล้วฉันไม่ชอบ) แต่ระวังนักเศรษฐศาสตร์จำนวนมากและนักวิทยาศาสตร์สังคมอื่น ๆ ที่ IV สามารถหมายถึงตัวแปรเครื่องมือเท่านั้น เป็นเรื่องธรรมดาที่จะพบกับผู้คนที่ DV สามารถหมายถึงดีโอ volente (พระเจ้าเต็มใจ) เท่านั้น
Nick Cox

0

จากคำตอบข้างต้นใช่ฉันยอมรับว่าตัวแปรตามและตัวแปรอิสระนี้เป็นคำศัพท์ที่อ่อนแอ แต่ฉันสามารถอธิบายบริบทที่มันถูกใช้โดยพวกเราหลายคน คุณบอกว่าสำหรับปัญหาการถดถอยทั่วไปเรามีตัวแปรเอาท์พุท, พูด Y, ซึ่งค่าขึ้นอยู่กับตัวแปรอินพุตอื่น, พูด x1, x2, x3 นั่นคือเหตุผลที่เรียกว่า "ตัวแปรตาม" และคล้ายกันขึ้นอยู่กับบริบทนี้เท่านั้นและเพื่อแยกความแตกต่างระหว่าง Output และ Input Variable, x1, x2, x3 ถูกเรียกว่าเป็นตัวแปรอิสระ เพราะต่างจาก Y มันไม่ได้ขึ้นอยู่กับตัวแปรอื่น ๆ (แต่ใช่ที่นี่เราไม่ได้พูดถึงการพึ่งพาตนเอง)


คุณตอบกลับคล้ายกับของ @Ramya R.
Amarpreet Singh

-2

ตัวแปรอิสระถูกเรียกว่าเป็นอิสระเพราะมันไม่ได้ขึ้นอยู่กับตัวแปรอื่น ๆ ตัวอย่างเช่นพิจารณาปัญหาการทำนายราคาบ้าน สมมติว่าเรามีข้อมูลเกี่ยวกับ house_size สถานที่และ house_price ที่นี่ house_price ถูกกำหนดโดยพิจารณาจาก house_size และตำแหน่ง แต่ที่ตั้งและ house_size สามารถแตกต่างกันไปสำหรับบ้านที่แตกต่างกัน


4
บางครั้งตัวแปรที่เรียกว่า "อิสระ" ในการถดถอยมีความสัมพันธ์กัน ดังนั้นพวกเขาจึงไม่จำเป็นต้องเป็นอิสระทางสถิติ มันจะเป็นการดีกว่าถ้าจะเรียกพวกมันว่าตัวแปรทำนาย
Michael R. Chernick

Micheal ขอบคุณที่ชี้ให้เห็น ฉันมีคำถามติดตาม ในกรณีที่เรามีตัวแปรทำนายสองตัวที่เป็น collinear เราจะไม่ทิ้งหนึ่งในนั้นเพื่อกำจัดปัญหาความหลากสีเพื่อให้ตัวแปรทำนายของเราเป็นอิสระจากกัน
Ramya R

1
ไม่จำเป็น. ขึ้นอยู่กับว่ามันจะส่งผลกระทบต่อความมั่นคงของการประมาณการหรือไม่และการคาดการณ์ที่แข็งแกร่งขึ้นก็คือเมื่อรวมตัวแปรทั้งสองเข้าด้วยกัน หากตัวแปรสองตัวมีค่าสหสัมพันธ์ 0.1 พวกเขาจะไม่เป็นอิสระ แต่ความสัมพันธ์ระหว่างพวกเขาจะอ่อนแอ
Michael R. Chernick
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.