ความสัมพันธ์ระหว่างมุมฉากความสัมพันธ์และความเป็นอิสระคืออะไร?


25

ฉันได้อ่านบทความที่บอกว่าเมื่อใช้การเปรียบเทียบความแตกต่างที่วางแผนไว้เพื่อค้นหาวิธีการที่แตกต่างกันในการวิเคราะห์ความแปรปรวนทางเดียวคอนดิชั่นเนอร์ควรเป็นมุมฉากเพื่อไม่ให้สัมพันธ์กันและป้องกันข้อผิดพลาดประเภทที่ 1

ฉันไม่เข้าใจว่าทำไมฉากมุมฉากถึงไม่เกี่ยวข้องกันไม่ว่าในกรณีใด ๆ ฉันไม่สามารถหาคำอธิบายที่เข้าใจง่าย / เข้าใจง่ายดังนั้นฉันจึงพยายามเข้าใจบทความ / คำตอบ

https://www.psych.umn.edu/faculty/waller/classes/FA2010/Readings/rodgers.pdf

มุมฉากมีความหมายอย่างไรในบริบทของสถิติ

แต่สำหรับฉันพวกเขาขัดแย้งกัน คนแรกบอกว่าถ้าสองตัวแปร uncorrelated และ / หรือ orthogonal แล้วพวกเขาก็เป็นอิสระเป็นเส้นตรง แต่ความจริงที่ว่าพวกเขาเป็นอิสระเชิงเส้นตรงไม่ได้หมายความว่าพวกเขาจะไม่เกี่ยวข้องกันและ / หรือ orthogonal

ตอนนี้ในลิงค์ที่สองมีคำตอบว่าสิ่งที่รัฐเช่น "orthogonal หมายถึง uncorrelated" และ "ถ้า X และ Y เป็นอิสระแล้วพวกเขาจะ Orthogonal แต่การสนทนาไม่เป็นความจริง"

ความคิดเห็นที่น่าสนใจอีกข้อหนึ่งในการเชื่อมโยงครั้งที่สองที่สัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสองตัวเท่ากับโคไซน์ของมุมระหว่างเวกเตอร์สองตัวที่สอดคล้องกับตัวแปรเหล่านี้ซึ่งบอกว่าเวกเตอร์มุมฉากทั้งสองนั้นไม่เกี่ยวข้องกันอย่างสมบูรณ์ การเรียกร้อง)

ดังนั้นความสัมพันธ์ที่แท้จริงระหว่างอิสรภาพมุมฉากและสหสัมพันธ์คืออะไร บางทีฉันอาจจะพลาดอะไรบางอย่าง แต่ฉันไม่สามารถหาได้ว่ามันคืออะไร


1
ไม่มีคำตอบสำหรับคำถามที่แสดงว่า "เชื่อมโยง" และ "เกี่ยวข้อง" ทางด้านขวาของคำถามนี้หรือไม่?
Dilip Sarwate

2
ลิงก์ทั้งสองที่ฉันให้ดูเหมือนจะให้คำตอบที่ชัดเจน แต่ระบุสิ่งที่แตกต่างกันและเมื่อฉันดูคำถามที่เกี่ยวข้องฉันจะเห็นว่าคนที่ให้คำตอบนั้นไกลเกินกว่าจะเห็นด้วยกัน
Carl Levasseur

2
ความสับสน / การรับรู้ที่ขัดแย้งอาจเป็นเพราะความแตกต่างระหว่างความเป็นอิสระเชิงเส้นและความเป็นอิสระทางสถิติ
jona

1
ฉันคิดว่าข้อ จำกัด(ANOVA) ควรเป็นมุมฉากเป็นส่วนสำคัญของคำถามนี้: นี่ไม่ได้เป็นเพียงตัวแปรสุ่ม นอกจากนี้ยังมีการเน้นเป็นพิเศษเกี่ยวกับ "ความเป็นอิสระ" เมื่อเทียบกับคำถามที่เกี่ยวข้องอย่างใกล้ชิดที่ซีอานเสนอว่าเป็นไปได้ที่ซ้ำกัน (ในคำถามที่ OP กล่าวว่าพวกเขาเข้าใจ "ความเป็นอิสระ" ดังนั้นฉันขอแนะนำว่าไม่ใช่สิ่งที่ซ้ำกันและอย่างที่สอง @ โจนาที่ความสับสนอาจถูกห่อหุ้มด้วยความหมายหลายอย่างของ "อิสรภาพ"
Silverfish

1
ฉันยังเชื่อว่านี่ไม่ซ้ำกัน คำถามนั้นไม่ได้หมายถึงสหสัมพันธ์และคำตอบนั้นไม่ได้ให้รายละเอียดเกี่ยวกับความแตกต่างที่เป็นไปได้ระหว่าง orthogonality และ uncorrelatedness ยิ่งไปกว่านั้นเมื่อโปสเตอร์ชี้ให้เห็นว่ามีคำตอบที่ขัดแย้งกับคำถามที่เกี่ยวข้องที่แตกต่างกัน
A. Donda

คำตอบ:


39

ความเป็นอิสระเป็นแนวคิดทางสถิติ ตัวแปรสุ่ม สองตัวแปรและYมีความเป็นอิสระทางสถิติหากการแจกแจงร่วมของพวกเขาคือผลคูณของการแจกแจงที่ขอบนั่นคือ f ( x , y ) = f ( x ) f ( y ) ถ้าแต่ละตัวแปรมีความหนาแน่นfหรือมากกว่า F ( x , y ) = F ( x ) F ( y ) โดยที่FXY

(x,Y)=(x)(Y)
F(x,Y)=F(x)F(Y)
F หมายถึงแต่ละฟังก์ชันการแจกแจงสะสมแบบสุ่มของตัวแปร

ความสัมพันธ์เป็นแนวคิดทางสถิติที่อ่อนแอ แต่เกี่ยวข้อง ที่ (เพียร์สัน) ความสัมพันธ์ของตัวแปรสุ่มสองคือความคาดหวังของผลิตภัณฑ์ของตัวแปรมาตรฐานคือ ตัวแปรที่จะuncorrelatedถ้า0 มันสามารถแสดงให้เห็นว่าตัวแปรสุ่มสองตัวที่เป็นอิสระนั้นไม่จำเป็นต้องมีความสัมพันธ์กัน แต่ไม่ใช่ในทางกลับกัน

ρ=E[X-E[X]E[(X-E[X])2]Y-E[Y]E[(Y-E[Y])2]].
ρ=0

Orthogonalityเป็นแนวคิดที่เกิดขึ้นในเรขาคณิตและได้รับการทั่วไปในพีชคณิตเชิงเส้นและสาขาที่เกี่ยวข้องของคณิตศาสตร์ ในพีชคณิตเชิงเส้น orthogonality ของเวกเตอร์สองตัวและถูกกำหนดไว้ในช่องว่างภายในของผลิตภัณฑ์นั่นคือช่องว่างเวกเตอร์ที่มีผลิตภัณฑ์ภายในตามเงื่อนไขที่ ผลิตภัณฑ์ภายใน สามารถกำหนดได้หลายวิธี (ทำให้เกิดช่องว่างภายในของผลิตภัณฑ์ต่างกัน) หากเวกเตอร์จะได้รับในรูปแบบของการลำดับของตัวเลขจากนั้นเป็นทางเลือกทั่วไปคือสินค้า dot ,ยูโวลต์ยู,โวลต์

ยู,โวลต์=0
ยู=(ยู1,ยู2,...ยูn)ยู,โวลต์=Σผม=1nยูผมโวลต์ผมv_i

ดังนั้นความตั้งฉากจึงไม่ใช่แนวคิดทางสถิติต่อความสับสนที่คุณสังเกตเห็นอาจเป็นเพราะการแปลแนวคิดพีชคณิตเชิงเส้นที่แตกต่างกันไปเป็นสถิติ:

ก) อย่างเป็นทางการพื้นที่ของตัวแปรสุ่มถือได้ว่าเป็นพื้นที่เวกเตอร์ จากนั้นเป็นไปได้ที่จะกำหนดผลิตภัณฑ์ภายในในพื้นที่นั้นในรูปแบบต่างๆ ทางเลือกหนึ่งที่พบบ่อยคือการกำหนดเป็นความแปรปรวนร่วม: เนื่องจากความสัมพันธ์ของตัวแปรสุ่มสองตัวมีค่าเป็นศูนย์อย่างแน่นอนหากค่าความแปรปรวนร่วมเป็นศูนย์ตามคำจำกัดความ uncorrelatedness นี้เหมือนกับ orthogonality (ความเป็นไปได้อีกอย่างคือการกำหนดผลิตภัณฑ์ภายในของตัวแปรสุ่มอย่างง่าย ๆ ตามความคาดหวังของผลิตภัณฑ์ )

X,Y=โอโวลต์(X,Y)=E[(X-E[X])(Y-E[Y])].

b) ตัวแปรทั้งหมดที่เราพิจารณาในสถิติไม่ใช่ตัวแปรสุ่ม โดยเฉพาะอย่างยิ่งในการถดถอยเชิงเส้นเรามีตัวแปรอิสระที่ไม่ได้พิจารณาแบบสุ่ม แต่กำหนดไว้ล่วงหน้า ตัวแปรอิสระมักจะได้รับเป็นลำดับของตัวเลขซึ่งเป็นฉากที่ถูกกำหนดโดยธรรมชาติของผลิตภัณฑ์จุด (ดูด้านบน) จากนั้นเราสามารถตรวจสอบผลลัพธ์ทางสถิติของตัวแบบการถดถอยซึ่งตัวแปรอิสระนั้นอยู่หรือไม่ใช่แบบมุมฉาก ในบริบทนี้ orthogonality ไม่ได้มีคำจำกัดความทางสถิติโดยเฉพาะและยิ่งไปกว่านั้นมันไม่ได้ใช้กับตัวแปรสุ่ม

นอกจากนี้การตอบสนองต่อความคิดเห็นของ Silverfish: Orthogonality ไม่เพียง แต่เกี่ยวข้องกับความเคารพดั้งเดิม แต่ยังด้วยความเคารพความแตกต่างเพราะ (ชุด) ความแตกต่างง่าย ๆ (ระบุโดยเวกเตอร์ตรงกันข้าม) สามารถเห็นการเปลี่ยนแปลงของการออกแบบเมทริกซ์คือชุด ของตัวแปรอิสระลงในชุดตัวแปรอิสระใหม่ ความตั้งฉากสำหรับความเปรียบต่างถูกกำหนดผ่านผลิตภัณฑ์ดอท ถ้า regressors ดั้งเดิมเป็น orthogonal ร่วมกันและอีกอันหนึ่งใช้ orthogonal contrasts regressors ใหม่ก็จะเป็น orthogonal เหมือนกันเช่นกัน เพื่อให้แน่ใจว่าชุดของความแตกต่างที่สามารถมองเห็นทั้งอธิบายการสลายตัวของความแปรปรวนเช่นเข้าไปในผลกระทบหลักและการมีปฏิสัมพันธ์ความคิดพื้นฐานของการวิเคราะห์ความแปรปรวน

เนื่องจากความแตกต่างของก) ความไม่สัมพันธ์กันและความเป็น orthogonality เป็นเพียงชื่อที่แตกต่างกันสำหรับสิ่งเดียวกันในความคิดของฉันมันเป็นสิ่งที่ดีที่สุดที่จะหลีกเลี่ยงการใช้คำในแง่ที่ว่า ถ้าเราต้องการพูดถึงตัวแปรสุ่มที่ไม่เกี่ยวข้องกันเราจะพูดอย่างนั้นและไม่ทำให้เกิดความซับซ้อนโดยใช้คำอื่นที่มีพื้นหลังแตกต่างกันและมีความหมายต่างกัน สิ่งนี้ยังช่วยเพิ่มความสามารถในการคำศัพท์ที่ใช้ตามตัวแปร b) ซึ่งมีประโยชน์อย่างมากโดยเฉพาะอย่างยิ่งในการอภิปรายการถดถอยหลายครั้ง และอีกทางหนึ่งเราควรหลีกเลี่ยงการใช้คำที่สัมพันธ์กับตัวแปรอิสระเนื่องจากมันไม่ใช่ตัวแปรสุ่ม


การนำเสนอของ Rodgers และคณะเป็นส่วนใหญ่สอดคล้องกับมุมมองนี้โดยเฉพาะอย่างยิ่งเมื่อพวกเขาเข้าใจถึงความตั้งฉากที่แตกต่างจากความไม่สัมพันธ์กัน อย่างไรก็ตามพวกเขาใช้ความสัมพันธ์ของคำกับตัวแปรที่ไม่สุ่ม (ลำดับของตัวเลข) นี้จะทำให้ความรู้สึกทางสถิติเกี่ยวกับตัวอย่างค่าสัมประสิทธิ์สหสัมพันธ์ Rฉันยังคงแนะนำให้หลีกเลี่ยงการใช้คำนี้ยกเว้นว่าลำดับตัวเลขจะถือว่าเป็นลำดับของการรับรู้ของตัวแปรสุ่มR

ฉันได้กระจายลิงก์ไปยังคำตอบของคำถามสองข้อที่เกี่ยวข้องตลอดทั้งข้อความข้างต้นซึ่งจะช่วยให้คุณนำไปสู่บริบทของคำตอบนี้


1
+1 ความแตกต่างที่คุณทำที่นี่มีความชัดเจนและเป็นประโยชน์ - ฉันสนุกกับการอ่านโพสต์ทั้งหมด
whuber

+1 ฉันชอบวิธีการที่คุณสานต่อคำตอบอื่น ๆ ซึ่งอาจดูขัดแย้งกัน บางทีในส่วน (b) มันจะดีที่จะพูดถึงบางสิ่งบางอย่างโดยเฉพาะเกี่ยวกับการออกแบบการทดลองหรือ ANOVA (ตั้งแต่ที่กล่าวถึงในคำถามของ OP) - มันไม่ชัดเจนในบริบทของคำตอบของคุณทำไม "orthogonality" อาจน่าสนใจ หรือคุณสมบัติที่ต้องการของตัวแปรอิสระ
Silverfish

@Silverfish คุณพูดถูกฉันจะพยายามเพิ่มมัน
A. Donda

2
ฉันขอแตกต่างจากความคิดเห็นที่ยกย่องของผู้ค้าประเวณี ความหมายของความเป็นอิสระเป็นที่น่ากลัว: ดูเหมือนจะบ่งบอกว่าตัวแปรสุ่มและมีเดียวกันฟังก์ชันการแจกแจงความน่าจะเป็นที่สะสม (CDF หรือ CDF) ซึ่งจะแสดงที่นี่โดยcdot) และไม่มีและไม่ได้แสดงว่าแตกต่างกัน CDFS ของและYเป็นฟังก์ชั่นมูลค่าจริงของตัวแปรจริงและและแสดงถึงค่าของฟังก์ชั่นนี้ที่ตัวเลขและY F ( ) F ( x ) F ( y ) X Y F ( ) F ( x ) F ( y ) x y F X , Y ( x , y ) = F X ( x ) F Y ( y ) สำหรับทุกx และy ที่, - < x ,XYF()F(x)F(Y)XYF()F(x)F(Y)xY. การใช้ถ้อยคำที่ถูกต้องจะเป็น
FX,Y(x,Y)=FX(x)FY(Y) สำหรับทุกอย่าง x และ Y,-<x,Y<.
Dilip Sarwate

2
@DilipSarwate, puh-lease ...
A. Donda

0

นี่คือมุมมองที่ใช้งานง่ายของฉัน: การระบุว่า x และ y นั้นไม่เกี่ยวข้องกัน / orthogonal มีทั้งวิธีที่บอกว่าความรู้เกี่ยวกับค่าของ x หรือ y ไม่สามารถเปิดใช้การทำนายของอีก - x และ y เป็นอิสระจากกันและกัน - สมมติว่า ว่าความสัมพันธ์ใด ๆ เป็นเส้นตรง

สัมประสิทธิ์สหสัมพันธ์เป็นตัวบ่งชี้ว่าความรู้ของ x (หรือ y) ช่วยให้เราทำนาย y (หรือ x) ได้ดีเพียงใด สมมติว่าความสัมพันธ์เชิงเส้น

ในระนาบเวกเตอร์ตามแกน X สามารถเปลี่ยนแปลงได้ในขนาดโดยไม่มีการเปลี่ยนแปลงส่วนประกอบตามแกน Y - แกน X และ Y เป็น orthogonal และเวกเตอร์ตาม X คือ orthogonal ไปตาม Y ใด ๆ ไม่พร้อม X จะทำให้ทั้งองค์ประกอบ X และ Y แตกต่างกันไป เวกเตอร์ไม่มีมุมฉากเป็น Y อีกต่อไป

หากตัวแปรสองตัวไม่ได้มีความสัมพันธ์กันพวกมันจะเป็นแบบมุมฉากและถ้าตัวแปรสองตัวนั้นเป็นแบบมุมฉาก ความสัมพันธ์และ orthogonality แตกต่างกันเพียง แต่วิธีการแสดงความคิดเห็นเชิงพีชคณิตและเรขาคณิต - เทียบเท่า - พีชคณิต ในการเปรียบเทียบให้พิจารณาคำตอบของสมการเชิงเส้นในสองตัวแปรโดยการพล็อต (เรขาคณิต) และดีเทอร์มิแนนต์ (พีชคณิต)

ด้วยความเคารพต่อข้อสมมติเชิงเส้น - ให้ x เป็นเวลา, ให้ y เป็นฟังก์ชันไซน์ ในช่วงเวลาหนึ่ง x และ y เป็นทั้ง orthogonal และ uncorrelated โดยใช้วิธีการปกติสำหรับการคำนวณทั้งสอง อย่างไรก็ตามความรู้เกี่ยวกับ x ทำให้เราสามารถทำนาย y ได้อย่างแม่นยำ ลิเนียริตี้ (Linearity) เป็นลักษณะสำคัญของสหสัมพันธ์และความตั้งฉาก

แม้ว่าจะไม่ได้เป็นส่วนหนึ่งของคำถามฉันสังเกตว่าความสัมพันธ์และความไม่เอนโทฉากไม่ถือเอาเป็นเวรกรรม x และ y สามารถสัมพันธ์กันได้เนื่องจากทั้งคู่มีตัวแปรบางอย่างซ่อนเร้นพึ่งพาตัวแปรที่สาม การบริโภคไอศกรีมเพิ่มขึ้นในช่วงฤดูร้อนผู้คนไปที่ชายหาดบ่อยขึ้นในช่วงฤดูร้อน ทั้งสองมีความสัมพันธ์กัน แต่ไม่มี "สาเหตุ" ที่อื่น ดูhttps://en.wikipedia.org/wiki/Correlation_does_not_imply_causationสำหรับข้อมูลเพิ่มเติมเกี่ยวกับประเด็นนี้


ความไม่รู้และ orthogonality เป็นสิ่งที่แตกต่าง คุณสามารถตรวจสอบได้ที่นี่ - terpconnect.umd.edu/~bmomen/BIOM621/LineardepCorrOrthogonal.pdf
Yurii

0

นี่คือความสัมพันธ์: ถ้า X และ Y ไม่มีการเชื่อมโยงดังนั้น XE [X] จะเป็นมุมฉากกับ YE [Y]

ซึ่งแตกต่างจากที่เป็นอิสระเป็นแนวคิดที่แข็งแกร่งของ uncorrelated คืออิสระจะนำไปสู่ ​​uncorrelated (ไม่ใช่ -) orthogonal และ (un) มีความสัมพันธ์สามารถเกิดขึ้นได้ในเวลาเดียวกัน ตัวอย่าง

ฉันเป็น TA ของความน่าจะเป็นในภาคการศึกษานี้ดังนั้นฉันจึงทำวิดีโอสั้น ๆ เกี่ยวกับ Independence, Correlation, Orthogonality

https://youtu.be/s5lCl3aQ_A4

หวังว่ามันจะช่วย


นี่ไม่ได้ตอบคำถาม
Michael R. Chernick

ฉันแก้ไขคำตอบหวังว่านี่จะช่วยได้ ~ @ Michael Chernick
linan huang

@linanhuang ผู้คนจาก Larx?
YHH
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.