ผลรวมของตัวแปรสองตัวสามารถอธิบายความแปรปรวนได้มากกว่าตัวแปรแต่ละตัวอย่างไร


13

ฉันได้รับผลลัพธ์ที่น่าสงสัยสำหรับความสัมพันธ์ของผลรวมกับตัวแปรที่สามเมื่อตัวทำนายสองตัวนั้นมีความสัมพันธ์เชิงลบ อะไรทำให้เกิดผลลัพธ์ที่น่างงงวยเหล่านี้

ตัวอย่างที่ 1: ความสัมพันธ์ระหว่างผลรวมของตัวแปรสองตัวกับตัวแปรตัวที่สาม

พิจารณาสูตร 16.23 ในหน้า 427 ของข้อความ 1965 ของ Guildford ดังที่แสดงด้านล่าง

การค้นหาที่น่าสงสัย: หากตัวแปรทั้งสองมีความสัมพันธ์กับ. 2 กับตัวแปรที่สามและมีความสัมพันธ์กับ -.7 ซึ่งกันและกันสูตรจะส่งผลให้มีค่าเท่ากับ. 52 ความสัมพันธ์ของผลรวมกับตัวแปรที่สามจะเป็น. 52 ได้อย่างไรถ้าทั้งสองตัวแปรนั้นสัมพันธ์กันเพียง. 2 กับตัวแปรที่สาม

ตัวอย่างที่ 2: ความสัมพันธ์หลายอย่างระหว่างตัวแปรสองตัวกับตัวแปรที่สามคืออะไร

พิจารณาสูตร 16.1 ในหน้า 404 ของข้อความ 1965 ของ Guildford (แสดงด้านล่าง)

การค้นหาที่น่าสงสัย: สถานการณ์เดียวกัน หากตัวแปรทั้งสองมีความสัมพันธ์กับ. 2 กับตัวแปรที่สามและมีความสัมพันธ์กับ -.7 ซึ่งกันและกันสูตรจะส่งผลให้มีค่าเท่ากับ. 52 ความสัมพันธ์ของผลรวมกับตัวแปรที่สามจะเป็น. 52 ได้อย่างไรถ้าทั้งสองตัวแปรนั้นสัมพันธ์กันเพียง. 2 กับตัวแปรที่สาม

ฉันลองใช้การจำลองแบบมอนติคาร์โลอย่างรวดเร็วและยืนยันผลของสูตร Guilford

แต่หากผู้ทำนายสองคนแต่ละคนทำนายความแปรปรวนของตัวแปรที่สามได้ 4% ผลรวมของพวกเขาจะทำนายความแปรปรวน 1/4 ได้อย่างไร

สหสัมพันธ์ของผลรวมของสองตัวแปรกับตัวแปรที่สาม หลายค่าสหสัมพันธ์ของสองตัวแปรกับตัวแปรที่สาม

ที่มา: สถิติพื้นฐานทางจิตวิทยาและการศึกษา, ฉบับที่ 4, 1965

ชี้แจง

สถานการณ์ที่ฉันจัดการเกี่ยวข้องกับการคาดการณ์ผลการดำเนินงานในอนาคตของแต่ละบุคคลตามการวัดความสามารถของพวกเขาในขณะนี้

แผนภาพสองเวนน์ด้านล่างแสดงให้เห็นถึงความเข้าใจของฉันเกี่ยวกับสถานการณ์และมีความหมายที่จะชี้แจงปริศนาของฉัน

แผนภาพ Venn นี้ (รูปที่ 1) แสดงคำสั่งเป็นศูนย์ r = .2 ระหว่าง x1 และ C ในฟิลด์ของฉันมีตัวแปรตัวทำนายหลายตัวที่ทำนายเกณฑ์อย่างถ่อมตัว

รูปที่ 1

แผนภาพ Venn นี้ (รูปที่ 2) สะท้อนถึงตัวทำนายสองตัว ได้แก่ x1 และ x2 แต่ละตัวทำนาย C ที่ r = .2 และตัวทำนายสองตัวมีความสัมพันธ์เชิงลบ r = -. 7

รูปที่ 2

ฉันสูญเสียการมองเห็นความสัมพันธ์ระหว่างตัวทำนายสอง r = .2 ที่จะทำให้พวกเขาทำนายความแปรปรวนของ C ได้ 25%

ฉันขอความช่วยเหลือในการทำความเข้าใจความสัมพันธ์ระหว่าง x1, x2 และ C

หาก (ตามคำแนะนำของบางคนในการตอบคำถามของฉัน) x2 ทำหน้าที่เป็นตัวยับยั้งตัวแปรสำหรับ x1 พื้นที่ใดในแผนภาพ Venn ที่สองถูกระงับ

หากตัวอย่างที่เป็นรูปธรรมน่าจะมีประโยชน์เราสามารถพิจารณา x1 และ x2 เป็นความสามารถของมนุษย์สองคนและ C เป็น GPA ระดับวิทยาลัย 4 ปีหลังจาก 4 ปี

ฉันกำลังมีปัญหาในการมองเห็นว่าตัวแปรตัวยับยั้งอาจทำให้เกิดความแปรปรวน 8% ที่อธิบายได้ของสอง r = .2 ศูนย์ลำดับ r เพื่อขยายและอธิบาย 25% ของความแปรปรวนของ C ตัวอย่างที่เป็นรูปธรรมจะเป็นคำตอบที่มีประโยชน์มาก


มีกฎง่ายๆในสถิติที่ความแปรปรวนของผลรวมของชุดตัวแปรอิสระเท่ากับผลรวมของความแปรปรวน
Mike Hunter

@DJohnson ความคิดเห็นของคุณเกี่ยวข้องกับคำถามที่ถามอย่างไร
Joel W.

ขออภัยฉันไม่เข้าใจคำถาม สำหรับฉันมันชัดเจนว่ามันเกี่ยวข้องอย่างไร นอกจากนี้ยังเป็นความคิดเห็นที่ไม่มีสิทธิ์ได้รับรางวัลหรือต้องการรายละเอียดเพิ่มเติม
Mike Hunter

1
@DJohnson ความคิดเห็นของคุณเกี่ยวข้องกับคำถามที่ถามอย่างไร สำหรับฉันมันไม่ชัดเจนว่ามันเกี่ยวข้องอย่างไร
Joel W.

2
คำถามของคุณเกี่ยวกับความหมายของการดู N อาจได้รับการตอบสนองที่ดีขึ้นในเว็บไซต์ Meta CV
mdewey

คำตอบ:


3

สิ่งนี้สามารถเกิดขึ้นได้เมื่อตัวทำนายสองตัวทั้งคู่มีปัจจัยรบกวนขนาดใหญ่ แต่มีเครื่องหมายตรงข้ามดังนั้นเมื่อคุณเพิ่มพวกมันเข้าไปแล้วสิ่งรบกวนจะถูกยกเลิกและคุณจะได้ใกล้ชิดกับตัวแปรที่สามมากขึ้น

ลองยกตัวอย่างที่มีตัวอย่างมากขึ้น สมมติว่าเป็นตัวแปรสุ่มแบบอิสระมาตรฐาน ตอนนี้ให้X,YN(0,1)

A=X

B=X+0.00001Y

สมมติว่าเป็นตัวแปรที่สามของคุณA , Bเป็นตัวทำนายสองตัวและXเป็นตัวแปรแฝงที่คุณไม่รู้อะไรเลย ความสัมพันธ์ของ A กับ Y คือ 0 และความสัมพันธ์ของ B กับ Y นั้นน้อยมากใกล้กับ 0.00001 * แต่ความสัมพันธ์ของA + BกับYคือ 1YA,BXA+BY

* มีการแก้ไขเล็ก ๆ น้อย ๆ สำหรับค่าเบี่ยงเบนมาตรฐานของ B ที่เป็นมากกว่า 1 เล็กน้อย


สถานการณ์แบบนี้เกิดขึ้นในสังคมศาสตร์หรือไม่?
Joel W.

1
ในศัพท์แสงทางสังคมศาสตร์นี้เป็นเพียงผลกระทบที่รุนแรงรบกวนผลกระทบที่อ่อนแอในรูปแบบเฉพาะ ฉันไม่ได้เป็นผู้เชี่ยวชาญด้านสังคมศาสตร์ แต่ฉันไม่สามารถจินตนาการได้ว่าเป็นการยากที่จะหาตัวอย่าง
พอล

คุณอาจมีตัวอย่างจากวิทยาศาสตร์ทางกายภาพบ้างไหม?
Joel W.

ความสัมพันธ์ที่คุณอธิบายสามารถแสดงในแผนภาพ Venn ได้หรือไม่?
Joel W.

ฉันจะไม่หา Venn diagram ที่เป็นประโยชน์ที่นี่ แต่ถ้าคุณต้องการฉันจะวาด B เป็นสี่เหลี่ยมแล้วแยกออกเป็นสอง sub-rectang หนึ่งใหญ่อ้วน A และผอมเล็ก Y. Summing A และ B คือ ยกเลิกส่วนใหญ่ A และออกจากส่วนเล็ก ๆ Y
Paul

10

มันจะมีประโยชน์ในการเข้าใจตัวแปรทั้งสามว่าเป็นการรวมกันเชิงเส้นของตัวแปรที่ไม่เกี่ยวข้องอื่น ๆ เพื่อปรับปรุงความเข้าใจของเราเราอาจพรรณนาเชิงเรขาคณิตทำงานกับพวกเขาเกี่ยวกับพีชคณิตและให้คำอธิบายทางสถิติตามที่เราต้องการ

XYZ

U=X,V=(7X+51Y)/10;W=(3X+17Y+55Z)/75.

คำอธิบายทางเรขาคณิต

กราฟิกต่อไปนี้เกี่ยวกับสิ่งที่คุณต้องการเพื่อทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรเหล่านี้

รูป

UVWU+VX,Y,ZUVUVWUVWสร้างมุมแหลม (ประมาณ 45 องศา): มันมีความสัมพันธ์เชิงบวกที่สูงอย่างไม่คาดคิด


การคำนวณพีชคณิต

สำหรับผู้ที่ต้องการความแม่นยำมากขึ้นนี่คือพีชคณิตเพื่อสำรองเรขาคณิตในกราฟิก

UVW

Cor(U,V)=Cov(U,V)=E(UV)=E(51XY7X2)/10=7/10=0.7

XY

Cor(U,W)=3/75=1/5=0.2

และ

Cor(V,W)=(73+1517)/(1075)=1/5=0.2.

สุดท้าย

Cor(U+V,W)=Cov(U+V,W)Var(U+V)Var(W)=1/5+1/5Var(U)+Var(V)+2Cov(U,V)=2/51+12(7/10)=2/53/50.5164.

ดังนั้นตัวแปรทั้งสามนี้จึงมีความสัมพันธ์ที่ต้องการ


คำอธิบายทางสถิติ

ตอนนี้เราสามารถเห็นได้ว่าทำไมทุกอย่างทำงานเหมือน:

  • UV7/10VUY

  • UW1/5WUYZ

  • VW1/5W75

    • 17YV
    • 3XV
    • Z
  • U+V=(3X+51Y)/10=3/100(3X+17Y)WWZ


มีวิธีที่จะแสดงสิ่งนี้ในแผนภาพ Venn หรือไม่? แม้จะมีคณิตศาสตร์ แต่ฉันก็ยังไม่เห็นตรรกะของผลรวมของตัวแปรสองตัวที่อธิบาย 25 +% ของความแปรปรวนของตัวแปรที่สามเมื่อแต่ละตัวแปรสองตัวที่ปิดลงในการทำนายผลรวม แต่ 4% ของความแปรปรวนของตัวแปรที่สามนั้น . 8% อธิบายความแปรปรวนกลายเป็น 25% อธิบายความแปรปรวนเพียงแค่เพิ่มตัวแปรสองตัวได้อย่างไร
Joel W.

นอกจากนี้ยังมีการใช้งานจริงของปรากฏการณ์แปลก ๆ นี้หรือไม่?
Joel W.

หากแผนภาพ Venn ไม่เหมาะสมที่จะแสดงความแปรปรวนที่อธิบายคุณสามารถบอกฉันได้ว่าทำไมมันไม่เหมาะสม
Joel W.

@JoelW คำตอบที่ดีที่นี่สัมผัสได้ว่าทำไมไดอะแกรมของเวนน์ไม่ได้ขึ้นอยู่กับหน้าที่อธิบายปรากฏการณ์นี้ (ไปจนสุดคำตอบ): stats.stackexchange.com/a/73876/5829
Jake Westfall

Joel, Cohens ใช้แผนภาพคล้าย Venn พวกเขาเรียกว่า "Ballantine" เพื่อวิเคราะห์ความแปรปรวน ดูww2.amstat.org/publications/jse/v10n1/kennedy.htmlเป็นต้น คุณควรถามคำถามตรงข้ามว่าแอปพลิเคชันของการแปรปรวนและการย่อยสลายความแปรปรวนนั้นไม่สามารถใช้งานได้จริง
whuber

5

อีกตัวอย่างง่ายๆ:

  • zN(0,1)
  • x1N(0,1)
  • x2=zx1z=x1+x2

แล้ว:

  • Corr(z,x1)=0
  • Corr(z,x2).7
  • Corr(z,x1+x2)=1

เรขาคณิตสิ่งที่เกิดขึ้นเป็นเหมือนในกราฟิกของ WHuber แนวคิดอาจมีลักษณะเช่นนี้: ป้อนคำอธิบายรูปภาพที่นี่

E[XY]

x1zθ

  • Corr(z,x1)=cosθzx1=0θz,x1=π2
  • Corr(z,x2)=cosθzx2.7θz,x2=π4
  • Corr(z,x1+x2)=cosθz,x1+x2=1θz,x1+x2=0

zx1x2zx1x1x2x1x2


(+1) ตัวอย่างที่ดี!
user795305

โปรดอธิบายสถานที่ของคำตอบของคุณ หลังจากวางตำแหน่ง z = x1 + x2 ทำไมต้องพูดว่า“ แล้ว Corr (z, x1) = 0” คุณกำลังพูดว่า Corr (z, x1) = 0 ตามจากคำสั่ง Let แรกของคุณหรือความสัมพันธ์ของศูนย์เป็นข้อสันนิษฐานเพิ่มเติมหรือไม่? หากเป็นข้อสันนิษฐานเพิ่มเติมเหตุใดสถานการณ์ในคำถามเดิมจึงจำเป็นต้องมีการสันนิษฐานเพิ่มเติม
Joel W.

zx1zx1zx1x2

@MatthewGunn ทอนที่สามของคุณบอกว่า z = x1 + x2 ดูเหมือนว่าจะละเมิดสอง Lets แรกของคุณที่บอกว่า z และ x1 นั้นเป็นอิสระ
Joel W.

1
z=x1+x2zx1

3

พูดถึงความคิดเห็นของคุณ:

แม้จะมีคณิตศาสตร์ แต่ฉันก็ยังไม่เห็นตรรกะของผลรวมของตัวแปรสองตัวที่อธิบาย 25 +% ของความแปรปรวนของตัวแปรที่สามเมื่อแต่ละตัวแปรสองตัวที่ปิดลงในการทำนายผลรวม แต่ 4% ของความแปรปรวนของตัวแปรที่สามนั้น . 8% อธิบายความแปรปรวนกลายเป็น 25% อธิบายความแปรปรวนเพียงแค่เพิ่มสองตัวแปรได้อย่างไร

ปัญหาที่นี่ดูเหมือนจะเป็นคำศัพท์ "อธิบายความแปรปรวน" เช่นเดียวกับคำศัพท์ในสถิติจำนวนมากสิ่งนี้ได้รับเลือกให้ดูเหมือนว่ามีความหมายมากกว่าที่เป็นจริง

Y

y=(6,7,4,8,9,6,6,3,5,10)

UYRRY

r=(20,80,100,90,50,70,40,30,40,60)

U=R+0.1Y

u=(19.4,79.3,100.4,90.8,50.9,70.6,40.6,30.3,40.5,61.0)

V=R+0.1Y

v=(20.6,80.7,99.6,89.2,49.1,69.4,39.4,29.7,39.5,59.0)

UVYr0.2YY

YUURVRYU+V

พล็อตของตัวแปรแต่ละตัว

ABBA


@ naught101 ได้สร้างตัวเลขเพื่อแสดงให้เห็นถึงตัวแปรของคุณ Flounderer คุณอาจต้องการดูว่ารวมพวกเขาสนใจคุณหรือไม่
gung - Reinstate Monica

แน่นอนว่าแก้ไขได้ตามที่คุณต้องการ ฉันไม่สามารถดู imgur ในที่ทำงานได้ แต่ฉันแน่ใจว่ามันใช้ได้
Flounderer

ฉันปฏิเสธคำแนะนำ b / c ฉันไม่เห็นว่าเขาติดต่อคุณที่นี่ คุณสามารถอนุมัติได้โดยไปที่คิวการแก้ไขที่แนะนำ
gung - Reinstate Monica

ตัวอย่างที่คุณให้นั้นน่าสนใจถ้าออกแบบอย่างระมัดระวัง แต่สถานการณ์ที่ฉันนำเสนอนั้นกว้างกว่า (โดยที่ตัวเลขไม่ได้เลือกอย่างระมัดระวัง) และขึ้นอยู่กับ 2 ตัวแปร N (0,1) แม้ว่าเราจะเปลี่ยนคำศัพท์จาก "อธิบาย" เป็น "แบ่งปัน" คำถามก็ยังคงอยู่ วิธีการสุ่มตัวแปร 2 ตัวแต่ละตัวที่มีความแปรปรวนร่วมกัน 4% กับตัวแปรที่สามสามารถรวมกันในรูปของผลรวมอย่างง่ายที่ตามสูตรมีความแปรปรวนร่วมกัน 25% กับตัวแปรที่สามได้อย่างไร นอกจากนี้หากเป้าหมายคือการคาดการณ์มีแอปพลิเคชันที่ใช้งานจริงในโลกแห่งความแปรปรวนร่วมที่เพิ่มขึ้นอย่างแปลกประหลาดนี้หรือไม่
Joel W.

ที่ใดก็ได้ในอุปกรณ์อิเล็กทรอนิกส์เมื่อคุณมี (เสียงดัง + สัญญาณอ่อนแอ) + (- เสียงดัง) = สัญญาณอ่อนคุณจะต้องใช้สิ่งนี้ ตัวอย่างเช่นหูฟังตัดเสียงรบกวน
Flounderer
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.