ใครสามารถอธิบายได้ว่าการพึ่งพาและความแปรปรวนเป็นศูนย์ได้อย่างไร


12

ใครบางคนสามารถอธิบายได้อย่างที่ Greg ทำ แต่ในรายละเอียดมากขึ้นตัวแปรสุ่มสามารถขึ้นอยู่กับได้อย่างไร แต่ไม่มีความแปรปรวนร่วมเป็นศูนย์? เกร็กโปสเตอร์ที่นี่ให้ตัวอย่างโดยใช้วงกลมที่นี่

ใครสามารถอธิบายกระบวนการนี้อย่างละเอียดมากขึ้นโดยใช้ลำดับขั้นตอนที่แสดงขั้นตอนหลายขั้นตอนได้หรือไม่?

นอกจากนี้หากคุณทราบตัวอย่างจากจิตวิทยาโปรดอธิบายด้วยแนวคิดนี้พร้อมตัวอย่างที่เกี่ยวข้อง โปรดแม่นยำและต่อเนื่องในคำอธิบายของคุณและระบุสิ่งที่อาจเกิดขึ้น


ลิงก์ไปยังบทความที่คุณอ้างถึงจะช่วย
gui11aume

1
ฉันค่อนข้างแน่ใจว่าหัวข้ออยู่ที่นี่: stats.stackexchange.com/questions/12842/ …และคำตอบของ Greg (Snow) อยู่ที่นี่: stats.stackexchange.com/a/12898/2073
Andy McKenzie

ตอนแรกฉันคิดว่าการปิดคำถามนี้ถูกต้อง แต่ฉันคิดว่าบางทีมันอาจจะถามคำถามที่แตกต่างอย่างละเอียดจากที่นี่stats.stackexchange.com/questions/12842/เนื่องจากกระทู้นั้นเพิ่งถามตัวอย่างทางคณิตศาสตร์ เหตุใดทั้งสองจึงไม่เทียบเท่ากัน
มาโคร

คำตอบ:


21

แนวคิดพื้นฐานที่นี่คือความแปรปรวนร่วมเพียงวัดการพึ่งพาประเภทหนึ่งเท่านั้นดังนั้นทั้งสองจึงไม่เท่ากัน โดยเฉพาะอย่างยิ่ง

  • ความแปรปรวนร่วมคือการวัดความสัมพันธ์เชิงเส้นของตัวแปรสองตัว หากตัวแปรสองตัวนั้นไม่มีความสัมพันธ์เชิงเส้นตรงตัวแปรนี้จะไม่สะท้อนให้เห็นในความแปรปรวนร่วม รายละเอียดเพิ่มเติมสามารถพบได้ที่นี่

  • การพึ่งพาระหว่างตัวแปรสุ่มหมายถึงความสัมพันธ์ประเภทใดก็ได้ระหว่างสองสิ่งที่ทำให้พวกเขากระทำ "กัน" ต่างจากที่พวกเขาทำ "ด้วยตนเอง" โดยเฉพาะการพึ่งพาระหว่างตัวแปรสุ่มช่วยให้ความสัมพันธ์ใด ๆ ระหว่างทั้งสองที่ทำให้การกระจายข้อต่อของพวกเขาจะไม่เป็นผลมาจากการกระจายของพวกเขา ซึ่งรวมถึงความสัมพันธ์เชิงเส้นและอื่น ๆ อีกมากมาย

  • หากตัวแปรสองตัวนั้นไม่เกี่ยวข้องกันเป็นเส้นตรงพวกมันสามารถมีความแปรปรวนร่วมได้ 0 แต่ก็ยังขึ้นอยู่กับ - ยกตัวอย่างหลายตัวอย่างที่นี่และพล็อตด้านล่างจากวิกิพีเดียให้ตัวอย่างกราฟิกในแถวล่าง:

    ป้อนคำอธิบายรูปภาพที่นี่

  • ตัวอย่างหนึ่งที่ความแปรปรวนร่วมเป็นศูนย์และความเป็นอิสระระหว่างตัวแปรสุ่มเป็นเงื่อนไขที่เท่าเทียมกันคือเมื่อมีการกระจายตัวแปรร่วมกันตามปกติ (นั่นคือตัวแปรทั้งสองเป็นไปตามการแจกแจงปกติแบบไบวาริเอทซึ่งไม่เท่ากับตัวแปรสองตัว อีกกรณีพิเศษคือคู่ของตัวแปร bernoulli จะไม่เกี่ยวข้องถ้าหากพวกเขาเป็นอิสระ (ขอบคุณ @ cardinal) แต่โดยทั่วไปแล้วทั้งสองไม่สามารถที่จะเทียบเท่า

ดังนั้นโดยทั่วไปแล้วเราไม่สามารถสรุปได้ว่าตัวแปรสองตัวนั้นมีความเป็นอิสระเพียงเพราะพวกมันดูไม่เกี่ยวข้องกัน (เช่นไม่ล้มเหลวในการปฏิเสธสมมติฐานว่างโดยไม่มีความสัมพันธ์) เราแนะนำให้พล็อตข้อมูลเพื่ออนุมานว่าทั้งสองเกี่ยวข้องกันหรือไม่เพียงแค่หยุดทดสอบความสัมพันธ์ ตัวอย่างเช่น (ขอบคุณ @gung) หากมีใครต้องการเรียกใช้การถดถอยเชิงเส้น (เช่นการทดสอบสำหรับความสัมพันธ์ที่ไม่เป็นศูนย์) และพบผลลัพธ์ที่ไม่มีนัยสำคัญหนึ่งอาจถูกล่อลวงเพื่อสรุปว่าตัวแปรไม่เกี่ยวข้อง แต่คุณ ' ได้ตรวจสอบความสัมพันธ์เชิงเส้นเท่านั้น

ฉันไม่ค่อยรู้เรื่องจิตวิทยามากนัก แต่มันก็สมเหตุสมผลที่อาจมีความสัมพันธ์แบบไม่เป็นเส้นตรงระหว่างตัวแปร จากตัวอย่างของของเล่นดูเหมือนว่าความเป็นไปได้ที่ความสามารถในการคิดนั้นไม่เกี่ยวข้องกับอายุ - เด็กและคนแก่มากไม่คมชัดเท่ากับอายุ 30 ปี หากเราวางแผนการวัดความสามารถทางปัญญากับอายุหนึ่งอาจคาดว่าจะเห็นว่าความสามารถทางปัญญาสูงที่สุดในวัยปานกลางและสลายตัวไปรอบ ๆ ซึ่งจะเป็นรูปแบบที่ไม่ใช่เชิงเส้น


1
หมายเหตุด้านข้าง ( อวดอ้าง?! ) แต่ตัวแปรสุ่มของเบอร์นูลลีนั้นมีความเป็นอิสระถ้าหากพวกมันไม่เกี่ยวข้องกัน :)
สำคัญ

@ cardinal ไม่ต้องกังวลนั่นเป็นเพียงฉันกำลังละทิ้งความเป็นเหตุเป็นผลอีกครั้งเหมือนเมื่อคุณบอกว่าปกติหลายตัวแปรที่มีเมทริกซ์ความแปรปรวนร่วมเอกพจน์คือ "ที่ใช้กันทั่วไปและมีความเกี่ยวข้องทางสถิติ"
แมโคร

ครั้งต่อไปที่ฉันอยู่ใน Ann Arbor ฉันจะซื้อกาแฟให้คุณเพื่อลองเล่นมุขตลก :) อย่าลังเลที่จะถามเหตุผลของฉันในระหว่างนี้ :)
สำคัญ

Ah แต่ที่อ้างอิงสุดท้ายคือความจริง ;-) มันปรากฏขึ้นในสถานที่ทั่วไปที่น่าประหลาดใจ :) (แม้ว่ามันจะเป็นเรื่องเล็กน้อยที่นี่)
พระคาร์ดินัล

(+1) ฉันมีปัญหากับรั้วว่าควรปิดคำถามนี้ซ้ำหรือไม่ แต่ฉันคิดว่าคำตอบที่ดีสามารถสร้างคำถามที่คล้ายกันมาก ๆ มีทุกสิ่งที่เชื่อมโยงข้ามช่วย
พระคาร์ดินัล

7

วิธีมาตรฐานในการสอน / แสดงภาพความสัมพันธ์หรือความแปรปรวนร่วมคือการพล็อตข้อมูลวาดเส้นที่ค่าเฉลี่ยของ 'x' และ 'y' จากนั้นวาดรูปสี่เหลี่ยมผืนผ้าจากจุดที่ 2 หมายถึงดาต้าพอยน์ของแต่ละบุคคลเช่นนี้

ป้อนคำอธิบายรูปภาพที่นี่

รูปสี่เหลี่ยมผืนผ้า (คะแนน) ที่มุมบนขวาและล่างซ้ายของควอดเรนท์ (สีแดงในตัวอย่าง) มีส่วนร่วมในเชิงบวกกับค่าสหสัมพันธ์ / ความแปรปรวนร่วมในขณะที่สี่เหลี่ยม (คะแนน) ในมุมบนซ้ายและล่างขวา Quadrant (สีน้ำเงินในตัวอย่าง) ค่าความสัมพันธ์ / ความแปรปรวนร่วม หากพื้นที่ทั้งหมดของสี่เหลี่ยมสีแดงเท่ากับพื้นที่ทั้งหมดของสี่เหลี่ยมสีน้ำเงินนั้นการบวกและเนกาทีฟจะถูกยกเลิกและคุณจะได้ค่าความแปรปรวนเป็นศูนย์ หากมีพื้นที่เป็นสีแดงมากขึ้นความแปรปรวนร่วมจะเป็นบวกและหากมีพื้นที่มากขึ้นในสีน้ำเงินการแปรปรวนร่วมจะเป็นลบ

ตอนนี้ให้ดูตัวอย่างจากการสนทนาก่อนหน้า:

ป้อนคำอธิบายรูปภาพที่นี่

แต่ละจุดเป็นพาราโบลาดังนั้นพวกมันจึงขึ้นอยู่กับว่าถ้าคุณรู้ว่า 'x' คุณก็รู้ว่า 'y' แน่นอน แต่คุณสามารถเห็นได้ว่าสำหรับทุกสี่เหลี่ยมสีแดงมีสี่เหลี่ยมสีน้ำเงินที่ตรงกันดังนั้นความแปรปรวนร่วมสุดท้ายจะเป็น 0 .


(+1) มีRแพ็คเกจที่ทำให้แปลงเหล่านี้ (ฉันจำได้ว่า whuber แสดงพล็อตแบบนี้ครั้งเดียว) หรือคุณทำมันตั้งแต่ต้น?
มาโคร

@Macro เป็นคำถามที่ดี แต่ฉันคิดว่า Whuber ทำใน Mathematica มันเป็นเรื่องตรงไปตรงมาที่จะทำสิ่งนี้ "ด้วยมือ" ในการใช้ R polygonหรือหรือrectอุปกรณ์ที่รองรับความโปร่งแสง
พระคาร์ดินัล

ฉันเขียนฟังก์ชันเพื่อทำพล็อตนี้และอาจจะเพิ่มลงในTeachingDemosแพ็คเกจเร็ว ๆ นี้ ความคิดแรกของฉันคือการย่อวลี "rectangles correlation" เป็น "correct" เป็นชื่อของฟังก์ชั่นจากนั้นหลังจากนั้นสักครู่ก็รู้ว่าชื่ออาจเข้าใจผิดได้ง่ายว่าทำอะไรที่ค่อนข้างแตกต่าง ดังนั้นฉันต้องหาชื่อที่ดีขึ้นเพิ่มตัวเลือกสองสามตัวแล้วอัปโหลดไปยัง R-Forge
Greg Snow

3

การทดสอบอย่างง่าย ๆ อย่างหนึ่งหากว่าข้อมูลนั้นเป็นไปตามรูปแบบที่สมมาตรรอบแกนในแนวตั้งหรือแนวนอนผ่านค่าเฉลี่ยความแปรปรวนร่วมจะค่อนข้างใกล้เคียงกับศูนย์ ตัวอย่างเช่นหากสมมาตรอยู่รอบแกน y นั่นหมายความว่าสำหรับแต่ละค่าที่มี y ที่กำหนดจะมีความแตกต่างเป็นบวก x จากค่าเฉลี่ยของ x และความแตกต่างเชิงลบจากค่าเฉลี่ยของ x การเพิ่ม y * x สำหรับค่าเหล่านั้นจะเป็นศูนย์ คุณสามารถดูตัวอย่างนี้ได้อย่างชัดเจนในชุดตัวอย่างแปลงในคำตอบอื่น ๆ มีรูปแบบอื่น ๆ ที่จะทำให้เกิดความแปรปรวนร่วมเป็นศูนย์ แต่ไม่ใช่ความเป็นอิสระ แต่ตัวอย่างจำนวนมากได้รับการประเมินอย่างง่ายดายโดยการหาสมมาตรหรือไม่


1

ตัวอย่างจากWikipedia :

"ถ้าตัวแปรเป็นอิสระสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันคือ 0 แต่การสนทนาไม่เป็นความจริงเพราะค่าสัมประสิทธิ์สหสัมพันธ์ตรวจจับการอ้างอิงเชิงเส้นระหว่างตัวแปรสองตัวเท่านั้นตัวอย่างเช่นสมมติว่าตัวแปรสุ่ม X กระจายแบบสมมาตรเกี่ยวกับศูนย์และ Y = X ^ 2. จากนั้น Y จะถูกกำหนดโดย X อย่างสมบูรณ์ดังนั้น X และ Y นั้นขึ้นอยู่กับความสมบูรณ์แบบ แต่ความสัมพันธ์ของพวกมันนั้นเป็นศูนย์; พวกมันจะไม่เกี่ยวข้องกันอย่างไรก็ตามในกรณีพิเศษเมื่อ X และ Y เป็นปกติร่วมกัน uncorrelatedness

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.