คุณจะอธิบายความแปรปรวนร่วมกับคนที่เข้าใจเฉพาะค่าเฉลี่ยได้อย่างไร


207

... สมมติว่าฉันสามารถเพิ่มพูนความรู้เกี่ยวกับความแปรปรวนในรูปแบบที่เข้าใจง่าย (การทำความเข้าใจ "ความแปรปรวน" อย่างสังหรณ์ใจ ) หรือโดยการพูดว่า: มันเป็นระยะทางเฉลี่ยของค่าข้อมูลจาก 'เฉลี่ย' - และเนื่องจากความแปรปรวนอยู่ในตาราง หน่วยเราใช้สแควร์รูทเพื่อให้หน่วยเดียวกันและที่เรียกว่าส่วนเบี่ยงเบนมาตรฐาน

สมมติว่าเรื่องนี้ชัดเจนมากและหวังว่าจะเข้าใจโดย 'ผู้รับ' ทีนี้ความแปรปรวนร่วมคืออะไรและจะอธิบายได้อย่างไรในภาษาอังกฤษง่าย ๆ โดยไม่ใช้คำศัพท์ / สูตรทางคณิตศาสตร์ใด ๆ (เช่นคำอธิบายที่เข้าใจง่าย;)

โปรดทราบ: ฉันรู้สูตรและคณิตศาสตร์ที่อยู่เบื้องหลังแนวคิด ฉันต้องการที่จะ 'อธิบาย' สิ่งเดียวกันในรูปแบบที่เข้าใจง่ายโดยไม่รวมคณิตศาสตร์ เช่น 'ความแปรปรวนร่วม' หมายถึงอะไร


1
@ ซีอาน - 'วิธี' คุณจะกำหนดมันผ่านการถดถอยเชิงเส้นอย่างง่ายได้อย่างไร ฉันอยากรู้จริงๆ ...
ปริญญาเอก

3
สมมติว่าคุณมี scatterplot ของตัวแปรสองตัวของคุณ, x กับ y, ที่มีต้นกำเนิดที่ (0,0), เพียงแค่ลากสองบรรทัดที่ x = Mean (x) (vertical) และ y = mean (x) (horizontal): การใช้ระบบพิกัดใหม่นี้ (แหล่งกำเนิดอยู่ที่ (หมายถึง (x), ค่าเฉลี่ย (y)) ให้ใส่เครื่องหมาย "+" ในด้านบนขวาและล่างซ้ายล่างเป็นเครื่องหมาย "-" ในจตุภาคอื่น ๆ คุณมีสัญญาณของความแปรปรวนซึ่งเป็นพื้นสิ่ง @ Peter กล่าวว่าการปรับ X และ Y หน่วย (โดย SD) นำไปสู่การสรุป interpretable มากขึ้นตามที่กล่าวไว้ใน. ด้ายที่ตามมา .
CHL

1
@chl - คุณช่วยกรุณาโพสต์ว่าเป็นคำตอบและอาจใช้กราฟิกเพื่อพรรณนามัน!
ปริญญาเอก

ฉันพบวิดีโอในเว็บไซต์นี้เพื่อช่วยฉันเนื่องจากฉันชอบภาพมากกว่าคำอธิบายเชิงนามธรรม เว็บไซต์พร้อมวิดีโอโดยเฉพาะภาพนี้: ! [ใส่คำอธิบายภาพที่นี่ ] ( i.stack.imgur.com/xGZFv.png )
Karl Morrison

คำตอบ:


374

บางครั้งเราสามารถ "เสริมความรู้" ด้วยวิธีที่ผิดปกติหรือแตกต่างกัน ฉันต้องการคำตอบนี้เพื่อให้นักเรียนชั้นอนุบาลเข้าถึงได้และสนุกไปกับทุกคน

รับข้อมูลที่จับคู่(x,y) , วาด scatterplot ของพวกเขา (นักเรียนที่อายุน้อยกว่าอาจต้องการครูเพื่อทำสิ่งนี้สำหรับพวกเขา :-) แต่ละคู่ของคะแนน(xi,yi) , (xj,yj)ในพล็อตนั้นกำหนดรูปสี่เหลี่ยมผืนผ้า: มันเป็นรูปสี่เหลี่ยมผืนผ้าที่เล็กที่สุด ขนานกับแกนที่บรรจุจุดเหล่านั้น ดังนั้นคะแนนจะอยู่ที่มุมบนขวาและมุมซ้ายล่าง (ความสัมพันธ์ "บวก") หรืออยู่ที่มุมบนซ้ายและมุมขวาล่าง (ความสัมพันธ์ "ลบ")

วาดสี่เหลี่ยมที่เป็นไปได้ทั้งหมด ทำให้สีเป็นสี่เหลี่ยมมุมฉากสีแดง (พูด) และสี่เหลี่ยมลบ "ต่อต้านแดง" (สีน้ำเงิน) ในแบบนี้สี่เหลี่ยมทับซ้อนกันไม่ว่าสีของพวกมันจะได้รับการปรับปรุงเมื่อมันเหมือนกัน (สีน้ำเงินและน้ำเงินหรือแดงและแดง) หรือยกเลิกเมื่อมันต่างกัน

สี่เหลี่ยมบวกและลบ

( ในภาพประกอบนี้ของสี่เหลี่ยมบวก (แดง) และลบ (สีน้ำเงิน) การซ้อนทับควรเป็นสีขาว แต่น่าเสียดายที่ซอฟต์แวร์นี้ไม่มีสี "ต่อต้านแดง" ที่แท้จริงการทับซ้อนนั้นเป็นสีเทาดังนั้นมันจะมืด พล็อต แต่โดยรวมแล้วจำนวนสุทธิของสีแดงนั้นถูกต้อง )

ตอนนี้เราพร้อมแล้วสำหรับคำอธิบายความแปรปรวนร่วม

ความแปรปรวนร่วมคือจำนวนสุทธิของสีแดงในพล็อต (ถือว่าสีฟ้าเป็นค่าลบ)

ต่อไปนี้เป็นตัวอย่างบางส่วนที่มี 32 binormal points ซึ่งมาจากการแจกแจงด้วย covariances ที่กำหนดโดยเรียงลำดับจากค่าลบ (bluest) ไปเป็นค่าบวกมากที่สุด (reddest)

แปลงความแปรปรวนร่วมปรับปรุง 2562

พวกเขาถูกวาดบนแกนทั่วไปเพื่อให้พวกเขาเปรียบ รูปสี่เหลี่ยมผืนผ้าจะมีโครงร่างเบา ๆ เพื่อช่วยให้คุณมองเห็น นี่เป็นรุ่นดั้งเดิม (2019) ที่ได้รับการอัปเดต: ใช้ซอฟต์แวร์ที่ยกเลิกสีแดงและสีฟ้าอย่างเหมาะสมในรูปสี่เหลี่ยมผืนผ้าที่ทับซ้อนกัน

ลองอนุมานคุณสมบัติบางอย่างของความแปรปรวนร่วม การทำความเข้าใจกับคุณสมบัติเหล่านี้จะสามารถเข้าถึงได้โดยทุกคนที่วาดรูปสี่เหลี่ยมไม่กี่อัน :-)

  • Bilinearity เนื่องจากปริมาณของสีแดงขึ้นอยู่กับขนาดของพล็อตความแปรปรวนร่วมจึงเป็นสัดส่วนโดยตรงกับสเกลบนแกน x และสเกลบนแกน y

  • ความสัมพันธ์ ความแปรปรวนร่วมจะเพิ่มขึ้นตามจุดที่ประมาณเส้นลาดขึ้นและลดลงเมื่อจุดประมาณเส้นลาดเอียงลง นี่เป็นเพราะในอดีตกรณีส่วนใหญ่ของสี่เหลี่ยมเป็นบวกและในกรณีหลังส่วนใหญ่เป็นลบ

  • ความสัมพันธ์กับการเชื่อมโยงเชิงเส้น เนื่องจากการเชื่อมโยงที่ไม่ใช่เชิงเส้นสามารถสร้างการผสมของสี่เหลี่ยมที่เป็นบวกและลบพวกมันนำไปสู่การแปรปรวนร่วมที่ไม่สามารถคาดเดาได้ (และไม่มีประโยชน์มาก) การเชื่อมโยงเชิงเส้นสามารถแปลความหมายได้อย่างสมบูรณ์ด้วยวิธีการกำหนดลักษณะสองแบบก่อนหน้านี้

  • ความไวต่อค่าผิดปกติ ค่าขอบเขตทางเรขาคณิต (จุดหนึ่งที่ยืนห่างจากมวล) จะสร้างรูปสี่เหลี่ยมขนาดใหญ่จำนวนมากที่เชื่อมโยงกับจุดอื่น ๆ ทั้งหมด เพียงอย่างเดียวสามารถสร้างจำนวนสุทธิบวกหรือลบสีแดงสุทธิในภาพรวม

อนึ่งคำจำกัดความความแปรปรวนร่วมนี้แตกต่างจากค่าปกติเพียงค่าคงที่สากลของสัดส่วน (ไม่ขึ้นอยู่กับขนาดชุดข้อมูล) ความโน้มเอียงทางคณิตศาสตร์จะไม่มีปัญหาในการสาธิตเกี่ยวกับพีชคณิตว่าสูตรที่ให้ที่นี่มีค่าความแปรปรวนร่วมสองเท่าเสมอ


92
+1 ว้าว สิ่งนี้ใช้ได้กับการอธิบายความแปรปรวนร่วมกับผู้ที่คิดอยู่แล้วว่าพวกเขารู้ว่ามันคืออะไร
แอรอน

7
+1 ฉันสนุกกับการอ่านคำตอบของคุณ ผมจะวาดรูปสี่เหลี่ยมบางและปล่อยให้ลูกชายของฉันวาดพวกเขา :)
CHL

18
ตอนนี้ถ้าเพียงแนวคิดทางสถิติเบื้องต้นทั้งหมดสามารถนำเสนอให้กับนักเรียนในลักษณะที่ชัดเจนนี้ ...
MannyG

4
นี่คือสิ่งที่สวยงาม และชัดเจนมาก
Benjamin Mako Hill

4
(x¯,y¯)

61

xy

มันจะมีประโยชน์ในการจำสูตรพื้นฐาน (ง่ายต่อการอธิบายไม่จำเป็นต้องพูดคุยเกี่ยวกับความคาดหวังทางคณิตศาสตร์สำหรับหลักสูตรเบื้องต้น):

cov(x,y)=1ni=1n(xix¯)(yiy¯)

(xi,yi)x¯y¯

y=1.2x+εy=0.1x+εεSD=2x[0,20]

ป้อนคำอธิบายรูปภาพที่นี่

xy(0,0)(x¯,y¯)

   +  -
+ 30  2
-  0 28

xiyiy¯xyb=Cov(x,y)/Var(x)

xi

   +  -
+ 18 14
- 12 16

xiyi

xy(x/10,y)(x,y/10)xy(x,y)(x¯,y¯)xy


27

ความแปรปรวนร่วมคือการวัดว่าตัวแปรหนึ่งตัวเพิ่มขึ้นเท่าใดเมื่ออีกตัวแปรขึ้นไป


1
มันเป็นไปในทิศทางเดียวกันเสมอไหม? นอกจากนี้ยังใช้สำหรับความสัมพันธ์แบบผกผันด้วยเช่นกัน (เช่นเมื่อหนึ่งไปขึ้นไปอีกลงไป)?
ปริญญาเอก

4
@nupul ตรงข้ามกับ "up" คือ "down" และตรงกันข้ามของ "positive" คือ "negative" ฉันพยายามให้คำตอบหนึ่งประโยค ของคุณสมบูรณ์มากยิ่งขึ้น แม้กระทั่ง "การเปลี่ยนแปลงของสองตัวแปรด้วยกัน" ของคุณนั้นสมบูรณ์กว่านี้ แต่ฉันคิดว่าเข้าใจยากขึ้นเล็กน้อย
Peter Flom

1
+1 สำหรับการปรับให้เหมาะสมในประโยคเดียวที่เรียบง่าย แต่นั่นไม่ใช่ความสัมพันธ์นั้นใช่ไหม ฉันหมายถึงฉันรู้ cov มากขึ้น => สัมพันธ์มากขึ้น แต่ด้วยประโยคนั้นฉันคาดหวังบางอย่างเช่น "80%" เป็นคำตอบซึ่งสอดคล้องกับ corr = 0.8 โคฟไม่ได้อธิบายความแปรปรวนของข้อมูลด้วยหรือไม่ กล่าวคือ "ความแปรปรวนร่วมเป็นสัดส่วนกับจำนวนของตัวแปรตัวหนึ่งที่เพิ่มขึ้นเมื่ออีกตัวหนึ่งเพิ่มขึ้นและสัดส่วนกับการแพร่กระจายของข้อมูลในตัวแปรทั้งสอง" หรือบางอย่าง?
naught101

4
ใช่แล้ว Peter ซึ่งเป็นเหตุผลที่ @ naught101 ทำให้ความเห็นนั้น: คำอธิบายของคุณดูเหมือนอัตราการเปลี่ยนแปลงซึ่งหน่วยจะเป็น [หน่วยของตัวแปรหนึ่ง] / [หน่วยของตัวแปรอื่น ๆ ] (ถ้าเราตีความเหมือนอนุพันธ์ ) หรือจะเป็น [หน่วยของตัวแปรเดียว] (ถ้าเราตีความว่าเป็นความแตกต่างที่บริสุทธิ์) สิ่งเหล่านั้นไม่ใช่ความแปรปรวนร่วม (ซึ่งหน่วยการวัดเป็นผลคูณของหน่วยสำหรับตัวแปรสองตัว) หรือสหสัมพันธ์ (ซึ่งไม่มีหน่วย)
whuber

1
XY1,YXY

12

ฉันกำลังตอบคำถามของตัวเอง แต่ผมคิดว่ามันต้องการจะดีสำหรับคนที่มาในโพสต์นี้เพื่อตรวจสอบบางส่วนของคำอธิบายในหน้านี้

ฉันถอดความหนึ่งในคำตอบที่ชัดเจนมาก (โดย user'Zhop ') ฉันทำเช่นนั้นในกรณีที่เว็บไซต์นั้นปิดตัวลงหรือหน้าเว็บถูกลบเมื่อใครบางคนจากตอนนี้เข้าถึงโพสต์นี้)

ความแปรปรวนร่วมเป็นตัวชี้วัดว่ามีตัวแปรสองตัวที่เปลี่ยนแปลงไปพร้อมกัน เปรียบเทียบสิ่งนี้กับความแปรปรวนซึ่งเป็นเพียงช่วงที่การวัดหนึ่ง (หรือตัวแปร) แตกต่างกันไป

ในการศึกษารูปแบบทางสังคมคุณอาจตั้งสมมติฐานว่าคนที่มีฐานะร่ำรวยมีแนวโน้มที่จะได้รับการศึกษามากขึ้นดังนั้นคุณจึงลองดูว่าการวัดความมั่งคั่งและการศึกษาอยู่ใกล้กันมากเพียงใด คุณจะใช้การวัดความแปรปรวนร่วมเพื่อกำหนดสิ่งนี้

...

ฉันไม่แน่ใจว่าคุณหมายถึงอะไรเมื่อคุณถามว่ามันนำไปใช้กับสถิติได้อย่างไร มันเป็นมาตรการหนึ่งที่สอนในชั้นเรียนสถิติต่างๆ คุณหมายถึงเมื่อไหร่ที่คุณควรใช้

คุณใช้มันเมื่อคุณต้องการดูว่ามีการเปลี่ยนแปลงของตัวแปรสองตัวหรือมากกว่าที่สัมพันธ์กัน

คิดถึงคนในทีม ดูว่าพวกเขาแตกต่างกันในที่ตั้งทางภูมิศาสตร์อย่างไรเมื่อเทียบกับที่อื่น เมื่อทีมเล่นหรือฝึกซ้อมระยะห่างระหว่างสมาชิกแต่ละคนนั้นน้อยมากและเราจะบอกว่าพวกเขาอยู่ในตำแหน่งเดียวกัน และเมื่อสถานที่ตั้งของพวกเขาเปลี่ยนไปมันก็จะเปลี่ยนให้ทุกคนอยู่ด้วยกัน (พูดการเดินทางบนรถบัสเป็นเกม) ในสถานการณ์เช่นนี้เราจะบอกว่าพวกเขามีระดับความแปรปรวนร่วมสูง แต่เมื่อพวกเขาไม่ได้เล่นอัตราความแปรปรวนร่วมนั้นค่อนข้างต่ำเพราะพวกเขาทั้งหมดไปยังสถานที่ต่าง ๆ ด้วยอัตราความเร็วที่แตกต่างกัน

ดังนั้นคุณสามารถทำนายตำแหน่งของสมาชิกในทีมได้โดยอิงจากตำแหน่งของสมาชิกในทีมคนอื่นเมื่อพวกเขาฝึกซ้อมหรือเล่นเกมด้วยความแม่นยำระดับสูง การวัดความแปรปรวนร่วมจะใกล้เคียงกับ 1 ฉันเชื่อ แต่เมื่อพวกเขาไม่ได้ฝึกฝนหรือเล่นคุณจะมีโอกาสน้อยมากในการทำนายตำแหน่งของบุคคลหนึ่งโดยพิจารณาจากตำแหน่งของสมาชิกในทีม อาจจะใกล้กับศูนย์ แต่อาจไม่ใช่ศูนย์เนื่องจากบางครั้งสมาชิกในทีมจะเป็นเพื่อนและอาจไปด้วยกันตามเวลาของตนเอง

อย่างไรก็ตามหากคุณสุ่มเลือกบุคคลในสหรัฐอเมริกาและพยายามใช้หนึ่งในนั้นเพื่อทำนายตำแหน่งของอีกฝ่ายคุณอาจพบว่าความแปรปรวนร่วมเป็นศูนย์ กล่าวอีกนัยหนึ่งไม่มีความสัมพันธ์ระหว่างตำแหน่งของบุคคลหนึ่งที่ถูกสุ่มเลือกในสหรัฐอเมริกาและของบุคคลอื่น

เพิ่มอีกหนึ่ง (โดย 'CatofGrey') ที่ช่วยเพิ่มสัญชาตญาณ:

ในทฤษฎีความน่าจะเป็นและสถิติความแปรปรวนร่วมเป็นตัวชี้วัดว่ามีตัวแปรสุ่มสองตัวที่แตกต่างกันอย่างไร (แตกต่างจากความแปรปรวน

หากตัวแปรสองตัวมีแนวโน้มที่จะเปลี่ยนแปลงไปด้วยกัน (นั่นคือเมื่อหนึ่งในนั้นสูงกว่าค่าที่คาดไว้ตัวแปรอื่น ๆ ก็มักจะสูงกว่าค่าที่คาดไว้ด้วย) ความแปรปรวนร่วมระหว่างตัวแปรทั้งสองจะเป็นค่าบวก ในทางตรงกันข้ามถ้าหนึ่งในนั้นสูงกว่าค่าที่คาดไว้และตัวแปรอื่น ๆ จะต่ำกว่าค่าที่คาดไว้ความแปรปรวนร่วมระหว่างตัวแปรทั้งสองจะเป็นค่าลบ

ทั้งสองเข้าด้วยกันทำให้ฉันเข้าใจความแปรปรวนร่วมเพราะฉันไม่เคยเข้าใจมาก่อน! น่าอัศจรรย์เพียง !!


15
แม้ว่าคำอธิบายเหล่านี้มีการชี้นำในเชิงคุณภาพเศร้าที่พวกเขาจะไม่สมบูรณ์พวกเขาไม่เห็นความแตกต่างจากความแปรปรวนสหสัมพันธ์ (รายละเอียดปรากฏครั้งแรกเพื่อสร้างความสับสนทั้งสองในความเป็นจริง) หรือไม่ได้นำมาออกที่สมมติฐานพื้นฐานของการเชิงเส้นร่วมการเปลี่ยนแปลง นอกจากนี้ไม่ได้กล่าวถึงประเด็นที่สำคัญที่ความแปรปรวนร่วมนั้นขึ้นอยู่กับขนาดของตัวแปรแต่ละตัว
whuber

@whuber - ตกลง! และด้วยเหตุนี้ยังไม่ได้ทำเครื่องหมายว่าเหมืองเป็นคำตอบ :) (ยังไม่เป็น;)
ปริญญาเอก

12

ฉันชอบคำตอบของ Whuber ดังนั้นฉันจึงรวบรวมแหล่งข้อมูลเพิ่มเติม ความแปรปรวนร่วมอธิบายว่าทั้งคู่มีความแตกต่างของตัวแปรและความสัมพันธ์ของพวกเขา

ความแปรปรวนร่วมใช้รูปสี่เหลี่ยมผืนผ้าเพื่ออธิบายว่าการสังเกตนั้นอยู่ห่างจากค่าเฉลี่ยในกราฟกระจายอย่างไร:

  • หากสี่เหลี่ยมผืนผ้ามีด้านยาวและกว้างหรือสูงและสั้นและกว้างก็แสดงหลักฐานว่าตัวแปรทั้งสองเคลื่อนไหวพร้อมกัน

  • ถ้าสี่เหลี่ยมผืนผ้ามีสองด้านที่ค่อนข้างยาวสำหรับตัวแปรนั้นและอีกสองด้านที่ค่อนข้างสั้นสำหรับตัวแปรอื่นการสังเกตนี้แสดงหลักฐานว่าตัวแปรนั้นเคลื่อนไหวกันไม่ดีนัก

  • หากสี่เหลี่ยมผืนผ้าอยู่ในจตุภาคที่ 2 หรือ 4 จากนั้นเมื่อตัวแปรหนึ่งมีค่ามากกว่าค่าเฉลี่ยค่าอื่นจะน้อยกว่าค่าเฉลี่ย การเพิ่มขึ้นของตัวแปรหนึ่งสัมพันธ์กับการลดลงของตัวแปรอื่น

ฉันพบภาพที่น่าสนใจของสิ่งนี้ที่http://sciguides.com/guides/covariance/มันอธิบายว่าความแปรปรวนร่วมคืออะไรถ้าคุณเพิ่งรู้ค่าเฉลี่ย


7
+1 คำอธิบายที่ดี (โดยเฉพาะอย่างยิ่งการสรุปหนึ่งประโยคเบื้องต้น) ลิงค์น่าสนใจ เนื่องจากมันไม่มีไฟล์เก็บถาวรในเครื่อง Waybackจึงอาจเป็นเรื่องใหม่ เนื่องจากมันใกล้เคียงกับคำตอบ (อายุสามขวบ) ของฉันอย่างใกล้ชิดลงไปที่ตัวเลือกของสีแดงสำหรับความสัมพันธ์เชิงบวกและสีน้ำเงินสำหรับความสัมพันธ์เชิงลบฉันจึงสงสัยว่ามันเป็นอนุพันธ์ (ไม่กระจาย) ของเนื้อหาบนเว็บไซต์นี้
whuber

4
ลิงก์ "การสร้างภาพแบบเจ๋ง ๆ " เสียชีวิต ...
whuber

1
@MSIS นั้นเป็นไปไม่ได้ที่จะคิดออกเพราะมีการแจกแจงที่เป็นไปได้จำนวนมากในแวดวง แต่ถ้าคุณอ้างถึงการแจกแจงแบบเดียวกันไม่มีอะไรที่ต้องคำนวณเพราะ (อย่างที่ฉันจำได้ว่าตั้งข้อสังเกตในหัวข้อของคุณที่stats.stackexchange.com/q/414365/919 ) สัมประสิทธิ์สหสัมพันธ์จะต้องเท่ากับค่าลบQED
whuber

1
XX0XX2X1,XX2:11
whuber

1
α,a<αb((ba)mod2π)/(2π).

10

ต่อไปนี้เป็นความพยายามอธิบายความแปรปรวนร่วมกับรูปภาพ ทุกแผงในภาพด้านล่างมี 50 คะแนนจำลองจากการแจกแจงไบวาริเอทที่มีความสัมพันธ์ระหว่าง x & y ของ 0.8 และความแปรปรวนดังที่แสดงในป้ายชื่อแถวและคอลัมน์ ความแปรปรวนร่วมจะปรากฏขึ้นที่มุมล่างขวาของแต่ละแผง

ความแปรปรวนร่วมที่แตกต่างกันมีความสัมพันธ์ = 0.8

ทุกคนที่สนใจในการปรับปรุงนี้ ... นี่คือรหัส R:

library(mvtnorm)

rowvars <- colvars <- c(10,20,30,40,50)

all <- NULL
for(i in 1:length(colvars)){
  colvar <- colvars[i]
  for(j in 1:length(rowvars)){
    set.seed(303)  # Put seed here to show same data in each panel
    rowvar <- rowvars[j]
    # Simulate 50 points, corr=0.8
    sig <- matrix(c(rowvar, .8*sqrt(rowvar)*sqrt(colvar), .8*sqrt(rowvar)*sqrt(colvar), colvar), nrow=2)
    yy <- rmvnorm(50, mean=c(0,0), sig)
    dati <- data.frame(i=i, j=j, colvar=colvar, rowvar=rowvar, covar=.8*sqrt(rowvar)*sqrt(colvar), yy)
    all <- rbind(all, dati)
  }
}
names(all) <- c('i','j','colvar','rowvar','covar','x','y')
all <- transform(all, colvar=factor(colvar), rowvar=factor(rowvar))
library(latticeExtra)
useOuterStrips(xyplot(y~x|colvar*rowvar, all, cov=all$covar,
                      panel=function(x,y,subscripts, cov,...){
                        panel.xyplot(x,y,...)
                        print(cor(x,y))
                        ltext(14,-12, round(cov[subscripts][1],0))
                      }))

10

ฉันชอบคำตอบของ @whuber - ก่อนที่ฉันจะมีความคิดที่คลุมเครือในความคิดของฉันว่าการแปรปรวนร่วมสามารถมองเห็นได้ แต่แผนการสี่เหลี่ยมผืนผ้าเหล่านั้นเป็นอัจฉริยะ

อย่างไรก็ตามเนื่องจากสูตรสำหรับความแปรปรวนร่วมเกี่ยวข้องกับค่าเฉลี่ยและคำถามดั้งเดิมของ OP ได้ระบุว่า 'ผู้รับ' เข้าใจแนวคิดของค่าเฉลี่ยฉันคิดว่าฉันจะมีรอยแตกในการปรับแปลงสี่เหลี่ยมของ @ whuber เพื่อเปรียบเทียบแต่ละจุดข้อมูลกับ ค่าเฉลี่ยของ x และ y เนื่องจากนี่แสดงถึงสิ่งที่เกิดขึ้นในสูตรความแปรปรวนร่วม ฉันคิดว่ามันจริง ๆ แล้วดูเป็นธรรมชาติที่ใช้งานง่าย: "กราฟความแปรปรวนร่วมของตัวแปรที่มีความสัมพันธ์ต่างกัน"

จุดสีน้ำเงินตรงกลางของแต่ละจุดคือค่าเฉลี่ยของ x (x_mean) และค่าเฉลี่ยของ y (y_mean)

สี่เหลี่ยมกำลังเปรียบเทียบค่าของ x - x_mean และ y - y_mean สำหรับแต่ละจุดข้อมูล

สี่เหลี่ยมผืนผ้าเป็นสีเขียวเมื่อ:

  • ทั้ง x และ y มากกว่าค่าเฉลี่ยของพวกเขา
  • ทั้ง x และ y น้อยกว่าค่าเฉลี่ยที่เกี่ยวข้อง

สี่เหลี่ยมผืนผ้าเป็นสีแดงเมื่อ:

  • x มากกว่า x_mean แต่ y น้อยกว่า y_mean
  • x น้อยกว่า x_mean แต่ y มากกว่า y_mean

ความแปรปรวนร่วม (และสหสัมพันธ์) สามารถเป็นได้ทั้งเชิงลบอย่างรุนแรงและบวกอย่างมาก เมื่อกราฟถูกครอบงำด้วยสีใดสีหนึ่งมากกว่าสีอื่นนั่นหมายความว่าข้อมูลส่วนใหญ่เป็นไปตามรูปแบบที่สอดคล้องกัน

  • หากกราฟมีสีเขียวมากกว่าสีแดงจำนวนมากแสดงว่าโดยทั่วไปแล้ว y จะเพิ่มขึ้นเมื่อ x เพิ่มขึ้น
  • หากกราฟมีสีแดงมากกว่าสีเขียวจำนวนมากก็หมายความว่าโดยทั่วไปแล้ว y จะลดลงเมื่อ x เพิ่มขึ้น
  • หากกราฟไม่ได้ถูกครอบงำด้วยสีใดสีหนึ่งนั่นหมายความว่ามีรูปแบบไม่มากนักในการที่ x และ y สัมพันธ์กัน

ค่าที่แท้จริงของความแปรปรวนร่วมสำหรับตัวแปรสองตัวที่แตกต่างกัน x และ y นั้นคือผลรวมของพื้นที่สีเขียวทั้งหมดลบพื้นที่สีแดงทั้งหมดแล้วหารด้วยจำนวนคะแนนข้อมูลทั้งหมด .

เสียง / รูปลักษณ์นั้นเป็นอย่างไร?


3

Variance คือระดับที่การเปลี่ยนแปลงสุ่มแบบสุ่มเทียบกับค่าที่คาดไว้เนื่องจากลักษณะสุ่มของกระบวนการต้นแบบซึ่งเป็นตัวแปรสุ่ม

ความแปรปรวนร่วมคือระดับที่ตัวแปรสุ่มแตกต่างกันสองตัวเปลี่ยนไปด้วยความเคารพซึ่งกันและกัน สิ่งนี้อาจเกิดขึ้นเมื่อตัวแปรสุ่มถูกผลักดันโดยกระบวนการพื้นฐานเดียวกันหรืออนุพันธ์ของมัน กระบวนการที่แสดงโดยตัวแปรสุ่มเหล่านี้มีผลต่อกันหรือเป็นกระบวนการเดียวกัน แต่หนึ่งในตัวแปรสุ่มนั้นมาจากอีกกระบวนการหนึ่ง


2

ฉันจะอธิบายความสัมพันธ์ซึ่งง่ายต่อการเข้าใจ ฉันจะบอกว่า "สหสัมพันธ์วัดความแข็งแกร่งของความสัมพันธ์ระหว่างสองตัวแปร X และ Y. สหสัมพันธ์อยู่ระหว่าง -1 และ 1 และจะใกล้เคียงกับ 1 ในค่าสัมบูรณ์เมื่อความสัมพันธ์ที่แข็งแกร่ง Covariance เป็นเพียงความสัมพันธ์คูณด้วยค่าเบี่ยงเบนมาตรฐานของ ตัวแปรสองตัวดังนั้นในขณะที่ความสัมพันธ์ไม่มีมิติความแปรปรวนร่วมอยู่ในผลิตภัณฑ์ของหน่วยสำหรับตัวแปร X และตัวแปร Y


10
ดูเหมือนว่าไม่เพียงพอเพราะไม่มีการเอ่ยถึงความเป็นเส้นตรง X และ Y สามารถมีความสัมพันธ์กำลังสองที่แข็งแกร่ง แต่มีสหสัมพันธ์เป็นศูนย์
mark999

0

ตัวแปรสองตัวที่จะมีความแปรปรวนในเชิงบวกสูง (สหสัมพันธ์) คือจำนวนคนในห้องและจำนวนนิ้วที่อยู่ในห้อง (เมื่อจำนวนคนเพิ่มขึ้นเราคาดว่าจำนวนนิ้วจะเพิ่มขึ้นเช่นกัน)

สิ่งที่อาจมีความแปรปรวนเชิงลบ (สหสัมพันธ์) จะเป็นอายุของบุคคลและจำนวนของรูขุมขนบนหัวของพวกเขา หรือจำนวนของสิวบนใบหน้าของบุคคล (ในกลุ่มอายุที่แน่นอน) และจำนวนวันที่พวกเขามีในหนึ่งสัปดาห์ เราคาดหวังว่าคนที่มีอายุมากกว่าจะมีผมน้อยและคนที่เป็นสิวมากขึ้นจะมีวันที่น้อยลง


2
ความแปรปรวนร่วมไม่จำเป็นต้องมีความสัมพันธ์ซึ่งกันและกัน - อดีตนั้นขึ้นอยู่กับหน่วย ความสัมพันธ์เป็นตัวเลขระหว่าง -1 ถึง 1 สเกลาร์ที่ไม่มียูนิตแสดงถึง 'ความแข็งแกร่ง' ของความแปรปรวนร่วม IMO และนั่นไม่ชัดเจนจากคำตอบของคุณ
PhD

Downvoted เป็นคำตอบที่แสดงถึงความแปรปรวนร่วมและความสัมพันธ์ที่สามารถใช้แทนกันได้
sapo_cosmico
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.