ตัวอย่างง่าย ๆ ของ uncorrelated แต่ไม่ใช่อิสระและ


26

นักเรียนที่ทำงานหนัก ๆ ทุกคนเป็นตัวอย่างของ "นักเรียนทุกคนขี้เกียจ"

อะไรคือตัวอย่างของตัวอย่างง่ายๆที่ว่า "ถ้าตัวแปรสุ่มและไม่ได้มีความสัมพันธ์กันแล้วพวกมันมีความเป็นอิสระ"?YXY


8
ฉันคิดว่านี่เป็นสิ่งที่ซ้ำกัน แต่ฉันขี้เกียจเกินกว่าที่จะค้นหาได้ ใช้และ 2 แต่ชัดเจนว่าตัวแปรสองตัวนั้นไม่เป็นอิสระ Y = X 2 c o v ( X , Y ) = E X 3 = 0X~ยังไม่มีข้อความ(0,1)Y=X2โอโวลต์(X,Y)=EX3=0
mpiktas

1
ตัวอย่างง่ายๆ (แม้ว่าอาจจะมีคนที่เรียบง่ายกว่า)
Glen_b -Reinstate Monica

1
ใช้เวลาที่จะกระจายอย่างสม่ำเสมอบนและ ,U [ 0 , 2 π ] X = cos U Y = sin UU[0,2π]X=cosUY=sinยู
Dilip Sarwate

เนื่องจากความรู้สึกของ "ง่ายที่สุด" ไม่ได้ถูกกำหนดคำถามนี้จึงไม่สามารถตอบได้อย่างเป็นกลาง ฉันเลือกสำเนาซ้ำที่stats.stackexchange.com/questions/41317บนพื้นฐานของผลรวมที่ง่ายที่สุด = จำนวนน้อยที่สุดของจำนวนเชิงการสนับสนุนของการแจกแจงส่วนล่าง
whuber

3
@whuber: แม้ว่า "ง่าย" เป็นที่แน่นอนไม่ได้กำหนดไว้เป็นอย่างดีคำตอบที่นี่เช่นคำตอบโดย Glen_b ที่มีการให้บริการอย่างชัดเจนมากตัวอย่างง่ายๆมากกว่าด้ายคุณปิดนี้เป็นซ้ำของ ฉันขอแนะนำให้เปิดใหม่นี้ (ฉันได้ลงคะแนนไปแล้ว) และอาจทำให้ CW เพื่อเน้นความจริงที่ว่า "ง่ายที่สุด" ถูกนิยามไม่ดีและ OP อาจจะขอตัวอย่าง "ง่าย" หลายอย่าง
อะมีบาพูดว่า Reinstate Monica

คำตอบ:


18

Let(-1,1)XU(1,1)

Let 2Y=X2

ตัวแปรไม่เกี่ยวข้อง แต่ขึ้นอยู่กับ

อีกทางหนึ่งให้พิจารณาการกระจายตัวแบบไบวาเรียที่ไม่ต่อเนื่องประกอบด้วยความน่าจะเป็นที่ 3 คะแนน (-1,1) (0, -1), (1,1) โดยมีความน่าจะเป็น 1/4, 1/2, 1/4 ตัวแปรจะไม่เกี่ยวข้อง แต่ขึ้นอยู่กับ

พิจารณาชุดข้อมูล bivariate ในเพชร (รูปสี่เหลี่ยมจัตุรัสหมุน 45 องศา) ตัวแปรจะไม่สัมพันธ์กัน แต่ขึ้นอยู่กับ

นี่เป็นกรณีที่ง่ายที่สุดที่ฉันนึกถึง


ตัวแปรสุ่มทั้งหมดซึ่งมีความสมมาตรและมีศูนย์กลางอยู่ที่ 0 ซึ่งไม่เกี่ยวข้องกันหรือไม่
Martin Thoma

1
@moose คำอธิบายของคุณไม่ชัดเจน ถ้าคุณหมายถึง "ถ้ามีความสมมาตรเกี่ยวกับศูนย์และYเป็นสมมาตรเกี่ยวกับศูนย์" ดังนั้นไม่เนื่องจาก bivariate ปกติที่มีระยะขอบปกติมาตรฐานสามารถสัมพันธ์กันได้ตัวอย่างเช่น หากคุณหมายถึง "ถ้าXมีความสมมาตรเกี่ยวกับศูนย์และYเป็นฟังก์ชันคู่ของX " ดังนั้นตราบใดที่มีความแปรปรวนอยู่ฉันเชื่อว่าคำตอบคือใช่ ถ้าคุณหมายถึงอย่างอื่นคุณจะต้องอธิบาย XYXYX
Glen_b -Reinstate Monica

7

ผมคิดว่าสาระสำคัญของบางส่วนของ counterexamples ง่ายสามารถมองเห็นได้โดยเริ่มต้นด้วยตัวแปรสุ่มต่อเนื่องศูนย์กลางในการเป็นศูนย์คือE [ X ] = 0 สมมติว่าไฟล์ PDF ของXคือแม้และกำหนดไว้ในช่วงของรูปแบบ( - , )ที่> 0 ตอนนี้สมมติY = F ( X )สำหรับฟังก์ชั่นบางฉ ตอนนี้เราถามคำถาม: สำหรับฟังก์ชั่นประเภทใดf ( X )เรามีC oXE[X]=0X(-a,a)a>0Y=(X)(X) ?Cโอโวลต์(X,(X))=0

เรารู้ว่า ] สมมติฐานของเราว่าE [ X ] = 0ทำให้เราตรงไปที่C o v ( X , f ( X ) ) = E [ X fCโอโวลต์(X,(X))=E[X(X)]-E[X]E[(X)]E[X]=0 ] แสดงว่า pdf ของ Xผ่าน p ( )เรามีCov(X,f(X))=E[Xf(X)]Xp()

xCov(X,f(X))=E[Xf(X)]=aaxf(x)p(x)dx

เราต้องการให้และวิธีหนึ่งในการบรรลุเป้าหมายนี้คือการทำให้f ( x )เป็นฟังก์ชั่นคู่ซึ่งหมายถึงx f ( x ) p ( x )เป็นฟังก์ชันคี่ จากนั้นจึงตามด้วยa - a x f ( x ) p ( x ) d x = 0และดังนั้นC o vCov(X,f(X))=0f(x)xf(x)p(x)aaxf(x)p(x)dx=0 0Cov(X,f(X))=0

วิธีนี้เราจะเห็นว่าการกระจายความแม่นยำของมีความสำคัญเป็นพร้อมเป็น pdf เป็นสมมาตรรอบบางจุดและฟังก์ชั่นใด ๆ แม้กระทั่ง( )จะทำสำหรับการกำหนดYXf()Y

หวังว่าสิ่งนี้จะช่วยให้นักเรียนเห็นว่าผู้คนต่างมีตัวอย่างของประเภทนี้อย่างไร


5

เป็นตัวอย่าง (เช่นนักเรียนที่ทำงานหนัก)! ด้วยที่กล่าวว่า:

ฉันพยายามคิดถึงตัวอย่างของโลกแห่งความจริงและนี่เป็นครั้งแรกที่เข้ามาในความคิดของฉัน นี่จะไม่ใช่กรณีที่ง่ายที่สุดทางคณิตศาสตร์ (แต่ถ้าคุณเข้าใจตัวอย่างนี้คุณควรจะสามารถหาตัวอย่างที่ง่ายกว่าด้วยโกศและบอลหรืออะไรบางอย่าง)

จากการวิจัยพบว่าค่าเฉลี่ยไอคิวของชายและหญิงเท่ากัน แต่ความแปรปรวนของไอคิวของผู้ชายนั้นมากกว่าค่าความแปรปรวนของไอคิวของผู้หญิง สำหรับรูปธรรมขอบอกว่าชาย IQ ดังนี้และเพศหญิง IQ ดังนี้N ( 100 , α σ 2 )กับα < 1 ประชากรครึ่งหนึ่งเป็นเพศชายและอีกครึ่งหนึ่งเป็นประชากรเพศหญิงN(100,σ2)N(100,ασ2)α<1

สมมติว่างานวิจัยนี้ถูกต้อง:

ความสัมพันธ์ของเพศและไอคิวคืออะไร?

เพศและ IQ เป็นอิสระหรือไม่?


4

เราสามารถกำหนดตัวแปรสุ่มแบบไม่ต่อเนื่องด้วยP ( X = - 1 ) = P ( X = 0 ) = P ( X = 1 ) = 1X{-1,0,1}P(X=-1)=P(X=0)=P(X=1)=13

จากนั้นให้นิยามY={1,ถ้าX=00,มิฉะนั้น

สามารถตรวจสอบได้อย่างง่ายดายว่าและYไม่เกี่ยวข้องกัน แต่ไม่เป็นอิสระXY


2

ลองนี้ (รหัส R):

x=c(1,0,-1,0);  
y=c(0,1,0,-1);  

cor(x,y);  
[1] 0

นี่คือจากสมการของวงกลมx2+Y2-R2=0

ไม่สัมพันธ์กับ xแต่ขึ้นอยู่กับการใช้งาน (กำหนดขึ้น) Yx


1
ศูนย์สหสัมพันธ์ตัวอย่างไม่ได้หมายความว่าความสัมพันธ์ที่แท้จริงคือศูนย์
mpiktas

3
@mpiktas หากค่าสี่ค่าเหล่านี้แสดงถึงการแจกแจงแบบไบวาริเอตแต่ละค่าด้วยความน่าจะเป็น 1/4 corฟังก์ชันที่ส่งคืนค่าศูนย์จะบ่งบอกความสัมพันธ์ของประชากรเป็นศูนย์
Glen_b -Reinstate Monica

@Glen_b ฉันควรจะแสดงความคิดเห็นดีกว่าในรหัส สิ่งนี้อาจไม่เป็นที่รู้จักสำหรับทุกคน คุณสามารถใช้เครื่องหมายอัฒภาคคิดว่าฉันไม่แนะนำให้ใช้รูปแบบการเข้ารหัสใน R.
นักวิเคราะห์

1
@Glen_b ใช่คุณถูกต้อง แต่นี่ไม่ได้ระบุไว้ การสังเกตที่ดี btw
mpiktas

1

กรณีทั่วไปเท่านั้นเมื่อขาดความสัมพันธ์หมายถึงความเป็นอิสระคือเมื่อการกระจายตัวของ X และ Y เป็นแบบเกาส์


2
สิ่งนี้ไม่ได้ตอบคำถามโดยตรงโดยการสร้างตัวอย่างง่ายๆ - ในแง่นั้นมันเป็นความคิดเห็นมากกว่า - แต่มันให้คำตอบทางอ้อมซึ่งมันแสดงให้เห็นตัวอย่างที่เป็นไปได้มากมาย มันอาจจะคุ้มค่าการโพสต์ข้อความนี้ใหม่เพื่อให้ชัดเจนว่าจะตอบคำถามต้นฉบับ
Silverfish

-1

คำตอบสองประโยค: กรณีที่ชัดเจนที่สุดของการพึ่งพาทางสถิติที่ไม่เกี่ยวข้องซึ่งเป็นฟังก์ชันที่ไม่ใช่เชิงเส้นของ RV กล่าวว่า Y = X ^ n RVs ทั้งสองนั้นขึ้นอยู่อย่างชัดเจน แต่ก็ไม่ได้มีความสัมพันธ์กัน


XXY=Xn

คำตอบนี้ไม่ถูกต้อง ใน R: นิพจน์: {x <- runif (100); cor (x, x ^ 3)} ผลลัพธ์: 0.9062057
Josh
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.