การกระจายระยะทางแบบยุคลิดระหว่างตัวแปรสุ่มแบบกระจายสองตัวคืออะไร?


41

สมมติว่าคุณจะได้รับวัตถุทั้งสองมีสถานที่ที่แน่นอนไม่เป็นที่รู้จัก แต่จะมีการกระจายไปตามการแจกแจงปรกติกับพารามิเตอร์ที่รู้จักกัน (เช่นและ(วีที)) เราสามารถสันนิษฐานได้ว่าสิ่งเหล่านี้เป็นทั้งบรรทัดฐาน bivariate เช่นตำแหน่งที่ถูกอธิบายโดยการกระจายข้ามพิกัด ( (เช่นและเป็นเวกเตอร์ที่มีพิกัดคาดหวังสำหรับและตามลำดับ) เราจะถือว่าวัตถุนั้นเป็นอิสระa~ยังไม่มีข้อความ(ม.,s)~ยังไม่มีข้อความ(โวลต์,เสื้อ))(x,Y)ม.โวลต์(x,Y)a

ไม่มีใครรู้ว่าการกระจายตัวของปริภูมิแบบยุคลิดแบบสแควร์ระหว่างวัตถุสองชิ้นนี้คือการแจกแจงแบบพารามิเตอร์หรือไม่? หรือวิธีการหา PDF / CDF สำหรับฟังก์ชั่นนี้วิเคราะห์?


4
คุณควรได้รับการแจกแจงไคสแควร์ที่ไม่ได้เป็นศูนย์กลางหลายชุดหากพิกัดทั้งสี่ไม่เกี่ยวข้องกัน มิฉะนั้นผลลัพธ์จะดูซับซ้อนมากขึ้น
whuber

@whuber รายละเอียดใด ๆ / คำแนะนำคุณสามารถให้เป็นวิธีพารามิเตอร์ของการแจกแจงไคสแควร์ที่เกิดไม่ใช่กลางที่เกี่ยวข้องกับของวัตถุ A, B จะเป็นที่ยอดเยี่ยม
นิค

4
@Nick วรรคสองสามย่อหน้าแรกของบทความ Wikipediaให้รายละเอียด โดยดูที่ฟังก์ชันคุณสมบัติคุณสามารถสร้างว่าผลลัพธ์ที่คล้ายกันไม่สามารถใช้ได้เมื่อความแปรปรวนไม่เหมือนกันทั้งหมดหรือมีความสัมพันธ์บางอย่าง
whuber

@ ไม่ชัดเพียงชี้แจงทั้งและเป็นเวกเตอร์สุ่มที่มีค่าใน ? b R 2abR2
mpiktas

1
@ ไม่ชัดถ้าaและเป็นค่าปกติดังนั้นความแตกต่างคือa-ก็เป็นปกติเช่นกัน จากนั้นปัญหาของคุณคือหาการกระจายตัวของเวกเตอร์ปกติแบบสุ่ม Googling ฉันพบลิงค์นี้ กระดาษอธิบายปัญหาที่ซับซ้อนมากขึ้นซึ่งในกรณีเฉพาะอย่างยิ่งเกิดขึ้นพร้อมกับคุณ สิ่งนี้ให้ความหวังว่าจะมีคำตอบที่แน่นอนสำหรับคำถามของคุณ การอ้างอิงอาจให้แนวคิดเพิ่มเติมแก่คุณในการค้นหา
mpiktas

คำตอบ:


24

คำตอบของคำถามนี้สามารถพบได้ในหนังสือรูปแบบสมการกำลังสองในตัวแปรสุ่มโดย Mathai และ Provost (1992, Marcel Dekker, Inc. )

ในฐานะที่เป็นความคิดเห็นชี้แจงคุณจะต้องพบการกระจายตัวของที่ Z = - ดังนี้การกระจายปกติ bivariate ที่มีค่าเฉลี่ยμและแปรปรวนเมทริกซ์Σ นี้เป็นรูปแบบสมการกำลังสองในสองตัวแปรตัวแปรสุ่มZQ=Z12+Z22Z=a-μΣZ

สั้น ๆ หนึ่งผลลัพธ์ทั่วไปที่ดีสำหรับกรณี -dimensional ซึ่งz N p ( μ , Σ )และQ = p j = 1 z 2 j คือการสร้างฟังก์ชั่นโมเมนต์คือ E ( e t Q ) = e t p j = 1 b 2 j λ jพีZ~ยังไม่มีข้อความพี(μ,Σ)

Q=ΣJ=1พีZJ2
ที่λ1,...,λPมีค่าลักษณะเฉพาะของΣและBเป็นฟังก์ชันเชิงเส้นของμ ดูทฤษฎีบท 3.2a.2 (หน้า 42) ในหนังสือที่อ้างถึงข้างต้น (เราสมมติว่าΣไม่ใช่เอกพจน์) การเป็นตัวแทนที่มีประโยชน์อื่นคือ 3.1a.1 (หน้า 29) Q=pj=1
E(อีเสื้อQ)=อีเสื้อΣJ=1พีJ2λJ1-2เสื้อλJΠJ=1พี(1-2เสื้อλJ)-1/2
λ1,...,λพีΣμΣ ที่ U 1 , ... , ยูพีจะ IID N ( 0 , 1 )
Q=ΣJ=1พีλJ(ยูJ+J)2
ยู1,...,ยูพียังไม่มีข้อความ(0,1)

บทที่ 4 ทั้งหมดในหนังสือเล่มนี้อุทิศให้กับการเป็นตัวแทนและการคำนวณความหนาแน่นและฟังก์ชั่นการกระจายซึ่งไม่ได้เป็นเรื่องเล็กน้อย ฉันคุ้นเคยกับหนังสือเพียงผิวเผินเท่านั้น แต่ความประทับใจของฉันก็คือการเป็นตัวแทนทั่วไปในแง่ของการขยายซีรี่ส์ที่ไม่มีที่สิ้นสุด

ดังนั้นในทางหนึ่งคำตอบของคำถามคือใช่การกระจายตัวของปริภูมิแบบยุคลิดแบบสแควร์ระหว่างสองเวกเตอร์ bivariate ปกตินั้นเป็นของคลาส (และศึกษากันดี) การแจกแจงพาราเมาท์โดยพารามิเตอร์ทั้งสี่และ1 , 2 R อย่างไรก็ตามฉันค่อนข้างมั่นใจว่าคุณจะไม่พบการแจกจ่ายนี้ในตำรามาตรฐานของคุณλ1,λ2>01,2R

หมายเหตุยิ่งไปกว่านั้นและbไม่จำเป็นต้องเป็นอิสระ ความปกติของการมีส่วนร่วมก็เพียงพอแล้ว (ซึ่งเป็นไปโดยอัตโนมัติถ้าพวกมันเป็นอิสระและเป็นเรื่องปกติ) จากนั้นความแตกต่างa - bตามการแจกแจงแบบปกติaa-


1
ขอบคุณสำหรับการอ้างอิงฉันพบหนังสือเล่มนี้แล้วและฉันก็พยายามที่จะทำมันให้สำเร็จ
Nick

λJ=σ2พี=2J2λJμJ2

JμJ2

7

μd=μ1μ2Σd=Σ1+Σ2 Σd=JΣ12JTΣ12=[Σ1Σ2]J=[+ผม,-ผม]

ประการที่สองค้นหาการกระจายของความยาวเวกเตอร์ที่ต่างกันหรือระยะทางรัศมีจากจุดกำเนิดซึ่งก็คือฮอยต์ที่กระจายตัว :

รัศมีรอบค่าเฉลี่ยที่แท้จริงในตัวแปรสุ่มปกติที่มีความสัมพันธ์แบบ bivariate กับความแปรปรวนที่ไม่เท่ากันอีกครั้งที่เขียนใหม่ในพิกัดขั้วโลก (รัศมีและมุม) ตามการกระจายฮอยต์ pdf และ cdf ถูกกำหนดในรูปแบบปิดการค้นหารูทแบบตัวเลขจะใช้ในการค้นหา cdf ^ −1 ลดการกระจาย Rayleigh หากความสัมพันธ์เป็น 0 และความแปรปรวนเท่ากัน

การกระจายทั่วไปเกิดขึ้นถ้าคุณยอมให้มีความแตกต่างแบบเอนเอียง (ต้นกำเนิดที่เปลี่ยน) จาก Ballistipedia : การแจกแจงพิกัด xy และข้อผิดพลาดของรัศมีที่เกิดขึ้น


2
+1 แต่ฉันคิดว่ามันคุ้มค่าที่ชี้ให้เห็นว่าคำถามนั้นเกี่ยวข้องกับสิ่งที่คุณเรียกว่า "กรณีทั่วไป"
อะมีบาพูดว่า Reinstate Monica

1

ทำไมไม่ลองทดสอบดูล่ะ?

set.seed(347)
x <- rnorm(10000)
y <- rnorm(10000)
x2 <- rnorm(10000)
y2 <- rnorm(10000)

qdf <- data.frame(x,y,x2,y2)
qdf <- data.frame(qdf,(x-x2)^2+(y-y2)^2)
colnames(qdf)[5] <- "euclid" 

plot(c(x,y),c(x2,y2))
plot(qdf$euclid)
hist(qdf$euclid) 
plot(dentist(qdf$euclid))

แปลง 1 แปลง 2 แปลง 3 แปลง 4


2
ความคิดเห็นของผู้ถามคำถามเดิมระบุไว้แล้วว่ามันจะมีลักษณะอย่างไรถ้าความแปรปรวนเหมือนกันและตัวแปรไม่เกี่ยวข้องกัน บางทีอาจยกตัวอย่างว่ากรณีนี้ไม่ใช่ที่ใด
Andy W

คุณสามารถให้ตัวอย่างเช่น
Brandon Bertelsen

สิ่งที่คุณต้องทำคือสร้างค่า x และ y ที่มีความสัมพันธ์หรือมีความแปรปรวนต่างกัน ความแปรปรวนที่แตกต่างสามารถทำได้ทันทีในรหัสตามที่เป็นอยู่ คุณสามารถสร้างค่าจากเมทริกซ์ความแปรปรวนร่วมที่ระบุโดยใช้ mvrnorm จากแพ็คเกจ MASS นอกจากนี้ฉันไม่แน่ใจว่าฟังก์ชั่น "หมอฟัน" อยู่ในรหัสด้านบนมันอาจจะเป็น "ความหนาแน่น"
Andy W

1
ที่ถูกกล่าวว่าอาจเป็นเพียง enlightening ทำงานผ่านคณิตศาสตร์เพื่อดูว่าทำไมในกรณีนี้ (และวิธีการจัดการกับความแปรปรวน / covariances จะเปลี่ยนการกระจาย) ไม่ชัดเจนเลยสำหรับฉันว่าทำไมในกรณีนี้เพียงแค่ดูฟังก์ชั่นพิเศษที่กล่าวถึงโดย whuber ดูเหมือนว่าจะมีความเข้าใจอย่างง่ายเกี่ยวกับกฎสำหรับการเพิ่มการลบและการคูณตัวแปรแบบสุ่มคุณจะได้เข้าใจถึงสาเหตุที่เป็นเช่นนั้น
Andy W
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.