การแจกแจงความแตกต่างระหว่างการแจกแจงสองแบบปกติ


21

ฉันมีฟังก์ชันความหนาแน่นของความน่าจะเป็นสองแบบของการแจกแจงแบบปกติ:

f1(x1|μ1,σ1)=1σ12πe(xμ1)22σ12

และ

f2(x2|μ2,σ2)=1σ22πe(xμ2)22σ22

ฉันกำลังมองหาฟังก์ชั่นความหนาแน่นของความน่าจะเป็นของการแยกระหว่างx1และx2 2 ฉันคิดว่านั่นหมายถึงฉันกำลังมองหาฟังก์ชันความหนาแน่นของความน่าจะเป็นของ|x1x2|. ถูกต้องหรือไม่ ฉันจะหาสิ่งนั้นได้อย่างไร


หากเป็นการบ้านโปรดใช้self-studyแท็ก เรายอมรับคำถามทำการบ้าน แต่เราจัดการกับพวกเขาแตกต่างกันเล็กน้อยที่นี่
shadowtalker

นอกจากนี้ฉันไม่ต้องการเป็น "ผู้ชายคนนั้น" แต่คุณลองใช้ Google หรือเปล่า "ความแตกต่างระหว่างการแจกแจงแบบปกติ" พบคำตอบให้ฉันทันที
shadowtalker

@ssdecontrol ไม่ใช่ไม่ใช่การบ้าน แต่มันเป็นโครงการงานอดิเรกดังนั้นฉันไม่รังเกียจที่จะค้นหาสิ่งต่าง ๆ ด้วยตัวเองถ้าฉันทำถูกแล้ว ฉันลองใช้ google แต่ความเข้าใจของฉันเกี่ยวกับเรื่องนี้ จำกัด มากจนฉันอาจจำไม่ได้ว่ามันอยู่ตรงหน้าฉัน ด้วยเครื่องหมายคำพูดฉันพบสิ่งต่าง ๆ มากมายคล้ายกับ "ความแตกต่างระหว่างการแจกแจงแบบปกติกับ x" สำหรับบาง x
Martijn

คำตอบ:


26

คำถามนี้สามารถตอบได้ตามที่ระบุไว้โดยสมมติว่าตัวแปรสุ่ม1ตัวและX 2 ที่ควบคุมโดยการแจกแจงเหล่านี้เป็นอิสระ X1X2 นี้จะทำให้พวกเขาแตกต่างปกติที่มีค่าเฉลี่ยμ = μ 2 - μ 1และแปรปรวนσ 2 = σ 2 1 + σ 2 2 (วิธีแก้ปัญหาต่อไปนี้สามารถทำให้เป็นมาตรฐานโดยทั่วไปสำหรับการแจกแจงไบวาริเอตแบบปกติของ( X 1 , X 2X=X2X1μ=μ2μ1σ2=σ12+σ22 .) ดังนั้นตัวแปร(X1,X2)

Z=Xμσ=X2X1(μ2μ1)σ12+σ22

มีการแจกแจงแบบปกติมาตรฐาน (นั่นคือโดยมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนของหน่วย) และ

X=σ(Z+μσ).

การแสดงออก

|X2X1|=|X|=X2=σ(Z+μσ)2

แสดงให้เห็นถึงความแตกต่างที่แท้จริงในฐานะเวอร์ชั่นสเกลของสแควร์รูทของการแจกแจงแบบไคสแควร์ที่ไม่ใช่ศูนย์กลางพร้อมหนึ่งระดับของอิสระและพารามิเตอร์ noncentrality λ=(μ/σ)2 2การกระจายแบบไคสแควร์ที่ไม่ใช่ศูนย์กลางด้วยพารามิเตอร์เหล่านี้มีองค์ประกอบความน่าจะเป็น

f(y)dy=y2πe12(λy)cosh(λy)dyy, y>0.

การเขียนสำหรับx > 0 จะสร้างการติดต่อแบบหนึ่งต่อหนึ่งระหว่างyและสแควร์รูทของมันทำให้เกิดy=x2x>0y

f(y)dy=f(x2)d(x2)=x22πe12(λx2)cosh(λx2)dx2x2.

ลดความซับซ้อนนี้แล้วลดขนาดโดยให้ความหนาแน่นที่ต้องการσ

f|X|(x)=1σ2πcosh(xμσ2)exp(x2+μ22σ2).

ผลลัพธ์นี้ได้รับการสนับสนุนโดยการจำลองเช่นฮิสโตแกรมนี้ที่มี 100,000 การจับฉลากอิสระของ(เรียกว่า "X" ในรหัส) กับพารามิเตอร์μ 1 = - 1 , μ 2 = 5 , σ 1 = 4 , σ 2 = 1 บนมันถูกพล็อตกราฟของf | X | ซึ่งสอดคล้องกับค่าฮิสโตแกรมอย่างประณีต|X|=|X2X1|μ1=1,μ2=5,σ1=4,σ2=1f|X|

Figure

Rรหัสสำหรับการจำลองนี้ดังต่อไปนี้

#
# Specify parameters
#
mu <- c(-1, 5)
sigma <- c(4, 1)
#
# Simulate data
#
n.sim <- 1e5
set.seed(17)
x.sim <- matrix(rnorm(n.sim*2, mu, sigma), nrow=2)
x <- abs(x.sim[2, ] - x.sim[1, ])
#
# Display the results
#
hist(x, freq=FALSE)
f <- function(x, mu, sigma) {
 sqrt(2 / pi) / sigma * cosh(x * mu / sigma^2) * exp(-(x^2 + mu^2)/(2*sigma^2)) 
}
curve(f(x, abs(diff(mu)), sqrt(sum(sigma^2))), lwd=2, col="Red", add=TRUE)

(f1(.)f2(.))2?
user77005

1
@user77005 The answer to that is in my post: it's a non-central chi-squared distribution. Follow the link for details.
whuber

22

I am providing an answer that is complementary to the one by @whuber in the sense of being what a non-statistician (i.e. someone who does not know much about non-central chi-square distributions with one degree of freedom etc) might write, and that a neophyte could follow relatively easily.

Borrowing the assumption of independence as well as the notation from whuber's answer, Z=X1X2N(μ,σ2) where μ=μ1μ2 and σ2=σ12+σ22. Thus, for x0,

F|Z|(x)P{|Z|x}=P{xZx}=P{x<Zx}since Z is a continuous random variable=FZ(x)FZ(x),
and of course, F|Z|(x)=0 for x<0. It follows upon differentiating with respect to x that
f|Z|(x)xF|Z|(x)=[fZ(x)+fZ(x)]1(0,)(x)=[exp((xμ)22σ2)σ2π+exp((x+μ)22σ2)σ2π]1(0,)(x)=exp(x2+μ22σ2)σ2π(exp(xμσ2)+exp(xμσ2))1(0,)(x)=1σ2πcosh(xμσ2)exp(x2+μ22σ2)1(0,)(x)
which is the exact same result as in whuber's answer, but arrived at more transparently.

1
+1 I always like to see solutions that work from the most basic possible principles and assumptions.
whuber

1

The distribution of a difference of two normally distributed variates X and Y is also a normal distribution, assuming X and Y are independent (thanks Mark for the comment). Here is a derivation: http://mathworld.wolfram.com/NormalDifferenceDistribution.html

Here you are asking the absolute difference, based on whuber's answer and if we assume the difference in mean of X and Y is zero, it's just a half normal distribution with two times the density (thanks Dilip for the comment).


3
You and Wolfram Mathworld are implicitly assuming that the 2 normal distributions (random variables) are independent. The difference is not even necessarily normally distributed if the 2 normal random variables are not bivariate normal, which can happen if they are not independent..
Mark L. Stone

4
In addition to the assumption pointed out by Mark, you are also ignoring the fact that the means are different. The half normal case works only when μ1=μ2 so that the difference has mean 0.
Dilip Sarwate

Thank you for your comments. Now I revised my answer based on your comments and whuber's answer.
yuqian
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.