เหตุใด CDF ของตัวอย่างกระจายอย่างสม่ำเสมอ


17

ฉันอ่านที่นี่ที่ได้รับตัวอย่างจากการกระจายอย่างต่อเนื่องกับ cdfตัวอย่างที่สอดคล้องกับเป็นไปตามการแจกแจงแบบมาตรฐานF X U ฉัน = F X ( X i )X1,X2,...,XnFXUi=FX(Xi)

ฉันตรวจสอบสิ่งนี้โดยใช้แบบจำลองเชิงคุณภาพใน Python และฉันสามารถตรวจสอบความสัมพันธ์ได้อย่างง่ายดาย

import matplotlib.pyplot as plt
import scipy.stats

xs = scipy.stats.norm.rvs(5, 2, 10000)

fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
    scipy.stats.norm.cdf(xs, 5, 2),
    bins=50
)
axes[1].set_title("CDF(samples)")

ส่งผลให้พล็อตต่อไปนี้:

พล็อตแสดงตัวอย่างของการแจกแจงแบบปกติและ cdf ของตัวอย่าง

ฉันไม่สามารถเข้าใจได้ว่าทำไมสิ่งนี้จึงเกิดขึ้น ฉันถือว่ามันเกี่ยวข้องกับคำจำกัดความของ CDF และเป็นความสัมพันธ์กับ PDF แต่ฉันขาดอะไรไป ...

ฉันจะขอบคุณถ้ามีคนชี้ให้ฉันอ่านเรื่องหรือช่วยให้ฉันได้สัญชาตญาณในเรื่อง

แก้ไข: CDF มีลักษณะเช่นนี้:

CDF ของการกระจายตัวอย่าง


2
คำนวณ CDF ของ(X) FX(X)
Zhanxiong

2
คุณจะพบหลักฐานของคุณสมบัตินี้ (สำหรับ rv ต่อเนื่อง) ในหนังสือใด ๆ เกี่ยวกับการจำลองเนื่องจากนี่เป็นพื้นฐานของวิธีการจำลอง cdf แบบผกผัน
ซีอาน

2
ลองใช้การแปลงความน่าจะเป็นแบบอินทิกรัลของ
Zachary Blumenfeld

1
@ ซีอานมันเป็นสิ่งที่ดีที่จะชี้ให้เห็นข้อสรุปถือเฉพาะสำหรับตัวแปรสุ่มอย่างต่อเนื่อง บางครั้งผลลัพธ์นี้ถูกใช้อย่างไม่เหมาะสมสำหรับตัวแปรสุ่มที่ไม่ต่อเนื่อง ในอีกทางหนึ่งทราบอีกหลายบทพิสูจน์ที่เกี่ยวข้องกับขั้นตอนซึ่งถือว่าเข้มงวด monotonicity ของซึ่งก็คือ สมมติฐานที่แข็งแกร่งเกินไป ลิงค์ต่อไปนี้ให้สรุปอย่างเข้มงวดในหัวข้อนี้: people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdfFP(F(X)x)=P(XF1(x))F
Zhanxiong

@Zhanxiong เงื่อนไขเดียวที่จำเป็นสำหรับคือมันคือcàdlàg F
AdamO

คำตอบ:


19

สมมติว่านั้นต่อเนื่องและเพิ่มขึ้นเรื่อย ๆ กำหนดและทราบว่าใช้เวลาค่าใน1] จากนั้น Z = F X ( X ) Z [ 0 , 1 ] F Z ( x ) = P ( F X ( X ) x ) = P ( X F - 1 X ( x ) ) = F X ( F - 1 x ( x ) ) = xFXZ=FX(X)Z[0,1]

FZ(x)=P(FX(X)x)=P(XFX-1(x))=FX(FX-1(x))=x.

ในทางกลับกันถ้าเป็นตัวแปรสุ่มแบบสม่ำเสมอที่รับค่าใน , ยู[0,1]

FU(x)=RfU(u)du=0xdu=x.

ดังนั้นสำหรับทุก1]FZ(x)=FU(x)x[0,1]


มันเป็นไปตามที่ Z มีการกระจายแบบสม่ำเสมอ (0, 1) หรือไม่?
สถิติแม่มด

@StatsSorceress ใช่คุณพูดถูก มีการแจกแจงแบบสม่ำเสมอมาตรฐานในZ(0,1).
Idonknow

8

สังหรณ์ใจบางทีมันอาจจะทำให้ความรู้สึกที่จะคิดว่าเป็นฟังก์ชันเปอร์เซ็นต์เช่นของกลุ่มตัวอย่างที่สร้างแบบสุ่มจาก DFคาดว่าจะลดลงต่ำกว่าxอีกทางหนึ่ง(คิดว่าภาพผกผันไม่ใช่ฟังก์ชันผกผันที่เหมาะสมต่อ se ) คือฟังก์ชัน "quantile" นั่นคือคือจุดด้านหลังซึ่งอยู่ในสัดส่วนของตัวอย่าง องค์ประกอบการทำงานเป็นวัดสับเปลี่ยนFF(x)F(x)FxF1x=F1(p)xpFF1=λF1F

การแจกแจงแบบสม่ำเสมอเป็นการกระจายตัวแบบเดียวที่มีฟังก์ชันควอนไทล์เท่ากับฟังก์ชันเปอร์เซ็นไทล์: มันคือฟังก์ชันตัวตน พื้นที่ภาพจึงเท่ากับพื้นที่ความน่าจะเป็น แมปตัวแปรสุ่มต่อเนื่องไปยังพื้นที่ (0, 1) ด้วยการวัดที่เท่ากัน เนื่องจากสองเปอร์เซนต์, , เรามีFa<bP(F1(a)<x<F1(b))=P(a<F(X)<b)=ba


ฉันพยายามเป็นเวลาหลายชั่วโมง แต่ในที่สุดก็คลิกว่าทำไมตัวแปรสุ่มที่ได้รับมีการกระจายอย่างสม่ำเสมอ คำตอบของคุณช่วยได้จริงๆขอบคุณมาก ดูเหมือนเป็นอย่างมากในพีชคณิตโดยที่ 1 คือเอกลักษณ์ของการคูณ Y=F(X)
Aditya P
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.