เหตุใดฟังก์ชันการแจกแจงสะสม (CDF) จึงกำหนดการกระจายโดยเฉพาะ


17

ฉันได้รับการบอกเสมอว่า CDF ไม่เหมือนใคร แต่ PDF / PMF ไม่เหมือนกันทำไมจึงเป็นเช่นนั้น คุณสามารถยกตัวอย่างที่ PDF / PMF ไม่ซ้ำกันได้หรือไม่?


6
[0,1](0,1) 0 < j 2 - i < 1 i 1 jPr(j2i)=212i0<j2i<1i1j

2
ไม่ใช่ดิสทริบิวชันทั้งหมดที่มี PDF หรือมี PMF ในขณะที่ดู CDF จะทำให้มุมมองรวมเป็นหนึ่งเดียว ตัวแปรแบบต่อเนื่องมี CDF ที่ดูราบรื่นตัวแปรแบบแยกมี "staircase" และ CDF บางตัวผสมกัน
Silverfish

6
@Silverfish: ... และบางส่วนไม่ได้อยู่เหนือ! :-)
พระคาร์ดินัล

3
เพื่อจัดการกับชื่อ (อาจจะค่อนข้างหลวม) CDF กำหนดการแจกแจงเพราะ CDF (หรือเทียบเท่าเพียงแค่ DF / 'ฟังก์ชั่นการกระจาย'; "C" ทำหน้าที่เฉพาะเพื่อชี้แจงว่าเป็นวัตถุที่เรากำลังพูดถึง) 'การกระจาย' หมายถึงแท้จริง; "D" เป็นเงื่อนงำในส่วนนั้น นั่นคือมันไม่ซ้ำกันดังต่อไปนี้จาก "F" - ฟังก์ชั่นมีค่าเดียวดังนั้นหากฟังก์ชั่นการกระจายสองฟังก์ชั่นเหมือนกันวัตถุที่พวกเขากำหนดจะเหมือนกัน; หาก DFs แตกต่างกันทุกที่สิ่งที่พวกเขาเป็นคำจำกัดความของจะแตกต่างกันไปที่จุดเหล่านั้น นั่นคือการพูดซ้ำซาก? ฉันคิดว่ามันคือ.
Glen_b -Reinstate Monica

4
@Glen_b มันเป็นเรื่องธรรมดาสำหรับสัญชาตญาณที่ผ่านการฝึกฝนมาแล้วเท่านั้น ฟังก์ชั่นการกระจายFเพียง แต่ช่วยให้ความน่าจะเป็นในรูปแบบF(x)=Pr{ωΩ|X(ω)x}ในขณะที่ทั้งกระจายระบุความน่าจะเป็นในรูปแบบPr({ωΩ|X(ω)B}สำหรับพลชุดที่วัดBR R คุณต้องแสดงFตัวกำหนดการกระจาย ดังที่ NicholasB ชี้ให้เห็นนั่นเป็นเรื่องของการขยายการวัดล่วงหน้าจากกึ่งวงแหวน (ครึ่งช่วงเปิด),μ((a,b])=F(b)F(a)ไปยัง Lebesgue เต็ม sigma-field และแสดงว่ามันไม่เหมือนใคร
whuber

คำตอบ:


13

ให้เราระลึกถึงบางสิ่ง Let เป็นพื้นที่ที่น่าจะเป็น , Ωเป็นชุดตัวอย่างของเราเป็นของเราσพีชคณิตและPเป็นฟังก์ชั่นความน่าจะเป็นกำหนดไว้ใน ตัวแปรสุ่มเป็นฟังก์ชั่นที่วัดX : โอห์ม→การวิจัยเช่นX - 1 ( S ) สำหรับการใด ๆ ที่วัดเกอเซตในR(Ω,A,P)ΩAσPAX:ΩRX1(S)AR. หากคุณไม่คุ้นเคยกับแนวคิดนี้ทุกอย่างที่ฉันพูดในภายหลังจะไม่สมเหตุสมผล

เมื่อใดก็ตามที่เรามีตัวแปรสุ่มมันทำให้เกิดความน่าจะเป็นในการวัดX บนRโดยการผลักดันอย่างเป็นหมวดหมู่ ในคำอื่น ๆX ' ( S ) = P ( X - 1 ( S ) ) มันไม่ได้เป็นเรื่องที่จะตรวจสอบว่าX 'เป็นตัวชี้วัดความน่าจะเป็นในการวิจัย เราเรียกX 'กระจายของXX:ΩRXRX(S)=P(X1(S))XRXX

ตอนนี้เกี่ยวข้องกับแนวคิดนี้เป็นสิ่งที่เรียกว่าฟังก์ชั่นการกระจายของตัวแปรฟังก์ชั่น กำหนดตัวแปรสุ่มเรากำหนดF ( x ) = P ( X x ) ฟังก์ชันการแจกแจงF : R[ 0 , 1 ]มีคุณสมบัติดังต่อไปนี้:X:ΩRF(x)=P(Xx)F:R[0,1]

  1. เป็นแบบต่อเนื่องที่ถูกต้องF

  2. ไม่ลดลงF

  3. และ F ( - ) = 0F()=1F()=0

ตัวแปรสุ่มที่ชัดเจนซึ่งเท่ากันมีฟังก์ชันการแจกแจงและการแจกแจงแบบเดียวกัน

หากต้องการย้อนกลับกระบวนการและรับการวัดด้วยฟังก์ชันการแจกแจงที่ให้นั้นเป็นเรื่องทางเทคนิค ให้เราบอกคุณจะได้รับฟังก์ชันการแจกแจง ) กำหนดμ ( a , b ] = F ( b ) - F ( a )คุณต้องแสดงให้เห็นว่าμเป็นตัวชี้วัดกึ่งพีชคณิตของช่วงเวลาของ( a , b ]หลังจากนั้นคุณสามารถใช้ทฤษฎีบทการขยายCarathéodoryเพื่อขยายμไปยังวัดความน่าจะเป็นในการวิจัยF(x)μ(a,b]=F(b)F(a)μ(a,b]μR


4
นี่เป็นการเริ่มต้นที่ดีสำหรับคำตอบ แต่อาจเป็นการปิดบังเรื่องเล็กน้อยโดยไม่ตั้งใจ ปัญหาหลักดูเหมือนว่าจะแสดงให้เห็นว่าสองมาตรการที่มีฟังก์ชั่นการกระจายตัวที่เหมือนกันในความเป็นจริงเท่ากัน เรื่องนี้ต้องมีอะไรมากไปกว่าของ Dynkin - λทฤษฎีบทและความจริงที่ว่าชุดของแบบฟอร์ม( - , ]รูปแบบπ -System ที่สร้าง Borel σ . พีชคณิตแล้ว nonuniqueness ของความหนาแน่นที่ (สมมติว่ามันมีอยู่) สามารถ! ได้รับการแก้ไขและตรงกันข้ามกับด้านบนπλ(,b]πσ
พระคาร์ดินัล

3
(เล่นโวหารเพิ่มเติมอีกหนึ่ง: ตัวแปรสุ่มมักจะกำหนดในแง่ของชุด Borel มากกว่าชุด Lebesgue.) ฉันคิดว่าการแก้ไขเล็กน้อยบางคำตอบนี้จะค่อนข้างชัดเจน :-)
พระคาร์ดินัล

@ cardinal ฉันคิดถึงการวิเคราะห์ก่อนความน่าจะเป็นที่สอง ดังนั้นสิ่งนี้อาจอธิบายได้ว่าทำไมฉันถึงคิดว่าชุด Lebesgue ไม่ว่าในกรณีใดมันจะไม่ส่งผลกระทบต่อสิ่งที่พูด
Nicolas Bourbaki

4

ในการตอบคำขอเป็นตัวอย่างของความหนาแน่นสองค่าที่มีอินทิกรัลเดียวกัน (เช่นมีฟังก์ชันการแจกแจงแบบเดียวกัน) ให้พิจารณาฟังก์ชันเหล่านี้ที่กำหนดบนจำนวนจริง:

 f(x) = 1 ; when x is odd integer
 f(x) = exp(-x^2)  ; elsewhere

แล้ว;

 f2(x) = 1  ; when x is even integer
 f2(x) = exp(-x^2) ;  elsewhere

They are not equal at all x, but are both densities for the same distribution, hence densities are not uniquely determined by the (cumulative) distribution. When densities with a real domain are different only on a countable set of x values, then the integrals will be the same. Mathematical analysis is not really for the faint of heart or the determinately concrete mind.


0

I disagree with the statement, "the probability distribution function does not uniquely determine a probability measure", that you say in your opening question. It does uniquely determine it.

Let f1,f2:R[0,) be two probability mass functions. If,

Ef1=Ef2
For any measurable set E then f1=f2 almost everywhere. This uniquely determines the pdf (because in analysis we do not care if they disagree on a set of measure zero).

We can rewrite the above integral into,

Eg=0
Where g=f1f2 is an integrable function.

Define E={xR | g0}, so Eg=0. We use the well-known theorem that if an integral of a non-negative function is zero then the function is zero almost everywhere. In particular, g=0 a.e. on E. So f1=f2 a.e. on E. Now repeat the argument in the other direction with F={xR | g0}. We will get that f1=f2 a.e on F. Thus, f1=f2 a.e. on EF=R.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.