CDFs เป็นพื้นฐานมากกว่า PDF หรือไม่?


43

สถิติของฉันโดยทั่วไปกล่าวว่าหากได้รับหนึ่งในสามต่อไปนี้คุณสามารถค้นหาอีกสอง:

  • ฟังก์ชันการแจกแจงสะสม
  • ฟังก์ชั่นการสร้างช่วงเวลา
  • ฟังก์ชั่นความหนาแน่นของความน่าจะเป็น

แต่อาจารย์เศรษฐศาสตร์ของฉันกล่าวว่า CDFs เป็นพื้นฐานมากกว่า PDF เพราะมีตัวอย่างที่คุณสามารถมี CDF แต่ PDF ไม่ได้ถูกกำหนดไว้

CDFs เป็นพื้นฐานมากกว่า PDF หรือไม่? ฉันจะรู้ได้อย่างไรว่า PDF หรือ MGF สามารถมาจาก CDF ได้หรือไม่


23
นี่เป็นการประกวดพื้นฐานหรือไม่? เรามีคณะกรรมการตัดสินคนดังหรือไม่? เหล่านี้ทั้งหมดสามแนวคิดสามารถนำมาใช้ในการกำหนดมาตรการในพื้นที่ d อย่างไรก็ตามสำหรับการให้ CDF, MGF และ PDF อาจจะไม่อยู่ในรูปแบบ PDF ถูกกำหนดให้เป็นอนุพันธ์ของ CDF และ MGF ถูกกำหนดให้เป็นRประสบการณ์( T x ) d F ( x )และความต้องการที่สำคัญได้อยู่ อย่างไรก็ตามสิ่งนี้ไม่ได้หมายความว่าแนวคิดใด ๆ เหล่านี้มีพื้นฐานน้อยกว่า Fundamental เป็นคำคุณศัพท์ที่ดีซึ่งไม่มีคำจำกัดความทางคณิตศาสตร์ มันเป็นคำพ้องความสำคัญ RdRประสบการณ์(เสื้อx)dF(x)
mpiktas

6
@mpiktas: การแจกแจงความน่าจะเป็นทุกครั้งบน (เซตย่อยของ) มี CDF และมันกำหนดการกระจายแบบไม่ซ้ำกัน การแจกแจงความน่าจะไม่ใช่ทั้งหมดมี PDF หรือ MGF อย่างไรก็ตาม (แต่ทั้งหมดมีฟังก์ชั่นพิเศษ ) Rn
Ilmari Karonen

3
@mpiktas คุณอาจทำมันด้วย= { R , }บนR จากนั้นP ( ( - , x ] )ไม่ได้ถูกกำหนดอย่างไรก็ตามมันชัดเจนสำหรับฉันว่าทำไมศาสตราจารย์ใช้นิพจน์ "พื้นฐานมากขึ้น" คำคุณศัพท์อาจไม่มีความหมายทางคณิตศาสตร์ที่กำหนดไว้อย่างดี ..) English เกินไปทุกรูปแบบไฟล์ PDF ที่เรารู้มีพื้นฐาน CDF ที่นี่ "ต้นแบบ" มีความสัมพันธ์ที่ดีกับ "พื้นฐาน" ตรงข้ามไม่เป็นความจริง..A={R,}RP((-,x])
drhab

2
@drhab, โดยธรรมชาติฉันกำลังพูดถึงอนุพันธ์ของ Radon-Nikodym :) ฉันเข้าใจอย่างสมบูรณ์แบบถึงสิ่งที่อาจารย์มีอยู่ในใจ แต่ในความคิดของฉันมันเป็นอันตรายที่จะใช้การแสดงออกเช่นนี้กับนักเรียนเพราะแทนที่จะพยายามทำความเข้าใจความแตกต่างระหว่าง แนวคิดทางคณิตศาสตร์ที่พวกเขาพยายามจัดอันดับพวกเขาตามความรู้พื้นฐานซึ่งเป็นพื้นฐานที่ผิด ปุนตั้งใจ
mpiktas

4
@mpiktas: แน่นอนไม่มีคำจำกัดความที่แน่นอนของ "พื้นฐาน" แต่มีจุดกึ่งกลางขนาดใหญ่ระหว่าง“ กำหนดอย่างเข้มงวด” และ“ ไร้ความหมายโดยสิ้นเชิง” ในวิชาคณิตศาสตร์ของเราเองแน่นอนว่าทุกอย่างต้องจบอย่างเข้มงวดดังนั้นเราจึงคุ้นเคยกับการตบสิ่งที่ไม่ใช่ แต่เมื่อเราพูดคุยและคิดเกี่ยวกับคณิตศาสตร์เรามีความคิดเชิงทัศนะที่มีความหมายเช่น "พื้นฐาน", "ทั่วไป" และอื่น ๆ เช่นกันเหมือนกับทุกคน และก็ไม่เป็นไร
PLL

คำตอบ:


69

การแจกแจงความน่าจะเป็นทุกครั้งบน (เซตย่อยของ) มีฟังก์ชันการแจกแจงสะสมและจะกำหนดการแจกแจงแบบไม่ซ้ำกัน ดังนั้นในแง่นี้ CDF จึงเป็นพื้นฐานในการกระจายตัวRn

หนาแน่นเป็นฟังก์ชันแต่มีอยู่เฉพาะสำหรับ(อย่าง) แจกแจงความน่าจะต่อเนื่อง ตัวอย่างที่ง่ายที่สุดของการแจกแจงที่ไม่มี PDF คือการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องใด ๆเช่นการแจกแจงของตัวแปรสุ่มที่ใช้ค่าจำนวนเต็มเท่านั้น

แน่นอนว่าการแจกแจงความน่าจะเป็นแบบแยกนั้นสามารถจำแนกได้โดยฟังก์ชันความน่าจะเป็นแบบมวลแต่ยังมีการแจกแจงที่ไม่มีทั้งแบบ PDF และ PMF เช่นการผสมแบบต่อเนื่องและการกระจายแบบไม่ต่อเนื่อง:

ไดอะแกรมของการแจกแจงความน่าจะเป็นแบบต่อเนื่องไม่ต่อเนื่องและแบบผสม
(ไดอะแกรมถูกขโมยอย่างไร้จุดหมายจากคำตอบของ Glen_bสำหรับคำถามที่เกี่ยวข้อง)

มีการแจกแจงความน่าจะเป็นเอกพจน์เช่นการแจกแจงคันทอร์ซึ่งไม่สามารถอธิบายได้แม้จะเป็นการรวมกันของ PDF และ PMF การแจกแจงดังกล่าวยังคงมี CDF ที่นิยามไว้อย่างดี ตัวอย่างเช่นนี่คือ CDF ของการกระจายคันทอร์ซึ่งบางครั้งเรียกว่า "บันไดปีศาจ":

ต้นเสียงกระจาย CDF
( ภาพจากWikimedia Commonsโดยผู้ใช้TheonและAmirkiใช้ภายใต้ใบอนุญาตCC-By-SA 3.0 )

CDF หรือที่เรียกว่าฟังก์ชันคันทอร์นั้นต่อเนื่อง แต่ไม่ต่อเนื่องอย่างแน่นอน ในความเป็นจริงมันคงที่ทุกที่ยกเว้นชุดคันทอร์ของมาตรการ Lebesgue ศูนย์ แต่ยังคงมีหลายจุดมากมาย ดังนั้นมวลความน่าจะเป็นทั้งหมดของการแจกแจงคันทอร์จึงเน้นไปที่เซตย่อยขนาดเล็กที่หายไปของเส้นจำนวนจริง แต่ทุกจุดในเซตยังคงมีความน่าจะเป็นศูนย์


นอกจากนี้ยังมีการแจกแจงความน่าจะเป็นที่ไม่ได้มีฟังก์ชั่นช่วงเวลาที่ก่อให้เกิด อาจเป็นตัวอย่างที่รู้จักกันดีที่สุดคือการกระจาย Cauchy , การกระจายไขมันหางซึ่งไม่มีช่วงเวลาที่ดีในการสั่งซื้อ 1 หรือสูงกว่า (ดังนั้นโดยเฉพาะอย่างยิ่งไม่มีความหมายหรือความแปรปรวนที่กำหนดไว้อย่างดี!)

ทั้งหมดแจกแจงความน่าจะเกี่ยวกับทำ แต่มี (อาจจำนวนเชิงซ้อน) ลักษณะการทำงาน ) ซึ่งมีความหมายที่แตกต่างจากที่ MGF โดยเฉพาะคูณกับที่หน่วยจินตภาพ ดังนั้นฟังก์ชั่นลักษณะอาจถือได้ว่าเป็นพื้นฐานเป็น CDFRn


คุณบอกว่าทุกการแจกแจงมี CDF แต่ไม่ใช่ทุกอย่างที่มี PDF แต่จริงๆแล้วมีการแจกแจงที่มี PDF และไม่มี CDFs แบบปิดเช่นหลายตัวแปรปกติ
ทิม

13
@Tim: จริง แต่มีเพียงคุณสมบัติ "ปิดแบบฟอร์ม" เท่านั้น CDF ยังคงมีอยู่แม้ว่าเราจะไม่สามารถเขียนในรูปแบบปิด และไม่ว่าในกรณีใดคำจำกัดความของ " การแสดงออกในรูปแบบปิด " นั้นมีความคลุมเครืออย่างมาก โดยคำจำกัดความบางอย่างแม้แต่การแจกแจงแบบปกติแบบไม่มีตัวแปรไม่มี CDF รูปแบบปิด แต่ถ้าคุณพิจารณาว่าฟังก์ชันข้อผิดพลาดเป็นแบบปิดก็จะเกิดขึ้น
Ilmari Karonen

11
@Tim ไม่ใช่ตัวอย่างเคาน์เตอร์ เป็นคุณสมบัติที่คุณเลือกว่าเป็นสิ่งสำคัญสำหรับคุณ สำหรับฉันแล้วคุณสมบัติ "มีอยู่" มีความสำคัญมากกว่า "มีแบบฟอร์มปิด" ยิ่งกว่านั้น "มีอยู่เสมอ" กับ "บางครั้งอาจไม่มีรูปแบบปิดเหมือนฟังก์ชันใด ๆ "
Ark-kun

3
สิ่งที่สำคัญกว่าชุดคันทอร์นั้นมี "หลาย ๆ จุดไม่สิ้นสุด" คือมันมีหลายจุดนับไม่ถ้วน มันมี cardinality เดียวกันคือช่วง R ดังนั้นมันจึงเป็นเซตย่อยที่ไม่สามารถนับได้ของช่วงเวลาที่มีการวัดเป็นศูนย์ (Lebesgue) การวัดที่คุณอธิบายนั้นน่าสนใจเช่นเดียวกันว่ามันมีค่าเป็นศูนย์สำหรับเซตย่อยที่นับได้ของเซตคันทอร์และเซตย่อยที่ไม่นับจำนวน (บางส่วน) ที่ไม่ใช่ศูนย์ ...[0,1]R
Eric Towers

1
@ Ark-kun ฉันเล่นเป็นผู้สนับสนุนปีศาจที่นี่เนื่องจากมีหลายกรณีที่ PDF เป็นสิ่งที่ "พร้อมใช้งานโดยตรง" มากกว่า CDF แล้ว ฉันชอบคำตอบนี้ (+1) แต่ IMHO นี่เป็นสิ่งที่อาจกล่าวได้เช่นกัน
ทิม

16

ฉันเชื่อว่าอาจารย์เศรษฐศาสตร์ของคุณกำลังคิดอะไรบางอย่างในบรรทัดต่อไปนี้

F[0,1]

F(x)=12x สำหรับ x<12
F(x)=12x+12 สำหรับ x12

[0,1]

P({12})=12

โดยคำจำกัดความของ PDF เราต้องมี

0x(เสื้อ)dเสื้อ=F(x)-F(0)=14x

0<x<12

(x)=14 สำหรับ x<12

x>12

(x)=14 สำหรับ x>12

(12)(12)

P({12})=12

เราต้องการ

12-ε12+ε(เสื้อ)dเสื้อ>12

12

12-ε12+ε(เสื้อ)dเสื้อ=12-ε12+ε14dเสื้อ=12ε

คุณสามารถกู้คืนจิตวิญญาณของรูปแบบไฟล์ PDF แต่คุณต้องใช้วัตถุทางคณิตศาสตร์ที่ซับซ้อนมากขึ้นทั้งมาตรการหรือการจัดจำหน่าย


3
12δ(x-12)δ(x)x=0
-+δ(x)dx=1

2
L1

@IllnotexistIdonotexist สิ่งที่คนพูดว่าเป็นสิ่งที่ฉันพูดเป็นนัยในบรรทัดสุดท้าย ฉันใช้คำว่า "การกระจาย"
Matthew Drury

4
1/21/2

4

Ilmari ให้คำตอบที่ดีจากมุมมองทางทฤษฎี อย่างไรก็ตามหนึ่งอาจถามว่าวัตถุประสงค์ความหนาแน่น (PDF) และฟังก์ชั่นการกระจาย (PDF) ให้บริการสำหรับการคำนวณในทางปฏิบัติ สิ่งนี้สามารถอธิบายได้ว่าสถานการณ์ใดมีประโยชน์โดยตรงมากกว่าสถานการณ์อื่น

R(-,x]--

อย่างไรก็ตามความหนาแน่นเป็นสิ่งจำเป็นสำหรับสถิติเนื่องจากมีการกำหนดความน่าจะเป็นในแง่ของความหนาแน่น ดังนั้นหากเราต้องการคำนวณการประมาณความน่าจะเป็นสูงสุดเราต้องการความหนาแน่นโดยตรง

หากเราหันไปเปรียบเทียบการกระจายเชิงประจักษ์และการแจกแจงเชิงทฤษฎีทั้งคู่อาจมีประโยชน์ แต่วิธีการเช่น pp- และ qq-plots ตามฟังก์ชันการกระจายมักเป็นที่ต้องการ

Rdd2

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.