Wolfram Mathworld ทำผิดที่อธิบายการแจกแจงความน่าจะเป็นแบบแยกโดยใช้ฟังก์ชันความหนาแน่นของความน่าจะเป็นหรือไม่?


14

โดยปกติการแจกแจงความน่าจะเป็นเหนือตัวแปรที่ไม่ต่อเนื่องนั้นถูกอธิบายโดยใช้ฟังก์ชันความน่าจะเป็นมวล (PMF):

เมื่อทำงานกับตัวแปรสุ่มต่อเนื่องเราจะอธิบายการแจกแจงความน่าจะเป็นโดยใช้ฟังก์ชันความหนาแน่นของความน่าจะเป็น (PDF) แทนที่จะเป็นฟังก์ชันมวลความน่าจะเป็น

- การเรียนรู้อย่างลึกซึ้งโดย Goodfellow, Bengio และ Courville

อย่างไรก็ตามWolfram Mathworldใช้ PDF เพื่ออธิบายการแจกแจงความน่าจะเป็นผ่านตัวแปรที่ไม่ต่อเนื่อง:

ป้อนคำอธิบายรูปภาพที่นี่

นี่เป็นความผิดพลาดหรือไม่? หรือมันไม่สำคัญอะไร


5
ในความคิดของฉัน แต่ไม่สำคัญมาก มันสามารถป้องกันได้หากพวกเขาเข้าใกล้ความน่าจะเป็นจากมุมมองของทฤษฎีการวัดถึงแม้ว่ามันจะดูเป็นเรื่องเล็กน้อยสำหรับการแนะนำให้พลิกเหรียญ (แปลกมากพวกเขาไม่มีบทความเกี่ยวกับ PMF)
เดฟ

9
น. pmf คือความหนาแน่นเทียบกับการนับการวัด
ซีอาน

3
เมื่อคุณพูดถึงทฤษฎีความน่าจะเป็นที่ระดับของพื้นที่การวัดที่ระบุโดย 3 องค์ประกอบ pdf และ pmf ไม่แตกต่างกันดังนั้น PMF จึงลดลง การแจกแจงทั้งหมดสามารถระบุได้ด้วย pdf วุลแฟรมเป็นเว็บไซต์คณิตศาสตร์ดังนั้นจึงไม่น่าแปลกใจที่พวกเขาใช้คณิตศาสตร์ระดับสูงเพื่อพูดคุยเกี่ยวกับความน่าจะเป็น นี่คือการอ่านฟรีที่ดี stat.washington.edu/~pdhoff/courses/581/LectureNotes/…
user158565

คำตอบ:


30

มันไม่ใช่ความผิดพลาด:ในการรักษาความเป็นไปได้อย่างเป็นทางการผ่านทฤษฎีการวัดฟังก์ชันความหนาแน่นของความน่าจะเป็นเป็นอนุพันธ์ของการวัดความน่าจะเป็นที่น่าสนใจโดยเทียบกับ "อำนาจเหนือ" สำหรับการกระจายที่ไม่ต่อเนื่องในช่วงเลขที่มวลฟังก์ชันเป็นฟังก์ชันความหนาแน่นที่เกี่ยวกับการวัดการนับ เนื่องจากฟังก์ชันมวลความน่าจะเป็นเป็นฟังก์ชันความหนาแน่นของความน่าจะเป็นชนิดหนึ่งบางครั้งคุณจะพบการอ้างอิงเช่นนี้ที่อ้างถึงเป็นฟังก์ชันความหนาแน่นและพวกมันไม่ผิดที่จะอ้างถึงวิธีนี้

ในวาทกรรมทั่วไปเกี่ยวกับความน่าจะเป็นและสถิติเรามักจะหลีกเลี่ยงคำศัพท์นี้และดึงความแตกต่างระหว่าง "ฟังก์ชันมวล" (สำหรับตัวแปรสุ่มแบบแยก) และ "ฟังก์ชันความหนาแน่น" (สำหรับตัวแปรสุ่มแบบต่อเนื่อง) เพื่อแยกความแตกต่างแบบไม่ต่อเนื่อง ในบริบทอื่น ๆ ที่หนึ่งระบุแง่มุมแบบองค์รวมของความน่าจะเป็นมันมักจะดีกว่าที่จะไม่สนใจความแตกต่างและอ้างถึงทั้งสองเป็น "ฟังก์ชั่นความหนาแน่น"


ขอบคุณสำหรับคำตอบ. ไม่treatment"ในการรักษาอย่างเป็นทางการของความน่าจะเป็น" สัญกรณ์หมายถึงมุมมองการประชุมหรือสิ่งอื่นใด
czlsws

เมื่อฉันพูดถึงที่นี่เกี่ยวกับ "การรักษาอย่างเป็นทางการ" ฉันหมายถึงพื้นฐานที่ทันสมัยของทฤษฎีความน่าจะเป็นซึ่งเป็นส่วนหนึ่งของทฤษฎีการวัด นั่นคือทฤษฎีทางคณิตศาสตร์ที่ได้รับการยอมรับว่าเป็นทางการที่สนับสนุนความน่าจะเป็น
Reinstate Monica

"ฟังก์ชันความหนาแน่นของความน่าจะเป็นเป็นอนุพันธ์ของการวัดความน่าจะเป็นที่น่าสนใจ" สำหรับผมแล้วในแง่หนึ่งมันเป็น "แอนตี้ - อินทิกรัล" มากกว่าอนุพันธ์ มี PDF ที่ไม่ต่อเนื่องเช่นการกระจายแบบสม่ำเสมอและการแจกแจงแบบแยกสามารถถือว่าเป็นผลรวมของฟังก์ชัน Dirac delta ในกรณีเหล่านั้นเราจะต้องสรุปแนวความคิดของอนุพันธ์ที่อยู่เหนือความเข้าใจทั่วไปเพื่อนำไปใช้
สะสม

@ การคำนวณ - การกระจายแบบไม่ต่อเนื่องเป็นอย่างไร ... และทฤษฎีการวัดคือการรักษาที่ไกลมากขึ้นทั่วไปของการรวมกลุ่มและความแตกต่างกว่าความเข้าใจสามัญของ Calc I และ II ให้
jbowman

@ การคำนวณ: ใช่ว่าเป็นลักษณะที่เป็นธรรมและแน่นอนว่าเป็นสิ่งที่ทำ ในทางเทคนิคความหนาแน่นคืออนุพันธ์ของ Radon-Nikodymซึ่งเป็นประเภทของ "anti-integral" ของประเภทที่คุณอธิบาย
Reinstate Monica

5

นอกจากคำตอบเชิงทฤษฎีมากขึ้นในแง่ของทฤษฎีการวัดแล้วมันยังสะดวกที่จะไม่แยกความแตกต่างระหว่าง pmfs และ pdf ในการเขียนโปรแกรมเชิงสถิติ ตัวอย่างเช่น R มีความมั่งคั่งของการกระจายในตัว สำหรับการแจกแจงแต่ละครั้งจะมี 4 ฟังก์ชั่น ตัวอย่างเช่นสำหรับการแจกแจงแบบปกติ (จากไฟล์ช่วยเหลือ):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

ผู้ใช้ R กลายเป็นd,p,q,rคำนำหน้าอย่างรวดเร็ว มันจะน่ารำคาญถ้าคุณต้องทำอะไรบางอย่างเช่นการปล่อยdและการใช้mเช่นการแจกแจงทวินาม แต่ทุกอย่างเป็นไปตามที่ผู้ใช้ R คาดหวัง:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.

3
scipy.statsแตกต่างวัตถุบางอย่างมีpdfวิธีการและอื่น ๆ มีpmfวิธีการ มันทำให้ฉันรำคาญจริงๆ!
Matthew Drury
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.