มูลค่าการแจกแจงความน่าจะเป็นที่เกิน 1 สามารถเป็นได้หรือไม่?


149

ในหน้า Wikipedia เกี่ยวกับตัวแยกประเภทซื่อๆ Bayesมีบรรทัดนี้:

p(height|male)=1.5789 (การกระจายความน่าจะเป็นที่มากกว่า 1 คือ OK มันคือพื้นที่ใต้เส้นโค้งระฆังที่เท่ากับ 1)

ค่าจะตกลงได้อย่างไร? ผมคิดว่าน่าจะเป็นค่าทั้งหมดถูกแสดงในช่วง1 นอกจากนี้หากเป็นไปได้ที่จะมีค่าเช่นนั้นค่าที่ได้จากตัวอย่างที่แสดงในหน้าเป็นอย่างไร>10p1


2
เมื่อฉันเห็นว่าฉันคิดว่ามันอาจเป็นความสูงของฟังก์ชันความหนาแน่นของความน่าจะเป็นซึ่งอาจเป็นจำนวนบวกใด ๆ ตราบเท่าที่มันถูกรวมเข้ากับช่วงเวลาใด ๆ อินทิกรัลน้อยกว่าหรือเท่ากับ 1 วิกิพีเดียควรแก้ไขรายการนั้น
Michael Chernick

16
เนื่องจากสิ่งนี้อาจช่วยผู้อ่านในอนาคตฉันจึงเสนอการแปลเชิงเรขาคณิตของส่วนทั่วไปของคำถามนี้: "รูปร่างที่มีพื้นที่ไม่เกินอาจขยายได้มากกว่าในทิศทางใด?" โดยเฉพาะรูปร่างเป็นส่วนหนึ่งของระนาบครึ่งบนที่ล้อมรอบด้วยกราฟของ PDF และทิศทางของปัญหาเป็นแนวตั้ง ในการตั้งค่ารูปทรงเรขาคณิต (ตัดของการตีความความน่าจะเป็น) มันเป็นเรื่องง่ายที่จะคิดว่าตัวอย่างเช่นรูปสี่เหลี่ยมผืนผ้าฐานใดยิ่งใหญ่กว่าและความสูง2111/22
whuber

บทความ Wikipedia ใช้ตัวพิมพ์เล็กpสำหรับความหนาแน่นของความน่าจะเป็นและตัวพิมพ์ใหญ่Pสำหรับความน่าจะเป็น
Aprillion

ฉันแค่จะออกจากที่นี่เพื่อคนต่อไป: en.wikipedia.org/wiki/Dirac_delta_function
Joshua

น่าสังเกตว่าฟังก์ชั่นการแจกแจงสะสม (อินทิกรัลของ PDF) ไม่สามารถอยู่เหนือ 1 CDF นั้นใช้งานง่ายกว่ามากในหลาย ๆ กรณี
naught101

คำตอบ:


167

หน้าวิกินั้นใช้ภาษาในทางที่ผิดโดยอ้างถึงความน่าจะเป็นนี้ คุณถูกต้องว่ามันไม่ได้เป็น มันเป็นความจริงที่น่าจะเป็นต่อเท้า โดยเฉพาะค่า 1.5789 (สำหรับความสูง 6 ฟุต) แสดงว่าความน่าจะเป็นของความสูงระหว่างพูด 5.99 และ 6.01 ฟุตใกล้เคียงกับค่าหน่วยต่อไปนี้:

1.5789[1/foot]×(6.015.99)[feet]=0.0316

ค่านี้ต้องไม่เกิน 1 ดังที่คุณทราบ (ช่วงความสูงเล็ก ๆ (0.02 ในตัวอย่างนี้) เป็นส่วนสำคัญของเครื่องมือวัดความน่าจะเป็นมันคือ "ความแตกต่าง" ของความสูงซึ่งฉันจะย่อตัว ) ความน่าจะเป็นต่อหน่วยของบางอย่างคือ เรียกว่าความหนาแน่นโดยเปรียบเทียบกับความหนาแน่นอื่น ๆ เช่นมวลต่อปริมาตรd(height)

ความหนาแน่นของความน่าจะเป็นโดยแท้จริงอาจมีค่าใหญ่โดยพลการแม้ค่าที่ไม่มีขีด จำกัด

การกระจายรังสี

ตัวอย่างนี้แสดงฟังก์ชันความหนาแน่นของความน่าจะเป็นสำหรับการแจกแจงแกมม่า (ที่มีพารามิเตอร์รูปร่างเท่ากับและมาตราส่วน ) เนื่องจากความหนาแน่นส่วนใหญ่น้อยกว่าเส้นโค้งจึงต้องสูงกว่าเพื่อให้มีพื้นที่ทั้งหมดตามที่จำเป็นสำหรับการแจกแจงความน่าจะเป็นทั้งหมด3/21/5111

การกระจายเบต้า

ความหนาแน่นนี้ (สำหรับการกระจายเบต้ากับพารามิเตอร์ ) จะกลายเป็นอนันต์ที่และ1พื้นที่ทั้งหมดยังคงมี จำกัด (และเท่ากับ )!1/2,1/10011


ในตัวอย่างนั้นได้รับค่า 1.5789 / ฟุตโดยประเมินว่าความสูงของเพศชายมีการแจกแจงแบบปกติด้วยค่าเฉลี่ย 5.855 ฟุตและความแปรปรวน 3.50e-2 ตารางฟุต (สามารถดูได้ในตารางก่อนหน้า) รากที่สองของความแปรปรวนนั้นคือค่าเบี่ยงเบนมาตรฐานคือ 0.18717 ฟุต เราแสดงความยาว 6 ฟุตเป็นจำนวน SD จากค่าเฉลี่ย:

z=(65.855)/0.18717=0.7747

การหารด้วยค่าเบี่ยงเบนมาตรฐานสร้างความสัมพันธ์

dz=d(height)/0.18717

ความหนาแน่นของความน่าจะเป็นปกติโดยนิยามเท่ากับ

12πexp(z2/2)dz=0.29544 d(height)/0.18717=1.5789 d(height).

(อันที่จริงผมโกง.. ฉันก็ถาม Excel ในการคำนวณ NORMDIST (6, 5.855, 0.18717, FALSE) แต่แล้วฉันจริงๆไม่ตรวจสอบกับสูตรเพียงเพื่อให้แน่ใจ) เมื่อเราตัดที่สำคัญค่าจากสูตรเฉพาะตัวเลขเหลืออยู่เช่นรอยยิ้มของ Cheshire Cat เราผู้อ่านจำเป็นต้องเข้าใจว่าจำนวนนั้นต้องคูณด้วยความสูงเล็กน้อยเพื่อสร้างความน่าจะเป็นd(height)1.5789


ฉันทราบว่าตัวอย่างที่ให้ไว้ในหน้าวิกินั้นใช้ความหนาแน่นของความน่าจะเป็นแทนความน่าจะเป็นที่แท้จริงสำหรับการคำนวณของผู้โพสต์น่าจะเป็นเพราะมุมมองต่อหน่วยไม่จำเป็นสำหรับการเปรียบเทียบหากหน่วยเปรียบเทียบ การขยายสิ่งนี้หากไม่มีใครต้องการถือว่าเป็นกฎเกณฑ์ แต่แทนที่จะมีข้อมูลเชิงประจักษ์ที่สามารถประเมินความหนาแน่นได้เช่นการประมาณความหนาแน่นของเคอร์เนลมันจะถูกต้องหรือไม่ที่จะใช้การอ่านตามค่าที่กำหนดบนแกน x จากนี้ kde เป็นอินพุตในการคำนวณ posteriors ในตัวจําแนกเบส์ไร้เดียงสาโดยสมมติว่าเท่ากับหน่วยต่อหน่วยหรือไม่
babelproofreader

1
@babelproofreader ฉันเชื่อว่าผู้โพสต์นั้นได้รับการอัปเดตแบบเบย์ผ่านข้อมูลการฝึกอบรมของนักบวช มันไม่ชัดเจนว่า kde สามารถตีความในทำนองเดียวกันได้อย่างไร แต่ฉันไม่มีความเชี่ยวชาญในเรื่องนี้ คำถามของคุณน่าสนใจพอที่คุณอาจพิจารณาโพสต์แยกต่างหาก
whuber

คุณจะกำหนดความแตกต่างที่ดีได้อย่างไร เกิดอะไรขึ้นถ้าคุณเลือกส่วนต่าง 1 แทน? ความน่าจะเป็นนั้นจะมากกว่า 1 หรือไม่ ขออภัยในความสับสนของฉันที่นี่ คุณสามารถอธิบาย?
fiacobelli

3
@tree พื้นที่ของรูปสามเหลี่ยมเป็นครึ่งหนึ่งของผลคูณของความยาวของฐานและความสูง
whuber

1
@ user929304 คุณอาจอ้างถึงหนังสือเรียนเชิงทฤษฎีที่คุณสนใจ: นี่เป็นส่วนหนึ่งของพื้นฐานความน่าจะเป็นและสถิติ แนวคิดเรื่องความหนาแน่นของความน่าจะเป็นแบบนี้ได้ถูกกล่าวถึงอย่างดีในตำราเรียนเบื้องต้นที่ดีกว่าเช่นฟรีแมน, ปิซานี, และพิวเวส
whuber

43

นี่เป็นข้อผิดพลาดทั่วไปจากการไม่เข้าใจความแตกต่างระหว่างฟังก์ชั่นความน่าจะเป็นที่มวลซึ่งตัวแปรไม่ต่อเนื่องและฟังก์ชั่นความหนาแน่นของความน่าจะเป็นที่ซึ่งตัวแปรนั้นต่อเนื่อง ดูการกระจายความน่าจะเป็นคืออะไร :

ฟังก์ชันความน่าจะเป็นแบบต่อเนื่องถูกกำหนดไว้สำหรับจำนวนจุดที่ไม่มีที่สิ้นสุดในช่วงเวลาต่อเนื่องความน่าจะเป็นที่จุดเดียวจะเป็นศูนย์เสมอ ความน่าจะเป็นวัดในช่วงเวลาไม่ใช่จุดเดียว นั่นคือพื้นที่ใต้เส้นโค้งระหว่างสองจุดที่แตกต่างกันกำหนดความน่าจะเป็นสำหรับช่วงเวลานั้น ซึ่งหมายความว่าความสูงของฟังก์ชันความน่าจะเป็นอาจมากกว่าหนึ่ง คุณสมบัติที่อินทิกรัลต้องเท่ากับหนึ่งเท่ากับคุณสมบัติสำหรับการแจกแจงแบบแยกซึ่งผลรวมของความน่าจะเป็นทั้งหมดจะต้องเท่ากับหนึ่ง


14
NIST มักจะมีสิทธิ์ แต่ที่นี่มันเป็นเทคนิคที่ไม่ถูกต้อง (และ ungrammatical เพื่อบู๊ต): การมีความน่าจะเป็นที่กำหนดไว้ที่ "จำนวนอนันต์ของคะแนน" ไม่ได้หมายความถึง "ความน่าจะเป็นที่จุดเดียวเสมอ แน่นอนพวกเขากำลังหลบสิ่งที่ทำให้ไขว้เขวเกี่ยวกับความสำคัญที่ไม่มีที่สิ้นสุด แต่การให้เหตุผลที่นี่ทำให้เข้าใจผิด มันจะดีกว่าสำหรับพวกเขาเพียงแค่ละเว้นประโยคแรกในใบเสนอราคา
whuber

23

ฉันคิดว่าการกระจายชุดอย่างต่อเนื่องในช่วงเป็นตัวอย่างที่ตรงไปตรงมาสำหรับคำถามนี้: ในการกระจายชุดอย่างต่อเนื่องความหนาแน่นในแต่ละจุดจะเท่ากันในแต่ละจุด (การกระจายแบบสม่ำเสมอ) ยิ่งกว่านั้นเนื่องจากพื้นที่ด้านล่างสี่เหลี่ยมผืนผ้าต้องเป็นหนึ่ง (เช่นเดียวกับพื้นที่ด้านล่างโค้งปกติต้องเป็นหนึ่ง) ค่าความหนาแน่นต้องเป็นเนื่องจากสี่เหลี่ยมผืนผ้าใด ๆ ที่มีฐานและพื้นที่ต้องมีความสูง .[a,b]1/(ba)ba11/(ba)

ดังนั้นค่าสำหรับความหนาแน่นสม่ำเสมอในช่วงคือ , ในช่วงมันคือ , ...[0,0.5]1/(0.50)=2[0,0.1]10


4

ฉันไม่ทราบว่าบทความ Wikipedia ได้รับการแก้ไขภายหลังจากการโพสต์เริ่มต้นในกระทู้นี้หรือไม่ แต่ตอนนี้บอกว่า "โปรดทราบว่าค่าที่มากกว่า 1 คือ OK ที่นี่ - เป็นความหนาแน่นความน่าจะเป็นมากกว่าความน่าจะเป็นเพราะความสูงคือ ตัวแปรต่อเนื่อง "และอย่างน้อยที่สุดในบริบทนี้ P จะใช้สำหรับความน่าจะเป็นและ p จะใช้สำหรับความหนาแน่นของความน่าจะเป็น ใช่เลอะเทอะมากเนื่องจากบทความใช้ p ในบางแห่งเพื่อหมายถึงความน่าจะเป็นและในที่อื่น ๆ เป็นความหนาแน่นของความน่าจะเป็น

กลับไปที่คำถามเริ่มต้น "ค่าการแจกแจงความน่าจะเป็นที่เกิน 1 สามารถเป็นได้หรือไม่" ไม่ แต่ฉันเห็นมันเสร็จแล้ว (ดูย่อหน้าสุดท้ายด้านล่าง)

นี่คือวิธีการที่จะตีความความน่าจะเป็น> 1. ครั้งแรกของทั้งหมดทราบว่าคนที่สามารถและไม่ให้ความพยายาม 150% ในขณะที่เรามักจะได้ยินในการเล่นกีฬาและบางครั้งทำงานhttps://www.youtube.com/watch?v=br_vSdAOHQQ หากคุณแน่ใจว่ามีบางอย่างเกิดขึ้นนั่นเป็นความน่าจะเป็นที่ 1 ความน่าจะเป็นที่ 1.5 จะตีความได้เมื่อคุณ 150% แน่ใจว่าเหตุการณ์จะเกิดขึ้นเช่นให้ความพยายาม 150%

และถ้าคุณมีความน่าจะเป็น> 1 ฉันคิดว่าคุณน่าจะมีความน่าจะเป็น <0 ความน่าจะเป็นเชิงลบสามารถตีความได้ดังนี้ ความน่าจะเป็น 0.001 หมายความว่าแทบไม่มีโอกาสเกิดเหตุการณ์ ความน่าจะเป็น = 0 หมายถึง "ไม่มีทาง" ความน่าจะเป็นเชิงลบเช่น -1.2 สอดคล้องกับ "คุณ gots จะล้อเล่น"

เมื่อตอนที่ฉันยังเด็กอยู่นอกโรงเรียนเมื่อ 3 ทศวรรษที่แล้วฉันเห็นเหตุการณ์ที่น่าประหลาดใจมากกว่าการทำลายกำแพงเสียงในการบินกล่าวคือทำลายความสามัคคีในความน่าจะเป็น นักวิเคราะห์ที่มีปริญญาเอก ในวิชาฟิสิกส์ใช้เวลา 2 ปีเต็มเวลา (อาจให้ 150%) พัฒนาแบบจำลองสำหรับการคำนวณความน่าจะเป็นในการตรวจจับวัตถุ X ซึ่งในตอนท้ายของแบบจำลองและการวิเคราะห์ของเขาเสร็จสิ้นการตรวจสอบโดยเพื่อนนักวิทยาศาสตร์และวิศวกรหลายคน รัฐบาล. ฉันจะไม่บอกคุณว่าวัตถุ X คืออะไร แต่วัตถุ X และความน่าจะเป็นที่จะตรวจจับมันคือและยังคงเป็นที่สนใจของรัฐบาลสหรัฐฯ โมเดลนี้รวมสูตรสำหรับ = Prob (เหตุการณ์ y เกิดขึ้น) PyPyและคำอื่น ๆ ทั้งหมดรวมกันเป็นสูตรสุดท้ายซึ่งก็คือ Prob (ตรวจพบวัตถุ X) แท้จริงแล้วค่าที่คำนวณได้ของ Prob (ตรวจจับวัตถุ X) อยู่ในช่วง [0,1] เช่นเดียวกับ "ดั้งเดิม" ในความน่าจะเป็นในประเพณี Kolmogorov ในรูปแบบดั้งเดิมนั้นมักจะอยู่ใน [0,1] และเกี่ยวข้องกับฟังก์ชั่นยอดเยี่ยม "หลากหลายสวน" ซึ่งมีอยู่ในมาตรฐาน Fortran หรือเครื่องคิดเลขวิทยาศาสตร์ใด ๆ อย่างไรก็ตามสำหรับเหตุผลที่รู้จักกันเพียง แต่สำหรับนักวิเคราะห์และพระเจ้า (อาจเป็นเพราะเขาได้เห็นมันทำในชั้นเรียนฟิสิกส์และหนังสือของเขา แต่ไม่ทราบว่าเขาได้แสดงให้เห็นบางกรณีที่มันทำงานไม่มากที่มันทำ ไม่และชื่อของผู้ชายคนนี้และการตัดสินทางวิทยาศาสตร์ / คณิตศาสตร์ไม่ได้เกิดขึ้นกับ Dirac)PyPy(และไม่สนใจระยะที่เหลือ) ซึ่งต่อจากนี้ไปจะเรียกว่าP_yมันเป็นสองเทย์เลอร์การขยายตัวของซึ่งถูกแทรกลงในนิพจน์สุดท้ายของ Prob (ตรวจพบวัตถุ X) สิ่งที่เขาไม่ได้ตระหนักจนกระทั่งฉันชี้ให้เขาเห็นว่ามีค่าประมาณ 1.2 โดยใช้ค่าเคสพื้นฐานของเขาสำหรับพารามิเตอร์ทั้งหมด แน่นอนมันเป็นไปได้สำหรับPyPyPyPyเพิ่มขึ้นเป็นประมาณ 1.8 และนั่นคือสิ่งที่กำแพงความสามัคคีแตกสลายในความน่าจะเป็น แต่ชายคนนั้นไม่รู้ว่าเขาทำผลงานการบุกเบิกนี้ได้สำเร็จจนกระทั่งฉันชี้ให้เขาฟังโดยเพิ่งทำการคำนวณอย่างรวดเร็วเกี่ยวกับขนาดบัตรเครดิตที่ใช้พลังงานจากแบตเตอรี่ Casio เครื่องคิดเลขวิทยาศาสตร์ในห้องประชุมที่มืดมิด (ไม่สามารถทำได้ด้วย เครื่องคิดเลขพลังงานแสงอาทิตย์) นั่นจะเป็นเหมือนชัคเยเกอร์ออกไปปั่นอาทิตย์ในเครื่องบินของเขาและได้รับแจ้งเพียงไม่กี่เดือนต่อมาว่าเขาทำลายกำแพงเสียง


เรื่องเด็ด คุณมีข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้เหมือนการอ้างอิงหรือไม่?
Jay Schyler Raadt

1
@ Jay Schyler Raadt นี่คือเอกสารที่stats.stackexchange.com/questions/4220/…ฮ่า
Mark L. Stone

0

เมื่อตัวแปรสุ่มเป็นแบบต่อเนื่องและฟังก์ชันความหนาแน่นของความน่าจะเป็นคือ ,คือความน่าจะเป็น แต่ไม่ใช่ความน่าจะเป็นและอาจมากกว่าหนึ่ง รายงานไม่ใช่ความน่าจะเป็น แต่คือXf(x)f(x)dxf(x)f(height|male)f(height|male)dheight

กล่าวอีกนัยหนึ่งสำหรับตัวแปรสุ่มแบบต่อเนื่อง , ,และ 0 ความน่าจะเป็นแบบมีเงื่อนไขXP(X[x,x+dx))=f(x)dxP(X[a,b])=abf(x)dxP(X=x)=P(X[x,x])=0


-1

ค่าจุดที่ค่าพารามิเตอร์เฉพาะของพล็อตความหนาแน่นของความน่าจะเป็นน่าจะเป็นจริงไหม ถ้าเป็นเช่นนั้นคำสั่งอาจแก้ไขได้โดยเพียงเปลี่ยน P (height | male) เป็น L (height | male)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.