เหตุใดผลรวมของความน่าจะเป็นในการแจกแจงแบบสม่ำเสมออย่างต่อเนื่องจึงไม่มีความไม่สิ้นสุด


9

ฟังก์ชั่นความหนาแน่นของความน่าจะเป็น

ฟังก์ชันความหนาแน่นของความน่าจะเป็นของการแจกแจงแบบสม่ำเสมอ (ต่อเนื่อง) แสดงไว้ด้านบน พื้นที่ใต้เส้นโค้งคือ 1 - ซึ่งสมเหตุสมผลเนื่องจากผลรวมของความน่าจะเป็นทั้งหมดในการแจกแจงความน่าจะเป็นคือ 1

ฟังก์ชันความน่าจะเป็นข้างต้น (f (x)) สามารถกำหนดเป็น

1 / (ba) สำหรับ x ใน [a, b]

และ 0 เป็นอย่างอื่น

พิจารณาว่าฉันต้องเลือกจำนวนจริงระหว่าง a (พูด 2) และ b (พูด 6) สิ่งนี้ทำให้ความน่าจะเป็นแบบเดียวกัน = 0.25 อย่างไรก็ตามเนื่องจากมีจำนวนอนันต์ของตัวเลขในช่วงเวลานั้นผลรวมของความน่าจะเป็นทั้งหมดจึงไม่เท่ากับอินฟินิตี้หรือไม่? ฉันกำลังมองเห็นอะไร

f (x) ไม่ใช่ความน่าจะเป็นของตัวเลข x ที่เกิดขึ้นหรือไม่



1
f(x)ไม่น่าจะเป็นฟังก์ชั่นมันเป็นความหนาแน่นของความน่าจะเป็นฟังก์ชั่น นั่นคือมันไม่ได้ให้ความน่าจะเป็นสำหรับที่เป็นจำนวนหนึ่ง แต่เป็นความหนาแน่นของความน่าจะเป็นหรือความน่าจะเป็นต่อความยาวหน่วยตามแนวแกน x คุณใช้การรวมเพื่อให้ได้ความน่าจะเป็นรวมสำหรับฟังก์ชันประเภทนี้ไม่ใช่การสรุป x
HelloGoodbye

คำตอบ:


18

f(x)อธิบายความหนาแน่นของความน่าจะเป็นมากกว่าความน่าจะเป็นในตัวอย่างของคุณ โดยทั่วไปสำหรับการกระจายอย่างต่อเนื่องเหตุการณ์ -THE สิ่งที่เราได้รับความน่าจะเป็นสำหรับเป็นช่วงของค่าเช่นพื้นที่ใต้เส้นโค้งจากที่ไปหรือจากเพื่อ (แม้ว่าช่วงดังกล่าวไม่จำเป็นต้องต่อเนื่องกัน) . สำหรับการแจกแจงแบบต่อเนื่องความน่าจะเป็นของค่าเดี่ยวใด ๆ ที่เกิดขึ้นโดยทั่วไปคือ 0aa+.1ab


มีวิธีที่แม่นยำกว่าในการพูดในสิ่งที่คุณพยายามจะพูดหรือไม่? ฉันกังวลว่าสิ่ง "พิสัย" จะทำให้ผู้คน
พลัดพราก

3
@Mehrdad: เดลต้าแรคไม่ได้มีการกระจายอย่างต่อเนื่อง วิธีการที่เหมาะสมของการกำหนดความน่าจะผ่าน1DF P(A)=A1dF
อเล็กซ์อาร์

1
@AlexR: ฉันคิดว่า "การกระจายแบบต่อเนื่อง" คุณแค่หมายถึงการกระจายตัวในโดเมนต่อเนื่องเพราะนั่นคือสิ่งที่ผู้คนพูดถึงเมื่อพวกเขาบอกว่าเดลต้า Dirac เป็นอะนาล็อกต่อเนื่องของเดลต้า Kronecker ขอบคุณสำหรับการชี้แจง
user541686

@ Mehrdad ฉันคิดอย่างถ่องแท้ถึงเดลต้าของ Dirac แต่ฉันหวังว่าคุณจะสังเกตเห็นคำว่า "โดยทั่วไป" และระดับความรู้ทางสถิติของ OP ที่ชัดเจน
Alexis

@ Mehrdad สูตรทางเทคนิคของตัวแปรสุ่มอยู่ในแง่ของการวัด: มีฟังก์ชั่นจากชุดพลังงานของพื้นที่เหตุการณ์ถึงช่วงเวลา [0,1] ฟังก์ชันความหนาแน่นของความน่าจะเป็นสามารถใช้เป็นการวัดได้ (การวัดของเซตเป็นเพียงส่วนประกอบของ PDF ในชุดนั้น) แต่มีการวัดเช่นเดลต้า Dirac (ชุดมีการวัด 1 ถ้ามันมีและ เป็นศูนย์มิฉะนั้น) นั่นคือการพูดอย่างเคร่งครัดไม่ทำงานในความหมายดั้งเดิม x0
สะสม

11

เพราะแต่ละเทอมในการรวมนั้นจะถูกถ่วงน้ำหนักโดยเล็กที่สุด ความสำคัญของเรื่องนี้น่าจะเข้าใจได้ง่ายที่สุดโดยการเดินผ่านตัวอย่างพื้นฐานอย่างระมัดระวังx

พิจารณาใช้การสรุปของ Riemann เพื่อคำนวณพื้นที่ภายใต้พื้นที่สี่เหลี่ยมต่อไปนี้ (สี่เหลี่ยมผืนผ้าถูกเลือกเพื่อลบแง่มุมโดยประมาณของการรวม Riemann ซึ่งไม่ได้มุ่งเน้นที่นี่): ภูมิภาคสี่เหลี่ยมเราสามารถคำนวณพื้นที่โดยใช้ 2 subregions หรือโดยใช้ 4 subregions . ในกรณีของ 2 subregions (แทน ) พื้นที่จะได้รับจากในขณะที่ในกรณีของ 4 subregions (แทน ) พื้นที่จะได้รับจากพื้นที่ทั้งหมดในทั้งสองกรณีตรงกับ ทีนี้นี่ค่อนข้างชัดเจน แต่มันก็เพิ่ม คำถามที่สำคัญอย่างละเอียดซึ่งก็คือ: ทำไมทั้งสองคำตอบเห็นด้วยAi

A1=A2=5×2=10
Bi
B1=B2=B3=B4=5×1=5
i=12Ai=i=14Bi=20
? โดยสังหรณ์ใจมันควรจะชัดเจนว่ามันทำงานได้เพราะเราได้ลดความกว้างของอนุภูมิภาคชุดที่สอง เราอาจจะพิจารณาการทำสิ่งเดียวกันกับ 8 ภูมิภาคย่อยแต่ละคนมีความกว้างของและอีกครั้งกับ 16 ... และเราสามารถดำเนินการขั้นตอนนี้จนกว่าเรามีจำนวนอนันต์ของภูมิภาคย่อยแต่ละคนมีความกว้างเล็ก ๆ ของ d xตราบใดที่น้ำหนักทุกอย่างถูกต้องอยู่เสมอคำตอบควรเห็นด้วยเสมอ โดยไม่ต้องชั่งน้ำหนักที่ถูกต้องบวกจะแน่นอนเป็นเพียง\0.5x

นี่คือเหตุผลที่ฉันมักจะให้แน่ใจว่าจะชี้ให้นักเรียนที่หนึ่งไม่ได้เป็นเพียงแค่สัญลักษณ์แต่คู่ของสัญลักษณ์DXdx


5

คุณตีความการกระจายความน่าจะเป็นในทางที่ผิด - มันเป็นจำนวนอนันต์ของความน่าจะเป็นที่หารไม่สิ้นสุดดังนั้นคุณจึงไม่สามารถพูดได้ว่า "ความน่าจะเป็นที่จะวาดค่า 0.5 จากการแจกแจงเครื่องแบบ (0, 1)" ศูนย์ - มีจำนวนอนันต์ของค่าที่เป็นไปได้ที่คุณจะได้รับและทั้งหมดของพวกเขาได้อย่างเท่าเทียมกันมีแนวโน้มอย่างชัดเจนน่าจะเป็นของบุคคลใดบุคคลหนึ่งผลคือ [1]1=0

แต่คุณสามารถดูความน่าจะเป็นสำหรับช่วงผลลัพธ์และวัดว่าใช้พื้นที่ (และอินทิกรัล) ตัวอย่างเช่นถ้าคุณวาดจากการแจกแจงเครื่องแบบ (0, 1) (ด้วย pdfสำหรับและมิฉะนั้นความน่าจะเป็น ผลลัพธ์ของคุณอยู่ระหว่างถึงคือf(x)=1x[0,1]f(x)=00.20.3

0.20.3f(x) dx=0.20.31 dx=[x]0.20.3=0.30.2=0.1

นั่นคือคุณมีโอกาส 10% ที่จะได้ผลลัพธ์ในช่วงนั้น

[1]ขออภัยสำหรับทุกคนที่มีอาการหัวใจวายที่การคำนวณที่ง่ายเกินไปของฉัน


0

โดยทั่วไปการให้เหตุผลของคุณล้มเหลวในสมมติฐานนี้:

อย่างไรก็ตามเนื่องจากมีจำนวนอนันต์ของตัวเลขในช่วงเวลานั้นผลรวมของความน่าจะเป็นทั้งหมดจึงไม่เท่ากับอินฟินิตี้หรือไม่?

มันเป็นปัญหาทางคณิตศาสตร์รู้จักกันมาตั้งแต่Zeno ของ Elea ขัดแย้ง

เขาสองคนอ้างว่า

  1. ลูกศรไม่สามารถไปถึงเป้าหมายได้
  2. อาคิลลิสจะไม่มีวันได้เป็นเต่า

ทั้งคู่ขึ้นอยู่กับการอ้างสิทธิ์ว่าคุณสามารถสร้างลำดับบวกจำนวนอนันต์ (ในกรณีก่อนหน้าโดยบอกว่าลูกศรจะต้องบินอย่างไม่มีที่สิ้นสุดเวลาครึ่งทางที่เหลือไปยังเป้าหมายในระยะหลังโดยบอกว่า Achilles ได้ เพื่อไปยังตำแหน่งที่เคยเป็นเต่ามาก่อนและในขณะเดียวกันเต่าก็ย้ายไปยังตำแหน่งใหม่ที่กลายเป็นจุดอ้างอิงพื้นฐานต่อไปของเรา)

กรอไปข้างหน้าสิ่งนี้นำไปสู่การค้นพบจำนวนเงินไม่สิ้นสุด

ดังนั้นโดยทั่วไปผลรวมของตัวเลขบวกอนันต์จำนวนมากไม่จำเป็นต้องเป็นอนันต์ ; อย่างไรก็ตามมันอาจจะไม่สิ้นสุดถ้าหาก (การใช้คำสั่งมากเกินไป, เสียใจมากเกี่ยวกับเรื่องนั้น) ตัวเลขเกือบทั้งหมดในลำดับนั้นอยู่ใกล้กับ 0 มากที่สุดไม่ว่าคุณจะขอให้มันใกล้ศูนย์แค่ไหน

อินฟินิตี้เล่นเทคนิคมากยิ่งขึ้น การสั่งซื้อในที่ที่คุณเพิ่มองค์ประกอบของลำดับที่มีความสำคัญมากเกินไปและอาจนำไปสู่สถานการณ์ที่สั่งใหม่ให้ผลที่แตกต่างกัน!

สำรวจอีกเล็กน้อยเกี่ยวกับความขัดแย้งของอินฟินิตี้ คุณอาจจะประหลาดใจ


ฉันไม่เห็นวิธีที่จะตีความคำถามเช่นที่ OP คิดว่าเป็นจำนวนเงินที่นับได้
JiK

0

f(x)อธิบายความหนาแน่นของความน่าจะเป็นและมีหน่วย{x} ดังนั้นสำหรับ x ที่กำหนดคุณจะได้รับในหน่วยและไม่ใช่ p ตามที่คุณกำลังมองหา ถ้าคุณต้องการ p คุณต้องการฟังก์ชันการแจกแจงสำหรับช่วงที่กำหนดนั่นคือความน่าจะเป็นที่ p ของ x อยู่ภายใน a และ bpxf(x)=1bapx

หวังว่ามันจะสมเหตุสมผล

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.