ความน่าจะเป็นแบบมีเงื่อนไขของตัวแปรต่อเนื่อง


12

สมมติว่าตัวแปรสุ่มตามการแจกแจงแบบต่อเนื่องพร้อมพารามิเตอร์ 0 และ 10 (เช่น )U U ( 0 , 10 )UUU(0,10)

ทีนี้เรามาแทนเหตุการณ์ที่ = 5 และ B เหตุการณ์ที่เท่ากับหรือ 6 ตามความเข้าใจของฉันเหตุการณ์ทั้งสองมีความน่าจะเป็นศูนย์ที่จะเกิดขึ้นU 5UU5

ตอนนี้ถ้าเราพิจารณาที่จะคำนวณเราไม่สามารถใช้กฎหมายเงื่อนไข เนื่องจากเท่ากับศูนย์ แต่สัญชาตญาณของฉันบอกฉันว่า1/2P ( A | B ) = P ( A B )P(A|B) P(B)P(|B)=1/2P(A|B)=P(AB)P(B)P(B)P(A|B)=1/2


2
สิ่งที่สัญชาตญาณของคุณจะบอกคุณถ้ามีไม่สม่ำเสมอหนาแน่น ? 0.02 U , U ( 0 , 10 )U0.02u,u(0,10)
Dilip Sarwate

1
@DilipSarwate สัญชาตญาณของฉันจะบอกฉันว่าคำตอบคือตัวเลขที่ต่ำกว่า 0.5 เล็กน้อย
Noob

คำตอบ:


9

"แนวคิดของความน่าจะเป็นแบบมีเงื่อนไขเกี่ยวกับสมมติฐานที่แยกได้ซึ่งความน่าจะเป็นเท่ากับ 0 นั้นยอมรับไม่ได้" A. Kolmogorov

สำหรับตัวแปรสุ่มต่อเนื่องและพูดการแจกแจงแบบมีเงื่อนไขจะถูกกำหนดโดยคุณสมบัติที่พวกเขากู้คืนความน่าจะเป็นแบบดั้งเดิมนั่นคือสำหรับชุดที่วัดได้ทั้งหมด , ,นี่ก็หมายความว่ามีความหนาแน่นเงื่อนไขที่ถูกกำหนดโดยพลการในชุดของวัดเป็นศูนย์หรือคำอื่น ๆ ที่มีความหนาแน่นเงื่อนไขถูกกำหนดเกือบทุกที่ เนื่องจากชุดเป็นศูนย์การวัดเทียบกับการวัด Lebesgue ซึ่งหมายความว่าคุณสามารถกำหนดทั้งY A B ( X ) B B ( Y ) P ( X A , Y B ) = B d P Y ( y ) B d P X | Y ( x | y ) p X | Y ( x | y ) { 5 , 6 } p (XYAB(X)BB(Y)

P(XA,YB)=BdPY(y)BdPX|Y(x|y)
pX|Y(x|y){5,6}p ( 6 ) P ( U = 5 | U { 5 , 6 } )p(5)และตามอำเภอใจและด้วยเหตุนี้ความน่าจะเป็นสามารถรับค่าใด ๆ ได้p(6)
P(U=5|U{5,6})

นี่ไม่ได้หมายความว่าคุณไม่สามารถกำหนดความหนาแน่นแบบมีเงื่อนไขได้โดยสูตรอัตราส่วนเช่นเดียวกับในกรณีปกติแบบ bivariate แต่เพียงว่าความหนาแน่นนั้นถูกกำหนดไว้เกือบทุกที่ สำหรับทั้งและy ที่x y

f(y|x)=f(x,y)/f(x)
xy

"การโต้เถียงที่ไร้ประโยชน์จำนวนมากได้เกิดขึ้นระหว่างผู้น่าจะเป็นคนที่มีความสามารถ - ซึ่งผลลัพธ์เหล่านี้คือ 'ถูกต้อง' ET Jaynes

ความจริงที่ว่าอาร์กิวเมนต์ จำกัด (เมื่อไปที่ศูนย์) ในคำตอบข้างต้นดูเหมือนว่าจะให้คำตอบที่เป็นธรรมชาติและใช้งานง่ายเป็นเรื่องที่เกี่ยวข้องกับความขัดแย้งของโบเรล การเลือกใช้ parametrisation ในเรื่องที่ จำกัด ดังแสดงในตัวอย่างต่อไปนี้ที่ฉันใช้ในชั้นเรียนระดับปริญญาตรีของฉันϵ


ใช้ bivariate ปกติคืออะไรความหนาแน่นเงื่อนไขของให้ที่ ?X X = Y

X,Yi.i.d.N(0,1)
XX=Y


หากหนึ่งเริ่มต้นจากความหนาแน่นร่วมที่ "ง่าย" คำตอบคือ [สัดส่วนกับ] 2 สิ่งนี้สามารถทำได้โดยการพิจารณาการเปลี่ยนแปลงของตัวแปรโดยที่มีความหนาแน่น{2} ดังนั้นและอย่างไรก็ตาม หากพิจารณาการเปลี่ยนแปลงของตัวแปรความหนาแน่นของคือความหนาแน่นของ Cauchyφ(x)φ(y)φ(x)2

(x,t)=(x,yx)φ(x)φ(t+x)
T=YXφ(t/2)/2
f(x|t)=φ(x)φ(t+x)φ(t/2)/2
f(x|t=0)=φ(x)φ(x)φ(0/2)/2=φ(x)22
(x,r)=(x,y/x)φ(x)φ(rx)|x|
R=Y/Xψ(r)=1/π{1+r2}และความหนาแน่นของเงื่อนไขของให้เป็นดังนั้น และนี่คือที่ตั้งของ "ความขัดแย้ง" เหตุการณ์ที่เกิดขึ้นและเป็นเช่นเดียวกับแต่พวกเขานำไปสู่ความหนาแน่นเงื่อนไขที่แตกต่างกันในXXR
f(x|r)=φ(x)φ(rx)|x|×π{1+r2}
f(x|r=1)=πφ(x)2|x|/2.
R=1T=0X=YX

2
นี่เป็นเพียงความผิดธรรมดา หากคุณใช้หลักสูตรที่เข้มงวดในทฤษฎีความน่าจะเป็นคุณจะเห็นว่าการปรับสภาพเหตุการณ์ของศูนย์การวัดนั้นเป็นไปได้และเป็นไปได้จริง พิจารณาแบบเกาส์บิทูริเอท ทุกคนรู้ว่าคุณสามารถกำหนดให้ตัวแปรแรกรับค่าเป็นศูนย์ได้ แต่เหตุการณ์นี้มีความน่าจะเป็นศูนย์ ดูวิกิพีเดีย en.wikipedia.org/wiki/…
Yair Daon

5

นี่คือคำตอบแย้ง:

ซีอานนั้นถูกต้องที่คุณไม่สามารถจัดกิจกรรมได้โดยไม่มีค่าความน่าจะเป็น อย่างไรก็ตาม Yair ก็ถูกต้องที่เมื่อคุณตัดสินใจเกี่ยวกับกระบวนการ จำกัดคุณสามารถประเมินความน่าจะเป็นได้ ปัญหาคือมีกระบวนการ จำกัด จำนวนมากที่มาถึงสภาพที่ต้องการ

ฉันคิดว่าหลักการของความไม่แยแสบางครั้งสามารถแก้ไขตัวเลือกดังกล่าว มันระบุว่าผลลัพธ์ไม่ควรได้รับผลกระทบจากการแลกเปลี่ยนฉลากโดยพลการ ในกรณีของคุณให้พูดให้พลิกช่วงเวลาเพื่อให้เป็นชุดและเปลี่ยนจุด 5 และ 6 พลิกเปลี่ยนแปลงคำตอบไป1-Pดังนั้นหากคุณเลือกกระบวนการ จำกัด ที่แตกต่างจากที่อื่นคุณก็ต้องเปลี่ยนป้ายกำกับโดยพล (ในกรณีนี้การเปลี่ยนค่าบวกอนันต์สำหรับลบอนันต์) จะได้ผลลัพธ์ที่แตกต่างกัน ที่ไม่ควรเกิดขึ้นตามหลักการของความเฉยเมย ดังนั้นคำตอบคือ 0.5 ตามที่คุณเดา(1,11)p1p

โปรดทราบว่านักสถิติหลายคนไม่ยอมรับหลักการของความเฉยเมย ฉันชอบมันเพราะมันสะท้อนถึงสัญชาติญาณของฉัน แม้ว่าฉันจะไม่แน่ใจเสมอไปว่าจะนำไปใช้อย่างไรบางทีในอีก 50 ปีมันจะเป็นกระแสหลักมากกว่า


ขอบคุณสำหรับการโพสต์รอบคอบ ฉันสงสัยว่า "หลักการของความไม่แยแส" อย่างจริงจังสำหรับฉันจะเป็นสิ่งสำคัญเพราะมันไม่สามารถทำงานได้ ข้อโต้แย้งของคุณจะแยกกันเมื่อแสดงค่าที่อ้างอิงอีกครั้ง การกระจายชุดบนอาจจะกลายเป็นดังนั้นการพูด, การกระจาย Cauchy,อาจจะกลายเป็นและกลายเป็น{5}}} ตอนนี้ "หลักการของความไม่แยแส" ของคุณสร้างคำตอบที่แตกต่างอย่างสิ้นเชิง (ฉันใช้ความน่าจะเป็นแปลงเพื่อหาตัวอย่างนี้)[0,10]506125
whuber

@whuber: อาร์กิวเมนต์การพลิกจะไม่ทำงานสำหรับการแจกแจง Cauchy เว้นแต่ว่าคุณจะพลิกโหมดของมัน
Neil G

แน่ใจว่าทำได้: มีหลายวิธีในการแปลงการกระจายอย่างต่อเนื่องหนึ่งไปสู่อีกค่า ที่จริงแล้ว "การพลิก" ของคุณไม่ได้รักษาการกระจายดั้งเดิมไว้ (มันเปลี่ยนการสนับสนุนโดยสิ้นเชิง) ดังนั้นมันจะปรากฏว่าสิ่งที่คุณทำคือแทนที่การกระจายตัวหนึ่งด้วยอีกอันหนึ่ง ดูเหมือนจะไม่มีหลักการใด ๆ ในการดำเนินการที่นี่เลย
whuber

@ โฮเบอร์: มันแทนที่การกระจายตัวหนึ่งด้วยอีกอันโดยที่ภูมิภาคเครื่องแบบรอบ 5 และ 6 ไม่เปลี่ยนแปลง - ในทำนองเดียวกันฉันคิดว่าการซูมออกพยายามที่จะทำให้ความหนาแน่นไม่เปลี่ยนแปลงในวงกลมดั้งเดิมในเบอร์ทรานด์สพาราด็อกซ์
Neil G

1
@whuber: ถูกต้อง ฉันชอบคำตอบของ Potatoจริงๆสำหรับหนึ่งในคำถามของฉัน โดยส่วนตัวผมคิดว่าถ้ามีความคลาดเคลื่อนระหว่างทฤษฎีกับสัญชาตญาณเราควรหาทฤษฎีใหม่ที่สมบูรณ์กว่านี้ บางที "หลักการของความเฉยเมย" อาจไม่ถูกต้องหรือไม่สามารถใช้งานได้ แต่ฉันมีความปรารถนาอย่างเป็นธรรมชาติสำหรับทฤษฎีความน่าจะเป็นที่จะตอบคำถามที่เรามีความเข้าใจที่เข้าใจง่าย บางที Lebesgue มีความรู้สึกแบบเดียวกันเกี่ยวกับการรวม Riemann เมื่อเขาสร้างอินทิกรัลของเขา?
Neil G

1

ใช่เราทำได้! คุณสามารถจัดกิจกรรมเกี่ยวกับความน่าจะเป็นศูนย์ได้! คณิตศาสตร์มีความซับซ้อน - คุณต้องมีทฤษฎีการวัด แต่คุณสามารถทำได้ ในกรณีง่าย ๆ แบบนี้ฉันจะค้นหาปรีชาโดยกำหนดและ{4}] ทำทุกอย่างตอนนี้ที่คุณเคยทำมาก่อนและใช้เวลา0A=[5ϵ2,5+ϵ2]B=[5ϵ4,5+ϵ4][6ϵ4,6+ϵ4]ϵ0

ขอให้ฉันเครียดอีกครั้ง (และอีกครั้ง) ว่าวิธีการข้างต้นใช้สำหรับสัญชาตญาณ การปรับความน่าจะเป็นของเหตุการณ์ที่เป็นศูนย์จะเกิดขึ้นบ่อยครั้งมากโดยไม่ต้องคิดมาก ตัวอย่างที่ดีที่สุดที่ฉันนึกได้ก็คือถ้าเป็น gaussian แบบไบวาเรีย มักจะพิจารณาความหนาแน่นของได้รับ (พูด)ซึ่งเป็นเหตุการณ์ของการวัดศูนย์ สิ่งนี้มีพื้นฐานทางทฤษฎีเป็นอย่างดี แต่ก็ไม่ได้สำคัญอะไรเลย เกี่ยวกับคำพูดของ @ Xi'an ของ Kolmogorov - ฉันทำได้เพียงอ้าง Varadhan: "หนึ่งในเป้าหมายของเราคือการค้นหาคำจำกัดความที่สมเหตุสมผลเมื่อ " (ทฤษฎีความน่าจะเป็น, บันทึก Courant, หน้า 74) .(X1,X2)N(0,Σ)X1X2=0P(ξ=a)=0

ใช่คุณสามารถให้ความหมายกับการ จำกัด เหตุการณ์ของศูนย์การวัด


5
สมมติว่า : นั่นคือทั้งและเป็นไปได้ วิธีที่คุณจะจัดการกับสถานการณ์เมื่อและ ? จะ (ซึ่ง "สังหรณ์ใจ" เป็นคำตอบที่ถูกต้องเพราะตัวเลขทั้งหมดในมีความหนาแน่นเท่ากัน) หรืออาจ (ซึ่งเปลี่ยนจากเป็นในแบบง่าย ๆสูตรจะให้) หรือแม้กระทั่ง ? UU[0,10]010A={0}B={0,6}P(A|B)=1/2[0,10]1/3500
whuber

2
@ YairDaon ขอบคุณสำหรับคำตอบ! ถ้าฉันเข้าใจดีคุณหมายถึงทำสิ่งต่อไปนี้: สำหรับขนาดเล็กเรามี:εP(A|B)=P(AB)P(B)=5ε45+ε4f(u)du5ε45+ε4f(u)du+6ε46+ε4f(u)du=ε2ε2+ε2=0.5
Noob

3
@ YairDaon แต่ฉันคิดว่าผลลัพธ์ไม่คงที่หากเรากำหนด A เป็น ( และ B เหมือนเดิม) ในกรณีเช่นนี้ผลลัพธ์จะเป็น1[5ε8,5+ε8]18
Noob

4
มันยอดเยี่ยมสำหรับสัญชาตญาณโดยการแสดงว่าไม่มีคำตอบที่ไม่ซ้ำกันนั่นคือพื้นฐานสำหรับคำสั่งของ Kolmogorov ที่ยกมาโดย @ ซีอาน ความจริงที่คุณต้องเปลี่ยนขั้นตอนการทำสิ่งต่าง ๆ ออกมาตามที่คุณคิดว่าควรแจ้งเตือนคุณถึงปัญหาเกี่ยวกับวิธีการนี้
whuber

3
ความหนาแน่นของรับเป็นที่ดีที่กำหนดตรงกันข้ามกับความหนาแน่นของรับ 0 X 1 X 2 X 1 = 0X2X1X2X1=0
ซีอาน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.