การกระจายตัวของคือ ,คือการแจกแจงแบบสม่ำเสมอ?


17

ฉันมีสี่อิสระตัวแปรกระจายอย่างสม่ำเสมอ , ในแต่ละ [0,1]ฉันต้องการที่จะคำนวณการกระจายของ(โฆษณา)ฉันคำนวณการกระจายตัวของเป็น (ดังนั้น ) และจากจะเป็นตอนนี้การกระจายของจำนวนเงินที่คือ (นอกจากนี้ยังมี อิสระ)เพราะa,b,c,d[0,1](ad)2+4bcu2=4bc

f2(u2)=14lnu24
u2(0,4]u1=(ad)2
f1(u1)=1u1u1.
u1+u2u1,u2
fu1+u2(x)=+f1(xy)f2(y)dy=14041xyxylny4dy,
y(0,4]. ที่นี่จะต้องเป็นดังนั้นอินทิกรัลเท่ากับตอนนี้ฉันแทรกมันลงใน Mathematica และรับx>y
fu1+u2(x)=140x1xyxylny4dy.
fu1+u2(x)=14[x+xlnx42x(2+lnx)].

ฉันสร้างชุดอิสระสี่ชุดประกอบด้วยตัวเลข10 ^ 6แต่ละชุดและดึงฮิสโตแกรมของ(โฆษณา) ^ 2 + 4bc :10 6 ( a - d ) 2 + 4 b ca,b,c,d106(ad)2+4bc

ป้อนคำอธิบายรูปภาพที่นี่

และดึงพล็อตfu1+u2(x) :

ป้อนคำอธิบายรูปภาพที่นี่

โดยทั่วไปพล็อตจะคล้ายกับฮิสโตแกรม แต่ในช่วงเวลา(0,5)ส่วนใหญ่จะเป็นลบ (รากอยู่ที่ 2.27034) และหนึ่งของส่วนที่เป็นบวกคือ0.770.77

ความผิดพลาดอยู่ที่ไหน หรือฉันหายไปบางสิ่ง

แก้ไข:ฉันปรับฮิสโตแกรมเพื่อแสดง PDF

ป้อนคำอธิบายรูปภาพที่นี่

แก้ไข 2:ฉันคิดว่าฉันรู้ว่ามีปัญหาในการให้เหตุผลของฉัน - ในข้อ จำกัด การรวม เนื่องจากและฉันไม่สามารถเพียงแค่พล็อตแสดงภูมิภาคที่ฉันต้องรวมเข้าด้วยกัน:x - y ( 0 , 1 ] x 0y(0,4]xy(0,1]0x

ป้อนคำอธิบายรูปภาพที่นี่

ซึ่งหมายความว่าฉันมีสำหรับ (นั่นเป็นสาเหตุที่ส่วนหนึ่งของของฉันถูกต้อง),ใน , และในโชคไม่ดีที่ Mathematica ไม่สามารถคำนวณอินทิกรัลสองอันหลังได้ ) Y ( 0 , 1 ] x x - 1ปี( 1 , 4 ] 4 x - 1ปี( 4 , 5 ]0xy(0,1]fx1xy(1,4]x14y(4,5]

แก้ไข 3:ปรากฏว่า Mathematica สามารถคำนวณอินทิกรัลสามรายการสุดท้ายด้วยรหัสต่อไปนี้:

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1}, Assumptions ->0 <= u2 <= u1 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1}, Assumptions -> 1 <= u2 <= 3 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4}, Assumptions -> 4 <= u2 <= 4 && u1 > 0]

ซึ่งให้คำตอบที่ถูกต้อง :)


2
ฉันชอบที่คุณได้ลองตรวจสอบความสมเหตุสมผลของคำตอบด้วยการจำลอง ปัญหาของคุณคือคุณรู้ว่าคุณได้ทำผิดพลาด แต่ไม่สามารถดูได้ว่าอยู่ที่ไหน คุณคิดว่าคุณสามารถตรวจสอบแต่ละขั้นตอนของวิธีการของคุณเพื่อแก้ไขปัญหาข้อผิดพลาดหรือไม่ ตัวอย่างเช่นข้อผิดพลาดอยู่ในของคุณหรือไม่ คุณสามารถตรวจสอบ PDF ที่คำนวณได้ของคุณเทียบกับผลลัพธ์ที่จำลองได้เหมือนที่คุณทำเพื่อหาคำตอบสุดท้าย เช่นเดียวกันสำหรับF_2หากทั้งและนั้นถูกต้องทั้งคู่คุณก็ทำผิดพลาดเมื่อรวมมันเข้าด้วยกัน การตรวจสอบทีละขั้นตอนดังกล่าวช่วยให้คุณสามารถกำหนดจุดที่ผิดพลาดได้! f 2 f 1 f 2f1(u1)f2f1f2
Silverfish

ฉันโยนความพยายามครั้งแรกของฉันออกไปและคำนวณใหม่ตั้งแต่เริ่มต้น ฉันเชื่อว่าและนั้นถูกต้องแม้ว่าฉันจะต้องคูณเริ่มต้นด้วยตนเอง 2 ด้วยตนเองเพื่อให้มันเป็นมาตรฐานสู่ความเป็นเอกภาพ แต่นั่นเป็นเพียงการเปลี่ยนแปลงสูงและไม่ได้อธิบายว่าทำไมฉันมีเชิงลบฉf 2 f 1 ff1f2f1f
corey979

เมื่อสร้างฮิสโตแกรมดังกล่าวเพื่อเปรียบเทียบกับปริมาณพีชคณิตที่คำนวณได้ให้ปรับฮิสโตแกรมเป็นความหนาแน่นที่ถูกต้อง (และใส่ลงไปอีกหากคุณทำได้) ทำการตรวจสอบที่คล้ายกันสำหรับ f1 และ f2 ของคุณเพื่อให้แน่ใจว่าคุณมีสิทธิ์เหล่านั้น; หากพวกเขาพูดถูก (ฉันยังไม่เห็นเหตุผลที่ดีที่จะสงสัยพวกเขา แต่มันเป็นการดีที่สุดที่จะตรวจสอบอีกครั้ง) ดังนั้นปัญหาจะต้องเกิดขึ้นในภายหลัง
Glen_b -Reinstate Monica

คำตอบ:


19

บ่อยครั้งที่มันช่วยในการใช้ฟังก์ชันการแจกแจงสะสม

ครั้งแรก

F(x)=Pr((ad)2x)=Pr(|ad|x)=1(1x)2=2xx.

ต่อไป,

G(y)=Pr(4bcy)=Pr(bcy4)=0y/4dt+y/41ydt4t=y4(1log(y4)).

Letช่วงระหว่างที่เล็กที่สุด ( ) และใหญ่ที่สุด ( ) ค่าที่เป็นไปของปีก่อนคริสตกาล เขียนด้วย CDFและด้วย PDFเราจำเป็นต้องคำนวณ0δ05(ad)2+4bcx=(ad)2Fy=4bcg=G

H(δ)=Pr((ad)2+4bcδ)=Pr(xδy)=04F(δy)g(y)dy.

เราคาดหวังว่าสิ่งนี้จะน่ารังเกียจ - การกระจายเครื่องแบบ PDF ไม่ต่อเนื่องดังนั้นจึงควรหยุดพักในคำจำกัดความของดังนั้นมันค่อนข้างน่าอัศจรรย์ที่Mathematicaได้รับแบบฟอร์มปิด (ซึ่งฉันจะไม่ทำซ้ำที่นี่) การแยกความแตกต่างด้วยความเคารพให้ความหนาแน่นที่ต้องการ มันถูกกำหนดเป็นชิ้น ๆ ภายในสามช่วงเวลา ใน ,Hδ0<δ<1

H(δ)=h(δ)=18(8δ+δ((2+log(16)))+2(δ2δ)log(δ)).

ใน ,1<δ<4

h(δ)=14((δ+1)log(δ1)+δlog(δ)4δcoth1(δ)+3+log(4)).

และใน ,4<δ<5

h(δ)=14(δ4δ4+(δ+1)log(4δ1)+4δtanh1((δ4)δδδδ4)1).

รูป

ตัวเลขนี้ซ้อนพล็อตของบนกราฟแสดงความถี่ของความเข้าใจของ IID4BC ทั้งสองจะแยกไม่ออกเกือบบอกความถูกต้องของสูตรสำหรับชั่วโมงh106(ad)2+4bch


ต่อไปนี้เป็นวิธีการแก้ปัญหาทางคณิตศาสตร์ Mathematica ที่ไร้กำลัง มันทำทุกอย่างเกี่ยวกับการคำนวณโดยอัตโนมัติ ตัวอย่างเช่นมันจะคำนวณช่วงของตัวแปรผลลัพธ์:

ClearAll[ a, b, c, d, ff, gg, hh, g, h, x, y, z, zMin, zMax, assumptions];
assumptions = 0 <= a <= 1 && 0 <= b <= 1 && 0 <= c <= 1 && 0 <= d <= 1; 
zMax = First@Maximize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];
zMin = First@Minimize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];

นี่คือการรวมและความแตกต่างทั้งหมด (จงอดทน; การคำนวณใช้เวลาสองสามนาที)H

ff[x_] := Evaluate@FullSimplify@Integrate[Boole[(a - d)^2 <= x], {a, 0, 1}, {d, 0, 1}];
gg[y_] := Evaluate@FullSimplify@Integrate[Boole[4 b c <= y], {b, 0, 1}, {c, 0, 1}];
g[y_]  := Evaluate@FullSimplify@D[gg[y], y];
hh[z_] := Evaluate@FullSimplify@Integrate[ff[-y + z] g[y], {y, 0, 4}, 
          Assumptions -> zMin <= z <= zMax];
h[z_]  :=  Evaluate@FullSimplify@D[hh[z], z];

ในที่สุดการจำลองและการเปรียบเทียบกับกราฟของ :h

x = RandomReal[{0, 1}, {4, 10^6}];
x = (x[[1, All]] - x[[4, All]])^2 + 4 x[[2, All]] x[[3, All]];
Show[Histogram[x, {.1}, "PDF"], 
 Plot[h[z], {z, zMin, zMax}, Exclusions -> {1, 4}], 
 AxesLabel -> {"\[Delta]", "Density"}, BaseStyle -> Medium, 
 Ticks -> {{{0, "0"}, {1, "1"}, {4, "4"}, {5, "5"}}, Automatic}]

8
(+1) โดยเฉพาะอย่างยิ่งสำหรับเตือนผู้คนว่าแทนที่จะพูดถึงการโน้มน้าวความหนาแน่น"บ่อยครั้งที่มันช่วยให้ใช้ฟังก์ชันการแจกแจงสะสม"โดยเฉพาะอย่างยิ่งเมื่อพวกเขามีรูปแบบที่เรียบง่ายเช่นที่นี่ และคุณก็ถูกสาปแช่งอย่างรวดเร็วเช่นกัน
Alecos Papadopoulos

นั่นดูเหมือนเป็นทางออกที่เรียบร้อยที่ฉันชอบยอมรับ - หลังจากที่ฉันเข้าใจแล้ว ฉันเป็นแคลคูลัสมากกว่าผู้น่าจะเป็น ในขณะนี้ฉันมีคำถามสามข้อ: i) คุณใช้ CDF อย่างไรในการรับและ , ii) สาเหตุที่มีและภายใต้อินทิกรัลสำหรับและ iii) คุณเป็นอย่างไร ว่าผลลัพธ์ของการแก้ปัญหาจะเป็นค่าทีละน้อย? F(x)G(y)FgH
corey979

(1)และเป็น CDFs พวกเขาถูกคำนวณจากคำจำกัดความของ CDF ตามที่ระบุโดยความเท่าเทียมกันครั้งแรกหลังจากที่ปรากฏตัวครั้งแรก รายละเอียดควรจะชัดเจนในรหัสที่ฉันใส่ (2) นี่คือสูตรการรวมสำหรับผลรวม (อธิบายอย่างเต็มที่ยิ่งขึ้นในการคำนวณที่คล้ายกันที่stats.stackexchange.com/a/144237 ) (3) ฉันใส่ลิงค์ไปยังเธรดอื่นเกี่ยวกับคุณสมบัติของการแจกแจงแบบเดียวกัน FG
whuber

7

เช่นเดียวกับ OP และคนรอบข้างฉันจะใช้ความเป็นอิสระเพื่อแยกปัญหานี้ออกเป็นปัญหาที่ง่ายกว่า:

ให้ 2 จากนั้นไฟล์ pdf ของบอกว่าคือ:X=(ad)2Xf(x)

ป้อนคำอธิบายรูปภาพที่นี่

Letปีก่อนคริสตกาล จากนั้นไฟล์ pdf ของพูดว่าคือ:Y=4bcYg(y)

ป้อนคำอธิบายรูปภาพที่นี่

ปัญหาที่เกิดขึ้นในขณะนี้ลดไปหารูปแบบไฟล์ PDF ของY อาจจะมีหลายวิธีในการทำเช่นนี้ แต่ที่ง่ายที่สุดสำหรับฉันคือการใช้ฟังก์ชั่นที่เรียกว่าจากรุ่นปัจจุบันของพัฒนาการmathStatica น่าเสียดายที่นี่ไม่สามารถใช้ได้ในรุ่นสาธารณะในขณะนี้ แต่นี่คืออินพุต:X+YTransformSum

TransformSum[{f,g}, z]

ซึ่งจะส่งคืนไฟล์ PDF ของเป็นฟังก์ชั่นตามเข็มนาฬิกา:Z=X+Y

ป้อนคำอธิบายรูปภาพที่นี่

นี่คือพล็อตของ pdf ที่เพิ่งได้มาพูด :h(z)

ป้อนคำอธิบายรูปภาพที่นี่

ตรวจสอบมอนติคาร์โลด่วน

แผนภาพต่อไปนี้เป็นการเปรียบเทียบการประมาณของมอนติคาร์โลเชิงประจักษ์ของ pdf (ไก่งวงสีน้ำเงิน) กับ pdf เชิงทฤษฎีที่ได้มาจากด้านบน (เส้นประสีแดง) ดูดี

ป้อนคำอธิบายรูปภาพที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.