การแจกแจงความน่าจะเป็นพิเศษ


12

ถ้าp(x)คือการกระจายความน่าจะเป็นที่ไม่ใช่ศูนย์ค่าบน[0,+)สำหรับสิ่งที่ประเภท (s) ของp(x)จะมีอยู่อย่างต่อเนื่องc>0เช่นที่ 0p(x)logp(x)(1+ϵ)p(x(1+ϵ))dxcϵ2สำหรับทั้งหมด0<ϵ<1?

ความไม่เสมอภาคดังกล่าวข้างต้นเป็นจริง Kullback-Leibler แตกต่างระหว่างการกระจายp(x)และรุ่นที่ถูกบีบอัดของมัน(1+ϵ)p(x(1+ϵ)) ) ฉันพบว่าความไม่เท่าเทียมกันนี้มีไว้สำหรับการแจกแจงแบบเอ็กซ์โปเนนเชียลแกมม่าและไวบูลและฉันสนใจที่จะรู้ว่ามันใช้ได้กับการแจกแจงความน่าจะเป็นที่มีขนาดใหญ่ขึ้นหรือไม่

ความคิดใดที่ความไม่เท่าเทียมนั้นหมายถึงอะไร


3
เนื่องจากϵเป็นบวกที่จะถูกบีบอัด (ในทิศทาง x) แทนที่จะยืดออก
Glen_b -Reinstate Monica

2
คำถามนี้ไม่ชัดเจน: ปริมาณของคุณคืออะไร? คุณต้องการความไม่เท่าเทียมกันนี้จะถือสำหรับทุก , อย่างน้อยหนึ่งε , หรือสิ่งอื่นใด เป็นได้รับเบื้องต้นหรือคุณหมายถึงควรมีอยู่อย่างน้อยหนึ่งค่าดังกล่าวของ ? และเมื่อคุณพูดถึงคลาสของการแจกแจงความน่าจะเป็นโดย " p ( x ) " คุณหมายถึงการแจกแจงแบบเจาะจงหรือคุณอาจหมายถึงตระกูลพาราเมทริกของมัน? ϵ ϵccp(x)
whuber

2
@whuber ขอบคุณสำหรับความคิดเห็นของคุณ ฉันแก้ไขคำแถลงปัญหาเพื่อชี้แจงปัญหาที่กล่าวถึง ฉันหมายถึงอะไรที่ความไม่เท่าเทียมกันข้างต้นมีอยู่? คำตอบอาจเป็นการแนะนำให้รู้จักกับตัวแปรครอบครัวของการแจกแจงหรือเสนอสมการเชิงอนุพันธ์สำหรับp ( x )ที่เพียงพอและให้ความไม่เท่าเทียมกันที่ต้องการ p(x)p(x)
Sus20200

2
ความไม่เท่าเทียมนี้จะใช้ได้กับ p (x) ใดที่ต่อเนื่องและมีการสนับสนุนอย่างไม่สิ้นสุด คุณกำลังคำนวณ KL divergence ภายในพาราเมทริกตระกูล ( ถ้าKL แตกต่างกันที่ 0 แสดงว่าอนุพันธ์เป็น 0 เอาC เป็น Cสูงสุดของความโค้งของ KL (สำหรับε [ 0 , 1 ] .) เราได้ผูกพันกับการทำงานเพิ่มเติมก็อาจจะเป็นไปได้ที่จะถูกผูกไว้ C จากคุณสมบัติของพีϵp(x(1+ϵ))Cϵ[0,1]
กีโยม Dehaene

1
L=limx0p(x)x=0Lϵ+O(ϵ2)

คำตอบ:


4

รอบคัดเลือกโซน

เขียน

Ip(ϵ)=0p(x)log(p(x)(1+ϵ)p(x(1+ϵ)))dx.

ลอการิทึมและความสัมพันธ์ระหว่างและแนะนำให้แสดงทั้งและอาร์กิวเมนต์เป็น exponentials ด้วยเหตุนี้ให้กำหนดp(x)p(x(1+ϵ))p

q(y)=log(p(ey))

สำหรับจริงทั้งหมดที่ด้านขวามือจะถูกกำหนดและเท่ากับใดก็ตามที่ 0 ขอให้สังเกตว่าการเปลี่ยนแปลงของตัวแปรทำให้เกิดและ (การให้เป็นความหนาแน่นของการแจกแจง) ว่ากฎความน่าจะเป็นทั้งหมดนั้นสามารถแสดงเป็นyp(ey)=0x=eydx=eydyp

(1)1=0p(x)dx=Req(y)+ydy.

ให้เราสมมติเมื่อYeq(y)+y0y± กฎนี้ออกมาแจกแจงความน่าจะกับ spikes หลายอย่างมากมายในความหนาแน่นใกล้หรือ\โดยเฉพาะอย่างยิ่งหากท้ายของเป็นแบบโมโนโทนิกแสดงถึงการสันนิษฐานนี้แสดงว่ามันไม่รุนแรงp0p(1)

เพื่อให้การทำงานกับลอการิทึมง่ายขึ้นให้สังเกตด้วยว่า

1+ϵ=eϵ+O(ϵ2).

เนื่องจากการคำนวณต่อไปนี้จะดำเนินการได้ถึงทวีคูณของกำหนดϵ2

δ=log(1+ϵ).

เราอาจรวมทั้งเปลี่ยนโดยกับสอดคล้องกับและบวกสอดคล้องกับบวก\1+ϵeδδ=0ϵ=0δϵ

การวิเคราะห์

วิธีหนึ่งที่ชัดเจนที่ความไม่เท่าเทียมสามารถล้มเหลวได้สำหรับอินทิกรัลเพื่อเบี่ยงเบนความแตกต่างของสิ่งนี้จะเกิดขึ้นถ้าเช่นนั้นจะต้องมีใด ๆในช่วงเวลาที่เหมาะสมของตัวเลขในเชิงบวกว่าขนาดเล็กไม่มีซึ่งในเป็นเหมือนศูนย์ แต่ไม่ได้ศูนย์ในช่วง . ที่จะก่อให้เกิด integrand ที่จะ ไม่มีที่สิ้นสุดกับความน่าจะเป็นในเชิงบวกIp(ϵ)ϵ(0,1][u,v]pp[uϵ,vϵ]

เพราะคำถามคือ unspecific เกี่ยวกับธรรมชาติของเราจะได้รับการจมอยู่กับปัญหาทางเทคนิคเกี่ยวกับวิธีการที่เรียบอาจจะมี ลองหลีกเลี่ยงปัญหาดังกล่าวโดยหวังว่าจะได้ข้อมูลเชิงลึกโดยสมมติว่าทุกแห่งมีอนุพันธ์มากมายเท่าที่เราจะสนใจใช้ (สองจะพอเพียงถ้าอย่างต่อเนื่อง.) เพราะเห็นว่าการค้ำประกันซากทางทิศชุด จำกัด ใด ๆ ก็หมายความว่าไม่เคยมีศูนย์เมื่อ0ppqqqp(x)x>0

โปรดทราบว่าคำถามนี้เกี่ยวข้องกับพฤติกรรมของเมื่อเข้าใกล้ศูนย์จากด้านบน เนื่องจากอินทิกรัลนี้เป็นฟังก์ชั่นต่อเนื่องของในช่วงเวลาจึงได้เมื่อถูก จำกัด ช่วงบวกใด ๆทำให้เราสามารถเลือกเพราะเห็นได้ชัดว่าIp(ϵ)ϵϵ(0,1]Mp(a)ϵ[a,1]c=Mp(a)/a2

cϵ2=Mp(a)(ϵa)2Mp(a)Ip(ϵ)

ทำให้ความไม่เท่าเทียมทำงานได้ นี่คือเหตุผลที่เราต้องเกี่ยวข้องกับการคำนวณโมดูโลเท่านั้นϵ2

วิธีการแก้

การใช้การเปลี่ยนแปลงของตัวแปรจากเป็น , จากเป็น , และเป็น , ลองคำนวณผ่านลำดับที่สองใน (หรือ ) โดยหวังว่าจะบรรลุ การทำให้เข้าใจง่าย ไปยังจุดสิ้นสุดที่กำหนดxypqϵδIp(ϵ)ϵδ

R(y,δ)δ2=q(y+δ)q(y)δq(y)

จะเป็นการสั่งที่เหลือในการขยายตัวของเทย์เลอร์รอบปี2qy

Ip(ϵ)=Req(y)+y(q(y)q(y+δ)δ)dy=Req(y)+y(δ+δq(y)+R(y,δ)δ2)dy=δReq(y)+y(1+q(y))dyδ2Req(y)+yR(y,δ)dy.

การเปลี่ยนตัวแปรในการแสดงหนึ่งซ้ายมือก็จะต้องหายไปเป็นข้อสังเกตในสมมติฐานดังต่อไปนี้(1)การเปลี่ยนตัวแปรกลับไปเป็นในอินทิกรัลขวามือจะให้q(y)+y(1)x=ey

Ip(ϵ)=δ2Rp(x)R(log(x),δ)dy=δ2Ep(R(log(x),δ)).

ความไม่เท่าเทียมถือ (ภายใต้สมมติฐานทางเทคนิคต่าง ๆ ของเรา) ถ้าหากสัมประสิทธิ์ของทางด้านขวามือมี จำกัดδ2

การตีความ

นี่เป็นจุดที่ดีที่จะหยุดเพราะมันดูเหมือนจะเปิดเผยปัญหาสำคัญ:ถูก จำกัด ด้วยฟังก์ชันกำลังสองของอย่างแม่นยำเมื่อข้อผิดพลาดกำลังสองในการขยายตัวของเทย์เลอร์ไม่ ระเบิด (เทียบกับการจัดจำหน่าย) เป็นวิธี\Ip(ϵ)ϵqy±

ลองตรวจสอบบางกรณีที่กล่าวถึงในคำถาม: การแจกแจงแบบเอ็กซ์โปเนนเชียลและแกมม่า (เอ็กซ์โพเนนเชียลเป็นกรณีพิเศษของแกมม่า) เราไม่ต้องกังวลเกี่ยวกับพารามิเตอร์ของสเกลเพราะพวกเขาเพียงแค่เปลี่ยนหน่วยการวัด เฉพาะพารามิเตอร์ที่ไม่ใช่สเกลเท่านั้น

ที่นี่เนื่องจากสำหรับ , การขยายตัวของเทย์เลอร์รอบ ๆคือเทย์เลอร์ทฤษฎีบทที่เหลือหมายถึงถูกครอบงำโดยสำหรับธุรกิจขนาดเล็กพอ\เนื่องจากความคาดหวังของนั้นมี จำกัด ความไม่เท่าเทียมกันจึงมีไว้สำหรับการแจกแจงแกมมาp(x)=xkexk>1

q(y)=ey+kylogΓ(k+1).
y
Constant+(key)δey2δ2+.
R(log(x),δ)ey+δ/2<xδx

การคำนวณที่คล้ายกันบ่งบอกถึงความไม่เท่าเทียมกันในการกระจาย Weibull กระจายครึ่งปกติการแจกแจง Lognormal ฯลฯ ในความเป็นจริงจะได้รับการโต้แย้งเราจะต้องละเมิดอย่างน้อยหนึ่งสมมติฐานบังคับให้เรามองไปที่การกระจายที่หายไปในบางช่วงเวลาหรือ ไม่แตกต่างกันอย่างต่อเนื่องเป็นสองเท่าหรือมีหลายโหมดอย่างไม่ จำกัด การทดสอบเหล่านี้ง่ายต่อการใช้กับตระกูลการแจกแจงทั่วไปที่ใช้ในการสร้างแบบจำลองทางสถิติp

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.