การทำความเข้าใจหลักฐานของบทแทรกที่ใช้ในความไม่เท่าเทียม Hoeffding


11

ฉันกำลังศึกษาบันทึกการบรรยายของ Larry Wasserman เกี่ยวกับสถิติที่ใช้ Casella และ Berger เป็นข้อความหลัก ฉันกำลังทำงานผ่านบันทึกการบรรยายของเขาชุดที่ 2และติดอยู่ในการได้มาของบทแทรกที่ใช้ในความไม่เท่าเทียมกันของ Hoeffding (pp.2-3) ฉันกำลังทำซ้ำการพิสูจน์ในหมายเหตุด้านล่างและหลังจากการพิสูจน์ฉันจะชี้ให้เห็นว่าฉันติดอยู่ที่ไหน


บทแทรก

สมมติว่าและเป็น \ le X \ le ข แล้ว \ mathbb {E} (จ ^ {tX}) \ le E ^ {t ^ 2 (BA) ^ 2/8}X E ( อีทีเอ็กซ์ ) อีที2 ( - ) 2 / 8E(X)=0aXbE(etX)et2(ba)2/8

พิสูจน์

ตั้งแต่aXbเราสามารถเขียนXเป็นรวมกันนูนและคือ X = \ alpha B + (1 - \ alpha บริการ)ที่\ alpha = \ frac {Xa} {} โดยการนูนของฟังก์ชันy \ to e ^ {ty}เรามีabX=αb+(1α)aα=Xabayety

etXαetb+(1α)eta=Xabaetb+bXbaeta

รับความคาดหวังของทั้งสองฝ่ายและใช้ข้อเท็จจริงE(X)=0เพื่อรับ

E(etX)abaetb+bbaeta=eg(u)

ที่u=t(ba) , g(u)=γu+log(1γ+γeu)และγ=a/(ba)(BA) โปรดทราบว่าg(0)=g(0)=00 นอกจากนี้ยังg(u)1/4สำหรับทุกu>00

ตามทฤษฎีบทของเทย์เลอร์มีε(0,u)เช่นนั้น g(u)=g(0)+ug(0)+u22g(ε)=u22g(ε)u28=t2(ba)28

ดังนั้นE(etX)eg(u)et2(ba)28{8}}


ฉันสามารถทำตามหลักฐานจนกระทั่ง

U,กรัม(U),γE(etX)abaetb+bbaeta=eg(u) แต่ฉันไม่สามารถที่จะคิดออกว่าจะได้รับ\u,g(u),γ


3
เป็นที่น่าสนใจว่าค่าสูงสุดของคือและทำให้ผลลัพธ์นั้นมีประสิทธิภาพซึ่งดูเหมือนจะคุ้นเคยเกินกว่าที่จะเกิดขึ้นจากความบังเอิญที่แท้จริง ฉันสงสัยว่าอาจมีวิธีอื่นที่อาจเป็นไปได้ง่ายขึ้นในการหาผลลัพธ์ผ่านการโต้แย้งที่น่าจะเป็น σ 2 สูงสุด = ( - ) 2 / 4 E [ อีทีX ] อีσ 2 สูงสุดที2 / 2var(X)σmax2=(ba)2/4
E[etX]eσmax2t2/2
Dilip Sarwate

เข้าใจ @DilipSarwate ของฉันอยู่ที่ความแปรปรวนที่เกิดขึ้นสูงสุดสำหรับตัวแปรสุ่มเครื่องแบบB) ความแปรปรวนของคือ{12} คุณช่วยอธิบายได้ว่าคุณได้รับอย่างไร? X V a r ( X ) = ( b - a ) 2XU(a,b)X (b-a)2Var(X)=(ba)212(ba)24
อานันท์

โดยมุ่งเน้นมวลบนจุดสิ้นสุด ...
เอลวิส

@DilipSarwate ฉันได้เพิ่มความคิดเห็นบางส่วนในการพิสูจน์ที่อาจชี้แจงบิต liitle ทำไมกรณีที่เลวร้ายที่สุดคือความแปรปรวนสูงสุด
Elvis

1
@DilipSarwate - ดูบทแทรก 1 และการออกกำลังกาย 1 ที่นี่: terrytao.wordpress.com/2010/01/03/... ดูเหมือนว่ามันมีต้นกำเนิดที่ง่ายกว่าโดยอาศัยความไม่เท่าเทียมของเซ่นและการขยายตัวของเทย์เลอร์ แต่รายละเอียดของสิ่งนี้ยังไม่ชัดเจนสำหรับฉัน บางทีบางคนก็สามารถเข้าใจได้ (ได้รับจาก (9) ถึง (10) และการออกกำลังกาย 1)
Leo

คำตอบ:


17

ฉันไม่แน่ใจว่าฉันเข้าใจคำถามของคุณถูกต้องหรือไม่ ฉันจะพยายามตอบ: ลองเขียนเป็นฟังก์ชันของ : นี่ เป็นไปตามธรรมชาติตามที่คุณต้องการที่ถูกผูกไว้ใน8}u=t(b-a)e u 2

abaetb+bbaeta
u=t(ba)eu28

ช่วยด้วยประสบการณ์ที่คุณจะรู้ว่ามันจะดีกว่าที่จะเลือกที่จะเขียนมันในรูปแบบ(U)} จากนั้น นำไปสู่ กับกว่าปริญญาตรี} e g ( u ) = - aeg(u)กรัม( U )

eg(u)=abaetb+bbaeta
γ=- a
g(u)=log(abaetb+bbaeta)=log(eta(abaet(ba)+bba))=ta+log(γeu+(1γ))=γu+log(γeu+(1γ)),
γ=aba

นั่นเป็นสิ่งที่คุณขอหรือไม่?

แก้ไข: ความคิดเห็นเล็กน้อยเกี่ยวกับหลักฐาน

  1. เคล็ดลับแรกที่ควรได้รับการพิจารณาอย่างรอบคอบ: ถ้าเป็นฟังก์ชันนูนและเป็นตัวแปรสุ่มกึ่งกลางแล้ว ที่เป็นตัวแปรที่ไม่ต่อเนื่องที่กำหนดโดย ดังนั้นคุณจะได้คือ ตัวแปรกึ่งกลางที่มีการสนับสนุนในซึ่งมีความแปรปรวนสูงสุด: โปรดทราบว่าหากเราแก้ไขความกว้างการสนับสนุนa X b E ( ϕ ( X ) ) - aϕaXbX0P(X0=a)
    E(ϕ(X))abaϕ(b)+bbaϕ(a)=E(ϕ(X0)),
    X0X0[a,b]Var(X)=E(X2)E(X20)=ba2-ab2
    P(X0=a)=bbaP(X0=b)=aba.
    X0[a,b](b-a)(b-a)2
    Var(X)=E(X2)E(X02)=ba2ab2ba=ab.
    (ba)นี่คือน้อยกว่าดังที่ Dilip กล่าวไว้ในความคิดเห็นซึ่งเป็นเพราะ ; ถูกผูกไว้จะบรรลุสำหรับA(ba)24(ba)2+4ab0a=b
  2. ตอนนี้หันไปหาปัญหาของเรา ทำไมจึงเป็นไปได้ที่จะได้รับขอบเขตขึ้นอยู่กับ ? โดยสังหรณ์ใจมันเป็นเพียงเรื่องของการลดขนาดของ : ถ้าคุณมีขอบเขตสำหรับกรณีดังนั้นขอบเขตทั่วไป สามารถหาได้โดยการซัก(BA)) ทีนี้ลองนึกถึงชุดของตัวแปรที่อยู่ตรงกลางด้วยการสนับสนุนความกว้าง 1: ไม่มีอิสระมากนักดังนั้นขอบเขตเช่นจึงควรมีอยู่ อีกวิธีคือพูดง่ายๆว่าโดยบทแทรกเหนือจากนั้นโดยทั่วไปซึ่งขึ้นอยู่กับและu=t(ba)XE(etX)s(t)ba=1s(t(ba))s(t)

    E(ϕ(X))E(ϕ(tX))E(ϕ(tX0))uγ : หากคุณแก้ไขและและปล่อยให้แตกต่างกันมีเพียงหนึ่งระดับอิสระ และ , ,a_0 เราได้รับ คุณเพียงแค่ต้องไปหาผูกพันที่เกี่ยวข้องกับเฉพาะยูu=u0=t0(b0a0)γ=γ0=a0b0a0t,a,bt=t0αa=αa0b=αa0

    abaϕ(tb)+bbaϕ(ta)=a0b0a0ϕ(tb0)+b0b0a0ϕ(a0).
    u
  3. ตอนนี้เรามั่นใจแล้วว่าสามารถทำได้มันต้องง่ายกว่านี้มาก! คุณไม่จำเป็นต้องคิดว่าจะจะเริ่มต้นด้วย ประเด็นก็คือว่าคุณต้องเขียนทุกอย่างเป็นหน้าที่ของและ\ โน้ตตัวแรกที่ , ,และ U จากนั้น ตอนนี้เราอยู่ในกรณีเฉพาะ ... ฉัน คิดว่าคุณสามารถเสร็จสิ้นguγ

    γ=aba1γ=bbaat=γubt=(1γ)u

    E(ϕ(tX))abaϕ(tb)+bbaϕ(ta)=γϕ((1γ)u)+(1γ)ϕ(γu)


    ϕ=exp

ฉันหวังว่าฉันจะอธิบายให้ชัดเจนขึ้นเล็กน้อย


นั่นคือสิ่งที่ฉันกำลังมองหา ขอบคุณมาก.
อานันท์

1
@ และฉันรู้ว่ามันเป็นเรื่องยากที่จะทำตามคำแนะนำอย่างไรก็ตามฉันคิดว่าคุณไม่ควรเริ่มต้นด้วยการให้ความสำคัญกับรายละเอียดทางเทคนิค แต่พยายามที่จะเข้าใจว่าทำไมขอบเขตดังกล่าวจึงมีอยู่ ... ฉันพยายามแสดงให้คุณเห็นว่าทำไมในส่วนที่สองเพิ่มเมื่อเช้านี้ (คุณต้องนอนกับคำถามเช่นนี้ - อย่างน้อยฉันก็ต้อง) ฉันคิดว่ามันน่ากลัวว่าสัญชาติญาณประเภทนี้จะไม่ปรากฏในหนังสือเรียนส่วนใหญ่ ... แม้ว่าคุณจะได้รับส่วนทางเทคนิคตราบใดที่คุณไม่มีความคิดทุกอย่างก็ดูน่าอัศจรรย์ ขอบคุณและ CrossV ที่ให้โอกาสฉันคิดในรายละเอียด!
Elvis

1
ว้าว! +1 สำหรับการแก้ไข ขอบคุณ แต่มันจะไม่ดีถ้ามันเป็นไปได้ที่จะได้อะไรแบบ
E[etX]eE[t2X2/2]=e(t2/2)E[X2]=e(t2/2)var(X)et2σmax2/2?
Dilip Sarwate

@Elvis ขอบคุณสำหรับคำแนะนำและสละเวลาในการเขียนส่วนที่ใช้งานง่าย ฉันต้องใช้เวลาพอสมควรในการทำความเข้าใจสิ่งนี้!
อานันท์

1
@ เอลวิสเกี่ยวกับปรีชาญาณฉันต้องการชี้แจงความเข้าใจของฉัน เพื่อให้ได้ขอบเขตที่คมชัดยิ่งขึ้นเราต้องการเวลาที่สูงขึ้น มาร์คอฟใช้ช่วงเวลาแรก Chebyshev วินาทีที่สองและ Hoeffding ใช้ mgf ถูกต้องหรือไม่ หากใครบางคนสามารถขยายและชี้แจงส่วนนี้มันจะดี
อานันท์
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.