ขอบเขตใน


21

ถ้าfเป็นฟังก์ชันนูนแล้วความไม่เท่าเทียมของ Jensen ระบุว่าf(E[x])E[f(x)]และโดยอนุโลมโดยอนุโลมเมื่อfเป็นเว้า เห็นได้ชัดว่าในกรณีที่เลวร้ายที่สุดคุณไม่สามารถ จำกัด ขอบเขตE[f(x)]ในรูปของf(E[x])สำหรับนูนfแต่มีขอบเขตที่ไปในทิศทางนี้ถ้าfนูน แต่ "ไม่นูนเกินไป" คือมีมาตรฐานบางผูกพันที่ให้เงื่อนไขในการฟังก์ชั่นนูนf (และอาจกระจายเช่นกันถ้าจำเป็น) ที่จะช่วยให้คุณสามารถที่จะสรุปว่าE[f(x)]φ(f)f(E[x])ที่φ(f)เป็นหน้าที่ของความโค้ง / ระดับของนูนบางf ? บางสิ่งบางอย่างคล้ายกับสภาพ Lipschitz บางที?


การลงคะแนนเพื่อปิดเป็นปิดหัวข้อ math.stackexchange.comอาจจะ?
Aryabhata

7
ฉันคิดว่าคำถามนี้ควรเปิดอยู่ นี่คือความไม่เท่าเทียมที่นักทฤษฎีการทำงานจำนวนมากจะพบว่ามีประโยชน์เป็นประจำ
Aaron Roth

10
ฉันรู้ว่ามันใกล้กับคณิตศาสตร์บริสุทธิ์มากกว่าคำถามส่วนใหญ่ที่โพสต์ไปแล้ว แต่ฉันจะเถียงว่านี่เป็นหัวข้อเนื่องจากสิ่งนี้เกิดขึ้นบ่อยครั้งในการวิเคราะห์อัลกอริทึมแบบสุ่ม (ซึ่งเป็นแอปพลิเคชันที่ฉันมี ใจ) ฉันคิดว่าคณิตศาสตร์ที่ใช้อย่างมากในสาขาวิทยาศาสตร์คอมพิวเตอร์ควรได้รับการพิจารณาให้เป็นเกมที่ยุติธรรมสำหรับคำถาม
เอียน

6
ออกเสียงลงคะแนนเพื่อให้เปิด แน่นอนในหัวข้อ
Suresh Venkat

1
ฉันยังออกเสียงลงคะแนนเพื่อให้เปิด
Jeff

คำตอบ:


21

แก้ไข: เวอร์ชันดั้งเดิมพลาดค่าสัมบูรณ์ เสียใจ !!

สวัสดีเอียน ฉันจะสรุปคร่าว ๆ ของสองตัวอย่างอย่างย่อหนึ่งโดยใช้ Lipschitz ที่ถูกผูกไว้อีกตัวหนึ่งใช้อนุพันธ์ที่สองจากนั้นพูดถึงปัญหาบางอย่างในปัญหานี้ แม้ว่าฉันจะซ้ำซ้อนเนื่องจากวิธีการใช้อนุพันธ์หนึ่งอธิบายว่าเกิดอะไรขึ้นกับตราสารอนุพันธ์เพิ่มเติม (ผ่านเทย์เลอร์) แต่ปรากฎว่ารุ่นอนุพันธ์อันดับสองค่อนข้างดี

ครั้งแรกกับ Lipschitz ผูกไว้: เพียงแค่ทำงานอสมการเซ่นมาตรฐานอีกครั้ง ใช้เล่ห์เหลี่ยมเดียวกัน: คำนวณการขยายตัวของเทย์เลอร์ด้วยค่าที่คาดหวัง

โดยเฉพาะ Let ได้สอดคล้องวัดμและชุด: = E ( x ) ถ้าfมีค่าคงที่ Lipschitz Lตามทฤษฎีบทของเทย์เลอร์Xμm:=E(x)fL

f(x)=f(m)+f(z)(xm)f(m)+L|xm|,

โดยที่ (โปรดทราบว่าx mและx > mเป็นไปได้) การใช้สิ่งนี้และพิสูจน์หลักฐานเซ่นอีกครั้ง (ฉันเป็นคนหวาดระแวงและตรวจสอบว่ามาตรฐานฉบับนั้นเป็นวิกิพีเดียจริง ๆ )z[m,x]xmx>m

E(f(X))=f(x)dμ(x)f(m)dμ(x)+L|xm|dμ(x)=f(E(X))+LE(|XE(X)|).

|f(x)|λ

f(x)=f(m)+f(m)(xm)+f(z)(xm)22f(m)+f(m)(xm)+λ(xm)22,

และอื่น ๆ

E(f(X))f(m)+f(m)(E(X)m)+λE((Xm)2)2=f(E(X))+λVar(X)2.

ฉันต้องการพูดถึงบางสิ่งสั้น ๆ ขออภัยถ้าเห็นได้ชัด

หนึ่งคือการที่คุณไม่สามารถเพียงแค่พูดว่า "WLOG " โดยขยับกระจายเพราะคุณจะมีการเปลี่ยนแปลงความสัมพันธ์ระหว่างและ\E(X)=0fμ

ถัดไปคือขอบเขตต้องขึ้นอยู่กับการแจกแจงในบางวิธี หากต้องการดูนี้คิดว่าและ 2 ไม่ว่าค่าของคุณยังคงได้รับ0 บนมืออื่น ๆ , 2 ดังนั้นโดยการเปลี่ยนคุณสามารถสร้างช่องว่างระหว่างปริมาณสองปริมาณโดยพลการ! โดยสัญชาตญาณจำนวนมากถูกผลักออกไปจากค่าเฉลี่ยและดังนั้นสำหรับการทำงานของนูนอย่างเข้มงวดจะเพิ่มขึ้นXGaussian(0,σ2)f(x)=x2σf(E(X))=f(0)=0E(f(X))=E(X2)=σ2σE(f(X))

ท้ายสุดฉันไม่เห็นวิธีรับขอบเขตทวีคูณเหมือนที่คุณแนะนำ ทุกอย่างที่ฉันใช้ในโพสต์นี้เป็นมาตรฐาน: ทฤษฎีบทของเทย์เลอร์และขอบเขตอนุพันธ์คือขนมปังและเนยในขอบเขตสถิติและพวกมันให้ข้อผิดพลาดเพิ่มเติมโดยอัตโนมัติไม่ใช่ข้อผิดพลาดคูณ

ฉันจะคิดถึงมันและโพสต์บางสิ่ง สัญชาตญาณที่คลุมเครือก็คือมันจะต้องมีเงื่อนไขที่ยอดเยี่ยมทั้งในเรื่องของฟังก์ชั่นและการแจกแจงและการเติมสารเติมแต่งนั้นเป็นหัวใจสำคัญของมัน


ทุกครั้งที่ฉันแก้ไขคำตอบจะถูกกระแทก ดังนั้นฉันจะชี้ให้เห็น: ขอบเขตอนุพันธ์อันดับสองนั้นแน่นสำหรับตัวอย่างที่ฉันให้
matus

ฉันคิดว่าคุณถูกต้องในขอบเขตของสารเติมแต่งนั้นเป็นไปได้ที่ดีที่สุดโดยไม่มีเงื่อนไขที่แข็งแกร่งในฟังก์ชั่น
เอียน

ถึงเอียนฉันคิดเกี่ยวกับปัญหานี้อีกเล็กน้อย แต่ปัญหาหลักในใจของฉันถูกบอกใบ้โดยตัวอย่างที่ฉันให้โดยที่แต่0 คุณสามารถ จำกัด ทั้งฟังก์ชันตระกูล (ขอบเขต, อนุพันธ์ขอบเขต, รวมได้) และการแจกแจง (ราบรื่น, จำกัด ขอบเขต, Momemts จำกัด ) และคุณยังมีตัวอย่างเหล่านี้ มันพอเพียงที่จะมีฟังก์ชันสมมาตรไม่ใช่เชิงลบเท่ากับศูนย์ที่ค่าเฉลี่ยของการแจกแจง ที่กล่าวว่าทุกอย่างขึ้นอยู่กับข้อ จำกัด ในปัญหาที่แน่นอนของคุณ ในกรณีทั่วไปฉันคิดว่าธรรมชาติของสารเติมแต่งเป็นพื้นฐาน f(E(X))=0E(f(X))>0
matus

@Ian: หลักฐานของความไม่เท่าเทียมเชิง Chernoff และ Azuma-Hoeffding ใช้การโต้เถียงเพื่อเตือนความทรงจำของเรื่องนี้ดังนั้นคุณอาจต้องการที่จะอ่านแรงบันดาลใจ ดูเช่นหนังสือของ Mitzenmacher และ Upfal เกี่ยวกับการสุ่มในการคำนวณ
Warren Schudy

3

สำหรับข้อมูลเชิงลึกให้พิจารณาการกระจายที่เน้นสองค่า พูดด้วยความน่าจะเป็นเท่ากับ 1/2 ว่ามันเท่ากับ 1 หรือ 3 ดังนั้น 2 ใช้และ0 พิจารณาฟังก์ชั่นซึ่งและ\ โดยการทำให้มีขนาดเล็กเพียงพอและเชื่อมต่ออย่างต่อเนื่องระหว่างจุดสามจุดนี้เราสามารถทำให้ความโค้งของขนาดเล็กตามที่ต้องการ แล้วก็E[x]=2N>>0ϵ>0ff(1)=f(3)=Nϵf(E[x])=f(2)=ϵϵff

E[f(x)]=Nϵยัง

N=Nϵ/ϵ=E[f(x)]/f(E[x])φ(f)(ฉ)

สิ่งนี้แสดงต้องมีขนาดใหญ่โดยพลการφ(f)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.