จำนวนครั้งที่คาดว่าค่าเฉลี่ยเชิงประจักษ์จะเกินค่า


11

เมื่อพิจารณาลำดับของตัวแปรสุ่มของ iid ให้พูดว่าสำหรับฉันกำลังพยายามที่จะคาดเดาจำนวนครั้งที่ค่าเฉลี่ยเชิงประจักษ์จะเกินค่า, , ในขณะที่เรายังคงดึงตัวอย่างนั่นคือ: ฉัน= 1 , 2 , . . , n 1Xi[0,1]i=1,2,...,nc0T d e f = n j=1P({ 11ni=1nXic0

T=defj=1nP({1ji=1jXic})

หากเราสมมติว่าสำหรับบางอย่างเราสามารถใช้ความไม่เท่าเทียมกันของ Hoeffding ในการมาถึงa > 0c=a+E[X]a>0

Tj=1ne2ja2=1e2a2ne2a21

ข้อใดดูดี (อาจ) แต่จริง ๆ แล้วค่อนข้างจะหลวมมีวิธีใดที่ดีกว่าในการ จำกัด ค่านี้หรือไม่? ฉันคาดหวังว่าอาจจะมีวิธีหนึ่งเนื่องจากเหตุการณ์ที่แตกต่างกัน (สำหรับแต่ละ ) นั้นไม่ชัดเจนอย่างอิสระฉันไม่ได้ตระหนักถึงวิธีการใช้ประโยชน์จากการพึ่งพาอาศัยกันนี้ นอกจากนี้ยังเป็นการดีที่จะลบข้อ จำกัด ที่มากกว่าค่าเฉลี่ยcjc

แก้ไข : ข้อ จำกัด ในการเกินกว่าค่าเฉลี่ยสามารถลบออกได้ถ้าเราใช้ความไม่เท่าเทียมกันของมาร์คอฟดังนี้:c

TcE[X]

Tj=1n1jE[X]c=E[X]Hnc
ซึ่งเป็นแบบทั่วไป แต่แย่กว่าขอบเขตที่กล่าวถึงข้างต้นแม้ว่าจะชัดเจนว่าจะต้องแยกออกจากกันเมื่อใดก็ตามที่[X]TcE[X]

คำจำกัดความของคุณไม่ได้หลอกลวงด้วยคำอธิบายของคุณ ถ้า " " ถูกถอดออกมามันจะเป็นที่คาดว่าจำนวนของ exceedances ของแต่ตามที่เขียนไว้ว่ามันคือการรวมกันเชิงเส้นของเวลา มันไม่ได้คาดหวังอย่างชัดแจ้งเพราะความน่าจะเป็นไม่ได้เกิดร่วมกัน ตัวอย่างเช่นเมื่อ , 2 Tj×cc0T=n(n+1)/2
whuber

@ โฮ่โอ้ใช่แล้วจุดดีขอบคุณฉันแก้ไขมันไว้แล้ว
fairidox

ฉันสังเกตเห็นคุณเปลี่ยนขอบเขตบนของคุณ ดูเหมือนว่าจะเป็นลบ ;-)
whuber

ไม่ควรใช้ " " ในเลขชี้กำลังยกกำลังสอง? - ตกลงได้ง่ายขึ้นด้วยโดเมน [0,1]j
Alecos Papadopoulos

คำตอบ:


1

นี่เป็นวิธีที่ทำขึ้นด้วยมือและฉันขอขอบคุณสำหรับความคิดเห็นบางส่วน (และผู้วิจารณ์มักจะเป็นประโยชน์ที่สุด) หากฉันเข้าใจอย่างถูกต้อง OP จะคำนวณตัวอย่างหมายถึงโดยที่แต่ละตัวอย่างมีการสังเกต +1 ตัวอย่างก่อนหน้าจาก rv ใหม่แสดงว่าการกระจายของแต่ละค่าเฉลี่ยตัวอย่าง จากนั้นเราสามารถเขียน x¯jFj

T=defj=1n(1Fj(c))=nj=1nFj(c)

พิจารณาขนาดของกลุ่มตัวอย่างหลังจากที่การกระจายของค่าเฉลี่ยของกลุ่มตัวอย่างเป็นปกติเกือบแสดงมันG จากนั้นเราสามารถเขียนmG^

T=nj=1mFj(c)j=m+1nG^j(c)<nj=m+1nG^j(c)

การแก้เราได้รับ โดยที่เป็นมาตรฐานปกติ cdf,คือค่าเบี่ยงเบนมาตรฐานของกระบวนการ iid และคือค่าเฉลี่ย ใส่เข้าไปในขอบเขตและจัดเรียงใหม่ที่เราได้รับG^j(c)

G^j(c)=1Φ(jσ(μc))
Φσμ

T<m+j=m+1nΦ(jσ(a))

โปรดทราบว่าขอบเขตนี้ขึ้นอยู่กับความแปรปรวนของกระบวนการด้วย นี่เป็นข้อผูกมัดที่ดีกว่าคำถามที่นำเสนอในคำถามหรือไม่ สิ่งนี้จะขึ้นอยู่กับการกระจายตัวของค่าเฉลี่ยตัวอย่างอย่างรวดเร็วว่า "ปกติ" จะกลายเป็น "เกือบปกติ" เพื่อให้เป็นตัวอย่างตัวเลขสมมติว่า 30 สมมติว่าตัวแปรสุ่มในเครื่องแบบ[0,1]แล้วและ12 พิจารณาค่าเบี่ยงเบน 10% จากค่าเฉลี่ยคือตั้งAแล้ว: สำหรับขอบเขตที่ฉันเสนอ (ซึ่งมีความหมายสำหรับ ) จะแน่นขึ้น สำหรับขอบเขต Hoeffding คือm=30[0,1]σ=112 a=0.05n=34n>30n=10078.536.2199.538.5aa=0.149.530.5nμ=12a=0.05n=34n>30n=10078.5ในขณะที่ถูกผูกไว้ผมเสนอเป็น36.2Hoeffding ผูกพันลู่ไปขณะที่ผูกผมเสนอให้ถ้าคุณเพิ่มความแตกต่างระหว่างสองขอบเขตลด แต่ยังคงมองเห็น: เพื่อการเบี่ยงเบน 20%,ที่ Hoeffding ผูกพันลู่ไปในขณะที่ ฉันขอเสนอข้อผูกมัดกับ (เช่นผลรวมของ cdfs ปกติมีส่วนน้อยมากกับขอบเขตโดยรวม) โดยทั่วไปค่อนข้างมากเราทราบว่าสำหรับ Hoeffding มุ่งไปที่36.2199.538.5aa=0.149.530.5
n

Abm

Hb1e2a21
ในขณะที่ฉันถูกผูกไว้กับ
Abm

เนื่องจากค่าขนาดเล็กของ (ซึ่งค่อนข้างเป็นกรณีที่น่าสนใจ)กลายเป็นจำนวนมากยังคงมีกรณีที่อาจมีประสิทธิภาพสูงกว่าในความหนาแน่นแม้ว่าตัวอย่างเป็นเช่นนั้นการกระจายตัวของตัวอย่างเฉลี่ยหมายถึงช้า การแจกแจงแบบปกติH b A baHbAb


" (กล่าวคือไม่เกินขีด จำกัด ขนาดตัวอย่างที่สมมติว่าต้องการเพื่อให้การประมาณปกติในการกระจายตัวของค่าเฉลี่ยตัวอย่าง) " คุณกำลังพูดถึงอะไรที่นี่?
Glen_b -Reinstate Monica

30.5m+0.5j=m+1nΦ(jσ(a))

จนกว่าคุณจะสามารถระบุภายใต้สถานการณ์ที่มันถือโปรดหลีกเลี่ยงการเรียกร้องสิ่งที่กฎของหัวแม่มือในความหมายทั่วไป รูปที่ 30 มีความอิสระอย่างสมบูรณ์ (โดยปกติแล้วจะอ่อนแอหรือแข็งแรงเกินไป) และ 30 ในกรณีของคุณก็คือผมเชื่อว่าความบังเอิญง่าย ๆ
Glen_b -Reinstate Monica

1
@Glen_b "30" ไม่ได้เป็นเรื่องบังเอิญ - ฉันเพิ่งใช้มันเพื่อเป็นตัวอย่างของตัวเลข ฉันไม่คัดค้านเรื่องนี้ฉันไม่ชอบ "กฎของหัวแม่มือ" (โดยเฉพาะอย่างยิ่งเมื่อพวกเขาสงสัย) ฉันได้ทำการเปลี่ยนแปลงบางอย่างในคำตอบของฉัน ขอบคุณสำหรับการป้อนข้อมูล
Alecos Papadopoulos

@Glen_b ขอบคุณสำหรับความทรงจำที่ไม่คงที่ (เช่นยาว)!
Alecos Papadopoulos
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.