ความแปรปรวนของค่าสูงสุดของกลุ่มตัวอย่างคืออะไร?


13

ฉันกำลังหาขอบเขตของความแปรปรวนของตัวแปรสุ่มสูงสุดชุด กล่าวอีกนัยหนึ่งฉันกำลังมองหาสูตรปิดสำหรับเช่นนั้น ที่X = \ {X_1, \ ldots, X_M \}ได้รับการแก้ไข ชุดของMตัวแปรสุ่มด้วยวิธีการ จำกัด\ mu_1 \ ldots \ mu_Mและแปรปรวน\ sigma_1 ^ 2 \ ldots \ sigma_M ^ 2B

Var(maxiXi)B,
X={X1,,XM}Mμ1,,μMσ12,,σM2

ฉันสามารถสรุปได้ว่า

Var(maxiXi)iσi2,
แต่ขอบเขตนี้ดูเหมือนจะหลวมมาก การทดสอบเชิงตัวเลขดูเหมือนจะบ่งบอกว่าB=maxiσi2อาจเป็นไปได้ แต่ฉันไม่สามารถพิสูจน์ได้ ความช่วยเหลือใด ๆ ที่ชื่นชม

3
(คุณต้องการถือว่าXiมีความเป็นอิสระหรือไม่) การคาดคะเนมีความน่าเชื่อถือ แต่ดูเหมือนจะเป็นเท็จ ยกตัวอย่างเช่นการทดลองทำบางอย่างที่Xiจะ IID กับ CDF 1x1s , 1x , s>33 ความแปรปรวนของค่าสูงสุดเมื่อเทียบกับความแปรปรวนทั่วไปจะเพิ่มขึ้นโดยไม่มีข้อผูกมัดเมื่อMเติบโตขึ้น
whuber

@whuber ขอบคุณที่อธิบายว่าทำไมฉันจึงไม่สามารถพิสูจน์การคาดเดาได้ :) ฉันสนใจในกรณีที่Xiมีความเป็นอิสระ เพื่อชี้แจงฉันส่วนใหญ่สนใจในขอบเขตทั่วไปที่ใช้เพียงสองช่วงเวลาแรก ฉันไม่แน่ใจว่าขอบเขตทั่วไปที่คมชัดกว่านั้นมีอยู่มากกว่าความแปรปรวนทั่วไปหรือไม่
ปีเตอร์

1
ฉันควรชี้ให้เห็นว่าผลรวมของคุณ (สมมติว่ามันถูกต้อง - มันจะดีถ้าได้เห็นภาพสเก็ตช์ของหลักฐาน) แน่น ตัวอย่างเช่นสมมติได้รับการสนับสนุนในช่วงด้วยผลต่างไม่เกินและให้รับการสนับสนุนบนinfty] จากนั้นเมื่อ, พร้อมกับความแปรปรวน , แต่ความไม่เท่าเทียมกันสามารถทำให้แน่นได้มากเท่าที่คุณต้องการโดยการลดขนาด . X2,,XM[,a]ε2X1[a,]maxiXi=X1σ12σ12+(M1)ε2ε2
whuber

1
สำหรับข้อมูล iid ทฤษฎีค่าสุดขีดให้คลาสของการแจกแจงที่กลุ่มตัวอย่างมาบรรจบกันมากที่สุดโดยมีเงื่อนไขบางอย่างที่หางของการแจกแจงดั้งเดิมให้คลาสที่แตกต่างกันของการแจกแจงแบบซีมโทติค ดังนั้นฉันสงสัยว่าคุณจะสามารถได้รับขอบเขตที่ดีตามสองช่วงเวลาเท่านั้นแม้ว่าฉันจะคุ้นเคยกับทฤษฎีสัมผัส
StasK

คำตอบ:


9

สำหรับการใด ๆตัวแปรสุ่มที่ดีที่สุดที่ถูกผูกไว้ทั่วไปคือ ตามที่ระบุไว้ในคำถามเดิม นี่คือร่างหลักฐาน: ถ้า X, Y มี IID แล้ว(X) เมื่อพิจารณาถึงเวกเตอร์ของตัวแปรที่ขึ้นอยู่กับให้เป็นเวกเตอร์อิสระที่มีการแจกแจงร่วมเดียวกัน สำหรับเรามีการรวมกันว่าและการรวมนี้จากถึงให้ผลตอบแทนที่ไม่เท่ากันnXiVar(maxXi)iVar(Xi)E[(XY)2]=2Var(X)(X1,,Xn)(Y1,,Yn)r>0P[|maxiXimaxiYi|2>r]iP[|XiYi|2>r]dr0

ถ้ามี IID ตัวชี้วัดของเหตุการณ์ที่เกิดขึ้นน่าจะเป็นแล้วเป็นตัวบ่งชี้ของเหตุการณ์ของความน่าจะ2) แก้ไขและให้มีแนวโน้มที่จะเป็นศูนย์ที่เราได้รับและ2)XiϵmaxXinϵ+O(n2ϵ2)nϵVar(Xi)=ϵϵ2Var(maxiXi)=nϵ+O(n2ϵ2)


3

คำถามเกี่ยวกับ MathOverflow เกี่ยวข้องกับคำถามนี้

สำหรับตัวแปรสุ่ม IID ที่ TH สูงสุดที่เรียกว่าสถิติการสั่งซื้อk

แม้แต่สำหรับตัวแปรสุ่มของ IID Bernoulli ความแปรปรวนของสถิติการเรียงลำดับใด ๆ ที่นอกเหนือจากค่ามัธยฐานอาจมากกว่าความแปรปรวนของประชากร ตัวอย่างเช่นถ้าคือกับความน่าจะและมีโอกาสและแล้วสูงสุดคือกับความน่าจะเป็นเพื่อให้ความแปรปรวนของประชากรเป็นในขณะที่แปรปรวน สูงสุดอยู่ที่ประมาณ0.23Xi11/1009/10M=10111/e0.090.23

นี่คือเอกสารสองฉบับเกี่ยวกับความแปรปรวนของสถิติการสั่งซื้อ:

Yang, H. (1982) "จากความแปรปรวนของค่ามัธยฐานและสถิติการสั่งซื้ออื่น ๆ " วัว. Inst คณิตศาสตร์. Acad Sinica, 10 (2) pp. 197-204

Papadatos, N. (1995) "ความแปรปรวนสูงสุดของสถิติการสั่งซื้อ" แอน Inst statist คณิตศาสตร์, 47 (1) pp. 185-193

ผมเชื่อว่าขอบเขตบนแปรปรวนสูงสุดในกระดาษที่สองคือ 2 พวกเขาชี้ให้เห็นว่าความเท่าเทียมไม่สามารถเกิดขึ้นได้ แต่ค่าที่ต่ำกว่าสามารถเกิดขึ้นได้สำหรับตัวแปรสุ่มของ IID BernoulliMσ2

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.