ความคาดหวังของตัวแปร iid Gumbel สูงสุด


12

ฉันอ่านวารสารเศรษฐศาสตร์อย่างต่อเนื่องเกี่ยวกับผลลัพธ์เฉพาะที่ใช้ในแบบจำลองยูทิลิตี้แบบสุ่ม ผลลัพธ์หนึ่งเวอร์ชันคือ: ถ้าϵiiid, Gumbel ( μ,1),iจากนั้น:

E[maxi(δi+ϵi)]=μ+γ+ln(iexp{δi}),

โดยที่คือค่าคงที่ออยเลอร์ - มาเชโรนี่ ฉันได้ตรวจสอบแล้วว่าสิ่งนี้สมเหตุสมผลโดยใช้ R และมันก็ใช้ได้ CDF สำหรับการกระจายGumbelคือ:γ0.52277(μ,1)

G(ϵi)=exp(exp((ϵiμ)))

ฉันพยายามหาข้อพิสูจน์เรื่องนี้และฉันก็ไม่ประสบความสำเร็จ ฉันพยายามพิสูจน์ด้วยตัวเอง แต่ไม่สามารถผ่านขั้นตอนใดไปได้

ใครสามารถชี้ให้ฉันเห็นหลักฐานนี้ ถ้าไม่ฉันอาจโพสต์ข้อความพิสูจน์ความพยายามจนถึงจุดที่ฉันติดอยู่


ที่เกี่ยวข้อง: stats.stackexchange.com/questions/57506/…
เอเดรีย

คำตอบ:


7

ฉันขอขอบคุณงานที่แสดงในคำตอบของคุณ: ขอบคุณสำหรับการสนับสนุนนั้น จุดประสงค์ของโพสต์นี้คือเพื่อให้การสาธิตง่ายขึ้น คุณค่าของความเรียบง่ายคือการเปิดเผย: เราสามารถได้รับการแจกแจงสูงสุดทั้งหมดไม่ใช่แค่การคาดหวัง


ไม่สนใจโดยดูดซับเข้าไปในและสมมติว่าทั้งหมดมีการกระจายGumbel(นั่นคือแทนที่แต่ละโดยและเปลี่ยนเป็น .) สิ่งนี้ไม่เปลี่ยนตัวแปรสุ่มμδiϵi(0,1)ϵiϵiμδiδi+μ

X=maxi(δi+ϵi)=maxi((δi+μ)+(ϵiμ)).

ความเป็นอิสระของนัยสำหรับจริงทั้งหมดที่เป็นผลิตภัณฑ์ของโอกาสบุคคลx) การบันทึกและการใช้คุณสมบัติพื้นฐานของเอ็กซ์โพเนนเชียลϵixPr(Xx)Pr(δi+ϵix)

logPr(Xx)=logiPr(δi+ϵix)=ilogPr(ϵixδi)=ieδiex=exp(x+logieδi).

นี่คือลอการิทึมของ CDF ของการกระจาย Gumbel พร้อมพารามิเตอร์ตำแหน่ง นั่นคือ,λ=logieδi.

Xมี Gumbelการกระจาย(logieδi,1)

นี่เป็นข้อมูลที่มากกว่าที่ร้องขอ เฉลี่ยดังกล่าวกระจายเป็น entailingγ+λ,

E[X]=γ+logieδi,

QED


12

แต่กลับกลายเป็นว่าโคโนบทความโดยเคนเน ธ ขนาดเล็กและฮาร์วีย์ Rosenแสดงให้เห็นว่าในปี 1981 นี้ แต่ในบริบทของความเชี่ยวชาญมากเพื่อผลที่ต้องใช้จำนวนมากของการขุดไม่พูดถึงการฝึกอบรมในสาขาเศรษฐศาสตร์ ฉันตัดสินใจที่จะพิสูจน์ในวิธีที่ฉันสามารถเข้าถึงได้มากขึ้น

พิสูจน์ : ให้เป็นจำนวนทางเลือก ขึ้นอยู่กับค่าของ vector , ฟังก์ชันใช้ค่าต่างกัน ครั้งแรกที่มุ่งเน้นไปที่ค่าของเช่นว่า\ นั่นคือเราจะรวมกับชุด :Jϵ={ϵ1,...,ϵJ}maxi(δi+ϵi)ϵmaxi(δi+ϵi)=δ1+ϵ1δ1+ϵ1M1{ϵ:δ1+ϵ1>δj+ϵj,j1}

EϵM1[maxi(δi+ϵi)]=(δ1+ϵ1)f(ϵ1)[δ1+ϵ1δ2...δ1+ϵ1δJf(ϵ2)...f(ϵJ)dϵ2...dϵJ]dϵ1=(δ1+ϵ1)f(ϵ1)(δ1+ϵ1δ2f(ϵ2)dϵ2)...(δ1+ϵ1δJf(ϵJ)dϵJ)dϵ1=(δ1+ϵ1)f(ϵ1)F(δ1+ϵ1δ2)...F(δ1+ϵ1δJ)dϵ1

ระยะดังกล่าวข้างต้นเป็นครั้งแรกของข้อตกลงดังกล่าวในขวา)] โดยเฉพาะอย่างยิ่งJE[maxi(δi+ϵi)]

E[maxi(δi+ϵi)]=iEϵMi[maxi(δi+ϵi)].

ตอนนี้เราใช้รูปแบบการทำงานของการกระจาย Gumbel สิ่งนี้จะช่วยให้

EϵMi[maxi(δi+ϵi)]=(δi+ϵi)eμϵieeμϵijieeμϵi+δjδidϵi=(δi+ϵi)eμϵijeeμϵi+δjδidϵi=(δi+ϵi)eμϵiexp{jeμϵi+δjδi}dϵi=(δi+ϵi)eμϵiexp{eμϵijeδjδi}dϵi

ที่ขั้นตอนที่สองมาจากการจัดเก็บภาษีหนึ่งในแง่ exponentiated ลงสินค้าพร้อมกับความจริงที่ว่าถ้าJδjδi=0i=j

ตอนนี้เรากำหนดและทำการแทนดังนั้นและขวา) โปรดสังเกตว่าเมื่อเข้าใกล้อนันต์,เข้าใกล้ 0 และขณะที่เข้าใกล้อนันต์ลบ,เข้าใกล้อนันต์ Dijeδjδix=Dieμϵidx=DieμϵidϵidxDi=eμϵidϵiϵi=μlog(xDi)ϵixϵix

EϵMi[maxi(δi+ϵi)]=0(δi+μlog[xDi])(1Di)exp{x}dx=1Di0(δi+μlog[xDi])exdx=δi+μDi0exdx1Di0log[x]exdx+log[Di]Di0exdx

ฟังก์ชันแกมมาถูกกำหนดให้เป็น1} สำหรับค่าของซึ่งเป็นจำนวนเต็มบวกนี่เท่ากับดังนั้น1 นอกจากนี้ยังเป็นที่รู้จักกันว่าออยเลอร์-Mascheroni คงที่น่าพอใจΓ(t)=0xt1exdxtΓ(t)=(t1)!Γ(1)=0!=1γ0.57722

γ=0log[x]exdx.

ใช้ข้อเท็จจริงเหล่านี้ให้

EϵMi[maxi(δi+ϵi)]=δi+μ+γ+log[Di]Di

แล้วเรารวมกว่าจะได้รับi

E[maxi(δi+ϵi)]=iδi+μ+γ+log[Di]Di

จำได้ว่าdelta_i}} สังเกตว่าน่าจะเป็นทางเลือกที่คุ้นเคย logitมีแปรผกผันของ 's หรือในคำอื่น ๆ1 นอกจากนี้ทราบว่า1 ถ้าอย่างนั้นเราก็มีDi=jeδjδi=jeδjeδiPi=eδijδjDiPi=1/DiiPi=1

E[maxi(δi+ϵi)]=iPi(δi+μ+γ+log[Di])=(μ+γ)iPi+iPiδi+iPilog[Di]=μ+γ+iPiδi+iPilog[jeδjeδi]=μ+γ+iPiδi+iPilog[jeδj]iPilog[eδi]=μ+γ+iPiδi+log[jeδj]iPiiPiδi=μ+γ+log[jexp{δj}].
QED

3
ฉันเชื่อมโยงสิ่งที่ฉันเชื่อว่าเป็นบทความที่คุณอ้างถึงโดยไม่ได้ตรวจสอบให้แน่ใจ โปรดแก้ไขหากผิด
Dougal

@ Jason คุณรู้วิธีที่จะพิสูจน์ว่านี่คือเมื่อสูงสุดมีเงื่อนไขในการเป็นสูงสุด? ดูคำถามที่นี่ซึ่งยังไม่ได้แก้: stats.stackexchange.com/questions/260847/…
wolfsatthedoor
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.