สัญชาตญาณว่าทำไมความขัดแย้งของสไตน์จึงนำมาใช้ในมิติ


46

สไตน์ตัวอย่างแสดงให้เห็นว่าการประมาณการความน่าจะเป็นสูงสุดของตัวแปรกระจายตามปกติด้วยวิธีการและผลต่างคือไม่ยอมรับ (ภายใต้ฟังก์ชั่นการสูญเสียตาราง) IFF3 สำหรับการพิสูจน์ที่เป็นระเบียบดูบทแรกของการอนุมานขนาดใหญ่: วิธีการเชิงประจักษ์เบย์สำหรับการประมาณค่าการทดสอบและการทำนายโดยแบรดลีย์เอฟรอนnμ1,,μn1n3

นี่เป็นเรื่องน่าประหลาดใจอย่างมากสำหรับฉันในตอนแรก แต่มีปรีชาอยู่เบื้องหลังว่าทำไมคน ๆ หนึ่งคาดว่าการประมาณมาตรฐานจะไม่สามารถยอมรับได้ (โดยเฉพาะอย่างยิ่งถ้าจากนั้นตามที่ระบุไว้ในกระดาษต้นฉบับของ Stein ซึ่งเชื่อมโยงกับด้านล่าง)xN(μ,1)Ex2μ2+n

คำถามของฉันค่อนข้างจะ: คุณสมบัติใดของช่องว่างn -dimensional (สำหรับn3 ) R2ขาดอะไรบ้างที่อำนวยความสะดวกให้ตัวอย่างของ Stein? คำตอบที่เป็นไปได้อาจเกี่ยวกับความโค้งของnกลมหรือสิ่งที่แตกต่างอย่างสิ้นเชิง

ในคำอื่น ๆ เหตุผลที่เป็นที่ยอมรับใน MLE R2 ?


แก้ไข 1:เพื่อตอบสนองต่อ @mpiktas กังวลเกี่ยวกับ 1.31 จาก 1.30:

Eμ(zμ^2)=Eμ(S(N2S)2)=Eμ((N2)2S).

μi^=(1N2S)zi
ดังนั้น
Eμ(μi^zi)=Eμ(1N2S+2zi2S2).
ดังนั้นเราจึงมี:

2i=1NEμ(μi^zi)=2N2Eμ(N(N2)S)+4Eμ((N2)S)=2NEμ2(N2)2S.

แก้ไข 2 : ในบทความนี้สไตน์พิสูจน์ให้เห็นว่าเอมิลี่เป็นที่ยอมรับสำหรับN=2 2


4
@mpiktas มันไม่เหมาะสมอย่างที่เห็น สถานการณ์คล้ายกับ ANOVA หลังจากที่เราใช้การลดความพอเพียง นี่เป็นการบอกใบ้ว่าการประมาณค่าความแปรปรวนปกติของกลุ่มหมายความว่าไม่สามารถยอมรับได้หากเราพยายามประเมินความหมายของกลุ่มมากกว่า 3 กลุ่ม (ซึ่งกลายเป็นจริง) ฉันอยากจะแนะนำให้ดูที่การพิสูจน์ว่า MLE ยอมรับได้สำหรับและดูว่าพวกเขาล้มเหลวเมื่อพยายามขยายเป็นมากกว่าแค่ดูที่บทพิสูจน์ว่าตัวประมาณของ Stein ทำในสิ่งที่อ้างง่าย คุณมีตัวประมาณในใจ N=1,2N=3
คนที่แต่งตัวประหลาด

2
... และรู้จักใช้สไตน์เล็มม่าของ Stein ฉันคิดว่าจริง ๆ แล้วมันตรงไปตรงมาน้อยกว่าฉันเมื่อ 6 นาทีก่อน
คนที่แต่งตัวประหลาด

2
ฉันเห็นด้วย. คุณมีการอ้างอิงที่ดีสำหรับสิ่งนั้น (นอกเหนือจากเอกสารต้นฉบับ) ฉันพบกระดาษคำนวณต้นฉบับของ Stein มากเกินไปและหวังว่าจะมีบางคนพัฒนาวิธีการที่แตกต่างกันในช่วงห้าสิบปีที่ผ่านมา
ฮ่า

2
หลักฐานที่ฉันสอนคือของบราวน์และฮวางตั้งแต่ปี 1983 ซึ่งใช้วิธีการที่ไบลท์แนะนำตั้งแต่ต้นปี 1950 ฉันเชื่อ มันค่อนข้างทั่วไป (ทั่วไปมากกว่าผลของสไตน์เพราะมันใช้กับครอบครัวผู้ชี้แจง) และฉันเชื่อว่าค่อนข้างแตกต่างจากสไตน์ แต่มันก็ไม่สำคัญ
คนที่แต่งตัวประหลาด

2
@Har คำถามที่ดี! (+1)
suncoolsu

คำตอบ:


43

การแบ่งขั้วระหว่างคดีและสำหรับการยอมรับของ MLE ของค่าเฉลี่ยของตัวแปรสุ่มหลายมิติหลายตัวแปรมิติหลายมิติเป็นที่น่าตกใจอย่างแน่นอนd<3d3d

มีอีกหนึ่งตัวอย่างที่มีชื่อเสียงมากในความน่าจะเป็นและสถิติที่มีการแบ่งขั้วระหว่างเป็นและกรณี นี่คือการกำเริบของสุ่มเดินเรียบง่ายบนตาข่าย d นั่นคือการเดินแบบสุ่มแบบ -dimensional ง่าย ๆ จะเกิดขึ้นอีกครั้งใน 1 หรือ 2 มิติ แต่เป็นแบบชั่วคราวในมิติอะนาล็อกเวลาต่อเนื่อง (ในรูปแบบของการเคลื่อนไหว Brownian) ยังถือd<3d3Zddd3

ปรากฎว่าทั้งสองมีความสัมพันธ์กันอย่างใกล้ชิด

Larry Brownพิสูจน์แล้วว่าคำถามทั้งสองนั้นเทียบเท่ากันโดยพื้นฐานแล้ว นั่นคือตัวประมาณค่าคงที่ที่ดีที่สุดของมิติหลายมิติหลายมิติปกติหมายถึงเวกเตอร์เป็นที่ยอมรับถ้าหากมิติมิติสีน้ำตาลเคลื่อนไหวซ้ำแล้วซ้ำอีกμ^μ^(X)=Xdd

ในความเป็นจริงผลของเขาไปมากต่อไป สำหรับผู้ที่มีเหตุผล (กล่าวคือเบย์ทั่วไป) ตัวประมาณมีขอบเขต (ทั่วไป) ความเสี่ยงมีความชัดเจน (!) ที่เกี่ยวข้องมิติมิติเช่น ตัวประมาณจะยอมรับได้ก็ต่อเมื่อการแพร่ที่เกี่ยวข้องนั้นเกิดขึ้นอีกμ~μ~(X)L2dμ~

ค่าเฉลี่ยของการแพร่กระจายในท้องถิ่นนี้เป็นหลักความแตกต่างระหว่างสองประมาณคือและความแปรปรวนของการแพร่กระจายเป็นฉัน จากนี้เป็นเรื่องง่ายที่จะเห็นว่าสำหรับกรณีของ MLEเรากู้คืนการเคลื่อนไหวบราวเนียน (ได้รับการช่วยเหลือ)μ~μ^2Iμ~=μ^=X

ดังนั้นในบางแง่มุมเราสามารถดูคำถามเกี่ยวกับการยอมรับผ่านเลนส์ของกระบวนการสโตแคสติกและใช้คุณสมบัติของการแพร่กระจายอย่างดีเพื่อให้ได้ข้อสรุปที่ต้องการ

อ้างอิง

  1. L. Brown (1971) ประมาณยอมรับ diffusions กำเริบและปัญหาค่าขอบเขตที่ไม่ละลายน้ำ แอน คณิตศาสตร์. สถิติ ฉบับ หมายเลข 42 3, pp. 855–903
  2. RN Bhattacharya (1978) เกณฑ์การกลับเป็นซ้ำและการดำรงอยู่ของมาตรการคงที่สำหรับ diffusions แอน prob ฉบับ 6 ไม่ใช่ 4, 541–553

2
ที่จริงแล้วสิ่งนี้เป็นสิ่งที่ฉันหวังไว้ การเชื่อมต่อไปยังสาขาวิชาคณิตศาสตร์อื่น (ไม่ว่าจะเป็นเรขาคณิตเชิงอนุพันธ์หรือกระบวนการสุ่ม) ซึ่งแสดงให้เห็นว่าการยอมรับสำหรับไม่ได้เป็นเพียงความบังเอิญ คำตอบที่ดี! n=2
ฮ่า

ได้รับแรงบันดาลใจจากคำตอบของคุณฉันให้รายละเอียดบางอย่างและยังเพิ่มคำอธิบายทางเรขาคณิตเพื่อตอบสนองต่อปัญหานี้ใน MO: mathoverflow.net/questions/93745/…
Henry.L

21

@cardinal ให้คำตอบที่ดี (+1) แต่ปัญหาทั้งหมดยังคงเป็นปริศนาเว้นแต่ว่าใครจะคุ้นเคยกับการพิสูจน์ (และฉันไม่ได้) ดังนั้นผมจึงคิดว่าคำถามที่ยังคงเป็นสิ่งที่เป็นที่ใช้งานง่ายด้วยเหตุผลที่ว่าความขัดแย้งของสไตน์ไม่ปรากฏในและ 2R 2RR2

ผมพบว่ามุมมองของการถดถอยที่เป็นประโยชน์มากที่นำเสนอในสตีเฟ่น Stigler 1990, A Galtonian มุมมองเกี่ยวกับการหดตัวประมาณค่า พิจารณาวัดอิสระแต่ละวัดบางพื้นฐาน (สังเกต)และตัวอย่างจาก1) หากเรารู้เราสามารถสร้างพล็อตกระจายของคู่:θ i N ( θ i , 1 ) θ i ( X i , θ i )XiθiN(θi,1)θi(Xi,θi)

ความขัดแย้งของสไตน์: มุมมองการถดถอย

เส้นทแยงมุมสอดคล้องกับเสียงศูนย์และการประมาณที่สมบูรณ์แบบ ในความเป็นจริงเสียงเป็นที่ไม่ใช่ศูนย์และจุดที่มีการย้ายออกจากเส้นทแยงมุมในทิศทางแนวนอน Correspondinly,สามารถมองเห็นเป็นเส้นถดถอยของใน\อย่างไรก็ตามเรารู้และต้องการประมาณดังนั้นเราควรพิจารณาเส้นถดถอยของบน - ซึ่งจะมีความชันที่แตกต่างกัน, ลำเอียงในแนวนอนดังแสดงในรูป (เส้นประ)θ = X X θ X θ θ Xθ=Xθ=XXθXθθX

ข้อความจากกระดาษของ Stigler:

มุมมองของ Galtonian ใน Stein เส้นขนานทำให้มันเกือบจะโปร่งใส ว่า "ธรรมดา" ประมาณจะได้มาจากสายการถดถอยทางทฤษฎีของใน\บรรทัดนั้นจะมีประโยชน์หากเป้าหมายของเราคือการทำนายจากแต่ปัญหาของเราคือการย้อนกลับคือการทำนายจากโดยใช้ผลรวมของข้อผิดพลาดกำลังสองเป็น เกณฑ์ สำหรับเกณฑ์นั้นตัวประมาณเชิงเส้นที่เหมาะสมจะได้รับจากเส้นการถดถอยกำลังสองน้อยที่สุดของบนXθXθθXΣ(θฉัน - θฉัน)2θXθ^i0=XiXθXθθX(θiθ^i)2θXและตัวประมาณ James-Stein และ Efron-Morris เป็นตัวประมาณของตัวประมาณเชิงเส้นที่เหมาะสมที่สุด ตัวประมาณ "ธรรมดา" นั้นได้มาจากเส้นถดถอยที่ไม่ถูกต้องตัวประมาณ James-Stein และ Efron-Morris นั้นมาจากการประมาณค่าไปยังเส้นถดถอยที่ถูกต้อง

และตอนนี้บิตสำคัญ (เน้นเพิ่ม) มา:

เรายังสามารถดูว่าทำไมเป็นสิ่งที่จำเป็นถ้าหรือเส้นสี่เหลี่ยมน้อยในจะต้องผ่านจุดและด้วยเหตุนี้สำหรับหรือที่ เส้นการถดถอยสองบรรทัด (ของบนและของ on ) ต้องยอมรับที่แต่ละอันk = 1 2 θ X ( X ฉัน , θ ฉัน ) k = 1 2 X θ θ X X ฉันk3k=12θX(Xi,θi)k=12XθθXXi

ผมคิดว่าสิ่งนี้ทำให้มันชัดเจนมากสิ่งที่เป็นพิเศษเกี่ยวกับและ 2k = 2k=1k=2

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.