@cardinal ให้คำตอบที่ดี (+1) แต่ปัญหาทั้งหมดยังคงเป็นปริศนาเว้นแต่ว่าใครจะคุ้นเคยกับการพิสูจน์ (และฉันไม่ได้) ดังนั้นผมจึงคิดว่าคำถามที่ยังคงเป็นสิ่งที่เป็นที่ใช้งานง่ายด้วยเหตุผลที่ว่าความขัดแย้งของสไตน์ไม่ปรากฏในและ 2R 2RR2
ผมพบว่ามุมมองของการถดถอยที่เป็นประโยชน์มากที่นำเสนอในสตีเฟ่น Stigler 1990, A Galtonian มุมมองเกี่ยวกับการหดตัวประมาณค่า พิจารณาวัดอิสระแต่ละวัดบางพื้นฐาน (สังเกต)และตัวอย่างจาก1) หากเรารู้เราสามารถสร้างพล็อตกระจายของคู่:θ i N ( θ i , 1 ) θ i ( X i , θ i )XiθiN(θi,1)θi(Xi,θi)
เส้นทแยงมุมสอดคล้องกับเสียงศูนย์และการประมาณที่สมบูรณ์แบบ ในความเป็นจริงเสียงเป็นที่ไม่ใช่ศูนย์และจุดที่มีการย้ายออกจากเส้นทแยงมุมในทิศทางแนวนอน Correspondinly,สามารถมองเห็นเป็นเส้นถดถอยของใน\อย่างไรก็ตามเรารู้และต้องการประมาณดังนั้นเราควรพิจารณาเส้นถดถอยของบน - ซึ่งจะมีความชันที่แตกต่างกัน, ลำเอียงในแนวนอนดังแสดงในรูป (เส้นประ)θ = X X θ X θ θ Xθ=Xθ=XXθXθθX
ข้อความจากกระดาษของ Stigler:
มุมมองของ Galtonian ใน Stein เส้นขนานทำให้มันเกือบจะโปร่งใส ว่า "ธรรมดา" ประมาณจะได้มาจากสายการถดถอยทางทฤษฎีของใน\บรรทัดนั้นจะมีประโยชน์หากเป้าหมายของเราคือการทำนายจากแต่ปัญหาของเราคือการย้อนกลับคือการทำนายจากโดยใช้ผลรวมของข้อผิดพลาดกำลังสองเป็น เกณฑ์ สำหรับเกณฑ์นั้นตัวประมาณเชิงเส้นที่เหมาะสมจะได้รับจากเส้นการถดถอยกำลังสองน้อยที่สุดของบนXθXθθXΣ(θฉัน - θฉัน)2θXθ^0i=XiXθXθθX∑(θi−θ^i)2θXและตัวประมาณ James-Stein และ Efron-Morris เป็นตัวประมาณของตัวประมาณเชิงเส้นที่เหมาะสมที่สุด ตัวประมาณ "ธรรมดา" นั้นได้มาจากเส้นถดถอยที่ไม่ถูกต้องตัวประมาณ James-Stein และ Efron-Morris นั้นมาจากการประมาณค่าไปยังเส้นถดถอยที่ถูกต้อง
และตอนนี้บิตสำคัญ (เน้นเพิ่ม) มา:
เรายังสามารถดูว่าทำไมเป็นสิ่งที่จำเป็นถ้าหรือเส้นสี่เหลี่ยมน้อยในจะต้องผ่านจุดและด้วยเหตุนี้สำหรับหรือที่ เส้นการถดถอยสองบรรทัด (ของบนและของ on ) ต้องยอมรับที่แต่ละอันk = 1 2 θ X ( X ฉัน , θ ฉัน ) k = 1 2 X θ θ X X ฉันk≥3k=12θX(Xi,θi)k=12XθθXXi
ผมคิดว่าสิ่งนี้ทำให้มันชัดเจนมากสิ่งที่เป็นพิเศษเกี่ยวกับและ 2k = 2k=1k=2