พิจารณาสามปรากฏการณ์ต่อไปนี้
ความขัดแย้งของสไตน์: ได้รับข้อมูลจากการแจกแจงปกติหลายตัวแปรในค่าเฉลี่ยตัวอย่างไม่ใช่ค่าประมาณที่ดีมากของค่าเฉลี่ยที่แท้จริง เราสามารถได้ค่าประมาณที่มีความคลาดเคลื่อนกำลังสองต่ำกว่าถ้ามีการลดขนาดพิกัดทั้งหมดของค่าเฉลี่ยตัวอย่างไปยังศูนย์ [หรือไปสู่ค่าเฉลี่ยของพวกเขาหรือจริงต่อค่าใด ๆ ถ้าฉันเข้าใจถูกต้อง]
หมายเหตุ: มักจะเป็นสูตรของสไตน์โดยพิจารณาจากจุดข้อมูลเดียว ; โปรดแก้ไขฉันหากนี่เป็นสิ่งสำคัญและสูตรของฉันด้านบนไม่ถูกต้อง
สันถดถอย: ให้ตัวแปรและตัวแปรอิสระบางตัว , การถดถอยมาตรฐานมีแนวโน้ม เพื่อให้ข้อมูลเหมาะสมและนำไปสู่ประสิทธิภาพที่ไม่ดีตัวอย่าง หนึ่งมักจะสามารถลดการหดตัวโดยอิงต่อศูนย์:YX β = ( X ⊤ X ) - 1 X ⊤ Y β β = ( X ⊤ X + λ ฉัน) - 1 X ⊤ Y
เอฟเฟ็กต์แบบสุ่มในหลายระดับ / แบบผสม: เมื่อพิจารณาตัวแปร (เช่นความสูงของนักเรียน) ซึ่งขึ้นอยู่กับการพยากรณ์หมวดหมู่ (เช่นรหัสโรงเรียนและเพศของนักเรียน) เรามักแนะนำให้ใช้ตัวทำนายบางตัวเป็น 'สุ่ม' เช่นสมมติว่า ความสูงเฉลี่ยของนักเรียนในแต่ละโรงเรียนมาจากการแจกแจงแบบปกติบางส่วน สิ่งนี้ส่งผลให้การประมาณค่าความสูงเฉลี่ยต่อโรงเรียนลดลงไปสู่ค่าเฉลี่ยทั่วโลก
ฉันมีความรู้สึกว่าทั้งหมดนี้เป็นแง่มุมต่าง ๆ ของปรากฏการณ์ "การหดตัว" แบบเดียวกัน แต่ฉันไม่แน่ใจและไม่มีสัญชาตญาณที่ดีเกี่ยวกับเรื่องนี้ ดังนั้นคำถามหลักของฉันคือ: จริง ๆ แล้วมีความคล้ายคลึงกันลึกระหว่างสามสิ่งนี้หรือเป็นเพียงรูปร่างหน้าตาตื้น ๆ ? ชุดรูปแบบทั่วไปคืออะไรที่นี่ สัญชาตญาณที่ถูกต้องเกี่ยวกับมันคืออะไร?
นอกจากนี้นี่คือบางส่วนของปริศนานี้ที่ไม่เหมาะสำหรับฉัน:
ในการถดถอยสัน,ไม่หดอย่างสม่ำเสมอ; อันที่จริงการหดตัวของสันเขานั้นเกี่ยวข้องกับการสลายตัวของเอกพจน์โดยที่ทิศทางการแปรปรวนต่ำจะหดตัวมากขึ้น (ดูเช่นองค์ประกอบของการเรียนรู้ทางสถิติ 3.4.1) แต่ตัวประเมินเจมส์ - สไตน์ก็แค่หาค่าเฉลี่ยตัวอย่างแล้วคูณมันด้วยตัวประกอบสเกลเดียว มันเข้ากันได้อย่างไรX
อัปเดต:ดูตัวประมาณการ James-Stein ที่มีความแปรปรวนไม่เท่ากันและที่นี่เกี่ยวกับความแปรปรวนของค่าสัมประสิทธิ์
ค่าเฉลี่ยตัวอย่างเหมาะสมที่สุดในมิติด้านล่าง 3 หมายความว่าเมื่อมีตัวทำนายเพียงหนึ่งหรือสองตัวในแบบจำลองการถดถอยการถดถอยของสันเขาจะแย่กว่าสแควร์น้อยธรรมดาทั่วไปเสมอ ที่จริงแล้วลองคิดดูสิฉันไม่สามารถจินตนาการถึงสถานการณ์ใน 1D (เช่นการถดถอยแบบง่าย ๆ ไม่ใช่หลาย ๆ จุด) ซึ่งการหดตัวของสันจะเป็นประโยชน์ ...
อัปเดต:ไม่โปรดดูภายใต้เงื่อนไขว่าการถดถอยของสันเขาสามารถให้การปรับปรุงมากกว่าการถดถอยกำลังสองน้อยที่สุดได้อย่างไร
บนมืออื่น ๆ ตัวอย่างเฉลี่ยมักจะก่อให้เกิดผลลัพธ์ในมิติดังกล่าวข้างต้น 3. มันหมายความว่ามีมากกว่า 3 ตัวทำนายถดถอยสันอยู่เสมอดีกว่า OLS แม้ว่าพยากรณ์ทั้งหมดที่มี uncorrelated (มุมฉาก)? โดยทั่วไปแล้วการถดถอยของสันเขานั้นเกิดจากความหลากหลายของความสัมพันธ์และความต้องการที่จะ "คงที่"คำ
อัพเดท:ใช่! ดูชุดข้อความเดียวกันกับด้านบน
บ่อยครั้งที่มีการพูดคุยกันอย่างร้อนแรงเกี่ยวกับว่าปัจจัยต่าง ๆ ใน ANOVA ควรรวมไว้เป็นเอฟเฟกต์แบบคงที่หรือแบบสุ่ม เราไม่ควรใช้ตรรกะเดียวกันปฏิบัติกับปัจจัยสุ่มเสมอหากมีมากกว่าสองระดับ (หรือถ้ามีมากกว่าสองปัจจัยตอนนี้ฉันสับสน)
UPDATE: ?
อัปเดต:ฉันได้รับคำตอบที่ยอดเยี่ยม แต่ไม่มีภาพใหญ่เพียงพอดังนั้นฉันจะให้คำถาม "เปิด" ฉันสามารถสัญญาว่าจะมอบรางวัลอย่างน้อย 100 คะแนนให้กับคำตอบใหม่ที่เกินกว่าที่มีอยู่เดิม ฉันส่วนใหญ่กำลังมองหามุมมองรวมที่สามารถอธิบายว่าปรากฏการณ์ทั่วไปของการหดตัวปรากฏตัวในบริบทต่าง ๆ เหล่านี้และชี้ให้เห็นความแตกต่างที่สำคัญระหว่างพวกเขา