มีการเชื่อมต่อระหว่างเบย์เชิงประจักษ์กับเอฟเฟกต์แบบสุ่มหรือไม่?


12

เมื่อไม่นานมานี้ฉันได้อ่านเกี่ยวกับการทดลอง Bayes (Casella, 1985, การแนะนำการวิเคราะห์ข้อมูลเชิงประจักษ์ Bayes) และมันดูคล้ายกับแบบจำลองเอฟเฟกต์แบบสุ่ม; ในที่ทั้งสองมีการประมาณการหดตัวถึงค่าเฉลี่ยทั่วโลก แต่ฉันยังไม่ได้อ่านอย่างละเอียด ...

ใครบ้างมีความเข้าใจอย่างถ่องแท้เกี่ยวกับความเหมือนและความแตกต่างระหว่างพวกเขาบ้างไหม?


1
Empirical Bayes สามารถใช้ในสถานการณ์ที่มีหรือไม่มีเอฟเฟกต์แบบสุ่ม - EB เพียงหมายถึงวิธี Bayesian ที่ประมาณจากข้อมูลพารามิเตอร์ (บางครั้งเรียกว่า hyperparameters) ของการแจกแจงก่อนหน้า - นี่คือวิธีการประมาณ การสร้างแบบจำลองข้อมูลที่มีความสัมพันธ์ บางทีตัวอย่างที่คุณเห็นเกี่ยวข้องกับการประเมินรูปแบบเอฟเฟกต์แบบสุ่มโดยใช้เบย์เชิงประจักษ์และนั่นคือสาเหตุที่คุณเชื่อมต่อทั้งสอง
แมโคร

1
Casella ไม่ใช่ Cassella!
ซีอาน

2
ข้อแตกต่างที่สำคัญคือตัวแบบเอฟเฟกต์แบบสุ่มคือแบบจำลอง (รวมถึงเอฟเฟกต์แบบสุ่ม) ในขณะที่เทคนิคเชิงประจักษ์ Bayes เป็นเทคนิคการอนุมาน: เช่นคุณสามารถรันการประมาณแบบเบย์เชิงประจักษ์ในแบบจำลองเอฟเฟกต์แบบสุ่ม ... ที่ซึ่งคุณสามารถใช้วิธี Bayes ปกติไม่เพียง แต่กับโมเดลเอฟเฟกต์แบบสุ่ม
ซีอาน

คำตอบ:


5

มีบทความที่ยอดเยี่ยมมากใน JASA ย้อนกลับไปในช่วงกลางทศวรรษ 1970 บนตัวประมาณ James-Stein และการประเมิน Bayes เชิงประจักษ์ด้วยแอพพลิเคชั่นเฉพาะเพื่อทำนายผู้เล่นเบสบอลที่ตีค่าเฉลี่ย ข้อมูลเชิงลึกที่ฉันสามารถให้ได้ในเรื่องนี้เป็นผลมาจากเจมส์และสไตน์ซึ่งแสดงให้เห็นถึงความประหลาดใจของโลกทางสถิติว่าสำหรับการแจกแจงปกติหลายตัวแปรในสามมิติหรือมากกว่า MLE ซึ่งเป็นเวกเตอร์ของค่าเฉลี่ยพิกัด

การพิสูจน์ทำได้โดยการแสดงให้เห็นว่าตัวประมาณค่าที่ลดขนาดเวคเตอร์เฉลี่ยไปยังจุดกำเนิดนั้นดีกว่าอย่างสม่ำเสมอโดยอิงจากความคลาดเคลื่อนกำลังสองเฉลี่ยเป็นฟังก์ชันการสูญเสีย Efron และ Morris แสดงให้เห็นว่าในปัญหาการถดถอยหลายตัวแปรโดยใช้วิธีเชิงประจักษ์ Bayes วิธีการประมาณที่พวกเขามาถึงคือตัวประมาณค่าการหดตัวของชนิด James-Stein พวกเขาใช้วิธีการนี้เพื่อทำนายค่าเฉลี่ยของฤดูกาลสุดท้ายของผู้เล่นเบสบอลเมเจอร์ลีกโดยอ้างอิงจากผลการแข่งขันในฤดูกาลแรก การประมาณการจะย้ายค่าเฉลี่ยของทุกคนไปสู่ค่าเฉลี่ยที่ยิ่งใหญ่ของผู้เล่นทุกคน

ฉันคิดว่านี่จะอธิบายว่าตัวประมาณดังกล่าวสามารถเกิดขึ้นได้อย่างไรในโมเดลเชิงเส้นหลายตัวแปร มันไม่ได้เชื่อมต่ออย่างสมบูรณ์กับโมเดลเอฟเฟกต์พิเศษใด ๆ แต่อาจเป็นผู้นำที่ดีในทิศทางนั้น

อ้างอิงบางส่วน :

  1. บีเอฟรอนและซีมอร์ริส (1975), การวิเคราะห์ข้อมูลโดยใช้ประมาณการของสไตน์และภาพรวมของมัน , เจอาเมอร์ สถิติ รศ ฉบับ หมายเลข 70 350, 311–319
  2. B. Efron และ C. Morris (1973), กฎการประเมินของ Stein และคู่แข่ง - วิธีการทดลองของ Bayes , J. Amer สถิติ รศ ฉบับ หมายเลข 68 341, 117–130
  3. B. Efron และ C. Morris (1977), บุคคลที่ผิดธรรมดาของ Stein ในด้านสถิติ , Scientific American , vol. 236, ไม่ 5, 119–127
  4. G. Casella (1985), คำแนะนำเบื้องต้นเกี่ยวกับการวิเคราะห์ข้อมูลเชิงประจักษ์ Bayes , Amer. สถิติ , ฉบับ หมายเลข 39 2, 83–87

1
ไม่เกี่ยวข้องอย่างสมบูรณ์ แต่อีกเล็กน้อยเกี่ยวกับผลลัพธ์ที่ยอมรับได้ (ใน) อยู่ในคำถามนี้
พระคาร์ดินัล

1
ฉันวางลิงค์ไปยังบทความที่ฉันคิดว่าคุณกำลังอ้างถึงเป็นรายการ (1) ภายใต้การอ้างอิง แต่เนื่องจาก Efron & Morris เขียนบทความทั้งหมดในหัวข้อที่เกี่ยวข้องในช่วงเวลานั้นมันค่อนข้างไม่ชัดเจนว่าคุณเป็นใคร อ้างถึง. ฉันยังพยายามปรับการจัดรูปแบบและการสะกดคำบางอย่าง โปรดตรวจสอบว่าฉันไม่ได้แนะนำข้อผิดพลาดใด ๆ โดยไม่ตั้งใจและสามารถแก้ไขเพิ่มเติมหรือย้อนกลับของฉันได้
พระคาร์ดินัล

1
ฉันวางลิงก์ไปยังที่เก็บถาวรที่มีสิทธิ์ในโพสต์ แต่บทความบางส่วนหรือทั้งหมดอาจพบได้ในแหล่งอื่น ๆ (ไม่เสถียร) บนเว็บ
พระคาร์ดินัล

1
ขอขอบคุณที่โพสต์บทความ Efron และ Morris สิ่งเตือนความจำสำหรับวันที่ดีกว่าเมื่อ Don Kessinger, Ron Santo และ Billy Williams กำลังเล่นให้กับ Cubs และ Scientific American ยังคงตีพิมพ์บทความที่ควรค่าแก่การอ่าน
Ringold

1
เอกสารล่าสุดโดยแบรดอีฟรอนการอนุมานขนาดใหญ่ปรากฏขึ้นเมื่อเร็ว ๆ นี้ แม้จะมีชื่อเรื่องมันคือทั้งหมดที่เกี่ยวกับการทดลองเบย์! (ดูที่นี่สำหรับรีวิวหนังสือของฉัน.)
ซีอาน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.