คำถามนี้ได้รับคำตอบอย่างชัดเจนในเอกสารชุดดั้งเดิมเกี่ยวกับตัวประมาณค่า James-Stein ในบริบท Empirical Bayes ที่เขียนในปี 1970 โดย Efron & Morris ฉันหมายถึง:
Efron และ Morris, 1973, กฎการประมาณค่าของ Stein และคู่แข่ง - แนวทางเชิงประจักษ์ Bayes
Efron และ Morris, 1975, การวิเคราะห์ข้อมูลด้วยเครื่องมือประมาณการของ Stein และลักษณะทั่วไป
Efron และ Morris, 1977, Stein Paradox ในสถิติ
บทความปี 1977 เป็นงานแสดงสินค้าที่ไม่ใช่ด้านเทคนิคที่ต้องอ่าน ที่นั่นพวกเขาแนะนำตัวอย่างลูกบอลเบสบอล (ที่กล่าวถึงในเธรดที่คุณเชื่อมโยง); ในตัวอย่างนี้ความแปรปรวนการสังเกตควรจะเท่ากันสำหรับตัวแปรทั้งหมดและปัจจัยการหดตัวเป็นค่าคงที่ค
อย่างไรก็ตามพวกเขายังคงยกตัวอย่างอีกอันหนึ่งซึ่งกำลังประเมินอัตราการ toxoplasmosis ในหลาย ๆ เมืองในเอลซัลวาดอร์ ในแต่ละเมืองมีการสำรวจผู้คนแตกต่างกันจำนวนมากดังนั้นการสำรวจแต่ละครั้ง (อัตราการติดเชื้อท็อกโซพลาสโมซิสในแต่ละเมือง) จึงมีความแตกต่างกัน (ยิ่งจำนวนคนสำรวจน้อย สัญชาตญาณแน่นอนว่าจุดข้อมูลที่มีความแปรปรวนต่ำ (ความไม่แน่นอนต่ำ) ไม่จำเป็นต้องหดตัวลงอย่างรุนแรงเท่ากับจุดข้อมูลที่มีความแปรปรวนสูง (ความไม่แน่นอนสูง) ผลของการวิเคราะห์ของพวกเขาจะแสดงในรูปต่อไปนี้ซึ่งสิ่งนี้สามารถเห็นได้เกิดขึ้นจริง:
ข้อมูลและการวิเคราะห์ที่เหมือนกันถูกนำเสนอในบทความทางเทคนิคมากกว่าปี 1975 เช่นกันในรูปที่สง่างามกว่ามาก
ที่นั่นพวกเขานำเสนอการรักษาแบบ Empirical Bayes ที่เรียบง่ายซึ่งมีดังต่อไปนี้ ให้โดยที่ไม่ทราบ ในกรณีที่เหมือนกันการรักษา Empirical Bayes มาตรฐานคือประมาณเป็นและคำนวณค่าเฉลี่ยของเป็นซึ่งไม่มีอะไรเลย นอกเหนือจากตัวประมาณ James-SteinXผม| θผม∼ N( θผม, Dผม)θผม∼ N( 0 , A )
ADผม= 11 / ( 1 + A )( k - 2 ) / ∑ X2Jθผมθ^ผม= ( 1 - 11 + A) Xผม= ( 1 - k - 2∑ X2J) Xผม,
ถ้าตอนนี้แล้วกฎปรับปรุง Bayes เป็นและเราสามารถใช้เดียวกันเคล็ดลับเชิงประจักษ์เบส์ในการประมาณการ, แม้ว่าจะไม่มีสูตรปิดสำหรับในกรณีนี้ (ดูกระดาษ) อย่างไรก็ตามพวกเขาทราบว่าDผม≠ 1θ^ผม= ( 1 - DผมDผม+ A) Xผม
AA^
... กฎนี้ไม่ได้ลดลงถึง Stein เมื่อทุกเท่ากันและเราใช้ตัวแปรย่อยของตัวประมาณนี้มาใน [the 1973 paper] ซึ่งจะลดลงเป็น Stein กฎชุดตัวเลือกจะประเมินค่าต่างกันสำหรับแต่ละเมือง ความแตกต่างระหว่างกฎมีเพียงเล็กน้อยในกรณีนี้ แต่อาจสำคัญหากมีขนาดเล็กลงDJA^ผมk
ส่วนที่เกี่ยวข้องในบทความปี 1973 คือหมวดที่ 8 และค่อนข้างอ่านยาก ที่น่าสนใจพวกเขามีความคิดเห็นที่ชัดเจนเกี่ยวกับคำแนะนำของ @guy ในความคิดเห็นด้านบน:
วิธีที่ง่ายมากในการกำหนดกฎเจมส์ - สไตน์สำหรับสถานการณ์นี้คือการกำหนดดังนั้น , ใช้ [กฎ James-Stein ดั้งเดิม] กับข้อมูลที่ถูกแปลงแล้วเปลี่ยนกลับไปเป็นพิกัดดั้งเดิม ผลลัพธ์ที่ได้คือกฎโดย
สิ่งนี้ไม่น่าสนใจเนื่องจากแต่ละตัวนั้นหดตัวไปทางต้นกำเนิดด้วยปัจจัยเดียวกันx~ผม= D- 1 / 2ผมxผม, θ~ผม= D- 1 / 2ผมθผมx~ผม∼ N( θ~ผม, 1 )θiθฉัน = ( 1 - k - 2 θ^i=(1−k−2∑[X2j/Dj])Xi.
XiXi
จากนั้นพวกเขาก็อธิบายขั้นตอนที่พวกเขาต้องการสำหรับการประมาณซึ่งฉันต้องยอมรับว่าฉันยังไม่ได้อ่านอย่างเต็มที่ ฉันขอแนะนำให้คุณดูที่นั่นถ้าคุณมีความสนใจในรายละเอียดA^i