เครื่องมือประมาณการ James-Stein ที่มีความแปรปรวนไม่เท่ากัน


11

ทุกคำสั่งที่ฉันพบของตัวประมาณ James-Stein ถือว่าตัวแปรสุ่มที่ถูกประมาณนั้นมีความแปรปรวน (และหน่วย) เหมือนกัน

แต่ตัวอย่างทั้งหมดเหล่านี้ยังพูดถึงว่าตัวประมาณ JS สามารถใช้ในการประมาณปริมาณโดยไม่เกี่ยวข้องกัน ตัวอย่างเช่นวิกิพีเดียคือความเร็วของแสงการบริโภคกาแฟในไต้หวันและน้ำหนักหมูในมอนแทนา แต่สมมุติว่าการวัดปริมาณทั้งสามนี้ของคุณจะมีความแปรปรวน "ที่แท้จริง" ที่แตกต่างกัน สิ่งนี้นำเสนอปัญหาหรือไม่?

สิ่งนี้เชื่อมโยงกับปัญหาเชิงแนวคิดที่ใหญ่กว่าซึ่งฉันไม่เข้าใจเกี่ยวข้องกับคำถามนี้: ตัวประเมินเจมส์ - สไตน์: Efron และมอร์ริสคำนวณในปัจจัยการหดตัวอย่างเบสบอลของพวกเขาอย่างไร σ2 cเราคำนวณปัจจัยการหดตัวดังนี้c

c=1(k3)σ2(yy¯)2

ฉันคิดว่าเทอมนั้นจริง ๆ แล้ว - ต่างกันสำหรับแต่ละปริมาณที่ประมาณไว้ แต่การสนทนาในคำถามนั้นพูดถึงการใช้ความแปรปรวนร่วมเท่านั้น ...σ 2 iσ2σi2

ฉันจะซาบซึ้งจริง ๆ ถ้าใครสามารถล้างความสับสนนี้


3
หากความแปรปรวนคือเราสามารถคูณซ้ายด้วยเพื่อกลับไปที่ปัญหา James-Stein ถ้าไม่ทราบแต่แต่ละ "การสังเกต" ในปัญหาคือค่าเฉลี่ยตัวอย่างที่คำนวณจากการสังเกตเราสามารถประมาณด้วยและหวังว่าเราจะได้รับสถานการณ์ James-Stein ถ้าเราคูณด้วยแทน D - 1 / 2 D เมตรฉัน D D D - 1 / 2D=diag(σ12,,σn2)D1/2DmiDD^D^1/2
ผู้ชาย

2
@guy: นี่เป็นข้อเสนอแนะที่สมเหตุสมผล (+1) อย่างไรก็ตามสิ่งนี้จะส่งผลให้เกิดการหดตัวของตัวแปรทั้งหมดสำหรับตัวแปรทั้งหมดในขณะที่หนึ่งต้องการลดขนาดของตัวแปรที่แตกต่างกันขึ้นอยู่กับความแปรปรวน / ความไม่แน่นอน ดูคำตอบที่ฉันเพิ่งโพสต์
อะมีบา

1
@amoeba แน่นอน; ฉันไม่ได้แนะนำตัวประมาณของฉันว่าใช้งานได้จริงเพียง แต่แสดงให้เห็นว่าทำไมผู้คนถึงพูดในสิ่งที่ OP กล่าวถึงในวรรคที่สองของเขา / เธอ
ผู้ชาย

คำตอบ:


6

คำถามนี้ได้รับคำตอบอย่างชัดเจนในเอกสารชุดดั้งเดิมเกี่ยวกับตัวประมาณค่า James-Stein ในบริบท Empirical Bayes ที่เขียนในปี 1970 โดย Efron & Morris ฉันหมายถึง:

  1. Efron และ Morris, 1973, กฎการประมาณค่าของ Stein และคู่แข่ง - แนวทางเชิงประจักษ์ Bayes

  2. Efron และ Morris, 1975, การวิเคราะห์ข้อมูลด้วยเครื่องมือประมาณการของ Stein และลักษณะทั่วไป

  3. Efron และ Morris, 1977, Stein Paradox ในสถิติ

บทความปี 1977 เป็นงานแสดงสินค้าที่ไม่ใช่ด้านเทคนิคที่ต้องอ่าน ที่นั่นพวกเขาแนะนำตัวอย่างลูกบอลเบสบอล (ที่กล่าวถึงในเธรดที่คุณเชื่อมโยง); ในตัวอย่างนี้ความแปรปรวนการสังเกตควรจะเท่ากันสำหรับตัวแปรทั้งหมดและปัจจัยการหดตัวเป็นค่าคงที่c

อย่างไรก็ตามพวกเขายังคงยกตัวอย่างอีกอันหนึ่งซึ่งกำลังประเมินอัตราการ toxoplasmosis ในหลาย ๆ เมืองในเอลซัลวาดอร์ ในแต่ละเมืองมีการสำรวจผู้คนแตกต่างกันจำนวนมากดังนั้นการสำรวจแต่ละครั้ง (อัตราการติดเชื้อท็อกโซพลาสโมซิสในแต่ละเมือง) จึงมีความแตกต่างกัน (ยิ่งจำนวนคนสำรวจน้อย สัญชาตญาณแน่นอนว่าจุดข้อมูลที่มีความแปรปรวนต่ำ (ความไม่แน่นอนต่ำ) ไม่จำเป็นต้องหดตัวลงอย่างรุนแรงเท่ากับจุดข้อมูลที่มีความแปรปรวนสูง (ความไม่แน่นอนสูง) ผลของการวิเคราะห์ของพวกเขาจะแสดงในรูปต่อไปนี้ซึ่งสิ่งนี้สามารถเห็นได้เกิดขึ้นจริง:

ป้อนคำอธิบายรูปภาพที่นี่

ข้อมูลและการวิเคราะห์ที่เหมือนกันถูกนำเสนอในบทความทางเทคนิคมากกว่าปี 1975 เช่นกันในรูปที่สง่างามกว่ามาก

ป้อนคำอธิบายรูปภาพที่นี่

ที่นั่นพวกเขานำเสนอการรักษาแบบ Empirical Bayes ที่เรียบง่ายซึ่งมีดังต่อไปนี้ ให้โดยที่ไม่ทราบ ในกรณีที่เหมือนกันการรักษา Empirical Bayes มาตรฐานคือประมาณเป็นและคำนวณค่าเฉลี่ยของเป็นซึ่งไม่มีอะไรเลย นอกเหนือจากตัวประมาณ James-Stein

Xi|θiN(θi,Di)θiN(0,A)
ADi=11/(1+A)(k2)/Xj2θi
θ^i=(111+A)Xi=(1k2Xj2)Xi,

ถ้าตอนนี้แล้วกฎปรับปรุง Bayes เป็นและเราสามารถใช้เดียวกันเคล็ดลับเชิงประจักษ์เบส์ในการประมาณการ, แม้ว่าจะไม่มีสูตรปิดสำหรับในกรณีนี้ (ดูกระดาษ) อย่างไรก็ตามพวกเขาทราบว่าDi1

θ^i=(1DiDi+A)Xi
AA^

... กฎนี้ไม่ได้ลดลงถึง Stein เมื่อทุกเท่ากันและเราใช้ตัวแปรย่อยของตัวประมาณนี้มาใน [the 1973 paper] ซึ่งจะลดลงเป็น Stein กฎชุดตัวเลือกจะประเมินค่าต่างกันสำหรับแต่ละเมือง ความแตกต่างระหว่างกฎมีเพียงเล็กน้อยในกรณีนี้ แต่อาจสำคัญหากมีขนาดเล็กลงDjA^ik

ส่วนที่เกี่ยวข้องในบทความปี 1973 คือหมวดที่ 8 และค่อนข้างอ่านยาก ที่น่าสนใจพวกเขามีความคิดเห็นที่ชัดเจนเกี่ยวกับคำแนะนำของ @guy ในความคิดเห็นด้านบน:

วิธีที่ง่ายมากในการกำหนดกฎเจมส์ - สไตน์สำหรับสถานการณ์นี้คือการกำหนดดังนั้น , ใช้ [กฎ James-Stein ดั้งเดิม] กับข้อมูลที่ถูกแปลงแล้วเปลี่ยนกลับไปเป็นพิกัดดั้งเดิม ผลลัพธ์ที่ได้คือกฎโดย สิ่งนี้ไม่น่าสนใจเนื่องจากแต่ละตัวนั้นหดตัวไปทางต้นกำเนิดด้วยปัจจัยเดียวกันx~i=Di1/2xi,θ~i=Di1/2θix~iN(θ~i,1)θiθฉัน = ( 1 - k - 2

θ^i=(1k2[Xj2/Dj])Xi.
XiXi

จากนั้นพวกเขาก็อธิบายขั้นตอนที่พวกเขาต้องการสำหรับการประมาณซึ่งฉันต้องยอมรับว่าฉันยังไม่ได้อ่านอย่างเต็มที่ ฉันขอแนะนำให้คุณดูที่นั่นถ้าคุณมีความสนใจในรายละเอียดA^i

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.