ตัวประมาณค่า Bayes ต้องการให้พารามิเตอร์จริงเป็นค่าแปรปรวนที่เป็นไปได้ของค่าก่อนหน้าหรือไม่?


9

นี้อาจจะมีบิตของคำถามปรัชญา แต่ที่นี่เราจะไป: ในทางทฤษฎีการตัดสินใจความเสี่ยงของ Bayes ประมาณการสำหรับมีการกำหนดเกี่ยวกับการกระจายก่อนใน\θ^(x)θΘπΘ

ทีนี้ในแง่หนึ่งสำหรับความจริงจะสร้างข้อมูล (เช่น "มีอยู่"),จะต้องเป็นตัวแปรที่เป็นไปได้ภายใต้ , เช่นมีความน่าจะเป็นที่ไม่ใช่ศูนย์, ความหนาแน่นไม่เป็นศูนย์ ฯลฯ ; ในทางกลับกัน,ไม่เป็นที่รู้จัก, ดังนั้นการเลือกก่อนหน้า, ดังนั้นเราจึงไม่รับประกันว่าจริงเป็นความแปรปรวนที่เป็นไปได้ภายใต้เราเลือกθθπθθπ

ตอนนี้ดูเหมือนว่าเราจะต้องเลือกเพื่อที่จะเป็นรูปแบบที่เป็นไปได้ มิฉะนั้นทฤษฎีบทบางอย่างจะไม่ถือ ตัวอย่างเช่นการประมาณค่าขนาดเล็กที่สุดจะไม่เป็นการประมาณค่าแบบเบย์สำหรับสิ่งที่น่าพอใจน้อยที่สุดก่อนเนื่องจากเราสามารถทำให้ค่านั้นไม่ดีตามอำเภอใจก่อนโดยการยกเว้นพื้นที่ขนาดใหญ่รอบ ๆ และรวมถึงจากโดเมน อย่างไรก็ตามการรับประกันว่านั้นอยู่ในโดเมนนั้นอาจทำได้ยากπθθθ

ดังนั้นคำถามของฉันคือ:

  1. โดยทั่วไปแล้วสันนิษฐานว่าแท้จริงคือความแปรปรวนของเป็นไปได้หรือไม่?θπ
  2. สามารถรับประกันได้หรือไม่
  3. กรณีที่ละเมิดนี้สามารถตรวจพบได้อย่างน้อยดังนั้นจึงไม่เชื่อในทฤษฎีบทเช่น minimax เมื่อเงื่อนไขไม่ได้ถือ?
  4. หากไม่จำเป็นต้องทำทำไมมาตรฐานผลลัพธ์ในทฤษฎีการตัดสินใจจึงเป็นเช่นนั้น?

คำตอบ:


6

เป็นคำถามที่ดีมาก! จริง ๆ แล้วมันจะทำให้รู้สึกว่าการกระจายก่อนหน้า "ดี" ให้ความน่าเป็นบวกหรือค่าความหนาแน่นบวกกับพารามิเตอร์ "จริง"แต่จากมุมมองการตัดสินใจอย่างแท้จริงนี้ไม่จำเป็นต้องเป็นกรณี ตัวอย่างง่ายๆสำหรับปรีชา "สัญชาตญาณ" นี้ที่ควรจำเป็นเมื่อคือความหนาแน่นก่อนหน้าและคือค่า "จริง" ของพารามิเตอร์คือความฉลาดผลการย่อขนาดเล็กที่สุดของ Casella และ Strawderman (1981): เมื่อประมาณค่าเฉลี่ยจากการสังเกตการณ์เดี่ยวด้วยข้อ จำกัด เพิ่มเติมที่ ,θ0

π(θ0)>0
π()θ0μxN(μ,1)|μ|<ρρมีขนาดเล็กพอโดยเฉพาะ minimax ตัวประมาณค่าที่สอดคล้องกับ (อย่างน้อยที่เป็นที่นิยม) ก่อนหน้าชุดซึ่งหมายความว่าให้น้ำหนักเท่ากับและ ( และไม่มีค่าอื่นใดของค่าเฉลี่ย ) เมื่อเพิ่มความนิยมอย่างน้อยที่สุดก่อนที่จะเห็นการสนับสนุนเพิ่มขึ้น แต่ยังคงอยู่ในขอบเขตที่แน่นอนของค่าที่เป็นไปได้ แต่ความคาดหวังหลัง,สามารถใช้ค่าใด ๆ บนโร)ρ1.0567{ρ,ρ}πρρμ
π(θ)=12δρ(θ)+12δρ(θ)
ρE[μ|x](ρ,ρ)

แก่นของการสนทนา (ดูความคิดเห็น) อาจเป็นไปได้ว่าตัวประมาณของเบย์จะถูก จำกัด ให้เป็นจุดที่สนับสนุน คุณสมบัติของมันจะค่อนข้างแตกต่างกันπ()

ในทำนองเดียวกันเมื่อพิจารณาตัวประมาณค่าที่ยอมรับได้ตัวประมาณค่าแบบเบย์ที่เกี่ยวข้องกับค่าที่เหมาะสมก่อนในชุดขนาดกะทัดรัดมักจะยอมรับได้แม้ว่าพวกเขาจะมีการสนับสนุนที่ จำกัด

ในทั้งสองกรณีความคิดบ่อย ๆ (minimaxity หรือ admissibility) ถูกกำหนดในช่วงที่เป็นไปได้ของพารามิเตอร์แทนที่จะเป็นค่า "ที่แท้จริง" ของพารามิเตอร์ (ซึ่งจะนำคำตอบของคำถาม 4) ตัวอย่างเช่นการดูความเสี่ยงหลัง หรือเสี่ยง Bayes ไม่เกี่ยวข้องกับมูลค่าที่แท้จริง\

ΘL(θ,δ)π(θ|x)dθ
XΘL(θ,δ)π(θ)f(x|θ)dθdx
θ0

ยิ่งไปกว่านั้นดังที่ได้กล่าวไว้ในตัวอย่างข้างต้นเมื่อตัวประมาณเบย์ถูกกำหนดโดยนิพจน์อย่างเป็นทางการเช่นค่าเฉลี่ยหลัง สำหรับการสูญเสียกำลังสอง (หรือ ) ตัวประมาณนี้อาจใช้ค่านอกการสนับสนุนของในกรณีที่การสนับสนุนนี้ไม่นูน

θ^π(x)=Θθπ(θ|x)dθ
L2π

เช่นกันเมื่ออ่าน

สำหรับความจริงθที่จะสร้างข้อมูล (เช่น "มีอยู่"), θจะต้องเป็นตัวแปรที่เป็นไปได้ภายใต้π, เช่นมีความน่าจะเป็นที่ไม่ใช่ศูนย์, ความหนาแน่นที่ไม่เป็นศูนย์

ฉันคิดว่ามันเป็นการบิดเบือนความจริง การกระจายก่อนที่ไม่ควรจะยืนสำหรับทางกายภาพ (หรือจริง) กลไกที่เกิดขึ้นจริงที่เห็นค่าพารามิเตอร์สร้างขึ้นจากตามด้วยการสังเกตสร้างขึ้นจากtheta_0) ก่อนหน้าคือการวัดการอ้างอิงในพื้นที่พารามิเตอร์ที่รวมข้อมูลก่อนหน้านี้และความเชื่อส่วนตัวเกี่ยวกับพารามิเตอร์และนั่นคือไม่ซ้ำกัน การวิเคราะห์แบบเบย์นั้นสัมพันธ์กับการวิเคราะห์แบบเบย์ก่อนหน้านี้เสมอ ดังนั้นไม่มีความจำเป็นแน่นอนสำหรับพารามิเตอร์ที่แท้จริงจะเป็นการสนับสนุนของ\เห็นได้ชัดว่าเมื่อการสนับสนุนนี้เป็นชุดเชื่อมต่อขนาดกะทัดรัดθ0πxf(x|θ0)πAค่าใด ๆ ของพารามิเตอร์ที่อยู่นอกชุดไม่สามารถประมาณค่าได้อย่างต่อเนื่องโดยค่าเฉลี่ยหลังแต่สิ่งนี้ไม่ได้ป้องกันไม่ให้ตัวประมาณสามารถยอมรับได้Aθ^π


เกี่ยวกับประเด็นสุดท้ายของคุณนั่นคือสิ่งที่ทำให้ฉันสับสน: พูดว่าฉันมีการแจกแจงแบบปกติโดยที่มีจำนวนติดลบเล็กน้อยพอสมควร ถ้าด้วยเหตุผลแปลก ๆ บางอย่างฉันใส่ log-normal ก่อน (สนับสนุน ) บน (ไม่ว่ามันจะสมเหตุสมผลมากแค่ไหน) การประมาณค่า Bayes ภายใต้เรื่องก่อนหน้านี้ก็คงจะแย่กว่าการประมาณ minimax ซึ่งไม่ควรเกิดขึ้น แต่บางทีฉันอาจตีความบางสิ่งบางอย่างผิดที่นี่ ...μ[0,+)μ
user32849

1
โดยปกติแล้ว cf Berger (1985) ซึ่งเป็นที่นิยมน้อยที่สุดก่อนหน้านี้สอดคล้องกับความเสี่ยงขั้นต่ำสุด
ซีอาน

1
ผมสับสนจริงๆที่นี่: หนังสือของคุณ (บทที่ 2) ดูเหมือนจะคิดว่าและโดยเฉพาะในทฤษฎีบท 2.4.17,ที่ดีน้อย ก่อนคือการกระจายไม่ต่อเนื่องมากกว่า\แต่ฉันเดาว่าฉันควรอ่านหน้า 10 อย่างระมัดระวังมากขึ้น ;-)θπ(θ)Θ=[m,m]Θ
user32849

1
ความเสี่ยงรวมไม่เกี่ยวข้องกับพารามิเตอร์ "จริง" ในทุกขั้นตอน ดังนั้นในแง่นี้มันไม่สำคัญ
ซีอาน

1
ดังนั้นในแง่หนึ่งความเสี่ยงจับการสูญเสียที่เราคาดหวังไม่ใช่ความเสี่ยงที่เราประสบ สิ่งนี้เป็นประโยชน์อย่างมากขอบคุณมาก!
user32849

8
  1. ใช่โดยทั่วไปแล้วสันนิษฐานว่าจริงอยู่ในโดเมนของก่อน มันเป็นความรับผิดชอบของนักสถิติที่จะเห็นว่านี่เป็นกรณีθ

  2. โดยปกติแล้วใช่ ตัวอย่างเช่นเมื่อประมาณค่าพารามิเตอร์ค่าเฉลี่ยหรือพารามิเตอร์ตำแหน่งใด ๆ ก่อนหน้าจะมีค่าจริงในโดเมน (หากพารามิเตอร์เป็นที่รู้จักมากกว่าศูนย์เช่น "หมายถึงจำนวนอุบัติเหตุบนสะพานเบย์ต่อวัน" ค่าก่อนหน้าไม่จำเป็นต้องรวมค่าลบอย่างชัดเจน) หากเราประมาณความน่าจะเป็น ก่อนหน้าจะมีค่าจริงในโดเมน หากเรากำลังสร้างคำศัพท์ก่อนหน้าเกี่ยวกับความแปรปรวนใด ๆ ก่อนหน้าจะมีค่าจริงในโดเมน ... และอื่น ๆ(,)[0,1](0,)

  3. หากด้านหลังของคุณ "ซ้อนกัน" ที่ขอบหนึ่งของโดเมนก่อนหน้านี้และก่อนหน้าของคุณกำหนดข้อ จำกัด ที่ไม่จำเป็นบนโดเมนที่ขอบเดียวกันนั่นคือตัวบ่งชี้เฉพาะกิจที่ข้อ จำกัด ที่ไม่จำเป็นอาจทำให้คุณมีปัญหา แต่สิ่งนี้จะเกิดขึ้นได้หากก) คุณได้สร้างแบบฟอร์มก่อนหน้าซึ่งส่วนใหญ่ถูกขับเคลื่อนด้วยความสะดวกสบายแทนที่จะเป็นความรู้เดิมที่เกิดขึ้นจริงและ b) รูปแบบที่เกิดจากความสะดวกสบายของแบบก่อนหน้านี้จะ จำกัด โดเมนของพารามิเตอร์ โดเมนธรรมชาติถือได้ว่าเป็น

ตัวอย่างของสิ่งนี้คือสิ่งเก่า ๆ ที่ล้าสมัยมานานหวังว่าการฝึกฝนของขอบเขตก่อนหน้านี้เกี่ยวกับความแปรปรวนเล็กน้อยห่างจากศูนย์เล็กน้อยเพื่อหลีกเลี่ยงปัญหาการคำนวณที่อาจเกิดขึ้น หากค่าที่แท้จริงของความแปรปรวนอยู่ระหว่างขอบเขตและศูนย์, ดี ... แต่จริง ๆ แล้วคิดเกี่ยวกับค่าที่เป็นไปได้ของความแปรปรวนที่ได้รับข้อมูลหรือ (ตัวอย่างเช่น) การใส่ค่าก่อนหน้าบนบันทึกของความแปรปรวนแทนจะช่วยให้ คุณต้องหลีกเลี่ยงปัญหานี้และความเฉลียวฉลาดที่คล้ายคลึงกันควรอนุญาตให้คุณหลีกเลี่ยงนักบวชที่ จำกัด โดเมนโดยทั่วไป

  1. ตอบโดย # 1

2
ในโอกาสที่ใครก็ตามที่ downvote คำตอบกลับ - ทำไม "ไม่มีประโยชน์"?
jbowman

3

คำตอบที่ง่ายและเข้าใจง่ายคือก่อนหน้านี้จะสะท้อนความรู้ก่อนหน้าของคุณเกี่ยวกับและความรู้ขั้นต่ำที่คุณควรมีเป็นเรื่องเกี่ยวกับโดเมน หากคุณใช้ขอบเขตก่อนหน้านี้คุณจะถือว่าค่านอกขอบเขตมีความน่าจะเป็นศูนย์เป็นไปไม่ได้และนี่เป็นข้อสันนิษฐานที่แข็งแกร่งมากซึ่งไม่ควรทำโดยไม่มีเหตุผลที่ดี นี่คือเหตุผลที่คนที่ไม่ต้องการที่จะทำให้สมมติฐานก่อนที่แข็งแรงใช้ไพรเออร์ที่คลุมเครือในไป\θ

นอกเหนือจากกรณีที่มีขอบเขตเมื่อตัวอย่างของคุณเติบโตขึ้นหรือมีความแม่นยำมากขึ้นบ่งบอกถึงข้อมูลเพิ่มเติมในที่สุดผู้หลังของคุณควรมารวมกันที่ไม่ว่าจะเกิดอะไรขึ้นθ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.