อะไรคือเหตุผลในการตัดสินใจเชิงทฤษฎีสำหรับขั้นตอนช่วงเวลาที่น่าเชื่อถือแบบเบย์?


20

(เพื่อดูว่าทำไมฉันถึงเขียนสิ่งนี้ให้ตรวจสอบความคิดเห็นด้านล่างคำตอบของคำถามนี้ )

ข้อผิดพลาดประเภท III และทฤษฎีการตัดสินใจเชิงสถิติ

การให้คำตอบที่ถูกต้องกับคำถามที่ผิดนั้นบางครั้งเรียกว่าข้อผิดพลาด Type III ทฤษฎีการตัดสินใจเชิงสถิติเป็นรูปแบบของการตัดสินใจภายใต้ความไม่แน่นอน มันมีกรอบแนวคิดที่สามารถช่วยหนึ่งหลีกเลี่ยงข้อผิดพลาดประเภทที่สาม องค์ประกอบสำคัญของกรอบที่เรียกว่าฟังก์ชั่นการสูญเสีย มันต้องใช้สองข้อโต้แย้ง: ครั้งแรกคือ (ส่วนย่อยที่เกี่ยวข้องของ) สถานะที่แท้จริงของโลก (เช่นในปัญหาการประมาณค่าพารามิเตอร์ค่าพารามิเตอร์จริง ); ที่สองคือองค์ประกอบในชุดของการกระทำที่เป็นไปได้ (เช่นในปัญหาการประมาณค่าพารามิเตอร์การประมาณθ )θθ^). เอาท์พุทแบบจำลองการสูญเสียที่เกี่ยวข้องกับทุกการกระทำที่เป็นไปได้เกี่ยวกับทุกสถานะที่แท้จริงที่เป็นไปได้ของโลก ตัวอย่างเช่นในปัญหาการประมาณค่าพารามิเตอร์ฟังก์ชันการสูญเสียที่รู้จักกันดีคือ:

  • การสูญเสียข้อผิดพลาดแบบสัมบูรณ์L(θ,θ^)=|θθ^|
  • การสูญเสียข้อผิดพลาดกำลังสองL(θ,θ^)=(θθ^)2
  • การสูญเสีย LINEX ของHal VarianL(θ,θ^;k)=exp(k(θθ^))k(θθ^)1, k0

ตรวจสอบคำตอบเพื่อค้นหาคำถาม

มีกรณีหนึ่งที่อาจพยายามทำให้เกิดข้อผิดพลาดประเภท III ที่สามารถหลีกเลี่ยงได้โดยมุ่งเน้นไปที่การสร้างฟังก์ชั่นการสูญเสียที่ถูกต้องและดำเนินการผ่านวิธีการตัดสินใจเชิงทฤษฎีที่เหลือ นั่นไม่ใช่บทสรุปของฉัน - นักสถิติมีเครื่องมือและเทคนิคมากมายที่ทำงานได้ดีแม้ว่าจะไม่ได้มาจากวิธีการดังกล่าวก็ตาม แต่ผลลัพธ์สุดท้ายนั้นสำหรับฉันก็คือนักสถิติส่วนใหญ่ไม่รู้จักและไม่สนใจทฤษฎีการตัดสินใจเชิงสถิติและฉันคิดว่าพวกเขาขาดหายไป สำหรับนักสถิติเหล่านั้นฉันจะยืนยันว่าเหตุผลที่พวกเขาอาจพบว่าทฤษฎีการตัดสินใจเชิงสถิติมีคุณค่าในแง่ของการหลีกเลี่ยงข้อผิดพลาด Type III นั้นเป็นเพราะมันมีกรอบที่จะถามขั้นตอนการวิเคราะห์ข้อมูลใด ๆ ที่เสนอ:ฟังก์ชั่นการสูญเสีย (ถ้ามี) ขั้นตอนใดที่จัดการได้อย่างเหมาะสมที่สุด? นั่นคือในสถานการณ์การตัดสินใจอะไรจริง ๆ แล้วมันให้คำตอบที่ดีที่สุด?

หลังคาดว่าจะสูญเสีย

จากมุมมองของเบย์ฟังก์ชั่นการสูญเสียคือสิ่งที่เราต้องการ เราสวยมากสามารถข้ามส่วนที่เหลือของทฤษฎีการตัดสินใจ - เกือบโดยนิยามสิ่งที่ดีที่สุดที่จะทำคือการลดหลังคาดว่าการสูญเสีย, ที่อยู่, พบการกระทำที่ช่วยลดเป็น)~ L ( ) = Θ L ( θ , ) P ( θ | D ) d θaL~(a)=ΘL(θ,a)p(θ|D)dθ

(และเป็นมุมมองที่ไม่ใช่เบส์ดีก็เป็นทฤษฎีบทของทฤษฎีการตัดสินใจ frequentist - เฉพาะ Wald ของสินค้าชั้นทฤษฎีบท - ว่าการดำเนินการที่ดีที่สุดเสมอจะได้รับการลดคชกรรมหลังคาดว่าการสูญเสียที่เกี่ยวกับบางส่วน (อาจจะไม่เหมาะสม) ก่อนหน้าความยากลำบากของผลลัพธ์นี้คือทฤษฎีบทการดำรงอยู่ไม่ได้ให้คำแนะนำเกี่ยวกับสิ่งที่เคยใช้มาก่อน แต่มัน จำกัด ขอบเขตของขั้นตอนการทำงานที่เราสามารถ "สลับกลับ" ได้อย่างมีประสิทธิภาพเพื่อค้นหาว่าคำถามแบบไหน โดยเฉพาะอย่างยิ่งขั้นตอนแรกในการย้อนกลับขั้นตอนที่ไม่ใช่แบบเบย์คือการคิดว่าขั้นตอนแบบเบย์แบบใด (ถ้ามี) ทำซ้ำหรือใกล้เคียงที่สุด

สวัสดี Cyan คุณรู้ไหมว่านี่เป็นเว็บไซต์ถาม - ตอบใช่ไหม

ซึ่งนำฉันมาสู่คำถามเชิงสถิติ ในสถิติแบบเบย์เมื่อให้การประมาณช่วงเวลาสำหรับพารามิเตอร์ univariate ขั้นตอนที่น่าเชื่อถือทั่วไปสองขั้นตอนคือช่วงเวลาที่เชื่อถือได้เชิงควอนตัมและช่วงความน่าเชื่อถือหลังหนาแน่นสูงสุด ฟังก์ชั่นการสูญเสียคืออะไรที่อยู่เบื้องหลังขั้นตอนเหล่านี้?


ดีมาก. แต่พวกเขาเป็นฟังก์ชั่นการสูญเสียเพียงอย่างเดียวที่พิสูจน์ความชอบธรรมของกระบวนการเหล่านี้
แขกที่เข้าพัก

1
@Cyan >> ขอบคุณสำหรับการถามและตอบคำถามให้ฉัน :) ฉันจะอ่านทั้งหมดและอัปโหลดเมื่อใดก็ตามที่เป็นไปได้
Stéphane Laurent

4
อ้างที่น่าสนใจจากเบอร์เกอร์สถิติทฤษฎีการตัดสินใจและการวิเคราะห์แบบเบย์ : "เราไม่ได้ดูชุดที่น่าเชื่อถือว่ามีบทบาทในการตัดสินใจตามทฤษฎีที่ชัดเจนและดังนั้นจึงโกงของ 'optimality' วิธีการเลือกชุดที่น่าเชื่อถือ"
ไซมอนเบิร์น

1
@Simon Byrne >> 1985 เป็นเวลานานแล้ว ฉันสงสัยว่าเขายังคิดอยู่หรือเปล่า
Cyan

1
@ ฟ้า: ฉันไม่รู้ แต่ทฤษฎีการตัดสินใจเป็นส่วนหนึ่งของสถิติแบบเบย์ที่ไม่ได้เปลี่ยนแปลงอะไรมากในช่วง 27 ปีที่ผ่านมา (มีผลลัพธ์ที่น่าสนใจเล็กน้อย แต่หนังสือของเบอร์เกอร์ยังคงเป็นมาตรฐานอ้างอิง) โดยเฉพาะ เมื่อเปรียบเทียบกับความนิยมขั้นต่ำในผลลัพธ์สถิติบ่อย ๆ
Simon Byrne

คำตอบ:


15

ในการประมาณค่าช่วงเวลาแบบไม่แปรชุดของการกระทำที่เป็นไปได้คือชุดของคู่ที่สั่งซื้อซึ่งระบุจุดสิ้นสุดของช่วงเวลา ขอให้องค์ประกอบของชุดที่จะแสดงโดยข(a,b), ab

ช่วงความหนาแน่นหลังสูงสุด

f(θ)

LHPD(θ,(a,b);k)=I(θ[a,b])+k(ba),0<kmaxθf(θ) ,

ที่เป็นฟังก์ชั่นตัวบ่งชี้ สิ่งนี้ทำให้เกิดการสูญเสียด้านหลังI()

L~HPD((a,b);k)=1Pr(aθb|D)+k(ba)ก)

การตั้งค่าให้เงื่อนไขที่จำเป็นสำหรับ a ท้องถิ่นที่เหมาะสมที่สุดในการตกแต่งภายในของพื้นที่พารามิเตอร์: - ตรงตามกฎสำหรับช่วง HPD ตามที่คาดไว้aL~HPD=bL~HPD=0f(a)=f(b)=k

รูปแบบของให้ข้อมูลเชิงลึกว่าทำไมช่วงเวลาของ HPD จึงไม่แปรผันกับการแปลงแบบ monotone ที่เพิ่มขึ้นของพารามิเตอร์ ช่วง -space HPD เปลี่ยนเป็นช่องว่างจะแตกต่างจากช่วงเวลา -space HPD เพราะช่วงเวลาทั้งสองสอดคล้องกับฟังก์ชั่นการสูญเสียที่แตกต่างกัน: ช่วงเวลา -space HPD สอดคล้องกับ ความยาวเปลี่ยนโทษ(ก))L~HPD((a,b);k)g(θ)θg(θ)g(θ)g(θ)k(g(b)g(a))

ช่วงเวลาที่น่าเชื่อถือตาม Quantile

พิจารณาการประเมินจุดด้วยฟังก์ชันการสูญเสีย

Lq(θ,θ^;p)=p(θ^θ)I(θ<θ^)+(1p)(θθ^)I(θθ^), 0p11

การสูญเสียหลังคาดว่าจะเป็น

L~q(θ^;p)=p(θ^E(θ|θ<θ^,D))+(1p)(E(θ|θθ^,D)θ^)theta})

การตั้งค่าให้ผลสมการโดยปริยายddθ^L~q=0

Pr(θ<θ^|D)=p ,

นั่นคือที่ดีที่สุดคือ % quantile ของการแจกแจงหลังตามที่คาดไว้ (100หน้า)θ^(100p)

ดังนั้นเพื่อให้ได้ค่าประมาณตามช่วงควอนตัลฟังก์ชันการสูญเสียคือ

LqCI(θ,(a,b);pL,pU)=Lq(θ,a;pL)+Lq(θ,b;pU)p_U)


1
วิธีที่จะกระตุ้นให้นี้ก็คืออีกครั้งเขียนฟังก์ชั่นการสูญเสียเป็น (ถ่วงน้ำหนัก) ผลรวมของความกว้างของช่วงบวกระยะทางในกรณีใด ๆ โดยที่ช่วงเวลาที่ล้มเหลวเพื่อให้ครอบคลุมความจริง\θ
แขกที่เข้าพัก

มีวิธีอื่นในการคิดถึงช่วงเวลาแบบควอนไทล์ซึ่งไม่ได้อ้างอิงควอนไทล์โดยตรงหรือความยาวของช่วงเวลา ฉันหวังว่าจะมีบางอย่างเช่น "ช่วงเวลา
วอไทล์

@ RasmusBååthโดยทั่วไปแล้วคุณกำลังถามว่า "อะไรคือเงื่อนไขที่จำเป็นสำหรับฟังก์ชันการสูญเสียสำหรับช่วงเวลาควอไทล์เพื่อแก้ปัญหาการลดลงของการสูญเสียหลังที่คาดหวังไว้" สัญชาตญาณของฉันเพียงแค่วิธีที่คณิตศาสตร์ทำงานในทิศทางไปข้างหน้านั่นคือมันค่อนข้างมาก ถึงกระนั้นก็ยังไม่ได้พิสูจน์
สีฟ้า

ดังนั้นฉันไม่แน่ใจเกี่ยวกับฟังก์ชั่นการสูญเสีย แต่ฉันรู้ขั้นตอนที่ขึ้นอยู่กับฟังก์ชั่นการสูญเสียจุดจะส่งผลให้ทั้ง HPD หรือช่วงเวลาควอไทล์ สมมติคุณมีตัวอย่างที่สุ่มวาดจากด้านหลัง 1. เลือกจุดมีการสูญเสียด้านหลังที่ต่ำที่สุดและเพิ่มจุดนั้นในช่วงเวลาของคุณ 2. ลบจุดนั้นออกจากเนื่องจากการลบนี้การสูญเสียหลังสำหรับจุดที่เหลือในตอนนี้อาจมีการเปลี่ยนแปลง (ขึ้นอยู่กับ ) 3. มีความสุขถ้าช่วงเวลาของคุณมีความครอบคลุมที่จำเป็นไม่เช่นนั้นให้ทำซ้ำจาก (1) L = L0 ให้ HPD, L = L1 ให้ช่วงเวลาควอไทล์ s s s s LLssssL
Rasmus Bååth

5
เพียงแค่การกล่าวขวัญว่ามาตรา 5.5.3 ของคชกรรม Choiceครอบคลุมการสูญเสียมาตามชุดที่น่าเชื่อถือ ...
ซีอาน

1

ช่วงเวลาที่มีขนาดเล็กที่สุด

ทางเลือกหนึ่งที่ชัดเจนของฟังก์ชั่นการสูญเสียสำหรับการเลือกช่วงเวลา (ทั้งแบบเบย์และแบบประจำ) คือการใช้ขนาดของช่วงเวลาตามที่วัดได้ในรูปของการแจกแจงส่วนเพิ่ม ดังนั้นเริ่มต้นด้วยคุณสมบัติที่ต้องการหรือฟังก์ชันการสูญเสียและหาช่วงเวลาที่เหมาะสมที่สุด สิ่งนี้มีแนวโน้มที่จะไม่ทำตามที่เป็นตัวอย่างจากคำถามปัจจุบันแม้ว่ามันจะเป็นไปได้ สำหรับชุดที่น่าเชื่อถือแบบเบย์สิ่งนี้สอดคล้องกับการลดความน่าจะเป็นก่อนหน้าของช่วงเวลาหรือเพื่อเพิ่มความเชื่อมั่นสูงสุดเช่นตามที่ระบุไว้ในอีแวนส์ (2016) ขนาดอาจใช้เพื่อเลือกชุดความมั่นใจที่พบบ่อย (Schafer 2009) ทั้งสองวิธีมีความสัมพันธ์กันและสามารถนำไปปฏิบัติได้อย่างง่ายดายผ่านกฎการตัดสินใจที่รวมการตัดสินใจด้วยข้อมูลสำคัญร่วมกัน (Bartels 2017)

Bartels, C. , 2017 การใช้ความรู้เดิมในการทดสอบเป็นประจำ figshare https://doi.org/10.6084/m9.figshare.4819597.v3

Evans, M. , 2016. การวัดหลักฐานทางสถิติโดยใช้ความเชื่อสัมพัทธ์ วารสารเทคโนโลยีชีวภาพการคำนวณและโครงสร้าง, 14, pp.91-96

Schafer, CM และ Stark, PB, 2009 สร้างพื้นที่ความมั่นใจในขนาดที่เหมาะสม วารสารสมาคมสถิติอเมริกัน, 104 (487), pp.1080-1089


ฉันเห็นว่าคุณอ้างถึง Evans ตามข้อเสนอแนะของ Keith O'Rourke ( andrewgelman.com 2016/07/17/17 ) ฉันชอบสิ่งของของอีแวนส์จริงๆ
สีฟ้า

ฉันดีใจมากที่ได้รับแจ้งจากคี ธ เกี่ยวกับงานที่เริ่มแตกต่างกัน แต่จบลงด้วยข้อสรุปที่คล้ายกัน! สิ่งสำคัญที่ต้องกล่าวถึงนี้
user36160
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.