การเชื่อมต่อระหว่างภูมิภาคที่น่าเชื่อถือกับการทดสอบสมมติฐานแบบเบย์คืออะไร?


38

ในสถิติที่ใช้บ่อยมีการเชื่อมต่ออย่างใกล้ชิดระหว่างช่วงความมั่นใจและการทดสอบ ใช้การอนุมานเกี่ยวกับในการแจกแจงเป็นตัวอย่างช่วงเวลาความเชื่อมั่น มีค่าทั้งหมดของที่ไม่ได้ปฏิเสธโดย -test ที่ระดับนัยสำคัญ\N ( μ , σ 2 ) 1 - α ˉ x ± เสื้อα / 2 ( n - 1 ) s / μยังไม่มีข้อความ(μ,σ2)1-α μtα

x¯±เสื้อα/2(n-1)s/n
μเสื้อα

ช่วงความเชื่อมั่นบ่อยครั้งอยู่ในการทดสอบแบบคว่ำนี้ (โดยบังเอิญนี่หมายความว่าเราสามารถแปลค่าเป็นค่าที่เล็กที่สุดของซึ่งค่า null ของพารามิเตอร์จะรวมอยู่ในช่วงความเชื่อมั่นฉันพบว่านี่เป็นวิธีที่มีประโยชน์ในการ อธิบายสิ่งที่ค่าจริง ๆ กับคนที่รู้สถิติเล็กน้อย)α 1 - α pพีα1-αพี

เมื่ออ่านเกี่ยวกับรากฐานการตัดสินใจทางทฤษฎีของภูมิภาคที่น่าเชื่อถือของเบย์ฉันเริ่มสงสัยว่ามีการเชื่อมต่อ / ความเท่าเทียมกันที่คล้ายคลึงกันระหว่างภูมิภาคที่น่าเชื่อถือกับการทดสอบแบบเบย์

  • มีการเชื่อมต่อทั่วไปหรือไม่?
  • หากไม่มีการเชื่อมต่อทั่วไปมีตัวอย่างที่มีการเชื่อมต่อหรือไม่?
  • หากไม่มีการเชื่อมต่อทั่วไปเราจะเห็นสิ่งนี้ได้อย่างไร

คำถามที่เกี่ยวข้องซึ่งฉันสงสัยว่า - ใครบางคนสามารถชี้ให้ฉันไปที่กระดาษที่พวกเขาคิดว่าเป็น "มาตรฐานทองคำ" หรือ "ตัวอย่างมาตรฐาน" ของการทดสอบสมมติฐานแบบเบย์ที่ใช้กับปัญหาจริงแทนที่จะเป็นตัวอย่างของเล่น ฉันไม่เคยเข้าใจการทดสอบสมมติฐานแบบเบย์จริง ๆ และฉันคิดว่าฉันจะพบตัวอย่างที่ดีของการใช้คำแนะนำ
Patrick Caldon

2
@PatrickCaldon ฉันสงสัยว่ามี "กระดาษสีทอง" ในเรื่องนี้เพราะการทดสอบสมมติฐานแบบเบย์นั้นถูกกำหนดในกรอบการตัดสินใจเชิงทฤษฎี หนังสือที่กล่าวถึงในคำตอบของMånsTเป็นข้อมูลที่ดีหนังสือของเบอร์เกอร์และการพูดคุยอาจเป็นที่สนใจ

ฉันเชื่อว่ากระดาษba.stat.cmu.edu/vol03is01.phpสามารถอธิบายการสนทนาของเราได้ที่นี่
Carlos AB Pereira

ขอบคุณ @Carlos! ลิงค์ดูเหมือนจะยังใช้งานไม่ได้ในตอนนี้ แต่ฉันเดาว่ามันจะนำไปสู่บทความในปี 2008 ของคุณในการวิเคราะห์แบบเบย์ด้วย Stern และ Wechsler ฉันพบว่าการอ่านที่น่าสนใจมาก!
MånsT

เรียนMånsT: การวิเคราะห์แบบเบย์ย้ายไปที่โครงการ Euclid ศ. Carlos paper อยู่ที่นี่: projecteuclid.org/…
Zen

คำตอบ:


19

ฉันจัดการเพื่อหาตัวอย่างที่มีการเชื่อมต่ออยู่ ดูเหมือนว่าจะขึ้นอยู่กับการเลือกฟังก์ชั่นการสูญเสียของฉันและการใช้สมมติฐานเชิงประกอบ

ฉันเริ่มต้นด้วยตัวอย่างทั่วไปแล้วตามด้วยกรณีพิเศษอย่างง่าย ๆ ที่เกี่ยวข้องกับการแจกแจงแบบปกติ

ตัวอย่างทั่วไป

สำหรับการที่ไม่รู้จักพารามิเตอร์ให้มีพื้นที่พารามิเตอร์และพิจารณาสมมติฐานเมื่อเทียบกับทางเลือก\Θ θ Θ 0 θ Θ 1 = Θ Θ 0θΘθΘ0θΘ1=ΘΘ0

ให้เป็นฟังก์ชั่นทดสอบโดยใช้สัญกรณ์ในThe Bayesian Choiceของซีอาน (ซึ่งเรียงลำดับย้อนหลังกับสิ่งที่ฉันคุ้นเคยอย่างน้อยที่สุด) ดังนั้นเราจึงปฏิเสธถ้าและยอมรับถ้า 1 พิจารณาฟังก์ชั่นการสูญเสีย การทดสอบ Bayes เป็นΘ 0 φ = 0 Θ 0 φ = 1 L ( θ , φ ) = { 0 , ถ้า  φ = ฉันΘ 0 ( θ ) 0 , ถ้า  θ Θ 0  และ  φ = 0 1 , ถ้า  θ Θ 1  และ  φ = 1. φ เธ ( x ) =φΘ0φ=0Θ0φ=1

L(θ,φ)={0,ถ้า φ=ผมΘ0(θ)a0,ถ้า θΘ0 และ φ=0a1,ถ้า θΘ1 และ φ=1
φπ(x)=1ผมP(θΘ0|x)a1(a0+a1)-1.

ใช้และa_1โมฆะสมมติฐานเป็นที่ยอมรับถ้า1-1 = 1 - α Θ 0 P ( θ Θ 0 | x ) 1 - αa0=α0.5a1=1-αΘ0P(θΘ0|x)1-α

ตอนนี้เป็นภูมิภาคที่มีความน่าเชื่อถือเป็นพื้นที่ดังกล่าวว่า1- ดังนั้นตามคำนิยามถ้าเป็นเช่นนั้น ,สามารถเป็นภูมิภาคที่น่าเชื่อถือหาก 0 P ( Θ | x ) 1 - อัลฟ่าΘ 0 P ( θ Θ 0 | x ) 1 - อัลฟ่าΘ P ( Θ 0Θ | x ) > 0ΘP(Θ|x)1-αΘ0P(θΘ0|x)1-αΘP(Θ0Θ|x)>0

เรายอมรับสมมติฐานถ้าเฉพาะในกรณีที่แต่ละ ภูมิภาค -credible มีไม่ใช่เซตย่อยของ null \Θ 01-αΘ0

กรณีพิเศษที่ง่ายกว่า

หากต้องการแสดงตัวอย่างการทดสอบประเภทใดที่เรามีในตัวอย่างด้านบนให้พิจารณากรณีพิเศษต่อไปนี้

ให้กับ(0,1) ชุด ,และเพื่อที่ว่าเราต้องการที่จะทดสอบว่า0θ ~ N ( 0 , 1 ) Θ = R Θ 0 = ( - , 0 ] Θ 1 = ( 0 , ) θ 0x~ยังไม่มีข้อความ(θ,1)θ~ยังไม่มีข้อความ(0,1)Θ=RΘ0=(-,0]Θ1=(0,)θ0

การคำนวณมาตรฐานให้ที่เป็น cdf ปกติมาตรฐานΦ()

P(θ0|x)=Φ(-x/2),
Φ()

ให้เป็นเช่นนั้น\เป็นที่ยอมรับเมื่อalpha}ไว( ซี1 - α ) = 1 - α Θ 0 - x / Z1-αΦ(Z1-α)=1-αΘ0-x/2>Z1-α

สิ่งนี้เทียบเท่ากับการยอมรับเมื่อสำหรับ ,ถูกปฏิเสธดังนั้นเมื่อx> α=0.05Θ0x>-2.33x2Zα.α=0.05Θ0x>-2.33

แต่ถ้าเราใช้ก่อน ,ถูกปฏิเสธเมื่อx>Θ 0 x > - 2.33 - νθ~ยังไม่มีข้อความ(ν,1)Θ0x>-2.33-ν

ความคิดเห็น

ฟังก์ชั่นการสูญเสียข้างต้นที่เราคิดว่าการยอมรับสมมติฐานว่างเปล่านั้นเลวร้ายยิ่งกว่าการปฏิเสธมันอย่างผิด ๆ อาจมองแวบแรกดูเหมือนว่าจะเป็นสิ่งประดิษฐ์เล็กน้อย อย่างไรก็ตามมันสามารถนำไปใช้อย่างมากในสถานการณ์ที่ "เชิงลบเท็จ" อาจมีค่าใช้จ่ายสูงเช่นเมื่อคัดกรองโรคติดต่ออันตรายหรือผู้ก่อการร้าย

เงื่อนไขที่ทุกภูมิภาคที่น่าเชื่อถือจะต้องมีส่วนหนึ่งของนั้นแข็งแกร่งกว่าที่ฉันคาดไว้เล็กน้อย: ในกรณีที่พบบ่อยการติดต่อกันนั้นอยู่ระหว่างการทดสอบเดี่ยวและช่วงความเชื่อมั่นเดียวและไม่ใช่ระหว่างเดี่ยว ทดสอบและช่วงเวลาทั้งหมด 1 - α 1 - αΘ01-α1-α


2
+1 ผมจะใช้เขตความน่าเชื่อถือแทนช่วงเวลาที่น่าเชื่อถือ

1
ขอบคุณ @Procrastinator! ฉันแก้ไขคำตอบแล้วเปลี่ยนเป็น "ภูมิภาค" ในขณะที่ฉันอยู่ที่นั่น ฉันส่วนใหญ่ทำงานร่วมกับภูมิภาค HPD ของผู้โพสต์ที่ไม่มีรูปแบบเดียวดังนั้นฉันมักจะคิดว่าภูมิภาคที่มีความมั่นใจเป็นช่วงเวลา :)
MånsT

12

MichaelและFraijoแนะนำว่าเพียงแค่ตรวจสอบว่าค่าพารามิเตอร์ที่สนใจนั้นมีอยู่ในภูมิภาคที่น่าเชื่อถือหรือไม่นั้นคือค่าเบเซียนเทียบเท่ากับการเปลี่ยนช่วงความเชื่อมั่น ฉันค่อนข้างสงสัยเกี่ยวกับเรื่องนี้ในตอนแรกเนื่องจากมันไม่ชัดเจนสำหรับฉันว่ากระบวนการนี้ส่งผลให้มีการทดสอบแบบเบย์ (ตามปกติ)

ตามที่ปรากฎมันทำ - อย่างน้อยถ้าคุณยินดีรับฟังก์ชั่นการสูญเสียบางประเภท ขอบคุณZenที่ให้การอ้างอิงไปยังเอกสารสองฉบับที่สร้างการเชื่อมต่อระหว่างภูมิภาค HPD และการทดสอบสมมติฐาน:

ฉันจะพยายามสรุปพวกเขาที่นี่เพื่อใช้อ้างอิงในอนาคต ในอะนาล็อกกับตัวอย่างในคำถามเดิมฉันจะปฏิบัติต่อกรณีพิเศษที่สมมติฐานคือที่คือพื้นที่พารามิเตอร์Θ

H0:θΘ0={θ0}และH1:θΘ1=ΘΘ0,
Θ

Pereira & สเติร์นนำเสนอวิธีการในการทดสอบสมมติฐานกล่าวโดยไม่ต้องใส่ความน่าจะเป็นก่อนในและΘ 1Θ0Θ1 \

ปล่อยแสดงถึงความหนาแน่นของฟังก์ชั่นและกำหนดθ T ( x ) = { θ : π ( θ | x ) > π ( θ 0 | x ) }π()θ

T(x)={θ:π(θ|x)>π(θ0|x)}.

ซึ่งหมายความว่าเป็นภูมิภาคที่ HPDมีความน่าเชื่อถือx)T(x)P(θT(x)|x)

การทดสอบ Pereira-Stern ปฏิเสธเมื่อคือ "เล็ก" ( , พูด) สำหรับด้านหลังรูปแบบเดียวนั่นหมายความว่าอยู่ในส่วนท้ายของส่วนหลังทำให้มาตรฐานนี้ค่อนข้างคล้ายกับการใช้ค่า p กล่าวอีกนัยหนึ่งถูกปฏิเสธที่ระดับถ้าหากไม่มีในพื้นที่ HPD P ( θ T ( x ) | x ) < 0.05 θ 0 Θ 0 5 % 95 %Θ0P(θT(x)|x)<0.05θ0Θ05 %95 %

ปล่อยให้ฟังก์ชั่นทดสอบเป็นถ้าได้รับการยอมรับและถ้าถูกปฏิเสธ Madruga และคณะ เสนอฟังก์ชั่นการสูญเสีย ด้วย 01 Θ 0 0 Θ 0 L ( θ , φ , x ) = { ( 1 - ฉัน ( θ T ( x ) ) , ถ้า  φ ( x ) = 0 B + C ฉัน ( θ ( T ( x ) ) , ถ้า  φ ( x ) = 1 ,φ1Θ00Θ0

L(θ,φ,x)={a(1-ผม(θT(x)),ถ้า φ(x)=0+ผม(θ(T(x)),ถ้า φ(x)=1,
a,,>0

การลดความสูญเสียที่คาดหวังน้อยที่สุดจะนำไปสู่การทดสอบ Pereira-Stern โดยที่ถูกปฏิเสธหากΘ0P(θT(x)|x)<(+)/(a+).

จนถึงทุกอย่างเป็นอย่างดี การทดสอบ Pereira-Stern นั้นเทียบเท่ากับการตรวจสอบว่าอยู่ในภูมิภาค HPD หรือไม่และมีฟังก์ชั่นการสูญเสียที่สร้างการทดสอบนี้ซึ่งหมายความว่ามันก่อตั้งขึ้นในทฤษฎีการตัดสินใจθ0

ส่วนที่แย้งว่าเป็นที่ฟังก์ชั่นการสูญเสียขึ้นอยู่กับx xในขณะที่ฟังก์ชั่นการสูญเสียดังกล่าวปรากฏในวรรณกรรมสองสามครั้ง แต่ดูเหมือนว่าพวกเขาจะไม่ได้รับการยอมรับโดยทั่วไปว่ามีเหตุผลมาก

สำหรับการอ่านเพิ่มเติมในหัวข้อนี้ดูรายการเอกสารที่อ้างถึง Madruga และคณะ บทความ


อัปเดตตุลาคม 2555:

ฉันไม่พอใจอย่างสมบูรณ์กับฟังก์ชั่นการสูญเสียข้างต้นเนื่องจากการพึ่งพาทำให้การตัดสินใจเป็นเรื่องส่วนตัวมากกว่าที่ฉันต้องการ ผมใช้เวลาบางเวลาคิดเพิ่มเติมเกี่ยวกับปัญหานี้และสิ้นสุดที่เขียนโน้ตสั้น ๆ เกี่ยวกับเรื่องนี้โพสต์เมื่อ arXiv ก่อนหน้านี้ในวันนี้x

ให้แสดงฟังก์ชั่นหลังของ quantileเช่นว่าQ แทนที่จะ HPD ชุดเราพิจารณากลาง (เท่ากับนก) ช่วงเวลาx)) ในการทดสอบใช้ช่วงเวลานี้สามารถเป็นธรรมในกรอบการตัดสินใจทฤษฎีโดยไม่ต้องฟังก์ชั่นการสูญเสียที่ขึ้นอยู่กับxQα(θ|x)θP(θQα(θ|x))=α(qα/2(θ|x),q1α/2(θ|x))Θ0x

เคล็ดลับคือการปรับเปลี่ยนปัญหาของการทดสอบสมมติฐานจุดว่างเป็นปัญหาสามการตัดสินใจพร้อมข้อสรุปทิศทาง มีการทดสอบแล้วกับทั้งและ\}Θ0={θ0}Θ0Θ1={θ:θ<θ0}Θ1={θ:θ>θ0}

ปล่อยให้ฟังก์ชั่นทดสอบถ้าเรายอมรับ (โปรดสังเกตว่าสัญลักษณ์นี้ตรงข้ามกับที่ใช้ข้างต้น!) ปรากฎว่าภายใต้ฟังก์ชันการสูญเสีย น้ำหนัก the Bayes การทดสอบคือการปฏิเสธถ้าไม่ได้อยู่ในช่วงกลางφ=iΘi01

L2(θ,φ)={0,ถ้า θΘผม และ φ=ผม,ผม{-1,0,1},α/2,ถ้า θΘ0 และ φ=0,1,ถ้า θΘผมΘ0 และ φ=-ผม,ผม{-1,1},
Θ0θ0

ฟังก์ชั่นการสูญเสียที่สมเหตุสมผล ฉันพูดคุยเกี่ยวกับการสูญเสียนี้การสูญเสียและการทดสอบ Madruga-Esteves-Wechsler โดยใช้ชุดที่น่าเชื่อถือเพิ่มเติมในบทความเกี่ยวกับ arXiv


2
(ฉันกำลังทำเครื่องหมายว่านี่เป็นวิกิชุมชน)
MånsT

เมื่อคุณพูดว่า "ในการมาถึงการทดสอบ Pereira-Stern เราจะต้องลดการสูญเสียหลังที่คาดหวัง" เอาล่ะจริง ๆ แล้วเราทำอย่างนั้นในขั้นตอนการตัดสินใจของ Bayesian ความแตกต่างที่นี่คือฟังก์ชั่นการสูญเสียขึ้นอยู่กับข้อมูล (ตามที่คุณระบุ) ซึ่งไม่ได้มาตรฐาน Normaly เรามี{R} L:{PaRaม.อีเสื้ออีRSพีaอี}×{Aเสื้อผมโอns}R
Zen

@ เซน: ใช่แน่นอนฉันพูดผิดอย่างนั้น ขอบคุณสำหรับการชี้ให้เห็นว่า :)
MånsT

3
@ MånsT: (+1) นี่เป็นคำตอบที่น่าสนใจ ฉันเคารพความจริงที่คุณเลือกทำเครื่องหมายว่าเป็น CW ในตัวอย่างนี้ แต่ฉันหวังว่าคุณจะไม่มี :-)
พระคาร์ดินัล

8

ฉันบังเอิญอ่านบทความ arXiv ของคุณก่อนที่จะมาที่คำถามนี้และเขียนรายการบล็อกไว้แล้ว ( มีกำหนดจะปรากฏในเดือนตุลาคม 08 ) โดยสรุปแล้วฉันพบว่าการก่อสร้างของคุณมีความสนใจในเชิงทฤษฎี แต่ก็คิดว่ามันเป็นสิ่งที่เกินไปที่จะแนะนำ ดูเหมือนว่ามันจะไม่สามารถแก้ปัญหาการทดสอบจุด - โมฆะปัญหาการทดสอบแบบเบย์ซึ่งโดยทั่วไปแล้วจะต้องใส่มวลก่อนหน้านี้ในค่าพารามิเตอร์จุด - โมฆะ

วิธีแก้ปัญหาที่คุณนำเสนอข้างต้น (ในการอัปเดตเดือนตุลาคม) และตามทฤษฎีบทที่ 2 ในบทความ arXiv ของคุณไม่ใช่ขั้นตอนการทดสอบที่ถูกต้องในที่ใช้ค่าสามค่าแทนที่จะเป็นสองค่าที่สอดคล้องกับการยอมรับ / ปฏิเสธ ในทำนองเดียวกันฟังก์ชั่นการสูญเสียที่คุณใช้ในทฤษฎีบท 3 (ไม่ทำซ้ำที่นี่) จำนวนเงินที่จะทดสอบสมมติฐานด้านเดียวมากกว่าจุด null สมมติฐาน\φH0:θθ0H0:θ=θ0

ปัญหาหลักของฉันคือว่าทั้งทฤษฎีบท 3 และทฤษฎีบท 4 ในบทความ arXiv ของคุณไม่ถูกต้องเมื่อเป็นสมมติฐานจุดว่างเช่นเมื่อโดยไม่มีมวลก่อนหน้าH0Θ0={θ0}


1
ขอบคุณ (+1) สำหรับความคิดเห็นของคุณ! ฉันหวังเป็นอย่างยิ่งว่าจะได้อ่านโพสต์บล็อกของคุณ :) ในขณะที่คุณชี้ให้เห็นทฤษฎีบท 3 และ 4 เกี่ยวข้องกับสมมุติฐานเชิงประกอบเท่านั้น ในทฤษฎีบทที่ 2 คือการพิมพ์ผิด คุณควรอ่านซึ่งในกรณีนี้เมื่อซึ่งเกิดขึ้นเมื่อคือ ในช่วงเวลาที่น่าเชื่อถือ ฉันจะเปลี่ยนสิ่งนี้ในต้นฉบับ arXiv โดยเร็วที่สุด! α / 2 φ = 0 α / 2 < นาที ( P ( Θ - 1 ) , P ( Θ 1 ) ) θ 01-α/2α/2φ=0α/2<นาที(P(Θ-1),P(Θ1))θ0
MånsT

คุณพูดถูก (+1!) ฉันคิดถึงความไม่เท่าเทียมในทางกลับกัน! ในเอกสาร arXiv ความไม่เสมอภาคกลางเขียนผิดวิธี ie หนึ่งควรยอมรับ iffH0
ซีอาน

เป็นเรื่องที่ดีที่ได้ยิน :) ต้นฉบับที่อัปเดตแล้ว (เมื่อแก้ไข Thm 2) จะเป็น arXiv ในวันจันทร์ ฉันจะสมมติว่าไม่ใช่จุดว่างใน Thm 4 อย่างชัดเจนเช่นกัน Θ0
MånsT

1
เพียงแค่ให้แน่ใจว่าได้อธิบายหลักฐานของทฤษฎีบทที่ 2 ในเอกสาร arXiv: ความไม่เท่าเทียมกันที่แสดงถูกเขียนผิด นั่นคือเราควรยอมรับ iffไม่ใช่ตรงกันข้าม! P ( θ Θ ฉัน| x ) > α / 2H0P(θΘผม|x)>α/2
ซีอาน

3

คุณสามารถใช้ช่วงเวลาที่น่าเชื่อถือ (หรือภูมิภาค HPD) สำหรับการทดสอบสมมติฐานแบบเบย์ ฉันไม่คิดว่ามันเป็นเรื่องธรรมดา แม้ว่าเพื่อความเป็นธรรมฉันไม่เห็นอะไรมากหรือฉันไม่ได้ใช้การทดสอบสมมติฐานอย่างเป็นทางการแบบเบย์ในทางปฏิบัติ มีการใช้ปัจจัยเบย์เป็นบางครั้ง (และใน "หลักการแกนกลาง" ของโรเบิร์ตที่ได้รับการยกย่องค่อนข้างสูง) ในการทดสอบสมมติฐานตั้งค่า


1
ไชโย @ ฟราจิโอ! บางทีคุณอาจอธิบายให้ละเอียดเล็กน้อยว่าคำตอบของคุณแตกต่างจากคำพูดของ Michael Chernick อย่างไร
MånsT

2
ฉันไม่คิดว่าการใช้ปัจจัย Bayes สำหรับการทดสอบสมมติฐานคือ "เป็นครั้งคราว" ให้ดูตัวอย่างการอ้างอิงนี้

@ MånsTในการติดตามกระบวนการที่ไมเคิลอธิบายดูเหมือนจะเป็นการทดสอบแบบเบย์ โดยพื้นฐานแล้วคุณจะสร้างสองแบบจำลองที่มีระดับแตกต่างกันไปตามสมมติฐานของคุณแล้วเปรียบเทียบความน่าจะเป็นของชุดข้อมูลที่ใช้ตัวเลือกเหล่านั้น การอ้างอิง Procrasinator ที่โพสต์นั้นจะทำการตรวจสอบอย่างรวดเร็ว
Fraijo

1
@Procrastinator ฉันพูดเป็นครั้งคราวเท่านั้นเพราะในอุตสาหกรรมของฉันฉันเห็นคนไม่กี่คนที่ใช้วิธีการแบบเบย์ให้ใช้คนเดียวโดยใช้วิธีแบบเบย์สำหรับการทดสอบสมมติฐาน โดยส่วนตัวแล้วฉันใช้ปัจจัย Bayes เพื่อตรวจสอบแบบจำลองของฉันสำหรับความไวต่อก่อนหน้านี้ซึ่งฉันคิดว่าเป็นรูปแบบของการทดสอบสมมติฐาน
Fraijo

1
@ MånsTคำตอบสั้น ๆ : ไม่ การตั้งค่าช่วงเวลาที่น่าเชื่อถือและค้นหาว่ามันมีสมมติฐานว่างเปล่าเป็นเพียงการทดสอบโดยตรงที่เทียบเคียงได้กับการทดสอบสมมติฐานบ่อยๆ มีปัญหาสองวิธีด้วยวิธีนี้: 1) ความจริงที่ชัดเจนที่คุณสามารถค้นหาหลายภูมิภาคในบางกรณี (เช่น HPD กับพื้นที่สมมาตร) และ 2) การทดสอบสมมติฐานจุด (theta = a) ขัดแย้งกับอุดมคติอุดมคติของ Bayesian การแจกแจง (theta ~ P (theta))
Fraijo

1

ภูมิภาคที่น่าเชื่อถือเป็นเพียงภูมิภาคที่ความหนาแน่นของส่วนหลังเหนือบริเวณนั้นเป็นความน่าจะเป็นที่ระบุเช่น 0.95 วิธีหนึ่งในการสร้างการทดสอบสมมติฐานแบบเบย์คือการดูว่าค่าสมมติฐานที่เป็นโมฆะ (s) ของพารามิเตอร์ตกอยู่ในภูมิภาคที่น่าเชื่อถือหรือไม่ ด้วยวิธีนี้เราสามารถมีการโต้ตอบ 1-1 ที่คล้ายกันระหว่างการทดสอบสมมติฐานและภูมิภาคที่น่าเชื่อถือเหมือนกับที่ผู้ใช้บ่อยทำกับช่วงความมั่นใจและการทดสอบสมมติฐาน แต่นี่ไม่ใช่วิธีเดียวที่จะทำการทดสอบสมมติฐาน


การทดสอบแบบเบส์เฉพาะกิจนี้มักใช้ในทางปฏิบัติหรือไม่
MånsT

1
@ MansT ฉันไม่คิดอย่างนั้น ฉันคิดว่าโดยปกติแล้วชาวเบย์จะใส่อัตราต่อรองก่อนหน้านี้บนสมมติฐานว่างเปล่าที่เป็นจริงแล้วตามข้อมูลที่สร้างอัตราต่อรองหลัง หากอัตราต่อรองหลังเป็นไปอย่างต่อเนื่องกับสมมติฐานว่างแล้วมันจะถูกปฏิเสธ ฉันไม่ใช่คนที่ดีที่สุดที่จะถามเพราะฉันไม่ได้ทำการอนุมานแบบเบย์บ่อยครั้ง
Michael Chernick

2
การทดสอบที่อธิบายโดยไมเคิลได้รับการยกย่องให้ Lindley โดย Zellner ในหนังสือของเขาเกี่ยวกับเศรษฐศาสตร์เบย์
Zen

1
ใช่ชนิดของการทดสอบเหล่านี้จะถูกเด้งแน่นอนจากคชกรรมความคิดแต่ผมไม่แน่ใจว่าถ้าพวกเขามีรากฐานที่มั่นคงในคชกรรมทฤษฎีการตัดสินใจ ในการตั้งค่าหลังฉันคาดว่าการทดสอบจะได้มาจากฟังก์ชั่นการสูญเสียซึ่งมักจะเกี่ยวข้องกับฟังก์ชั่นการทดสอบ
MånsT

2
เรียนMånsTดูที่เอกสารเหล่านี้: mdpi.org/entropy/papers/e1040099.pdf w.ime.usp.br/~jstern/materialanea/citacoes/swtest1.pdf
Zen

-1

ผมขอให้มันว่าผมได้รับมันอ่านคำตอบของทิม

มันขึ้นอยู่กับมุมมองตารางที่มีสมมติฐาน (พารามิเตอร์โดยประมาณ) ในคอลัมน์และการสังเกตในแถว

ป้อนคำอธิบายรูปภาพที่นี่

ในตารางแรกคุณมีความน่าจะเป็นรวม col เป็น 1 นั่นคือความน่าจะเป็นแบบมีเงื่อนไขซึ่งเงื่อนไขการเข้าสู่เหตุการณ์คอลัมน์ถูกจัดไว้ในแถวล่างเรียกว่า 'ก่อนหน้า' ในตารางสุดท้ายแถวเดียวกันจะรวมกันเป็น 1 และตรงกลางคุณมีความน่าจะเป็นร่วมเช่นความน่าจะเป็นตามเงื่อนไขที่คุณพบในตารางแรกและตารางสุดท้ายคูณความน่าจะเป็นของเงื่อนไข

ตารางโดยทั่วไปทำการแปลงแบบเบย์: ในตารางแรกคุณให้ pdf ของการสังเกต (แถว) ในทุกคอลัมน์ตั้งค่าก่อนหน้าสำหรับสมมติฐานนี้ (ใช่คอลัมน์สมมติฐานเป็น pdf ของการสังเกตภายใต้สมมติฐานนั้น) คุณทำเช่นนั้น สำหรับทุกคอลัมน์และตารางจะนำไปใช้ก่อนในตารางความน่าจะเป็นร่วมและจากนั้นก็เข้าสู่ความน่าจะเป็นของสมมติฐานของคุณ

ตามที่ฉันได้รับจากคำตอบของทิม (แก้ไขฉันหากฉันผิด) วิธีการช่วงวิกฤตจะดูที่ตารางแรก นั่นคือเมื่อการทดสอบเสร็จสมบูรณ์เรารู้ว่าแถวของตาราง (ตัวอย่างหรือหัวในตัวอย่างของฉัน แต่คุณอาจทำการทดลองที่ซับซ้อนมากขึ้นเช่นการโยน 100 เหรียญและรับตารางที่มี 2 ^ 100 แถว) การสแกนแบบประจำผ่านคอลัมน์ของมันซึ่งดังที่ฉันได้กล่าวไว้คือการแจกแจงผลลัพธ์ที่เป็นไปได้ภายใต้เงื่อนไขที่ว่าสมมติฐานเป็นหวัดจริง (เช่นเหรียญนั้นยุติธรรมในตัวอย่างของฉัน) และปฏิเสธสมมติฐานเหล่านั้น (คอลัมน์) ที่ให้ค่าความน่าจะเป็นต่ำ แถวที่สังเกต

Bayesianist ปรับความน่าจะเป็นครั้งแรกโดยแปลง cols เป็นแถวและดูที่ตารางที่ 3 ค้นหาแถวของผลลัพธ์ที่สังเกตได้ เนื่องจากเป็นไฟล์ PDF ด้วยเขาจึงต้องผ่านแถวผลการทดสอบและเลือกระดับไฮโปซิซิสที่มีค่าสูงสุดจนถึงค่าความน่าเชื่อถือ 95% ของเขาเต็ม สมมติฐานที่เหลือถูกปฏิเสธ

คุณชอบมันอย่างไร ฉันยังอยู่ในกระบวนการเรียนรู้และกราฟิกดูเหมือนว่ามีประโยชน์กับฉัน ผมเชื่อว่าผมในการติดตามขวาตั้งแต่ผู้ใช้ที่มีชื่อเสียงให้ภาพเดียวกันเมื่อวิเคราะห์ความแตกต่างของทั้งสองแนวทาง ฉันได้เสนอมุมมองกราฟิกของกลไกการเลือกสมมุติฐาน

ฉันสนับสนุนให้ทุกคนอ่านว่า Keith คำตอบสุดท้าย แต่รูปของกลศาสตร์การทดสอบสมมติฐานสามารถบอกได้ทันทีว่านักประจำไม่ได้ดูที่สมมติฐานอื่นเมื่อตรวจสอบข้อสมมติฐานปัจจุบันในขณะที่การพิจารณาสมมติฐานที่มีความน่าเชื่อถือสูงส่งผลกระทบอย่างมากต่อการรับ / ปฏิเสธสมมติฐานอื่น ๆ การวิเคราะห์เพราะถ้าคุณมีสมมติฐานเดียวซึ่งเกิดขึ้น 95% ของจำนวนครั้งภายใต้ข้อมูลที่สังเกตคุณจะโยนสมมติฐานอื่นทั้งหมดทันทีโดยไม่คำนึงว่าข้อมูลมีความเหมาะสมภายในพวกเขามากเพียงใด ลองทำการวิเคราะห์พลังงานเชิงสถิติซึ่งเปรียบเทียบสองสมมติฐานตามช่วงความเชื่อมั่นของพวกเขาซ้อนทับกัน

แต่ฉันดูเหมือนได้เห็นความคล้ายคลึงกันระหว่างสองวิธี: พวกเขาดูเหมือนจะเชื่อมต่อผ่านคุณสมบัติP(A | B) > P(A) <=> P(B|A) > P(B) โดยทั่วไปหากมีการพึ่งพาระหว่าง A และ B แล้วมันจะปรากฏขึ้นเป็นสหสัมพันธ์ในตารางทั้งความถี่และเบย์ ดังนั้นการทดสอบสมมติฐานหนึ่งมีความสัมพันธ์กับการทดสอบอื่น ๆ พวกเขา sorta ต้องให้ผลลัพธ์ที่เหมือนกัน การศึกษารากเหง้าของความสัมพันธ์มีแนวโน้มที่จะให้การเชื่อมต่อระหว่างคุณทั้งสอง ในคำถามของฉันฉันถามว่าทำไมถึงมีความแตกต่างแทนที่จะเป็นสหสัมพันธ์แบบสัมบูรณ์?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.