การทดสอบสมมติฐานแบบเบส์หมายความว่าอย่างไรในกรอบการอนุมานและทฤษฎีการตัดสินใจ


15

พื้นหลังของฉันส่วนใหญ่อยู่ในการเรียนรู้ของเครื่องและฉันพยายามที่จะเรียนรู้ว่าการทดสอบสมมติฐานแบบเบย์หมายถึงอะไร ฉันโอเคกับการตีความความน่าจะเป็นแบบเบย์และฉันคุ้นเคยกับมันในบริบทของตัวแบบกราฟิกที่น่าจะเป็น อย่างไรก็ตามสิ่งที่ทำให้ฉันสับสนคือความหมายของคำว่า "สมมติฐาน" ในบริบทของการอนุมานเชิงสถิติ

ฉันคิดว่าฉันส่วนใหญ่สับสนเกี่ยวกับคำศัพท์ที่ฉันคุ้นเคยกับการเรียนรู้ของเครื่องเทียบกับสิ่งที่ใช้ในสถิติและการอนุมาน

ในบริบทของการเรียนรู้ภายใต้การดูแลผมตามปกติคิดว่าสมมติฐานที่เป็นฟังก์ชั่นการคาดการณ์ที่แมตัวอย่างป้ายชื่อของมันคือ{Y} อย่างไรก็ตามสำหรับฉันแล้วคำว่าสมมติฐานในการอ่านที่ฉันทำไม่มีความหมายเหมือนกัน ให้ฉันวางแยกอ่านที่ฉันกำลังอ่าน:ชั่วโมง:XY

ป้อนคำอธิบายรูปภาพที่นี่

ถ้าคุณอ่านอย่างระมัดระวังมันก็บอกว่า:

มีรูปแบบที่แตกต่างกันสำหรับข้อมูลที่สังเกตได้ ...

พวกเขาใช้คำว่า model สำหรับฉันรูปแบบคำทำให้ฉันคิดว่าชุดของฟังก์ชั่นคือเราเลือกฟังก์ชั่นการทำนายที่เฉพาะเจาะจง เช่นคลาสสมมุติฐานของฟังก์ชัน ตัวอย่างเช่นอาจเป็นคลาสสมมุติฐานของฟังก์ชันกำลังสอง (พหุนามของระดับ 2) อย่างไรก็ตามสำหรับฉันแล้วพวกเขาใช้แบบจำลองคำและสมมติฐานเป็นคำพ้องในสารสกัดนี้ (สำหรับฉันพวกเขาเป็นคำที่แตกต่างอย่างสิ้นเชิง)Hd2

จากนั้นจะกล่าวถึงว่าเราสามารถทำให้นักบวชเป็นสมมติฐาน (สิ่งที่สมเหตุสมผลอย่างสมบูรณ์ในการตั้งค่าแบบเบย์):

พีH(Hม.),     ม.={0,1,...,M-1}

นอกจากนี้เรายังสามารถระบุลักษณะข้อมูลด้วยสมมติฐานปัจจุบัน:

พีY|H(|Hม.),     ม.={0,1,...,M-1}

และอัปเดตข้อมูลปัจจุบันของเราที่เชื่อว่าได้รับข้อมูลบางอย่าง (และกฎของ Baye):

พีH|Y(Hม.|Y),     ม.={0,1,...,M-1}

อย่างไรก็ตามฉันคิดว่าฉันคุ้นเคยกับการนำการประมาณค่าแบบเบย์ไปยังพารามิเตอร์เฉพาะ (พูด ) จากคลาสสมมติฐานมากกว่าระดับสมมติฐานทั้งหมด โดยพื้นฐานแล้วดูเหมือนว่า "สมมติฐาน" เหล่านี้ไม่เหมือนสมมติฐานจากบริบทการเรียนรู้ของเครื่องจักรที่ฉันคุ้นเคยดูเหมือนว่าฉันว่าสมมติฐานเหล่านี้คล้ายกับพารามิเตอร์เฉพาะมากกว่าคลาสสมมติฐานθθ

เมื่อมาถึงจุดนี้ฉันเชื่อว่า "สมมติฐาน" มีความหมายเช่นเดียวกับในฟังก์ชั่นการทำนาย ( ตัวอย่างเช่นพารามิเตอร์ของพารามิเตอร์ ) แต่ฉันคิดว่าฉันผิด ...θ

เพื่อทำให้ความสับสนของฉันแย่ลงยิ่งขึ้นภายหลังการอ่านเดียวกันนี้ก็ดำเนินต่อไปเพื่อระบุ "สมมติฐาน" ที่เฉพาะเจาะจงสำหรับตัวอย่างการฝึกอบรมแต่ละอย่างที่พวกเขาสังเกตเห็น ให้ฉันวางแยกสิ่งที่ฉันหมายถึง:

ป้อนคำอธิบายรูปภาพที่นี่

เหตุผลที่ทำให้ฉันสับสนคือถ้าฉันตีความสมมุติฐานเป็นพารามิเตอร์ดังนั้นสำหรับฉันแล้วมันไม่มีเหตุผลที่จะระบุพารามิเตอร์เฉพาะสำหรับแต่ละค่าตัวอย่างที่เราเห็น ณ จุดนี้ฉันได้ข้อสรุปว่าฉันไม่รู้จริง ๆ ว่าพวกเขาหมายถึงอะไรโดยสมมติฐานดังนั้นฉันจึงโพสต์คำถามนี้

แต่ผมไม่ได้อย่างเต็มที่ให้ขึ้นฉันวิจัยสิ่งที่หมายถึงสมมติฐานในสถิติ frequentistและพบว่าต่อไปนี้khan วิดีโอสถาบันการศึกษา วิดีโอที่จริงทำให้จำนวนมากรู้สึกถึงฉัน(บางทีคุณอาจจะ frequentist ครับ :) อย่างไรก็ตามดูเหมือนว่าพวกเขาได้รับข้อมูลมากมาย (เช่น "กลุ่มตัวอย่าง") และจากคุณสมบัติของกลุ่มตัวอย่างพวกเขาตัดสินใจว่าจะยอมรับหรือปฏิเสธสมมติฐานว่างเกี่ยวกับข้อมูล อย่างไรก็ตามในบริบทBayesianที่ฉันอ่านดูเหมือนว่าสำหรับแต่ละข้อมูล [จุด] เวกเตอร์ที่สังเกตพวกเขา "ติดป้ายกำกับ" ด้วยสมมติฐานที่มี "การทดสอบอัตราส่วนความน่าจะเป็น":

ป้อนคำอธิบายรูปภาพที่นี่

วิธีที่พวกเขากำหนดสมมติฐานให้กับแต่ละตัวอย่างข้อมูลแม้ดูเหมือนว่าการตั้งค่าการเรียนรู้ภายใต้การดูแลคือเรากำลังติดป้ายกำกับให้กับชุดฝึกอบรมแต่ละชุด อย่างไรก็ตามฉันไม่คิดว่าพวกเขากำลังทำอะไรในบริบทนี้ พวกเขากำลังทำอะไร? การกำหนดสมมติฐานให้กับตัวอย่างข้อมูลแต่ละชุดหมายความว่าอย่างไร สมมติฐานคืออะไร ตัวแบบคำว่าอะไร?

โดยทั่วไปหลังจากคำอธิบายที่ยาวนานของความสับสนของฉันมีใครรู้ว่าการทดสอบสมมติฐานแบบเบส์หมายถึงอะไรในบริบทนี้


หากคุณต้องการคำชี้แจงใด ๆ หรือสิ่งใดเพื่อปรับปรุงคำถามของฉันหรือเพื่อให้คำถามมีเหตุผลฉันรู้สึกยินดีที่จะช่วยเหลือ :)


ในการค้นหาคำตอบของฉันฉันพบสิ่งที่มีประโยชน์บางอย่างที่เกี่ยวข้องกับการทดสอบสมมติฐานทางสถิติ:

อันนี้แนะนำให้รู้จักกับหัวข้อที่ดีถ้าคุณมาจากพื้นหลัง CS (เช่นฉัน):

การแนะนำการทดสอบสมมติฐานทางสถิติที่ดีสำหรับนักวิทยาศาสตร์คอมพิวเตอร์คืออะไร

เมื่อถึงจุดหนึ่งฉันถามเกี่ยวกับ "พารามิเตอร์เริ่มต้น" (ซึ่งฉันควรจะกำหนดสิ่งที่ฉันหมายถึงฉันคิดว่ามันเป็นคำมาตรฐาน แต่มันไม่ได้ดังนั้นที่นี่ฉันจะอยู่มัน) และฉันคิดว่าสิ่งที่ฉันหมายถึงอย่างแท้จริงเป็นอย่างไร คุณระบุพารามิเตอร์สำหรับแต่ละสมมติฐานที่คุณมี ตัวอย่างเช่นคุณจะตัดสินใจได้อย่างไรว่าสมมติฐานว่างของคุณคืออะไรและพารามิเตอร์ของมัน มีคำถามที่เกี่ยวข้องกับสิ่งนั้น:

จะระบุสมมติฐานว่างในการทดสอบสมมติฐานได้อย่างไร


@ ซีอานฉันอ่านบทความวิกิพีเดียต่อไปนี้: en.wikipedia.org/wiki/Statistical_modelนั่นคือสิ่งที่พวกเขาหมายถึงโดยแบบจำลองและสมมติฐาน? ขอบคุณสำหรับความอดทนของคุณ btw :)
Pinocchio

3
ฉันลังเลที่จะเข้าร่วมการสนทนานี้เพราะฉันคิดว่าปัญหาของคุณคือการทำความเข้าใจว่าการทดสอบสมมติฐานหมายถึงอะไรในหลักการมากกว่าการทดสอบสมมติฐานที่เฉพาะเจาะจงในกรอบเบย์ เพื่อช่วยในเรื่องนี้ฉันขอแนะนำให้ดูที่หนังสือ "โหมดของการอนุมานทางสถิติพารามิเตอร์" โดย Geisser books.google.ca/…
rocinante

@rocinante ฉันคิดว่าฉันเห็นด้วยกับคุณ ฉันสับสนอย่างแน่นอนเกี่ยวกับการทดสอบสมมติฐานโดยทั่วไป (และกรอบการทำงานแบบเบย์ไม่ได้ช่วยอะไรเลย) ฉันจะดูที่แน่นอน ขอบคุณสำหรับความอดทนและความเข้าใจของคุณ
Pinocchio

มันไม่ใช่เรื่องง่ายที่จะเข้าใจเพราะมันไม่ใช่เรื่องง่ายที่จะพูดออกมาอย่างรัดกุม แทนที่จะคิดถึงเรื่องนี้ในแง่นามธรรม (เช่นแผนที่) บางทีมันอาจจะช่วยได้ถ้าคุณคิดถึงตัวอย่างที่ง่ายกว่านี้ 1/2
rocinante

1
2/2 สมมติว่าคุณมีเหรียญและคุณต้องการดูว่ามันยุติธรรมหรือไม่ดังนั้นคุณพลิก 50 ครั้ง ตอนนี้คุณมีชุดข้อมูลที่คุณต้องการให้มีการอนุมาน (เช่นเป็นแบบเอนเอียงหรือไม่) เหตุผลถ้าเหรียญยุติธรรมประมาณครึ่งโยนควรเป็นหัวหน้า (โปรดทราบว่านี่ไม่ใช่สถิติที่ได้มา แต่เป็นเหตุผลเชิงตรรกะของคุณเอง) นั่นคือสมมติฐานของคุณ คุณสามารถทดสอบสมมติฐานนี้ได้ 2 วิธี: วิธีแบบเบย์และวิธีการแบบประจำ
rocinante

คำตอบ:


10

แบบจำลองทางสถิติจะได้รับจากครอบครัวของการกระจายความน่าจะเป็น เมื่อแบบจำลองเป็นพารามิเตอร์ตระกูลนี้จะถูกทำดัชนีโดยพารามิเตอร์ที่ไม่รู้จัก : F = { f ( | θ ) ; θ Θ } ถ้าใครต้องการที่จะทดสอบสมมติฐานเกี่ยวกับθเช่นH 0 :θ

F={f(|θ); θΘ}
θหนึ่งสามารถพิจารณาสองรุ่นที่อยู่ในความขัดแย้ง: Fเมื่อเทียบกับ F 0 = { F ( | θ ) ; θ Θ 0 } จากมุมมองของเบส์ของฉันฉันวาดภาพอนุมานในดัชนีของรูปแบบที่อยู่เบื้องหลังข้อมูลที่M ดังนั้นฉันวางก่อนหน้านี้ในดัชนีนี้, ρ 0และ ρ a , เช่นเดียวกับพารามิเตอร์ของทั้งสองรุ่น, π 0 ( θ )มากกว่า Θ 0และ πH0:θΘ0F
F0={f(|θ); θΘ0}
Mρ0ρaπ0(θ)Θ0มากกว่าΘ และจากนั้นผมก็อนุมานกระจายหลังของดัชนีนี้: π ( M = 0 | x ) = ρ 0 Θ 0 F ( x | θ ) π 0 ( θ ) d θπa(θ)Θเอกสารที่คุณเชื่อมโยงกับการไปลงในรายละเอียดมากขึ้น ในมุมมองนี้และควรเป็นทางเลือกของคุณในการทดสอบสมมติฐานทางสถิติเว้นแต่ว่าคุณจะสามารถอ่านหนังสือเบย์ทั้งหมดได้ หรือแม้แต่หนังสือเรียนรู้ด้วยเครื่อง
π(m=0|x)=ρ0Θ0f(x|θ)π0(θ)dθρ0Θ0f(x|θ)π0(θ)dθ+(1ρ0)Θf(x|θ)πa(θ)dθ
เช่นเควินเมอร์ฟี่ 's

XN(θ,1)H0:θ=0θ=0N(0,1)θθN(0,10)ρ0=1/2

π(m=0|x)=12πexp{x2/2}12πexp{x2/2}+R12πexp{(xθ)2/2}12π×10exp{θ2/20}dθ=exp{x2/2}exp{x2/2}+111exp{x2/22}

pH(H0)F0θF0py|H(y|H0)H0H0

HmθFmHm=(θ,Fm)θFm

ϱ0H0F0ϱ0=0π0(θ)θH0

ดังนั้นหากสมมติฐานเป็น tuple ของแบบจำลองทางสถิติที่เสนอและพารามิเตอร์เริ่มต้นจะเลือกพารามิเตอร์เริ่มต้นอย่างไร
Pinocchio

θ=0

4

คำถามที่ยอดเยี่ยม ฉันคิดว่าความสับสนของคุณอาจเป็นผลมาจากความแตกต่างพื้นฐานบางอย่างระหว่างมุมมอง "ผู้ใช้บ่อย" และ "Bayesian" ฉันมีประสบการณ์มากมายกับอดีตและเป็นคนใหม่ในภายหลังดังนั้นการลองสังเกตง่ายๆก็อาจช่วยฉันได้เช่นกัน ฉันแก้ไขคำถามของคุณเพื่อแยกความแตกต่างบางอย่าง - อย่างน้อยที่สุดเท่าที่ฉันเข้าใจ ฉันหวังว่าคุณจะไม่รังเกียจ! หากฉันทำอะไรผิดคุณสามารถแก้ไขคำถามของคุณอีกครั้งหรือเพิ่มความคิดเห็นในการตอบกลับนี้

1) มีความเสี่ยงที่จะเกิดเสียงค่อนข้างง่ายเกินไป: แบบจำลองเป็นข้อความที่พยายามอธิบายความเป็นจริงเช่น "ถ้าฉันมีแพนเค้กเป็นอาหารเช้าจะต้องเป็นวันอังคาร" ดังนั้นโมเดลเป็นสมมติฐาน ใบเสนอราคาที่มีชื่อเสียงโดย George Box: "ทุกรุ่นผิดรุ่นบางรุ่นมีประโยชน์" เพื่อให้แบบจำลองมีประโยชน์ต้องมีวิธีทดสอบ ป้อนแนวคิดของสมมติฐานที่แข่งขันกันและคำตอบสำหรับหนึ่งในคำถามของคุณ ฉันขอแนะนำว่า "... ในบริบทของการอนุมานเชิงสถิติ" สมมติฐานคือโมเดลใด ๆ ที่อาจมีประโยชน์และสามารถทดสอบทางคณิตศาสตร์ได้ ดังนั้นการทดสอบสมมติฐานเป็นวิธีการตัดสินใจเกี่ยวกับว่าแบบจำลองนั้นมีประโยชน์หรือไม่ โดยสรุปสมมติฐานเป็นรูปแบบภายใต้การพิจารณา อาจเป็นค่าพารามิเตอร์ที่แตกต่างกันของฟังก์ชั่นเดียวกันหรือฟังก์ชั่นที่แตกต่างกัน

2) วิดีโอคาห์นของคุณเป็นตัวอย่างของสิ่งที่เบย์เรียกวิธีการ "การทดสอบสมมติฐาน" เพื่อทดสอบสมมติฐานดังนั้นมันอาจทำให้คุณสับสนเมื่อพยายามที่จะนำไปใช้กับบันทึกการบรรยายของคุณซึ่งเป็นแบบเบส์ ฉันพยายามทำให้เกิดความแตกต่างอย่างง่าย ๆ ระหว่างการประยุกต์ใช้สองวิธี (ซึ่งอาจเป็นอันตราย) ฉันคิดว่าฉันเข้าใจความแตกต่างทางปรัชญาได้ดีพอสมควร จากสิ่งที่ฉันได้เห็น "ผู้ใช้บ่อย" ถือว่าเป็นองค์ประกอบแบบสุ่มกับข้อมูลและการทดสอบว่ามีแนวโน้มว่าข้อมูลที่สังเกตได้รับพารามิเตอร์ที่ไม่ใช่แบบสุ่ม "Bayesian" ถือว่าข้อมูลได้รับการแก้ไขและกำหนดค่าที่เป็นไปได้มากที่สุดของพารามิเตอร์แบบสุ่ม ความแตกต่างนี้นำไปสู่วิธีการทดสอบที่แตกต่างกัน

ในการทดสอบสมมติฐาน "Frequentist" แบบจำลองที่อาจมีประโยชน์คือสิ่งหนึ่งที่อธิบายถึงผลกระทบบางอย่างดังนั้นจึงถูกเปรียบเทียบกับ "สมมติฐานสมมุติฐาน" - แบบจำลองที่ไม่มีผลกระทบ มีความพยายามในการตั้งค่ารูปแบบที่มีประโยชน์ซึ่งไม่เกิดร่วมกันกับรุ่นที่ไม่มีผลกระทบ การทดสอบความน่าจะเป็นของการสังเกตข้อมูลภายใต้สมมติฐานว่าไม่มีผลกระทบใด ๆ หากพบว่าความน่าจะเป็นนั้นต่ำสมมติฐานว่างจะถูกปฏิเสธและทางเลือกคือสิ่งที่เหลืออยู่ (โปรดทราบว่าคนเจ้าระเบียบจะไม่ "ยอมรับ" สมมติฐานว่างเพียง "ล้มเหลวที่จะปฏิเสธ" หนึ่งมันอาจฟังดูเหมือนเทวดาเต้นรำบนหัวของพิน แต่ความแตกต่างเป็นปรัชญาพื้นฐาน) สถิติอินโทรมักจะเริ่มด้วยสิ่งที่อาจ เป็นตัวอย่างที่ง่ายที่สุด: "สองกลุ่มแตกต่างกัน"มากหรือใหญ่กว่าที่วัดได้จากการทดสอบแบบสุ่มเนื่องจากไม่แตกต่างกัน นี่คือ t-test ที่สมมติฐานว่างคือความแตกต่างของค่าเฉลี่ยเป็นศูนย์ ดังนั้นพารามิเตอร์คือค่าเฉลี่ยที่ค่าคงที่เป็นศูนย์

Bayesian กล่าวว่า "เดี๋ยวก่อนเราทำการวัดเหล่านั้นและพวกมันก็แตกต่างกัน พวกเขาคำนวณความน่าจะเป็นสำหรับทุกค่าของพารามิเตอร์สุ่ม (ตอนนี้) และเลือกค่าที่สูงที่สุด ดังนั้นในความเป็นจริงค่าที่เป็นไปได้ของพารามิเตอร์คือโมเดลแยกต่างหาก แต่ตอนนี้พวกเขาต้องการวิธีในการตัดสินใจว่าแบบจำลองที่มีความน่าจะเป็นสูงที่สุดนั้นแตกต่างกันพอที่จะสำคัญหรือไม่ นั่นเป็นเหตุผลที่บันทึกการบรรยายของคุณนำเสนอฟังก์ชั่นค่าใช้จ่าย ในการตัดสินใจที่ดีต้องมีข้อสันนิษฐานบางประการเกี่ยวกับผลของการตัดสินใจที่ผิดพลาด

3) "การกำหนดสมมติฐานให้กับแต่ละตัวอย่างข้อมูลหมายความว่าอย่างไร" ฉันไม่คิดว่าพวกเขาเป็น ระวังสิ่งที่มีความหมายโดย "จุดตัวอย่าง" ฉันเชื่อว่าพวกเขาอ้างถึงเวกเตอร์ตัวอย่างเฉพาะและต้องการทราบว่าโอกาสที่สมมติฐานแต่ละรายการจะมีสำหรับเวกเตอร์ตัวอย่างทั้งหมดในพื้นที่ตัวอย่าง สมการ (14) และ (15) แสดงวิธีเปรียบเทียบสองสมมติฐานสำหรับเวกเตอร์ตัวอย่างเฉพาะ ดังนั้นพวกเขาจึงทำให้อาร์กิวเมนต์ทั่วไปของการเปรียบเทียบหลายสมมติฐานง่ายขึ้นโดยแสดงวิธีเปรียบเทียบเพียงสองข้อ


0

สมมติว่าคุณมีข้อมูลจากชุดของกล่อง ข้อมูลประกอบด้วยความยาว (L), ความกว้าง (W), ความสูง (H) และปริมาณ (V)

หากเราไม่รู้เกี่ยวกับกล่อง / รูปทรงมากนักเราอาจลองแบบจำลอง:

V = a*L + b*W + c*H + e

โมเดลนี้มีพารามิเตอร์สามตัว (a, b, c) ที่สามารถเปลี่ยนแปลงได้รวมถึงข้อผิดพลาด / คำศัพท์ราคา (e) ที่อธิบายว่าสมมติฐานนั้นเหมาะสมกับข้อมูลได้ดีเพียงใด การรวมกันของค่าพารามิเตอร์จะถือว่าเป็นสมมติฐานที่แตกต่างกัน ค่าพารามิเตอร์ "default" ที่เลือกมักเป็นศูนย์ซึ่งในตัวอย่างด้านบนจะสอดคล้องกับ "ไม่มีความสัมพันธ์" ระหว่าง V และ L, W, H.

สิ่งที่ผู้คนทำคือทดสอบสมมติฐาน "ปริยาย" นี้โดยตรวจสอบว่า e มีค่าเกินกว่าค่า cutoff หรือไม่โดยปกติจะคำนวณค่า p-สมมติว่ามีการแจกแจงความผิดพลาดรอบ ๆ โมเดลตามปกติ หากสมมติฐานนั้นถูกปฏิเสธพวกเขาจะพบการรวมกันของพารามิเตอร์ a, b, c ที่เพิ่มโอกาสสูงสุดและนำเสนอนี่คือสมมติฐานที่เป็นไปได้มากที่สุด หากพวกมันเป็นแบบเบย์พวกมันจะคูณความน่าจะเป็นก่อนหน้านี้สำหรับแต่ละชุดของค่าพารามิเตอร์และเลือกวิธีแก้ปัญหาที่เพิ่มความน่าจะเป็นด้านหลัง

เห็นได้ชัดว่ากลยุทธ์นี้ไม่เหมาะสมที่สุดในแบบจำลองที่สมมติว่ามีความไวและจะพลาดสมมติฐานที่ถูกต้องคือ:

V = L*W*H + e

แก้ไข: @Pinocchio

บางทีบางคนไม่เห็นด้วยกับข้ออ้างที่ว่าการทดสอบสมมติฐานนั้นไม่เหมาะสมเมื่อไม่มีเหตุผลที่สมเหตุสมผลในการเลือกหนึ่ง / สามฟังก์ชั่น (หรือตามที่คุณกล่าวไว้: ของหลักสูตรนี้เป็นเรื่องจริงเล็กน้อยและ "ดีที่สุด" สามารถใช้ในความหมายที่ จำกัด ของ "แบบที่ดีที่สุดเนื่องจากฟังก์ชั่นค่าใช้จ่ายและตัวเลือกที่ให้มา" ความคิดเห็นนั้นทำให้มันเป็นคำตอบของฉันเพราะฉันไม่ชอบว่าปัญหาของแบบจำลองข้อมูลจำเพาะถูกคัดสรรมาอย่างไรในบันทึกย่อประจำชั้นของคุณ มันเป็นปัญหาหลักที่นักวิทยาศาสตร์ส่วนใหญ่ต้องเผชิญซึ่ง Afaik ไม่มีอัลกอริทึม

นอกจากนี้ฉันไม่สามารถเข้าใจค่า p, การทดสอบสมมติฐานและอื่น ๆ จนกว่าฉันจะเข้าใจประวัติศาสตร์ดังนั้นบางทีมันอาจช่วยคุณได้เช่นกัน มีหลายแหล่งที่มาของความสับสนรอบ ๆ การทดสอบสมมติฐานบ่อย ๆ (ฉันไม่คุ้นเคยกับประวัติของตัวแปรแบบเบส์)

มีสิ่งที่เรียกว่า "การทดสอบสมมติฐาน" ในความรู้สึกของเนย์แมน - เพียร์สัน "การทดสอบนัยสำคัญ" ที่พัฒนาโดยโรนัลด์ฟิชเชอร์และนิยามที่ไม่ดีไม่ถูกต้อง "ไฮบริด" ของกลยุทธ์ทั้งสองนี้ อาจถูกเรียกอย่างไม่เป็นทางการโดยใช้คำศัพท์ข้างต้นหรือ "การทดสอบนัยสำคัญสมมุติฐานว่าง") ในขณะที่ฉันจะไม่ขอแนะนำให้หน้าวิกิพีเดียเป็นเผด็จการหลายแหล่งที่มาพูดคุยเกี่ยวกับปัญหาเหล่านี้สามารถพบได้ที่นี่ ประเด็นหลักบางประการ:

  1. การใช้สมมติฐาน "เริ่มต้น" ไม่ได้เป็นส่วนหนึ่งของขั้นตอนการทดสอบสมมติฐานเดิม แต่ผู้ใช้ควรใช้ความรู้ก่อนหน้าเพื่อกำหนดรูปแบบที่อยู่ระหว่างการพิจารณา ฉันไม่เคยเห็นคำแนะนำที่ชัดเจนโดยผู้สนับสนุนของโมเดลนี้เกี่ยวกับสิ่งที่ต้องทำถ้าเราไม่มีเหตุผลใดที่จะเลือกชุดของสมมติฐานที่ต้องการเปรียบเทียบ มักกล่าวกันว่าวิธีนี้เหมาะสำหรับการควบคุมคุณภาพเมื่อมีความคลาดเคลื่อนที่ทราบกันเพื่อเปรียบเทียบการวัดบางอย่าง

  2. ไม่มีสมมติฐานทางเลือกภายใต้กระบวนทัศน์ "การทดสอบนัยสำคัญ" ของฟิชเชอร์เป็นเพียงสมมติฐานว่างซึ่งสามารถถูกปฏิเสธได้หากถือว่าไม่น่าเป็นไปได้ที่จะให้ข้อมูล จากการอ่านของฉันฟิชเชอร์เองก็ไม่เห็นด้วยกับการใช้สมมติฐานว่างเป็นค่าเริ่มต้น ฉันไม่เคยพบว่าเขาแสดงความคิดเห็นอย่างชัดเจนในเรื่องนี้ แต่เขาก็ไม่ได้แนะนำว่าควรเป็นสมมติฐานว่างเท่านั้น

  3. การใช้สมมุติฐานว่างเป็นค่าเริ่มต้นบางครั้งถูกตีความว่าเป็น "การละเมิด" ของการทดสอบสมมติฐาน แต่มันก็เป็นศูนย์กลางของวิธีการผสมที่ได้รับความนิยม อาร์กิวเมนต์ไปว่าการปฏิบัตินี้มักจะเป็น "เบื้องต้นไร้ประโยชน์":

    "นักวิจัยกำหนดทฤษฎีการทำนายโดยทั่วไปทิศทางของผลกระทบ ... เมื่อข้อมูลในความเป็นจริงแสดงผลทิศทางที่คาดการณ์นี้ดูเหมือนว่าจะยืนยันสมมติฐานนักวิจัยทดสอบสมมติฐาน 'คนฟาง' ว่าผลที่ได้จริง ศูนย์. หากหลังไม่สามารถปฏิเสธที่ระดับ. 05 (หรือตัวแปรบางอย่าง) แล้วการยืนยันที่ชัดเจนของทฤษฎีไม่สามารถอ้างสิทธิ์ได้ ... ข้อผิดพลาดทั่วไปในการทดสอบประเภทนี้คือการทำให้ระดับความสำคัญที่เกิดขึ้นจริงสับสน (สำหรับ ปฏิเสธคนฟาง - คนว่าง) กับการยืนยันระดับบรรลุทฤษฎีดั้งเดิม ... ความแข็งแกร่งของการยืนยันจริง ๆ แล้วขึ้นอยู่กับ [ความคมชัดของการคาดการณ์เชิงตัวเลขของนักวิจัย] ไม่ใช่ในระดับนัยสำคัญที่บรรลุเป้าหมายสำหรับคน - ฟางว่าง "

    การทดสอบสมมติฐานสมมุติฐานว่างในด้านจิตวิทยา David H Krantz วารสารสมาคมสถิติอเมริกัน; ธ.ค. 2542; 94, 448; 1372-1381

วิดีโอของ Khan Academy เป็นตัวอย่างของวิธีไฮบริดนี้และมีความผิดในการยอมรับข้อผิดพลาดที่ระบุไว้ในเครื่องหมายคำพูดนั้น จากข้อมูลที่มีอยู่ในวิดีโอเราสามารถสรุปได้ว่าหนูที่ฉีดแตกต่างจากที่ไม่ได้ฉีดในขณะที่วิดีโออ้างว่าเราสามารถสรุปได้ว่า "ยาเสพติดมีผลแน่นอน" การไตร่ตรองเล็กน้อยจะทำให้เราพิจารณาว่าบางทีหนูทดสอบที่เก่ากว่าที่ไม่ได้ฉีด ฯลฯ เราต้องแยกแยะคำอธิบายทางเลือกที่เป็นไปได้ก่อนที่จะอ้างหลักฐานสำหรับทฤษฎีของเรา ยิ่งการคาดการณ์ของทฤษฎีที่เฉพาะเจาะจงน้อยลงเท่าใดก็ยิ่งเป็นการยากที่จะทำสิ่งนี้ให้สำเร็จ

แก้ไข 2:

บางทีการยกตัวอย่างจากบันทึกการวินิจฉัยทางการแพทย์ของคุณอาจช่วยได้ สมมติว่าผู้ป่วยสามารถเป็น "ปกติ" หรือ "วิกฤตความดันโลหิตสูง" ได้

เรามีข้อมูลก่อนหน้านี้ว่ามีเพียง 1% ของคนที่อยู่ในภาวะวิกฤตความดันโลหิตสูง ผู้ที่อยู่ในภาวะวิกฤตความดันโลหิตสูงมีความดันโลหิตซิสโตลิกซึ่งตามหลังการแจกแจงปกติโดยมีค่าเฉลี่ย = 180 และ sd = 10 ในขณะเดียวกันคนปกติมีความดันโลหิตจากการแจกแจงแบบปกติมีค่าเฉลี่ย = 120, sd = 10 ค่าใช้จ่ายในการตัดสินคนปกติเมื่อพวกเขาเป็นศูนย์ค่าใช้จ่ายในการวินิจฉัยที่ขาดหายไปคือ 1 และค่าใช้จ่ายเนื่องจากผลข้างเคียงจากการรักษาคือ 0.2 ไม่ว่าพวกเขาจะอยู่ในช่วงวิกฤตหรือไม่ก็ตาม จากนั้นรหัส R ต่อไปนี้จะคำนวณอัตราส่วน (eta) และอัตราส่วนความน่าจะเป็น หากอัตราส่วนความน่าจะเป็นสูงกว่าเกณฑ์ที่เราตัดสินใจที่จะปฏิบัติหากน้อยกว่าที่เราทำไม่ได้:

#Prior probabilities
P0=.99 #Prior probability patient is normal
P1=1-P0 #Prior probability patient is in crisis

#Hypotheses
H0<-dnorm(x=50:250, mean=120, sd=10) #H0: Patient is normal
H1<-dnorm(x=50:250, mean=180, sd=10) #H1: Patient in hypertensive crisis

#Costs
C00=0 #Decide normal when normal
C01=1 #Decide normal when in crisis
C10=.2 #Decide crisis when normal
C11=.2 #Decide crisis when in crisis

#Threshold
eta=P0*(C10-C00)/ P1*(C01-C11)

#Blood Pressure Measurements
y<-rnorm(3, 150, 20)

#Calculate Likelihood of Each Datapoint Given Each Hypothesis
L0vec=dnorm(x=y, mean=120, sd=10) #Vector of Likelihoods under H0
L1vec=dnorm(x=y, mean=180, sd=10) #Vector of Likelihoods under H1

#P(y|H) is the product of the likelihoods under each hypothesis
L0<-prod(L0vec)
L1<-prod(L1vec)

#L(y) is the ratio of the two likelihoods
LikRatio<-L1/L0


#Plot
plot(50:250, H0, type="l", col="Green", lwd=4, 
     xlab=" Systolic Blood Pressure", ylab="Probability Density Given Model",
     main=paste0("L=",signif(LikRatio,3)," eta=", signif(eta,3)))
lines(50:250, H1, col="Red", lwd=4)
abline(v=y)

#Decision
if(LikRatio>eta){
  print("L > eta  ---> Decision: Treat Patient")
}else{
  print("L < eta  ---> Do Not Treat Patient")
}

ในสถานการณ์ข้างต้น threshold eta = 15.84 หากเราทำการวัดความดันโลหิตสามครั้งและรับ 139.9237, 125.2278, 190.3765 ดังนั้นอัตราส่วนความน่าจะเป็นคือ 27.6 ในความโปรดปรานของ H1: ผู้ป่วยในภาวะวิกฤตความดันโลหิตสูง ตั้งแต่ 27.6 มากกว่าเกณฑ์ที่เราจะเลือกปฏิบัติ กราฟแสดงสมมติฐานปกติเป็นสีเขียวและความดันโลหิตสูงเป็นสีแดง เส้นสีดำแนวตั้งแสดงถึงค่าของการสังเกต

ป้อนคำอธิบายรูปภาพที่นี่


บุคคลที่ลงคะแนนเลือกสามารถอธิบายได้ไหม เกิดอะไรขึ้นกับคำตอบนี้? : S
Pinocchio

@Pinocchio ฉันได้พยายามอธิบายสิ่งต่าง ๆ ที่มีประวัติในคำตอบ "การทดสอบสมมติฐาน" เป็นเรื่องยากที่จะพูดคุยอย่างชัดเจนเนื่องจาก ฉันคิดว่าฉันได้ตอบคำถามเกี่ยวกับวิธีการใช้แบบจำลอง / สมมติฐานของข้อตกลง แต่ไม่เข้าใจสิ่งนี้: 'การกำหนดสมมติฐานให้กับตัวอย่างข้อมูลแต่ละชุดมีความหมายอย่างไร'
สดใส

ฉันไม่เข้าใจว่าเพราะเหตุใดคำตอบนี้จึงถูกลดระดับลงและทำไมจึงไม่เพิ่มขึ้นอีก มันยอดเยี่ยมอย่างแท้จริง มันอาจใช้คำจำกัดความทางทฤษฎีมากกว่าเล็กน้อย แต่มันก็เน้นไปที่ผู้ชมที่กว้างกว่านักสถิติ ตัวอย่างแรกที่ใช้ GLM นั้นให้ความกระจ่างและสอดคล้องกับการอ่านเชิงวิชาการของฉัน บรรทัดล่างคือความแตกต่างที่สำคัญระหว่างการทดสอบสมมติฐานบ่อยและ Bayesian คือการบัญชีของก่อนเพื่อคำนวณ MAP (แทน MLE เท่านั้น)
gaborous

ฉันอาจเพิ่มว่าการแสดงกราฟิกของตัวอย่างแรกกับ GLM จะน่ากลัวมากและ enlightening อาจจะใช้ชนิดของพล็อตงัด ?
gaborous
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.