ช่วงความเชื่อมั่นและความน่าจะเป็น - ข้อผิดพลาดในคำสั่งนี้อยู่ที่ไหน?


12

หากมีคนทำคำสั่งเช่นด้านล่าง:

"โดยรวมผู้ที่ไม่สูบบุหรี่ที่สัมผัสกับควันสิ่งแวดล้อมมีความเสี่ยงสัมพัทธ์ของโรคหลอดเลือดหัวใจที่ 1.25 (ช่วงความเชื่อมั่น 95 เปอร์เซ็นต์, 1.17-1.32) เมื่อเทียบกับผู้สูบบุหรี่ที่ไม่ได้สัมผัสกับควัน"

อะไรคือความเสี่ยงสัมพัทธ์ของประชากรโดยรวม? สิ่งที่เกี่ยวข้องกับโรคหลอดเลือดหัวใจ? ในหลาย ๆ สิ่งที่สามารถทดสอบได้มีเพียงไม่กี่คนเท่านั้นที่เชื่อมโยงกับโรคหลอดเลือดหัวใจดังนั้นโอกาสที่สิ่งใดก็ตามที่ถูกเลือกแบบสุ่มนั้นเชื่อมต่อกันจะหายไป ดังนั้นเราจึงสามารถพูดได้ว่าความเสี่ยงสัมพัทธ์สำหรับประชากรคือ 1 แต่ช่วงเวลาที่ยกมาไม่มีค่า 1 ดังนั้นอย่างใดอย่างหนึ่งมีการเชื่อมต่อระหว่างสองสิ่งความน่าจะเป็นที่มีขนาดเล็กหายไปหรือนี่คือหนึ่งใน 5% ของช่วงเวลาที่ไม่มีพารามิเตอร์ ในฐานะที่เป็นหลังมีโอกาสมากขึ้นกว่าในอดีตมันเป็นสิ่งที่เราควรคิด ดังนั้นข้อสรุปที่เหมาะสมคือชุดข้อมูลเกือบผิดปกติของประชากร

แน่นอนถ้ามีพื้นฐานบางอย่างที่สมมติว่ามากกว่า 5% ของสิ่งต่าง ๆ เชื่อมโยงกับโรคหลอดเลือดหัวใจอาจมีหลักฐานบางอย่างในสถิติเพื่อสนับสนุนข้อเสนอแนะว่าควันสิ่งแวดล้อมเป็นหนึ่งในนั้น สามัญสำนึกแนะนำว่าสิ่งนี้ไม่น่าเป็นไปได้

อะไรคือข้อผิดพลาดในการใช้เหตุผลของพวกเขา (เนื่องจากองค์กรด้านสุขภาพทั้งหมดเห็นด้วยว่ามีวรรณกรรมสำคัญเกี่ยวกับผลกระทบที่เป็นอันตรายจากการสูบบุหรี่มือสอง) เป็นเพราะหลักฐานของพวกเขาที่ว่า "ในจำนวนที่มากของสิ่งที่สามารถทดสอบได้จริง ๆ น้อยมากที่เชื่อมต่อกับโรคหลอดเลือดหัวใจ"? ประโยคนี้อาจเป็นจริงสำหรับปัจจัยที่สุ่มเลือกใด ๆ (เช่นจำนวนสุนัขที่บุคคลหนึ่งเป็นเจ้าของที่มีความเสี่ยงต่อโรคหลอดเลือดหัวใจ) แต่ความน่าจะเป็นนิรนัยนั้นสูงกว่าการสูบบุหรี่มือสองและโรคหลอดเลือดหัวใจมากกว่าแค่ 'ปัจจัยสุ่มใด ๆ ' .

นี่เป็นเหตุผลที่ถูกต้องหรือไม่? หรือมีอย่างอื่นอีกไหม


ข้อความที่ยกมาดูเหมือน ... ดีเหมือนคำพูด มาจากไหน? :)
MånsT

ฮ่าฮ่าใช่มันเป็นคำพูดจากวิกิพีเดีย ... มีคนเพิ่มบทความนี้ลงในบทความสำหรับ "ช่วงความมั่นใจ" ฉันพยายามลบมันออกเพราะเห็นว่าไม่ถูกต้อง แต่ชายคนนั้นปฏิเสธดังนั้นฉันต้องการเหตุผลทางคณิตศาสตร์แทนที่จะเป็นแค่ "นี่เป็นสิ่งที่ผิดอย่างชัดเจน" .. แม้ว่าฉันจะมีความคิดบางอย่างฉันอยากจะรู้ว่ามีใครบางคนอธิบายได้ สิ่งที่เกิดขึ้นที่นี่ เพราะถ้าสิ่งนี้ถูกต้องการศึกษาจำนวนมากสามารถหักล้างในบริเวณเดียวกัน
BYS2

3
ถ้ามันลากไปนิดหน่อยฉันจะไปหาและช่วย ข้อโต้แย้งของเขาชัดเจนผิดและชี้ให้เห็นอย่างชัดเจนว่าเขามีวาระ
Erik

3
ในฐานะนักฟิสิกส์ที่ใช้สถิติจำนวนมาก แต่ไม่ใช่นักสถิติฉันพบว่าย่อหน้านั้นไม่มีประโยชน์จริง ๆ ไม่ต้องคิดเลยว่ามันฟังดูผิดธรรมดา ฉันคิดเสมอว่าอาจไม่ถูกต้องว่า 95% cl หมายความว่าถ้าสมมติฐานว่างเป็นจริงแล้ว 1 ครั้งใน 20 ถ้าฉันทำซ้ำการทดสอบของฉันฉันจะได้รับผลอย่างมีนัยสำคัญในระดับ 95% (เหตุผลที่ดีในความคิดของฉัน ไม่ใช้น้อยกว่า 99.9 แต่นั่นเป็นการสนทนาอื่น) โพสต์นั้นดูเหมือนจะเป็นประเด็นเกี่ยวกับปัจจัยที่มีความสัมพันธ์มากกว่าและไม่ได้ช่วยผู้ที่ไม่ใช่ผู้เชี่ยวชาญ (หรือใครก็ตาม) เลย
Bowler

@Erik ผู้ใช้มีประวัติหุ่นเชิดของหุ่นถุงเท้า (มีไม่กี่บัญชีและใช้การแก้ไข IP) และถูกบล็อกก่อนหน้านี้ ... ไม่แน่ใจว่าข้อตกลงของเขาคืออะไร แต่ดูเหมือนว่าจะเป็นผู้ก่อกวน
BYS2

คำตอบ:


10

มีหลายสิ่งผิดปกติที่นี่ ตามที่ @ Néstorอธิบายเขาจะถือว่าความน่าจะเป็นก่อนหน้านี้โดยปริยายบน (ไม่มีลิงก์) และ (ลิงก์)H 1H0H1

เขาวางน้ำหนักสูงมาก (มากใกล้เคียงกับ 1) ในและน้ำหนักขนาดเล็กมากในH_1นี่เป็นสิ่งที่น่าสงสัยเป็นครั้งแรกที่เขาทำเนื่องจากมีกลไกเชื่อมโยงระหว่างควันและโรคหัวใจ (พิจารณาผู้สูบบุหรี่ที่มีชีวิต) คำถามคือการได้รับสารเพียงพอหรือไม่ สิ่งนี้ไม่ได้พิจารณาการศึกษาก่อนหน้านี้ที่ทำ ดังนั้นจึงไม่ใช่หนึ่งใน "หลายสิ่งหลายอย่าง" ที่จะถูกทดสอบว่าสวมถุงเท้าสีแดงอย่างเช่น ซึ่งหมายความว่าเขาเริ่มต้นด้วยความลำเอียงสูงและไม่สมเหตุสมผลก่อนH 1H0H1

จากนั้นเขาอัปเดตก่อนหน้าของเขาโดยระบุว่าความน่าจะเป็นที่จะได้รับช่วงเวลาการยืนยัน 95% ที่ไม่มีค่าจริงมีความน่าจะเป็น 5% แม้ว่านี่จะเป็นจริง แต่นี่ไม่ใช่โอกาสที่จะได้ช่วงเวลานั้นภายใต้สมมติฐานของสมมติฐานว่าง โปรดทราบว่าเขาจะรักษาช่วงความมั่นใจไว้ที่ [1.17, 1.32] เหมือนกับช่วงความมั่นใจที่ [100, 200] ซึ่งเป็นปัญหาอย่างชัดเจน

นี่เป็นสิ่งสำคัญมากสำหรับวิธีการแบบเบย์: ในขณะที่คุณมีความน่าจะเป็นรวม 5% ที่ไม่ได้รับช่วงเวลาที่ประกอบด้วย 1 ภายใต้สมมติฐานที่ 1 เป็นศูนย์ความหนาแน่นของความน่าจะเป็นที่ได้รับช่วงเวลานั้นแตกต่างกัน

ข้อผิดพลาดประการที่สามคือเขาไม่เคยระบุก่อนหน้านี้หรือระบุว่าน่าจะเป็นอย่างไรเมื่อเทียบกับเพื่อให้ได้ผลลัพธ์นั้น มันเป็นแค่ "เล็ก ๆ ที่หายไป"H 1H0H1

ข้อผิดพลาดประการที่สี่คือการกล่าวว่าการกระทำที่เหมาะสมที่จะทำคือยกเลิกข้อมูล โปรดทราบว่าผลลัพธ์ของเขาไม่ได้ขึ้นอยู่กับข้อมูลอาร์กิวเมนต์ของเขาแสดงถึงการกระทำที่เหมือนกันสำหรับข้อมูลใด ๆ หากคุณพบลิงค์ที่น่าสนใจ แต่สงสัยว่ามันอาจจะเป็นความบังเอิญสิ่งที่วิทยาศาสตร์ต้องทำก็คือพยายามทำซ้ำผลลัพธ์ของคุณ!


ขอบคุณสำหรับการขยายคำตอบของ Nestor! แม้ว่าจะมีคำถามสั้น ๆ คุณระบุว่า "... นี่ไม่ใช่โอกาสที่จะได้ช่วงเวลานั้นภายใต้สมมติฐานของสมมติฐานว่าง" หากเราต้องการค้นหาโอกาสที่จะได้ช่วงเวลาหนึ่งภายใต้สมมติฐานของสมมติฐานว่างเราจะต้องใช้การอนุมานแบบเบย์และช่วงเวลาที่น่าเชื่อถือถูกต้องหรือไม่ ช่วงความมั่นใจบ่อยครั้งจะบอกคุณว่า "โอกาสที่ช่วงเวลานั้นจะรวมค่าจริง" ขอขอบคุณอีกครั้ง
BYS2

ช่วงความเชื่อมั่นที่เกิดขึ้นบ่อยครั้งที่ 95% ถูกสร้างขึ้นเพื่อให้อย่างน้อย 95% ของเวลาที่ช่วงเวลาที่สร้างขึ้นนั้นมีค่าจริง จนถึงตอนนี้ดีมาก สิ่งนี้บอกว่าคุณยังสามารถคำนวณความน่าจะเป็น (หรือค่าของความหนาแน่น) ของการได้ช่วงความเชื่อมั่นที่เฉพาะเจาะจงหากสมมติฐานว่างเป็นจริง ตำแหน่งที่แน่นอนมี "ข้อมูล" มากกว่าว่าจะรวมสมมติฐานว่างไว้หรือไม่ การทิ้งข้อมูลนั้นไม่ดีเมื่อใช้การอนุมานแบบเบย์เนื่องจากเกี่ยวข้องกับความน่าจะเป็นของการเป็นโมฆะ
Erik

ตัวอย่างของของเล่นคือ: การอนุมานแบบเบย์คุณต้องการอนุมานต่อรูปแบบการแจกแจง ก่อนอนุญาตให้มีสองสิ่งที่เป็นไปได้: H1: การกระจายตัวเป็นมาตรฐานปกติ H2: การแจกแจงแบบปกติ, ค่าเฉลี่ย = sd = 1. ตัวอย่างของค่าการแจกแจงอนุญาตให้คุณอัปเดตก่อนหน้า เมื่อคุณได้รับสัญญาณของค่าของคุณคุณสามารถอัปเดตก่อนหน้าได้ แต่การอัปเดตจะให้ข้อมูลน้อยลงเนื่องจากคุณทิ้งข้อมูลที่เกี่ยวข้อง
Erik

7

นี่เป็นประเด็นทางปรัชญาที่น่าสนใจมากที่เกี่ยวข้องกับการทดสอบสมมติฐาน (และในการตั้งค่าบ่อยครั้งก็มีช่วงความมั่นใจตามที่ฉันอธิบายที่นี่ )

แน่นอนมีสมมติฐานจำนวนมากที่สามารถตรวจสอบได้ - การสูบบุหรี่เรื่อย ๆ ทำให้เกิดโรคหลอดเลือดหัวใจ, การดื่มแอลกอฮอล์ทำให้เกิด chd, การเป็นเจ้าของสุนัขทำให้เกิด chd, การเป็นมังกรทำให้เกิด chd ...

หากเราเลือกหนึ่งในสมมติฐานเหล่านี้ทั้งหมดโดยการสุ่มความน่าจะเป็นที่เราเลือกสมมติฐานที่เกิดขึ้นจริงเป็นศูนย์ นี่น่าจะเป็นข้อโต้แย้งในข้อความที่ยกมา - มันไม่น่าเป็นไปได้มากที่เราจะทดสอบสมมติฐานที่แท้จริง

แต่สมมติฐานไม่ได้ถูกเลือกแบบสุ่ม มันเป็นแรงบันดาลใจจากความรู้ทางระบาดวิทยาและการแพทย์ก่อนหน้านี้เกี่ยวกับโรคหลอดเลือดหัวใจ มีกลไกทางทฤษฎีที่อธิบายว่าการสูบบุหรี่สามารถก่อให้เกิดโรคหลอดเลือดหัวใจได้อย่างไรจึงไม่น่าคิดว่าจะต้องใช้วิธีสูบบุหรี่แฝง

การวิจารณ์ในเครื่องหมายคำพูดอาจใช้ได้สำหรับการศึกษาเชิงสำรวจที่มีการขุดชุดข้อมูลสำหรับสมมติฐาน นั่นคือเหตุผลที่เราไม่ยอมรับ "การค้นพบ" ดังกล่าวเป็นข้อเท็จจริง แต่เราต้องการให้ผลลัพธ์นั้นสามารถทำซ้ำได้ในการศึกษาใหม่ ทั้งสองวิธีกระดาษที่อ้างถึงในใบเสนอราคาเป็นการศึกษาเมตาและดังนั้นจึงไม่ได้รับผลกระทบจากปัญหานี้

เราได้เห็นสังเกตุในช่วงหลายศตวรรษที่ผ่านมาว่าการทดสอบสมมติฐานได้รับแรงบันดาลใจจากทฤษฎีโดยการเปรียบเทียบผลลัพธ์ที่คาดการณ์กับผลลัพธ์ที่สังเกตได้ ความจริงที่ว่าเราเชื่อในกระบวนการนี้เป็นเหตุผลที่ทำให้เราก้าวหน้าไปมากในด้านการแพทย์วิศวกรรมและวิทยาศาสตร์ มันเป็นเหตุผลที่ฉันสามารถเขียนลงบนคอมพิวเตอร์ของฉันและคุณสามารถอ่านมันบนของคุณ เพื่อยืนยันว่าขั้นตอนนี้ไม่ถูกต้องคือการยืนยันว่าวิธีการทางวิทยาศาสตร์มีข้อบกพร่องพื้นฐาน - และเรามีหลักฐานมากมายที่ระบุเป็นอย่างอื่น

ฉันสงสัยว่ามีอะไรที่คนที่ไม่เต็มใจยอมรับหลักฐานประเภทนี้จริง ๆ แล้วจะยอมรับ ...


ฉันไม่ได้ย่อหน้าของคุณมาก่อน คุณหมายถึง "การทดสอบนัยสำคัญ" (เช่นการคำนวณความน่าจะเป็นของข้อมูลอย่างน้อยที่สุด) หรือ "การทดสอบสมมติฐาน" จริง ๆ (การตั้งค่าแบบเบส์) ใครบอกว่าข้อใดข้อหนึ่งไม่ได้ผลถ้าคุณถามคำถามที่ถูกต้อง
Néstor

@ Néstor: ฉันควรจะเขียนที่แตกต่างกัน ฉันไม่ได้ทำการแถลงเกี่ยวกับการทดสอบสมมติฐานทางสถิติแต่เป็นการสังเกตเกี่ยวกับความจริงที่ว่าการเปรียบเทียบแบบจำลองการทำนายกับข้อมูลในโลกแห่งความเป็นจริง (เช่น "การทดสอบ" หากสมมติฐานถูกต้อง) น่าจะเป็นวิธีที่มีประสิทธิภาพมาก วิทยาศาสตร์. หัวใจสำคัญของการวิจารณ์นี้ต่อ CI คือฉันเชื่อว่าไม่เต็มใจที่จะยอมรับวิธีนี้ ชนิดของการโต้แย้งที่ให้ไว้ในเครื่องหมายคำพูดจะนำไปใช้กับวิธีการทางสถิติใด ๆ - ด้วยความน่าจะเป็นที่เป็นศูนย์ก่อนสำหรับสมมติฐานว่างทั้งหมดเราไม่เคยเชื่อในสิ่งใดเลย
MånsT

6

ฉันไม่เข้าใจว่าทำไมผู้เขียนบอกว่าความน่าจะเป็นของความเสี่ยงสัมพัทธ์ของโรคหลอดเลือดหัวใจตีบ 1 อาจหายไปจากการวิเคราะห์ของเขาเพียงอย่างเดียวในช่วงความเชื่อมั่น มันผิดธรรมดา สำหรับฉันดูเหมือนว่าเขากำลังใช้การตั้งค่าแบบประจำ แต่เขาก็ให้เหตุผลแบบเบย์ (ซึ่งค่อนข้างธรรมดา)

สิ่งเดียวที่เชื่อมโยงกับ CI มีการทดสอบอย่างมีนัยสำคัญคลาสสิก แต่ที่เราทุกคนรู้ว่าถ้า { มีไม่มีการเชื่อมโยงระหว่างการสูบบุหรี่มือสองและโรคหลอดเลือดหัวใจตีบคือพวกเขาให้คุณ} (ที่หมายถึง " ข้อมูลอย่างน้อยที่สุดเท่าที่เราสังเกตเห็น ") ไม่ใช่ (โดยที่คือข้อมูล) ซึ่งเป็นสิ่งที่เขาอ้างและสิ่งที่เชื่อมโยงกับสิ่งที่คุณชี้ให้เห็นอย่างชัดเจน คุณต้องรวมความรู้ก่อนหน้าเกี่ยวกับลิงค์นั้น! นี้มาจากความจริงที่ว่า: โดยเบส์ทฤษฏีที่คือความน่าจะเป็นก่อนในH_0p ( D e | H 0 ) D e p ( H 0 | D ) D p ( H 0 | D ) p ( D | H 0 ) p ( H 0 ) , p ( H 0 ) H 0H0:p(De|H0)Dep(H0|D)D

p(H0|D)p(D|H0)p(H0),
p(H0)H0

จะไม่ H0: ไม่มีการเชื่อมโยงระหว่างการสูบบุหรี่เรื่อย ๆ และ CHD เนื่องจากสมมติฐานว่างมักเป็นสมมติฐานว่าไม่มีผลกระทบ นอกจากนั้นขอขอบคุณสำหรับคำตอบนี้!
BYS2

ใช่คุณพูดถูก! ฉันไม่ได้สังเกตจนกระทั่งคุณชี้ :-) ฉันจะแก้ไขคำตอบของฉัน
Néstor

3

ในขณะที่มีบางสิ่งบางอย่างสำหรับสายการให้เหตุผลแบบเบย์นี้ (แยกส่วนอย่างละเอียดโดย Erik!) และแนวความคิดนี้จะอธิบายว่าทำไมการค้นพบทางการแพทย์จำนวนมากจึงไม่สามารถทำซ้ำได้

ผู้เขียนสันนิษฐานสองสิ่งโดยไม่แสดงหลักฐาน: การสัมผัสกับควันถูกเลือกโดยการสุ่มและแทบไม่มีอะไรในโลกที่ทำให้เกิดโรคหัวใจ ภายใต้มาตรฐานการให้เหตุผลที่ไม่เข้มงวดเหล่านี้ผู้เขียนสามารถปฏิเสธข้อสรุปใด ๆ ที่ทำให้เกิดโรคหัวใจ สิ่งที่คุณต้องทำคือยืนยัน:

  1. สมมติฐานที่เลือกโดยการสุ่มและ
  2. โรคหัวใจนั้นมีสาเหตุใกล้เคียงกับศูนย์มาก

การยืนยันทั้งสองนี้เป็นที่ถกเถียงกัน (และตามความรู้ทั่วไปของฉันอาจเป็นเท็จได้) แต่ด้วยสมมติฐานเหล่านี้ในสถานที่แม้จะสังเกตว่า 100% ของผู้คนที่สัมผัสกับควันบุหรี่มือสองที่เสียชีวิตจากอาการหัวใจวายภายในหนึ่งปีคุณสามารถยืนยันได้ว่าการเชื่อมต่อเป็นเพียงความสัมพันธ์บังเอิญกับสาเหตุที่ซ่อนเร้น .


ขอบคุณสำหรับความคิดของคุณ! ใช่ผู้เขียนสันนิษฐานอย่างแน่นอนว่าสมมติฐานคือ 'เลือกโดยการสุ่ม' ซึ่งไม่ถูกต้อง
BYS2

-1

ฉันไม่เห็นความผิดพลาดใด ๆ ที่เห็นได้ชัดในย่อหน้า แต่ฉันไม่ได้เห็นข้อมูลและไม่สามารถตรวจสอบได้ว่าเป็นตัวเลข อย่างไรก็ตามสองย่อหน้าที่ตามมานั้นไม่มีความชัดเจนมาก

สมมติว่าเขาได้กล่าวว่า "โดยรวมแล้วผู้ที่ไม่สูบบุหรี่ซึ่งเป็นโรคอ้วนมีความเสี่ยงสัมพัทธ์ของโรคหลอดเลือดหัวใจ 1.25 (ช่วงความเชื่อมั่น 95 เปอร์เซ็นต์, 1.17 ถึง 1.32) เมื่อเทียบกับผู้ไม่สูบบุหรี่ที่มีน้ำหนักตัวปกติ" ใครบ้างมีเหตุผลที่จะสงสัยเขา


ย่อหน้าแรกในใบเสนอราคาเป็นเพียงผู้เขียนอ้างถึงข้อสรุปของการศึกษาทางระบาดวิทยาดังนั้นจึงไม่มีอะไรผิดปกติกับมัน .. วรรคสองสามต่อไปคือเขาพยายามทำให้เสียชื่อเสียงการศึกษาซึ่งเป็นที่ที่เขาทำให้งบที่น่าสงสัย
BYS2
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.