เป็นไปได้หรือไม่ที่จะเปลี่ยนสมมติฐานเพื่อให้ตรงกับข้อมูลที่สังเกต (หรือที่เรียกว่าการตกปลา) และหลีกเลี่ยงข้อผิดพลาด Type I ที่เพิ่มขึ้น?


32

เป็นที่ทราบกันดีว่านักวิจัยควรใช้เวลาในการสังเกตและสำรวจข้อมูลและการวิจัยที่มีอยู่ก่อนสร้างสมมติฐานแล้วรวบรวมข้อมูลเพื่อทดสอบสมมติฐานนั้น (หมายถึงการทดสอบนัยสำคัญของสมมติฐานว่างเปล่า) หนังสือสถิติพื้นฐานหลายเล่มเตือนว่าต้องมีการตั้งสมมติฐานก่อนและไม่สามารถเปลี่ยนแปลงได้หลังจากการรวบรวมข้อมูลมิฉะนั้นวิธีการจะไม่ถูกต้อง

ฉันเข้าใจว่าเหตุผลข้อหนึ่งที่ว่าทำไมการเปลี่ยนสมมติฐานให้พอดีกับข้อมูลที่สังเกตนั้นเป็นปัญหาเพราะมีโอกาสมากขึ้นที่จะยอมรับข้อผิดพลาดประเภทที่ 1 เนื่องจากข้อมูลปลอม แต่คำถามของฉันคือ: เป็นเหตุผลเดียวหรือมีปัญหาพื้นฐานอื่น ๆ เดินทางไปตกปลา?

ในฐานะที่เป็นคำถามโบนัสมีวิธีที่จะไปสำรวจการตกปลาโดยไม่ต้องเปิดเผยตัวเองถึงข้อผิดพลาดที่อาจเกิดขึ้น? ตัวอย่างเช่นหากคุณมีข้อมูลเพียงพอคุณสามารถสร้างสมมติฐานจากครึ่งหนึ่งของข้อมูลแล้วใช้อีกครึ่งหนึ่งเพื่อทดสอบพวกเขาได้หรือไม่

ปรับปรุง

ฉันซาบซึ้งในความสนใจในคำถามของฉัน แต่คำตอบและความคิดเห็นส่วนใหญ่มุ่งไปที่สิ่งที่ฉันคิดว่าฉันกำหนดไว้เป็นข้อมูลพื้นฐาน ฉันสนใจที่จะรู้ว่าถ้ามีคนอื่น ๆด้วยเหตุผลที่ว่าทำไมมันไม่ดีเกินความเป็นไปได้ที่สูงขึ้นของผลการปลอมและถ้ามีวิธีการเช่นข้อมูลแยกแรกของการเปลี่ยนแปลงสมมติฐานโพสต์เฉพาะกิจแต่หลีกเลี่ยงการเพิ่มขึ้นในข้อผิดพลาดประเภทฉัน

ฉันได้อัปเดตชื่อแล้วเพื่อให้สะท้อนถึงคำถามที่ฉันต้องการ

ขอบคุณและขออภัยในความสับสน!



1
การจุดของมุมมองในสิ่งที่มีอยู่แล้วอีกกล่าวว่าสาระสำคัญของวิธีการทางวิทยาศาสตร์คือการทำให้สมมติฐานและจากนั้นพยายามที่จะบิดเบือนพวกเขาว่าพวกเขาอาจจะกลายเป็นทฤษฎี (ถ้าทำผิดล้มเหลว) การออกไปตกปลาเป็นวิธีที่ถูกต้องในการค้นหาสมมติฐานที่คุ้มค่าที่จะปลอมแปลงในการทดสอบในภายหลัง แต่คุณไม่สามารถสร้างและพยายามที่จะปลอมแปลงสมมติฐานในครั้งเดียว โดยเฉพาะอย่างยิ่งหากคุณเปิดให้ปรับสมมติฐานของคุณคุณจะไม่พยายามเท็จอีกต่อไป แต่เมื่อคุณปรับเปลี่ยนคุณกำลังปลอมแปลงสมมติฐานที่ยังไม่ได้ปรับปรุงและสร้างสมมติฐานใหม่
Wrzlprmft

@ โจนานั่นเป็นกระดาษที่ยอดเยี่ยม ฉันได้อ่านบทความจากทั้ง Ioannidis และ Schooler แล้ว แต่ Simmons และคณะได้ อธิบายปัญหาอย่างน่าทึ่ง
โพสต์เฉพาะกิจ

1
ฉันสงสัยว่าคุณยังจะได้พบบทความนี้เกี่ยวข้องกับคำถามของคุณ: stat.columbia.edu/~gelman/research/published/multiple2f.pdf มันไม่ได้อยู่ในเรื่องเดียวกัน แต่มันเน้นที่แง่มุมหนึ่งของมัน
a11msp

1
ข้อมูลอาจทำให้คุณเปลี่ยนสมมติฐานของคุณ ... แต่ในกรณีนั้นคุณต้องเริ่มรวบรวมข้อมูลใหม่ตั้งแต่เริ่มต้นเพื่อยืนยันสมมติฐานใหม่
keshlam

คำตอบ:


54

แน่นอนว่าคุณสามารถไปสำรวจการตกปลาได้ตราบใดที่คุณยอมรับว่าเป็นการสำรวจการตกปลาและปฏิบัติต่อสิ่งนั้น ชื่อที่ดีกว่าสำหรับเช่นนี้คือ "การวิเคราะห์ข้อมูลเชิงสำรวจ"

การเปรียบเทียบที่ดีกว่าอาจเป็นการถ่ายภาพที่เป้าหมาย:

คุณสามารถยิงไปที่เป้าหมายและเฉลิมฉลองหากคุณโดนตาวัว

คุณสามารถยิงได้โดยไม่มีเป้าหมายเพื่อทดสอบคุณสมบัติของปืนของคุณ

แต่มันเป็นการโกงที่จะยิงที่กำแพงแล้วทาสีเป้าหมายรอบรูกระสุน

วิธีหนึ่งในการหลีกเลี่ยงปัญหาบางประการคือทำการสำรวจในชุดข้อมูลการฝึกอบรมและทดสอบในชุดข้อมูล "ทดสอบ" แยกต่างหาก


13
เป็นการยากที่จะปรับปรุงคำตอบของปีเตอร์ ปัญหาที่โชคร้ายที่มีการขุดลอกข้อมูลจำนวนมากคือการขาดการยอมรับจากผู้เขียนว่าสมมติฐานไม่ได้ระบุไว้ล่วงหน้าอย่างสมบูรณ์เช่นไม่ใช้คำว่า 'สำรวจ' นักวิจัยหลายคนกำลังขุดข้อมูลเพื่อให้ได้เอกสารเผยแพร่และไม่ได้ติดตามความพยายามในการตรวจสอบความถูกต้อง (ซึ่งมักจะทำให้พวกเขาผิดหวัง)
Frank Harrell

2
การแสดงความคิดเห็นของ Frank Harrell อีกขั้น: ถูกต้องตามกฎหมายในการสำรวจข้อมูลและเผยแพร่การค้นพบที่น่าสนใจ ... ในฐานะการค้นพบที่น่าสนใจ ข้อเสียคือ: ถ้ามีคนอื่นยืนยันการค้นพบของคุณพวกเขาอาจได้รับเกียรติและถ้าคนอื่นไม่ยืนยันผลลัพธ์ของคุณคุณจะถูกหลอกโดยความสัมพันธ์ที่น่าเกรงขาม ไม่ดีถ้าคุณมีอัตตาตัวใหญ่ ไม่ต้องพูดถึงคุณจะต้องทำให้ข้อมูลและขั้นตอนของคุณเป็นแบบสาธารณะซึ่งผู้ปฏิบัติงานหลายคนในหลายสาขาจะไม่ทำ และคุณควรติดตามข้อมูลใหม่มากกว่าที่จะดำเนินการต่อ
Wayne

11
+1But it's cheating to shoot at a wall and then paint a target around the bullet hole.
WernerCD

3
@ โพสต์ที่ดีมันไม่ควรยกคิ้ว แต่มันอาจ ขึ้นอยู่กับดวงตาที่อยู่ภายใต้คิ้ว!
Peter Flom - Reinstate Monica

2
เท็กซัสนักแม่นปืนเข้าใจผิด ..
smci

25

ปัญหาของการสำรวจการตกปลาคือ: ถ้าคุณทดสอบสมมติฐานมากพอหนึ่งในนั้นจะได้รับการยืนยันด้วยค่า p ต่ำ ขอยกตัวอย่างที่เป็นรูปธรรม

ลองนึกภาพคุณกำลังทำการศึกษาทางระบาดวิทยา คุณพบผู้ป่วย 1,000 รายที่ทุกข์ทรมานจากสภาพที่หายาก คุณต้องการที่จะรู้ว่าสิ่งที่พวกเขามีเหมือนกัน ดังนั้นคุณเริ่มการทดสอบ - คุณต้องการที่จะดูว่ามีลักษณะเฉพาะมีการแสดงมากเกินไปในตัวอย่างนี้หรือไม่ เริ่มแรกคุณต้องทดสอบเพศเชื้อชาติประวัติครอบครัวที่เกี่ยวข้องบางอย่าง (พ่อเสียชีวิตด้วยโรคหัวใจก่อนอายุ 50 ปี ... ) แต่ในที่สุดเมื่อคุณมีปัญหาในการค้นหาสิ่งที่ "เกาะติด" คุณจะเริ่มเพิ่มปัจจัยอื่น ๆอาจเกี่ยวข้องกับโรค:

  • เป็นมังสวิรัติ
  • ได้เดินทางไปแคนาดา
  • เรียนจบแล้ว
  • แต่งงานแล้ว
  • มีลูก
  • มีแมว
  • มีสุนัข
  • ดื่มไวน์แดงอย่างน้อย 5 แก้วต่อสัปดาห์
    ...

ตอนนี้ที่นี่คือสิ่งที่ ถ้าฉันเลือกสมมติฐาน "สุ่ม" มากพอก็เริ่มมีแนวโน้มว่าอย่างน้อยหนึ่งในนั้นจะส่งผลให้ค่า ap น้อยกว่า 0.05 - เพราะสาระสำคัญของค่า p คือ "ความน่าจะเป็นที่จะผิดสมมติฐานปฏิเสธเมื่อมี ไม่มีผล " ใส่แตกต่างกัน - โดยเฉลี่ยทุก 20 ปลอมสมมติฐานคุณทดสอบหนึ่งของพวกเขาจะทำให้คุณ AP ของ <0.05

นี่เป็นบทสรุปที่ดีมากในการ์ตูน XKCD http://xkcd.com/882/ :

ป้อนคำอธิบายรูปภาพที่นี่

โศกนาฏกรรมคือแม้ว่าผู้เขียนแต่ละคนไม่ได้ทำการทดสอบสมมุติฐาน 20 แบบในตัวอย่างเพื่อค้นหาความสำคัญอาจมีผู้เขียนอีก 19 คนที่ทำสิ่งเดียวกัน และคนที่ "พบ" ความสัมพันธ์ในขณะนี้มีกระดาษที่น่าสนใจที่จะเขียนและคนที่มีแนวโน้มที่จะได้รับการยอมรับสำหรับการตีพิมพ์ ...

สิ่งนี้นำไปสู่แนวโน้มที่โชคร้ายสำหรับการค้นพบที่เอาคืนไม่ได้ วิธีที่ดีที่สุดในการป้องกันสิ่งนี้ในฐานะผู้เขียนรายบุคคลคือการตั้งค่าแถบที่สูงขึ้น แทนที่จะทดสอบปัจจัยแต่ละตัวถามตัวเองว่า "ถ้าฉันทดสอบสมมุติฐาน N แล้วความน่าจะเป็นที่มาของค่าบวกปลอมอย่างน้อยหนึ่งค่าคืออะไร" เมื่อคุณกำลังทดสอบ "สมมติฐานการตกปลา" จริงๆคุณสามารถคิดเกี่ยวกับการแก้ไข Bonferroniเพื่อป้องกันสิ่งนี้ - แต่คนมักจะไม่ทำ

มีเอกสารที่น่าสนใจโดยดร. ไอโออานิเดส - จัดทำในเดือนแอตแลนติกโดยเฉพาะในหัวข้อนี้

ดูคำถามก่อนหน้านี้พร้อมคำตอบที่ลึกซึ้งด้วย

อัปเดตเพื่อตอบคำถามของคุณได้ดียิ่งขึ้น:

หากคุณกลัวว่าคุณอาจจะ "ตกปลา" แต่คุณไม่รู้ว่าจะตั้งสมมติฐานอย่างไรคุณสามารถแบ่งข้อมูลของคุณในส่วน "การสำรวจ", "การจำลอง" และ "การยืนยัน" ได้อย่างแน่นอน ในหลักการนี้ควร จำกัด การเปิดเผยความเสี่ยงที่ระบุไว้ก่อนหน้านี้: หากคุณมีค่า ap ของ 0.05 ในข้อมูลการสำรวจและคุณได้รับค่าที่คล้ายคลึงกันในข้อมูลการจำลองแบบและการยืนยันความเสี่ยงของการผิดพลาด ตัวอย่างที่ดีของ "การทำถูกต้อง" ปรากฏในวารสารการแพทย์ของอังกฤษ (สิ่งพิมพ์ที่ได้รับการยกย่องอย่างมากพร้อมด้วย Impact Factor 17+)

การสำรวจและการยืนยันปัจจัยที่เกี่ยวข้องกับการตั้งครรภ์ที่ไม่ซับซ้อนในผู้หญิงครรภ์แรก: การศึกษาตามรุ่นที่คาดหวัง, Chappell และคณะ

นี่คือย่อหน้าที่เกี่ยวข้อง:

เราแบ่งชุดข้อมูลของผู้หญิง 5628 ออกเป็นสามส่วน: ชุดข้อมูลการสำรวจของสองในสามของผู้หญิงจากออสเตรเลียและนิวซีแลนด์เลือกโดยการสุ่ม (n = 2129); ชุดข้อมูลการจำลองแบบท้องถิ่นของผู้หญิงที่สามที่เหลือจากออสเตรเลียและนิวซีแลนด์ (n = 1,067); และชุดข้อมูลการยืนยันภายนอกที่ชัดเจนทางภูมิศาสตร์ของผู้หญิงชาวยุโรปจำนวน 2432 คนจากสหราชอาณาจักรและสาธารณรัฐไอร์แลนด์

เมื่อย้อนกลับไปในวรรณกรรมมีบทความที่ดีโดย Altman et al entitle "การพยากรณ์โรคและการวิจัยเชิงพยากรณ์: การตรวจสอบความถูกต้องของแบบจำลองการพยากรณ์โรค"ซึ่งจะเจาะลึกลงไปมากขึ้นและแนะนำวิธีที่จะทำให้แน่ใจว่า ข้อผิดพลาดนี้ "ประเด็นหลัก" จากบทความ:

แบบจำลองที่ไม่ผ่านการตรวจสอบไม่ควรใช้ในการปฏิบัติทางคลินิกเมื่อตรวจสอบรูปแบบการพยากรณ์โรคควรทำการประเมินการสอบเทียบและการเลือกปฏิบัติในการตรวจสอบความถูกต้องของข้อมูลที่แตกต่างจากที่ใช้ในการพัฒนาแบบจำลอง เนื่องจากข้อบกพร่องในวิธีการพัฒนาหรือเนื่องจากตัวอย่างใหม่นั้นแตกต่างจากของจริงมากเกินไป

ข้อสังเกตโดยเฉพาะอย่างยิ่งข้อเสนอแนะที่จะทำการตรวจสอบ (ฉันถอดความ) กับข้อมูลจากแหล่งอื่น ๆ - เช่นมันไม่เพียงพอที่จะแยกข้อมูลของคุณเป็นชุดย่อยโดยพลการ แต่คุณควรทำสิ่งที่คุณสามารถทำได้เพื่อพิสูจน์ว่า ของการทดลองสามารถใช้กับข้อมูลจากชุดการทดลองอื่น นั่นเป็นแถบที่สูงกว่า แต่จะช่วยลดความเสี่ยงที่ระบบอคติในการตั้งค่าของคุณจะสร้าง "ผลลัพธ์" ที่ไม่สามารถตรวจสอบได้อย่างอิสระ

มันเป็นเรื่องที่สำคัญมาก - ขอบคุณสำหรับการถามคำถาม!


7
สิ่งนี้ทำให้นึกถึง: xkcd.com/882
Jens

2
@ jens - นั่นเป็นคำอธิบายที่ไกลเกินกว่าคำอธิบายที่ฉันได้ให้ ... ขอบคุณสำหรับลิงค์ ในฐานะที่เป็นปกติ - ทำเลื่อนเมาส์ไปที่การ์ตูนสำหรับ Zinger เล็ก ๆ น้อย ๆ
Floris

Ioannides และบทความ Lehrer เป็นเส้นทางที่นำฉันมาที่นี่ ตัวอย่างของคุณคล้ายกับตัวอย่างใน Simmons และคณะที่ @jona พูดถึง เป็นวิธีที่ดีมากในการอธิบายความเป็นไปได้ที่เพิ่มขึ้นของข้อผิดพลาด Type I แต่มีเหตุผลอื่น ๆ ที่ทำให้เกิดข้อผิดพลาด
โพสต์เฉพาะกิจ

1
ปัญหาเกี่ยวกับการขุดลอกข้อมูลโดยทั่วไปคือคุณเสี่ยงที่จะเกิด "ความสัมพันธ์" กับ "สาเหตุ" โดยการตั้งสมมติฐานที่สมเหตุสมผลก่อนจากนั้นยืนยันว่าช่วยอธิบายการสังเกตคุณจำกัดความเสี่ยงในการทำให้ทั้งสองสับสน "ข้อมูลขนาดใหญ่" มักจะไปทางอื่น - วิธีการทำงานของพวกเขาคือ "ถ้าฉันวิเคราะห์ข้อมูลมากพอฉันจะเห็นรูปแบบที่เป็นจริงในอดีตและจะยังคงอยู่ต่อไปในอนาคต" บางครั้งก็ใช้งานได้บางครั้งก็ใช้ไม่ได้ สถิติไม่ควรกลายเป็นสิ่งทดแทนความคิดและความเข้าใจ - เป็นการยืนยันเท่านั้น
Floris

6
ฉันไม่คิดว่าปัญหาหลักคือความสัมพันธ์กับสาเหตุ เป็นการง่ายที่จะทำการวิเคราะห์ความสัมพันธ์กับหมัดเพียงเพื่อจะพบว่าการเชื่อมโยงไม่ได้ทำซ้ำ
Frank Harrell

5

คำถามถามว่ามีปัญหาอื่นนอกเหนือจากแบบที่ผิดพลาดของอัตราเงินเฟ้อที่มาพร้อมกับการสำรวจการตกปลาหรือไม่

0

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.