หากการเปรียบเทียบหลายรายการเป็นแบบ“ วางแผน” คุณยังต้องแก้ไขหลายรายการหรือไม่


20

ฉันกำลังตรวจสอบกระดาษที่มีการทดสอบ> ทดสอบ 2x2 Chi Square แยกกัน 15 ครั้ง ฉันแนะนำว่าพวกเขาต้องแก้ไขให้ถูกต้องสำหรับการเปรียบเทียบหลาย ๆ ครั้ง แต่พวกเขาได้ตอบว่าการเปรียบเทียบทั้งหมดนั้นมีการวางแผนและดังนั้นจึงไม่จำเป็น

ฉันรู้สึกว่าสิ่งนี้จะต้องไม่ถูกต้อง แต่ไม่สามารถค้นหาแหล่งข้อมูลที่ระบุอย่างชัดเจนว่าเป็นกรณีนี้หรือไม่

ใครช่วยได้บ้าง


ปรับปรุง:

ขอบคุณสำหรับคำตอบที่เป็นประโยชน์ทั้งหมดของคุณ เพื่อตอบสนองต่อคำขอของ @ gung สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการศึกษาและการวิเคราะห์พวกเขากำลังเปรียบเทียบข้อมูลการนับสำหรับผู้เข้าร่วมสองประเภท (นักเรียนที่ไม่ใช่นักเรียน) ในสองเงื่อนไขในช่วงเวลาสามช่วงเวลา การทดสอบ 2x2 Chi Square หลายครั้งจะถูกเปรียบเทียบในแต่ละช่วงเวลาในแต่ละเงื่อนไขสำหรับผู้เข้าร่วมแต่ละประเภท (ถ้าเหมาะสม) เช่นนักเรียนเงื่อนไข 1 ระยะเวลา 1 เทียบกับช่วงเวลา 2) ดังนั้นการวิเคราะห์ทั้งหมดจึงทดสอบสมมติฐานเดียวกัน .


2
หลายคนที่ดำเนินการเปรียบเทียบหลายแผนเพื่อทำสิ่งเหล่านี้ให้สำเร็จ พวกเขาทำเพราะต้องการควบคุมอัตราความผิดพลาดประเภทที่ 1 ในบางสถานการณ์อาจมีเหตุผลที่จะไม่ถูกต้องสำหรับการเปรียบเทียบหลาย ๆ ครั้ง แต่มันไม่ใช่แค่เรื่องของการวางแผนที่จะทำสิ่งเหล่านี้ทั้งหมดตั้งแต่เริ่มต้น
Glen_b -Reinstate Monica

3
คุณช่วยพูดเพิ่มอีกเล็กน้อยเกี่ยวกับการศึกษาข้อมูลและการวิเคราะห์ที่นั่นได้ไหม? จำนวนเงิน> 15 เทียบกับการเปรียบเทียบที่เป็นไปได้ทั้งหมดหรือเพียงเล็กน้อยเท่านั้นหรือไม่ พวกเขามีข้อมูลเท่าไหร่? เป็นไปได้มากเพียงใดที่สมมติฐานทั้งหมดมาก่อน พวกเขาทั้งหมดสำคัญหรือไม่ การทดสอบไคสแควร์เป็นอิสระจากกันหรือไม่? พิจารณาคำถามที่เกิดขึ้นในคำตอบของ @ peuhp ด้วย
gung - Reinstate Monica

4
เนื่องจาก "พวกเขา" มีแนวโน้มที่จะสนใจในการค้นหาผลลัพธ์ที่สำคัญการตอบสนองของพวกเขาคือการบริการตนเอง ดังนั้นภาระที่พวกเขาแสดงให้เห็นว่าทำไมวิธีการของพวกเขาถูกต้องตามกฎหมายมากกว่าที่คุณจะแสดงว่ามันผิดกฎหมาย ความพยายามใด ๆ ที่จะแสดงให้เห็นว่าการเปรียบเทียบหลาย ๆ อย่างสามารถถูกละเลยได้จะล้มเหลวทันทีที่มันพิจารณาอัตราการบวกที่ผิดพลาดทั่วทั้งกระดาษดังนั้น "พวกเขา" จะต้องหลีกเลี่ยงการพิจารณาทั้งหมดของปัญหานั้นหรืออย่างอื่นให้เหตุผลที่ดี มันไม่มีความกังวลสำหรับผู้ชมที่ต้องการ
whuber

1
ฉันจะถูกล่อลวงอย่างมากที่จะตอบสนองด้วยการเชื่อมโยงไปยังแถบ XKCD นี้ (ซึ่งอย่างที่คุณอาจจะทราบว่าเกี่ยวข้องกับการทดสอบหลายชุดตามแผน ... )
Ilmari Karonen

คำตอบ:


21

นี่เป็นปัญหาที่ซับซ้อนของ IMHO และฉันต้องการแสดงความคิดเห็นสามข้อเกี่ยวกับสถานการณ์นี้

ก่อนอื่นโดยทั่วไปฉันจะมุ่งเน้นไปที่ว่าคุณต้องเผชิญกับการศึกษาเชิงยืนยันด้วยชุดของรูปทรงที่ดีที่กำหนดไว้ในบริบทที่เป็นข้อโต้แย้งหรือการศึกษาเชิงอธิบายที่มีการสังเกตตัวชี้วัดหลายอย่างมากกว่าที่พวกเขาวางแผนหรือไม่ เพียงวางแผนที่จะทำการเปรียบเทียบที่เป็นไปได้ทั้งหมด)

ประการที่สองฉันจะเน้นที่การพูดถึงค่า p ที่เกิดขึ้นแล้ว พวกเขาแต่ละคนเคยใช้เพื่อสรุปข้อสรุปที่ชัดเจนหรือพวกเขาพูดคุยกันเป็นหลักฐานและขาดหลักฐานหรือไม่?

ในที่สุดฉันจะพูดถึงความเป็นไปได้ที่การตั้งสมมติฐาน> 15 ซึ่งเป็นผลมาจากการทดสอบไคสแควร์ที่แยกต่างหาก> 15 อันที่จริงแล้วการแสดงออกของสมมติฐานเพียงไม่กี่ข้อ

โดยทั่วไปไม่ว่าสมมติฐานจะถูกกำหนดไว้ล่วงหน้าหรือไม่ก็ตามการแก้ไขเพื่อการเปรียบเทียบหลายรายการหรือไม่นั้นเป็นเรื่องของสิ่งที่คุณระบุไว้ในข้อผิดพลาดประเภท I การไม่แก้ไข MC ให้คุณควบคุมอัตราความผิดพลาดประเภทที่ฉันเปรียบเทียบต่อไปเท่านั้น ดังนั้นในกรณีของการเปรียบเทียบจำนวนมากคุณมีอัตราความผิดพลาดประเภทครอบครัวที่ฉลาดและมีการค้นพบที่ผิดพลาดมากกว่า


8
(+1) การสะกดคำว่าการทดสอบข้อผิดพลาดที่ชาญฉลาดอาจไม่คุ้มค่าหากเปรียบเทียบกับการวางแผนของบุคคลสิบห้าคนที่วางแผนไว้ ในทางกลับกันการเปรียบเทียบที่เป็นไปได้ที่เกินกว่าสิบห้าที่ไม่ได้ระบุไว้ในโครงการวิจัยไม่จำเป็นต้องนำมาพิจารณาในการแก้ไขแบบเปรียบเทียบหลายรายการ
Scortchi - Reinstate Monica

@Scortchi ขอบคุณสำหรับการป้อนข้อมูลของคุณ แต่ฉันไม่เข้าใจสิ่งที่คุณหมายถึงโดย "อัตราข้อผิดพลาดการทดสอบที่ชาญฉลาดไม่ได้ถูกควบคุมโดยการเปรียบเทียบแต่ละสิบห้า 'กำลังวางแผน"?
peuhp

1
เพียงแค่จุดพื้นฐานที่ถ้าคุณต้องการควบคุมความน่าจะเป็นภายใต้การทำข้อผิดพลาด Type I หนึ่งข้อหรือมากกว่าในการทดสอบทั้งหมดคุณจำเป็นต้องใช้ขั้นตอนการเปรียบเทียบหลายแบบ ฉันพูดถึงเพียงเพราะฉันเจอความสับสนในเรื่องนี้มาก่อน
Scortchi - Reinstate Monica

2
โปรดทราบว่าปัญหาเดียวกันนี้เกิดขึ้นในเธรดล่าสุด: แอปพลิเคชันโพสต์ Hoc ของการเปรียบเทียบหลายรายการ
Michael R. Chernick

1
@Scortchi โอเคขอบคุณสำหรับการชี้แจงและการป้อนข้อมูลนี้ควรระบุไว้อย่างชัดเจนในคำตอบของฉัน จะเพิ่มสิ่งนี้
peuhp

5

รับการปรับปรุงของคุณเกี่ยวกับการออกแบบฉันขอแนะนำให้พวกเขาทำรูปแบบของ log-linear model เพื่อใช้ข้อมูลทั้งหมดในครั้งเดียว การวิเคราะห์อาหารแบบชิ้นเดียวที่พวกเขาทำดูเหมือนว่า (a) ไม่มีประสิทธิภาพ (b) ตามหลักวิทยาศาสตร์ในขณะที่มันทำการทดสอบ 15 สมมติฐานซึ่งแน่นอนว่ามีสมมติฐานจริงน้อยกว่า

ฉันไม่ใช่แฟนของการแก้ไขหลายหลากเป็นภาพสะท้อนปรับอากาศ แต่ในกรณีนี้หากพวกเขาปฏิเสธวิธีการวิเคราะห์ที่ลึกกว่านั้นฉันจะแนะนำให้พวกเขาแก้ไข


1
k15

1
χ2

4

หากคุณแทนที่คำว่า 'ไตร่ตรองไว้ล่วงหน้า' สำหรับ 'วางแผน' สิ่งนี้อาจช่วยขจัดข้อโต้แย้งที่ผู้เขียนเสนอ พิจารณาการวิเคราะห์ทางสถิติที่แตกต่างกันสองแบบของข้อมูลเดียวกัน:

  1. 'อาชญากรรมไตร่ตรองล่วงหน้า' ซึ่งมีการทดสอบสมมติฐานทุกครั้งที่เป็นไปได้วางไว้ล่วงหน้าโดย 'ผู้กระทำผิดทางสถิติเชิงสถิติ' ซึ่งเป็นแผนการที่จะลองใช้แต่ละคนอย่างเป็นระบบและเลือกการทดสอบที่มีค่า p น้อยที่สุดในฐานะ เพื่อส่งเสริมในส่วนผลการสนทนาและข้อสรุปของบทความและแน่นอนชื่อเช่นกัน
  2. 'อาชญากรรมแห่งตัณหา' ซึ่งความตั้งใจเริ่มต้นเป็นเพียงการเผชิญหน้ากับข้อมูลด้วยสมมติฐานหนึ่ง แต่ "ดี ... สิ่งหนึ่งนำไปสู่อีก" และการทดสอบสมมติฐานเฉพาะกิจหลายรายการ"เพิ่งเกิดขึ้น" ในความร้อนแรงของวิทยาศาสตร์ที่ต้องการ เรียนรู้"บางสิ่ง ... อะไรก็ได้! "จากข้อมูล

ทั้งสองวิธีมันคือ 'การฆาตกรรม' - คำถามคือว่ามันอยู่ในระดับแรกหรือระดับที่สอง เห็นได้ชัดว่าคนแรกเป็นปัญหาทางศีลธรรมมากขึ้น ฟังดูราวกับว่าผู้เขียนที่นี่พยายามเรียกร้องอะไรบางอย่างกับผลกระทบที่ไม่ใช่การฆาตกรรมเพราะมันถูกไตร่ตรองไว้ล่วงหน้า


4
แต่การเปรียบเทียบหลาย ๆ แบบไม่ใช่อาชญากรรมที่ไตร่ตรองไว้ล่วงหน้าหรือไม่ P-hunting คือ
หน้าผา AB

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.