ฟิชเชอร์ของ LSD เลวร้ายอย่างที่บอกหรือเปล่า?


22

เมื่อเราทำการทดลอง (ขนาดตัวอย่างเล็ก ๆ (โดยปกติขนาดตัวอย่างต่อกลุ่มการรักษาประมาณ 7 ~ 8)) ในสองกลุ่มเราใช้การทดสอบ t-test เพื่อทดสอบความแตกต่าง อย่างไรก็ตามเมื่อเราทำการ ANOVA (เห็นได้ชัดว่ามีมากกว่าสองกลุ่ม) เราใช้บางสิ่งบางอย่างตามแนวของ Bonferroni (LSD / # ของการเปรียบเทียบแบบเป็นคู่) หรือ Tukey เป็นโพสต์เฉพาะกิจและในฐานะนักเรียนฉันถูกเตือนให้ออกจาก ใช้ความแตกต่างที่สำคัญน้อยที่สุดของฟิชเชอร์(LSD)

ทีนี้ก็คือตอนนี้ LSD คล้ายกับ pairwise t-test (ใช่ไหม?) และสิ่งเดียวที่มันไม่ได้อธิบายก็คือเรากำลังทำการเปรียบเทียบหลายครั้ง มีความสำคัญเพียงใดเมื่อพูดถึง 6 กลุ่มถ้า ANOVA นั้นมีความสำคัญ?

หรืออีกนัยหนึ่งมีเหตุผลทางวิทยาศาสตร์ / สถิติสำหรับการใช้ LSD ของฟิชเชอร์หรือไม่?


1
คุณช่วยอธิบายได้ว่า ' พวกเขา ' คือใครและรวมตัวอย่างของสิ่งที่พวกเขาพูด (พวกเขาบอกว่ามันแย่ขนาดไหนกันเถอะขอให้ชัดเจนว่าเรากำลังพูดถึงอะไรอยู่ที่นี่) ฉันเคยเห็นคำวิจารณ์ของ LSD บ้างมันก็เป็นธรรม แต่ฉันไม่รู้ว่าฉันได้เห็นสิ่งที่คุณได้เห็น เห็นหรือสิ่งที่ฉันเห็นจะต้องมีลักษณะคุณมี
Glen_b -Reinstate Monica

+1 ถ้าคุณมาที่นี่พยายามคิดว่าไซต์แลกเปลี่ยนสแต็คพูดถึง Timothy Learys LSD อย่างไร
PW Kad

@Glen_b พวกเขาหมายถึงนักวิทยาศาสตร์ในสาขาวิทยาศาสตร์ชีวการแพทย์ คำพูดของอาจารย์ของฉันคือการพูดว่า "ใช้ Bonferroni หรือ Tukey ใช้ LSD เฉพาะในความสิ้นหวังหากไม่ช่วยให้ใช้ LSD อื่น ๆ :)"
Rover Eye

คำตอบ:


10

LSD ของฟิชเชอร์เป็นชุดของการทดสอบตามลำดับคู่โดยการทดสอบแต่ละครั้งใช้ข้อผิดพลาดกำลังสองเฉลี่ยจาก ANOVA ที่มีนัยสำคัญในการประเมินความแปรปรวนพู (และการรับปริญญาอิสระ) ANOVA นั้นมีนัยสำคัญเป็นข้อ จำกัด เพิ่มเติมของการทดสอบนี้

มัน จำกัด อัตราความผิดพลาดที่เหมาะสำหรับครอบครัวไว้ที่อัลฟาในกรณีพิเศษ 3 กลุ่มเท่านั้น ธรรมด๊าธรรมดามีคำอธิบายที่ดีมากและค่อนข้างเรียบง่ายของวิธีการที่จะไม่ให้ในบทที่ 16 ของหนังสือของเขาที่สถิติพื้นฐานสำหรับพฤติกรรมศาสตร์ฉบับที่ 8 เดวิดซีธรรมด๊าธรรมดา

มากกว่า 3 กลุ่มอัลฟาจะพองตัวอย่างรวดเร็ว (ตามที่ @Alexis ได้ระบุไว้ด้านบน) ไม่เหมาะสำหรับ 6 กลุ่มอย่างแน่นอน ฉันเชื่อว่าการบังคับใช้ที่ จำกัด นี้ทำให้คนส่วนใหญ่แนะนำให้เพิกเฉยต่อมันเป็นตัวเลือก


18

การเปรียบเทียบหลายวิธีมีความสำคัญเมื่อจัดการกับ 6 กลุ่มอย่างไร ดี ... กับหกกลุ่มที่คุณติดต่อด้วยสูงสุดการเปรียบเทียบค่าที่เป็นไปได้หลังการจับคู่แบบสุ่ม ฉันจะปล่อยให้แรนดัลมันโรคาดเดาไม่ได้ที่อยู่ความสำคัญของการเปรียบเทียบหลาย:6(6-1)2=15

ป้อนคำอธิบายรูปภาพที่นี่

และฉันจะเพิ่มว่าถ้าในประโยคเปิดของคุณคุณแนะนำว่าบางครั้งคุณมีเจ็ดกลุ่มแล้วจำนวนการทดสอบหลังการจับคู่สูงสุดคือ7(7-1)2=21ซึ่งไกลเกินไปกับสถานการณ์ของ jellybean ที่เพิ่งนำเสนอ (ซึ่งนำเสนอการทดสอบ 21 ครั้ง) ดังนั้นถ้าคุณไม่อยากให้โลกจำลองคุณโดยการส่งสำเนาxkcd 882ให้คุณซ้ำ ๆฉันจะทำต่อไปและทำการปรับการเปรียบเทียบหลาย ๆ อย่าง (เช่นFWER อย่าง Bonferroni หรือ Holm-SidakหรือFDR เช่น Benjamini และ Hochberg ) .


1
ทำแต้มได้ดี อย่างไรก็ตามสิ่งนี้ไม่ได้นำมาตั้งคำถามว่าถ้าเรามีกลุ่มน้อยมาก (พูด 3 (3 คู่) หรือ 4 (6 คู่ตามลำดับ) ความน่าจะเป็นในการหาค่าที่สำคัญโดยบังเอิญมีน้อย (อีกครั้ง LSD ได้รับการคุ้มครองตามความสำคัญของ ANOVA)
Rover Eye

2
α

2
@Rover การทดสอบ 6 คู่ที่ทุกคนผ่านด้วย p> 0.05 หมายความว่าคุณมี p> 0.26 นั่นเป็นการเปลี่ยนแปลงที่สำคัญ
Voo

ฉันไม่ได้ถามอะไรในทางปฏิบัติมันแค่ดังออกมา แต่จุดของคุณทำดี @Voo จริงข้อผิดพลาดมีแนวโน้มที่จะทวีคูณ ขอบคุณทั้งคู่
Rover Eye

10

การทดสอบของฟิชเชอร์นั้นเลวร้ายอย่างที่ทุกคนบอกว่ามันมาจากมุมมองของเนย์แมน - เพียร์สันและถ้าคุณทำตามที่คำถามของคุณบ่งบอก - หลังจากการทดสอบ ANOVA ที่สำคัญแต่ละข้อแตกต่างกัน คุณสามารถดูนี้ในหลายตีพิมพ์ เอกสาร แต่การทดสอบความแตกต่างทั้งหมดหลังจากการวิเคราะห์ความแปรปรวนหรือข้อใดข้อหนึ่งนั้นไม่จำเป็นหรือไม่แนะนำ และการทดสอบของฟิชเชอร์ไม่ได้ถูกสร้างขึ้นภายใต้ทฤษฎีการอนุมานเชิงสถิติของ Neyman-Pearson

โปรดจำไว้ว่าเมื่อฟิชเชอร์เสนอ LSD เขาไม่ได้พิจารณาการทดสอบปัญหาสำคัญหลายอย่างเพราะเขาไม่ได้พิจารณาการตัดทอนความสำคัญกฎที่ยากและรวดเร็วในการตัดสินใจว่าผลลัพธ์นั้นสำคัญหรือไม่ หนึ่งสามารถสร้าง LSD เป็นวิธีที่ง่ายในการตรวจสอบข้อมูลที่อาจมีผลลัพธ์ที่สำคัญ แต่ไม่ใช่ผู้ตัดสินของสิ่งที่มีความหมาย โปรดจำไว้ว่ามันคือฟิชเชอร์ที่บอกว่าคุณควรวิ่งเรื่องมากขึ้นถ้าp > 0.05

และทำไมคุณถึงคิดว่าการทดสอบทุกอย่างเป็นความคิดที่ดี? พิจารณาว่าทำไมคุณถึงเรียกใช้ ANOVA ตั้งแต่แรก คุณอาจถูกสอนว่าเป็นเพราะการทดสอบแบบหลายครั้งนั้นเป็นปัญหาอย่างที่คุณคุ้นเคยในคำถามของคุณ แล้วทำไมคุณถึงเรียกพวกเขาหรือเทียบเท่าในภายหลัง ฉันรู้ว่ามันเกิดขึ้น แต่ฉันยังไม่จำเป็นต้องทำการทดสอบหลังจาก ANOVA ANOVA จะบอกคุณว่ารูปแบบข้อมูลของคุณไม่ใช่ชุดของค่าที่เท่ากันซึ่งอาจมีความหมายบางอย่างอยู่ในนั้น มีหลายคนที่ติดใจกับคำเตือนที่การทดสอบไม่ได้บอกคุณว่าบิตที่มีความหมายนั้นอยู่ที่ไหน แต่พวกเขาลืมไปว่าข้อมูลและทฤษฎีบอกคุณว่า


ขอบคุณสำหรับเอกสาร คุณตั้งคำถามว่าทำไมคนถึงใช้โพสต์เฉพาะกิจหลังจาก ANOVA เพื่อบอกความจริงกับคุณฉันไม่รู้จริงๆ ฉันได้รับการบอกว่า ANOVA เป็นแบบทดสอบหยดและอย่างที่คุณพูดถึงเราจำเป็นต้องค้นหาว่ามีความสำคัญอยู่ตรงไหน และตามจริงแล้วฉันสนใจที่จะรู้ว่าคุณรายงาน ANOVA เพียงใด
Rover Eye

1
ให้รูปแบบข้อมูลกับฉันและฉันจะบอกคุณว่าฉันรายงาน ANOVA อย่างไร รุ่นสั้นคือคุณอธิบายข้อมูล รายการที่อยู่ใกล้กันมากจะถูกจัดกลุ่มในคำอธิบายและสิ่งที่อยู่ห่างไกลกันถือว่ามีความแตกต่างที่มีความหมาย สมมุติว่าฉันมี A = 20, B = 58, C = 61, p = 0.03 ฉันจะรายงานสถิติและบอกว่า A ต่ำกว่า B และ C ซึ่งคล้ายกัน ดังนั้นทุกอย่างขึ้นอยู่กับข้อมูล ฉันสามารถจินตนาการลำดับของรายการที่เป็นบิตลำบาก (A = 10, B = 20, C = 30) ในบางวิธีอนุมาน แต่แล้วบางทีฉันควรได้ทำการถดถอย
จอห์น

นั่นเป็นวิธีที่น่าสนใจในการรายงาน ANOVA และฉันสามารถเห็นสิ่งที่คุณได้รับ ในขณะที่ฉันสามารถพูดคุยเรื่องนี้กับหัวหน้างานของฉันได้ฉันไม่แน่ใจว่าพวกเขาต้องการทำลาย "บรรทัดฐาน" ของการรายงาน ANOVA โดยไม่ต้องแจ้งให้ทราบล่วงหน้าหรือไม่ พยายามค้นหาสิ่งพิมพ์ทางวิทยาศาสตร์ที่รายงานโดยใช้วิธีนี้
Rover Eye

2
บางสิ่งมีความหมายในข้อมูล บ่อยครั้งที่เห็นได้ชัดว่ามันต้องเป็นอะไร ทำโพสต์เฉพาะกิจเพื่อแสดงให้เห็นชัดเจนเพียงแค่แสดงให้เห็นว่าคุณไม่รู้ว่า ANOVA ทำอะไรในตอนแรก
John

6

เหตุผลเบื้องหลังของ LSD ของฟิชเชอร์สามารถขยายไปยังกรณีที่เกินN = 3

ฉันจะหารือเกี่ยวกับกรณีของสี่กลุ่มในรายละเอียด เพื่อให้อัตราความผิดพลาดแบบครอบครัวตามลำดับที่ 0.05 หรือต่ำกว่านั้นปัจจัยการแก้ไขการเปรียบเทียบหลายค่าที่ 3 (เช่นอัลฟาต่อการเปรียบเทียบที่ 0.05 / 3) พอเพียงถึงแม้ว่าจะมีการเปรียบเทียบโพสต์เฉพาะกิจหกครั้งในทั้งสี่กลุ่ม นี้เป็นเพราะ:

  • ในกรณีที่วิธีการที่แท้จริงทั้งสี่มีค่าเท่ากันรถโดยสาร Anova ทั่วทั้งสี่กลุ่มจะ จำกัด อัตราความผิดพลาดแบบแฟมิลี่แฟมิลี่ที่ 0.05
  • ในกรณีที่สามของวิธีการที่แท้จริงมีค่าเท่ากันและที่สี่แตกต่างจากพวกเขามีเพียงสามการเปรียบเทียบที่อาจให้ข้อผิดพลาด Type-I;
  • ในกรณีที่สองของวิธีการที่แท้จริงมีค่าเท่ากันและแตกต่างจากอีกสองซึ่งมีค่าเท่ากันมีเพียงสองการเปรียบเทียบที่อาจทำให้เกิดข้อผิดพลาด Type-I

สิ่งนี้หมดความเป็นไปได้ ในทุกกรณีความน่าจะเป็นในการค้นหาอย่างน้อยหนึ่ง p valueนั้นต่ำกว่า 0.05 สำหรับกลุ่มที่มีค่าเฉลี่ยจริงเท่ากันอยู่ที่หรือต่ำกว่า 0.05 ถ้าปัจจัยการแก้ไขสำหรับการเปรียบเทียบหลายค่าคือ 3 และนี่คือคำจำกัดความของ

เหตุผลสำหรับสี่กลุ่มนี้เป็นลักษณะทั่วไปจากคำอธิบายของฟิชเชอร์สำหรับวิธีความแตกต่างอย่างมีนัยสำคัญสามกลุ่มของเขา สำหรับกลุ่มNปัจจัยการแก้ไขหากการทดสอบรถโดยสาร Anova มีความสำคัญคือ ( N -1) ( N -2) / 2 ดังนั้นการแก้ไข Bonferroni โดยปัจจัยของN ( N -1) / 2 นั้นแรงเกินไป มันพอเพียงที่จะใช้ปัจจัยการแก้ไขอัลฟ่า 1 สำหรับN = 3 (นี่คือสาเหตุที่ฟิชเชอร์ของ LSD ทำงานสำหรับN = 3), ปัจจัย 3 สำหรับN = 4, ปัจจัย 6 สำหรับN = 5, ปัจจัย 10 สำหรับN = 6 และอื่น ๆ


+1 นี่เป็นส่วนเสริมที่ดีมากสำหรับเธรด ยินดีต้อนรับสู่เว็บไซต์!
อะมีบาพูดว่า Reinstate Monica

ทุกสถานการณ์ที่คุณอธิบายไม่จำเป็นต้องมีการทดสอบโพสต์เฉพาะกิจ
จอห์น

1
(ยังไม่มีข้อความ-1)(ยังไม่มีข้อความ-2)/2
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.