"ไม่มีทฤษฎีอาหารกลางวันฟรี" ใช้กับการทดสอบทางสถิติทั่วไปหรือไม่


12

ผู้หญิงที่ฉันทำงานขอให้ฉันทำ ANOVA แบบทางเดียวกับข้อมูลบางอย่าง ฉันตอบว่าข้อมูลนั้นเป็นข้อมูลการวัดซ้ำ (อนุกรมเวลา) และฉันคิดว่าการสันนิษฐานว่ามีการละเมิดความเป็นอิสระ เธอตอบว่าฉันไม่ควรกังวลเกี่ยวกับสมมติฐานเพียงทำแบบทดสอบและเธอจะคำนึงถึงว่าอาจไม่ตรงตามสมมติฐาน

ดูเหมือนจะไม่ถูกต้องสำหรับฉัน ฉันค้นคว้ามาแล้วและพบว่าการโพสต์บล็อกที่ยอดเยี่ยมนี้โดย David Robinson การจัดกลุ่ม K- หมายถึงไม่ใช่อาหารกลางวันฟรี ฉันได้ดูเอกสารต้นฉบับและติดตามสิ่งต่างๆและคณิตศาสตร์ตรงไปตรงมาเล็กน้อย

ส่วนสำคัญของมัน - ตามที่ David Robinson - ดูเหมือนว่าพลังของการทดสอบทางสถิติมาจากสมมติฐานของมัน และเขาให้สองตัวอย่างที่ยอดเยี่ยม เมื่อฉันอ่านบทความอื่น ๆ และโพสต์บล็อกเกี่ยวกับบทความนี้ดูเหมือนว่าจะมีการอ้างอิงเสมอในแง่ของการเรียนรู้แบบควบคุมหรือค้นหา

ดังนั้นคำถามของฉันคือทฤษฎีบทนี้ใช้กับการทดสอบทางสถิติโดยทั่วไปหรือไม่? กล่าวอีกนัยหนึ่งเราสามารถพูดได้ว่าพลังของ t-test หรือ ANOVA นั้นมาจากการยึดมั่นในสมมติฐานและอ้างอิงทฤษฎีบทอาหารกลางวันฟรี

ฉันเป็นหนี้เอกสารฉบับสุดท้ายของเจ้านายเกี่ยวกับงานที่ฉันทำและฉันอยากรู้ว่าฉันสามารถอ้างอิงทฤษฎีบท No Free Lunch ได้หรือไม่โดยระบุว่าคุณไม่สามารถเพิกเฉยต่อสมมติฐานของการทดสอบทางสถิติและบอกว่าคุณจะนำสิ่งนั้นไปใช้ บัญชีเมื่อประเมินผล


4
ทำไมคุณไม่ทำแบบ "แอบแฝง" แบบวัดซ้ำ ANOVA?
Horst Grünbusch

1
@ HorstGrünbuschที่จริงแล้วข้อมูลและการทดสอบได้มีการพูดคุยกันในฟอรัมมาก่อนโดยมีคำถามเฉพาะเกี่ยวกับมาตรการซ้ำ ๆ ANOVA และปรากฎว่ารูปแบบเอฟเฟกต์แบบผสมเชิงเส้นน่าจะเป็นตัวเลือกที่ดีที่สุด
rwjones

2
นี่เป็นคำตอบที่ดีอยู่แล้วดังนั้นจึงสามารถเพิ่มการตอบกลับที่ลื่นไหลได้ คุณสามารถถามเจ้านายของคุณได้อย่างตรงไปตรงมาว่าเธอจะคำนึงถึงผลที่ตามมาจากการละเมิดสมมติฐาน ("ระวังตัว" จะดีกว่าไม่มีอะไร!) ในระยะสั้นมันเป็นเส้นทางที่ยาวและยากลำบากที่จะได้รับความเข้าใจและประสบการณ์เพียงพอที่จะรู้ว่าเมื่อใดที่คุณไม่ใส่ใจกับสมมติฐาน Rupert G. Miller's Beyond ANOVA (นิวยอร์ก: ไวลีย์, 1986 และพิมพ์ในภายหลัง) เป็นแหล่งข้อมูลที่ดีสำหรับผลลัพธ์และเนื้อหาสำคัญในนั้นคือการเพิกเฉยต่อสมมติฐานอิสระเป็นหนึ่งในสิ่งที่อันตรายที่สุดที่คุณสามารถทำได้
Nick Cox

1
@NickCox ดีเธอไม่ได้เป็นเจ้านายของฉันอีกต่อไปและสถานการณ์นี้เป็นเหตุผลหลักว่าทำไม โดยพื้นฐานแล้วมันเป็นสุดยอดของการคิดอย่างเลอะเทอะและการจัดการโครงการเลอะเทอะในส่วนของเธอในสภาพแวดล้อมการวิจัยที่เหมาะสม ที่กันขอบคุณสำหรับคำแนะนำหนังสือ จากเสียงมันเป็นหนึ่งในสิ่งที่ฉันกำลังมองหาที่จะกล่าวถึงในรายงานขั้นสุดท้ายของฉัน
rwjones

คำตอบ:


11

ฉันไม่ทราบหลักฐาน แต่ฉันจะเดิมพันนี้ใช้โดยทั่วไป ตัวอย่างคือการทดสอบกับ 2 วิชาในแต่ละกลุ่มการรักษา 2 การทดสอบ Wilcoxon นั้นไม่สามารถมีนัยสำคัญที่ระดับ 0.05 แต่การทดสอบ t สามารถ คุณสามารถพูดได้ว่าพลังของมันมามากกว่าครึ่งจากสมมติฐานไม่ใช่เพียงจากข้อมูล สำหรับปัญหาดั้งเดิมของคุณไม่เหมาะสมที่จะดำเนินการต่อราวกับว่าการสังเกตต่อวิชานั้น ๆ เป็นอิสระ การคำนึงถึงสิ่งต่าง ๆ หลังจากข้อเท็จจริงไม่ใช่การฝึกฝนเชิงสถิติที่ดียกเว้นในกรณีพิเศษ (เช่นตัวประมาณแซนวิชคลัสเตอร์)


2

คุณสามารถอ้างอิงอาหารกลางวันทฤษฎีบทไม่มีฟรีถ้าคุณต้องการ แต่คุณสามารถก็เป็นเพียงแค่ยกModus Ponens (ที่เรียกกันว่ากฎหมายของออกพื้นฐานของเหตุผลแบบนิรนัย) ซึ่งเป็นรากของอาหารกลางวันฟรีไม่มีทฤษฏี

The Noem กลางวันฟรีทฤษฎีบทครอบคลุมแนวคิดที่เฉพาะเจาะจงมากขึ้น: ความจริงที่ว่าไม่มีอัลกอริทึมที่เหมาะสมกับทุกวัตถุประสงค์ ในคำอื่น ๆ ที่ไม่มีอาหารกลางวันฟรีทฤษฎีบทเป็นพื้นบอกว่าไม่มีอัลกอริทึมbullet มายากล รากนี้ใน Modus Ponens เพราะสำหรับอัลกอริทึมหรือการทดสอบทางสถิติเพื่อให้ผลลัพธ์ที่ถูกต้องคุณจะต้องตอบสนอง premisses

เช่นเดียวกับในทุกทฤษฎีทางคณิตศาสตร์หากคุณละเมิด premisses แล้วการทดสอบทางสถิติก็หมดความรู้สึกและคุณไม่สามารถได้รับความจริงใด ๆ จากมัน ดังนั้นหากคุณต้องการอธิบายข้อมูลของคุณโดยใช้การทดสอบคุณต้องสมมติว่ามีคุณสมบัติตามที่กำหนดหากไม่ได้ (และคุณรู้ว่า) การทดสอบของคุณนั้นผิดปกติ

นั่นเป็นเพราะการใช้เหตุผลทางวิทยาศาสตร์นั้นมาจากการหัก: โดยทั่วไปการทดสอบ / กฎหมาย / ทฤษฎีบทของคุณนั้นเป็นกฎเกณฑ์ซึ่งบอกว่าถ้าคุณมี premisse Aคุณก็สามารถสรุปได้B: A=>Bแต่ถ้าคุณไม่มีAคุณก็สามารถมีBหรือ ไม่Bและทั้งสองกรณีเป็นจริงนั่นเป็นหนึ่งในหลักการพื้นฐานของการอนุมานเชิงตรรกะ / การอนุมาน (กฎ Modus Ponens) กล่าวอีกนัยหนึ่งถ้าคุณละเมิด premisses ผลลัพธ์ไม่สำคัญและคุณไม่สามารถอนุมานอะไรเลย

จำตารางไบนารีของความหมาย:

A   B   A=>B
F   F    T
F   T    T
T   F    F
T   T    T

Dependent_Variables => ANOVA_correctดังนั้นในกรณีของคุณจะลดความซับซ้อนของคุณมี ตอนนี้ถ้าคุณใช้ตัวแปรอิสระจึงDependent_Variablesเป็นFalseแล้วอาการจะเป็นจริงเนื่องจากDependent_Variablesสมมติฐานการละเมิด

แน่นอนว่านี่เป็นเรื่องง่ายและในทางปฏิบัติการทดสอบ ANOVA ของคุณอาจยังให้ผลลัพธ์ที่มีประโยชน์เพราะเกือบจะมีระดับความเป็นอิสระระหว่างตัวแปรตาม แต่ก็ให้ความคิดว่าทำไมคุณไม่สามารถพึ่งพาการทดสอบได้โดยไม่ต้องทำตามสมมติฐาน .

อย่างไรก็ตามคุณยังสามารถใช้การทดสอบที่ไม่ได้รับความพึงพอใจจากต้นฉบับโดยการลดปัญหาของคุณ: โดยการผ่อนคลายข้อ จำกัด ความเป็นอิสระอย่างชัดเจนผลลัพธ์ของคุณอาจยังมีความหมายไม่รับประกัน althrough (เพราะผลลัพธ์ของคุณจะใช้กับปัญหาที่ลดลง ปัญหาทั้งหมดดังนั้นคุณจึงไม่สามารถแปลทุกผลลัพธ์ยกเว้นว่าคุณสามารถพิสูจน์ได้ว่าข้อ จำกัด เพิ่มเติมของปัญหาใหม่ไม่ส่งผลกระทบต่อการทดสอบและผลลัพธ์ของคุณ)

ในทางปฏิบัติสิ่งนี้มักถูกใช้เพื่อทำแบบจำลองข้อมูลเชิงปฏิบัติโดยใช้ Naive Bayes ตัวอย่างเช่นโดยการสร้างแบบจำลองตัวแปรที่พึ่งพา (แทนที่จะเป็นอิสระ) โดยใช้แบบจำลองที่ใช้ตัวแปรอิสระและน่าแปลกใจที่มันทำงานได้ดีมาก สำหรับการอ้างอิง นอกจากนี้คุณยังสามารถได้รับความสนใจจากคำถามเกี่ยวกับวิธีการใช้การวิเคราะห์ความแปรปรวนเมื่อข้อมูลที่ไม่ตรงตามความคาดหวังทั้งหมด

เพื่อสรุป: หากคุณตั้งใจจะทำงานกับข้อมูลที่เป็นประโยชน์และเป้าหมายของคุณคือไม่ต้องพิสูจน์ผลลัพธ์ทางวิทยาศาสตร์ใด ๆ แต่เพื่อสร้างระบบที่ใช้งานได้ (เช่นบริการเว็บหรือแอปพลิเคชันที่ใช้งานได้จริง) สมมติฐานความเป็นอิสระ สามารถผ่อนคลาย แต่ถ้าคุณกำลังพยายามที่จะอนุมาน / พิสูจน์ความจริงบางอย่างโดยทั่วไปแล้วคุณควรมักจะใช้การทดสอบซึ่งคุณสามารถรับประกันทางคณิตศาสตร์ (หรืออย่างน้อยได้อย่างปลอดภัยและสรรพสิ่งสมมติ) ที่คุณตอบสนองความ premisses


2
ถ้าฉันเข้าใจข้อโต้แย้งของคุณอย่างถูกต้องคุณเริ่มต้นด้วยการบอกว่าไม่มีการประยุกต์ใช้สถิติที่สมมติฐานไม่ตรงตามจริง ถ้าเป็นจริงนี่เป็นข่าวร้ายมาก ๆ หนังสือเศรษฐมิติส่วนใหญ่ (ให้เพียงตัวอย่างเดียว) ใช้เวลาอธิบายว่ามันผิด (สรุปด้วยคำเดียว) และอธิบายรายละเอียดได้อย่างแม่นยำว่าทำไม อย่างไรก็ตามคุณดูเหมือนจะเปลี่ยนแทคที่อยู่ตรงกลางและสิ่งที่คุณสนับสนุนแทนที่จะเป็นฟัซซี่ การทำงานกับข้อมูลอาจส่งเสียงแม้ในขณะที่ข้อมูลไม่ถูกต้อง ดังนั้นฉันจึงไม่เห็นคำแนะนำที่ชัดเจนในที่นี้
นิคค็อกซ์

ประเด็นคือ: หาก premisses ถูกละเมิดคุณจะไม่สามารถรับผลการทดสอบได้ตามมูลค่าใบหน้าเนื่องจากการอนุมานนั้นมีความลำเอียง อย่างไรก็ตามคุณยังคงสามารถลองได้และถ้าคุณมั่นใจและมีประสบการณ์มากพอคุณก็ยังสามารถนำอะไรบางอย่างออกมาได้ แต่ส่วนใหญ่เกี่ยวกับการใช้งานจริงซึ่งในความเป็นจริงคุณไม่สนใจเกี่ยวกับการใช้เหตุผลทางวิทยาศาสตร์ ข้อมูลสำหรับเป้าหมายเชิงปฏิบัติไม่พยายามสรุปความจริงทั่วไปเกี่ยวกับโลก) ดังนั้นคำตอบของฉันไม่ได้เป็น "สรุปคำเดียว" มันเป็นเพียงกรณีทั่วไป (ผิด) เทียบกับกรณีเฉพาะ (อาจจะโอเค)
gaborous

ป.ล. : คำแถลงของฉันไม่เพียง แต่เกี่ยวข้องกับแอปพลิเคชันสถิติเท่านั้น แต่การประยุกต์ใช้ทฤษฎี / กฎ / ทดสอบเชิงตรรกะหรือทางคณิตศาสตร์ใด ๆ นี่เป็นความจริงของการใช้เหตุผลเชิงอนุมานและอุปนัยใด ๆ แต่ฉันสนใจอ้างอิงหนังสือเศรษฐศาสตร์ของคุณอ้างอิงอื่น ๆ ที่คุณให้ไว้ในความคิดเห็นของคำถามของ OP นั้นเกี่ยวข้องกันมาก
gaborous

ขอบคุณที่เพิ่มความคิดเห็น แต่ฉันต้องบอกว่าฉันไม่พบคำสั่งของคุณโดยเฉพาะอย่างยิ่งชัดเจนหรือเป็นที่ยอมรับ ฉันไม่สามารถเห็นได้ว่านักวิทยาศาสตร์ที่ทำงาน (ฉันเป็นคนเดียว) จะเข้าใจความแตกต่างระหว่างการวิเคราะห์ข้อมูลเพื่อเหตุผลเชิงวิทยาศาสตร์และเป้าหมายเชิงปฏิบัติ ฉันจะทิ้งมันไว้ที่นั่นเว้นแต่จะยกย่องหนังสือเรียนเช่นเจฟฟ์โวลด์ริดจ์ซึ่งเป็นบทความที่ขยายออกไปซึ่งข้อสมมติฐานมีความสำคัญซึ่งไม่ใช่และพื้นที่สีเทาขนาดใหญ่อยู่ระหว่างนั้น amazon.com/Jeffrey-M.-Wooldridge/e/B001IGLWNY
Nick Cox

ขอบคุณสำหรับการอ้างอิง. ฉันเพิ่งพบคำถามอีกข้อที่พวกเขาพูดถึงกระดาษที่อธิบายว่าทำไมสมมติฐานอิสระไร้เดียงสายังสามารถทำงานกับข้อมูลที่มีตัวแปรตาม: "กระดาษดูเหมือนว่าจะพิสูจน์ได้ว่าช่องว่าง (ไร้เดียงสา) นั้นดีไม่เพียงเมื่อคุณสมบัติเป็นอิสระเท่านั้น ของคุณสมบัติจากกันและกันมีความคล้ายคลึงกัน / ตรงข้ามระหว่างคุณสมบัติ " stats.stackexchange.com/a/23491/25538
gaborous
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.