การลบปัจจัยออกจากตาราง ANOVA 3 ทาง


14

ในบทความล่าสุดฉันติดตั้งโมเดลเอฟเฟกต์คงที่สามทาง เนื่องจากหนึ่งในปัจจัยไม่สำคัญ (p> 0.1) ฉันจึงลบออกและประกอบโมเดลที่มีเอฟเฟกต์คงที่สองรายการและการโต้ตอบ

ฉันเพิ่งมีความคิดเห็นกลับไปอ้าง:

เวลานั้นไม่ได้เป็นปัจจัยสำคัญในการวิเคราะห์ความแปรปรวน 3 ทางของตัวเองไม่ได้เป็นเกณฑ์ที่เพียงพอสำหรับการรวมปัจจัยเวลา: ข้อความมาตรฐานในเรื่องนี้ Underwood 1997 ระบุว่าค่า p สำหรับค่าที่ไม่มีนัยสำคัญจะต้องเป็น มากกว่า 0.25 ก่อนระดับการรักษาของปัจจัยสามารถรวมกลุ่มกันได้ ผู้เขียนควรให้ค่า p ที่เกี่ยวข้องที่นี่และปรับการรวมกำไรของพวกเขาด้วยการอ้างอิงถึง Underwood 1997

คำถามของฉันคือ:

  1. ฉันไม่เคยได้ยินเกี่ยวกับกฎ 0.25 มีใครอีกบ้างไหม? ฉันสามารถเข้าใจได้ว่าไม่ได้ลบปัจจัยหากค่า p ใกล้เคียงกับการตัดออก แต่การมี "กฎ" ดูเหมือนจะสุดขั้ว
  2. ผู้ตัดสินรายนี้ระบุว่าUnderwood 1997เป็นข้อความมาตรฐาน มันจริงเหรอ? ฉันไม่เคยได้ยินเรื่องนี้เลย อะไรคือข้อความมาตรฐาน (สิ่งนั้นมีอยู่จริง)? น่าเสียดายที่ฉันไม่สามารถเข้าถึง Underwood นี้ได้ในปี 1997
  3. คำแนะนำใด ๆ เมื่อตอบสนองต่อผู้ตัดสิน

ความเป็นมา: บทความนี้ถูกส่งไปยังวารสารที่ไม่ใช่สถิติ เมื่อติดตั้งโมเดลสามทางฉันจะตรวจสอบเอฟเฟกต์การโต้ตอบ


ไม่เคยได้ยินตำราของอันเดอร์วู้ด แต่บทความนี้ดูเหมือนจะพูดถึงข้อดีข้อเสียของการรวมกำไร: การปฏิบัติของการรวมกำไรในตาราง ANOVA (Hines, Am. Stat 1996) ตอนนี้ฉันดูเหมือนจะจำได้ว่า Sokal & Rohlf (1995) ยังแนะนำให้พิจารณาค่านิยมที่อนุรักษ์นิยมมาก ( ); ฉันต้องตรวจสอบก่อนโพสต์คำตอบเว้นแต่จะมีการอ้างอิงที่ดีกว่า พี.25
chl

2
เพียงแสดงความคิดเห็น แนวทางที่อยู่บนพื้นฐานของมีกลิ่นเหมือนทางที่ผิดของที่P -value ในการที่ไม่ใช่อย่างมีนัยสำคัญต่อมูลค่าไม่ได้เป็นตัวชี้วัดของที่ไม่ใช่หลักฐาน เนื่องจากค่าp-มีการกระจายอย่างสม่ำเสมอภายใต้สมมติฐานว่างทำไมไม่เพียงแค่พลิก (ลำเอียง) เหรียญ? ผลลัพธ์ที่ได้ก็เหมือนกันและอย่างน้อยก็ซื่อสัตย์เกี่ยวกับการเป็นคนงี่เง่า (ตกลง dopey ค่อนข้างแข็งแกร่ง แต่คุณจะได้รับความคิด)พีsโอม.อีเสื้อชั่วโมงผมnก.พีพีพี

5
นั่นจะเป็นการตอบสนองที่น่าสนใจสำหรับผู้ตัดสิน: "เราขอขอบคุณผู้ตัดสินสำหรับความคิดเห็นของพวกเขา แต่คิดว่าพวกเขาน่าเบื่อเล็กน้อย";) แสดงความคิดเห็นได้ดี
csgillespie

คำตอบ:


15

ฉันคาดเดาคำถามอันเดอร์วู้ดคือการทดลองในระบบนิเวศ (Cambridge Press 1991) มันมีการอ้างอิงมาตรฐานมากขึ้นหรือน้อยลงในวิทยาศาสตร์นิเวศบางทีสามหลัง Zar และ Sohkol และ Rohlf (และในความคิดของฉัน 'อ่านได้' มากที่สุดในสาม)

หากคุณสามารถหาสำเนาได้ส่วนที่เกี่ยวข้องที่ผู้ตัดสินของคุณอ้างถึงอยู่ใน 9.7 ในหน้า 233 อันเดอร์วู้ดแนะนำกระบวนการรวมกำไรที่แนะนำ (ไม่ใช่ 'กฎ' ต่อ se ) สำหรับปัจจัยที่ไม่สำคัญ มันเป็นขั้นตอน 2 ขั้นตอนที่ตรงไปตรงมาฉันไม่ค่อยเข้าใจมากนัก แต่แนะนำว่าควรให้ผลลัพธ์ที่ดีที่สุดคือ p = 0.25 เพื่อลดความน่าจะเป็นของข้อผิดพลาด Type I เมื่อรวมปัจจัยที่ไม่สำคัญออกไป ตัวอย่างของคุณอาจเป็นปัจจัยที่ไม่ใช่ซิกก็ได้)

ขั้นตอนดังกล่าวไม่ปรากฏว่าเป็นอันเดอร์วู้ดเขาอ้างถึง Winer et al 1991 ( กระบวนการทางสถิติในการออกแบบการทดลอง McGraw-Hill) คุณอาจลองที่นั่นหากคุณไม่พบสำเนาของอันเดอร์วู้ด


4
+1 คำตอบที่ดี: ชัดเจนตรงประเด็นเฉียบแหลมและเชื่อถือได้
whuber

@Chris คุณหมายถึง "ลดความน่าจะเป็นของข้อผิดพลาด Type II" (ไม่ใช่ Type I) ด้านบนหรือไม่ แรงจูงใจในการไม่ลบปัจจัยออกจากแบบจำลองคือเพื่อป้องกันการศึกษาพลังงานต่ำที่อนุญาตให้กำจัดสาเหตุของแท้ (เช่น Type II ของการสรุปตัวแปรไม่มีผลกระทบ) ในขณะที่ยังขยายผลชัดเจนของพารามิเตอร์ที่เหลือในโมเดล มีความสัมพันธ์กับตัวแปรที่ถูกลบตอนนี้ เนื่องจากผลข้างเคียงจะทำให้เกิดข้อผิดพลาด Type-I บางทีอันเดอร์วู้ดกำลังแนะนำให้ปล่อยเอฟเฟ็กต์ในการควบคุมข้อผิดพลาด Type 1 และ Type II ทั้งสองอย่างเช่นการเพิ่มความถูกต้องของแบบจำลองหรือไม่
ทิม

10

ฉันเกลียดกฎแบบตัดออกเหล่านี้ ฉันคิดว่ามันขึ้นอยู่กับการออกแบบและสิ่งที่คุณเบื้องต้นสมมติฐานและความคาดหวัง หากคุณคาดหวังว่าผลลัพธ์จะแตกต่างกันไปตามเวลาฉันจะบอกว่าคุณควรใช้เวลาตามที่คุณต้องการสำหรับปัจจัยอื่น ๆ ในทางกลับกันถ้าคุณทำซ้ำการทดลองเดียวกันในเวลาที่ต่างกันและไม่มีเหตุผลที่จะคิดว่าผลลัพธ์จะแตกต่างกันไปตามเวลา แต่ต้องการตรวจสอบกรณีนี้จากนั้นก็ทำเช่นนั้นและพบหลักฐานเพียงเล็กน้อยหรือไม่มีเลย เวลาฉันจะบอกว่ามันค่อนข้างสมเหตุสมผลที่จะลดเวลาแล้ว

ฉันไม่เคยได้ยินชื่ออันเดอร์วู้ดมาก่อน มันอาจจะเป็นข้อความมาตรฐานสำหรับ 'ทดลองในนิเวศวิทยา' (ชื่อหนังสือ) แต่ไม่มีเหตุผลที่ชัดเจนว่าการทดลองในระบบนิเวศที่ควรจะได้รับการรักษาใด ๆ ที่แตกต่างจากการทดลองอื่น ๆ ในส่วนนี้เพื่อที่จะดูว่ามันเป็น " ข้อความมาตรฐานใน ปัญหานี้ "ดูเหมือนไม่ยุติธรรม


1
ก่อนการทดลองเชื่อว่าปัจจัยจะมีนัยสำคัญ อย่างไรก็ตามมันก็ท่วมท้นไปด้วยเอฟเฟกต์อีกสองอย่าง ฉันลบปัจจัยออกเพราะทำให้ไม่ได้ข้อสรุปและทำให้คำอธิบายนั้นยากขึ้น
csgillespie

2
อืมในกรณีนี้ฉันคิดว่าฉันเก็บมันไว้ฉันไม่สามารถเห็นได้ว่าทำไมมันทำให้คำอธิบายนั้นยากขึ้นและเมื่อคุณค้นพบมันอาจจะยากที่จะอธิบายว่าทำไมคุณถึงทิ้งมันไปกว่าที่คุณเก็บไว้!
onestop

ฉันใช้จุดของคุณแม้ว่าฉันจะไม่เห็นด้วยกับมัน 100% ฉันสามารถเห็นผู้ตัดสินคนอื่นแนะนำว่าคุณควรลบปัจจัยออก (นั่นคือสิ่งที่นักสถิติชีวภาพแนะนำให้ฉันพูดด้วย) อย่างที่คุณพูดถึงเมื่อมันเป็นพื้นที่สีเทากฎเกณฑ์โดยพลการไม่ใช่วิธีที่จะไป หากเราต้องการทำให้เข้าใจผิดเราจะไม่พูดถึงอีกปัจจัยที่เกี่ยวข้อง! ผิดจรรยาบรรณโดยสมบูรณ์ แต่ฉันสงสัยว่ามันเกิดขึ้น
csgillespie

1

โปรดอ่านข้อความของอันเดอร์วู้ดและการอ้างอิงในที่นี้มันไม่ได้เป็นกฎโปรดอ่าน ในความเป็นจริงวิธีการนี้คือการควบคุมข้อผิดพลาดประเภทที่สองเมื่อลบ (หรือรวมกำไร) คำว่า "ไม่สำคัญ" ในรูปแบบ เกิดอะไรขึ้นถ้าคำที่คุณลบมีระดับ signficance ที่ 0.06? คุณแน่ใจหรือไม่ว่า MS ที่คาดหวังไม่ได้รวมเอฟเฟกต์เพิ่มเติมเนื่องจากปัจจัยดังกล่าว หากคุณลบคำดังกล่าวคุณกำลังสันนิษฐานว่า MS คาดว่าจะไม่รวมถึงผลกระทบเพิ่มเติมเนื่องจากการรักษานั้น แต่คุณจะต้องได้รับการคุ้มครองจากข้อผิดพลาดประเภท II! โปรดแก้ตัวภาษาอังกฤษที่ไม่ดีและเร่งรีบของฉันด้วย!

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.