ฉันหวังเป็นอย่างยิ่งว่าฉันจะได้ใช้คำถามนี้ในลักษณะที่สามารถตอบได้อย่างชัดเจน - หากไม่ได้โปรดแจ้งให้เราทราบและฉันจะลองอีกครั้ง! ฉันควรเดาด้วยว่าฉันจะใช้ R สำหรับการวิเคราะห์เหล่านี้
ฉันมีหลายมาตรการplant performance (Ys)
ที่ฉันสงสัยว่าได้รับอิทธิพลจากสี่รักษาผม imposed-- และflower thinning (X1), fertilization (X2), leaf clipping (X3)
biased flower thinning (X4)
สำหรับ Ys ที่เป็นไปได้ทั้งหมด N มีอย่างน้อย 242 ดังนั้นขนาดตัวอย่างของฉันจึงใหญ่ แผนการทั้งหมดถูกทำให้ผอมบางหรือไม่ แต่แต่ละแปลงก็ต้องมีหนึ่ง (และเพียงหนึ่ง) ของการรักษาอีกสาม (หรือไม่ - มีแผนการควบคุมด้วย) แนวคิดของการออกแบบนี้คือการทดสอบว่าอีกสามวิธีการรักษามีความสามารถในการ "กำบัง" หรือ "การเสริมสร้าง" ผลของการทำให้ผอมบาง ดังนั้นด้วยการออกแบบการรักษาทั้งสามหลัง (X2-X4) จึงไม่สามารถโต้ตอบกันได้เพราะพวกเขาไม่ได้ถูกข้าม แต่พวกเขาแต่ละคนสามารถโต้ตอบกับการทำให้ผอมบางของดอกไม้ - และพวกเขาอาจทำ
สมมติฐานที่ชัดเจนของฉันคือ 1) การทำให้ผอมบางดอกจะมีนัยสำคัญและ 2) คำที่ใช้ในการโต้ตอบX1*X2, X1*X3, and X1*X4,
ระหว่างการทำให้ผอมบางของดอกไม้กับอีกสามการรักษาก็มีความสำคัญเช่นกัน นั่นคือการทำให้ผอมบางดอกไม้ควรมีความสำคัญ แต่วิธีการที่มันควรจะมีการเปลี่ยนแปลงอย่างมีนัยสำคัญโดยสิ่งที่อีกสามรักษา
ฉันต้องการรวมข้อมูลทั้งหมดนี้ในรูปแบบผสม:
Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)
แต่มีอยู่หนึ่งแขวน: ฉันมีเหตุผลที่ดีที่จะเชื่อว่าผลกระทบของการทำให้ผอมบางใน Y เป็นแบบไม่เป็นเชิงเส้น พวกเขาอาจจะเป็นกำลังสอง แต่อาจจะเป็นลูกบาศก์ในบางกรณี นี่เป็นเพราะผลกระทบของการทำให้ผอมบางที่มีต่อประสิทธิภาพมีแนวโน้มที่จะเพิ่มขึ้นเร็วขึ้นในระดับที่ผอมบาง ถ้าฉันพยายามที่จะสร้างแบบจำลองความสัมพันธ์ที่ไม่ใช่เชิงเส้นผ่านสมการข้างต้นโดยการเพิ่มคำกำลังสองและลูกบาศก์สำหรับ X1 ฉันก็ไม่แน่ใจว่าจะสร้างแบบจำลองเงื่อนไขการโต้ตอบได้อย่างไร - ฉันควรจะรวมชุดค่าผสมที่เป็นไปได้ทั้งหมดของ X1, (X1) ^ 2 และ (X1) ^ 3 * X2, X3 และ X4? เพราะนั่นดูเหมือนว่าเป็นพารามิเตอร์จำนวนมากที่จะพยายามประมาณแม้จะมีจำนวนจุดข้อมูลที่ฉันมีและฉันไม่แน่ใจว่าจะตีความผลลัพธ์ที่ฉันจะได้รับอย่างไร ที่กล่าวว่าฉันไม่มีเหตุผลทางชีวภาพที่จะคิดว่านี่จะเป็นวิธีที่ไม่รอบคอบในการสร้างแบบจำลองสถานการณ์
ดังนั้นฉันมีสามความคิดเกี่ยวกับวิธีแก้ไขปัญหานี้:
- พอดีกับโมเดลที่มีขนาดเล็กกว่าก่อนเช่น
Y ~ X1 + X1^2 + X^3 + Random effects
มีจุดประสงค์เพียงอย่างเดียวในการพิจารณาว่าความสัมพันธ์ระหว่างการทำให้ผอมบางและ Y นั้นเป็นเส้นตรงกำลังสองหรือลูกบาศก์แล้วเปลี่ยนการทำให้ผอมบางผ่านสี่เหลี่ยม - หรือลูกบาศก์รูท จากที่นั่นเงื่อนไขการโต้ตอบสามารถเป็นแบบอย่างข้างต้นด้วยตัวแปรแปลง- สมมติว่าการโต้ตอบที่สำคัญหากเกิดขึ้นจะส่งผลต่อคำศัพท์ X1 เพียงคำเดียว (เช่นเฉพาะเชิงเส้นกำลังสองหรือลูกบาศก์เทอม) และจำลองการโต้ตอบตามนั้น ฉันไม่แน่ใจด้วยซ้ำว่าวิธีการนี้เหมาะสมหรือไม่
- พอดีกับ "full model" กับทุก ๆ ระยะการโต้ตอบที่เป็นไปได้ระหว่างคำที่ทำให้ผอมบางและการรักษาอื่น ๆ ตามที่กล่าวไว้ข้างต้น จากนั้นตัดคำที่ไม่สำคัญออกไปและใช้กราฟและเทคนิคอื่น ๆ เพื่อตีความผลลัพธ์
วิธีการใดที่เหมาะสมที่สุดและทำไมเพราะฉันสนใจการทดสอบสมมติฐานและไม่เลือกรูปแบบ? โดยเฉพาะอย่างยิ่งหาก # 1 ด้านบนไม่สมเหตุสมผลที่จะทำทำไมเป็นเช่นนั้น? ฉันได้อ่านบทความนี้และบทความนี้และพยายามที่จะแยกแยะสิ่งที่พวกเขาอาจมีความหมายสำหรับฉัน แต่แหล่งข้อมูลใด ๆ สำหรับการอ่านเพิ่มเติมก็จะได้รับการชื่นชมมาก!