คำถามติดแท็ก mixed-model

แบบผสม (aka หลายระดับหรือลำดับชั้น) เป็นโมเดลเชิงเส้นที่มีทั้งเอฟเฟกต์คงที่และเอฟเฟกต์แบบสุ่ม พวกเขาจะใช้ในการจำลองข้อมูลระยะยาวหรือซ้อน

1
การทดสอบผลกระทบที่เกิดขึ้นพร้อมกันและล้าหลังในโมเดลผสมตามยาวที่มีตัวแปรแปรผันตามเวลา
เมื่อไม่นานมานี้มีคนบอกฉันว่ามันเป็นไปไม่ได้ที่จะรวม covariates ที่แปรผันตามเวลาในรูปแบบผสมตามยาวโดยไม่ได้แนะนำการล่าช้าของ covariates เหล่านี้ คุณสามารถยืนยัน / ปฏิเสธสิ่งนี้ได้หรือไม่? คุณมีการอ้างอิงเกี่ยวกับสถานการณ์นี้หรือไม่? ฉันเสนอสถานการณ์ง่าย ๆ เพื่อชี้แจง สมมติว่าฉันมีมาตรการซ้ำ ๆ (พูดมากกว่า 30 ครั้ง) ของตัวแปรเชิงปริมาณ (y, x1, x2, x3) ใน 40 วิชา ตัวแปรแต่ละตัวจะถูกวัด 30 ครั้งในแต่ละหัวข้อโดยแบบสอบถาม ที่นี่ข้อมูลสุดท้ายจะเป็น 4 800 การสังเกต (4 ตัวแปร X 30 ครั้ง X 40 วิชา) ซ้อนกันใน 40 วิชา ฉันต้องการทดสอบแยกต่างหาก (ไม่ใช่สำหรับการเปรียบเทียบรุ่น) สำหรับ: เอฟเฟกต์แบบซิงโครนัส (พร้อมกัน): อิทธิพลของ x1, …

2
เทคนิคการเรียนรู้ของเครื่องสำหรับข้อมูลระยะยาว
ฉันสงสัยว่ามีเทคนิคการเรียนรู้ด้วยเครื่อง (ไม่ได้รับอนุญาต) สำหรับการสร้างแบบจำลองข้อมูลระยะยาวหรือไม่? ฉันเคยใช้โมเดลเอฟเฟ็กต์แบบผสม (ส่วนใหญ่ไม่ใช่แบบเส้นตรง) แต่ฉันสงสัยว่ามีวิธีอื่นในการทำเช่นนี้ (โดยใช้การเรียนรู้ของเครื่อง) โดยการเรียนรู้ของเครื่องผมหมายถึงป่าสุ่มการจำแนก / การจัดกลุ่มต้นไม้การตัดสินใจและแม้แต่การเรียนรู้ลึก ฯลฯ

2
ทำไมความน่าจะเป็นสูงสุดที่ จำกัด จึงให้ผลต่างประมาณที่ดีขึ้น (ไม่เอนเอียง)?
ฉันกำลังอ่านบทความทฤษฎีของ Doug Bates บนแพ็คเกจ lme4 ของ R เพื่อทำความเข้าใจกับ nitty-gritty ของแบบจำลองที่ผสมกันและพบผลลัพธ์ที่น่าสนใจที่ฉันต้องการทำความเข้าใจให้ดีขึ้นเกี่ยวกับการใช้โอกาสสูงสุดแบบ จำกัด (REML) เพื่อประเมินความแปรปรวน . ในมาตรา 3.3 ในเกณฑ์ REML เขากล่าวว่าการใช้ REML ในการประมาณค่าความแปรปรวนเกี่ยวข้องอย่างใกล้ชิดกับการใช้องศาความเป็นอิสระในการแก้ไขเมื่อประเมินความแปรปรวนจากส่วนเบี่ยงเบนที่เหลืออยู่ในตัวแบบเชิงเส้นพอดี โดยเฉพาะอย่างยิ่ง "แม้ว่าโดยปกติจะไม่ได้มาในลักษณะนี้" องศาของการแก้ไขอิสรภาพสามารถทำได้โดยการประเมินความแปรปรวนผ่านการปรับให้เหมาะสมของ "เกณฑ์ REML" (Eq. (28)) เกณฑ์ REML นั้นมีความเป็นไปได้เพียงอย่างเดียว แต่พารามิเตอร์เชิงเส้นพอดีได้ถูกกำจัดโดยการทำให้เป็นขอบ (แทนที่จะตั้งค่าให้เท่ากับการประมาณแบบพอดีซึ่งจะทำให้ความแปรปรวนตัวอย่างแบบเอนเอียง) ฉันทำคณิตศาสตร์และตรวจสอบผลลัพธ์ที่อ้างสิทธิ์สำหรับโมเดลเชิงเส้นอย่างง่ายที่มีเอฟเฟกต์คงที่เท่านั้น สิ่งที่ฉันกำลังดิ้นรนคือการตีความ มีมุมมองบางอย่างที่เป็นธรรมชาติหรือไม่ที่จะได้รับการประมาณค่าความแปรปรวนโดยการปรับความน่าจะเป็นที่พารามิเตอร์ทางพอดีได้ถูกทำให้ลดลง? มันให้ความรู้สึกเหมือนกับ Bayesian ราวกับว่าฉันกำลังคิดถึงโอกาสที่จะเป็นหลังและปรับพารามิเตอร์ที่เหมาะสมเหมือนพวกมันเป็นตัวแปรสุ่ม หรือเหตุผลหลักเกี่ยวกับคณิตศาสตร์เพียงอย่างเดียว - มันทำงานในกรณีเชิงเส้น แต่ยังเป็น generalizable?

2
รับองศาอิสระจาก lmer
ฉันเหมาะสมกับโมเดล lmer ด้วยสิ่งต่อไปนี้ (แม้ว่าจะเป็นเอาต์พุต): Random effects: Groups Name Std.Dev. day:sample (Intercept) 0.09 sample (Intercept) 0.42 Residual 0.023 ฉันต้องการสร้างช่วงความมั่นใจสำหรับแต่ละเอฟเฟกต์โดยใช้สูตรต่อไปนี้: ( n - 1 ) s2χ2α / 2 , n - 1, ( n - 1 ) s2χ21 - α / 2 , n - 1(n-1)s2χα/2,n-12,(n-1)s2χ1-α/2,n-12 \frac{(n-1)s^2}{\chi^2_{\alpha/2, n-1}},\frac{(n-1)s^2}{\chi^2_{1-\alpha/2,n-1}} มีวิธีที่จะออกจากองศาอิสระอย่างสะดวกสบายไหม

1
การออกแบบตัวแบบผสมเอฟเฟกต์พร้อมตัวแปรสุ่มตัวอย่าง
ฉันพยายามระบุสูตรสำหรับโมเดลเอฟเฟกต์แบบผสมเชิงเส้น (พร้อมlme4) สำหรับการออกแบบการทดลองของฉัน แต่ฉันไม่แน่ใจว่าฉันทำถูกต้องหรือไม่ การออกแบบ: โดยทั่วไปฉันวัดพารามิเตอร์การตอบสนองในพืช ฉันมีการรักษา 4 ระดับและระดับการชลประทาน 2 ระดับ พืชถูกจัดกลุ่มใน 16 แปลงภายในแต่ละแปลงฉันสุ่ม 4 แปลงย่อย ในแต่ละพล็อตย่อยฉันใช้เวลาสังเกตระหว่าง 15 ถึง 30 (ขึ้นอยู่กับจำนวนพืชที่พบ) นั่นคือมีทั้งหมด 1,500 แถว ตอนแรกระดับย่อยเป็นเพียงที่นี่เพื่อจุดประสงค์ในการสุ่มตัวอย่าง แต่ฉันคิดว่าฉันต้องการนำมาพิจารณาในรูปแบบ (เป็นตัวแปรระดับ 64) เพราะฉันเห็นว่ามีความแปรปรวนจำนวนมากจากพล็อตย่อยหนึ่งไปอีก แม้ในพล็อตเดียวกัน (มากกว่าความแปรปรวนระหว่างแปลงทั้งหมด) ความคิดแรกของฉันคือการเขียน: library(lme4) fit <- lmer(y ~ treatment*irrigation + (1|subplot/plot), data=mydata) หรือ fit <- lmer(y ~ treatment*irrigation + (1|subplot) + …

2
lme4 :: lmer เทียบเท่ากับ ANOVA ที่ทำซ้ำสามทางคืออะไร?
คำถามของฉันอยู่บนพื้นฐานของการตอบสนองซึ่งแสดงให้เห็นว่าlme4::lmerรูปแบบใดที่สอดคล้องกับการวัดความแปรปรวนสองทางแบบ ANOVA: require(lme4) set.seed(1234) d <- data.frame( y = rnorm(96), subject = factor(rep(1:12, 4)), a = factor(rep(1:2, each=24)), b = factor(rep(rep(1:2, each=12))), c = factor(rep(rep(1:2, each=48)))) # standard two-way repeated measures ANOVA: summary(aov(y~a*b+Error(subject/(a*b)), d[d$c == "1",])) # corresponding lmer call: anova(lmer(y ~ a*b+(1|subject) + (1|a:subject) + (1|b:subject), d[d$c == "1",])) …

2
โมเดลการสกัดกั้นแบบสุ่มเทียบกับ GEE
พิจารณาแบบจำลองเชิงเส้นตัดขวางแบบสุ่ม นี่เทียบเท่ากับการถดถอยเชิงเส้น GEE กับเมทริกซ์สหสัมพันธ์การทำงานที่แลกเปลี่ยนได้ สมมติว่ามีการพยากรณ์และและค่าสัมประสิทธิ์สำหรับพยากรณ์เหล่านี้เป็น ,และ\การตีความสัมประสิทธิ์ในการสกัดกั้นแบบสุ่มคืออะไร? มันเหมือนกับการถดถอยเชิงเส้นของ GEE ยกเว้นว่าอยู่ในระดับบุคคลหรือไม่?x1,x2,x1,x2,x_1, x_2,x3x3x_3β1β1\beta_1β2β2\beta_2β3β3\beta_3

3
ปรับโมเดลหลายระดับให้เหมาะสมกับข้อมูลการสำรวจที่ซับซ้อนใน R
ฉันกำลังมองหาคำแนะนำเกี่ยวกับวิธีการวิเคราะห์ข้อมูลการสำรวจที่ซับซ้อนด้วยโมเดลหลายระดับในอาร์ฉันใช้surveyแพคเกจน้ำหนักเพื่อความน่าจะเป็นที่ไม่เท่ากันของการเลือกในแบบจำลองระดับเดียว แต่แพ็คเกจนี้ไม่มีฟังก์ชันสำหรับการสร้างแบบหลายระดับ lme4แพคเกจเป็นที่ดีสำหรับการสร้างแบบจำลองหลายระดับ แต่มีไม่ได้เป็นวิธีที่ฉันรู้ที่จะรวมน้ำหนักในระดับที่แตกต่างกันของการจัดกลุ่ม Asparouhov (2006)สร้างปัญหา: แบบหลายระดับมักถูกใช้เพื่อวิเคราะห์ข้อมูลจากการออกแบบการสุ่มตัวอย่างแบบกลุ่ม การออกแบบการสุ่มตัวอย่างดังกล่าวมักจะใช้ความน่าจะเป็นที่ไม่เท่ากันของการเลือกในระดับคลัสเตอร์และระดับบุคคล น้ำหนักตัวอย่างจะถูกกำหนดในหนึ่งหรือทั้งสองระดับเพื่อสะท้อนความน่าจะเป็นเหล่านี้ หากน้ำหนักการสุ่มตัวอย่างถูกเพิกเฉยไม่ว่าในระดับใดการประมาณค่าพารามิเตอร์สามารถลำเอียงอย่างมาก แนวทางหนึ่งสำหรับแบบจำลองสองระดับคือตัวประมาณความน่าจะเป็นแบบหลอกหลายระดับ (MPML) ที่ใช้ใน MPLUS ( Asparouhov et al,? ) Carle (2009)ตรวจสอบแพ็คเกจซอฟต์แวร์ที่สำคัญและให้คำแนะนำเล็กน้อยเกี่ยวกับวิธีดำเนินการต่อ: ในการดำเนินการ MLM อย่างเหมาะสมกับข้อมูลการสำรวจที่ซับซ้อนและตุ้มน้ำหนักการออกแบบนักวิเคราะห์จำเป็นต้องใช้ซอฟต์แวร์ที่สามารถรวมน้ำหนักที่ปรับสัดส่วนไว้นอกโปรแกรม ปัจจุบันโปรแกรมซอฟต์แวร์ MLM ที่สำคัญสามโปรแกรมอนุญาตสิ่งนี้: Mplus (5.2), MLwiN (2.02) และ GLLAMM น่าเสียดายที่ HLM และ SAS ไม่สามารถทำได้ West และ Galecki (2013)ให้ความเห็นที่อัปเดตมากกว่าเดิมและฉันจะเสนอราคาข้อความที่เกี่ยวข้องตามความยาว: ในบางครั้งนักวิเคราะห์ต้องการปรับ LMM ให้เหมาะกับการสำรวจชุดข้อมูลที่รวบรวมจากตัวอย่างด้วยการออกแบบที่ซับซ้อน (ดู Heeringa et al, 2010, …

1
โมเดลชายขอบกับโมเดลสุ่มเอฟเฟกต์ - วิธีการเลือกระหว่างพวกเขา? คำแนะนำสำหรับคนธรรมดา
ในการค้นหาข้อมูลเกี่ยวกับตัวแบบขอบและตัวแบบสุ่มเอฟเฟกต์และวิธีการเลือกระหว่างพวกเขาฉันได้พบข้อมูลบางอย่าง แต่มันเป็นคำอธิบายเชิงนามธรรมทางคณิตศาสตร์มากขึ้นหรือน้อยลง (เช่นตัวอย่างที่นี่: https: //stats.stackexchange .com / a / 68753/38080 ) ที่ไหนสักแห่งที่ฉันพบว่ามีการสังเกตความแตกต่างอย่างมากระหว่างการประมาณค่าพารามิเตอร์ระหว่างสองวิธี / โมเดล ( http://www.biomedcentral.com/1471-2288/2/15/ ) อย่างไรก็ตามสิ่งที่ตรงกันข้ามถูกเขียนโดย Zuur et al . (2009, p. 116; http://link.springer.com/book/10.1007%2F978-0-387-87458-6) รุ่น Marginal (generalized การประเมินวิธีการสม) นำพารามิเตอร์ของประชากรเฉลี่ยในขณะที่ผลจากการสุ่มผลรุ่น (ทั่วไปเชิงเส้นรูปแบบผสม) นำเข้าผลสุ่มบัญชี - เรื่อง (Verbeke et al, 2010, หน้า 49-52.. http: / /link.springer.com/chapter/10.1007/0-387-28980-1_16 ) ฉันต้องการที่จะเห็นคำอธิบายเหมือนคนธรรมดาของแบบจำลองเหล่านี้ที่แสดงในตัวอย่างบางส่วน (ในชีวิตจริง) ในภาษาที่คุ้นเคยกับนักสถิติและนักคณิตศาสตร์ที่ไม่ใช่นักคณิตศาสตร์ ในรายละเอียดฉันต้องการทราบ: ควรใช้โมเดลร่อแร่และควรใช้โมเดลสุ่มเอฟเฟกต์เมื่อใด …

2
โมเดลเชิงเส้นผสมแบบทั่วไป: การวินิจฉัย
ฉันมีการถดถอยแบบลอจิสติกเพื่อสกัดกั้นแบบสุ่ม (เนื่องจากการวัดซ้ำ) และฉันต้องการที่จะทำการวินิจฉัยบางอย่างโดยเฉพาะเกี่ยวกับค่าผิดปกติและการสังเกตที่มีอิทธิพล ฉันดูที่เหลือเพื่อดูว่ามีข้อสังเกตที่โดดเด่นหรือไม่ แต่ฉันก็อยากจะดูบางอย่างเช่นระยะทางของ Cook หรือ DFFITS Hosmer และ Lemeshow (2000) กล่าวว่าเนื่องจากการขาดเครื่องมือวินิจฉัยแบบจำลองสำหรับข้อมูลที่มีความสัมพันธ์หนึ่งควรจะพอดีกับแบบจำลองการถดถอยโลจิสติกปกติละเว้นความสัมพันธ์และใช้เครื่องมือวินิจฉัยที่มีอยู่สำหรับการถดถอยโลจิสติกปกติ พวกเขายืนยันว่าสิ่งนี้จะดีกว่าไม่ได้ทำการวินิจฉัยใด ๆ เลย หนังสือเล่มนี้มาจากปี 2000 และฉันสงสัยว่าตอนนี้มีวิธีการสำหรับการวินิจฉัยแบบจำลองที่มีผลกระทบการถดถอยโลจิสติกแบบผสมหรือไม่? สิ่งที่จะเป็นวิธีที่ดีในการตรวจสอบค่าผิดปกติ? แก้ไข (5 พฤศจิกายน 2013): เนื่องจากการขาดการตอบสนองฉันสงสัยว่าการทำการวินิจฉัยด้วยโมเดลที่หลากหลายนั้นไม่ได้ทำโดยทั่วไปหรือไม่ใช่ขั้นตอนที่สำคัญเมื่อทำการสร้างแบบจำลองข้อมูล ดังนั้นฉันขอใช้ถ้อยคำใหม่คำถามของฉัน: คุณจะทำอย่างไรเมื่อคุณพบรูปแบบการถดถอยที่ "ดี"?

1
การเปรียบเทียบแบบหลายแบบผสมสำหรับการโต้ตอบระหว่างตัวทำนายแบบต่อเนื่องและหมวดหมู่
ฉันต้องการใช้lme4เพื่อให้พอดีกับการถดถอยแบบผสมและmultcompเพื่อคำนวณการเปรียบเทียบแบบคู่ ฉันมีชุดข้อมูลที่ซับซ้อนพร้อมตัวทำนายอย่างต่อเนื่องและจัดหมวดหมู่หลายชุด แต่คำถามของฉันสามารถแสดงให้เห็นได้โดยใช้ChickWeightชุดข้อมูลในตัวเป็นตัวอย่าง: m <- lmer(weight ~ Time * Diet + (1 | Chick), data=ChickWeight, REML=F) Timeมีความต่อเนื่องและDietเป็นหมวดหมู่ (4 ระดับ) และมีลูกไก่หลายตัวต่ออาหาร ลูกไก่ทุกตัวเริ่มต้นด้วยน้ำหนักเท่ากัน แต่อาหารของพวกมัน (อาจ) ส่งผลต่ออัตราการเติบโตดังนั้นการDietสกัดกั้นควรจะเหมือนกัน (มากหรือน้อย) เหมือนกัน แต่ความลาดชันอาจแตกต่างกัน ฉันจะได้รับการเปรียบเทียบแบบคู่สำหรับผลของการสกัดกั้นDietแบบนี้: summary(glht(m, linfct=mcp(Diet = "Tukey"))) และแน่นอนพวกเขาไม่ได้แตกต่างกันอย่างมีนัยสำคัญ แต่ฉันจะทำการทดสอบแบบอะนาล็อกเพื่อให้ได้Time:Dietผลอย่างไร เพียงแค่ใส่คำที่โต้ตอบลงไปในmcpข้อผิดพลาด: summary(glht(m, linfct=mcp('Time:Diet' = "Tukey"))) Error in summary(glht(m, linfct = mcp(`Time:Diet` = "Tukey"))) : error in …

1
ทำไมการทิ้งส่วนที่เหลือจากรูปแบบเอฟเฟกต์ผสมจึงให้ช่วงความมั่นใจในการต่อต้านอย่างอนุรักษ์นิยม?
ฉันมักจะจัดการกับข้อมูลที่แต่ละคนวัดกันหลายครั้งในแต่ละเงื่อนไขตั้งแต่ 2 ข้อขึ้นไป เมื่อไม่นานมานี้ฉันได้เล่นกับการสร้างแบบผสมเอฟเฟกต์เพื่อประเมินหลักฐานความแตกต่างระหว่างเงื่อนไขการสร้างแบบจำลองindividualเป็นเอฟเฟกต์แบบสุ่ม เพื่อให้เห็นภาพความไม่แน่นอนเกี่ยวกับการคาดการณ์จากแบบจำลองดังกล่าวฉันได้ใช้ bootstrapping ซึ่งในแต่ละการวนซ้ำของ bootstrap ทั้งบุคคลและการสังเกต - ภายใน - เงื่อนไข - ภายใน - บุคคล - ตัวอย่างจะถูกแทนที่ด้วยและแบบจำลองเอฟเฟกต์ใหม่ ได้รับ วิธีนี้ใช้งานได้ดีสำหรับข้อมูลที่ถือว่าข้อผิดพลาด gaussian แต่เมื่อข้อมูลเป็นแบบทวินามการบูตสแตรปอาจใช้เวลานานมากเนื่องจากการวนซ้ำแต่ละครั้งจะต้องคำนวณรูปแบบเอฟเฟกต์ผสมแบบทวินามที่คำนวณได้ค่อนข้างเข้มข้น ความคิดที่ฉันมีคือฉันอาจใช้ส่วนที่เหลือจากแบบจำลองเดิมแล้วใช้ส่วนที่เหลือเหล่านี้แทนข้อมูลดิบใน bootstrapping ซึ่งจะอนุญาตให้ฉันคำนวณรูปแบบเอฟเฟกต์แบบ gaussian ในการวนซ้ำของ bootstrap แต่ละครั้ง การเพิ่มการทำนายดั้งเดิมจากแบบจำลองทวินามของข้อมูลดิบไปยังการคาดการณ์ bootstrapped จากส่วนที่เหลือให้ผลตอบแทน 95% CI สำหรับการคาดการณ์ดั้งเดิม อย่างไรก็ตามฉันเพิ่งเขียนโค้ดการประเมินอย่างง่ายของวิธีการนี้การสร้างแบบจำลองไม่แตกต่างกันระหว่างสองเงื่อนไขและการคำนวณสัดส่วนของช่วงเวลาที่ความมั่นใจ 95% ล้มเหลวในการรวมศูนย์และฉันพบว่าขั้นตอนการบูตสต็อก (ไม่รวมศูนย์มากกว่า 5% ของเวลา) ยิ่งไปกว่านั้นฉันเขียนโค้ด (ลิงค์เดียวกันก่อนหน้านี้) การประเมินที่คล้ายกันของวิธีการนี้ที่นำไปใช้กับข้อมูลที่เป็นเกาส์เดิมและได้รับ CIs ต่อต้านอนุรักษ์นิยมในทำนองเดียวกัน ความคิดใด ๆ ว่าทำไมถึงเป็นเช่นนั้น?

3
ขนาดเอฟเฟกต์สำหรับเอฟเฟกต์ปฏิสัมพันธ์ในการออกแบบการควบคุมการรักษาก่อนโพสต์
หากคุณเลือกที่จะวิเคราะห์การออกแบบการควบคุมการรักษาก่อนโพสต์ด้วยตัวแปรตามอย่างต่อเนื่องโดยใช้ ANOVA แบบผสมมีวิธีต่าง ๆ ในการวัดผลกระทบของการอยู่ในกลุ่มการรักษา เอฟเฟกต์การโต้ตอบเป็นหนึ่งในตัวเลือกหลัก โดยทั่วไปแล้วฉันชอบการวัดแบบ d ของ Cohen มากกว่า (เช่น ) ฉันไม่ชอบความแปรปรวนที่อธิบายมาตรการเนื่องจากผลลัพธ์แตกต่างกันไปตามปัจจัยที่ไม่เกี่ยวข้องเช่นขนาดตัวอย่างที่สัมพันธ์กันของกลุ่มμ1- μ2σμ1-μ2σ{\frac{\mu_1 - \mu_2}{\sigma}} ดังนั้นฉันคิดว่าฉันสามารถหาปริมาณผลกระทบได้ดังนี้ Δ μค= μc 2- μc 1Δμค=μค2-μค1\Delta\mu_c = \mu_{c2} - \mu_{c1} Δ μเสื้อ= μt 2- μt 1Δμเสื้อ=μเสื้อ2-μเสื้อ1\Delta\mu_t = \mu_{t2} - \mu_{t1} ดังนั้นขนาดของผลกระทบที่อาจจะหมายถึงΔ μเสื้อ- Δ μคσΔμเสื้อ-Δμคσ\frac{\Delta\mu_t - \Delta\mu_c}{\sigma} โดยที่อ้างถึงการควบคุม, tถึงการรักษา, และ 1 และ 2 …

1
ข้อมูลสองปีที่อธิบายการเกิดขึ้นของสมาคมการทดสอบความรุนแรงกับจำนวนผู้ป่วยในวอร์ด
ฉันมีข้อมูลสองปีซึ่งมีลักษณะโดยทั่วไปดังนี้ วันที่ _ __ ความรุนแรง Y / N? _ จำนวนผู้ป่วย 1/1/2551 _ ___ 0 __ _ __ _ ____ 11 2/1/2551 _ __ _ 0 _ __ _ __ _ __ 11 3/1/2551 _ ____ 1 __ _ __ _ ____ 12 4/1/2551 _ ____ 0 __ _ __ _ …

5
ควรใช้แบบผสมเอฟเฟกต์เมื่อใด?
ตัวแบบผสมผลกระทบเชิงเส้นเป็นส่วนขยายของตัวแบบการถดถอยเชิงเส้นสำหรับข้อมูลที่รวบรวมและสรุปในกลุ่ม ข้อได้เปรียบที่สำคัญคือสัมประสิทธิ์อาจแตกต่างกันไปตามตัวแปรของกลุ่มหนึ่งตัวหรือมากกว่า อย่างไรก็ตามฉันกำลังดิ้นรนกับเวลาที่จะใช้รูปแบบผสมแบบผสม? ฉันจะทำอย่างละเอียดคำถามของฉันโดยใช้ตัวอย่างของเล่นกับกรณีที่รุนแรง สมมติว่าเราต้องการสร้างแบบจำลองความสูงและน้ำหนักสำหรับสัตว์และเราใช้สปีชีส์เป็นตัวแปรในการจัดกลุ่ม หากกลุ่ม / สายพันธุ์ที่แตกต่างกันแตกต่างกันจริงๆ พูดสุนัขและช้าง ฉันคิดว่าไม่มีจุดใช้โมเดลเอฟเฟกต์แบบผสมเราควรสร้างแบบจำลองสำหรับแต่ละกลุ่ม หากกลุ่ม / สปีชีส์ต่างกันมีความคล้ายคลึงกันจริงๆ พูดว่าสุนัขตัวเมียกับหมาตัวผู้ ฉันคิดว่าเราอาจต้องการใช้เพศเป็นตัวแปรเด็ดขาดในโมเดล ดังนั้นฉันคิดว่าเราควรใช้โมเดลเอฟเฟกต์ผสมในกรณีกลาง? บอกเด็ก ๆ ว่ากลุ่มคือแมวสุนัขกระต่ายพวกมันเป็นสัตว์ขนาดใกล้เคียงกัน แต่ต่างกัน มีข้อโต้แย้งอย่างเป็นทางการใด ๆ ที่จะแนะนำเมื่อใช้โมเดลเอฟเฟกต์แบบผสมเช่นวิธีการวาดเส้น แบบจำลองอาคารสำหรับแต่ละกลุ่ม แบบผสมลักษณะพิเศษ ใช้กลุ่มเป็นตัวแปรเด็ดขาดในการถดถอย ความพยายามของฉัน: วิธีที่ 1 เป็น "รูปแบบที่ซับซ้อน" ที่สุด / มีระดับความเป็นอิสระน้อยลงและวิธีที่ 3 คือรูปแบบที่ง่ายที่สุด "/ ระดับที่อิสระมากขึ้น และโมเดลเอฟเฟกต์ผสมอยู่ตรงกลาง เราอาจพิจารณาจำนวนข้อมูลและข้อมูลที่ซับซ้อนที่เราต้องเลือกแบบจำลองที่เหมาะสมตาม Bais Variance Trade Off

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.