ข้อดีของการรักษาแบบสุ่มในแบบผสมคืออะไร


24

ฉันมีปัญหาในการใช้ประโยชน์จากการติดฉลากแบบจำลองด้วยเหตุผลแบบสุ่มด้วยเหตุผลบางประการ สำหรับฉันดูเหมือนว่าในเกือบทุกกรณีทางออกที่ดีที่สุดคือการรักษาปัจจัยทั้งหมดตามที่ได้รับการแก้ไข

ครั้งแรกความแตกต่างของการจับคู่เทียบกับการสุ่มค่อนข้างสุ่ม คำอธิบายมาตรฐานคือหากมีใครสนใจในหน่วยทดลองเฉพาะต่อหนึ่งคนก็ควรใช้เอฟเฟกต์คงที่และหากใครสนใจประชากรที่เป็นตัวแทนของหน่วยทดลองก็ควรใช้เอฟเฟกต์แบบสุ่ม สิ่งนี้ไม่ได้ช่วยอะไรมากเพราะมันบอกเป็นนัย ๆ ว่าสามารถสลับกันระหว่างมุมมองแบบคงที่และแบบสุ่มแม้ว่าข้อมูลและการออกแบบการทดลองยังคงเหมือนเดิม นอกจากนี้คำจำกัดความนี้ส่งเสริมภาพลวงตาว่าหากปัจจัยถูกระบุว่าเป็นแบบสุ่มการอนุมานที่ดึงมาจากตัวแบบนั้นมีความเหมาะสมกับประชากรมากกว่าในกรณีที่ตัวประกอบถูกระบุว่าเป็นแบบคงที่ ในที่สุดGelman แสดงให้เห็นว่าความแตกต่างแบบสุ่มคงที่ทำให้เกิดความสับสน แม้ในระดับคำจำกัดความเนื่องจากมีคำจำกัดความเพิ่มเติมอีกสี่คำของเอฟเฟกต์แบบคงที่และแบบสุ่ม

ประการที่สองการประมาณค่าของตัวแบบผสมค่อนข้างซับซ้อน ซึ่งแตกต่างจากโมเดล "คงที่หมดจด" มีมากกว่าสองสามวิธีในการรับค่า p ศาสตราจารย์ Prof. Bates ที่ใช้การประมาณค่า REML ในแพ็คเกจ lme4 ใน R ไปไกลจนปฏิเสธที่จะรายงานค่า p ทั้งหมด .

ประการที่สามมีปัญหาที่มืดของจำนวนพารามิเตอร์โดยนัยที่นำมาใช้โดยปัจจัยสุ่ม ตัวอย่างต่อไปนี้คือการปรับตัวของฉันที่อยู่ในอัม & Anderson, รุ่นการคัดเลือกและมีหลายรุ่นอนุมาน: วิธีการข้อมูลตามทฤษฎีปฏิบัติ จากมุมมองการแลกเปลี่ยนความแปรปรวนแบบอคติบทบาทของเอฟเฟกต์แบบสุ่มสามารถแสดงได้ดังนี้ พิจารณาการวิเคราะห์ความแปรปรวนแบบทางเดียวกับรีทเม้นต์และKปัจจัยหลักซึ่งK - 1สามารถประมาณได้ คำผิดพลาดมีN ( 0 , σ 2 )เพิ่มขึ้น สมมติว่าเราบอกว่าKผลกระทบหลักมาจากN (KKK1N(0,σ2)การแจกแจงหากจำนวนการสังเกตได้รับการแก้ไขค่าความแปรปรวนแบบอคติจะลดลงเป็นKKการแจกแจง 0 , σ K ) โมเดลที่เกี่ยวข้องจะมีความซับซ้อนที่อยู่ระหว่างรุ่นที่แก้ไข (ติดตั้ง) และรุ่นที่มีขนาดเล็กซึ่งมีจุดตัดเท่านั้น จำนวนของพารามิเตอร์ที่มีประสิทธิภาพในรูปแบบคงที่คือN(0,σK)

1intercept+(K1)maineffects+1σ=K+1.

จำนวนพารามิเตอร์ที่มีประสิทธิภาพในโมเดลสุ่มมีอย่างน้อยสาม: intercept,σ,σK Kนอกจากนี้โมเดลแบบสุ่มยังมีพารามิเตอร์“ ซ่อน” จำนวนหนึ่งซึ่งบ่งบอกถึงข้อ จำกัด การกระจาย (ปกติในกรณีนี้) ที่กำหนดให้กับผลกระทบหลัก

โดยเฉพาะอย่างยิ่งหากมีปัจจัยที่มีสองระดับมันไม่สมเหตุสมผลที่จะเรียกว่าการสุ่มแม้ว่าเราจะรู้ว่าระดับของมันนั้นถูกสุ่มจากประชากรบางคน นั่นเป็นเพราะรุ่นผลกระทบคงที่มีสามพารามิเตอร์และรุ่นผลแบบสุ่มมีมากกว่าสามพารามิเตอร์ ในกรณีนี้โมเดลแบบสุ่มจะมีความซับซ้อนมากกว่ารุ่นคงที่ เห็นได้ชัดว่าสวิทช์จากรุ่นคงที่ไปเป็นแบบสุ่มมีสายดินมากขึ้นสำหรับขนาดใหญ่K. อย่างไรก็ตามจำนวนของพารามิเตอร์“ ซ่อน” ในโมเดลสุ่มไม่เป็นที่รู้จักดังนั้นจึงเป็นไปไม่ได้ที่จะเปรียบเทียบรุ่นที่มีการแก้ไขและแบบสุ่มตามเกณฑ์ข้อมูลเช่น AIC ดังนั้นในขณะที่ตัวอย่างนี้ให้ความกระจ่างกับการมีส่วนร่วมของเอฟเฟกต์แบบสุ่ม (ความเป็นไปได้ของการแลกเปลี่ยนความเอนเอียงที่ดีกว่า) แต่ก็แสดงให้เห็นว่ามันยากที่จะพูดว่า

ไม่มีปัญหาใด ๆ ข้างต้นที่แสดงในรูปแบบ“ การแก้ไขอย่างหมดจด” ดังนั้นฉันยินดีที่จะถาม:

  1. ทุกคนสามารถให้ตัวอย่างเมื่อมีสิ่งเลวร้ายเกิดขึ้นเมื่อมีการใช้ปัจจัยแบบสุ่มราวกับว่ามันได้รับการแก้ไขแล้วหรือไม่? ฉันเชื่อว่าควรมีการศึกษาเกี่ยวกับการจำลองสถานการณ์เพื่อแก้ไขปัญหาอย่างชัดเจน

  2. มีวิธีการเชิงปริมาณที่ได้รับการพิสูจน์แล้วหรือไม่ที่จะตัดสินใจว่าควรเปลี่ยนจากป้ายกำกับเป็นป้ายสุ่มหรือไม่


คำถามที่เขียนมาอย่างดีและฉันได้เรียนรู้เล็ก ๆ น้อย ๆ จากการอ่าน ฉันสงสัยว่าการวิเคราะห์เอฟเฟกต์แบบสุ่มนั้นจะต้องใช้เวลาอีกนานหรือไม่ ถ้าฉันพยายามตอบ # 1 ฉันจะไปหาสถานการณ์ที่มีความแปรปรวนสูงหลายวิชาและขนาดตัวอย่างเล็ก ๆ ภายในหัวเรื่อง จากนั้นค่าประมาณคงที่ภายในเรื่องจะอยู่ทั่วทุกสถานที่
Ben Ogorek

คำตอบ:


20

1ตัวอย่างที่มีชื่อเสียงในด้านจิตวิทยาและภาษาศาสตร์อธิบายโดย Herb Clark (1973; ตามโคลแมน, 1964): "การเข้าใจผิดของภาษาเป็นผลคงที่: บทวิจารณ์ของสถิติภาษาในการวิจัยทางจิตวิทยา"

คลาร์กเป็นนักจิตวิทยาที่พูดคุยเกี่ยวกับการทดลองทางจิตวิทยาซึ่งกลุ่มตัวอย่างของงานวิจัยให้คำตอบกับชุดของวัสดุกระตุ้นซึ่งโดยทั่วไปมักใช้คำต่าง ๆ ที่ดึงมาจากคลังข้อมูลบางส่วน เขาชี้ให้เห็นว่ากระบวนการทางสถิติมาตรฐานที่ใช้ในกรณีเหล่านี้ขึ้นอยู่กับมาตรการ ANOVA ซ้ำและเรียกโดยคลาร์กเป็นถือว่าผู้เข้าร่วมเป็นปัจจัยสุ่ม แต่ (อาจจะโดยปริยาย) ถือว่าวัสดุกระตุ้นเศรษฐกิจ คงที่ สิ่งนี้นำไปสู่ปัญหาในการตีความผลลัพธ์ของการทดสอบสมมติฐานเกี่ยวกับปัจจัยเงื่อนไขการทดลอง: โดยธรรมชาติแล้วเราต้องการสมมติว่าผลลัพธ์ในเชิงบวกบอกเราบางอย่างเกี่ยวกับประชากรทั้งสองที่เราดึงตัวอย่างผู้เข้าร่วมของเรา วัสดุภาษา แต่F1โดยผู้เข้าร่วมการรักษาเป็นแบบสุ่มและสิ่งเร้าคงเป็นเพียงบอกเราเกี่ยวกับผลกระทบของปัจจัยสภาพข้ามคนอื่น ๆ ที่คล้ายกันการตอบสนองต่อสิ่งเร้าเดียวกันแน่นอน การดำเนินการวิเคราะห์ F 1เมื่อผู้เข้าร่วมและสิ่งเร้าถูกมองอย่างเหมาะสมมากขึ้นเนื่องจากการสุ่มสามารถนำไปสู่อัตราความผิดพลาด Type 1 ที่สูงกว่าระดับ αเล็กน้อยซึ่งมักจะเป็น. 05 - โดยขึ้นอยู่กับปัจจัยเช่นจำนวนและความแปรปรวนของ สิ่งเร้าและการออกแบบการทดลอง ในกรณีนี้การวิเคราะห์ความเหมาะสมมากขึ้นอย่างน้อยภายใต้กรอบการวิเคราะห์ความแปรปรวนคลาสสิกคือการใช้สิ่งที่เรียกว่ากึ่ง Fสถิติขึ้นอยู่กับอัตราส่วนของสี่เหลี่ยมหมายถึงF1F1αFผลรวมเชิงเส้นของ

กระดาษของคลาร์กสาดในภาษาศาสตร์จิตวิทยาในเวลานั้น แต่ล้มเหลวในการสร้างบุ๋มใหญ่ในวรรณคดีจิตวิทยาที่กว้างขึ้น (และแม้กระทั่งภายในจิตวิทยาภาษาศาสตร์คำแนะนำของคลาร์กก็ค่อนข้างบิดเบี้ยวในช่วงหลายปีที่ผ่านมาโดย Raaijmakers, Schrijnemakers, & Gremmen, 1999) แต่ในช่วงไม่กี่ปีที่ผ่านมาปัญหาดังกล่าวได้เห็นการฟื้นฟู ในโมเดลเอฟเฟ็กต์แบบผสมซึ่ง ANOVA รุ่นผสมแบบคลาสสิกสามารถมองได้ว่าเป็นกรณีพิเศษ เอกสารล่าสุดบางส่วน ได้แก่ Baayen, Davidson, & Bates (2008), Murayama, Sakaki, Yan, & Smith (2014) และ ( ahem ) Judd, Westfall, & Kenny (2012) ฉันแน่ใจว่ามีบางอย่างที่ฉันลืม

2.ไม่แน่นอน มีอยู่ . วิธีการรับอย่างไม่ว่าจะเป็นปัจจัยที่จะรวมอยู่ที่ดีขึ้นเป็นผลสุ่มหรือไม่ได้อยู่ในรูปแบบที่ทุกคน (ดูเช่น Pinheiro & เบตส์, 2000, pp ได้ 83-87;แต่ดู Barr, ประกาศ Scheepers และ Tily, 2013) และแน่นอนว่ามีเทคนิคการเปรียบเทียบแบบจำลองแบบคลาสสิกสำหรับการพิจารณาว่าปัจจัยใดที่รวมอยู่ในผลกระทบคงที่ดีกว่าหรือไม่เลย (เช่นการทดสอบ ) แต่ฉันคิดว่าการพิจารณาว่าปัจจัยใดที่ถือว่าดีกว่าว่าเป็นแบบคงที่หรือแบบสุ่มโดยทั่วไปแล้วจะเหลือคำถามที่ดีที่สุดเป็นคำถามทางความคิดที่จะตอบโดยพิจารณาจากการออกแบบการศึกษาและลักษณะของข้อสรุปที่ดึงออกมาF

Gary McClelland ผู้สอนสถิติระดับบัณฑิตศึกษาคนหนึ่งของฉันชอบบอกว่าบางทีคำถามพื้นฐานของการอนุมานเชิงสถิติคือ: "เปรียบเทียบกับอะไร" ต่อไปนี้ Gary ฉันคิดว่าเราสามารถวางกรอบคำถามเชิงแนวคิดที่ฉันกล่าวไว้ข้างต้นว่า: อะไรคือคลาสอ้างอิงของผลการทดลองเชิงสมมุติฐานที่ฉันต้องการเปรียบเทียบผลลัพธ์ที่สังเกตจริงของฉันกับอะไร อยู่ในบริบทของภาษาศาสตร์จิตวิทยาและพิจารณาการออกแบบการทดลองที่เรามีตัวอย่างของวิชาที่ตอบสนองต่อตัวอย่างของคำที่ถูกจัดประเภทในหนึ่งในสองเงื่อนไข (การออกแบบเฉพาะที่กล่าวถึงความยาวโดยคลาร์ก, 1973) ฉันจะเน้น สองความเป็นไปได้:

  1. ชุดการทดลองที่แต่ละการทดลองเราวาดตัวอย่างวิชาใหม่ตัวอย่างคำศัพท์ใหม่และตัวอย่างข้อผิดพลาดใหม่จากแบบจำลองเชิงกำเนิด ภายใต้รุ่นนี้หัวเรื่องและคำต่าง ๆ เป็นทั้งเอฟเฟกต์แบบสุ่ม
  2. ชุดการทดลองที่เราจะวาดตัวอย่างวิชาใหม่และตัวอย่างข้อผิดพลาดใหม่สำหรับการทดสอบแต่ละครั้ง แต่เรามักจะใช้ชุดคำเดิมเสมอ ภายใต้โมเดลนี้หัวเรื่องเป็นเอฟเฟ็กต์แบบสุ่ม แต่ Words เป็นเอฟเฟกต์คงที่

เพื่อให้เป็นรูปธรรมโดยสิ้นเชิงด้านล่างนี้มีแผนการบางส่วนจาก (ด้านบน) 4 ชุดของผลลัพธ์เชิงสมมุติจาก 4 การจำลองการทดลองภายใต้แบบจำลอง 1; (ด้านล่าง) ผลลัพธ์สมมุติฐาน 4 ชุดจากการทดลองจำลอง 4 ครั้งภายใต้แบบจำลอง 2 การทดลองแต่ละครั้งจะดูผลลัพธ์ในสองวิธี: (แผงด้านซ้าย) จัดกลุ่มตามหัวเรื่องโดย Subject-by-Condition หมายถึงพล็อตและเชื่อมโยงเข้าด้วยกัน (พาเนลด้านขวา) จัดกลุ่มตามคำโดยมีพล็อตสรุปการกระจายการตอบสนองสำหรับแต่ละ Word การทดลองทั้งหมดเกี่ยวข้องกับ 10 คนที่ตอบสนองต่อคำ 10 คำและในการทดลองทั้งหมด "สมมติฐานว่างเปล่า" ที่ไม่มีความแตกต่างของเงื่อนไขนั้นเป็นจริงในประชากรที่เกี่ยวข้อง

ผู้เข้าร่วมการทดลองและกลุ่มคำทั้งสองแบบสุ่ม: 4 การทดลองจำลอง

both_random

โปรดสังเกตที่นี่ว่าในการทดสอบแต่ละครั้งโปรไฟล์การตอบสนองสำหรับหัวเรื่องและคำต่างกันโดยสิ้นเชิง สำหรับหัวข้อเราบางครั้งผู้ตอบแบบสอบถามโดยรวมต่ำบางครั้งผู้ตอบสูงบางครั้งหัวเรื่องที่แสดงความแตกต่างของเงื่อนไขจำนวนมากและบางครั้งหัวเรื่องที่แสดงความแตกต่างของเงื่อนไขเล็กน้อย ในทำนองเดียวกันสำหรับคำบางครั้งเราได้รับคำที่มีแนวโน้มที่จะกระตุ้นการตอบสนองต่ำและบางครั้งได้รับคำที่มีแนวโน้มที่จะกระตุ้นการตอบสนองสูง

หัวเรื่องสุ่ม, คำที่แก้ไข: 4 การทดลองจำลอง

subs_random

โปรดสังเกตที่นี่ว่าในการทดลองทั้ง 4 แบบจำลองหัวเรื่องจะแตกต่างกันทุกครั้ง แต่โปรไฟล์การตอบสนองของคำจะมีลักษณะเหมือนกันโดยสอดคล้องกับสมมติฐานที่ว่าเรากำลังนำชุดคำศัพท์เดิมมาใช้สำหรับการทดลองทุกครั้งภายใต้โมเดลนี้

ตัวเลือกของเราไม่ว่าเราจะคิดว่าแบบจำลอง 1 (หัวเรื่องและคำทั้งแบบสุ่ม) หรือแบบจำลอง 2 (แบบสุ่มเรื่อง, คำที่แก้ไข) ให้ชั้นอ้างอิงที่เหมาะสมสำหรับผลการทดลองที่เราสังเกตเห็นจริง ๆ แล้วสามารถสร้างความแตกต่างอย่างมาก "ทำงาน." เราคาดหวังความผันแปรของโอกาสในข้อมูลภายใต้โมเดล 1 มากกว่าภายใต้โมเดล 2 เนื่องจากมี "ชิ้นส่วนเคลื่อนไหว" ดังนั้นหากข้อสรุปที่เราต้องการวาดมีความสอดคล้องกับสมมติฐานของโมเดล 1 มากขึ้นซึ่งความแปรปรวนของโอกาสจะค่อนข้างสูงกว่า แต่เราวิเคราะห์ข้อมูลของเราภายใต้สมมติฐานของโมเดล 2 ซึ่งความแปรปรวนของโอกาสต่ำกว่าดังนั้นข้อผิดพลาดประเภท 1 ของเรา อัตราสำหรับการทดสอบความแตกต่างของเงื่อนไขจะสูงขึ้นถึงระดับ (อาจค่อนข้างใหญ่) สำหรับข้อมูลเพิ่มเติมดูการอ้างอิงด้านล่าง

อ้างอิง

Baayen, RH, Davidson, DJ, & Bates, DM (2008) การสร้างแบบผสมเอฟเฟ็กต์พร้อมเอฟเฟกต์แบบข้ามสำหรับวัตถุและรายการ วารสารของหน่วยความจำและภาษา, 59 (4), 390-412 รูปแบบไฟล์ PDF

Barr, DJ, Levy, R. , Scheepers, C. , & Tily, HJ (2013) โครงสร้างเอฟเฟ็กต์แบบสุ่มสำหรับการทดสอบสมมติฐานยืนยัน: เก็บได้สูงสุด วารสารหน่วยความจำและภาษา, 68 (3), 255-278 รูปแบบไฟล์ PDF

คลาร์ก HH (2516) การเข้าใจผิดของภาษาเป็นผลคงที่: บทวิจารณ์ของสถิติภาษาในการวิจัยทางจิตวิทยา วารสารการเรียนรู้ด้วยวาจาและพฤติกรรมทางวาจา, 12 (4), 335-359 รูปแบบไฟล์ PDF

Coleman, EB (1964) การสรุปประชากรกลุ่มภาษา รายงานทางจิตวิทยา, 14 (1), 219-226

Judd, CM, Westfall, J. , & Kenny, DA (2012) การรักษาสิ่งเร้าเป็นปัจจัยสุ่มในจิตวิทยาสังคม: วิธีการใหม่และครอบคลุมในการแก้ปัญหาที่แพร่หลาย แต่ไม่สนใจส่วนใหญ่ วารสารบุคลิกภาพและจิตวิทยาสังคม 103 (1) หน้า 54 PDF

Murayama, K. , Sakaki, M. , Yan, VX, & Smith, GM (2014) อัตราความผิดพลาด Type I ในการวิเคราะห์แบบดั้งเดิมโดยผู้เข้าร่วมเพื่อความแม่นยำของ Metamemory: มุมมองตัวแบบผลผสมแบบทั่วไป วารสารจิตวิทยาการทดลอง: การเรียนรู้ความจำและความรู้ความเข้าใจ รูปแบบไฟล์ PDF

Pinheiro, JC, & Bates, DM (2000) โมเดลผสมเอฟเฟกต์ใน S และ S-PLUS สปริงเกอร์

Raaijmakers, JG, Schrijnemakers, J. , & Gremmen, F. (1999) วิธีจัดการกับ“ การเข้าใจผิดแบบผลกระทบต่อภาษา”: ความเข้าใจผิดที่พบบ่อยและการแก้ปัญหาทางเลือก วารสารหน่วยความจำและภาษา, 41 (3), 416-426 รูปแบบไฟล์ PDF


1
+1 นี่เป็นคำตอบที่ยอดเยี่ยมและกระดาษ 2012 ของคุณนั้นยอดเยี่ยมมาก
อะมีบากล่าวว่า Reinstate Monica

เนื่องจากคำถามเดิมเชื่อมโยงกับการสนทนาที่ยอดเยี่ยมที่ได้รับในเรื่องนี้ - คุณหมายถึงอะไรกันแน่?
James

1
ลิงก์ Gelman
Jake Westfall

@ James ฉันไปข้างหน้าและเพิ่มเนื้อหาแนวความคิดเพิ่มเติมบางอย่างรวมถึงรูปภาพ แจ้งให้เราทราบสิ่งที่คุณคิด.
Jake Westfall

ขอบคุณสำหรับรูปภาพ ตามย่อหน้าสุดท้ายของคุณเอฟเฟกต์เพิ่มเติมในแบบจำลองจะถูกระบุว่าเป็นแบบสุ่มยิ่งค่า p สำหรับค่าเอฟเฟกต์คงที่ที่สูงขึ้น อย่างไรก็ตามสำหรับรุ่นเพิ่มเติมดูเหมือนว่าเมื่อวิธีการ "เริ่มต้น" ถูกนำมาใช้ใน PROC MIXED แล้วค่า p สำหรับผลคงที่จะเหมือนกัน ตัวอย่างหนึ่งที่เจาะจงคือคำถามนี้: stats.stackexchange.com/q/112640/54099คุณจะอธิบายได้อย่างไร
James

1

สมมติว่าฉันมีกระบวนการผลิตที่เกี่ยวข้องกับการทำวัสดุบนเครื่องที่แตกต่างกัน พวกเขาเป็นเครื่องเดียวที่ฉันมี "เครื่องจักร" เป็นเอฟเฟกต์คงที่ แต่ฉันทำวัสดุจำนวนมากในแต่ละเครื่องและฉันสนใจที่จะทำนายสิ่งต่าง ๆ เกี่ยวกับล็อตในอนาคต ฉันจะทำให้ "Lot number" เป็นปัจจัยแบบสุ่มเพราะฉันสนใจในผลลัพธ์ที่ฉันจะได้รับมากมายในอนาคต


1
เอมิลที่รัก: ฉันกลัวว่าคุณจะไม่เข้าใจคำถามที่ฉันถาม ตัวอย่างของคุณแสดงคำจำกัดความที่พบบ่อยที่สุดของ "fixed vs random" ที่ฉันให้ไว้ในคำถามของฉัน อย่างไรก็ตามโดยใช้ตัวอย่างของคุณคุณสามารถบอกฉันได้ไหมว่าทำไมจึงเป็นความคิดที่ดีที่จะอนุมานเกี่ยวกับการตอบสนองในอนาคตจากโมเดลที่มีหมายเลขล็อตคงที่
James

หากคุณปฏิบัติต่อ "หมายเลขล็อต" ตามที่ได้รับการแก้ไขข้อสรุปของคุณจะใช้กับล็อตที่คุณได้ทำการทดสอบแล้วเท่านั้น ในสถานการณ์อื่น ๆ สิ่งเดียวกันก็เกิดขึ้นเช่นกัน หากคุณต้องการทำการอนุมานเกี่ยวกับเอฟเฟกต์แบบสุ่มการปฏิบัติต่อเอฟเฟกต์แบบคงที่จะให้คำตอบที่ผิด ในสถานการณ์แบบผสมหลายแบบการใช้เอฟเฟกต์แบบสุ่มเป็นเอฟเฟกต์คงที่จะให้คำตอบที่ไม่ถูกต้องเกี่ยวกับเอฟเฟกต์ที่ได้รับการแก้ไขจริง
Emil Friedman

มันไม่ใช่เรื่องของการกลับหัวเมื่อเทียบกับข้อเสีย หากทำการวิเคราะห์ที่ไม่เหมาะสมผลลัพธ์มักจะไม่ถูกต้อง
Emil Friedman

คุณสามารถให้ข้อมูลอ้างอิงสำหรับการศึกษาแบบจำลองที่แสดงให้เห็นว่าผลลัพธ์นั้นไม่ถูกต้องหรือไม่ขึ้นอยู่กับฉลากแบบคงที่ / แบบสุ่ม?
James

โปรดทราบด้วยว่า MLE ไม่ได้มาโดยไม่เสียค่าใช้จ่ายโดยเฉพาะอย่างยิ่งเมื่อมีส่วนประกอบความแปรปรวนอยู่ พยายามตั้งค่าการออกแบบแบบตัดขวางพร้อมปัจจัย 3 ประการและผู้ร่วมทุนอีกสองคน จากนั้นลองประเมินรุ่นถาวรที่บริสุทธิ์และข้อมูลจำเพาะแบบผสมไม่กี่อย่าง ตราบใดที่มีส่วนประกอบแบบสุ่มที่ทำให้สวิตช์จาก OLS เป็น MLE / REML ปัญหาเกี่ยวกับการบรรจบกันการรับส่วนประกอบความแปรปรวนเป็นศูนย์หรือลบหรือผลลัพธ์ที่ไม่มีความหมายอื่น ๆ
James

1

ดังนั้นคุณถือว่าพวกมันเป็นแบบสุ่มเพื่อให้มีผลเฉลี่ยระหว่างค่าเฉลี่ยโดยรวมกับค่าเฉลี่ยสำหรับปัจจัยเฉพาะนั้นตามขนาดตัวอย่างของปัจจัยและจำนวนการสังเกตโดยรวม สิ่งนี้ช่วยให้คุณสามารถบอกได้ว่าผลลัพธ์ของคุณใช้กับประชากรจำนวนมากเนื่องจากคุณมีค่าเฉลี่ยถ่วงน้ำหนักประเภทหนึ่งและการประมาณค่าความแปรปรวนเนื่องจากปัจจัยนั้นหากไม่ใช่คุณสามารถบอกได้ว่าผลลัพธ์ของคุณใช้กับระดับปัจจัยเท่านั้น คุณใช้ตั้งแต่การถดถอยจะถือว่าพวกเขาเป็นปัจจัยที่ไม่ต่อเนื่องและไม่สุ่มคนที่ได้รับค่าเฉลี่ยถ่วงน้ำหนัก

อีกทั้งยังมีประโยชน์เมื่อคุณใช้มาตรการซ้ำในเรื่องเดียวกันเนื่องจากคุณสามารถใช้มาตรการเหล่านี้เพื่ออธิบายความสัมพันธ์ระหว่างการวัดในหัวข้อเดียวกัน


สำหรับ RM นั่นเป็นหนึ่งในเหตุผลที่ฉันถามคำถามตั้งแต่แรก ดังที่ฉันได้กล่าวถึงที่นี่: stats.stackexchange.com/q/112640/54099การรักษาหัวเรื่องเป็นแบบคงที่หรือสุ่มไม่เปลี่ยนค่า p ของค่าการรักษาดังนั้นทำไมต้องกังวล
James

หากคุณมีการออกแบบไขว้อย่างง่ายที่มีปัจจัยหนึ่งคงที่และสุ่มหนึ่งตัวและใช้ค่าเฉลี่ยกำลังสองที่คาดหวังค่า p สำหรับปัจจัยคงที่จะแตกต่างจากสิ่งที่คุณจะได้รับหากคุณปฏิบัติต่อทั้งสองแบบคงที่
Emil Friedman

1

Yij=β1Xij+β2Zi+ei+μijXijZiβ2Zii ,Ziเป็น collinear กับพวกเขา ดังนั้นหากเราใช้ตัวประมาณค่าผลกระทบคงที่ในสถานการณ์นี้เราจะเพิกเฉยต่อข้อมูลที่สำคัญที่อาจเกิดขึ้น

Yij=β1Xij+ei+μijZiเรายังอาจต้องการที่จะใช้ผลการสุ่มสำหรับเหตุผลไม่กี่แม้จะมีปัญหาที่อาจมาพร้อมกับพวกเขา บางรายการอยู่ในคำถามของคุณ

β1β1ในทางทฤษฎีส่งผลให้เกิดข้อผิดพลาดมาตรฐานขนาดเล็ก


(คำตอบเดิม)

ที่เดียวที่คุณจำเป็นต้องใช้เอฟเฟกต์แบบสุ่มคือเมื่อคุณต้องการรวมพารามิเตอร์ที่ไม่เปลี่ยนแปลงในระดับการจัดกลุ่มของเอฟเฟกต์คงที่

ตัวอย่างเช่นสมมติว่าคุณต้องการตรวจสอบผลกระทบของลักษณะของแพทย์ (เช่น / การศึกษา) ต่อผลลัพธ์ของผู้ป่วย ชุดข้อมูลเป็นระดับผู้ป่วยที่มีผลลัพธ์ของผู้ป่วยที่สังเกตและลักษณะผู้ป่วย / แพทย์ เนื่องจากผู้ป่วยที่ได้รับการรักษาโดยแพทย์เดี่ยวมีความสัมพันธ์กันคุณต้องการควบคุมสิ่งนี้ คุณสามารถแทรกเอฟเฟกต์คงที่ที่นี่ได้ แต่ในการทำเช่นนั้นคุณห้ามรวมถึงลักษณะของแพทย์ใด ๆ ในโมเดล ซึ่งเป็นปัญหาหากความสนใจอยู่ในระดับแพทย์


คุณสามารถให้รูปแบบงบบางอย่าง?
James

0

ฉันคิดว่ามันเกี่ยวข้องกับความสอดคล้องของการประมาณการ

สมมติว่า xผมJ=aผม+J+อี ที่ไหน aผม ย่อมาจากผลคงที่ (เงื่อนไขการทดลองบางอย่าง)

และ J ย่อมาจากผลแบบสุ่ม (อาจคน)

Neyman และ Scott (1948) ชี้ให้เห็นปัญหาของความมั่นคงของ

การประมาณความน่าจะเป็นสูงสุดของ aผม และ J.

ถ้าเราใช้ aผม และ J ในฐานะที่เป็นผลกระทบคงที่ทั้งสองประมาณการไม่ได้อีกต่อไป

คงเส้นคงวา อย่างน้อยนั่นคือสิ่งที่ฉันเข้าใจ ...

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.