อะไรคือความแตกต่างระหว่างเอฟเฟกต์แบบสุ่ม - เอฟเฟกต์คงที่และโมเดลร่อแร่


49

ฉันพยายามขยายความรู้ด้านสถิติ ฉันมาจากพื้นหลังวิทยาศาสตร์กายภาพด้วย "สูตรตาม" วิธีการทดสอบทางสถิติที่เราบอกว่ามันเป็นอย่างต่อเนื่องมันกระจายตามปกติ - OLS ถดถอย

ในการอ่านของฉันฉันได้เจอคำศัพท์: แบบจำลองลักษณะพิเศษแบบจำลองลักษณะพิเศษแบบคงที่แบบจำลองระยะขอบ คำถามของฉันคือ:

  • ในแง่ง่ายมากพวกเขาคืออะไร
  • ความแตกต่างระหว่างพวกเขาคืออะไร?
  • มีความหมายเหมือนกันบ้างไหม?
  • การทดสอบแบบดั้งเดิมเช่นการถดถอยแบบ OLS, ANOVA และ ANCOVA อยู่ในประเภทใด

เพียงแค่พยายามตัดสินใจว่าจะไปเรียนต่อที่ไหนด้วยตนเอง



1
@ gung: คำตอบที่คุณจะมอบรางวัลให้จริง ๆ แล้วเกินคำตอบทั้งหมดในเธรด "main" ในความแตกต่างระหว่างเอฟเฟกต์คงที่ / สุ่ม (ลิงก์ในความคิดเห็นด้านบน) คำถามนั้นมีมากกว่า 40 upvotes และคำตอบที่ได้รับการยอมรับกับ 25 upvotes ซึ่งน่าเสียดายที่ไม่เป็นประโยชน์ เราควรจะรวมกระทู้เหล่านี้หรือไม่ ฉันเดาว่านี่จะหมายความว่า OP N26 จะสูญเสียคำถาม upvote แต่ดูเหมือนว่าบัญชีของพวกเขาจะไม่ทำงานอีกต่อไป ไม่แน่ใจว่าเป็นแนวทางปฏิบัติที่ดีที่สุด
อะมีบาพูดว่า Reinstate Monica

1
ขอบคุณ @amoeba ฉันคิดว่าสิ่งนี้สมควรได้รับความสนใจมากกว่าเช่นกัน สำหรับฉันแล้วคำถามนั้นในขณะที่ชื่อคล้าย ๆ กันนั้นแตกต่างออกไปเล็กน้อย (& อาจมีชื่อผิด) ฉันไม่มีสิทธิ์ในการรวมสิ่งเหล่านี้ ฉันเพิ่งเพิ่มความคิดเห็นที่นั่นลิงก์ไปยังกระทู้นี้ ทำไมไม่ถามคำถามว่าจะทำอย่างไรกับหัวข้อเหล่านี้ใน meta.CV และเราจะเห็นว่าคนอื่นคิดอย่างไร
gung - Reinstate Monica

คำตอบ:


53

คำถามนี้ถูกกล่าวถึงบางส่วนในไซต์นี้ดังต่อไปนี้และความคิดเห็นต่างๆ

โดยทั่วไปคำศัพท์ทั้งหมดเกี่ยวข้องกับข้อมูลตามยาว / พาเนล / คลัสเตอร์ / ข้อมูลลำดับชั้นและมาตรการซ้ำ ๆ (ในรูปแบบของการถดถอยขั้นสูงและ ANOVA) แต่มีความหมายหลายอย่างในบริบทที่แตกต่างกัน ฉันต้องการตอบคำถามในสูตรตามความรู้ของฉัน

รูปแบบผลกระทบคงที่

  • ในชีวสถิติผลคงที่แสดงเป็นในสมการ (*) ด้านล่างซึ่งมักจะมาพร้อมกับเอฟเฟกต์แบบสุ่ม แต่รูปแบบผลกระทบคงที่ยังถูกกำหนดให้ถือว่าการสังเกตมีความเป็นอิสระเช่นการตั้งค่าแบบตัดขวางเช่นเดียวกับในการวิเคราะห์ข้อมูลตามยาวของ Hedeker และชะนี (2006)β
  • ในเศรษฐมิติโมเดลผลกระทบคงที่สามารถเขียนเป็น โดยที่ได้รับการแก้ไข (ไม่ใช่แบบสุ่ม) สกัดกั้นสำหรับแต่ละวิชา ( ) หรือเราสามารถมีเอฟเฟกต์คงที่ในฐานะสำหรับการวัดซ้ำแต่ละครั้ง ( ); หมายถึง covariates
    yij=xijβ+ui+ϵij
    uiiujjxij
  • ในการวิเคราะห์อภิมานแบบจำลองผลกระทบคงที่ถือว่าผลกระทบพื้นฐานเหมือนกันในทุกการศึกษา (เช่น Mantel และ Haenszel, 1959)

แบบจำลองผลกระทบแบบสุ่ม

  • ในชีวสถิติแบบจำลองเอฟเฟกต์สุ่ม (Laird and Ware, 1982) สามารถเขียนเป็น โดยที่จะถือว่าเป็นไปตามการแจกแจง แสดงถึง covariates สำหรับเอฟเฟกต์คงที่และแสดงถึง covariates สำหรับเอฟเฟกต์แบบสุ่ม
    (*)yij=xijβ+zijui+eij
    uixijzij
  • ในเศรษฐมิติโมเดลสุ่มเอฟเฟกต์อาจอ้างถึงโมเดลการสกัดกั้นแบบสุ่มเช่นเดียวกับชีวสถิติเช่นและเป็นสเกลาร์zij=1ui
  • ในการวิเคราะห์อภิมานแบบจำลองผลกระทบแบบสุ่มถือว่าผลต่างกันในการศึกษา (DerSimonian และ Laird, 1986)

ขอบแบบจำลอง

แบบจำลองโดยทั่วไปจะถูกเปรียบเทียบกับแบบจำลองแบบมีเงื่อนไข (แบบจำลองผลกระทบแบบสุ่ม) และอดีตมุ่งเน้นไปที่ค่าเฉลี่ยประชากร (ใช้แบบจำลองเชิงเส้นเป็นต้น)ในขณะที่หลังเกี่ยวข้องกับค่าเฉลี่ยตามเงื่อนไขการตีความและขนาดของสัมประสิทธิ์การถดถอยระหว่างตัวแบบขอบและตัวแบบสุ่มผลกระทบจะแตกต่างกันสำหรับตัวแบบที่ไม่ใช่เชิงเส้น (เช่นการถดถอยแบบโลจิสติก) ให้จากนั้น

E(yij)=xijβ,
E(yij|ui)=xijβ+zijui.
h(E(yij|ui))=xijβ+zijui
E(yij)=E(E(yij|ui))=E(h1(xijβ+zijui))h1(xijβ),
เว้นแต่ฟังก์ชันลิงก์คือการเชื่อมโยงข้อมูลเฉพาะตัว ) หรือ (ไม่มีเอฟเฟกต์แบบสุ่ม) ตัวอย่างที่ดี ได้แก่ สมการการประมาณแบบทั่วไป (GEE; Zeger, Liang and Albert, 1988) และโมเดลหลายระดับแบบชายขอบ (Heagerty and Zeger, 2000)hui=0

ขอบคุณ Randel อีกหนึ่งคำถามเกี่ยวกับคำศัพท์ "แบบผสม" เท่าที่ฉันเข้าใจในชีวสถิติสมการของคุณ (*) จะเรียกว่าแบบผสมเพราะมันมีทั้งแบบสุ่มและแบบคงที่ ถูกต้องหรือไม่ แต่คำว่า "แบบผสม" ยังใช้ในเศรษฐมิติด้วยหรือไม่ ถ้าเป็นเช่นนั้นมันหมายถึงอะไร?
อะมีบาพูดว่า Reinstate Monica

ใช่สมการ (*) เรียกอีกอย่างว่าแบบผสมในสถิติ (ชีวภาพ) เท่าที่ฉันรู้นักเศรษฐศาสตร์ไม่อาจเรียกมันว่า "แบบจำลองผสม" แต่ "แบบจำลองผลกระทบแบบสุ่ม" หรือ "แบบจำลองสัมประสิทธิ์แบบสุ่ม" หากพวกเขามีความสนใจในความหลากหลายของคลัสเตอร์ สำหรับฉันความแตกต่างเพียงอย่างเดียวคือการสันนิษฐานสำหรับเอฟเฟกต์ของคลัสเตอร์แบบคงที่หรือแบบสุ่ม
Randel

1
@skanหมายถึง covariates สำหรับเอฟเฟกต์แบบสุ่ม มันเป็นเวกเตอร์และเป็นทรานสโพส zijzij
Randel.

1
นี่คือตัวอย่างโดยละเอียด หวังว่ามันจะช่วย @skan
Randel

1
@skan ไม่แนะนำให้มีทั้งสองอย่างเพียงพอ นี่คือตัวอย่างที่สมบูรณ์แบบ
Randel

1

แก้ไขฉันถ้าฉันผิดที่นี่:

แนวคิดมีสี่ผลกระทบที่เป็นไปได้: การสกัดกั้นคงที่, สัมประสิทธิ์คงที่, สกัดกั้นแบบสุ่ม, สัมประสิทธิ์แบบสุ่ม แบบจำลองการถดถอยส่วนใหญ่เป็น 'เอฟเฟ็กต์แบบสุ่ม' ดังนั้นพวกเขาจึงมีการสกัดแบบสุ่มและค่าสัมประสิทธิ์แบบสุ่ม คำว่า 'เอฟเฟ็กต์แบบสุ่ม' มีการใช้งานตรงกันข้ามกับ 'เอฟเฟกต์คงที่'

'ลักษณะพิเศษตายตัว' คือเมื่อตัวแปรมีผลต่อตัวอย่างบางส่วน แต่ไม่ใช่ทั้งหมด รุ่นที่ง่ายที่สุดของโมเดลเอฟเฟกต์คงที่ (แนวคิด) จะเป็นตัวแปรจำลองสำหรับเอฟเฟกต์คงที่ที่มีค่าไบนารี แบบจำลองเหล่านี้มีการสกัดกั้นแบบสุ่มเดียวสัมประสิทธิ์ผลคงที่และสัมประสิทธิ์ตัวแปรแบบสุ่ม

ชั้นที่สองของภาวะแทรกซ้อน (ตามแนวคิด) คือเมื่อเอฟเฟกต์คงที่ไม่ใช่ไบนารี แต่เป็นค่าเล็กน้อยที่มีค่ามากมาย ในกรณีนี้สิ่งที่สร้างขึ้นคือแบบจำลองที่มีจุดตัดหลายจุด (หนึ่งค่าสำหรับแต่ละค่าเล็กน้อย) นี่คือที่ที่คุณจะได้รับ 'หลายบรรทัด' ของโมเดลข้อมูลพาเนลคลาสสิกที่ 'ตัวเลือก' ของตัวแปรเอฟเฟกต์คงที่แต่ละตัวจะได้รับเอฟเฟกต์ของตัวเอง ข้อดีของการโยนชุดข้อมูลเฉพาะปัจจัยที่แตกต่างกันทั้งหมดลงในการถดถอยครั้งเดียว (แทนที่จะทำแต่ละปัจจัยของผลกระทบคงที่ในฐานะการถดถอยของตัวเอง) คือการที่คุณจะรวมความแปรปรวนของผลต่าง ๆ ทั้งหมดในสมการเดียว รับค่าดีขึ้น (แน่นอนยิ่งขึ้น) สำหรับค่าสัมประสิทธิ์ทั้งหมดของคุณ

'ระดับที่สาม' ของความซับซ้อนจะเกิดขึ้นเมื่อ 'เอฟเฟกต์คงที่' เป็นตัวแปรสุ่มยกเว้นว่าเอฟเฟกต์นั้นจะ 'คงที่' ที่จะส่งผลต่อชุดย่อยของตัวอย่างเท่านั้น ณ จุดนี้โมเดลจะมีจุดตัดแบบสุ่มจุดตัดหลายจุดคงที่และตัวแปรสุ่มหลายจุด ฉันคิดว่านี่คือสิ่งที่เรียกว่าแบบจำลอง 'เอฟเฟ็กต์ผสม'?

'เอฟเฟ็กต์แบบผสม' ใช้สำหรับการสร้างแบบจำลองหลายระดับ (MLM) เนื่องจากสามารถใช้ 'เอฟเฟ็กต์คงที่' เพื่อทำรังข้อมูลย่อยหนึ่งชุดภายในอีกชุดหนึ่ง การจัดกลุ่มนี้สามารถมีหลายระดับโดยมีนักเรียนซ้อนอยู่ในห้องเรียนซ้อนกันภายในโรงเรียน โรงเรียนเป็นผลกระทบคงที่ในห้องเรียนและห้องเรียนกับนักเรียน (โรงเรียนอาจมีหรือไม่มีผลกับนักเรียนขึ้นอยู่กับการออกแบบการทดลอง - ไม่แน่ใจ)

โมเดลข้อมูลพาเนลคือโมเดล 'เอฟเฟ็กต์แบบผสม' แต่ใช้สองมิติสำหรับการจัดกลุ่มโดยทั่วไปเวลาและหมวดหมู่บางประเภท


ไม่แน่ใจว่าคุณหมายถึงอะไรโดย "เอฟเฟกต์คงที่ครอบคลุม 'ชุด' ตัวเลือก: A หรือ B; ... เอฟเฟกต์แบบสุ่มรวมถึงสิ่งต่าง ๆ เช่นน้ำหนักตัว" คุณหมายถึงเอฟเฟกต์คงที่สำหรับตัวแปรที่ไม่ต่อเนื่องเอฟเฟกต์แบบสุ่มสำหรับตัวแปรต่อเนื่องหรือไม่ ยังไม่แน่ใจว่าทำไม "การใช้ตัวแปรจำลองหลายตัวสำหรับสิ่งเดียวกันนั้นไม่เหมาะสมทางสถิติ" โมเดลเอฟเฟ็กต์คงที่ในเศรษฐมิติมีตัวแปรจำลองสำหรับแต่ละ "พาเนล" ฉันไม่เห็นด้วยกับนางแบบ "ผสม" ... หากมีการดักจับ 'คงที่' โดยการจัดกลุ่มพวกเขาจะไม่ดักจับแบบสุ่มอีกต่อไป " โมเดลเอฟเฟ็กต์แบบผสมหลายแบบมีการสกัดกั้นแบบสุ่ม
Randel

ความเข้าใจของฉันไม่สมบูรณ์ ฉันจะแก้ไขคำตอบของฉันแล้วลองอีกครั้ง
Mox

เป็นไปได้หรือไม่ที่ตัวแปรจะปรากฎพร้อมกันเป็นเอฟเฟกต์คงที่และเอฟเฟกต์แบบสุ่ม?
skan

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.