แนวคิดเบื้องหลังโมเดลเอฟเฟกต์แบบคงที่ / แบบสุ่ม


14
  1. ใครสามารถช่วยฉันเข้าใจโมเดลเอฟเฟกต์แบบสุ่มและแบบคงที่ได้หรือไม่? คุณอาจอธิบายด้วยวิธีของคุณเองหากคุณได้แยกย่อยแนวคิดเหล่านี้หรือนำฉันไปยังแหล่งข้อมูล (หนังสือโน้ตเว็บไซต์) ด้วยที่อยู่เฉพาะ (หมายเลขหน้าบทที่ ฯลฯ ) เพื่อให้ฉันสามารถเรียนรู้ได้โดยไม่มีความสับสน
  2. นี่เป็นความจริงหรือไม่: "เรามีผลกระทบคงที่โดยทั่วไปและผลกระทบแบบสุ่มเป็นกรณีเฉพาะ" โดยเฉพาะอย่างยิ่งฉันจะขอบคุณเป็นอย่างยิ่งที่จะได้รับความช่วยเหลือเมื่อคำอธิบายเปลี่ยนไปจากรุ่นทั่วไปไปยังรุ่นที่เฉพาะเจาะจงที่มีเอฟเฟกต์แบบคงที่และแบบสุ่ม

2
สนใจเป็นไปได้: stats.stackexchange.com/questions/4700/…
ocram

ดูอ้างอิงหนังสือบนแท็กผสมรูปแบบ หมายเลข 1 ได้รับการกล่าวถึงในบทแนะนำ (บางส่วน) สำหรับหนังสือการสร้างแบบจำลองหลายระดับทั้งหมดที่ฉันได้อ่าน
Andy W

คำตอบ:


13

นี่เป็นคำถามที่ดีมากเมื่อสัมผัสกับศัพท์เฉพาะทางเศรษฐศาสตร์ที่รบกวนนักเรียนเมื่อเปลี่ยนมาใช้วรรณคดีเชิงสถิติ (หนังสือครู ฯลฯ ) ฉันขอแนะนำให้คุณhttp://www.amazon.com/Econometric-Analysis-Cross-Section-Panel/dp/0262232197 บทที่ 10

สมมติว่าตัวแปรที่คุณสนใจเป็นที่สังเกตในสองมิติ (เช่นบุคคลและเวลา) ขึ้นอยู่กับลักษณะที่สังเกตx ฉันทีและคนที่ไม่มีใครสังเกตU ฉันที หากY ฉันทีมีค่าจ้างที่สังเกตแล้วเราอาจโต้แย้งว่ามันถูกกำหนดโดยสังเกต (การศึกษา) และทักษะการสังเกต (ความสามารถพิเศษอื่น ๆ ) แต่เป็นที่ชัดเจนว่าทักษะที่ไม่ได้สังเกตอาจมีความสัมพันธ์กับระดับการศึกษา ดังนั้นนั่นนำไปสู่การสลายตัวของข้อผิดพลาด: u i t = e i t + v i โดยที่v iyitxituityituit=eit+viviเป็นองค์ประกอบข้อผิดพลาด (สุ่ม) ที่เราอาจสันนิษฐานว่ามีความสัมพันธ์กับของ เช่นv ฉันจำลองแบบทักษะที่ไม่ได้ตั้งใจของแต่ละคนเป็นองค์ประกอบส่วนบุคคลแบบสุ่มxvi

ดังนั้นรูปแบบจะกลายเป็น:

yit=jθjxj+eit+vi

รูปแบบนี้มักจะถูกระบุว่าเป็นรูปแบบ FE แต่เป็น Wooldridge ระบุว่ามันจะฉลาดที่จะเรียกว่ารุ่น RE กับองค์ประกอบข้อผิดพลาดมีความสัมพันธ์ในขณะที่ถ้าไม่มีความสัมพันธ์กับx ' sมันจะกลายเป็นรูปแบบอีกครั้ง ดังนั้นคำตอบนี้คำถามที่สองของคุณการตั้งค่า FE เป็นทั่วไปมากขึ้นในขณะที่มันช่วยให้ความสัมพันธ์ระหว่างวีฉันและx ' svixsvixs

หนังสือเก่าในสาขาเศรษฐศาสตร์มีแนวโน้มที่จะอ้างถึง FE กับแบบจำลองที่มีค่าคงที่เฉพาะของแต่ละบุคคลโชคไม่ดีที่นี่ยังคงปรากฏอยู่ในวรรณคดีทุกวันนี้ (ฉันเดาว่าในสถิติที่พวกเขาไม่เคยมี )


ขอบคุณสำหรับลิงก์ไปยัง (1) ทรัพยากรที่ยอดเยี่ยมและ (2) คำอธิบายที่ดี
Stat-R

1
นี่เป็นวิธีที่แตกต่างในการอธิบายแนวคิดเหล่านี้มากกว่าที่ฉันเคยเห็น แต่ก็ทำได้ดีมาก +1
gung - Reinstate Monica

15

ตัวอย่างที่ดีที่สุดของฉันของผลแบบสุ่มในรูปแบบมาจากการศึกษาทดลองทางคลินิก ในการทดลองทางคลินิกเราลงทะเบียนผู้ป่วยจากโรงพยาบาลต่างๆ (เรียกว่าไซต์) ไซต์ถูกเลือกจากไซต์ที่มีศักยภาพจำนวนมาก อาจมีปัจจัยที่เกี่ยวข้องกับเว็บไซต์ที่มีผลต่อการตอบสนองต่อการรักษา ดังนั้นในโมเดลเชิงเส้นคุณมักต้องการรวมไซต์เป็นเอฟเฟกต์หลัก

แต่มันเหมาะสมที่จะมีเว็บไซต์เป็นผลคงที่? โดยทั่วไปเราไม่ทำเช่นนั้น เรามักจะนึกถึงเว็บไซต์ที่เราเลือกสำหรับการทดลองเป็นตัวอย่างแบบสุ่มจากเว็บไซต์ที่เราสามารถเลือกได้ อาจไม่เป็นเช่นนั้น แต่อาจเป็นข้อสันนิษฐานที่สมเหตุสมผลมากกว่าการสมมติว่าผลกระทบของไซต์ได้รับการแก้ไข ดังนั้นการดูแลไซต์เป็นเอฟเฟกต์แบบสุ่มทำให้เราสามารถรวมความแปรปรวนในเอฟเฟกต์ไซต์ที่เกิดจากการเลือกชุดไซต์ k จากประชากรที่มีไซต์ N

แนวคิดทั่วไปคือกลุ่มไม่ได้รับการแก้ไข แต่ถูกเลือกจากประชากรที่มีขนาดใหญ่ขึ้นและตัวเลือกอื่น ๆ สำหรับกลุ่มเป็นไปได้และอาจนำไปสู่ผลลัพธ์ที่แตกต่างกัน ดังนั้นให้ถือว่าเป็นเอฟเฟกต์แบบสุ่มซึ่งรวมความแปรปรวนประเภทนั้นไว้ในโมเดลที่คุณจะไม่ได้รับจากเอฟเฟกต์คงที่


การอ้างอิง @ocram ค่อนข้างน่าสนใจ มันชี้ให้เห็นถึงความแตกต่างเกี่ยวกับคำจำกัดความของ FE แต่ความหมายของ Stat-R หมายถึงอะไร? คำถามที่สองของเขาแสดงให้เห็นว่า FE ถือเป็น RE ด้วยองค์ประกอบที่มีความสัมพันธ์แบบสุ่ม ภายใต้คำจำกัดความดังกล่าวและในตัวอย่างของคุณ FE จะหมายความว่าการรักษาอาจมีความสัมพันธ์กับเอฟเฟกต์ไซต์ที่ไม่ได้รับการสังเกต
JDav

2
ดี - ย่อหน้าสุดท้ายของคุณเป็นวิธีที่สั้นมากในการวาง +1
ลุค

1
@MichaelChernick: ตัวอย่างที่ดี ดังนั้นคุณยืนยันว่าเว็บไซต์โรงพยาบาลควรได้รับการสุ่มและไม่เป็นผลคงที่ แต่อะไรคือความแตกต่างที่เกิดขึ้นจริงระหว่างผลลัพธ์ของตัวเลือกทั้งสองนี้ หากเรารักษามันให้คงที่เราจะได้ค่าสัมประสิทธิ์การถดถอยสำหรับแต่ละโรงพยาบาลและสามารถทดสอบได้เช่นถ้าผลกระทบหลักของโรงพยาบาลมีนัยสำคัญ หากเราถือว่าเป็นแบบสุ่มเราจะไม่ได้รับค่าสัมประสิทธิ์การถดถอยสำหรับแต่ละโรงพยาบาล (ถูกต้อง?); เรายังสามารถทดสอบผลกระทบหลักของโรงพยาบาลได้หรือไม่? ที่สำคัญกว่านั้นคืออาจเพิ่ม / ลดพลังของเอฟเฟกต์หลัก / การโต้ตอบอื่น ๆ ในโมเดลหรือไม่?
อะมีบาพูดว่า Reinstate Monica

12
  1. ไม่แน่ใจเกี่ยวกับหนังสือ แต่นี่เป็นตัวอย่าง สมมติว่าเรามีตัวอย่างน้ำหนักแรกเกิดจากเด็กกลุ่มใหญ่ในช่วงระยะเวลานาน น้ำหนักของทารกที่เกิดกับผู้หญิงคนเดียวกันจะมีความคล้ายคลึงกันมากกว่าน้ำหนักของทารกที่เกิดจากมารดาที่แตกต่างกัน เด็กชายก็หนักกว่าเด็กผู้หญิง

ดังนั้นรูปแบบเอฟเฟกต์คงที่โดยไม่สนใจความสัมพันธ์ในน้ำหนักระหว่างทารกที่เกิดกับแม่คนเดียวกันคือ:

รุ่นที่ 1 หมายถึงน้ำหนักแรกเกิด = การสกัดกั้น + เพศ

รูปแบบเอฟเฟกต์คงที่อีกตัวหนึ่งที่ปรับให้สัมพันธ์กันคือ:

รุ่นที่ 2 หมายถึงน้ำหนักแรกเกิด = การสกัดกั้น + เพศ + mother_id

อย่างไรก็ตามประการแรกเราอาจไม่สนใจผลกระทบสำหรับแม่แต่ละคนโดยเฉพาะ นอกจากนี้เรายังถือว่าแม่เป็นแม่แบบสุ่มจากประชากรแม่ทุกคน ดังนั้นเราจึงสร้างโมเดลผสมที่มีเอฟเฟกต์คงที่สำหรับเพศและเอฟเฟกต์แบบสุ่ม (เช่นการสกัดกั้นแบบสุ่ม) สำหรับแม่

แบบที่ 3: หมายถึงน้ำหนักแรกเกิด = การสกัดกั้น + เพศ + u

คุณนี้จะแตกต่างกันไปสำหรับแม่แต่ละคนเช่นเดียวกับในรุ่น 2 แต่มันไม่ได้ประเมินจริง ค่อนข้างจะมีการประเมินความแปรปรวนเท่านั้น การประมาณความแปรปรวนนี้ทำให้เรามีความคิดเกี่ยวกับระดับของการจัดกลุ่มของน้ำหนักโดยแม่

หวังว่าจะทำให้รู้สึกบางอย่าง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.