ความแตกต่างทางคณิตศาสตร์ระหว่างแบบสุ่มและแบบคงที่คืออะไร


26

ฉันพบมากบนอินเทอร์เน็ตเกี่ยวกับการตีความแบบสุ่มและแบบคงที่ อย่างไรก็ตามฉันไม่สามารถดึงแหล่งที่มาได้ดังต่อไปนี้:

ความแตกต่างทางคณิตศาสตร์ระหว่างแบบสุ่มและแบบคงที่คืออะไร

โดยที่ฉันหมายถึงสูตรทางคณิตศาสตร์ของแบบจำลองและวิธีการประมาณค่าพารามิเตอร์


1
เอฟเฟกต์คงที่มีผลต่อค่าเฉลี่ยของการแจกแจงแบบร่วมและเอฟเฟกต์แบบสุ่มมีผลต่อความแปรปรวนและโครงสร้างการเชื่อมโยง คุณหมายถึงอะไรโดย "ความแตกต่างทางคณิตศาสตร์"? คุณกำลังถามว่าโอกาสในการเปลี่ยนแปลงอย่างไร คุณจะเจาะจงมากขึ้นได้ไหม?
มาโคร



1
คำถามดูเหมือนจะไม่แยกพื้นหลังที่มันถูกวาด คำศัพท์ในวิชาเศรษฐศาสตร์ข้อมูลบัญชีนี้แตกต่างจากวิชาสังคมศาสตร์อื่น ๆ โดยใช้แบบจำลองหลายระดับ คำถามต้องมีการชี้แจงเพิ่มเติม มิฉะนั้นนี่จะทำให้เข้าใจผิดสำหรับผู้ที่มาถึงที่นี่จากพื้นหลังทั้งที่ไม่รู้ว่ามีคำจำกัดความทางเลือกในสาขาที่เกี่ยวข้อง
luchonacho

คำตอบ:


20

แบบจำลองที่ง่ายที่สุดพร้อมเอฟเฟกต์แบบสุ่มคือแบบจำลองความแปรปรวนแบบทางเดียวที่มีเอฟเฟกต์แบบสุ่มให้โดยการสังเกตด้วยสมมติฐานการกระจาย: ( yyij

(yijμi)iidN(μi,σw2),j=1,,J,μiiidN(μ,σb2),i=1,,I.

นี่คือผลกระทบที่สุ่มเป็นฉัน พวกเขาเป็นตัวแปรสุ่มในขณะที่พวกเขาเป็นตัวเลขคงที่ในรูปแบบ ANOVA ด้วยผลคงμi

ตัวอย่างเช่นช่างสามคนแต่ละคนในในห้องปฏิบัติการจะบันทึกชุดการวัดและy i jคือi=1,2,3yijวัด -th ของช่างผม โทรหาฉันμ "ค่าเฉลี่ยจริง" ของซีรี่ส์ที่สร้างโดยช่างเทคนิค i ; นี้เป็นพารามิเตอร์เทียมเล็กน้อยคุณสามารถดู μ ฉันเป็นค่าเฉลี่ยที่ช่างผมจะได้รับถ้าเขา / เธอได้บันทึกชุดใหญ่ของวัดjiμiiμii

หากคุณสนใจที่จะประเมิน , μ 2 , μ 3 (เช่นเพื่อประเมินอคติระหว่างผู้ให้บริการ) คุณต้องใช้โมเดล ANOVA ที่มีเอฟเฟกต์คงที่μ1μ2μ3

คุณต้องใช้โมเดล ANOVA พร้อมเอฟเฟกต์แบบสุ่มเมื่อคุณสนใจความแปรปรวนและσ 2 bกำหนดรูปแบบและความแปรปรวนรวมσ 2 b + σ 2 w (ดูด้านล่าง) ความแปรปรวนσ 2 wคือความแปรปรวนของการบันทึกที่สร้างขึ้นโดยช่างเทคนิคคนหนึ่ง (ซึ่งถือว่าเป็นสิ่งเดียวกันสำหรับช่างเทคนิคทุกคน) และσ 2 bเรียกว่าความแปรปรวนระหว่างช่างเทคนิค อาจเป็นการดีที่ช่างควรเลือกแบบสุ่มσw2σb2 σb2+σw2σw2σ2

รุ่นนี้สะท้อนให้เห็นถึงการสลายตัวของสูตรความแปรปรวนสำหรับตัวอย่างข้อมูล: ป้อนคำอธิบายรูปภาพที่นี่

ความแปรปรวนรวม = ความแปรปรวนของค่าเฉลี่ยหมายถึงความแปรปรวนภายใน+

ซึ่งสะท้อนโดยโมเดล ANOVA พร้อมเอฟเฟกต์แบบสุ่ม: ป้อนคำอธิบายรูปภาพที่นี่

อันที่จริงการกระจายของจะถูกกำหนดโดยเงื่อนไขการกระจายของมัน( Y ฉันเจ )ได้รับμ ฉันและการกระจายของμฉัน หากหนึ่งคำนวณ "ไม่มีเงื่อนไข" การกระจายของY ฉันJแล้วเราพบY ฉันJ ~ N ( μ , σ 2 + σ 2 W )yij(yij)μiμiyijyijN(μ,σb2+σw2)

ดูสไลด์ 24 และเลื่อน 25 ที่นี่เพื่อภาพที่ดีกว่า (คุณต้องบันทึกไฟล์ pdf เพื่อชื่นชมภาพซ้อนทับอย่าดูเวอร์ชั่นออนไลน์)


1
(+1) ตัวเลขที่ดีมาก!
อะมีบาพูดว่า Reinstate Monica

1
ขอบคุณ @amoeba รหัสของฉันสำหรับช่วงเวลาความเฉื่อยนั้นไม่มีประโยชน์ในบล็อกของฉัน: stla.github.io/stlapblog/posts/Variance_inertia.html
Stéphane Laurent

ฉันไม่เข้าใจ หากฉันมีการวัดจำนวนมากที่ดำเนินการโดยช่างเทคนิคจำนวนหนึ่งทำไมฉันจึงต้องใช้ ANOVA ฉันไม่สามารถใส่ gaussian ให้พอดีกับผลลัพธ์ของช่างเทคนิคแต่ละคนและรับและσสำหรับแต่ละรายการได้หรือไม่? วิธีการแก้ปัญหานี้ของคุณทำให้ฉันทำซึ่งวิธีการของฉันไม่ได้? μσ
TheChymera

@TheChymera ANOVA เป็นสมมติฐานของทั่วไปσคุณจะได้รับช่วงความมั่นใจที่สั้นลงด้วยสมมติฐานนี้ แต่ความคิดเห็นของคุณเป็นเรื่องเกี่ยวกับเหตุผลในการใช้ ANOVA ที่มีความแปรปรวนร่วมกับ ANOVA ที่มีความแปรปรวนต่างกันนี่ไม่ใช่หัวข้อที่นี่จริงๆ σ
Stéphane Laurent

@ StéphaneLaurentซึ่ง ANOVA เป็นสมมติฐานของทั่วไป ? - นอกจากนี้ยังมีสิ่งนี้σร่วมกันเพื่อ? คุณพูดว่า "หากคุณสนใจที่จะประเมินμ1, μ2, μ3 (เช่นเพื่อประเมินอคติระหว่างผู้ให้บริการ) คุณต้องใช้โมเดล ANOVA ด้วยเอฟเฟกต์คงที่" สูตรของวิธีการวิเคราะห์ความแปรปรวนที่มีเอฟเฟกต์คงที่อย่างไรและจะแจ้งให้คุณทราบเกี่ยวกับμ iโดยไม่แจ้งให้คุณทราบได้ที่σ 2 b ? นอกจากนี้ยังสามารถประมาณμ i ได้อย่างไรโดยไม่ต้องให้ข้อมูลที่จำเป็นทั้งหมดเพื่อคำนวณσσσμiσb2μiอย่างไร (และในทางกลับกันสำหรับโมเดลเอฟเฟกต์แบบสุ่ม)σw2
TheChymera

16

โดยทั่วไปสิ่งที่ฉันคิดว่าเป็นความแตกต่างที่ชัดเจนที่สุดถ้าคุณสร้างแบบจำลองเป็นปัจจัยสุ่มคือเอฟเฟ็กต์นั้นมาจากการแจกแจงแบบปกติทั่วไป

ตัวอย่างเช่นหากคุณมีแบบจำลองบางอย่างเกี่ยวกับผลการเรียนและคุณต้องการบัญชีสำหรับข้อมูลนักเรียนของคุณที่มาจากโรงเรียนที่แตกต่างกันและคุณเป็นตัวอย่างของโรงเรียนแบบสุ่มซึ่งหมายความว่าคุณคิดว่าค่าเฉลี่ยโดยโรงเรียนกระจายอยู่ตามปกติ นั่นหมายถึงแหล่งที่มาของความแปรปรวนสองแหล่งคือการสร้างแบบจำลอง: ความแปรปรวนในโรงเรียนของเกรดนักเรียน

ผลนี้ในสิ่งที่เรียกว่าร่วมกันบางส่วน พิจารณาสองสุดขั้ว:

  1. โรงเรียนไม่มีผลกระทบใด ๆ (ระหว่างความแปรปรวนของโรงเรียนเป็นศูนย์) ในกรณีนี้แบบจำลองเชิงเส้นซึ่งไม่เกี่ยวข้องกับโรงเรียนจะเหมาะสมที่สุด
  2. ความแปรปรวนของโรงเรียนใหญ่กว่าความแปรปรวนของนักเรียน โดยทั่วไปคุณต้องทำงานในระดับโรงเรียนแทนระดับนักเรียน (ตัวอย่างน้อย #) นี่คือรูปแบบที่คุณใช้สำหรับโรงเรียนโดยใช้เอฟเฟกต์คงที่ นี่อาจเป็นปัญหาได้หากคุณมีตัวอย่างไม่กี่ตัวอย่างต่อโรงเรียน

ด้วยการประเมินความแปรปรวนทั้งสองระดับโมเดลผสมทำให้เกิดการประนีประนอมอย่างชาญฉลาดระหว่างสองแนวทางนี้ โดยเฉพาะอย่างยิ่งถ้าคุณมีจำนวนนักเรียนไม่มากต่อโรงเรียนนี่หมายความว่าคุณจะได้รับผลกระทบจากการลดขนาดของโรงเรียนแต่ละแห่งตามแบบจำลอง 2 ต่อค่าเฉลี่ยโดยรวมของรุ่น 1

นั่นเป็นเพราะแบบจำลองบอกว่าถ้าคุณมีโรงเรียนหนึ่งแห่งที่มีนักเรียนสองคนรวมอยู่ซึ่งดีกว่าสิ่งที่ "ปกติ" สำหรับประชากรของโรงเรียนแล้วก็เป็นไปได้ว่าส่วนหนึ่งของผลกระทบนี้จะถูกอธิบายโดยโรงเรียนที่โชคดีในตัวเลือก นักเรียนสองคนมองไปที่ มันไม่ได้ทำให้ตาบอดแบบนี้มันขึ้นอยู่กับการประเมินความแปรปรวนภายในโรงเรียน นอกจากนี้ยังหมายความว่าระดับผลกระทบที่มีกลุ่มตัวอย่างน้อยลงจะถูกดึงเข้าหาค่าเฉลี่ยโดยรวมมากกว่าโรงเรียนขนาดใหญ่

สิ่งสำคัญคือคุณต้องมีการแลกเปลี่ยนกับระดับของปัจจัยสุ่ม ซึ่งหมายความว่าในกรณีนี้โรงเรียนสามารถแลกเปลี่ยนได้ (จากความรู้ของคุณ) และคุณไม่รู้อะไรเลยที่ทำให้โรงเรียนเหล่านั้นแตกต่าง หากคุณมีข้อมูลเพิ่มเติมคุณสามารถรวมสิ่งนี้ไว้เป็นปัจจัยเพิ่มเติมก็เพียงพอแล้วที่โรงเรียนจะสามารถแลกเปลี่ยนได้กับข้อมูลอื่น ๆ

ตัวอย่างเช่นจะเหมาะสมที่จะสมมติว่าผู้ใหญ่อายุ 30 ปีที่อาศัยอยู่ในนิวยอร์กสามารถแลกเปลี่ยนเพศสภาพได้ หากคุณมีข้อมูลเพิ่มเติม (อายุ, เชื้อชาติ, การศึกษา) มันก็สมเหตุสมผลที่จะรวมข้อมูลนั้นไว้ด้วย

OTH หากคุณได้ศึกษากับกลุ่มควบคุมหนึ่งกลุ่มและกลุ่มโรคที่แตกต่างกันสามกลุ่มมันไม่สมเหตุสมผลที่จะจัดกลุ่มแบบสุ่มเนื่องจากโรคเฉพาะไม่สามารถแลกเปลี่ยนได้ อย่างไรก็ตามหลายคนชอบเอฟเฟกต์การหดตัวเพื่อให้พวกเขายังคงโต้เถียงกับโมเดลเอฟเฟกต์แบบสุ่ม แต่นั่นเป็นอีกเรื่องหนึ่ง

ฉันสังเกตเห็นว่าฉันไม่ได้เข้าเรียนคณิตศาสตร์มากเกินไป แต่โดยทั่วไปแล้วความแตกต่างคือแบบจำลองเอฟเฟกต์แบบสุ่มประเมินข้อผิดพลาดแบบกระจายตามปกติทั้งในระดับโรงเรียนและระดับนักเรียนขณะที่แบบจำลองลักษณะพิเศษคงที่มีข้อผิดพลาดเพียง ระดับของนักเรียน โดยเฉพาะอย่างยิ่งนี่หมายความว่าแต่ละโรงเรียนมีระดับของตัวเองที่ไม่ได้เชื่อมต่อกับระดับอื่น ๆ โดยการกระจายทั่วไป นี่ก็หมายความว่าแบบจำลองที่ตายตัวนั้นไม่อนุญาตให้คาดการณ์ถึงนักเรียนของโรงเรียนที่ไม่รวมอยู่ในข้อมูลดั้งเดิมในขณะที่แบบจำลองเอฟเฟกต์แบบสุ่มทำได้ด้วยความแปรปรวนที่เป็นผลรวมของระดับนักเรียนและระดับความแปรปรวนของโรงเรียน หากคุณมีความสนใจในโอกาสที่เราสามารถทำงานใน


1
(+1) คำตอบที่ยอดเยี่ยมซึ่งไม่น่าโหวต ฉันสังเกตเห็นคำพิมพ์ที่สับสน: "ยกเว้น" ควรอ่าน "รวมแล้ว" นอกเหนือจากนั้น: อะไรคือความแตกต่างในทางปฏิบัติที่คาดหวังระหว่างการปฏิบัติต่อโรงเรียนในลักษณะสุ่มและแบบคงที่? ฉันเข้าใจว่าการรักษาตามที่กำหนดจะไม่อนุญาตให้ทำนายการแสดงของนักเรียนจากโรงเรียนใหม่ แต่สิ่งที่เกี่ยวกับความแตกต่างของข้อมูลที่มีอยู่? สมมติว่าเอฟเฟกต์คงที่อื่น ๆ คือเพศเชื้อชาติและน้ำหนักของนักเรียน (อะไรก็ตาม) การปฏิบัติต่อโรงเรียนแบบสุ่ม / คงมีอิทธิพลต่อพลังของผลกระทบหลักหรือปฏิสัมพันธ์ที่น่าสนใจหรือไม่? ความแตกต่างอื่น ๆ
อะมีบาพูดว่า Reinstate Monica

3
@ amoeba ออกจากความสอดคล้องกัน, MSE ในสัมประสิทธิ์ระดับนักเรียนสามารถมีประสิทธิภาพมากขึ้นหรือน้อยลงในการสุ่มเทียบกับแบบจำลองผลกระทบคงที่ขึ้นอยู่กับสิ่งอื่น ๆ ระดับความสัมพันธ์ระหว่างนักเรียน X และผลกระทบแบบสุ่มจำนวนกลุ่ม ฯลฯ . Clark และ Linzer 2012มีผลการจำลอง
conjugateprior

1
@conjugateprior ว้าวขอบคุณมากสำหรับความคิดเห็นนี้! ฉันอ่านเอกสารที่เชื่อมโยงและเป็นคำอธิบายที่ชัดเจนที่สุดของปัญหาที่ฉันได้เห็น ฉันใช้เวลาพอสมควรในการอ่านหัวข้อต่างๆใน CV เกี่ยวกับเอฟเฟกต์แบบคงที่ / แบบสุ่ม แต่ไม่สามารถคิดได้ว่าเมื่อใดควรใช้อีกแบบหนึ่งและอีกเหตุผลหนึ่ง การอ่าน C&L ทำให้ฉันชัดเจนยิ่งขึ้น คุณต้องการเขียนคำตอบใน CV เพื่อนำเสนอบทสรุปของเอกสารนี้และ / หรือเอกสารที่เกี่ยวข้อง ฉันได้รับรางวัลมากมายจากกระทู้ที่ได้รับการโหวตมากที่สุดและยินดีที่จะให้รางวัลแก่คุณที่นั่นด้วย
อะมีบาพูดว่า Reinstate Monica

@Erik ฉันแก้ไขเพื่อแก้ไข "การศึกษาบางส่วน" เป็น "การรวมบางส่วน" ฉันคิดว่ามันเป็นตัวพิมพ์ผิด แต่ขอโทษถ้ามันเป็นการเล่นสำนวนที่ตั้งใจ!
อะมีบาพูดว่า Reinstate Monica

2

ในที่ดิน econ ผลกระทบดังกล่าวเป็นสิ่งสกัดกั้นเฉพาะส่วนบุคคล (หรือค่าคงที่) ที่ไม่ได้ตรวจสอบ แต่สามารถประมาณได้โดยใช้ข้อมูลแผง (สังเกตซ้ำ ๆ ในหน่วยเดียวกันตลอดเวลา) วิธีการประมาณผลกระทบคงที่ช่วยให้มีความสัมพันธ์ระหว่างการสกัดกั้นเฉพาะหน่วยและตัวแปรอธิบายอิสระ ผลแบบสุ่มไม่ได้ ค่าใช้จ่ายในการใช้เอฟเฟกต์คงที่ที่มีความยืดหยุ่นมากขึ้นคือคุณไม่สามารถประมาณค่าสัมประสิทธิ์ของตัวแปรที่แปรผันตามเวลา (เช่นเพศศาสนาหรือเผ่าพันธุ์)

หมายเหตุสาขาอื่นมีคำศัพท์ของตนเองซึ่งอาจสร้างความสับสน


(-1) สิ่งนี้ไม่ได้กล่าวถึงความแตกต่างทางคณิตศาสตร์ระหว่างเอฟเฟกต์คงที่และสุ่ม
มาโคร

1
@Macro เห็นด้วย ก่อนที่จะเกิดขึ้นมันจะเป็นประโยชน์ที่จะทราบว่าคำศัพท์ econ เป็นสิ่งที่ OP กำลังมองหา ฉันควรชัดเจนกว่านี้
Dimitriy V. Masterov

ตกลง. ในกรณีนี้อาจมีความเหมาะสมมากกว่าความคิดเห็นคุณจะไม่พูด?
มาโคร

คำแถลง "ค่าใช้จ่ายในการใช้เอฟเฟกต์คงที่ที่มีความยืดหยุ่นมากขึ้นคือคุณไม่สามารถประมาณค่าสัมประสิทธิ์ของตัวแปรที่แปรปรวนตามเวลา" ไม่เป็นความจริง ฉันเพิ่งสร้างแบบจำลองที่คุณได้ทำการวัดซ้ำ ๆ กับบุคคลและตัวทำนายเลขฐานสองเดียวที่ไม่เปลี่ยนแปลงเวลา หากคุณใส่เอฟเฟกต์ถาวรสำหรับ ID และอีกหนึ่งสำหรับตัวทำนายไบนารีคุณแน่นอนที่สุดสามารถประมาณค่าสัมประสิทธิ์ในตัวทำนายไบนารี (แม้ว่าฉันจะยอมรับถ้าคุณไม่มีการวัดซ้ำหลายครั้งการประมาณจะมี ข้อผิดพลาดมาตรฐานขนาดใหญ่)
มาโคร

3
แอนดรูว์เกลแมน (ที่ไม่ได้เป็นนักเศรษฐศาสตร์) รายการ 5 คำนิยามที่แตกต่างกันในกระดาษวิเคราะห์ความแปรปรวนของเขาstat.columbia.edu/~gelman/research/published/banova7.pdf
Dimitriy V. Masterov

2

ในชุดซอฟต์แวร์มาตรฐาน (เช่น R's lmer) ความแตกต่างพื้นฐานคือ:

  • ผลกระทบคงที่ถูกประเมินโดยความน่าจะเป็นสูงสุด
  • เอฟเฟกต์แบบสุ่มถูกประเมินโดยเบย์เชิงประจักษ์ (กำลังสองน้อยที่สุดที่มีการหดตัวบางส่วนสำหรับแบบจำลองเชิงเส้นซึ่งพารามิเตอร์การหดตัวถูกเลือกโดยความน่าจะเป็นสูงสุด)

หากคุณเป็น Bayesian (เช่น WinBUGS) แสดงว่าไม่มีความแตกต่างที่แท้จริง


3
ฉันไม่เห็นด้วยอย่างยิ่งว่าไม่มีความแตกต่าง คุณสามารถใส่รูปแบบเอฟเฟกต์คงที่แบบเบย์ได้ด้วยสัมประสิทธิ์ทั้งหมดที่มีตัวคั่นแบบแยกกันหรือแบบผสมแบบเบย์ที่มีพารามิเตอร์หลายมิติ
Erik

หากคุณเป็นคชกรรมความแตกต่างที่มีลักษณะเช่นนี้
conjugateprior

@Simon มันเป็นคำตอบที่ถูกต้องและกรอบ ฉันควรจะพูดถึงมันนานแล้ว
Subhash C. Davar

-3

@ โจ๊กรูปแบบผลกระทบคงที่แสดงให้เห็นว่าขนาดผลกระทบที่สร้างขึ้นโดยการศึกษา (หรือการทดสอบ) ได้รับการแก้ไขคือการวัดซ้ำสำหรับการแทรกแซงเปิดออกผลขนาดเดียวกันผลที่คาดการณ์ไว้สภาพภายนอกและภายในสำหรับการทดสอบไม่เปลี่ยนแปลง หากคุณมีการทดลองจำนวนมากและหรือมีการศึกษาภายใต้เงื่อนไขที่แตกต่างกันคุณจะมีขนาดเอฟเฟกต์ต่างกัน การประมาณค่าพารามิเตอร์ของค่าเฉลี่ยและความแปรปรวนสำหรับชุดของเอฟเฟ็กต์ขนาดสามารถรับรู้ได้โดยการสันนิษฐานว่าสิ่งเหล่านี้เป็นเอฟเฟกต์คงที่หรือเหล่านี้เป็นเอฟเฟกต์แบบสุ่ม ฉันคิดว่ามันเป็นเรื่องที่สามารถแก้ไขได้ด้วยความช่วยเหลือของสถิติทางคณิตศาสตร์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.