ฉันพบมากบนอินเทอร์เน็ตเกี่ยวกับการตีความแบบสุ่มและแบบคงที่ อย่างไรก็ตามฉันไม่สามารถดึงแหล่งที่มาได้ดังต่อไปนี้:
ความแตกต่างทางคณิตศาสตร์ระหว่างแบบสุ่มและแบบคงที่คืออะไร
โดยที่ฉันหมายถึงสูตรทางคณิตศาสตร์ของแบบจำลองและวิธีการประมาณค่าพารามิเตอร์
ฉันพบมากบนอินเทอร์เน็ตเกี่ยวกับการตีความแบบสุ่มและแบบคงที่ อย่างไรก็ตามฉันไม่สามารถดึงแหล่งที่มาได้ดังต่อไปนี้:
ความแตกต่างทางคณิตศาสตร์ระหว่างแบบสุ่มและแบบคงที่คืออะไร
โดยที่ฉันหมายถึงสูตรทางคณิตศาสตร์ของแบบจำลองและวิธีการประมาณค่าพารามิเตอร์
คำตอบ:
แบบจำลองที่ง่ายที่สุดพร้อมเอฟเฟกต์แบบสุ่มคือแบบจำลองความแปรปรวนแบบทางเดียวที่มีเอฟเฟกต์แบบสุ่มให้โดยการสังเกตด้วยสมมติฐานการกระจาย: ( y
นี่คือผลกระทบที่สุ่มเป็นฉัน พวกเขาเป็นตัวแปรสุ่มในขณะที่พวกเขาเป็นตัวเลขคงที่ในรูปแบบ ANOVA ด้วยผลคง
ตัวอย่างเช่นช่างสามคนแต่ละคนในในห้องปฏิบัติการจะบันทึกชุดการวัดและy i jคือวัด -th ของช่างผม โทรหาฉันμ "ค่าเฉลี่ยจริง" ของซีรี่ส์ที่สร้างโดยช่างเทคนิค i ; นี้เป็นพารามิเตอร์เทียมเล็กน้อยคุณสามารถดู μ ฉันเป็นค่าเฉลี่ยที่ช่างผมจะได้รับถ้าเขา / เธอได้บันทึกชุดใหญ่ของวัด
หากคุณสนใจที่จะประเมิน , μ 2 , μ 3 (เช่นเพื่อประเมินอคติระหว่างผู้ให้บริการ) คุณต้องใช้โมเดล ANOVA ที่มีเอฟเฟกต์คงที่
คุณต้องใช้โมเดล ANOVA พร้อมเอฟเฟกต์แบบสุ่มเมื่อคุณสนใจความแปรปรวนและσ 2 bกำหนดรูปแบบและความแปรปรวนรวมσ 2 b + σ 2 w (ดูด้านล่าง) ความแปรปรวนσ 2 wคือความแปรปรวนของการบันทึกที่สร้างขึ้นโดยช่างเทคนิคคนหนึ่ง (ซึ่งถือว่าเป็นสิ่งเดียวกันสำหรับช่างเทคนิคทุกคน) และσ 2 bเรียกว่าความแปรปรวนระหว่างช่างเทคนิค อาจเป็นการดีที่ช่างควรเลือกแบบสุ่ม
รุ่นนี้สะท้อนให้เห็นถึงการสลายตัวของสูตรความแปรปรวนสำหรับตัวอย่างข้อมูล:
ความแปรปรวนรวม = ความแปรปรวนของค่าเฉลี่ยหมายถึงความแปรปรวนภายใน
ซึ่งสะท้อนโดยโมเดล ANOVA พร้อมเอฟเฟกต์แบบสุ่ม:
อันที่จริงการกระจายของจะถูกกำหนดโดยเงื่อนไขการกระจายของมัน( Y ฉันเจ )ได้รับμ ฉันและการกระจายของμฉัน หากหนึ่งคำนวณ "ไม่มีเงื่อนไข" การกระจายของY ฉันJแล้วเราพบY ฉันJ ~ N ( μ , σ 2 ข + σ 2 W )
ดูสไลด์ 24 และเลื่อน 25 ที่นี่เพื่อภาพที่ดีกว่า (คุณต้องบันทึกไฟล์ pdf เพื่อชื่นชมภาพซ้อนทับอย่าดูเวอร์ชั่นออนไลน์)
โดยทั่วไปสิ่งที่ฉันคิดว่าเป็นความแตกต่างที่ชัดเจนที่สุดถ้าคุณสร้างแบบจำลองเป็นปัจจัยสุ่มคือเอฟเฟ็กต์นั้นมาจากการแจกแจงแบบปกติทั่วไป
ตัวอย่างเช่นหากคุณมีแบบจำลองบางอย่างเกี่ยวกับผลการเรียนและคุณต้องการบัญชีสำหรับข้อมูลนักเรียนของคุณที่มาจากโรงเรียนที่แตกต่างกันและคุณเป็นตัวอย่างของโรงเรียนแบบสุ่มซึ่งหมายความว่าคุณคิดว่าค่าเฉลี่ยโดยโรงเรียนกระจายอยู่ตามปกติ นั่นหมายถึงแหล่งที่มาของความแปรปรวนสองแหล่งคือการสร้างแบบจำลอง: ความแปรปรวนในโรงเรียนของเกรดนักเรียน
ผลนี้ในสิ่งที่เรียกว่าร่วมกันบางส่วน พิจารณาสองสุดขั้ว:
ด้วยการประเมินความแปรปรวนทั้งสองระดับโมเดลผสมทำให้เกิดการประนีประนอมอย่างชาญฉลาดระหว่างสองแนวทางนี้ โดยเฉพาะอย่างยิ่งถ้าคุณมีจำนวนนักเรียนไม่มากต่อโรงเรียนนี่หมายความว่าคุณจะได้รับผลกระทบจากการลดขนาดของโรงเรียนแต่ละแห่งตามแบบจำลอง 2 ต่อค่าเฉลี่ยโดยรวมของรุ่น 1
นั่นเป็นเพราะแบบจำลองบอกว่าถ้าคุณมีโรงเรียนหนึ่งแห่งที่มีนักเรียนสองคนรวมอยู่ซึ่งดีกว่าสิ่งที่ "ปกติ" สำหรับประชากรของโรงเรียนแล้วก็เป็นไปได้ว่าส่วนหนึ่งของผลกระทบนี้จะถูกอธิบายโดยโรงเรียนที่โชคดีในตัวเลือก นักเรียนสองคนมองไปที่ มันไม่ได้ทำให้ตาบอดแบบนี้มันขึ้นอยู่กับการประเมินความแปรปรวนภายในโรงเรียน นอกจากนี้ยังหมายความว่าระดับผลกระทบที่มีกลุ่มตัวอย่างน้อยลงจะถูกดึงเข้าหาค่าเฉลี่ยโดยรวมมากกว่าโรงเรียนขนาดใหญ่
สิ่งสำคัญคือคุณต้องมีการแลกเปลี่ยนกับระดับของปัจจัยสุ่ม ซึ่งหมายความว่าในกรณีนี้โรงเรียนสามารถแลกเปลี่ยนได้ (จากความรู้ของคุณ) และคุณไม่รู้อะไรเลยที่ทำให้โรงเรียนเหล่านั้นแตกต่าง หากคุณมีข้อมูลเพิ่มเติมคุณสามารถรวมสิ่งนี้ไว้เป็นปัจจัยเพิ่มเติมก็เพียงพอแล้วที่โรงเรียนจะสามารถแลกเปลี่ยนได้กับข้อมูลอื่น ๆ
ตัวอย่างเช่นจะเหมาะสมที่จะสมมติว่าผู้ใหญ่อายุ 30 ปีที่อาศัยอยู่ในนิวยอร์กสามารถแลกเปลี่ยนเพศสภาพได้ หากคุณมีข้อมูลเพิ่มเติม (อายุ, เชื้อชาติ, การศึกษา) มันก็สมเหตุสมผลที่จะรวมข้อมูลนั้นไว้ด้วย
OTH หากคุณได้ศึกษากับกลุ่มควบคุมหนึ่งกลุ่มและกลุ่มโรคที่แตกต่างกันสามกลุ่มมันไม่สมเหตุสมผลที่จะจัดกลุ่มแบบสุ่มเนื่องจากโรคเฉพาะไม่สามารถแลกเปลี่ยนได้ อย่างไรก็ตามหลายคนชอบเอฟเฟกต์การหดตัวเพื่อให้พวกเขายังคงโต้เถียงกับโมเดลเอฟเฟกต์แบบสุ่ม แต่นั่นเป็นอีกเรื่องหนึ่ง
ฉันสังเกตเห็นว่าฉันไม่ได้เข้าเรียนคณิตศาสตร์มากเกินไป แต่โดยทั่วไปแล้วความแตกต่างคือแบบจำลองเอฟเฟกต์แบบสุ่มประเมินข้อผิดพลาดแบบกระจายตามปกติทั้งในระดับโรงเรียนและระดับนักเรียนขณะที่แบบจำลองลักษณะพิเศษคงที่มีข้อผิดพลาดเพียง ระดับของนักเรียน โดยเฉพาะอย่างยิ่งนี่หมายความว่าแต่ละโรงเรียนมีระดับของตัวเองที่ไม่ได้เชื่อมต่อกับระดับอื่น ๆ โดยการกระจายทั่วไป นี่ก็หมายความว่าแบบจำลองที่ตายตัวนั้นไม่อนุญาตให้คาดการณ์ถึงนักเรียนของโรงเรียนที่ไม่รวมอยู่ในข้อมูลดั้งเดิมในขณะที่แบบจำลองเอฟเฟกต์แบบสุ่มทำได้ด้วยความแปรปรวนที่เป็นผลรวมของระดับนักเรียนและระดับความแปรปรวนของโรงเรียน หากคุณมีความสนใจในโอกาสที่เราสามารถทำงานใน
ในที่ดิน econ ผลกระทบดังกล่าวเป็นสิ่งสกัดกั้นเฉพาะส่วนบุคคล (หรือค่าคงที่) ที่ไม่ได้ตรวจสอบ แต่สามารถประมาณได้โดยใช้ข้อมูลแผง (สังเกตซ้ำ ๆ ในหน่วยเดียวกันตลอดเวลา) วิธีการประมาณผลกระทบคงที่ช่วยให้มีความสัมพันธ์ระหว่างการสกัดกั้นเฉพาะหน่วยและตัวแปรอธิบายอิสระ ผลแบบสุ่มไม่ได้ ค่าใช้จ่ายในการใช้เอฟเฟกต์คงที่ที่มีความยืดหยุ่นมากขึ้นคือคุณไม่สามารถประมาณค่าสัมประสิทธิ์ของตัวแปรที่แปรผันตามเวลา (เช่นเพศศาสนาหรือเผ่าพันธุ์)
หมายเหตุสาขาอื่นมีคำศัพท์ของตนเองซึ่งอาจสร้างความสับสน
ในชุดซอฟต์แวร์มาตรฐาน (เช่น R's lmer
) ความแตกต่างพื้นฐานคือ:
หากคุณเป็น Bayesian (เช่น WinBUGS) แสดงว่าไม่มีความแตกต่างที่แท้จริง
@ โจ๊กรูปแบบผลกระทบคงที่แสดงให้เห็นว่าขนาดผลกระทบที่สร้างขึ้นโดยการศึกษา (หรือการทดสอบ) ได้รับการแก้ไขคือการวัดซ้ำสำหรับการแทรกแซงเปิดออกผลขนาดเดียวกันผลที่คาดการณ์ไว้สภาพภายนอกและภายในสำหรับการทดสอบไม่เปลี่ยนแปลง หากคุณมีการทดลองจำนวนมากและหรือมีการศึกษาภายใต้เงื่อนไขที่แตกต่างกันคุณจะมีขนาดเอฟเฟกต์ต่างกัน การประมาณค่าพารามิเตอร์ของค่าเฉลี่ยและความแปรปรวนสำหรับชุดของเอฟเฟ็กต์ขนาดสามารถรับรู้ได้โดยการสันนิษฐานว่าสิ่งเหล่านี้เป็นเอฟเฟกต์คงที่หรือเหล่านี้เป็นเอฟเฟกต์แบบสุ่ม ฉันคิดว่ามันเป็นเรื่องที่สามารถแก้ไขได้ด้วยความช่วยเหลือของสถิติทางคณิตศาสตร์