คำตอบสั้น ๆ คือการคาดคะเนของคุณเป็นจริงเมื่อใดและเมื่อมีความสัมพันธ์ในระดับบวกภายในข้อมูลเท่านั้น ชุดข้อมูลที่ได้รับการพูดเชิงประจักษ์ส่วนใหญ่มักแสดงความสัมพันธ์เชิงบวกภายในห้องเรียนซึ่งหมายความว่าในทางปฏิบัติการคาดเดาของคุณมักเป็นจริง แต่ถ้าความสัมพันธ์ภายในคลาสนั้นเป็น 0 ดังนั้นทั้งสองกรณีที่คุณกล่าวถึงนั้นเป็นข้อมูลที่เท่าเทียมกัน และถ้าความสัมพันธ์ภายในชั้นเรียนเป็นลบแสดงว่ามันมีข้อมูลน้อยกว่าที่จะทำการวัดน้อยลงในวิชาที่มากขึ้น เราต้องการ (เท่าที่จะลดความแปรปรวนของการประมาณค่าพารามิเตอร์ที่เกี่ยวข้อง) เพื่อทำการวัดทั้งหมดของเราในเรื่องเดียว
ในทางสถิติมีสองมุมมองที่เราสามารถคิดเกี่ยวกับสิ่งนี้: แบบจำลองเอฟเฟกต์แบบสุ่ม (หรือผสม ) ที่คุณพูดถึงในคำถามของคุณหรือแบบจำลองส่วนขอบซึ่งท้ายที่สุดก็เป็นข้อมูลอีกเล็กน้อย
แบบสุ่มเอฟเฟ็กต์ (ผสม)
บอกว่าเรามีชุดของวิชาจากผู้ที่เราได้ถ่ายเมตรวัดแต่ละ จากนั้นง่ายรูปแบบสุ่มผลกระทบของเจวัดนับขึ้นจากฉันเรื่อง TH อาจจะ
Y ฉันJ = β + U ฉัน + อีฉันเจ ,
ที่βคือตัดคงที่U ฉันเป็นผลเรื่องการสุ่ม (กับความแปรปรวนσ 2 u ), e i jคือเทอมข้อผิดพลาดระดับการสังเกต (ด้วยความแปรปรวนσ 2 enmji
yij=β+ui+eij,
βuiσ2ueijσ2e) และคำสองคำหลังสุ่มมีความเป็นอิสระ
ในรูปแบบนี้หมายถึงประชากรเฉลี่ยและมีชุดข้อมูลที่สมดุล (เช่นจำนวนที่เท่ากันของการวัดจากแต่ละเรื่อง) ประมาณการที่ดีที่สุดของเราเป็นเพียงค่าเฉลี่ยของกลุ่มตัวอย่าง ดังนั้นหากเราจะใช้ "ข้อมูลเพิ่มเติม" หมายถึงความแปรปรวนขนาดเล็กสำหรับประมาณนี้แล้วโดยทั่วไปเราต้องการทราบวิธีการแปรปรวนของค่าเฉลี่ยของกลุ่มตัวอย่างขึ้นอยู่กับnและม. ด้วยพีชคณิตเล็กน้อยเราสามารถหาวานั้นได้
( 1)βnm
การตรวจสอบการแสดงออกนี้เราจะเห็นได้ว่าเมื่อใดก็ตามที่มีใด ๆ แปรปรวนเรื่อง(เช่นσ2U>0), การเพิ่มจำนวนของอาสาสมัคร (คนn) จะทำให้ทั้งสองของคำเหล่านี้มีขนาดเล็กลงในขณะที่การเพิ่มจำนวนของการวัดต่อเรื่อง (ม.) จะทำให้เทอมที่สองมีขนาดเล็กลงเท่านั้น (สำหรับความหมายโดยปริยายเกี่ยวกับสิ่งนี้สำหรับการออกแบบโครงการจำลองแบบหลายไซต์ดูโพสต์บล็อกนี้ที่ฉันเขียนเมื่อไม่นานมานี้)
var(1nm∑i∑jyij)=var(1nm∑i∑jβ+ui+ eฉันเจ)= 1n2ม.2วาร์(∑ผมΣJยูผม+∑ผมΣJอีฉันเจ)= 1n2ม.2(m2Σผมวาร์(uผม) +∑ผมΣJvar ( eฉันเจ) )= 1n2ม.2( nm2σ2ยู+ n มσ2อี)=σ2ยูn+σ2อีไม่ม.
σ2ยู> 0nm
ตอนนี้คุณต้องการที่จะรู้ว่าเกิดอะไรขึ้นเมื่อเราเพิ่มหรือลดหรือnในขณะที่จำนวนการสังเกตทั้งหมดคงที่ ดังนั้นเราจึงคิดว่าn mเป็นค่าคงที่เพื่อให้การแสดงออกของความแปรปรวนทั้งหมดดูเหมือน
σ 2 umnnm
ซึ่งเป็นขนาดเล็กที่สุดเท่าที่เป็นไปได้เมื่อnมีขนาดใหญ่ที่สุดเท่าที่ทำได้ (สูงสุดของn=nเมตรซึ่งในกรณีที่ม.=1หมายถึงเราใช้วัดเดียวจากแต่ละเรื่อง)
σ2un+constant,
nn=nmm=1
คำตอบสั้น ๆ ของฉันอ้างถึงความสัมพันธ์ภายในห้องเรียนดังนั้นสิ่งที่เหมาะสมใน? ในแบบจำลองเอฟเฟกต์แบบง่ายนี้ความสัมพันธ์ภายในคลาสคือ
(ภาพร่างของแหล่งที่มา) ดังนั้นเราสามารถเขียนสมการความแปรปรวนข้างบนเป็น
var(1)
ρ=σ2uσ2u+σ2e
สิ่งนี้ไม่ได้เพิ่มความเข้าใจลึกลงไปในสิ่งที่เราได้เห็นไปแล้ว แต่มันทำให้เราแปลกใจ: เนื่องจากความสัมพันธ์ภายในชั้นเรียนเป็นสัมประสิทธิ์สหสัมพันธ์โดยสุจริตและสัมประสิทธิ์สหสัมพันธ์ อาจเป็นลบได้จะเกิดอะไรขึ้น (และมันหมายถึงอะไร) หากความสัมพันธ์ภายในห้องเรียนเป็นลบ
var(1nm∑i∑jyij)=σ2un+σ2enm=(ρn+1−ρnm)(σ2u+σ2e)
σ2uρ
ขอบแบบจำลอง
yij
yij=β+e∗ij,
uieije∗ij=ui+eijuieij i.ide∗ij CC = σ2⎡⎣⎢⎢⎢⎢⎢R0⋮00R⋮0⋯⋯⋱⋯00⋮R⎤⎦⎥⎥⎥⎥⎥, R = ⎡⎣⎢⎢⎢⎢⎢1ρ⋮ρρ1⋮ρ⋯⋯⋱⋯ρρ⋮1⎤⎦⎥⎥⎥⎥⎥
ในคำนี้หมายความว่าภายใต้ตัวแบบที่เราพิจารณา
ρ ที่จะเป็นความสัมพันธ์ที่คาดหวังระหว่างสอง
อี* * * *s จากหัวเรื่องเดียวกัน (เราถือว่าความสัมพันธ์ข้ามวิชาคือ 0) เมื่อ
ρเป็นบวกการสังเกตสองครั้งที่ดึงมาจากหัวเรื่องเดียวกันมีแนวโน้มที่จะคล้ายกันมากขึ้น (โดยใกล้กันมากขึ้น) โดยเฉลี่ยแล้วการสังเกตสองครั้งที่สุ่มมาจากชุดข้อมูลในขณะที่ไม่สนใจการจัดกลุ่มเนื่องจากวัตถุ เมื่อ
ρเป็น
ค่าลบการสังเกตสองครั้งที่ดึงมาจากหัวเรื่องเดียวกันนั้นมี
ความคล้ายคลึงกัน
น้อยกว่า (โดยแยกจากกัน) โดยเฉลี่ยแล้วกว่าการสังเกตสองครั้งที่สุ่มมาโดยสมบูรณ์ (ข้อมูลเพิ่มเติมเกี่ยวกับการตีความนี้ใน
คำถาม / คำตอบที่นี่ )
ตอนนี้เมื่อเราดูสมการความแปรปรวนของค่าเฉลี่ยตัวอย่างภายใต้ตัวแบบขอบเรามี
วาร์( 1)ไม่มΣผมΣJYฉันเจ)= var ( 1)ไม่มΣผมΣJβ+ e* * * *ฉันเจ)= 1n2ม.2วาร์( ∑ผมΣJอี* * * *ฉันเจ)= 1n2ม.2( n ( mσ)2+ ( ม2- ม. ) ρ σ2) )= σ2(1+(m−1)ρ)nm=(ρn+1−ρnm)σ2,
which is the same variance expression we derived above for the random-effects model, just with
σ2e+σ2u=σ2, which is consistent with our note above that
e∗ij=ui+eij. The advantage of this (statistically equivalent) perspective is that here we can think about a negative intra-class correlation without needing to invoke any weird concepts like a negative subject variance. Negative intra-class correlations just fit naturally in this framework.
(BTW, just a quick aside to point out that the second-to-last line of the derivation above implies that we must have ρ≥−1/(m−1), or else the whole equation is negative, but variances can't be negative! So there is a lower bound on the intra-class correlation that depends on how many measurements we have per cluster. For m=2 (i.e., we measure each subject twice), the intra-class correlation can go all the way down to ρ=−1; for m=3 it can only go down to ρ=−1/2; and so on. Fun fact!)
So finally, once again considering the total number of observations nm to be a constant, we see that the second-to-last line of the derivation above just looks like
(1+(m−1)ρ)×positive constant.
So when
ρ>0, having
m as small as possible (so that we take fewer measurements of more subjects--in the limit, 1 measurement of each subject) makes the variance of the estimate as small as possible. But when
ρ<0, we actually want
m to be as
large as possible (so that, in the limit, we take all
nm measurements from a single subject) in order to make the variance as small as possible. And when
ρ=0, the variance of the estimate is just a constant, so our allocation of
m and
n doesn't matter.