เมทริกซ์ตัดกันคืออะไร?


46

สิ่งที่ว่าคือความคมชัดเมทริกซ์ (คำที่เกี่ยวข้องกับการวิเคราะห์ทำนายเด็ดขาดเป็นพิเศษ) และวิธีการว่าจะตรงกันข้ามเมทริกซ์ที่ระบุ? คือคอลัมน์คืออะไรแถวคืออะไรข้อ จำกัด ของเมทริกซ์นั้นคืออะไรและจำนวนในคอลัมน์jและแถวiหมายถึงอะไร ฉันพยายามตรวจสอบเอกสารและเว็บ แต่ดูเหมือนว่าทุกคนใช้มัน แต่ก็ไม่มีการต่อต้านใด ๆ ฉันสามารถย้อนกลับ - วิศวกรความคมชัดที่กำหนดไว้ล่วงหน้าที่มีอยู่ แต่ฉันคิดว่าคำนิยามควรจะใช้ได้โดยไม่ว่า

> contr.treatment(4)
  2 3 4
1 0 0 0
2 1 0 0
3 0 1 0
4 0 0 1
> contr.sum(4)
  [,1] [,2] [,3]
1    1    0    0
2    0    1    0
3    0    0    1
4   -1   -1   -1
> contr.helmert(4)
  [,1] [,2] [,3]
1   -1   -1   -1
2    1   -1   -1
3    0    2   -1
4    0    0    3
> contr.SAS(4)
  1 2 3
1 1 0 0
2 0 1 0
3 0 0 1
4 0 0 0

"เมทริกซ์ความคมชัด" ใช้เพื่อแสดงค่า IV ที่เป็นหมวดหมู่ (ปัจจัย) ในการสร้างแบบจำลอง โดยเฉพาะอย่างยิ่งมันจะใช้ในการถอดรหัสปัจจัยเป็นชุดของ "ตัวแปรความคมชัด" (ตัวแปรตัวอย่างเป็นเพียงตัวอย่าง) ตัวแปรความคมชัดแต่ละประเภทมีเมทริกซ์ความคมชัดที่สอดคล้องกัน ดูตัวอย่างคำถามที่เกี่ยวข้องกับตัวเองยังไม่ได้รับคำตอบ
ttnphns

5
@ttnphns ขออภัย แต่คุณยังคงทำสิ่งที่เอกสารและเว็บทั้งหมดทำ: คุณอธิบายว่าเมทริกซ์ความเปรียบต่างใช้สำหรับอะไรโดยไม่ต้องตอบคำถามว่าเมทริกซ์ความคมชัดคือ นี่คือจุดประสงค์ของการให้คำนิยาม
อยากรู้อยากเห็น

3
แน่นอนว่ามันเกี่ยวข้อง แต่ได้มา "สิ่งที่เป็น" จาก "สิ่งที่จำเป็นสำหรับ" เป็นงานของนักสืบซึ่งไม่ควรต้องการ นั่นคือวิศวกรรมย้อนกลับ สิ่งที่ควรบันทึกไว้
อยากรู้อยากเห็น

2
ats.ucla.edu/stat/r/library/contrast_coding.htmเป็นRทรัพยากรที่ดีที่ใช้วิธีการเข้ารหัส
whuber

1
@ จริงเพียงแจ้งให้คุณทราบ: ฉันได้รับรางวัล 100 รางวัลให้กับ ttnphns แต่ฉันจะเริ่มรางวัลอีกครั้ง (หรือขอให้คนอื่นทำ) เพื่อรับรางวัล Gus_est เช่นกัน ฉันได้เขียนคำตอบของฉันเองเช่นกันในกรณีที่คุณต้องการให้สั้นกว่า :-)
อะมีบาพูดว่า Reinstate Monica

คำตอบ:


31

ในคำตอบที่ดีของพวกเขา @Gus_est รับคำอธิบายทางคณิตศาสตร์เกี่ยวกับสาระสำคัญของเมทริกซ์สัมประสิทธิ์ความคมชัดL (ระบุไว้ที่C ) เป็นสูตรพื้นฐานสำหรับการทดสอบสมมติฐานในการสร้างแบบจำลองเชิงเส้นทั่วไปแบบไม่รวมตัวแปร (โดยที่เป็นพารามิเตอร์และเป็นฟังก์ชันที่สามารถประมาณค่าได้แทนสมมุติฐานว่าง) และคำตอบนั้นแสดงสูตรที่จำเป็นบางอย่างที่ใช้ในโปรแกรม ANOVA สมัยใหม่b kLb=kbk

คำตอบของฉันมีสไตล์แตกต่างกันมาก สำหรับนักวิเคราะห์ข้อมูลที่เห็นว่าตัวเองเป็น "วิศวกร" มากกว่า "นักคณิตศาสตร์" ดังนั้นคำตอบจะเป็นบัญชี (ผิวเผิน) "ภาคปฏิบัติ" หรือ "การสอน" และจะเน้นที่จะตอบเพียงแค่หัวข้อ (1) ค่าสัมประสิทธิ์ความคมชัดหมายถึงและ (2) พวกเขาสามารถช่วยในการดำเนินการ ANOVA ผ่านโปรแกรมการถดถอยเชิงเส้น

การวิเคราะห์ความแปรปรวนเป็นถดถอยที่มีตัวแปรดัมมี่: แนะนำความแตกต่าง

ให้เราจินตนาการถึงความแปรปรวนร่วมกับตัวแปรตามYและปัจจัยหมวดหมู่A ที่มี 3 ระดับ (กลุ่ม) ขอให้เราได้อย่างรวดเร็วในการวิเคราะห์ความแปรปรวนจากจุดถดถอยเชิงเส้นของมุมมองที่เป็น - ผ่านการเปลี่ยนปัจจัยเป็นชุดของดัมมี่ (aka ตัวบ่งชี้ที่รู้จักรักษา aka ร้อนหนึ่ง ) ตัวแปรไบนารี นี้เป็นชุดของเราเป็นอิสระX (อาจเป็นไปได้ว่าทุกคนเคยได้ยินว่าเป็นไปได้ที่จะทำ ANOVA ด้วยวิธีนี้ - เป็นการถดถอยเชิงเส้นตรงกับตัวทำนายแบบจำลอง)

เนื่องจากหนึ่งในสามกลุ่มนั้นซ้ำซ้อนตัวแปรดัมมี่สองตัวเท่านั้นจึงจะเข้าสู่โมเดลเชิงเส้น เรามากำหนด Group3 ให้ซ้ำซ้อนหรืออ้างอิง ตัวทำนายแบบจำลองที่ประกอบขึ้นด้วยXเป็นตัวอย่างของตัวแปรทางตรงกันข้ามเช่นตัวแปรพื้นฐานที่แสดงถึงหมวดหมู่ของปัจจัย Xเองมักเรียกว่าเมทริกซ์การออกแบบ ตอนนี้เราสามารถใส่ชุดข้อมูลในโปรแกรมการถดถอยเชิงเส้นหลายเส้นซึ่งจะจัดกึ่งกลางข้อมูลและหาค่าสัมประสิทธิ์การถดถอย (พารามิเตอร์) , โดยที่ " + "กำหนด pseudoinverseb=(XX)1Xy=X+y

แต่จะเพิ่มระยะเวลาคงที่ของแบบจำลองเป็นคอลัมน์แรกของ1วินาทีในXจากนั้นประมาณค่าสัมประสิทธิ์แบบเดียวกับข้างบน Yจนถึงตอนนี้ดีมากb=(XX)1Xy=X+y

ให้เรากำหนดเมทริกซ์Cจะเป็นการรวมตัว (สรุป) ของตัวแปรอิสระออกแบบเมทริกซ์X มันก็แสดงให้เราเห็นรูปแบบการเข้ารหัสสังเกตมี - The ตรงกันข้ามการเข้ารหัสเมทริกซ์ (= เมทริกซ์พื้นฐาน): XC=aggrX

C
              Const  A1    A2
Gr1 (A=1)       1     1     0
Gr2 (A=2)       1     0     1
Gr3 (A=3,ref)   1     0     0

colums เป็นตัวแปร (คอลัมน์) ของX - ตัวแปรความคมชัดระดับประถมศึกษา A1 A2, จำลองในตัวอย่างนี้และแถวเป็นกลุ่ม / ระดับทั้งหมดของปัจจัย ดังนั้นเราได้รับการเข้ารหัสเมทริกซ์Cสำหรับตัวบ่งชี้หรือความคมชัดหุ่นโครงการการเข้ารหัส

ตอนนี้เรียกว่าเมทริกซ์สัมประสิทธิ์ความคมชัดหรือเมทริกซ์ L ตั้งแต่Cเป็นตาราง1} เมทริกซ์ความคมชัดที่สอดคล้องกับCของเรา- ซึ่งมีไว้สำหรับตัวเปรียบเทียบความขัดแย้งของตัวอย่างของเรา - ดังนั้น:L = C + = C - 1C+=LL=C+=C1

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const      0     0     1            => Const = Mean_Gr3
A1         1     0    -1            => Param1 = Mean_Gr1-Mean_Gr3
A2         0     1    -1            => Param2 = Mean_Gr2-Mean_Gr3

L-เมทริกซ์เมทริกซ์แสดงค่าสัมประสิทธิ์ความคมชัด หมายเหตุ: ผลรวมของค่าสัมประสิทธิ์ความคมชัดในทุกแถว (ยกเว้นคงแถว) เป็น0ทุกแถวดังกล่าวจะเรียกว่าเป็นความคมชัด แถวสอดคล้องกับตัวแปรความคมชัดและคอลัมน์สอดคล้องกับกลุ่มระดับปัจจัย0

ความสำคัญของค่าสัมประสิทธิ์ความคมชัดคือพวกเขาช่วยให้เข้าใจว่าแต่ละผลกระทบ (แต่ละพารามิเตอร์ประมาณในการถดถอยด้วยXของเรามันเป็นรหัส) เป็นตัวแทนในความรู้สึกของความแตกต่าง (การเปรียบเทียบกลุ่ม) เราเห็นทันทีตามค่าสัมประสิทธิ์ว่าค่าคงที่โดยประมาณจะเท่ากับค่าเฉลี่ย Y ในกลุ่มอ้างอิง พารามิเตอร์นั้น b1 (เช่นตัวแปรดัมมี่ A1) จะเท่ากับความแตกต่าง: Y mean ใน group1 ลบ Y เฉลี่ยใน group3; และพารามิเตอร์ b2 คือความแตกต่าง: ค่าเฉลี่ยในกลุ่ม 2 ลบค่าเฉลี่ยในกลุ่ม 3

หมายเหตุ : บอก "หมายถึง" ด้านขวาเหนือ (และต่อไปด้านล่าง) เราหมายถึงโดยประมาณ (ตามคำทำนายของรุ่น) หมายถึงกลุ่มที่ไม่ได้หมายถึงการสังเกตในกลุ่ม

ข้อสังเกตที่ให้คำแนะนำ : เมื่อเราทำการถดถอยโดยตัวแปรทำนายแบบไบนารีพารามิเตอร์ของตัวแปรดังกล่าวจะกล่าวถึงความแตกต่างใน Y ระหว่างกลุ่มตัวแปร = 1 และกลุ่มตัวแปร = 0 อย่างไรก็ตามในสถานการณ์เมื่อตัวแปรไบนารี่เป็นชุดของk-1 ตัวแปรดัมมี่ที่แสดงถึงkปัจจัยระดับความหมายของพารามิเตอร์จะแคบลง : มันแสดงให้เห็นถึงความแตกต่างใน Y ระหว่างตัวแปร = 1 และ (ไม่ใช่แค่ตัวแปร = 0 แต่ถึงแม้) Reference_variable = 1 กลุ่ม

เช่นเดียวกับ (หลังจากคูณด้วย ) ทำให้เราเห็นคุณค่าของคล้ายนำในความหมายของข y ( a g g r X ) +X+y(aggrX)+

ตกลงเราได้ให้ความหมายของความคมชัดค่าสัมประสิทธิ์เมทริกซ์L ตั้งแต่ , สมมาตรซึ่งหมายความว่าถ้าคุณได้รับหรือสร้างเมทริกซ์ความคมชัดLตามปัจจัยหมวดหมู่ (s) - เพื่อทดสอบLในการวิเคราะห์ของคุณจากนั้นคุณมีเงื่อนงำวิธีการเขียนโค้ดตัวแปรทำนายความคมชัดXของคุณอย่างถูกต้องเพื่อทดสอบL ผ่านซอฟต์แวร์การถดถอยปกติ (เช่นการประมวลผลเพียงตัวแปร "ต่อเนื่อง" มาตรฐาน OLS วิธีและไม่รับรู้ปัจจัยเด็ดขาดเลย) ในตัวอย่างปัจจุบันของเราการเข้ารหัสคือ - ตัวแปรตัวบ่งชี้ (ดัมมี่) C = L + = L - 1L=C+=C1C=L+=L1

การวิเคราะห์ความแปรปรวนเป็นถดถอย: ความคมชัดประเภทอื่น

แจ้งให้เราสั้นสังเกตประเภทอื่น ๆ ตรงกันข้าม (= รูปแบบการเข้ารหัสรูปแบบ = parameterization) สำหรับปัจจัยเด็ดขาด

เบี่ยงเบนหรือผลแตกต่าง เมทริกซ์CและLและความหมายพารามิเตอร์:

C
              Const  A1    A2
Gr1 (A=1)       1     1     0
Gr2 (A=2)       1     0     1
Gr3 (A=3,ref)   1    -1    -1

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const     1/3   1/3   1/3      => Const = 1/3Mean_Gr3+1/3Mean_Gr2+1/3Mean_Gr3 = Mean_GU
A1        2/3  -1/3  -1/3      => Param1 = 2/3Mean_Gr1-1/3(Mean_Gr2+Mean_Gr3) = Mean_Gr1-Mean_GU
A2       -1/3   2/3  -1/3      => Param2 = 2/3Mean_Gr2-1/3(Mean_Gr1+Mean_Gr3) = Mean_Gr2-Mean_GU

                                  Parameter for the reference group3 = -(Param1+Param2) = Mean_Gr3-Mean_GU

                                  Mean_GU is grand unweighted mean = 1/3(Mean_Gr1+Mean_Gr2+Mean_Gr3)

โดยการเบี่ยงเบนการเข้ารหัสแต่ละกลุ่มของปัจจัยจะถูกเปรียบเทียบกับค่าเฉลี่ยแกรนด์ที่ไม่ถ่วงในขณะที่ค่าคงที่คือค่าเฉลี่ยที่ยิ่งใหญ่ นี่คือสิ่งที่คุณได้รับจากการถดถอยด้วยตัวทำนายความคมชัดX ที่เขียนในส่วนเบี่ยงเบนหรือเอฟเฟกต์ "ท่าทาง"

ความแตกต่างง่ายๆ ชุดรูปแบบความแตกต่าง / การเข้ารหัสนี้เป็นลูกผสมของตัวบ่งชี้และส่วนเบี่ยงเบนมันให้ความหมายของค่าคงที่ในรูปแบบส่วนเบี่ยงเบนและความหมายของพารามิเตอร์อื่น ๆ เช่นเดียวกับในประเภทตัวบ่งชี้:

C
              Const  A1    A2
Gr1 (A=1)       1   2/3  -1/3
Gr2 (A=2)       1  -1/3   2/3
Gr3 (A=3,ref)   1  -1/3  -1/3

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const     1/3   1/3   1/3        => Const = as in Deviation
A1         1     0    -1         => Param1 = as in Indicator
A2         0     1    -1         => Param2 = as in Indicator

ความแตกต่าง Helmert เปรียบเทียบแต่ละกลุ่ม (ยกเว้นการอ้างอิง) ด้วยค่าเฉลี่ยแบบไม่ถ่วงของกลุ่มที่ตามมาและค่าคงที่คือค่าเฉลี่ยขนาดใหญ่แบบไม่ถ่วงน้ำหนัก matrces CและL :

C
              Const  A1    A2
Gr1 (A=1)       1   2/3    0
Gr2 (A=2)       1  -1/3   1/2
Gr3 (A=3,ref)   1  -1/3  -1/2

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const     1/3   1/3   1/3        => Const = Mean_GU
A1         1   -1/2  -1/2        => Param1 = Mean_Gr1-1/2(Mean_Gr2+Mean_Gr3)
A2         0     1    -1         => Param2 = Mean_Gr2-Mean_Gr3

ความแตกต่างหรือความขัดแย้ง Helmert ย้อนกลับ เปรียบเทียบแต่ละกลุ่ม (ยกเว้นการอ้างอิง) ด้วยค่าเฉลี่ยแบบไม่ถ่วงของกลุ่มก่อนหน้าและค่าคงที่คือค่าเฉลี่ยแบบแกรนด์แบบไม่ถ่วงน้ำหนัก

C
              Const  A1    A2
Gr1 (A=1)       1  -1/2  -1/3
Gr2 (A=2)       1   1/2  -1/3
Gr3 (A=3,ref)   1    0    2/3

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const     1/3   1/3   1/3        => Const = Mean_GU
A1        -1     1     0         => Param1 = Mean_Gr2-Mean_Gr1
A2       -1/2  -1/2    1         => Param2 = Mean_Gr3-1/2(Mean_Gr2+Mean_Gr1)

ความแตกต่างซ้ำแล้วซ้ำอีก เปรียบเทียบแต่ละกลุ่ม (ยกเว้นการอ้างอิง) กับกลุ่มถัดไปและค่าคงที่คือค่าเฉลี่ยแกรนด์ที่ไม่ถ่วง

C
              Const  A1    A2
Gr1 (A=1)       1   2/3   1/3
Gr2 (A=2)       1  -1/3   1/3
Gr3 (A=3,ref)   1  -1/3  -2/3

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const     1/3   1/3   1/3        => Const = Mean_GU
A1         1    -1     0         => Param1 = Mean_Gr1-Mean_Gr2
A2         0     1    -1         => Param2 = Mean_Gr2-Mean_Gr3

คำถามถาม: การhow exactly is contrast matrix specified?ดูประเภทของความแตกต่างที่ระบุไว้จนถึงตอนนี้เป็นไปได้ที่จะเข้าใจว่า แต่ละชนิดมีตรรกะของวิธีการ "เติม" ค่าในL ตรรกะแสดงความหมายของพารามิเตอร์แต่ละตัว - การรวมกันของกลุ่มสองกลุ่มที่วางแผนจะเปรียบเทียบคืออะไร

ความแตกต่างพหุนาม เหล่านี้เป็นบิตพิเศษไม่เชิงเส้น เอฟเฟกต์แรกคือแบบเชิงเส้นหนึ่งแบบที่สองคือกำลังสองถัดไปคือลูกบาศก์ ฉันออกจากที่นี่โดยไม่มีคำถามคำถามว่าจะสร้างเมทริกซ์CและLของพวกเขาอย่างไรและถ้าพวกมันเป็นสิ่งที่ตรงกันข้ามกัน โปรดปรึกษากับคำอธิบายที่ลึกซึ้ง @Antoni Parellada ของประเภทของความคมชัดนี้: 1 , 2

ในการออกแบบที่สมดุล Helmert กลับ Helmert และความแตกต่างพหุนามมักจะแตกต่างมุมฉาก ประเภทอื่น ๆ ที่พิจารณาข้างต้นไม่ใช่ความขัดแย้งมุมฉาก Orthogonal (ภายใต้ความสมดุล) คือความคมชัดที่เมทริกซ์Lผลรวมในแต่ละแถว (ยกเว้น Const) เป็นศูนย์และผลรวมของผลิตภัณฑ์ขององค์ประกอบที่สอดคล้องกันของแต่ละคู่ของแถวเป็นศูนย์

นี่คือการวัดความคล้ายคลึงกันของมุม (ความสัมพันธ์ของโคไซน์และเพียร์สัน) ภายใต้ประเภทคอนทราสต์ที่แตกต่างกันยกเว้นพหุนามที่ฉันไม่ได้ทดสอบ ขอให้เรามีปัจจัยเดียวที่มีkระดับและจากนั้นก็จะถูกคำนวณในชุดของk-1ตัวแปรความคมชัดของประเภทที่เฉพาะเจาะจง ค่าในความสัมพันธ์หรือเมทริกซ์โคไซน์ระหว่างตัวแปรความคมชัดเหล่านี้คืออะไร

                     Balanced (equal size) groups     Unbalanced groups
Contrast type             cos        corr              cos        corr

INDICATOR                  0       -1/(k-1)             0         varied
DEVIATION                 .5          .5              varied      varied
SIMPLE                 -1/(k-1)    -1/(k-1)           varied      varied
HELMERT, REVHELMERT        0           0              varied      varied
REPEATED                varied   =  varied            varied      varied

   "=" means the two matrices are same while elements in matrix vary

ฉันกำลังให้ข้อมูลและปล่อยตารางทิ้งไว้โดยไม่ใส่ความคิดเห็น มันมีความสำคัญสำหรับการมองลึกลงไปในโมเดลเชิงเส้นทั่วไป

ความแตกต่างที่ผู้ใช้กำหนด นี่คือสิ่งที่เราเขียนเพื่อทดสอบสมมติฐานเปรียบเทียบแบบกำหนดเอง โดยปกติผลรวมในทุก ๆ แต่แถวแรกของLควรเป็น 0 ซึ่งหมายความว่ามีการเปรียบเทียบสองกลุ่มหรือสององค์ประกอบของกลุ่มในแถวนั้น (เช่นโดยพารามิเตอร์นั้น)

พารามิเตอร์โมเดลอยู่ที่ไหน ?

พวกเขาเป็นแถวหรือคอลัมน์ของLหรือไม่? ตลอดข้อความข้างต้นฉันบอกว่าพารามิเตอร์นั้นสอดคล้องกับแถวของLเนื่องจากแถวนั้นเป็นตัวแทนของตัวแปรที่ตรงกันข้าม ในขณะที่คอลัมน์เป็นระดับของปัจจัยกลุ่ม ซึ่งอาจปรากฏว่าขัดแย้งกับเรื่องดังกล่าวตัวอย่างเช่นบล็อกเชิงทฤษฎีจาก @Gus_est คำตอบที่ชัดเจนคอลัมน์ที่สอดคล้องกับพารามิเตอร์:

H0:[011000011000011][β0β1β2β3β4]=[000]

ที่จริงแล้วไม่มีความขัดแย้งและคำตอบของ "ปัญหา" คือ: ทั้งแถวและคอลัมน์ของเมทริกซ์สัมประสิทธิ์ความคมชัดสอดคล้องกับพารามิเตอร์! เพียงจำความแตกต่าง (ตัวแปรความแตกต่าง) ซึ่งเป็นแถวในตอนแรกถูกสร้างขึ้นเพื่อแสดงถึงอะไรอื่นนอกจากระดับปัจจัย: พวกมันคือระดับยกเว้นการอ้างอิงที่ละเว้น โปรดเปรียบเทียบการสะกดของ L-matrix ที่เทียบเท่ากันทั้งสองนี้เพื่อความคมชัดอย่างง่าย :

L
          Gr1   Gr2   Gr3
          A=1   A=2   A=3(reference)
Const     1/3   1/3   1/3 
A1         1     0    -1  
A2         0     1    -1   

L
            b0    b1    b2    b3(redundant)
           Const  A=1   A=2   A=3(reference)
b0  Const   1    1/3   1/3   1/3 
b1  A1      0     1     0    -1  
b2  A2      0     0     1    -1   

อันแรกคือสิ่งที่ฉันเคยแสดงมาก่อนสิ่งที่สองคือเค้าโครง "เชิงทฤษฎี" (สำหรับพีชคณิตโมเดลเชิงเส้นทั่วไป) เพิ่มคอลัมน์ที่เกี่ยวข้องกับคำที่คงที่ สัมประสิทธิ์พารามิเตอร์ป้ายแถวและคอลัมน์ พารามิเตอร์ b3 จะถูกตั้งค่าซ้ำซ้อนเป็นศูนย์ คุณอาจใช้รูปแบบที่สองเพื่อรับเมทริกซ์การเข้ารหัสCซึ่งภายในส่วนล่างขวาคุณจะพบว่ารหัสที่ถูกต้องสำหรับตัวแปรความคมชัด A1 และ A2 นั่นจะเป็นเช่นนั้นสำหรับประเภทความคมชัดใด ๆ ที่อธิบายไว้ (ยกเว้นสำหรับประเภทตัวบ่งชี้ - ที่ pseudoinverse ของรูปแบบสี่เหลี่ยมดังกล่าวจะไม่ให้ผลลัพธ์ที่ถูกต้องนี่อาจเป็นเหตุผลว่าทำไมประเภทความคมชัดที่เรียบง่ายถูกประดิษฐ์ขึ้นเพื่อความสะดวก แถวคงที่)

ประเภทความคมชัดและผลลัพธ์ในตาราง ANOVA

(μ1=μ2,μ2=μ3)(μ1=μ23,μ2=μ3)(μ1=μ123,μ2=μ123)(μ1=μ3,μ2=μ3)

โปรแกรมวิเคราะห์ความแปรปรวนดำเนินการผ่านกระบวนทัศน์แบบจำลองเชิงเส้นทั่วไปสามารถแสดงทั้งตาราง ANOVA (ผลรวม: หลักปฏิสัมพันธ์) และพารามิเตอร์ประมาณการตาราง (ผลกระทบประถม ) บางโปรแกรมอาจแสดงผลลัพธ์ในตารางหลังให้กับชนิดคอนทราสต์ตามราคาเสนอของผู้ใช้ แต่ส่วนใหญ่จะส่งออกพารามิเตอร์ที่สัมพันธ์กับประเภทเดียว - บ่อยครั้งที่ประเภทของตัวบ่งชี้เนื่องจากโปรแกรม ANOVA ตามแบบจำลองเชิงเส้นทั่วไป to do) จากนั้นสลับไปใช้ความแตกต่างด้วยสูตรพิเศษ "การเชื่อมโยง" ซึ่งแปลความหมายของข้อมูลจำลองแบบตายตัวให้เป็นความคมชัด (โดยพลการ)

ในขณะที่คำตอบของฉัน - แสดง ANOVA ว่าการถดถอย - "ลิงค์" ถูกรับรู้เร็วเท่าที่ระดับของอินพุตXซึ่งถูกเรียกเพื่อแนะนำแนวคิดของสคีมาการเข้ารหัสที่เหมาะสมสำหรับข้อมูล

ตัวอย่างที่แสดงให้เห็นความแตกต่างของการทดสอบการวิเคราะห์ความแปรปรวนทางถดถอยปกติ

แสดงใน SPSS คำขอประเภทคอนทราสต์ใน ANOVA และรับผลลัพธ์เดียวกันผ่านการถดถอยเชิงเส้น เรามีชุดข้อมูลที่มีYและปัจจัยA (3 ระดับอ้างอิง = ล่าสุด) และB (4 ระดับอ้างอิง = ล่าสุด); ค้นหาข้อมูลด้านล่างในภายหลัง

ค่าความเบี่ยงเบนตัดกันตัวอย่างภายใต้โมเดลแฟคทอเรียลเต็มรูปแบบ (A, B, A * B) ประเภทค่าเบี่ยงเบนที่ร้องขอสำหรับทั้ง A และ B (เราอาจเลือกที่จะเรียกร้องประเภทที่แตกต่างกันสำหรับแต่ละปัจจัยสำหรับข้อมูลของคุณ)

ค่าสัมประสิทธิ์ความคมชัดเมทริกซ์Lสำหรับ A และ B:

            A=1      A=2      A=3
Const     .3333    .3333    .3333 
dev_a1    .6667   -.3333   -.3333
dev_a2   -.3333    .6667   -.3333

            B=1      B=2      B=3      B=4
Const     .2500    .2500    .2500    .2500
dev_b1    .7500   -.2500   -.2500   -.2500 
dev_b2   -.2500    .7500   -.2500   -.2500 
dev_b3   -.2500   -.2500    .7500   -.2500

ร้องขอโปรแกรม ANOVA ( GLMใน SPSS) เพื่อทำการวิเคราะห์ความแปรปรวนและแสดงผลลัพธ์ที่ชัดเจนสำหรับความแตกต่างที่เบี่ยงเบน:

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่

ประเภทความคมชัดเบี่ยงเบนเปรียบเทียบ A = 1 เทียบกับค่าเฉลี่ยถ่วงน้ำหนักที่ยิ่งใหญ่และ A = 2 ที่มีค่าเฉลี่ยเดียวกัน รูปวงรีสีแดงหมึกประมาณการความแตกต่างและค่า p ของพวกเขา เอฟเฟกต์รวมเหนือปัจจัย A ถูกทำเครื่องหมายด้วยสี่เหลี่ยมสีแดง สำหรับปัจจัย B การจัดวางทุกครั้งจะถูกลงหมึกสีน้ำเงินแบบอะนาล็อก แสดงตาราง ANOVA ด้วย ให้สังเกตว่าเอฟเฟ็กต์คอนทราสต์รวมกันนั้นเท่ากับเอฟเฟกต์หลักในนั้น

ป้อนคำอธิบายรูปภาพที่นี่

ให้เราสร้างตัวแปรความคมชัดทางกายภาพ dev_a1, dev_a2, dev_b1, dev_b2, dev_b3 และเรียกใช้การถดถอย สลับเมทริกซ์Lเพื่อรับเมทริกซ์การเข้ารหัสC :

      dev_a1   dev_a2
A=1   1.0000    .0000 
A=2    .0000   1.0000 
A=3  -1.0000  -1.0000

      dev_b1   dev_b2   dev_b3
B=1   1.0000    .0000    .0000 
B=2    .0000   1.0000    .0000 
B=3    .0000    .0000   1.0000 
B=4  -1.0000  -1.0000  -1.0000

X=DCDkk

ต้องสร้างตัวแปรคอนทราสต์คูณระหว่างปัจจัยต่าง ๆ เพื่อรับตัวแปรเพื่อเป็นตัวแทนการโต้ตอบ (โมเดล ANOVA ของเราเต็มแฟคทอเรียล): dev_a1b1, dev_a1b2, dev_a1b3, dev_a2b2, dev_a2b2 จากนั้นเรียกใช้การถดถอยเชิงเส้นหลายครั้งพร้อมตัวทำนาย

ป้อนคำอธิบายรูปภาพที่นี่

ตามที่คาดไว้ dev_a1 จะเหมือนกับเอฟเฟกต์เหมือนกับที่เคยเป็นตรงกันข้าม "ระดับ 1 กับค่าเฉลี่ย" dev_a2 เหมือนกันกับ "ระดับ 2 vs ค่าเฉลี่ย" ฯลฯ ฯลฯ - เปรียบเทียบชิ้นส่วนที่มีหมึกด้วยการวิเคราะห์ความเปรียบต่างของ ANOVA ด้านบน

โปรดทราบว่าหากเราไม่ได้ใช้ตัวแปรการโต้ตอบ dev_a1b1, dev_a1b2 ... ในการถดถอยผลลัพธ์จะตรงกับผลลัพธ์ของการวิเคราะห์ความแตกต่างหลัก ANOVA เท่านั้น

ตัวอย่างความแตกต่างง่าย ๆภายใต้โมเดลแฟคทอเรียลเต็มรูปแบบ (A, B, A * B)

ค่าสัมประสิทธิ์ความคมชัดเมทริกซ์Lสำหรับ A และ B:

            A=1      A=2      A=3
Const     .3333    .3333    .3333 
sim_a1   1.0000    .0000  -1.0000
sim_a2    .0000   1.0000  -1.0000

            B=1      B=2      B=3      B=4
Const     .2500    .2500    .2500    .2500
sim_b1   1.0000    .0000    .0000  -1.0000
sim_b2    .0000   1.0000    .0000  -1.0000
sim_b3    .0000    .0000   1.0000  -1.0000

ผลลัพธ์ ANOVA สำหรับความเปรียบต่างที่เรียบง่าย:

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่

ผลลัพธ์โดยรวม (ตาราง ANOVA) เหมือนกับความแตกต่างของความเบี่ยงเบน (ไม่แสดงในขณะนี้)

สร้างตัวแปรความแตกต่างทางร่างกาย sim_a1, sim_a2, sim_b1, sim_b2, sim_b3 เมทริกซ์การเข้ารหัสโดยการย้อนกลับของเมทริกซ์ L คือ (โดยไม่มีคอลัมน์ Const):

      sim_a1   sim_a2
A=1    .6667   -.3333
A=2   -.3333    .6667
A=3   -.3333   -.3333

      sim_b1   sim_b2   sim_b3
B=1    .7500   -.2500   -.2500
B=2   -.2500    .7500   -.2500
B=3   -.2500   -.2500    .7500
B=4   -.2500   -.2500   -.2500

X=DC

ป้อนคำอธิบายรูปภาพที่นี่

เมื่อก่อนเราจะเห็นว่าผลลัพธ์ของการถดถอยและ ANOVA ตรงกัน พารามิเตอร์การถดถอยของตัวแปรความแตกต่างง่าย ๆ คือความแตกต่าง (และการทดสอบที่สำคัญของมัน) ระหว่างระดับของปัจจัยนั้นและระดับอ้างอิง (ระดับสุดท้ายในตัวอย่างของเรา) ระดับของมัน

ข้อมูลสองปัจจัยที่ใช้ในตัวอย่าง:

     Y      A      B
 .2260      1      1
 .6836      1      1
-1.772      1      1
-.5085      1      1
1.1836      1      2
 .5633      1      2
 .8709      1      2
 .2858      1      2
 .4057      1      2
-1.156      1      3
1.5199      1      3
-.1388      1      3
 .4865      1      3
-.7653      1      3
 .3418      1      4
-1.273      1      4
1.4042      1      4
-.1622      2      1
 .3347      2      1
-.4576      2      1
 .7585      2      1
 .4084      2      2
1.4165      2      2
-.5138      2      2
 .9725      2      2
 .2373      2      2
-1.562      2      2
1.3985      2      3
 .0397      2      3
-.4689      2      3
-1.499      2      3
-.7654      2      3
 .1442      2      3
-1.404      2      3
-.2201      2      4
-1.166      2      4
 .7282      2      4
 .9524      2      4
-1.462      2      4
-.3478      3      1
 .5679      3      1
 .5608      3      2
1.0338      3      2
-1.161      3      2
-.1037      3      3
2.0470      3      3
2.3613      3      3
 .1222      3      4

ตัวอย่างความคมชัดที่ผู้ใช้กำหนด ขอให้เรามีปัจจัยเดียวFกับ 5 ระดับ ฉันจะสร้างและทดสอบชุดของความแตกต่างมุมฉากที่กำหนดเองใน ANOVA และในการถดถอย

ป้อนคำอธิบายรูปภาพที่นี่

LL

ให้เราส่งเมทริกซ์ไปยังกระบวนการ ANOVA ของ SPSS เพื่อทดสอบความแตกต่าง ทีนี้เราอาจส่งแม้แต่หนึ่งแถว (ตรงกันข้าม) จากเมทริกซ์ แต่เราจะส่งเมทริกซ์ทั้งหมดเพราะ - ในตัวอย่างก่อนหน้า - เราต้องการรับผลลัพธ์เดียวกันผ่านการถดถอยและโปรแกรมการถดถอยจะต้องสมบูรณ์ ชุดของตัวแปรความคมชัด (เพื่อให้ทราบว่าพวกมันอยู่รวมกันเป็นหนึ่งปัจจัย!) เราจะเพิ่มแถวคงที่ลงใน L เช่นเดียวกับที่เราเคยทำก่อนหน้านี้ถึงแม้ว่าเราไม่จำเป็นต้องทดสอบการสกัดกั้นเราอาจละเว้นได้อย่างปลอดภัย

UNIANOVA Y BY F
  /METHOD=SSTYPE(3)
  /INTERCEPT=INCLUDE
  /CONTRAST (F)= special
       (.2 .2 .2 .2 .2
         3  3 -2 -2 -2
         1 -1  0  0  0
         0  0  2 -1 -1
         0  0  0  1 -1)
  /DESIGN=F.

Equivalently, we might also use this syntax (with a more flexible /LMATRIX subcommand)
if we omit the Constant row from the matrix.
UNIANOVA Y BY F
  /METHOD=SSTYPE(3)
  /INTERCEPT=INCLUDE
  /LMATRIX= "User contrasts"
       F  3  3 -2 -2 -2;
       F  1 -1  0  0  0;
       F  0  0  2 -1 -1;
       F  0  0  0  1 -1
  /DESIGN=F.

ป้อนคำอธิบายรูปภาพที่นี่

เอฟเฟกต์ความเปรียบต่างโดยรวม (ที่ด้านล่างของรูป) ไม่เหมือนกับผลรวมของการวิเคราะห์ความคาดหวังโดยรวม:

ป้อนคำอธิบายรูปภาพที่นี่

แต่มันเป็นเพียงสิ่งประดิษฐ์ของการแทรกเทอมค่าคงที่ลงในเมทริกซ์ L สำหรับ SPSS นั้นหมายถึงค่าคงที่เมื่อมีการระบุความแตกต่างที่ผู้ใช้กำหนด ลบแถวค่าคงที่ออกจาก L และเราจะได้ผลลัพธ์ตรงกันข้าม (เมทริกซ์ K ในรูปด้านบน) ยกเว้นว่า L0 ความคมชัดจะไม่ปรากฏ และผลความคมชัดโดยรวมจะตรงกับ ANOVA โดยรวม:

ป้อนคำอธิบายรูปภาพที่นี่

C=L+X=DC

C
      use_f1   use_f2   use_f3   use_f4
F=1    .1000    .5000    .0000    .0000
F=2    .1000   -.5000    .0000    .0000
F=3   -.0667    .0000    .3333    .0000
F=4   -.0667    .0000   -.1667    .5000
F=5   -.0667    .0000   -.1667   -.5000

ป้อนคำอธิบายรูปภาพที่นี่

สังเกตตัวตนของผลลัพธ์ ข้อมูลที่ใช้ในตัวอย่างนี้:

     Y      F
 .2260      1
 .6836      1
-1.772      1
-.5085      1
1.1836      1
 .5633      1
 .8709      1
 .2858      1
 .4057      1
-1.156      1
1.5199      2
-.1388      2
 .4865      2
-.7653      2
 .3418      2
-1.273      2
1.4042      2
-.1622      3
 .3347      3
-.4576      3
 .7585      3
 .4084      3
1.4165      3
-.5138      3
 .9725      3
 .2373      3
-1.562      3
1.3985      3
 .0397      4
-.4689      4
-1.499      4
-.7654      4
 .1442      4
-1.404      4
-.2201      4
-1.166      4
 .7282      4
 .9524      5
-1.462      5
-.3478      5
 .5679      5
 .5608      5
1.0338      5
-1.161      5
-.1037      5
2.0470      5
2.3613      5
 .1222      5

ความแตกต่างในอื่น ๆ นอกเหนือจากการวิเคราะห์

เมื่อใดก็ตามที่ตัวทำนายที่ระบุปรากฏขึ้นคำถามของความคมชัด (ซึ่งชนิดความคมชัดที่จะเลือกสำหรับตัวทำนายที่เกิดขึ้น) บางโปรแกรมแก้ไขมันไว้ด้านหลังของฉากภายในเมื่อผลลัพธ์โดยรวมของรถโดยสารจะไม่ขึ้นอยู่กับประเภทที่เลือก หากคุณต้องการประเภทที่เฉพาะเจาะจงเพื่อดูผลลัพธ์ "ระดับต้น" เพิ่มเติมคุณต้องเลือก คุณเลือก (หรือค่อนข้างเรียบเรียง) ความเปรียบต่างเช่นกันเมื่อคุณทดสอบสมมติฐานเปรียบเทียบแบบกำหนดเอง

(M) การวิเคราะห์ความแปรปรวนและ Loglinear การผสมตัวแบบเชิงเส้นและแบบทั่วไปบางครั้งมีตัวเลือกในการรักษาตัวทำนายด้วยความแตกต่างประเภทต่าง ๆ แต่ขณะที่ฉันพยายามแสดงมันเป็นไปได้ที่จะสร้างความแตกต่างเป็นตัวแปรความคมชัดอย่างชัดเจนและด้วยมือ จากนั้นหากคุณไม่มีแพ็คเกจ ANOVA อยู่ในมือคุณอาจทำได้หลายวิธีด้วยโชคดี - ด้วยการถดถอยหลายครั้ง


1
โปรดอย่า จำกัด คำตอบนี้เฉพาะกับ anova หากเป็นไปได้ แท็ก [anova] ถูกเพิ่มโดย @amoeba ตามเวลาที่คุณตอบคำถามของฉัน แต่ฉันไม่ต้องการให้คำตอบถูก จำกัด เพียงแค่ anova
อยากรู้อยากเห็น

CLCL

@ amoeba, ฉันไม่คุ้นเคยกับ "contrast matrix" และเกือบจะแน่ใจว่าเป็น "matrix coefficient matrix" หรือ L-matrix ซึ่งเป็นคำศัพท์ทางการหรือกว้างอย่างน้อยใน (M) ANOVA / GLM คำว่า "ความคมชัดการเข้ารหัสเมทริกซ์" นั้นมีการกล่าวถึงน้อยมากเนื่องจากเป็นเพียงมุมมองที่ซับซ้อนของการออกแบบเมทริกซ์ X ฉันเคยเห็นคำว่า "พื้นฐานเมทริกซ์" ที่ใช้ในเอกสารของนักสถิติอาวุโสคนหนึ่งของ SPSS Dave Nichols แน่นอนว่าเมทริกซ์ L (ป้ายกำกับอย่างเป็นทางการ) และ C (ป้ายกำกับตามอำเภอใจ?) มีความสัมพันธ์กันอย่างใกล้ชิดจนแทบไม่มีใครพูดถึงเรื่องอื่นได้ ฉันคิดว่า "เมทริกซ์ความคมชัด" ควรถือว่าเป็นคู่นี้
ttnphns

1
ใช่ฉันเห็นด้วย. ถึงตอนนี้ฉันมั่นใจแล้วว่า "matrix matrix" เป็นคำที่ใช้เฉพาะในชุมชน R และอ้างถึงรูปแบบการเข้ารหัส ฉันตรวจสอบตำราเรียนที่ Gus_est อ้างถึงและพวกเขาไม่เคยใช้คำว่า "contrast matrix" พวกเขาพูดถึง "contrasts" เท่านั้น (ดูความคิดเห็นล่าสุดของฉันใต้คำตอบของเขา) OP ชัดเจนถามเกี่ยวกับ "ความเปรียบต่างเมทริกซ์" ในความรู้สึก R
อะมีบาพูดว่า Reinstate Monica

1
That L will determine what are you going to test, you aren't free anymore to choose what to testβi=0β1β2/2β3/2=0

17

ฉันจะใช้อักษรตัวพิมพ์เล็กสำหรับเวกเตอร์และตัวอักษรพิมพ์ใหญ่สำหรับการฝึกอบรม

ในกรณีของโมเดลเชิงเส้นของแบบฟอร์ม:

y=Xβ+ε

ที่เป็นเมทริกซ์ของการจัดอันดับและเราคิด2)Xn×(k+1)k+1nεN(0,σ2)

เราสามารถประมาณโดยเนื่องจาก อินเวอร์สของมีอยู่β^(XX)1XyXX

ตอนนี้สำหรับกรณีของ ANOVA เรามีไม่ใช่อันดับเต็มอีกต่อไป ความหมายของสิ่งนี้คือเราไม่มีและเราจะต้องจัดการกับอินเวอร์สทั่วไป{-}X(XX)1(XX)

หนึ่งในปัญหาของการใช้อินเวอร์สทั่วไปนี้คือมันไม่ซ้ำกัน อีกปัญหาหนึ่งคือเราไม่สามารถหาตัวประมาณเป็นกลางสำหรับเนื่องจาก β

β^=(XX)XyE(β^)=(XX)XXβ.

ดังนั้นเราจึงไม่สามารถประมาณการเบต้า} แต่เราสามารถประมาณการรวมกันเชิงเส้นของได้หรือไม่ββ

เรามีการรวมกันเชิงเส้นของของพูดจะประเมินได้ถ้ามีเวกเตอร์เช่นนั้นเบต้า}βgβaE(ay)=gβ


ความแตกต่างเป็นกรณีพิเศษของฟังก์ชันที่ประมาณค่าได้ซึ่งผลรวมของสัมประสิทธิ์ของเท่ากับศูนย์g

และความแตกต่างเกิดขึ้นในบริบทของตัวทำนายเชิงหมวดหมู่ในแบบจำลองเชิงเส้น (หากคุณตรวจสอบคู่มือที่ลิงก์โดย @amoeba คุณจะเห็นว่าการเข้ารหัสความคมชัดทั้งหมดเกี่ยวข้องกับตัวแปรหมวดหมู่) จากนั้นการตอบกลับ @Curious และ @amoeba เราเห็นว่าเกิดขึ้นใน ANOVA แต่ไม่ใช่ในรูปแบบการถดถอย "บริสุทธิ์" ที่มีเพียงตัวทำนายอย่างต่อเนื่องเท่านั้น (เราสามารถพูดถึงความแตกต่างใน ANCOVA เนื่องจากเรามีตัวแปรเด็ดขาดอยู่)


ตอนนี้ในรูปแบบโดยที่ไม่ได้อยู่ในตำแหน่งเต็มและ , ฟังก์ชันเชิงเส้นสามารถประเมินได้ถ้ามีเวกเตอร์เช่นนั้น\ นั่นคือคือการรวมกันเชิงเส้นของแถวของ{X} นอกจากนี้ยังมีตัวเลือกมากมายของ vectorเช่นดังที่เราเห็นในตัวอย่างด้านล่าง

y=Xβ+ε
XE(y)=XβgβaaX=ggXaaX=g

ตัวอย่างที่ 1

พิจารณาโมเดลทางเดียว:

yij=μ+αi+εij,i=1,2,j=1,2,3.

X=[110110110101101101],β=[μτ1τ2]

และสมมติว่าดังนั้นเราจึงต้องการที่จะประเมิน\g=[0,1,1][0,1,1]β=τ1τ2

เราจะเห็นว่ามีตัวเลือกต่าง ๆ ของเวกเตอร์ที่ให้ผล : รับ ; หรือ ; หรือ-2]aaX=ga=[0,0,1,1,0,0]a=[1,0,0,0,0,1]a=[2,1,0,0,1,2]


ตัวอย่างที่ 2

ใช้รูปแบบสองทาง: J

yij=μ+αi+βj+εij,i=1,2,j=1,2

X=[11010110011011010101],β=[μα1α2β1β2]

เราสามารถกำหนดฟังก์ชั่นนับถือโดยการเชิงเส้นการรวมกันของแถวของ{X}X

การลบแถว 1 จากแถว 2, 3 และ 4 (ของ ): X

[11010000110110001111]

และรับแถวที่ 2 และ 3 จากแถวที่สี่:

[11010000110110000000]

การคูณด้วยอัตราผลตอบแทน: β

g1β=μ+α1+β1g2β=β2β1g3β=α2α1

ดังนั้นเรามีฟังก์ชั่นที่ประมาณค่าได้อิสระแบบเส้นตรงสามฟังก์ชัน ตอนนี้มีเพียงและเท่านั้นที่สามารถพิจารณาความแตกต่างได้เนื่องจากผลรวมของสัมประสิทธิ์ (หรือแถว ผลรวมของเวกเตอร์ที่เกี่ยวข้อง ) เท่ากับศูนย์g2βg3βg


กลับไปที่โมเดลสมดุลทางเดียว

yij=μ+αi+εij,i=1,2,,k,j=1,2,,n.

และสมมติว่าเราต้องการที่จะทดสอบสมมติฐาน\H0:α1==αk

ในการตั้งค่านี้ matrixไม่ได้อยู่ในตำแหน่งเต็มดังนั้นไม่ซ้ำกันและไม่สามารถประเมินได้ ที่จะทำให้มันนับถือเราสามารถคูณโดยตราบเท่าที่0 ในคำอื่น ๆมีที่นับถือ IFF0Xβ=(μ,α1,,αk)βgigi=0igiαiigi=0

ทำไมสิ่งนี้ถึงเป็นจริง

เรารู้ว่าสามารถได้หากมีเวกเตอร์อยู่เช่นว่า{X} รับแถวที่แตกต่างกันของและแล้ว: gβ=(0,g1,,gk)β=igiαiag=aXXa=[a1,,ak]

[0,g1,,gk]=g=aX=(iai,a1,,ak)

และผลดังต่อไปนี้


ถ้าเราต้องการที่จะทดสอบความคมชัดเฉพาะสมมติฐานของเราคือ0 ตัวอย่างเช่น:ซึ่งสามารถเขียนเป็นดังนั้นเราจึงเปรียบเทียบกับค่าเฉลี่ยของและ\H0:giαi=0H0:2α1=α2+α3H0:α1=α2+α32α1α2α3

สมมติฐานนี้สามารถแสดงเป็นที่g_k) ในกรณีนี้และเราทดสอบสมมติฐานนี้ด้วยสถิติต่อไปนี้: H0:gβ=0g=(0,g1,g2,,gk)q=1

F=[gβ^][g(XX)g]1gβ^SSE/k(n1).

ถ้าแสดงเป็นโดยที่แถวของเมทริกซ์ เป็นความแตกต่างระหว่าง orthogonal ( ) จากนั้นเราสามารถทดสอบโดยใช้สถิติ , โดยที่H0:α1=α2==αkGβ=0

G=[g1g2gk]
gigj=0H0:Gβ=0F=SSHrank(G)SSEk(n1)SSH=[Gβ^][G(XX)1G]1Gβ^.

ตัวอย่างที่ 3

เพื่อให้เข้าใจได้ดียิ่งขึ้นลองใช้และสมมติว่าเราต้องการทดสอบซึ่งสามารถแสดงเป็น k=4H0:α1=α2=α3=α4,

H0:[α1α2α1α3α1α4]=[000]

หรือตามที่ : H0:Gβ=0

H0:[011000101001011]G,our contrast matrix[μα1α2α3α4]=[000]

ดังนั้นเราจะเห็นว่าเมทริกซ์ตัดกันของเราสามแถวนั้นถูกกำหนดโดยสัมประสิทธิ์ของความแตกต่างของดอกเบี้ย และแต่ละคอลัมน์ให้ระดับปัจจัยที่เราใช้ในการเปรียบเทียบของเรา


สวยมากทั้งหมดที่ฉันเขียนถูกนำ \ คัดลอก (ลงคอ) จาก Rencher & Schaalje, "โมเดลเชิงเส้นในเชิงสถิติ" บทที่ 8 และ 13 (ตัวอย่างถ้อยคำของทฤษฎีบทการตีความบางอย่าง) แต่สิ่งอื่น ๆ เช่นคำว่า "เมทริกซ์ความคมชัด "(ที่จริงไม่ปรากฏในหนังสือเล่มนี้) และคำจำกัดความที่ให้ไว้ที่นี่เป็นของฉันเอง


เชื่อมโยงเมทริกซ์คอนทราสต์ของ OP กับคำตอบของฉัน

หนึ่งในเมทริกซ์ของ OP (ซึ่งสามารถพบได้ในคู่มือนี้) คือ:

> contr.treatment(4)
  2 3 4
1 0 0 0
2 1 0 0
3 0 1 0
4 0 0 1

ในกรณีนี้ปัจจัยของเรามี 4 ระดับและเราสามารถเขียนโมเดลดังนี้: สิ่งนี้สามารถเขียนในรูปแบบเมทริกซ์เป็น:

[y11y21y31y41]=[μμμμ]+[a1a2a3a4]+[ε11ε21ε31ε41]

หรือ

[y11y21y31y41]=[11000101001001010001]X[μa1a2a3a4]β+[ε11ε21ε31ε41]

ตอนนี้สำหรับตัวอย่างการเข้ารหัสแบบจำลองบนคู่มือเดียวกันพวกเขาใช้เป็นกลุ่มอ้างอิง ดังนั้นเราจึงลบแถวที่ 1 ออกจากแถวอื่น ๆ ใน matrixซึ่งให้ค่า :a1XX~

[11000011000101001001]

หากคุณสังเกตการนับของแถวและคอลัมน์ในเมทริกซ์ contr.treatment (4) คุณจะเห็นว่าพวกเขาพิจารณาแถวทั้งหมดและเฉพาะคอลัมน์ที่เกี่ยวข้องกับปัจจัย 2, 3 และ 4 หากเราทำเช่นเดียวกันใน เมทริกซ์ด้านบนให้ผล:

[000100010001]

วิธีนี้เมทริกซ์ contr.treatment (4) บอกเราว่าพวกเขากำลังเปรียบเทียบปัจจัย 2, 3 และ 4 กับปัจจัย 1 และเปรียบเทียบปัจจัย 1 กับค่าคงที่ (นี่คือความเข้าใจของฉันด้านบน)

และให้นิยาม (นั่นคือนำเฉพาะแถวที่รวมเป็น 0 ในเมทริกซ์ด้านบน): G

[011000101001001]

เราสามารถทดสอบและค้นหาค่าประมาณความแตกต่างH0:Gβ=0

hsb2 = read.table('http://www.ats.ucla.edu/stat/data/hsb2.csv', header=T, sep=",")

y<-hsb2$write

dummies <- model.matrix(~factor(hsb2$race)+0)
X<-cbind(1,dummies)

# Defining G, what I call contrast matrix
G<-matrix(0,3,5)
G[1,]<-c(0,-1,1,0,0)
G[2,]<-c(0,-1,0,1,0)
G[3,]<-c(0,-1,0,0,1)
G
     [,1] [,2] [,3] [,4] [,5]
[1,]    0   -1    1    0    0
[2,]    0   -1    0    1    0
[3,]    0   -1    0    0    1

# Estimating Beta

X.X<-t(X)%*%X
X.y<-t(X)%*%y

library(MASS)
Betas<-ginv(X.X)%*%X.y

# Final estimators:
G%*%Betas
          [,1]
[1,] 11.541667
[2,]  1.741667
[3,]  7.596839

และค่าประมาณก็เหมือนกัน


เกี่ยวข้องกับคำตอบ @ttnphns 'กับฉัน

ในตัวอย่างแรกของพวกเขาการตั้งค่ามีปัจจัยเด็ดขาด A ที่มีสามระดับ เราสามารถเขียนสิ่งนี้เป็นแบบจำลอง (สมมติว่าเพื่อความง่าย, นั่นคือ ): j=1

yij=μ+ai+εij,for i=1,2,3

และสมมติว่าเราต้องการทดสอบหรือโดยที่เป็นกลุ่ม / ปัจจัยอ้างอิงของเราH0:a1=a2=a3H0:a1a3=a2a3=0a3

สิ่งนี้สามารถเขียนในรูปแบบเมทริกซ์เป็น:

[y11y21y31]=[μμμ]+[a1a2a3]+[ε11ε21ε31]

หรือ

[y11y21y31]=[110010101001]X[μa1a2a3]β+[ε11ε21ε31]

ตอนนี้ถ้าเราลบแถวที่ 3 จากแถว 1 และแถวที่ 2 เรามีกลายเป็น (ฉันจะเรียกมันว่า :XX~

X~=[010100111001]

เปรียบเทียบช่วง 3 คอลัมน์ของเมทริกซ์ข้างต้นด้วย @ttnphns' เมทริกซ์{L} แม้จะมีคำสั่งพวกเขาค่อนข้างคล้ายกัน แน่นอนถ้าทวีคูณเราจะได้:LX~β

[010100111001][μa1a2a3]=[a1a3a2a3μ+a3]

ดังนั้นเรามีฟังก์ชั่นที่สามารถประเมินได้: ; ; A_3c1β=a1a3c2β=a2a3c3β=μ+a3

ตั้งแต่เราเห็นจากด้านบนว่าเรากำลังเปรียบเทียบค่าคงที่ของเรากับค่าสัมประสิทธิ์สำหรับกลุ่มอ้างอิง (a_3); สัมประสิทธิ์ของ group1 ถึงสัมประสิทธิ์ของ group3; และสัมประสิทธิ์ของ group2 ถึง group3 หรือตามที่ @ttnphns กล่าวว่า: "เราเห็นทันทีตามค่าสัมประสิทธิ์ว่าค่าคงที่โดยประมาณจะเท่ากับค่าเฉลี่ย Y ในกลุ่มอ้างอิงพารามิเตอร์นั้น b1 (เช่นตัวแปรจำลอง A1) จะเท่ากับความแตกต่าง: Y หมายถึงกลุ่ม 1 ลบ Y ค่าเฉลี่ยในกลุ่ม 3 และพารามิเตอร์ b2 คือความแตกต่าง: ค่าเฉลี่ยในกลุ่ม 2 ลบค่าเฉลี่ยในกลุ่ม 3 "H0:ciβ=0

ยิ่งไปกว่านั้นสังเกตว่า (ตามคำนิยามของความเปรียบต่าง: ฟังก์ชันที่ประมาณได้ + ผลรวมแถว = 0), เวกเตอร์และนั้นต่างกัน และถ้าเราสร้าง matrixของ constrasts เรามี:c1c2G

G=[01010011]

เมทริกซ์ความคมชัดของเราเพื่อทดสอบH0:Gβ=0

ตัวอย่าง

เราจะใช้ข้อมูลเดียวกันกับ @ttnphns '"ผู้ใช้กำหนดตัวอย่างความคมชัด" (ฉันต้องการพูดถึงว่าทฤษฎีที่ฉันเขียนที่นี่ต้องมีการแก้ไขเล็กน้อยเพื่อพิจารณาโมเดลที่มีการโต้ตอบนั่นคือเหตุผลที่ฉันเลือกตัวอย่างนี้อย่างไรก็ตาม คำจำกัดความของความแตกต่างและ - สิ่งที่ฉันเรียกว่า - เมทริกซ์ความคมชัดยังคงเหมือนเดิม)

Y<-c(0.226,0.6836,-1.772,-0.5085,1.1836,0.5633,0.8709,0.2858,0.4057,-1.156,1.5199,
     -0.1388,0.4865,-0.7653,0.3418,-1.273,1.4042,-0.1622,0.3347,-0.4576,0.7585,0.4084,
     1.4165,-0.5138,0.9725,0.2373,-1.562,1.3985,0.0397,-0.4689,-1.499,-0.7654,0.1442,
     -1.404,-0.2201,-1.166,0.7282,0.9524,-1.462,-0.3478,0.5679,0.5608,1.0338,-1.161,
     -0.1037,2.047,2.3613,0.1222)

F_<-c(1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,
    5,5,5,5,5,5,5,5,5,5,5)

dummies.F<-model.matrix(~as.factor(F_)+0)

X_F<-cbind(1,dummies.F)

G_F<-matrix(0,4,6)
G_F[1,]<-c(0,3,3,-2,-2,-2)
G_F[2,]<-c(0,1,-1,0,0,0)
G_F[3,]<-c(0,0,0,2,-1,-1)
G_F[4,]<-c(0,0,0,0,1,-1)

 G 
 [,1] [,2] [,3] [,4] [,5] [,6]
[1,]    0    3    3   -2   -2   -2
[2,]    0    1   -1    0    0    0
[3,]    0    0    0    2   -1   -1
[4,]    0    0    0    0    1   -1

# Estimating Beta 

X_F.X_F<-t(X_F)%*%X_F
X_F.Y<-t(X_F)%*%Y

Betas_F<-ginv(X_F.X_F)%*%X_F.Y

# Final estimators:
G_F%*%Betas_F
           [,1]
[1,]  0.5888183
[2,] -0.1468029
[3,]  0.6115212
[4,] -0.9279030

ดังนั้นเราจึงได้ผลลัพธ์เดียวกัน


ข้อสรุป

สำหรับผมแล้วดูเหมือนว่าจะไม่มีแนวคิดใดที่นิยามว่าเมทริกซ์ความเปรียบต่างคืออะไร

หากคุณใช้คำจำกัดความของความเปรียบต่างที่กำหนดโดย Scheffe ("การวิเคราะห์ความแปรปรวน" หน้า 66) คุณจะเห็นว่ามันเป็นฟังก์ชันที่สามารถประเมินได้ซึ่งมีค่าสัมประสิทธิ์รวมเป็นศูนย์ ดังนั้นถ้าเราต้องการที่จะทดสอบผลรวมเชิงเส้นที่แตกต่างกันของสัมประสิทธิ์ของตัวแปรเด็ดขาดของเราเราใช้เมทริกซ์{G} นี่คือเมทริกซ์ที่แถวรวมกันเป็นศูนย์ซึ่งเราใช้ในการคูณเมทริกซ์ของสัมประสิทธิ์ของเราเพื่อทำให้สัมประสิทธิ์เหล่านั้นสามารถประมาณได้ แถวของมันบ่งบอกถึงชุดค่าผสมเชิงเส้นที่แตกต่างกันของความแตกต่างที่เรากำลังทดสอบและคอลัมน์ของมันบ่งบอกถึงปัจจัย (สัมประสิทธิ์) ที่จะถูกเปรียบเทียบG

เมื่อเมทริกซ์ด้านบนสร้างขึ้นในลักษณะที่แต่ละแถวประกอบขึ้นด้วยเวกเตอร์ตัดกัน (ซึ่งรวมเป็น 0) สำหรับฉันมันสมเหตุสมผลแล้วที่จะเรียกเป็น "เมทริกซ์ตัดกัน" ( Monahan - "ไพรเมอร์สำหรับโมเดลเชิงเส้น" - ใช้คำศัพท์นี้เช่นกัน)GG

อย่างไรก็ตามตามที่อธิบายอย่างสวยงามโดย @ttnphns ซอฟต์แวร์กำลังเรียกอย่างอื่นว่า "contrast matrix" และฉันไม่สามารถหาความสัมพันธ์โดยตรงระหว่าง matrixและคำสั่งในตัว / เมทริกซ์ในตัวจาก SPSS (@ttnphns ) หรือ R (คำถามของ OP) มีความคล้ายคลึงกันเท่านั้น แต่ฉันเชื่อว่าการอภิปราย / การร่วมมือที่ดีที่นำเสนอที่นี่จะช่วยชี้แจงแนวคิดและคำจำกัดความดังกล่าวG


โปรดอย่า จำกัด คำตอบนี้เฉพาะกับ anova หากเป็นไปได้ แท็ก [anova] ถูกเพิ่มโดย @amoeba ตามเวลาที่คุณตอบคำถามของฉัน แต่ฉันไม่ต้องการให้คำตอบถูก จำกัด เพียงแค่ anova
อยากรู้อยากเห็น

ขอบคุณมากสำหรับการอัพเดทครั้งใหญ่ ฉันได้ลบความคิดเห็นบางส่วนของฉันด้านบนที่ล้าสมัยไปแล้วในตอนนี้ (คุณสามารถลบความคิดเห็นบางส่วนของคุณเช่นความคิดเห็นแรก) อย่างไรก็ตามตอนนี้มันชัดเจนสำหรับฉันว่า "ความเปรียบต่างเมทริกซ์" ในความรู้สึกของคุณ (และโมฮัน) เป็นสิ่งที่แตกต่างอย่างสิ้นเชิงจาก "ความเปรียบต่างเมทริกซ์" ในแง่ที่ใช้ในคู่มือ R นี้และในคำถามเดิมที่นี่ C-เมทริกซ์) ฉันคิดว่ามันสมเหตุสมผลถ้าคุณจดบันทึกที่ไหนซักแห่งในคำตอบของคุณเกี่ยวกับความแตกต่างนี้
อะมีบาพูดว่า Reinstate Monica

ฉันมีปัญหาในการทำความเข้าใจเริ่มจากตัวอย่างที่ 1 อะไรคือสิ่งที่สัญกรณ์ของคุณ ? คืออะไรและคอลัมน์ odหมายถึงอะไร นั่นคือค่าคงที่ (คอลัมน์ของคน) และตัวแปรจำลองสองตัวหรือไม่? ijyijaiX
ttnphns

@ttnphns:คือกลุ่มการจัดทำดัชนี (มีสองกลุ่มในตัวอย่างที่ 1)คือการทำดัชนีจุดข้อมูลภายในแต่ละกลุ่ม เป็นค่าคงที่และเป็นค่าคงที่สำหรับแต่ละกลุ่มเช่นเป็นค่าเฉลี่ยของกลุ่ม (ดังนั้นสามารถเป็นค่าเฉลี่ยรวมและสามารถเบี่ยงเบนจากค่าเฉลี่ยของกลุ่มทั้งหมด) คอลัมน์ของเป็นคำที่คงที่และหุ่นสองตัวใช่ ijμαiμ+αiμαiX
อะมีบาพูดว่า Reinstate Monica

ขอบคุณสำหรับคำตอบนี้ แต่ฉันอาจจะไม่สามารถไม่มีเวลาเข้าใจ และผมเรียนคณิตศาสตร์ :-) ผมคาดว่าบางคำนิยามง่ายมากเป็นคำตอบ :-)
อยากรู้อยากเห็น

7

"เมทริกซ์ความคมชัด" ไม่ใช่คำมาตรฐานในวรรณคดีเชิงสถิติ มันสามารถมี [อย่างน้อย] สองอันที่เกี่ยวข้องด้วยความหมายที่แตกต่าง:

  1. เมทริกซ์ที่ระบุสมมติฐานว่างเฉพาะในการถดถอยแบบ ANOVA (ไม่เกี่ยวข้องกับรูปแบบการเข้ารหัส) โดยที่แต่ละแถวมีความต่างกัน นี่ไม่ใช่การใช้งานมาตรฐานของคำศัพท์ ฉันใช้การค้นหาข้อความแบบเต็มใน Christensen Plane Answers สำหรับคำถามที่ซับซ้อน Rutherford แนะนำ ANOVA และ ANCOVA; GLM วิธีการและ Rencher & Schaalje เป็น Linear Models ในสถิติ พวกเขาพูดถึง "ความแตกต่าง" มากมาย แต่ไม่เคยพูดถึงคำว่า "ความเปรียบต่างของเมทริกซ์" แต่เป็น @Gus_est พบคำนี้ถูกนำมาใช้ใน Monahan ของรองพื้น on Linear รุ่น

  2. เมทริกซ์ที่ระบุรูปแบบการเข้ารหัสสำหรับเมทริกซ์การออกแบบในการวิเคราะห์ความแปรปรวน นี่คือวิธีการใช้คำว่า "ความเปรียบต่างของเมทริกซ์" ในชุมชน R (ดูเช่นคู่มือนี้หรือหน้าความช่วยเหลือนี้ )

คำตอบโดย @Gus_est สำรวจความหมายแรก คำตอบโดย @ttnphns สำรวจความหมายที่สอง (เขาเรียกมันว่า "matrix coding matrix" และยังกล่าวถึง "matrix coefficient matrix" ซึ่งเป็นคำมาตรฐานในวรรณคดี SPSS)


ความเข้าใจของฉันคือการที่คุณถามเกี่ยวกับความหมาย # 2 ดังนั้นที่นี่ไปนิยาม:

"ความเปรียบต่างของเมทริกซ์" ในความหมาย R คือเมทริกซ์โดยที่คือจำนวนของกลุ่มโดยระบุว่าการเข้ารหัสความเป็นสมาชิกกลุ่มในการออกแบบเมทริกซ์อย่างไร โดยเฉพาะถ้าเป็น -th สังเกตอยู่ในกลุ่มแล้ว{IJ}k×kCkXmiXmj=Cij

หมายเหตุ:โดยปกติแล้วคอลัมน์แรกของคือคอลัมน์ของทุกคอลัมน์ (ตรงกับคอลัมน์สกัดกั้นในเมทริกซ์การออกแบบ) เมื่อคุณเรียกใช้คำสั่ง R คุณจะได้รับ matrixโดยไม่มีคอลัมน์แรกนี้Ccontr.treatment(4)C


ฉันวางแผนที่จะขยายคำตอบนี้เพื่อแสดงความคิดเห็นเพิ่มเติมเกี่ยวกับคำตอบของ @ttnphns และ @Gus_est


The answer by @Gus_est explores the first meaning. The answer by @ttnphns explores the second meaning.ฉันประท้วง (และฉันประหลาดใจที่ได้ยิน - หลังจากที่เราทั้งคู่สนทนากันนานเกี่ยวกับคำจำกัดความในความคิดเห็นต่อคำตอบ mty) ฉันเชิญสองคำ: เมทริกซ์สัมประสิทธิ์ความคมชัด (ที่แถวคือความแตกต่าง และเมทริกสคีการเข้ารหัสความคมชัดหรือเมทริกซ์ C ทั้งคู่มีความเกี่ยวข้องกันฉันได้พูดคุยกันทั้งคู่
ttnphns

(ต่อ.) ความคมชัดสัมประสิทธิ์ L เมทริกซ์เป็นระยะมาตรฐานในการวิเคราะห์ความแปรปรวน / ทั่วไปเชิงเส้นรุ่นที่ใช้ในตำราและเอกสาร SPSS, ตัวอย่างเช่น รูปแบบการเข้ารหัสดูที่นี่
ttnphns

You were asking about meaning #2จริงๆแล้วเราไม่แน่ใจว่าคำว่า OP หมายถึงอะไร OP แสดงตัวอย่างของรูปแบบการเข้ารหัสความคมชัด - ไม่จำเป็นต้องหมายความว่าเขาไม่สนใจเมทริกซ์ L
ttnphns

1
ฉันมีความสุขที่เราพูดภาษาเดียวกันได้แล้ว อย่างน้อยก็ดูเหมือนว่า มันจะดีสำหรับทุกคนโดยเฉพาะอย่างยิ่งผู้อ่านผู้เข้าชมหากคุณตอบคำถามของคุณโดยแสดงให้เห็นว่ารายงานของ Gus 'และ ttnphns เปลี่ยนเป็นผลลัพธ์เดียวกันได้อย่างไร หากคุณต้องการสำเร็จ
ttnphns

1
(ต่อ) แน่นอนว่าเมทริกซ์ L ในทั้ง "วิธีการ" นั้นเหมือนกัน (และไม่จำเป็นต้องใช้เมทริกซ์ G ลึกลับ) แสดงให้เห็นว่าทั้งสองเส้นทางที่เทียบเท่ากัน (L คืออะไรก็ได้ X คือ Dummies): L -> XC -> regression -> resultและX -> [regression -> adjusting to test for L] -> resultให้ผลลัพธ์เหมือนเดิม เส้นทางที่สองคือวิธีที่โปรแกรม ANOVA จะทำ (ส่วนที่อยู่ในวงเล็บ []); เส้นทางที่ 1 คือการสาธิตการสอนว่าความแตกต่างสามารถแก้ไขได้ผ่านโปรแกรมการถดถอยเท่านั้น
ttnphns

3

ความเปรียบต่างเปรียบเทียบสองกลุ่มโดยเปรียบเทียบความแตกต่างกับศูนย์ ในเมทริกซ์ความแตกต่างแถวคือความแตกต่างและต้องเพิ่มเป็นศูนย์คอลัมน์คือกลุ่ม ตัวอย่างเช่น:

สมมติว่าคุณมี 4 กลุ่ม A, B, C, D ที่คุณต้องการเปรียบเทียบจากนั้นเมทริกซ์ความคมชัดจะเป็น:

กลุ่ม: ABCD
A กับ B: 1 -1 0 0
C กับ D: 0 0 -1 1
A, B กับ D, C: 1 1 -1 -1

การถอดความจากความเข้าใจการทดลองทางอุตสาหกรรม :

หากมีกลุ่มของวัตถุ k ที่จะเปรียบเทียบกับกลุ่มย่อยเฉลี่ย k ความคมชัดจะถูกกำหนดในชุดของวัตถุ k นี้โดยชุดของค่าสัมประสิทธิ์ k ใด ๆ [c1, c2, c3, ... cj, ... , ck ] จำนวนนั้นเป็นศูนย์

ให้ C เป็นความแตกต่างแล้ว

C=c1μ1+c2μ2+...cjμj+...ckμk

C=j=1kcjμj

ด้วยข้อ จำกัด

j=1kcj=0

กลุ่มย่อยที่ได้รับการกำหนดค่าสัมประสิทธิ์เป็นศูนย์จะถูกแยกออกจากการเปรียบเทียบ (*)

มันเป็นสัญญาณของสัมประสิทธิ์ที่กำหนดการเปรียบเทียบไม่ใช่ค่าที่เลือก ค่าสัมบูรณ์ของสัมประสิทธิ์สามารถเป็นอะไรก็ได้ตราบใดที่ผลรวมของสัมประสิทธิ์เป็นศูนย์

(*) ซอฟต์แวร์ทางสถิติแต่ละรายการมีวิธีที่แตกต่างกันในการระบุว่าจะแยก / รวมกลุ่มย่อยใด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.