จะคำนวณความสัมพันธ์ระหว่าง / ภายในกลุ่มของตัวแปรอย่างไร


13

ฉันมีเมทริกซ์จำนวน 1,000 การสังเกตและ 50 ตัวแปรแต่ละตัววัดในระดับ 5 จุด ตัวแปรเหล่านี้ถูกจัดกลุ่มเป็นกลุ่ม แต่มีจำนวนตัวแปรไม่เท่ากันในแต่ละกลุ่ม

ฉันต้องการคำนวณสหสัมพันธ์สองประเภท:

  1. ความสัมพันธ์ภายในกลุ่มของตัวแปร (ในลักษณะ): การวัดว่าตัวแปรภายในกลุ่มของตัวแปรกำลังวัดสิ่งเดียวกันหรือไม่
  2. ความสัมพันธ์ระหว่างกลุ่มของตัวแปร: การวัดบางอย่างสมมติว่าแต่ละกลุ่มสะท้อนลักษณะโดยรวมหนึ่งลักษณะว่าแต่ละลักษณะ (กลุ่ม) เกี่ยวข้องกับลักษณะอื่น ๆ อย่างไร

ลักษณะเหล่านี้เคยถูกจำแนกออกเป็นกลุ่ม ฉันสนใจที่จะหาความสัมพันธ์ระหว่างกลุ่ม - เช่นสมมติว่าลักษณะภายในกลุ่มกำลังวัดลักษณะพื้นฐานเดียวกัน (หลังจากเสร็จสิ้น # 1 ด้านบน - อัลฟ่าของครอนบาค) มีความสัมพันธ์กันหรือไม่?

ไม่มีใครมีคำแนะนำสำหรับการเริ่มต้นหรือไม่


1
หากคุณคุ้นเคยกับ R จะมีแพ็คเกจที่veganมีฟังก์ชั่นanosimหรือเด่นกว่าadonis(permutational MANOVA)
Roman Luštrik

ฉันได้อัปเดตคำถามของคุณเพื่อพยายามใช้คำศัพท์มาตรฐาน (เช่นตัวแปรที่ไม่ใช่ลักษณะเฉพาะกลุ่มของตัวแปรมากกว่า "กลุ่ม")
Jeromy Anglim

คำตอบ:


16

สิ่งที่ @rolando แนะนำดูเหมือนเป็นการเริ่มต้นที่ดีหากไม่ใช่คำตอบทั้งหมด (IMO) ให้ฉันดำเนินการตามแนวทางสหสัมพันธ์ตามกรอบทฤษฎีการทดสอบคลาสสิก (CTT) ที่นี่ตามที่ระบุไว้โดย @Jeromy การวัดสรุปสำหรับกลุ่มคุณลักษณะของคุณอาจถือเป็นคะแนนรวม (หรือผลรวม) ของรายการทั้งหมด (คุณลักษณะในคำพูดของคุณ) ซึ่งเป็นของสิ่งที่ฉันจะอ้างถึงในระดับนี้ ภายใต้ CTT สิ่งนี้ช่วยให้เราสามารถกำหนดลักษณะนิสัยหรือความรับผิดของแต่ละบุคคลอย่างเป็นทางการในระดับที่ต่อเนื่องซึ่งสะท้อนการสร้างพื้นฐาน (ลักษณะแฝง) แม้ว่าที่นี่จะเป็นเพียงมาตราส่วนตามลำดับ .

สิ่งที่คุณอธิบายเกี่ยวกับสิ่งที่รู้กันว่าเป็นบรรจบ (สิ่งที่ขอบเขตของรายการในระดับเดียวกันมีความสัมพันธ์ซึ่งกันและกัน) และการเลือกปฏิบัติ (รายการที่อยู่ในระดับที่แตกต่างกันไม่ควรมีความสัมพันธ์ในระดับที่ดี) ใน psychometrics เทคนิคคลาสสิกรวมถึงการวิเคราะห์หลายวิธีหลายวิธี (MTMM) (Campbell & Fiske, 1959) ภาพประกอบแสดงวิธีการทำงานด้านล่าง (สามวิธีหรือเครื่องมือสามโครงสร้างหรือลักษณะ):

ป้อนคำอธิบายรูปภาพที่นี่

ในเมทริกซ์ MTMM นี้องค์ประกอบในแนวทแยงอาจจะเป็นความสัมพันธ์ระหว่างอินเทราคลาสของครอนบาคหรือทดสอบซ้ำ สิ่งเหล่านี้เป็นตัวบ่งชี้ความน่าเชื่อถือของแต่ละขนาดการวัด ความถูกต้องของสมมติฐาน (ร่วม) สร้างโดยจะมีการประเมินความสัมพันธ์ของคะแนนตาชั่งเมื่อเครื่องมือที่แตกต่างกันจะใช้ในการประเมินลักษณะเดียวกัน หากเครื่องมือเหล่านี้ได้รับการพัฒนาอย่างอิสระความสัมพันธ์สูง ( ) จะสนับสนุนแนวคิดที่กำหนดไว้ในลักษณะที่สอดคล้องและมีวัตถุประสงค์ เซลล์ที่เหลืออยู่ในเมทริกซ์ MTMM นี้สรุปความสัมพันธ์ระหว่างลักษณะภายในเมธอดและระหว่างลักษณะข้ามเมธอด< .3>0.7และบ่งบอกถึงวิธีการสร้างสิ่งก่อสร้างที่ไม่เหมือนใครด้วยเกล็ดที่แตกต่างกันและความสัมพันธ์ระหว่างคุณลักษณะแต่ละอย่างในระดับที่กำหนด สมมติว่าคุณสมบัติอิสระโดยทั่วไปเราไม่คาดหวังว่าจะสูง (เกณฑ์ที่แนะนำคือ ) แต่สามารถทำการทดสอบสมมติฐานอย่างเป็นทางการได้มากกว่า (ตามการประมาณค่าสหสัมพันธ์) สามารถทำได้ ความละเอียดอ่อนคือเราใช้สิ่งที่เรียกว่า "rest correlation" นั่นคือเราคำนวณความสัมพันธ์ระหว่างไอเท็ม (หรือลักษณะ) และสเกลของมัน (หรือวิธีการ) หลังจากลบการสนับสนุนของไอเท็มนี้ไปยังคะแนนรวมของสเกลนี้ ที่ทับซ้อนกัน)<.3

แม้ว่าวิธีการนี้จะได้รับการพัฒนาเพื่อประเมินความถูกต้องของคอนเวอร์เจนซ์และการเลือกปฏิบัติในลักษณะที่กำหนดจำนวนหนึ่งซึ่งศึกษาโดยเครื่องมือวัดที่แตกต่างกัน จากนั้นลักษณะจะกลายเป็นรายการและวิธีการเป็นเพียงเครื่องชั่งที่แตกต่างกัน ลักษณะทั่วไปของวิธีการนี้เพื่อเป็นเครื่องมือเดียวที่เป็นที่รู้จักกันปรับ multitrait รายการที่สัมพันธ์กันตามที่คาดไว้ (เช่นมีขนาดของตัวเองมากกว่าระดับที่แตกต่างกัน) จะนับเป็นความสำเร็จในการไต่ระดับ. อย่างไรก็ตามเรามักจะสมมติว่าเครื่องชั่งที่แตกต่างกันนั้นไม่มีความสัมพันธ์กันนั่นคือเครื่องชั่งเหล่านี้มีเป้าหมายอยู่ที่การสร้างสมมุติฐานที่แตกต่างกัน แต่การหาค่าเฉลี่ยของความสัมพันธ์ภายในและระหว่างขนาดเป็นวิธีที่รวดเร็วในการสรุปโครงสร้างภายในของเครื่องมือของคุณ อีกวิธีที่สะดวกในการทำเช่นนี้คือการใช้การวิเคราะห์กลุ่มบนเมทริกซ์ของความสัมพันธ์แบบคู่และดูว่าตัวแปรของคุณทำงานร่วมกันอย่างไร

จากการสังเกตในทั้งสองกรณีจะใช้การทำงานร่วมกับการวัดความสัมพันธ์โดยทั่วไปนั่นคือคุณไม่สามารถอธิบายถึงข้อผิดพลาดในการวัดคุณต้องมีตัวอย่างจำนวนมากเครื่องมือหรือการทดสอบจะถือว่าเป็น "ขนาน" (tau-สมมูลข้อผิดพลาด uncorrelated ความแตกต่างข้อผิดพลาดเท่ากับ)

ส่วนที่สองที่ได้รับการแก้ไขโดย @rolando ก็น่าสนใจเช่นกัน: หากไม่มีสิ่งบ่งชี้ทางทฤษฎีหรือเนื้อหาสาระที่ชัดเจนว่าการจัดกลุ่มรายการที่มีอยู่แล้วเหมาะสมคุณจะต้องหาวิธีที่จะเน้นโครงสร้างของข้อมูลด้วยเช่นการวิเคราะห์ปัจจัยเชิงสำรวจ . แต่ถึงแม้ว่าคุณจะเชื่อถือ "ลักษณะเฉพาะภายในกลุ่ม" คุณสามารถตรวจสอบว่านี่เป็นข้อสมมติฐานที่ถูกต้อง ตอนนี้คุณอาจใช้รูปแบบการวิเคราะห์ปัจจัยยืนยันเพื่อตรวจสอบว่ารูปแบบของการโหลดรายการ (ความสัมพันธ์ของรายการที่มีระดับของตนเอง) ทำงานตามที่คาดไว้

แทนที่จะใช้วิธีการวิเคราะห์ปัจจัยแบบดั้งเดิมคุณสามารถดูการจัดกลุ่มรายการ (Revelle, 1979) ซึ่งอาศัยกฎการแยกแบบอิงแอลฟาของครอนบาคเพื่อจัดกลุ่มรายการเข้าด้วยกันเป็นเครื่องชั่งที่เป็นเนื้อเดียวกัน

คำสุดท้าย: หากคุณใช้ R มีสองแพ็คเกจที่ดีมากที่จะช่วยลดขั้นตอนดังกล่าว:

  • วิญญาณให้คุณมีทุกสิ่งที่คุณต้องการสำหรับการเริ่มต้นด้วยวิธีการ psychometrics รวมถึงการวิเคราะห์ปัจจัย ( fa, fa.parallel, principal) รายการจัดกลุ่ม ( ICLUSTและวิธีการที่เกี่ยวข้อง), อัลฟาของ Cronbach ( alpha); มีภาพรวมที่ดีมีอยู่ในเว็บไซต์วิลเลียมเรเวลล์โดยเฉพาะอย่างยิ่งความรู้เบื้องต้นเกี่ยวกับทฤษฎีทางจิตวิทยากับการประยุกต์ใช้ในการวิจัย
  • psyรวมถึงพล็อตหินกรวด (ผ่านชุดข้อมูล PCA + จำลอง) ( scree.plot) และ MTMM ( mtmm)

อ้างอิง

  1. Campbell, DT และ Fiske, DW (1959) การตรวจสอบความเข้ากันได้และการจำแนกโดยเมทริกซ์หลายวิธี แถลงการณ์ทางจิตวิทยา , 56: 81–105
  2. Hays, RD และ Fayers, P. (2005) การประเมินสเกลหลายรายการ ในการประเมินคุณภาพชีวิตในการทดลองทางคลินิก (เฟย์เยอร์, ​​พี. และเฮย์ส, อาร์, สหพันธ์), หน้า 41-53 ฟอร์ด
  3. Revelle, W. (1979) การวิเคราะห์คลัสเตอร์ตามลำดับชั้นและโครงสร้างภายในของการทดสอบ การวิจัยพฤติกรรมหลายตัวแปร , 14: 57-74

บางทีนี่อาจเป็นคำตอบที่น่าสนใจที่สุดที่ฉันเคยอ่านเกี่ยวกับการแลกเปลี่ยนและฉันเรียนเศรษฐศาสตร์มา 5 ปีแล้ว
d8aninja

เมทริกซ์ MTMM รวมอยู่ที่นี่ควรจะเป็นตัวอย่างจริงของเมทริกซ์สหสัมพันธ์หรือไม่ ถ้าเป็นเช่นนั้นฉันจะทราบว่ามันไม่ได้เป็นเมทริกซ์ semidefinite ที่เป็นบวก: ตัวอย่างเช่น 4-by-4 รองสำหรับความสัมพันธ์ของลักษณะ 1,2 ข้ามวิธีที่ 1,2 มีค่า -0.0419179 (เนื่องจากนี่เป็นค่าลบเล็กน้อยนี่อาจจะเป็นเพียงจุดของคุณอีกครั้ง: 'ข้อผิดพลาดการวัด')
Semiclassical

7

วิธีที่ฉันอ่านคำศัพท์ของคุณสิ่งที่คุณต้องการคืออันดับแรกเพื่อประเมินความสอดคล้องภายในของแต่ละกลุ่มของตัวแปรแล้วประเมินความสัมพันธ์ระหว่างคะแนนสเกลซึ่งประกอบด้วยค่าเฉลี่ยของตัวแปรแต่ละกลุ่ม สิ่งแรกสามารถทำได้โดยใช้อัลฟ่าของครอนบาคและอันดับที่สองใช้สหสัมพันธ์เพียร์สัน สิ่งนี้ถือว่าคุณมีการแจกแจงแบบปกติที่สมเหตุสมผลและความสัมพันธ์เชิงเส้นที่สมเหตุสมผล

วิธีการที่เกี่ยวข้องมากขึ้นและไม่จำเป็นต้องเป็นวิธีที่จำเป็นก็คือการวิเคราะห์ปัจจัยเชิงสำรวจ คุณจะพยายามสร้างตัวแปรที่ควรจะจัดกลุ่มเข้าด้วยกันและจากนั้นอีกครั้งว่าปัจจัยเหล่านั้นจะสัมพันธ์กันในระดับใด หากคุณลองใช้วิธีนี้ตรวจสอบให้แน่ใจว่าคุณใช้การหมุนเอียงเพื่ออนุญาตให้ความสัมพันธ์เหล่านั้นปรากฏขึ้น ไม่ว่าคุณจะใช้การสกัดส่วนประกอบหลักหรือการสกัดแกนหลักขึ้นอยู่กับว่าตัวแปรของคุณมีวัตถุประสงค์การวัดที่ปราศจากข้อผิดพลาดหรือวัตถุที่เป็นอัตนัยเช่นรายการสำรวจที่มีข้อผิดพลาดจำนวนหนึ่งหรือไม่


ขอบคุณสำหรับคำตอบของคุณ ฉันสามารถคำนวณอัลฟ่าของครอนบาชได้ แต่หนึ่งวิธีคำนวณสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันในกรณีนี้ได้อย่างไร ฉันสามารถคำนวณพวกมันแบบคู่ตามลำดับสำหรับแต่ละลักษณะ แต่ฉันอยากรู้วิธีคำนวณความสัมพันธ์ระหว่างกลุ่มของลักษณะเฉพาะ ลักษณะภายในกลุ่มจะมีคะแนนคล้ายกันสำหรับการสังเกตแต่ละครั้ง ฉันจะแก้ไขคำถามเพื่อให้ชัดเจนขึ้น
blep

5
  • เครื่องมือมาตรฐานอย่างน้อยทางจิตวิทยาในสถานการณ์ของคุณคือการวิเคราะห์เชิงสำรวจและยืนยันปัจจัยเพื่อประเมินการรวมกันของเมทริกซ์ความสัมพันธ์ระหว่างรายการกับรูปแบบที่เสนอบางส่วนของความสัมพันธ์ระหว่างปัจจัยและรายการ วิธีที่คุณใช้ถ้อยคำคำถามของคุณแนะนำว่าคุณอาจไม่คุ้นเคยกับวรรณกรรมนี้ ยกตัวอย่างเช่นที่นี่เป็นบันทึกของฉันในการก่อสร้างขนาดและการวิเคราะห์ปัจจัยและนี่คือการกวดวิชาใน R ในแบบฟอร์มการวิเคราะห์ปัจจัย Quick-R ดังนั้นในขณะที่มันคุ้มค่าที่จะตอบคำถามของคุณโดยเฉพาะฉันคิดว่าเป้าหมายที่กว้างขึ้นของคุณจะได้รับการบริการที่ดีขึ้นโดยการตรวจสอบวิธีการวิเคราะห์ปัจจัยเพื่อประเมินเครื่องชั่งหลายปัจจัยหลายรายการ

  • กลยุทธ์มาตรฐานอีกอย่างหนึ่งก็คือการคำนวณคะแนนรวมสำหรับแต่ละกลุ่มของตัวแปร (สิ่งที่ฉันเรียกว่า "สเกล") และเชื่อมโยงเครื่องชั่ง

  • เครื่องมือวิเคราะห์ความน่าเชื่อถือจำนวนมากจะรายงานความสัมพันธ์ระหว่างรายการโดยเฉลี่ย

  • หากคุณสร้างเมทริกซ์ความสัมพันธ์ 50 ถึง 50 ระหว่างไอเท็มคุณสามารถเขียนฟังก์ชันใน R ที่เซตย่อยเฉลี่ยโดยขึ้นอยู่กับการรวมกันของกลุ่มของตัวแปร คุณอาจไม่ได้สิ่งที่คุณต้องการหากคุณมีส่วนผสมของรายการเชิงบวกและเชิงลบเนื่องจากความสัมพันธ์เชิงลบอาจยกเลิกความสัมพันธ์เชิงบวก


2

ฉันขอแนะนำให้ใช้แทนความคิดความสัมพันธ์ซึ่งกำหนดไว้สำหรับความฉลาดทางคู่ความคิดของข้อมูลร่วมกันและบูรณาการในแบบจำลองเกาส์

ในแบบจำลองเกาส์การรวมกลุ่มของตัวแปรถูกกำหนดให้เป็นเอนโทรปีของกลุ่ม:G1

I1log(|C1|)

ที่เป็นเมทริกซ์ความสัมพันธ์ของกลุ่มตัวแปรG_1มันเป็นเรื่องง่ายที่จะเห็นว่าถ้าประกอบด้วยเพียง 2 ตัวแปรบูรณาการของมันคือซึ่งเกี่ยวข้องโดยตรงกับค่าสัมประสิทธิ์สหสัมพันธ์คู่ของตัวแปร\G 1 G 1 l o g ( 1 - ρ 2 ) ρC1G1G1log(1ρ2)ρ

ในการคำนวณการโต้ตอบระหว่างสองกลุ่มของตัวแปรคุณสามารถใช้ข้อมูลร่วมกันซึ่งเป็นเพียงการข้ามเอนโทรปีระหว่างกลุ่ม:

MU12=I12I1I2

ฉันพบข้อมูลอ้างอิงเกี่ยวกับความคิดเหล่านี้หลังจาก Google ด่วนที่อาจเป็นประโยชน์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.