ตัวแปรเอียงใน PCA หรือการวิเคราะห์ปัจจัย


9

ฉันต้องการทำการวิเคราะห์องค์ประกอบหลัก (การวิเคราะห์ปัจจัย) บน SPSS โดยใช้ตัวแปร 22 ตัว อย่างไรก็ตามตัวแปรบางตัวของฉันเบ้มาก (ความเบ้คำนวณจาก SPSS อยู่ในช่วง 2-80!)

ดังนั้นนี่คือคำถามของฉัน:

  1. ฉันควรเก็บตัวแปรที่เอียงเหล่านั้นไว้หรือฉันสามารถเปลี่ยนตัวแปรในการวิเคราะห์องค์ประกอบหลักได้หรือไม่ ถ้าใช่ฉันจะตีความคะแนนตัวประกอบอย่างไร

  2. ฉันควรเปลี่ยนรูปแบบใด log10 หรือ ln

  3. เดิมที KMO ของฉัน (Kaiser – Meyer – Olkin) คือ 0.413 วรรณกรรมจำนวนมากแนะนำขั้นต่ำ 0.5 ฉันยังคงทำการวิเคราะห์ปัจจัยหรือฉันต้องลบตัวแปรเพื่อเพิ่ม KMO ของฉันเป็น 0.5 หรือไม่


5
One note: PCA ไม่เหมือนกับการวิเคราะห์ปัจจัย PCA เป็นวิธีการลดข้อมูล FA เป็นความพยายามในการค้นหาตัวแปรแฝง พวกเขามักจะ ( แต่ไม่เสมอไป) ให้ผลที่คล้ายกัน
ปีเตอร์ Flom

คำตอบ:


9
  1. ปัญหาความเบ้ใน PCA นั้นเหมือนกับในการถดถอย: หางที่ยาวกว่าถ้ามันยาวมากเมื่อเทียบกับช่วงการกระจายทั้งหมดจริง ๆ แล้วจะทำงานเหมือนค่าผิดปกติขนาดใหญ่ - มันดึงสายพอดี (ส่วนประกอบหลักในกรณีของคุณ) ตัวเองเพราะอิทธิพลของมันคือการปรับปรุง; อิทธิพลของมันเพิ่มขึ้นเพราะมันอยู่ไกลจากค่าเฉลี่ย ในบริบทของ PCA ที่ให้ตัวแปรที่เบ้ค่อนข้างคล้ายคลึงกับการทำ PCA โดยไม่ต้องอยู่ตรงกลางของข้อมูล (เช่นการทำ PCA บนพื้นฐานของโคไซน์เมทริกซ์มากกว่าเมทริกซ์สหสัมพันธ์) คุณคือผู้ตัดสินใจว่าจะอนุญาตให้หางยาวมีอิทธิพลต่อผลลัพธ์อย่างมาก (และปล่อยให้ข้อมูล) หรือไม่ (และแปลงข้อมูล) ปัญหาไม่ได้เชื่อมโยงกับการตีความการโหลด

  2. ตามที่คุณต้องการ.

  3. KMO เป็นดัชนีที่บอกคุณว่าความสัมพันธ์บางส่วนมีขนาดเล็กพอสมควรที่จะส่งข้อมูลไปยังการวิเคราะห์ปัจจัย เพราะในการวิเคราะห์ปัจจัยโดยทั่วไปเราคาดหวังว่าปัจจัยที่จะโหลดมากกว่าสองตัวแปร KMO ของคุณต่ำพอ คุณสามารถทำให้ดีขึ้นได้ถ้าคุณลดลงจากตัวแปรการวิเคราะห์ด้วยค่า KMO ต่ำ ๆ (รูปแบบเหล่านี้เป็นเส้นทแยงมุมของเมทริกซ์ต่อต้านภาพคุณสามารถขอให้แสดงเมทริกซ์นี้ในขั้นตอน SPSS Factor) การเปลี่ยนรูปแบบตัวแปรเป็นการกู้คืน KMO ที่เบ้น้อยลงหรือไม่ ใครจะรู้. อาจจะ. โปรดทราบว่า KMO มีความสำคัญส่วนใหญ่ในแบบจำลองการวิเคราะห์ปัจจัยไม่ใช่แบบจำลองการวิเคราะห์องค์ประกอบหลัก: ใน FA คุณพอดีกับความสัมพันธ์แบบคู่ในขณะที่ PCA คุณไม่ได้


2

+1 ถึง @ttnphns ฉันแค่ต้องการขยายจุดเล็กน้อย # 2 การเปลี่ยนรูปมักใช้เพื่อทำให้ภาพเอียง @ttnphns ชี้ให้เห็นคุณจะต้องใช้สิ่งเหล่านี้ก่อนที่คุณจะทำการวิเคราะห์ การแปลงไฟล์บันทึกเป็นส่วนหนึ่งของตระกูลการแปลงพลังงานของ Box-Cox. คุณจะต้องพิจารณาช่วงกว้างของการแปลงที่เป็นไปได้มากกว่าเพียงแค่บันทึก (เช่นสแควร์รูท, ส่วนกลับ, ฯลฯ ) ทางเลือกระหว่างฐานลอการิทึมที่แตกต่างกันไม่มีผลต่อความแข็งแรงของการเปลี่ยนแปลง เมื่อผู้คนกำลังทำงานคณิตศาสตร์กับตัวแปรที่แปลงสภาพบางครั้งอาจต้องการบันทึกธรรมชาติเนื่องจากบันทึกธรรมชาติสามารถทำให้คณิตศาสตร์สะอาดขึ้นได้ในบางกรณี หากคุณไม่สนใจสิ่งนั้นคุณอาจต้องการเลือกฐานที่จะช่วยในการตีความ นั่นคือแต่ละหน่วยที่เพิ่มขึ้นในระดับใหม่จะแสดงถึงฐาน- เพิ่มขึ้นในระดับเดิม (เช่นหากคุณใช้ log base 2 ทุกหน่วยจะเพิ่มขึ้น 2 เท่าฐาน 10 หมายความว่าทุกหน่วยจะเพิ่มขึ้น 10 เท่าเป็นต้น) ดังนั้นจึงน่าจะดี เพื่อเลือกฐานที่ข้อมูลของคุณจะครอบคลุมหลายหน่วยในสเกลที่ถูกแปลง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.