ฉันเป็นนักศึกษาระดับบัณฑิตศึกษาสาขาวิทยาศาสตร์คอมพิวเตอร์ ฉันทำการวิเคราะห์ปัจจัยเชิงสำรวจสำหรับโครงการวิจัย เพื่อนร่วมงานของฉัน (ที่เป็นผู้นำโครงการ) ใช้ SPSS ในขณะที่ฉันต้องการใช้ R สิ่งนี้ไม่สำคัญจนกว่าเราจะค้นพบความแตกต่างที่สำคัญระหว่างสองแพ็คเกจทางสถิติ
เราใช้แกนแฟคตอริ่งระหว่างการแยก (โปรดทราบว่าฉันตระหนักดีถึงความแตกต่างระหว่าง PCA และการวิเคราะห์ปัจจัยและเราไม่ได้ใช้ PCAอย่างน้อยก็ไม่ได้ตั้งใจ) จากสิ่งที่ฉันได้อ่านสิ่งนี้ควรสอดคล้องกับวิธี "แกนหลัก" ใน R และ "แกนตัวประกอบแฟคตอริ่งหลัก" หรือ "สแควร์สแควร์น้อยที่สุด" ใน SPSSตามเอกสาร R เราจะใช้วิธีการเอียงหมุน (เฉพาะPromax ) เพราะเราคาดว่าปัจจัยที่มีความสัมพันธ์และมีการตีความเมทริกซ์รูปแบบ
การรันสองโพรซีเดอร์ใน R และ SPSS มีความแตกต่างที่สำคัญ เมทริกซ์รูปแบบให้การโหลดที่แตกต่างกัน แม้ว่าสิ่งนี้จะให้ปัจจัยเดียวกันกับความสัมพันธ์ของตัวแปรมากขึ้นหรือน้อยลง แต่ก็มีความแตกต่างระหว่างการโหลดที่สอดคล้องกันถึง 0.15 ซึ่งดูเหมือนจะมากกว่าที่คาดไว้โดยการใช้วิธีการสกัดและการหมุนแบบโปรแม็กซ์ที่แตกต่างกัน อย่างไรก็ตามนั่นไม่ใช่ความแตกต่างที่น่าตกใจที่สุด
ความแปรปรวนสะสมที่อธิบายโดยปัจจัยอยู่ที่ประมาณ 40% ในผลลัพธ์ SPSS และ 31% ในผลลัพธ์ R นี่เป็นความแตกต่างอย่างมากและทำให้เพื่อนร่วมงานของฉันต้องการใช้ SPSS แทนอาร์ฉันไม่มีปัญหากับเรื่องนี้ แต่ความแตกต่างที่ยิ่งใหญ่ทำให้ฉันคิดว่าเราอาจตีความบางอย่างผิดพลาดซึ่งเป็นปัญหา
SPSS รายงานความแปรปรวนที่อธิบายต่างชนิดกันเมื่อเราทำการสำรวจน่านน้ำมากขึ้นเมื่อเราเรียกใช้การแยกตัวประกอบกำลังสองน้อยที่สุด สัดส่วนของความแปรปรวนที่อธิบายโดยค่าเริ่มต้นเป็นค่าเริ่มต้น 40% ในขณะที่สัดส่วนของความแปรปรวนที่อธิบายจากการแยกจำนวนของการโหลด Squared (SSL) คือ 33% นี่ทำให้ฉันคิดว่าค่าเริ่มต้นไม่ใช่ค่าที่เหมาะสมที่จะดู (ฉันสงสัยว่านี่คือความแปรปรวนที่อธิบายไว้ก่อนการหมุนแม้ว่ามันจะใหญ่ไปกว่าฉันก็ตาม) ยิ่งสับสน SPSS ยังแสดง Rotation SSL แต่ไม่คำนวณเปอร์เซ็นต์ของความแปรปรวนที่อธิบาย (SPSS บอกฉันว่าการมีปัจจัยที่มีความสัมพันธ์กันหมายความว่าฉันไม่สามารถเพิ่ม SSL เพื่อค้นหาความแปรปรวนทั้งหมดซึ่งสมเหตุสมผลกับคณิตศาสตร์ที่ฉันเคยเห็น) SSL ที่รายงานจาก R ไม่ตรงกับสิ่งเหล่านี้และ R บอกฉันว่าอธิบายความแปรปรวนทั้งหมด 31% SSL ของ R เหมาะกับ Rotation SSL มากที่สุด ค่าลักษณะเฉพาะของ R จากเมทริกซ์สหสัมพันธ์เดิมตรงกับค่าเริ่มต้นจาก SPSS
นอกจากนี้โปรดทราบว่าฉันได้เล่นกับการใช้วิธีการที่แตกต่างกันและ ULS และ PAF ของ SPSS ดูเหมือนจะตรงกับวิธี PA ของ R ใกล้เคียงที่สุด
คำถามเฉพาะของฉัน:
- ฉันควรคาดหวังความแตกต่างระหว่าง R กับ SPSS มากเพียงใดด้วยการใช้การวิเคราะห์ปัจจัย
- ผลรวมของการโหลดกำลังสองจาก SPSS ใดที่ฉันควรแปลความหมายค่าเริ่มต้นการสกัดหรือการหมุน
- มีปัญหาอื่นอีกไหมที่ฉันอาจมองข้ามไป
สายของฉันไปที่ SPSS และ R มีดังนี้:
SPSS:
FACTOR
/VARIABLES <variables>
/MISSING PAIRWISE
/ANALYSIS <variables>
/PRINT INITIAL KMO AIC EXTRACTION ROTATION
/FORMAT BLANK(.35)
/CRITERIA FACTORS(6) ITERATE(25)
/EXTRACTION ULS
/CRITERIA ITERATE(25)
/ROTATION PROMAX(4).
R:
library(psych)
fa.results <- fa(data, nfactors=6, rotate="promax",
scores=TRUE, fm="pa", oblique.scores=FALSE, max.iter=25)