การตีความคะแนน PCA


16

มีใครช่วยฉันในการตีความคะแนน PCA หรือไม่ ข้อมูลของฉันมาจากแบบสอบถามเกี่ยวกับทัศนคติที่มีต่อหมี จากการโหลดฉันได้ตีความองค์ประกอบหลักอย่างหนึ่งของฉันว่า "กลัวหมี" คะแนนขององค์ประกอบหลักนั้นจะเกี่ยวข้องกับวิธีการที่ผู้ตอบแต่ละคนประเมินถึงองค์ประกอบหลักนั้นหรือไม่


คำตอบสั้น ๆ สำหรับคำถามของคุณคือใช่
อะมีบาพูดว่า Reinstate Monica

คำตอบ:


13

โดยทั่วไปคะแนนปัจจัยจะถูกคำนวณเป็นการตอบสนองแบบถ่วงน้ำหนักโดยการโหลดปัจจัย ดังนั้นคุณต้องดูการโหลดปัจจัยของมิติข้อมูลแรกของคุณเพื่อดูว่าแต่ละตัวแปรเกี่ยวข้องกับองค์ประกอบหลักอย่างไร การสังเกตการโหลดสูงที่เป็นบวก (resp. ลบ) ที่เกี่ยวข้องกับตัวแปรเฉพาะหมายความว่าตัวแปรเหล่านี้มีส่วนสนับสนุนในเชิงบวก (การตอบสนองเชิงลบ) ในส่วนนี้ ดังนั้นคนที่ให้คะแนนสูงในตัวแปรเหล่านี้จะมีแนวโน้มที่จะได้คะแนนปัจจัยที่สูงขึ้น (ลดลง) ในมิตินี้โดยเฉพาะ

การวาดวงกลมความสัมพันธ์มีประโยชน์ที่จะมีความคิดทั่วไปเกี่ยวกับตัวแปรที่สนับสนุน "บวก" กับ "ลบ" (ถ้ามี) ให้กับแกนหลักแรก แต่ถ้าคุณใช้ R คุณอาจดูแพ็คเกจFactoMineRและdimdesc()ฟังก์ชั่น

นี่คือตัวอย่างของUSArrestsข้อมูล:

> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1)  # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
         correlation  p.value
Assault        0.918 5.76e-21
Rape           0.856 2.40e-15
Murder         0.844 1.39e-14
UrbanPop       0.438 1.46e-03
> res$var$coord  # show loadings associated to each axis
         Dim.1  Dim.2  Dim.3   Dim.4
Murder   0.844 -0.416  0.204  0.2704
Assault  0.918 -0.187  0.160 -0.3096
UrbanPop 0.438  0.868  0.226  0.0558
Rape     0.856  0.166 -0.488  0.0371

ดังที่เห็นได้จากผลล่าสุดมิติแรกสะท้อนการกระทำที่รุนแรง (ทุกชนิด) เป็นส่วนใหญ่ ถ้าเราดูที่แผนที่แต่ละอันมันชัดเจนว่ารัฐที่ตั้งอยู่ทางด้านขวาคือสิ่งที่การกระทำดังกล่าวเกิดขึ้นบ่อยที่สุด

ข้อความแสดงแทน ข้อความแสดงแทน

คุณอาจสนใจคำถามที่เกี่ยวข้องนี้: คะแนนองค์ประกอบหลักคืออะไร


5

สำหรับฉันคะแนน PCA เป็นเพียงการจัดเรียงข้อมูลใหม่ในรูปแบบที่ช่วยให้ฉันสามารถอธิบายชุดข้อมูลที่มีตัวแปรน้อยลง คะแนนแสดงจำนวนของแต่ละรายการที่เกี่ยวข้องกับองค์ประกอบ คุณสามารถตั้งชื่อให้พวกเขาตามการวิเคราะห์ปัจจัย แต่สิ่งสำคัญที่ต้องจำไว้ว่าพวกเขาไม่ใช่ตัวแปรแฝงเนื่องจาก PCA จะวิเคราะห์ความแปรปรวนทั้งหมดในชุดข้อมูลไม่ใช่แค่องค์ประกอบที่มีเหมือนกัน (เช่นการวิเคราะห์ปัจจัย)


ใช่คุณพูดถูกว่าไม่มีการรวมโมเดลของข้อผิดพลาดไว้ใน PCA ซึ่งต่างจาก FA ฉัน +1 ในจุดนั้น โปรดทราบว่าฉันพูดว่า "เหมาะสมที่จะต้องพิจารณา" ไม่ใช่ว่าองค์ประกอบหลักที่ดึงมาจาก PCA เป็น LVs จริง แม้ว่าคุณจะสนใจที่จะประเมินความน่าเชื่อถือของเครื่องชั่งหรือรุ่นการวัดก็ตามมันสร้างความแตกต่างเล็กน้อยไม่ว่าคุณจะใช้ PCA หรือ FA ก็ตาม ตอนนี้การวิเคราะห์ข้อมูลมักจะเกี่ยวข้องกับการอธิบายความสัมพันธ์ระหว่างตัวแปรหรือการค้นหากลุ่มวิชาดังนั้นแนวคิดของการตีความหนึ่งมิติหรือมากกว่าของพื้นที่แฟคทอเรียล (... )
chl

(... ) FactoMineRรวมถึงชุดข้อมูลเกี่ยวกับไวน์และวิธีการหลายปัจจัยที่สามารถใช้ในการเล่นกับมัน (PCA, MFA) และแม้แต่ PLS หรือ CCA ที่ทำโดย Michel Tenenhaus
chl

@ chl ขอบคุณสำหรับคำแนะนำเกี่ยวกับแพคเกจฉันจะตรวจสอบว่า ใน PCA กับ FA ฉันเห็นด้วยกับประเด็น ฉันชอบ FA สำหรับการใช้งานส่วนใหญ่เนื่องจากฉันให้ทุนแก่ชุมชน (ความแปรปรวนทั่วไป) ประมาณการว่ามีประโยชน์มากในการประเมินมูลค่าของโครงสร้างปัจจัยเฉพาะ นั่นอาจเป็นความชอบส่วนตัวอย่างไรก็ตาม
richiemorrisroe

คุณพูดถูก (ฉันได้ตอบโต้การตอบกลับของคุณก่อนหน้านี้แล้วเพราะชัดเจนมาก) เป็นเพียงแค่นั้น (ไม่ได้รับการป้องกัน) PCA มีประวัติของตนเองในการวิเคราะห์ข้อมูล (โดยเฉพาะโรงเรียนภาษาฝรั่งเศส) พร้อมกับ CA, MFA, MCA ในทางตรงกันข้าม Paul Kline มีหนังสือสองเล่มที่ดีมากเกี่ยวกับการใช้ FA ในการวิจัยบุคลิกภาพ และหนังสือที่กำลังจะมาถึงของ William Revelle น่าจะเหมาะสำหรับผู้ใช้ R :) ไม่ว่าในกรณีใดผมคิดว่าเราเห็นด้วยว่านี่เป็นเครื่องมือที่มีประโยชน์ในการวิเคราะห์โครงสร้างของเมทริกซ์สหสัมพันธ์
chl

0

ผลลัพธ์ PCA (มิติที่แตกต่างกันหรือเครื่องหมายจุลภาค) โดยทั่วไปไม่สามารถแปลเป็นแนวคิดที่แท้จริงฉันคิดว่าผิดที่คิดว่าหนึ่งในองค์ประกอบคือ "กลัวหมี" สิ่งที่ทำให้คุณคิดว่าเป็นสิ่งที่มีความหมาย? ขั้นตอนส่วนประกอบหลักจะแปลงเมทริกซ์ข้อมูลของคุณเป็นเมทริกซ์ข้อมูลใหม่ที่มีขนาดเท่ากันหรือน้อยกว่าและขนาดมิติที่ได้จะมีขนาดตั้งแต่ผลลัพธ์ที่ดีกว่าอธิบายความแปรปรวนให้ดีขึ้น ส่วนประกอบนี้จะถูกคำนวณตามการรวมกันของตัวแปรดั้งเดิมที่มีการคำนวณ eigenvector โพรซีเดอร์ Overal PCA จะแปลงตัวแปรดั้งเดิมเป็นออร์แกนอน (เชิงเส้นแบบอิสระ) หวังว่าสิ่งนี้จะช่วยให้คุณชี้แจงเกี่ยวกับขั้นตอน PCA เล็กน้อย


คุณจะเห็นด้วยหรือไม่ว่าการรวมกันเชิงเส้นของตัวแปรบางตัวยังคงสามารถตีความได้ว่าเป็นการสะท้อนการมีส่วนร่วมแบบถ่วงน้ำหนักของแต่ละตัวแปรเข้ากับแกนปัจจัยหรือไม่
chl

ใช่นั่นแหละ
mariana soffer

ดังนั้นทำไมจึงป้องกันไม่ให้ตั้งชื่อ ตัวแปรถูกพิจารณาว่าเป็นตัวแปรที่ชัดแจ้งและในบางกรณีการพิจารณาถึงการรวมกันแบบถ่วงน้ำหนักของพวกเขานั้นสะท้อนถึงปัจจัยแฝง (ไม่ได้ตรวจสอบ)
chl
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.