ฉันเปรียบเทียบ?prcomp
และ?princomp
พบบางสิ่งเกี่ยวกับการวิเคราะห์องค์ประกอบหลักของ Q-mode และ R-mode (PCA) แต่อย่างสุจริต - ฉันไม่เข้าใจ ใครสามารถอธิบายความแตกต่างได้และอาจอธิบายได้ว่าจะใช้เมื่อไร
ฉันเปรียบเทียบ?prcomp
และ?princomp
พบบางสิ่งเกี่ยวกับการวิเคราะห์องค์ประกอบหลักของ Q-mode และ R-mode (PCA) แต่อย่างสุจริต - ฉันไม่เข้าใจ ใครสามารถอธิบายความแตกต่างได้และอาจอธิบายได้ว่าจะใช้เมื่อไร
คำตอบ:
ความแตกต่างระหว่างพวกเขาไม่มีอะไรจะทำอย่างไรกับประเภทของ PCA ที่พวกเขาทำเพียงวิธีที่พวกเขาใช้ ในฐานะที่เป็นหน้าช่วยเหลือสำหรับprcomp
พูดว่า:
การคำนวณทำโดยการสลายตัวของเอกพจน์ของเมทริกซ์ข้อมูล (กึ่งกลางและขนาดที่อาจเป็นไปได้) ไม่ใช่โดยการใช้
eigen
เมทริกซ์ความแปรปรวนร่วม โดยทั่วไปนี่เป็นวิธีที่ต้องการสำหรับความแม่นยำเชิงตัวเลข
ในอีกทางหนึ่งprincomp
หน้าความช่วยเหลือพูดว่า:
การคำนวณจะทำโดยการใช้ในความสัมพันธ์หรือความแปรปรวนเมทริกซ์ตามที่กำหนดโดย
eigen
cor
สิ่งนี้ทำเพื่อความเข้ากันได้กับผลลัพธ์ S-PLUS วิธีการที่ต้องการของการคำนวณคือการใช้svd
ในx
ขณะที่จะทำในprcomp
."
ดังนั้นprcomp
เป็นที่ต้องการแม้ว่าในทางปฏิบัติคุณจะไม่เห็นความแตกต่างมากนัก (ตัวอย่างเช่นหากคุณใช้ตัวอย่างในหน้าช่วยเหลือคุณควรได้ผลลัพธ์เหมือนกัน)
prcomp
เป็นวิธีที่ต้องการ
โดยทั่วไปแล้วการวิเคราะห์หลายตัวแปร (การคำนวณความสัมพันธ์การแยกระยะแฝง ฯลฯ ) ทำจากคอลัมน์ข้อมูลซึ่งเป็นคุณสมบัติหรือคำถาม - ในขณะที่หน่วยตัวอย่างแถวคือr espondents ดังนั้นวิธีนี้เรียกว่าการวิเคราะห์ทางR อย่างไรก็ตามบางครั้งคุณอาจต้องการทำการวิเคราะห์หลายตัวแปรของผู้ตอบในขณะที่การทดสอบqจะถือเป็นหน่วยตัวอย่าง นั่นจะเป็นการวิเคราะห์แบบQ
ไม่มีความแตกต่างอย่างเป็นทางการระหว่างทั้งสองดังนั้นคุณสามารถจัดการทั้งสองด้วยฟังก์ชั่นเดียวกันโอนข้อมูล อย่างไรก็ตามมีความแตกต่างในประเด็นเรื่องมาตรฐานและการตีความผลลัพธ์
นี่เป็นคำตอบทั่วไป: ฉันไม่ได้สัมผัสเฉพาะฟังก์ชั่น R prcomp
และprincomp
เพราะฉันไม่ใช่ผู้ใช้ R และไม่ทราบถึงความแตกต่างที่เป็นไปได้ระหว่างพวกเขา
เอกสารที่มีประโยชน์และเฉพาะเจาะจงจาก Gregory B. Andersonมีชื่อว่าPRINCIPAL COMPONENT ANALYSIS IN R AN EXAMINATION OF THE DIFFERENT FUNCTIONS AND METHODS TO PERFORM PCA
ให้ข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อนี้
แยกสองย่อหน้าต่อไปนี้มาจากการแนะนำ:
ใน R มีวิธีการทั่วไปสองวิธีในการดำเนินการ PCA โดยไม่มีค่าที่ขาดหายไป: (1) การสลายตัวของสเปกตรัม (โหมด R- [หรือเรียกอีกอย่างว่า eigendecomposition]) และ (2) การสลายตัวค่าเอกพจน์ (Q-mode; วิธีการทั้งสองนี้สามารถทำได้ในระยะยาวโดยใช้ฟังก์ชั่น eigen (โหมด R) และ svd (โหมด Q) ตามลำดับหรือสามารถดำเนินการโดยใช้ฟังก์ชั่น PCA จำนวนมากที่พบในแพ็คเกจสถิติและแพ็คเกจอื่น ๆ เพิ่มเติมที่มี วิธีการสลายตัวทางสเปกตรัมของการวิเคราะห์ตรวจสอบความแปรปรวนร่วมและความสัมพันธ์ระหว่างตัวแปรในขณะที่วิธีการสลายตัวของค่าเอกฐานมีลักษณะที่ความแปรปรวนร่วมและความสัมพันธ์ในกลุ่มตัวอย่าง ในขณะที่วิธีการทั้งสองสามารถทำได้อย่างง่ายดายภายใน R วิธีการสลายตัวของค่าเอกพจน์ (เช่น
เอกสารนี้มุ่งเน้นไปที่การเปรียบเทียบวิธีการต่าง ๆ ในการทำ PCA ใน R และให้เทคนิคการสร้างภาพข้อมูลที่เหมาะสมเพื่อตรวจสอบความเป็นมาตรฐานภายในแพ็คเกจทางสถิติ โดยเฉพาะอย่างยิ่งเอกสารนี้เปรียบเทียบฟังก์ชั่นที่แตกต่างกันหกอย่างที่สร้างขึ้นสำหรับหรือสามารถใช้สำหรับ PCA: eigen, princomp, svd, prcomp, PCA และ pca ตลอดทั้งเอกสารรหัส R ที่จำเป็นต่อการทำหน้าที่เหล่านี้จะถูกฝังอยู่ภายในข้อความโดยใช้แบบอักษร Courier New และเป็นรหัสสีโดยใช้เทคนิคที่ให้ไว้ใน Tinn-R ( https://sourceforge.net/projects/tinn-r ) นอกจากนี้ผลลัพธ์จากฟังก์ชั่นจะถูกเปรียบเทียบโดยใช้ขั้นตอนการจำลองเพื่อดูว่าวิธีการที่แตกต่างกันในค่าลักษณะเฉพาะ, ค่าลักษณะเฉพาะและคะแนนที่ได้จากเอาท์พุท
พวกเขาต่างกันเมื่อทั้งคู่ใช้เมทริกซ์ความแปรปรวนร่วม เมื่อปรับขนาด (ปรับมาตรฐาน) ข้อมูลการฝึกอบรมให้prcomp
ใช้เป็นตัวส่วน แต่ใช้เป็นตัวส่วน ความแตกต่างของทั้งสองตัวหารมีการอธิบายในการกวดวิชานี้ในการวิเคราะห์องค์ประกอบหลักprincomp
ด้านล่างนี้คือผลการทดสอบของฉัน:
> job<-read.table("./job_perf.txt", header=TRUE, sep="")
> pc.cr<-prcomp(job, scale=TRUE, cor=TRUE, scores=TRUE)
> pc.cr1<-princomp(job, scale=TRUE, cor=TRUE, scores=TRUE)
> pc.cr$scale
commun probl_solv logical learn physical appearance
5.039841 1.689540 2.000000 4.655398 3.770700 4.526689
> pc.cr1$scale
commun probl_solv logical learn physical appearance
4.805300 1.610913 1.906925 4.438747 3.595222 4.316028
ข้อมูลการทดสอบ:
commun probl_solv logical learn physical appearance
12 52 20 44 48 16
12 57 25 45 50 16
12 54 21 45 50 16
13 52 21 46 51 17
14 54 24 46 51 17
22 52 25 54 58 26
22 56 26 55 58 27
17 52 21 45 52 17
15 53 24 45 53 18
23 54 23 53 57 24
25 54 23 55 58 25