คำถามติดแท็ก factor-rotation

การแปลงปัจจัยเชิงเส้นในโซลูชันการวิเคราะห์ปัจจัย (หรือ PCA) มักทำเพื่อปรับปรุงความสามารถในการตีความ วิธีการหมุนตัวประกอบ ได้แก่ varimax, promax, oblimin เป็นต้น

8
PCA ตามมาด้วยการหมุน (เช่น varimax) ยังคงเป็น PCA หรือไม่
ฉันได้ลองทำซ้ำการวิจัย (ใช้ PCA) จาก SPSS ใน R จากประสบการณ์ของฉันprincipal() ฟังก์ชั่นจากแพ็คเกจpsychเป็นฟังก์ชั่นเดียวที่เข้ามาใกล้ (หรือถ้าหน่วยความจำของฉันทำหน้าที่ฉันถูกต้องตาย) เพื่อให้ตรงกับผลลัพธ์ เพื่อให้ตรงกับผลเช่นเดียวกับในโปรแกรม SPSS principal(..., rotate = "varimax")ผมต้องใช้พารามิเตอร์ ฉันเคยเห็นเอกสารพูดคุยเกี่ยวกับวิธีที่พวกเขาทำ PCA แต่จากผลของ SPSS และการใช้การหมุนมันฟังดูคล้ายกับการวิเคราะห์ตัวประกอบ คำถาม: PCA คือแม้หลังจากหมุน (โดยใช้varimax) ยังคง PCA หรือไม่ ฉันรู้สึกว่านี่อาจเป็นการวิเคราะห์ตัวประกอบจริง ๆ ... ในกรณีที่ไม่ได้ฉันมีรายละเอียดอะไรบ้าง

1
เหตุผลที่ใช้งานง่ายที่อยู่เบื้องหลังการหมุนเวียนในการวิเคราะห์ปัจจัย / PCA คืออะไรและจะเลือกการหมุนที่เหมาะสมได้อย่างไร
คำถามของฉัน อะไรคือเหตุผลที่เข้าใจง่ายที่อยู่เบื้องหลังการหมุนของปัจจัยในการวิเคราะห์ปัจจัย (หรือส่วนประกอบใน PCA) ความเข้าใจของฉันคือถ้าตัวแปรถูกโหลดอย่างเท่าเทียมกันในองค์ประกอบด้านบน (หรือปัจจัย) แล้วแน่นอนว่ามันยากที่จะแยกความแตกต่างขององค์ประกอบ ดังนั้นในกรณีนี้เราสามารถใช้การหมุนเพื่อให้ได้ความแตกต่างของส่วนประกอบที่ดีขึ้น ถูกต้องหรือไม่ ผลที่ตามมาจากการหมุนคืออะไร สิ่งนี้มีผลกระทบอะไรบ้าง วิธีการเลือกการหมุนที่เหมาะสม? มีการหมุนมุมฉากและการหมุนเอียง วิธีเลือกระหว่างสิ่งเหล่านี้กับความหมายของตัวเลือกนี้คืออะไร กรุณาอธิบายโดยใช้สมการทางคณิตศาสตร์อย่างน้อยที่สุด คำตอบที่แพร่กระจายเพียงไม่กี่คำคือคณิตศาสตร์อย่างหนัก แต่ฉันกำลังมองหาเหตุผลและกฎง่ายๆ

1
องศาอิสระเป็นหมายเลขที่ไม่ใช่จำนวนเต็มหรือไม่
เมื่อฉันใช้ GAM มันให้ DF ที่เหลือกับฉันคือ (บรรทัดสุดท้ายในรหัส) นั่นหมายความว่าอย่างไร? นอกเหนือไปจากตัวอย่างของ GAM โดยทั่วไปแล้วจำนวนองศาความเป็นอิสระจะเป็นจำนวนที่ไม่ใช่จำนวนเต็มหรือไม่26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

1
อะไรคือองค์ประกอบหลัก“ ที่หมุน” และ“ ไม่ได้รับการป้องกัน” เนื่องจาก PCA จะหมุนแกนพิกัดเสมอ
เท่าที่ฉันเข้าใจส่วนประกอบหลักจะได้รับโดยการหมุนแกนพิกัดเพื่อจัดเรียงพวกเขากับทิศทางของความแปรปรวนสูงสุด อย่างไรก็ตามฉันยังคงอ่านเกี่ยวกับ "ส่วนประกอบหลักที่ไม่ได้ทำการหมุน" และซอฟต์แวร์สถิติของฉัน (SAS) ให้ส่วนประกอบหลักที่หมุนรอบตัวได้แบบแปรปรวนตลอดจนส่วนประกอบที่ไม่ได้หมุน ที่นี่ฉันสับสน: เมื่อเราคำนวณส่วนประกอบหลักแกนจะหมุนไปแล้ว เหตุใดจึงต้องมีการหมุนอีกครั้ง และ "องค์ประกอบหลักที่ยังไม่ได้ประมวลผล" หมายความว่าอย่างไร

3
วิธีการคำนวณส่วนประกอบหลักหมุน varimax ใน R?
ฉันวิ่ง PCA เมื่อวันที่ 25 ตัวแปรและเลือกด้านบน 7 prcompเครื่องคอมพิวเตอร์ใช้ prc <- prcomp(pollutions, center=T, scale=T, retx=T) ฉันได้ทำการหมุน varimax กับส่วนประกอบเหล่านั้นแล้ว varimax7 <- varimax(prc$rotation[,1:7]) และตอนนี้ฉันต้องการ varimax หมุนข้อมูลที่หมุน PCA (เนื่องจากไม่ได้เป็นส่วนหนึ่งของวัตถุ varimax - เฉพาะเมทริกซ์การโหลดและเมทริกซ์การหมุน) ฉันอ่านว่าการทำเช่นนี้คุณคูณทรานสปอนของเมทริกซ์การหมุนโดยทรานสโพสของข้อมูลดังนั้นฉันจะทำสิ่งนี้: newData <- t(varimax7$rotmat) %*% t(prc$x[,1:7]) แต่นั่นก็ไม่สมเหตุสมผลเนื่องจากขนาดของเมทริกซ์ทรานส์ข้างต้นคือคูณและตามลำดับดังนั้นฉันจะเหลือเมทริกซ์เพียงแถวแทนที่จะเป็นแถว ... ไม่มีใครรู้ สิ่งที่ฉันทำผิดที่นี่หรือสิ่งสุดท้ายของฉันควรเป็นอย่างไร ฉันต้องเปลี่ยนกลับในภายหลังไหม?7×77×77\times 77 169337×169337×169337 \times 16933777169331693316933
13 r  pca  factor-rotation 

2
วิธีการหมุนตัวประกอบ (varimax, oblimin ฯลฯ ) - ชื่อนี้มีความหมายว่าอย่างไรและมีวิธีการอย่างไร?
การวิเคราะห์ปัจจัยมีวิธีการหมุนหลายวิธีเช่น varimax, quartimax, equamax, promax, oblimin เป็นต้นฉันไม่สามารถหาข้อมูลใด ๆ ที่เกี่ยวข้องกับชื่อของพวกเขากับการกระทำทางคณิตศาสตร์หรือสถิติที่แท้จริง ทำไมถึงเรียกว่า "equa-max" หรือ "quarti-max" แกนหรือเมทริกซ์หมุนไปทางใดดังนั้นพวกเขาจึงมีชื่อเช่นนี้? น่าเสียดายที่พวกเขาส่วนใหญ่ถูกประดิษฐ์ขึ้นในปี 1950 - 1970 ดังนั้นฉันไม่สามารถติดต่อผู้เขียนได้

2
มีเหตุผลหรือไม่ที่จะปล่อยให้โซลูชันการวิเคราะห์ปัจจัยเชิงสำรวจไม่ได้รับการป้องกัน
มีเหตุผลใดบ้างที่จะไม่หมุนโซลูชันการวิเคราะห์ปัจจัยเชิงสำรวจ? มันง่ายที่จะหาการสนทนาเปรียบเทียบการแก้ปัญหามุมฉากกับการแก้ปัญหาแบบเอียงและฉันคิดว่าฉันเข้าใจสิ่งทั้งหมดอย่างสมบูรณ์ นอกจากนี้จากสิ่งที่ฉันสามารถหาได้ในตำราเรียนผู้เขียนมักจะอธิบายวิธีการวิเคราะห์การวิเคราะห์ปัจจัยในการอธิบายวิธีการหมุนและตัวเลือกที่แตกต่างกัน สิ่งที่ฉันไม่ได้เห็นคือการสนทนาว่าจะหมุนในตอนแรกหรือไม่ ในฐานะโบนัสฉันขอขอบคุณเป็นพิเศษหากใคร ๆ ก็สามารถโต้เถียงกับการหมุนของประเภทใด ๆ ที่จะใช้ได้สำหรับหลายวิธีในการประเมินปัจจัย (เช่นวิธีส่วนประกอบหลักและวิธีโอกาสสูงสุด)

2
ในการวิเคราะห์ปัจจัย (หรือใน PCA) มันหมายถึงปัจจัยที่โหลดมากกว่า 1 หรือไม่
ฉันเพิ่งเรียกใช้ FA โดยใช้การหมุนแบบเอียง (promax) และรายการให้ค่าการโหลดปัจจัย 1.041 ในปัจจัยเดียว (และปัจจัยการโหลดของ -.131, -.119 และ. 0.65 ในอีกปัจจัยที่ใช้เมทริกซ์รูปแบบ ) . และฉันไม่แน่ใจว่ามันหมายถึงอะไรฉันคิดว่ามันอาจจะอยู่ระหว่าง -1 ถึง 1 เท่านั้น มันเกิดจากการหมุนแบบเอียงหรือไม่? และสามารถโหลดเกิน 1 ด้วยปัจจัยมุมฉากได้หรือไม่

3
หมุนส่วนประกอบ PCA เพื่อปรับความแปรปรวนในแต่ละองค์ประกอบให้เท่ากัน
ฉันกำลังพยายามลดมิติข้อมูลและเสียงรบกวนของชุดข้อมูลด้วยการแสดง PCA บนชุดข้อมูลและทิ้งพีซีสองสามเครื่องล่าสุด หลังจากนั้นฉันต้องการใช้อัลกอริทึมการเรียนรู้ของเครื่องบางอย่างบนพีซีที่เหลืออยู่ดังนั้นฉันจึงต้องการทำให้ข้อมูลเป็นมาตรฐานด้วยการทำให้ความแตกต่างของพีซีให้เท่ากัน วิธีง่ายๆวิธีหนึ่งก็คือทำให้ค่าความแปรปรวนเป็นค่าหน่วย อย่างไรก็ตามพีซีเครื่องแรกมีความแปรปรวนจากชุดข้อมูลดั้งเดิมมากกว่าชุดข้อมูลต่อไปนี้และฉันยังต้องการให้ "น้ำหนัก" มากขึ้น ดังนั้นฉันสงสัยว่า: มีวิธีง่าย ๆ ในการแยกความแปรปรวนและแบ่งปันกับพีซีที่มีความแปรปรวนน้อยกว่าหรือไม่ อีกวิธีหนึ่งคือการแมปพีซีกลับไปยังพื้นที่คุณลักษณะดั้งเดิม แต่ในกรณีนั้นมิติข้อมูลจะเพิ่มขึ้นเป็นค่าดั้งเดิม ฉันเดาว่าจะดีกว่าที่จะเก็บคอลัมน์ผลลัพธ์ไว้เป็นมุมฉาก แต่ก็ไม่จำเป็นในตอนนี้

3
ในการใช้งานของการหมุนเฉียงหลังจาก PCA
แพ็คเกจทางสถิติหลายอย่างเช่น SAS, SPSS และ R ช่วยให้คุณสามารถทำการหมุนตัวประกอบต่อไปนี้ PCA ทำไมการหมุนจึงจำเป็นหลังจาก PCA ทำไมคุณถึงใช้การหมุนแบบเอียงหลังจาก PCA เนื่องจากเป้าหมายของ PCA คือการสร้างมิติมุมฉาก
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.