คำถามติดแท็ก multivariate-analysis

วิเคราะห์ที่มีมากกว่าหนึ่งตัวแปรวิเคราะห์พร้อมกันและตัวแปรเหล่านี้อาจขึ้นอยู่กับ (ตอบสนอง) หรือคนเดียวในการวิเคราะห์ สิ่งนี้สามารถเปรียบเทียบกับการวิเคราะห์ "หลาย" หรือ "หลายตัวแปร" ซึ่งมีความหมายมากกว่าหนึ่งตัวแปร (อิสระ) ตัวแปร

4
วิธีการเรียนรู้เครื่องหลายตัวแปร (การทำนายตัวแปรตามหลายตัว)
ฉันต้องการทำนายกลุ่มของรายการที่บางคนจะซื้อ ... นั่นคือฉันมีตัวแปรที่ขึ้นอยู่กับหลายสี แทนที่จะสร้างแบบจำลองอิสระ 7 แบบหรือมากกว่านั้นเพื่อคาดการณ์ความน่าจะเป็นของคนที่ซื้อแต่ละรายการจาก 7 รายการแล้วรวมผลลัพธ์ฉันควรพิจารณาวิธีใดเพื่อให้มีแบบจำลองหนึ่งแบบที่อธิบายความสัมพันธ์ระหว่างตัวแปรที่สัมพันธ์กันซึ่งขึ้นอยู่กับ 7 สิ่งที่พวกเขาสามารถซื้อได้) ฉันใช้ R เป็นภาษาการเขียนโปรแกรมดังนั้นคำแนะนำเฉพาะของ R จึงเป็นที่ชื่นชม

1
ใช้การวิเคราะห์องค์ประกอบหลักเทียบกับการวิเคราะห์การโต้ตอบ
ฉันกำลังวิเคราะห์ชุดข้อมูลที่เกี่ยวข้องกับชุมชน intertidal ข้อมูลเป็นเปอร์เซ็นต์การครอบคลุม (ของสาหร่ายทะเล, เพรียง, หอยแมลงภู่, ฯลฯ ) ในรูปสี่เหลี่ยม ฉันเคยคิดเกี่ยวกับการวิเคราะห์การติดต่อ (CA) ในแง่ของจำนวนสปีชีส์และการวิเคราะห์องค์ประกอบหลัก (PCA) เป็นสิ่งที่มีประโยชน์มากขึ้นสำหรับแนวโน้มเชิงเส้นสิ่งแวดล้อม (ไม่ใช่สปีชีส์) ฉันไม่ได้มีโชคใด ๆ ที่คิดว่า PCA หรือ CA จะเหมาะกว่าสำหรับเปอร์เซ็นต์การครอบคลุม (ไม่พบเอกสารใด ๆ ) และฉันไม่แน่ใจด้วยซ้ำว่าสิ่งที่ต่อยอดสูงสุดถึง 100% จะกระจายออกไปได้อย่างไร ? ฉันคุ้นเคยกับแนวทางคร่าวๆว่าหากความยาวของแกนการวิเคราะห์การโต้ตอบจดหมายที่ถูก detrended แรก (DCA) มากกว่า 2 คุณจะสามารถสันนิษฐานได้ว่าควรใช้ CA อย่างปลอดภัย ความยาวของแกน DCA 1 คือ 2.17 ซึ่งฉันไม่พบว่ามีประโยชน์

1
CCA ระหว่างสองชุดข้อมูลที่เหมือนกันเทียบเท่ากับ PCA ในชุดข้อมูลนี้หรือไม่
การอ่านวิกิพีเดียเกี่ยวกับการวิเคราะห์สหสัมพันธ์แคนนอน (CCA) สำหรับเวกเตอร์สุ่มสองตัวและYฉันสงสัยว่าองค์ประกอบหลัก anslysis (PCA) เหมือนกับ CCA เมื่อX = Yหรือไม่XXXYYYX=YX=YX=Y

1
ฟังก์ชันการสร้างช่วงเวลาของผลิตภัณฑ์ภายในของเวกเตอร์สุ่มเกาส์สองตัว
ใครช่วยได้โปรดแนะนำว่าฉันจะคำนวณฟังก์ชันสร้างโมเมนต์ของผลิตภัณฑ์ภายในของเวกเตอร์สุ่มแบบเกาส์สองตัวได้อย่างไรแต่ละแบบกระจายเป็นเป็นอิสระจากกัน? มีผลลัพธ์มาตรฐานสำหรับสิ่งนี้ไหม ตัวชี้ใด ๆ ที่ชื่นชมอย่างมากยังไม่มีข้อความ( 0 ,σ2)N(0,σ2)\mathcal N(0,\sigma^2)

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
การวิเคราะห์ข้อมูลภาษาฝรั่งเศสคืออะไร
วิธีการทางสถิติบางอย่าง - ฉันจำไม่ได้ว่ามันเป็นการวิเคราะห์องค์ประกอบหลักหรืออะไรทำนองนั้น - บางครั้งเรียกว่า "การวิเคราะห์ข้อมูลภาษาฝรั่งเศส" มันคืออะไรกันแน่? และบางคนบอกว่าชื่อนี้เป็นเรื่องน่าขันจริงหรือไม่และทำไม?

4
การลดจำนวนตัวแปรในการถดถอยหลายครั้ง
ฉันมีชุดข้อมูลขนาดใหญ่ซึ่งประกอบด้วยค่าของตัวแปรทางการเงินหลายร้อยตัวที่สามารถใช้ในการถดถอยหลายครั้งเพื่อทำนายพฤติกรรมของกองทุนดัชนีในช่วงเวลาหนึ่ง ฉันต้องการลดจำนวนของตัวแปรให้เหลือเพียงสิบหรือมากกว่านั้นในขณะที่ยังคงรักษาพลังการทำนายได้มากที่สุด เพิ่มเติม: ชุดของตัวแปรที่ลดลงจะต้องเป็นชุดย่อยของชุดตัวแปรดั้งเดิมเพื่อที่จะรักษาความหมายทางเศรษฐกิจของตัวแปรดั้งเดิมไว้ ตัวอย่างเช่นฉันไม่ควรลงท้ายด้วยชุดค่าผสมเชิงเส้นหรือมวลรวมของตัวแปรดั้งเดิม ความคิด (อาจไร้เดียงสา) บางอย่างเกี่ยวกับวิธีการทำเช่นนี้: ดำเนินการถดถอยเชิงเส้นที่เรียบง่ายกับตัวแปรแต่ละตัวและเลือกสิบมีขนาดใหญ่ที่สุดค่า แน่นอนไม่มีการรับประกันว่าตัวแปรที่ดีที่สุดสิบตัวที่รวมกันจะเป็นกลุ่มที่ดีที่สุดของสิบคนR2R2R^2 ทำการวิเคราะห์ส่วนประกอบหลักและลองค้นหาตัวแปรสิบตัวแรกที่มีความสัมพันธ์มากที่สุดกับแกนหลักสองสามตัวแรก ฉันไม่คิดว่าฉันสามารถทำการถดถอยแบบลำดับชั้นได้เนื่องจากตัวแปรนั้นไม่ซ้อนกันจริงๆ การลองชุดค่าผสมที่เป็นไปได้ทั้งหมดของตัวแปรสิบตัวนั้นเป็นไปไม่ได้เนื่องจากไม่มีชุดค่าผสมมากเกินไป มีวิธีการมาตรฐานในการจัดการกับปัญหานี้ในการลดจำนวนตัวแปรในการถดถอยหลายครั้งหรือไม่? ดูเหมือนว่านี่จะเป็นปัญหาที่พบได้บ่อยพอที่จะมีวิธีการมาตรฐาน คำตอบที่เป็นประโยชน์มากคือคำตอบที่ไม่เพียง แต่กล่าวถึงวิธีมาตรฐาน แต่ยังให้ภาพรวมของวิธีการและสาเหตุ อีกวิธีหนึ่งถ้าไม่มีวิธีการแบบมาตรฐาน แต่มีหลายวิธีที่มีจุดแข็งและจุดอ่อนที่แตกต่างกันคำตอบที่มีประโยชน์มากก็คือคำตอบที่เป็นประโยชน์ ความคิดเห็นของ whuber ด้านล่างแสดงว่าคำขอในย่อหน้าสุดท้ายนั้นกว้างเกินไป แต่ฉันจะยอมรับว่าเป็นคำตอบที่ดีสำหรับรายการของวิธีการที่สำคัญบางทีอาจมีคำอธิบายสั้น ๆ ของแต่ละวิธี เมื่อฉันมีเงื่อนไขฉันสามารถขุดรายละเอียดในแต่ละตัวเอง

1
วิธีสร้างควอดรัตสำหรับกระบวนการจุดที่แตกต่างกันอย่างมากในความถี่?
ฉันต้องการทำการวิเคราะห์การนับควอดเรตในกระบวนการจุดต่าง ๆ (หรือกระบวนการจุดหนึ่งที่ทำเครื่องหมายไว้) เพื่อใช้เทคนิคการลดมิติข้อมูลบางอย่าง เครื่องหมายดังกล่าวไม่ได้มีการกระจายเหมือนกันเช่นเครื่องหมายบางอันปรากฏค่อนข้างบ่อยและบางเครื่องหมายค่อนข้างหายาก ดังนั้นฉันไม่สามารถแบ่งพื้นที่ 2D ของฉันในตารางปกติได้เพราะเครื่องหมายที่บ่อยขึ้นจะ "เอาชนะ" พื้นที่ที่มีความถี่น้อยกว่า ดังนั้นฉันจึงพยายามที่จะสร้างกริดของฉันเพื่อให้แต่ละเซลล์มีจุด N มากที่สุดในนั้น (เพื่อทำเช่นนั้นฉันเพียงแค่แบ่งแต่ละเซลล์ออกเป็นสี่เซลล์ขนาดเล็ก (และขนาดเท่ากัน) ซ้ำจนกระทั่งไม่มีเซลล์ใดมีคะแนน N มากกว่า มัน). คุณคิดอย่างไรกับเทคนิค "การทำให้เป็นมาตรฐาน" นี้? มีวิธีมาตรฐานในการทำสิ่งเหล่านี้หรือไม่?

2
จะค้นหาความสัมพันธ์ระหว่างกิจกรรมประเภทต่างๆได้อย่างไร (กำหนดโดยตำแหน่ง 2D)
ฉันมีชุดข้อมูลของเหตุการณ์ที่เกิดขึ้นในช่วงเวลาเดียวกัน แต่ละเหตุการณ์มีประเภท (มีหลายประเภทที่แตกต่างกันน้อยกว่าสิบ) และสถานที่ซึ่งแสดงเป็นจุด 2D ฉันต้องการตรวจสอบว่ามีความสัมพันธ์ระหว่างประเภทของกิจกรรมหรือระหว่างประเภทและตำแหน่ง ตัวอย่างเช่นเหตุการณ์ประเภท A มักจะไม่เกิดขึ้นเมื่อมีกิจกรรมประเภท B หรือบางทีในบางพื้นที่มีเหตุการณ์ส่วนใหญ่เป็นประเภท C ฉันสามารถใช้เครื่องมือชนิดใดในการทำสิ่งนี้ เป็นมือใหม่ในการวิเคราะห์ทางสถิติความคิดแรกของฉันคือการใช้ PCA (การวิเคราะห์ส่วนประกอบหลัก) ในชุดข้อมูลนี้เพื่อดูว่าเหตุการณ์แต่ละประเภทมีองค์ประกอบของตัวเองหรือบางคนแบ่งปันเหมือนกัน (เช่นมีความสัมพันธ์กัน) ฉันต้องพูดถึงว่าชุดข้อมูลของฉันมีลำดับ 500,000 คะแนนจึงทำให้การจัดการกับเรื่องยากขึ้นเล็กน้อย( x , y, t yp e )(x,Y,เสื้อYพีอี)(x, y, type) แก้ไข: ตามที่ระบุไว้ในคำตอบด้านล่างและความคิดเห็นวิธีที่จะไปคือการทำแบบจำลองนี้เป็นกระบวนการจุดที่ถูกทำเครื่องหมายแล้วใช้ R เพื่อยกของหนักทั้งหมดดังอธิบายในรายละเอียดในรายงานการประชุมเชิงปฏิบัติการนี้: http: / /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.