สมมติว่าเรามีตัวแปรวัดได้เราทำการวัดจำนวนของการวัดแล้วต้องการทำการแยกสลายค่าเอกพจน์บนผลลัพธ์เพื่อค้นหาแกนของความแปรปรวนสูงสุดสำหรับ points ในช่องว่างมิติ( หมายเหตุ:คิดว่าวิธีการของฉันได้รับการหักออกเพื่อ⟨ ฉัน ⟩ = 0สำหรับทุกฉัน .)
ทีนี้สมมติว่าตัวแปรหนึ่งตัว (หรือมากกว่า) มีขนาดลักษณะแตกต่างกันอย่างมีนัยสำคัญมากกว่าส่วนที่เหลือ เช่น1อาจมีค่าอยู่ในช่วง10 - 100ในขณะที่ส่วนที่เหลืออาจจะอยู่ที่ประมาณ0.1 - 1 นี้จะเอียงแกนของความแปรปรวนสูงสุดต่อ1ของแกนมาก
ความแตกต่างของขนาดอาจเป็นเพราะตัวเลือกการวัดที่โชคร้าย (ถ้าเรากำลังพูดถึงข้อมูลทางกายภาพเช่นกิโลเมตรเทียบกับเมตร) แต่ที่จริงแล้วตัวแปรที่แตกต่างกันอาจมีมิติที่แตกต่างกันโดยสิ้นเชิง (เช่นน้ำหนักเทียบกับปริมาตร) อาจไม่มีวิธีที่ชัดเจนในการเลือกหน่วย "เปรียบได้" สำหรับพวกเขา
คำถาม: ฉันต้องการทราบว่ามีวิธีการมาตรฐาน / ทั่วไปในการทำให้ข้อมูลเป็นมาตรฐานเพื่อหลีกเลี่ยงปัญหานี้หรือไม่ ผมสนใจในเทคนิคมาตรฐานที่ผลิตขนาดเทียบเคียง1 - Nเพื่อจุดประสงค์นี้มากกว่าขึ้นมาพร้อมกับสิ่งใหม่ ๆ
แก้ไข: ความเป็นไปได้อย่างหนึ่งคือทำให้ตัวแปรแต่ละตัวเป็นปกติโดยค่าเบี่ยงเบนมาตรฐานหรือสิ่งที่คล้ายกัน อย่างไรก็ตามปัญหาต่อไปนี้จะปรากฏขึ้น: ลองตีความข้อมูลเป็น cloud point ในพื้นที่ -dimensional คลาวด์จุดนี้สามารถหมุนได้และการฟื้นฟูแบบนี้จะให้ผลลัพธ์สุดท้ายที่แตกต่างกัน (หลังจาก SVD) ขึ้นอยู่กับการหมุน (เช่นในกรณีที่รุนแรงที่สุดให้จินตนาการการหมุนข้อมูลอย่างแม่นยำเพื่อจัดแนวแกนหลักกับแกนหลัก)
ฉันคาดหวังว่าจะไม่มีวิธีการหมุนแบบคงที่ใด ๆ แต่ฉันจะขอบคุณถ้ามีคนสามารถชี้ให้ฉันไปพูดคุยเกี่ยวกับปัญหานี้ในวรรณกรรมโดยเฉพาะอย่างยิ่งเกี่ยวกับคำเตือนในการตีความผล