(คำตอบด้านล่างเพียงแค่แนะนำและระบุทฤษฎีบทที่พิสูจน์ใน [0] ความงามในกระดาษนั้นคือข้อโต้แย้งส่วนใหญ่ทำในรูปของพีชคณิตเชิงเส้นพื้นฐานเพื่อตอบคำถามนี้มันจะเพียงพอที่จะระบุผลลัพธ์หลัก แต่ โดยทั้งหมดไปตรวจสอบแหล่งต้นฉบับ)
ในสถานการณ์ใด ๆ ที่รูปแบบหลายตัวแปรของข้อมูลสามารถอธิบายได้โดยการแจกแจงรูปไข่แบบตัวแปรการอนุมานเชิงสถิติจะตามคำนิยามลดปัญหาของการปรับ (และการหาลักษณะ) เวกเตอร์ตำแหน่งตัวแปร (พูด ) และ aโดย symmetric เมทริกซ์แน่นอนกึ่งบวก (พูด ) กับข้อมูล สำหรับเหตุผลที่ฉันอธิบายด้านล่าง (แต่ที่คุณถือว่าเป็นสถานที่) มันมักจะมีความหมายมากขึ้นในการย่อยสลายเป็นองค์ประกอบรูปร่าง (เมทริกซ์ SPSD ที่มีขนาดเดียวกับk θ k k Σ Σ Σ σ SkkθkkΣΣΣ) การบัญชีสำหรับรูปร่างของรูปทรงความหนาแน่นของการกระจายหลายตัวแปรของคุณและสเกลาร์แสดงขนาดของรูปทรงเหล่านี้σS
ใน univariate data ( ), , เมทริกซ์ความแปรปรวนร่วมของข้อมูลของคุณคือเซนต์ตส์และตามมาจากการสนทนาด้านล่างส่วนประกอบรูปร่างของเท่ากับ 1 เพื่อให้เท่ากับ องค์ประกอบสเกลของมันเสมอและไม่สามารถคลุมเครือได้Σ Σ Σ Σ = σ Sk=1ΣΣΣΣ=σS
ในข้อมูลหลายตัวแปรทางเลือกหลายฟังก์ชั่นการปรับที่เป็นไป หนึ่งในนั้น ( ) โดดเด่นในการมีความเหมาะสมที่สำคัญที่ต้องการ สิ่งนี้ควรทำให้มันเป็นตัวเลือกที่ต้องการของปัจจัยการปรับสเกลในบริบทของตระกูลรูปไข่σ S = | ΣσSσS=|ΣΣ|1/k
ปัญหามากมายในสถิติ MV เกี่ยวข้องกับการประมาณค่าของเมทริกซ์กระจายซึ่งนิยามเป็นฟังก์ชัน (อัล)
สมมาตรกึ่งบวกแน่นอนแน่นอนในและน่าพอใจ:R k × kΣRk×k
A b
(0)Σ(AX+b)=AΣ(X)A⊤
(สำหรับเมทริกซ์เอกพจน์ที่ไม่ใช่และเวกเตอร์ ) ตัวอย่างเช่นการประมาณค่าดั้งเดิมของความแปรปรวนร่วมเป็นไปตาม (0) แต่มันไม่ได้มีเพียงค่าเดียว
Ab
ในการปรากฏตัวของข้อมูลการกระจายรูปไข่ที่ความหนาแน่นของรูปทรงเป็นรูปวงรีที่กำหนดโดยเมทริกซ์รูปร่างเดียวกันถึงการคูณด้วยสเกลาร์มันเป็นธรรมชาติที่จะพิจารณารุ่นปกติของของรูปแบบ:Σ
VS=Σ/S(Σ)
โดยที่คือฟังก์ชัน 1-honogenous ที่น่าพอใจ:S
(1)S(λΣ)=λS(Σ)
สำหรับทุก 0 จากนั้นเรียกว่าองค์ประกอบรูปร่างของเมทริกซ์กระจาย (ในเมทริกซ์รูปร่างสั้น) และเรียกว่าสเกลองค์ประกอบของเมทริกซ์กระจาย ตัวอย่างของปัญหาการประมาณค่าหลายตัวแปรที่ฟังก์ชันการสูญเสียขึ้นอยู่กับผ่านองค์ประกอบรูปร่างรวมถึงการทดสอบของทรงกลม PCA และ CCA ในกลุ่มอื่น ๆV S σ S = S 1 / 2 ( Σ )λ>0VSσS=S1/2(Σ)ΣVS
แน่นอนว่ามีฟังก์ชั่นการปรับขนาดที่เป็นไปได้มากมายดังนั้นสิ่งนี้ยังคงเปิดคำถามว่าอะไร (ถ้ามี) ของฟังก์ชั่นการปรับสภาพมาตรฐานหลายตัวเลือกในแง่ที่เหมาะสมที่สุด ตัวอย่างเช่น:S
- S=tr(Σ)/k (ตัวอย่างที่เสนอโดย @amoeba ในความคิดเห็นของเขาใต้คำถามของ OP ดูเพิ่มเติมที่ [1], [2], [3])
- S=|Σ|1/k ([4], [5], [6], [7], [8])
- Σ11 (รายการแรกของเมทริกซ์ความแปรปรวนร่วม)
- λ1(Σ) (ค่าลักษณะเฉพาะแรกของ )Σ
อย่างไรก็ตามเป็นฟังก์ชันการปรับขนาดเฉพาะซึ่งฟิชเชอร์ Information Information เมทริกซ์สำหรับการประมาณขนาดและรูปร่างที่สอดคล้องกันในครอบครัวปกติแบบไม่เชิงเส้นเป็นบล็อกขวาง (นั่นคือสเกล และองค์ประกอบรูปร่างของปัญหาการประมาณค่าคือมุมฉากเชิงเส้นกำกับ นี่หมายถึงเหนือสิ่งอื่นใดว่าสเกลการทำงานเป็นทางเลือกเดียวของที่ไม่ใช่คุณสมบัติของไม่ทำให้สูญเสียประสิทธิภาพเมื่อทำการอนุมานบนV_S S = | Σ | 1 / k S σ SS=|Σ|1/kS=|Σ|1/kSσSVS
ฉันไม่ทราบถึงคุณลักษณะการมองโลกในแง่ดีที่มีค่าเปรียบเทียบกับตัวเลือกที่เป็นไปได้มากมายที่เป็นไปตาม (1)S
- [0] Paindaveine, D. , คำจำกัดความที่เป็นที่ยอมรับของรูปร่าง, สถิติ & ความน่าจะเป็นจดหมาย, เล่มที่ 78, ฉบับที่ 14, 1 ตุลาคม 2008, หน้า 2240-2247 ลิงก์ที่ไม่ได้บันทึก
- [1] Dumbgen, L. (1998) เกี่ยวกับการทำงานของไทเลอร์ของการกระจายในมิติสูงแอน Inst statist คณิตศาสตร์. 50, 471–491
- [2] Ollila, E. , TP Hettmansperger และ H. Oja (2004) เลียนแบบวิธีการลงนามหลายตัวแปร Preprint มหาวิทยาลัย Jyvaskyla
- [3] Tyler, DE (1983) ความทนทานและคุณสมบัติเชิงประสิทธิภาพของเมทริกซ์กระจายกระจาย Biometrika 70, 411–420
- [4] Dumbgen, L. และ DE Tyler (2005) ในคุณสมบัติการแยกส่วนของ M-Functionals แบบหลายตัวแปร, Scand J. นักสถิติ 32, 247–264
- [5] Hallin, M. and D. Paindaveine (2008) การทดสอบตามระดับที่เหมาะสมที่สุดสำหรับความสม่ำเสมอของการกระจายแอน นักสถิติให้ปรากฏ
- [6] Salibian-Barrera, M. , S. Van Aelst และ G. Willems (200 6) การวิเคราะห์ส่วนประกอบหลักขึ้นอยู่กับการประเมิน MM แบบหลายตัวแปรพร้อมบู๊ทบูตที่รวดเร็วและมีประสิทธิภาพ J. Amer statist รศ 101, 1198–1211
- [7] Taskinen, S. , C. Croux, A. Kankainen, E. Ollila, และ H. O ja (2006) ฟังก์ชั่นที่มีอิทธิพลและประสิทธิภาพของการประมาณค่าความสัมพันธ์แบบแคนนอนและเวกเตอร์ตามเมทริกซ์กระจายและรูปร่าง, J. Multivariate Anal 97, 359–384
- [8] Tatsuoka, KS และ DE Tyler (2000) เกี่ยวกับความเป็นเอกลักษณ์ของ S-Functionals และ M-functionals ภายใต้การแจกแจงแบบไม่ จำกัด , แอน statist 28, 1219–1243