การกระจายของระยะทาง Mahalanobis ระดับสังเกต


23

ถ้าฉันมีตัวอย่าง iid ปกติหลายตัวแปรและกำหนด (ซึ่งเป็นชนิดของระยะทาง Mahalanobis [กำลังสอง] จากจุดตัวอย่างไปยังเวกเตอร์โดยใช้เมทริกซ์สำหรับการถ่วงน้ำหนัก) อะไรคือการกระจายตัวของ (ระยะทาง Mahalanobis sample meanโดยใช้เมทริกซ์ความแปรปรวนร่วมตัวอย่าง )?d 2 i ( b , A ) = ( X i - b ) A - 1 ( X i - b ) a AX1,,XnNp(μ,Σ)

di2(b,A)=(Xib)A1(Xib)
aA ˉ X Sdi2(X¯,S)X¯S

ฉันกำลังดูกระดาษที่อ้างว่าเป็นแต่สิ่งนี้ผิดอย่างชัดเจน: การน่าจะได้รับสำหรับโดยใช้ประชากรเฉลี่ย (ไม่ทราบ) และเมทริกซ์ความแปรปรวนร่วม เมื่อ analogues ตัวอย่างเสียบอยู่หนึ่งควรจะได้รับ Hotellingแจกจ่ายหรือลดขนาดการจัดจำหน่ายหรือสิ่งที่ต้องการ แต่ไม่ได้\ฉันไม่พบผลลัพธ์ที่แน่นอนทั้งในMuirhead (2005)หรือในAnderson (2003)หรือในMardia Kent และ Bibby (1979, 2003) χ 2 P d 2 ฉัน ( μ , Σ ) T 2 F ( ) χ 2 หน้าχพี2χพี2dผม2(μ,Σ)T 2F()χพี2. เห็นได้ชัดว่าคนเหล่านี้ไม่ได้ใส่ใจกับการวินิจฉัยที่ผิดปกติเนื่องจากการแจกแจงแบบหลายตัวแปรปกตินั้นสมบูรณ์แบบและสามารถรับได้ง่ายทุกครั้งที่รวบรวมข้อมูลหลายตัวแปร: - /

สิ่งต่าง ๆ อาจซับซ้อนกว่านั้น ผลการกระจายของ Hotellingขึ้นอยู่กับการสมมติความเป็นอิสระระหว่างส่วนเวกเตอร์และส่วนเมทริกซ์ ความเป็นอิสระดังกล่าวมีไว้สำหรับและแต่มันไม่ได้ถือครองไว้สำหรับและอีกต่อไปˉ X S X ฉัน ST 2X¯SXผมS


ในคำจำกัดความของคุณยังคงมองว่าเป็นตัวแปรสุ่มหรือคุณกำลังมองว่ามันเป็นเวกเตอร์คงที่หรือไม่? รวมถึงตัวห้อยบ่งบอกถึงตัวหลัง แต่ก็ดูแปลกไปหน่อย X ฉันdผม2Xผม
whuber

1
ทราบเพียงเล็กน้อยด้านนอกข้อมือ แต่สังเกตว่าเป็นอุปกรณ์เสริมที่เกี่ยวกับและเท่ากับค่าคงที่คงที่ ( ควรเป็นหรือคล้ายกันฉันคิดว่า) เกือบแน่นอน μ i d 2 i ( ˉ X , S ) n - pXผม-X¯μΣผมdผม2(X¯,S)n-พี
พระคาร์ดินัล

1
@whuber - อาจจะเน้นว่ามันคำนวณโดยใช้การสังเกตจากตัวอย่างไม่ใช่การสังเกตใหม่
jbowman

1
@ โฮเบอร์ประมาณตามแนวของสิ่งที่ jbowman พูด - เพื่อระบุว่านี่เป็นสถิติระดับการสังเกต (ตรงข้ามกับสถิติระดับตัวอย่างเช่นค่าเฉลี่ยตัวอย่าง)
StasK

1
การกระจายของเป็นเบต้า,แต่ฉันยังคงมองหาการกระจายของS) การแจกแจงของนั้นไม่ได้เป็นอิสระ n / ( n - 1 ) 2 d 2 i ( ˉ X , S ) B ( p / 2 , ( n - p - 1 ) / 2 ) d 2 i ( μ , S ) d 2 idผม2(X¯,S)n/(n-1)2dผม2(X¯,S)~B(พี/2,(n-พี-1)/2)dผม2(μ,S)dผม2

คำตอบ:


18

ตรวจสอบแบบจำลองส่วนผสมของเสียนโดยใช้ประโยชน์จากระยะทาง Mahalanobis ( ลิงค์อื่น ) ดูหน้า 13, คอลัมน์ที่สอง ผู้เขียนยังได้รับหลักฐานบางอย่างเช่นกันสำหรับการเผยแพร่ การกระจายถูกปรับสเกลเบต้า โปรดแจ้งให้เราทราบหากสิ่งนี้ไม่ได้ผลสำหรับคุณ มิฉะนั้นฉันสามารถตรวจสอบคำใบ้ใด ๆ ในหนังสือ SS Wilks ในวันพรุ่งนี้


4
คำตอบที่ให้ไว้ในกระดาษคือ:{2}) ขอบคุณ! n(n-1)2dผม2(X¯,S)~B(พี2,n-พี-12)
StasK

9

มีการแจกแจงที่เกี่ยวข้อง 3 รายการ เท่าที่สังเกตถ้าพารามิเตอร์ของประชากรที่แท้จริงถูกนำมาใช้การกระจายอยู่ในไคสแควร์กับ pนี่เป็นการแจกแจงแบบซีมโทติคด้วยพารามิเตอร์โดยประมาณและขนาดตัวอย่างขนาดใหญ่d=พี

อีกคำตอบให้การกระจายที่ถูกต้องสำหรับสถานการณ์ที่พบบ่อยที่สุดโดยมีพารามิเตอร์ที่ประมาณไว้เมื่อการสังเกตตัวเองเป็นส่วนหนึ่งของชุดการประมาณ: อย่างไรก็ตามหากการสังเกตเป็นอิสระจากการประมาณค่าพารามิเตอร์การแจกแจงจะเป็นสัดส่วนกับการแจกแจงแบบ F- ของฟิชเชอร์: xi(nd2(n-p)

n(d2)(n-1)2~Bอีเสื้อa(พี2,(n-พี-1)2).
xผม
(nd2(n-พี)(พี(n-1)(n+1))~F(พี,n-พี)

ยินดีต้อนรับสู่เว็บไซต์ @JoeSullivan ฉันใช้เสรีภาพในการใช้เพื่อให้สมการของคุณอ่านง่ายขึ้น โปรดตรวจสอบให้แน่ใจว่าพวกเขายังพูดในสิ่งที่คุณต้องการ LATEX
gung - Reinstate Monica

คุณสามารถให้การอ้างอิงสำหรับสูตร F ได้หรือไม่
อายไลเนอร์

1
การอ้างอิงที่เกี่ยวข้องหนึ่งหัวข้อ 3 ใน Hardin, Johanna และ David M. Rocke 2548 "การกระจายของระยะทางที่แข็งแกร่ง" วารสารการคำนวณและสถิติเชิงกราฟ 14 (4): 928–46 ดอย: 10.1198 / 106186005X77685
Josef
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.