ขอบเขตของความแตกต่างของตัวแปรสุ่มที่สัมพันธ์กัน


9

ด้วยตัวแปรสุ่มที่มีความสัมพันธ์สูงสองตัวและฉันต้องการที่จะจำกัดความน่าจะเป็นที่ความแตกต่างเกินจำนวนที่กำหนด: XY|XY|

P(|XY|>K)<δ

สมมติว่าความเรียบง่ายนั้น:

  • สัมประสิทธิ์สหสัมพันธ์เป็นที่รู้กันว่า "สูง" พูดว่า: ρX,Y=covar(X,Y)/σXσY1ϵ

  • X,Yมีค่าเฉลี่ยเป็นศูนย์:μx=μy=0

  • 1xi,yi1 (หรือ ถ้ามันง่ายกว่า)0xi,yi1

  • (ถ้าทำให้สิ่งต่าง ๆ ง่ายขึ้นสมมติว่าX,Yมีความแปรปรวนเหมือนกัน: σX2=σY2 )

ไม่แน่ใจว่าเป็นไปได้ที่จะได้รับขอบเขตความแตกต่างที่ได้รับจากข้อมูลข้างต้นเท่านั้น (แน่นอนฉันไม่สามารถไปได้ทุกที่) โซลูชันเฉพาะ (ถ้ามี) ข้อ จำกัด เพิ่มเติมที่บังคับใช้เพื่อกำหนดการกระจายหรือเพียงแค่คำแนะนำเกี่ยวกับวิธีการจะดี

คำตอบ:


9

แม้ว่าจะไม่มีข้อสมมติฐานที่ทำให้เข้าใจง่ายเหล่านี้ก็สามารถรับขอบเขตได้ด้วยการรวมเครื่องมือสองสามอย่าง:

  • ความแปรปรวนของความแตกต่างของสองตัวแปรความสัมพันธ์ มันช่วยให้เราเปลี่ยนปัญหาตัวแปรสองตัวเป็นปัญหาที่ไม่แปร
  • ความไม่เท่าเทียมกันของ Chebyshev มันให้ความผูกพันกับความน่าจะเป็นที่มากกว่าค่าที่กำหนด

ในรายละเอียดบางอย่าง:

σXY2=σX2+σY22·cov(X,Y)

cov(X,Y)=σX·σY·ρXY

σXY2=σX2+σY22·σX·σY·ρX,Y

ตามความไม่เสมอภาคของ Chebyshev สำหรับตัวแปรสุ่มใด ๆ :Z

Pr(|Zμ|kσ)1k2

จากนั้น (และใช้ :μXY=μXμY)

Pr(|XYμX+μY|k·σX2+σY22·σX·σY·ρX,Y)1k2

เราสามารถใช้สมมติฐานที่ทำให้เข้าใจง่ายที่เสนอเพื่อรับนิพจน์ที่ง่ายขึ้น เมื่อไหร่:

ρX,Y=covar(X,Y)/σXσY=1ϵ
μx=μy=0
σX2=σY2=σ2

แล้ว:

σX2+σY22·σX·σY·ρX,Y=2·σ2·(1(1ϵ))=2σ2ϵ

และดังนั้นจึง:

Pr(|XY|k·σ2ϵ)1k2

สิ่งที่น่าสนใจคือผลลัพธ์นี้ยังคงอยู่แม้ว่าจะไม่เล็กและหากเงื่อนไขของการเปลี่ยนแปลงสหสัมพันธ์จากเป็นผลลัพธ์จะไม่เปลี่ยนแปลง (เนื่องจากความไม่เท่าเทียมกันอยู่แล้ว)ϵ=1ϵ1ϵ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.