การกระจายของผลิตภัณฑ์สเกลาร์ของเวกเตอร์หน่วยสุ่มสองตัวในมิติ


27

ถ้าxและyสองเป็นอิสระเวกเตอร์หน่วยสุ่มRD (การกระจายอย่างสม่ำเสมอในหน่วยทรงกลม) อะไรคือการกระจายตัวของผลคูณของพวกเขา (ผลิตภัณฑ์ dot) xy ?

ฉันเดาว่าDจะเพิ่มการกระจายอย่างรวดเร็ว (?) กลายเป็นปกติโดยมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนลดลงในส่วนของสูงขึ้น

limDσ2(D)0,
แต่มีสูตรที่ชัดเจนสำหรับσ2(D)หรือไม่

ปรับปรุง

ฉันวิ่งไปตามสถานการณ์จำลอง ประการแรกการสร้าง 10000 คู่ของเวกเตอร์หน่วยสุ่มสำหรับD=1000มันเป็นเรื่องง่ายที่จะเห็นว่าการกระจายตัวของผลคูณจุดของพวกเขาเป็นอย่างดีเสียน (ในความเป็นจริงมันค่อนข้างเสียนแล้วสำหรับD=100 ) ดูแผนทางด้านซ้าย ที่สองสำหรับแต่ละDตั้งแต่ 1 ถึง 10,000 (ด้วยขั้นตอนเพิ่มขึ้น) ฉันสร้าง 1,000 คู่และคำนวณความแปรปรวน พล็อตเข้าสู่ระบบเข้าสู่ระบบจะปรากฏบนด้านขวาและเป็นที่ชัดเจนว่าสูตรเป็นห้วงเป็นอย่างดีโดย1/D D โปรดทราบว่าสำหรับD=1และD=2สูตรนี้ยังให้ผลลัพธ์ที่แน่นอน (แต่ฉันไม่แน่ใจว่าจะเกิดอะไรขึ้นในภายหลัง)

ผลิตภัณฑ์ดอทระหว่างเวกเตอร์หน่วยสุ่ม


@KarlOskar: ขอบคุณลิงค์นี้มีความเกี่ยวข้องมากและในความเป็นจริงทำให้คำถามของฉันเกือบจะซ้ำซ้อน แต่ไม่มาก ดังนั้นจึงมีสูตรที่ชัดเจนสำหรับซึ่งเป็นฟังก์ชันการแจกแจงสะสมของผลิตภัณฑ์ดอท เราสามารถหาอนุพันธ์เพื่อรับ PDF จากนั้นศึกษาขีด จำกัดอย่างไรก็ตามมีการกำหนดสูตรในรูปแบบของฟังก์ชันเบต้าและฟังก์ชันเบต้าที่ไม่สมบูรณ์ดังนั้นการคำนวณจึงน่ารังเกียจ P{(x,y)>ϵ}D
อะมีบาพูดว่า Reinstate Monica

@KarlOskar: จากการกระจายชุดในหน่วยทรงกลมใน D ในการสร้างเวกเตอร์แบบสุ่มจากการแจกแจงนี้เราสามารถสร้างเวกเตอร์แบบสุ่มจาก Gaussian ด้วยความแปรปรวนของหน่วยแล้วทำให้เป็นมาตรฐาน RD
อะมีบาพูดว่า Reinstate Monica

คำตอบ:


30

เพราะ ( ที่เป็นที่รู้จักกันดี ) เครื่องแบบกระจายบนตัวเครื่องทรงกลม จะได้รับโดย normalizingกระจายปกติ -variate และ dot สินค้าของเวกเตอร์ปกติคือค่าสัมประสิทธิ์สหสัมพันธ์ของพวกเขาคำตอบของสาม คำถามคือ:SD1Dt

  1. u=(t+1)/2มีการกระจายเบต้า((D1)/2,(D1)/2)

  2. ความแปรปรวนของเท่ากับ (ตามที่คาดการณ์ไว้ในคำถาม)t1/D

  3. การแจกแจงแบบมาตรฐานของเข้าใกล้ภาวะปกติในอัตราtO(1D).


วิธี

การกระจายแน่นอนของผลคูณดอทของเวกเตอร์หน่วยสามารถหาได้ง่ายในเชิงเรขาคณิตเพราะนี่คือองค์ประกอบของเวกเตอร์ตัวที่สองในทิศทางของอันแรก เนื่องจากเวกเตอร์ที่สองมีความเป็นอิสระจากเวกเตอร์แรกและมีการกระจายอย่างสม่ำเสมอบนทรงกลมหน่วยส่วนประกอบของมันในทิศทางแรกจึงมีการกระจายเช่นเดียวกับพิกัดใด ๆ ของทรงกลม (โปรดสังเกตว่าการแจกแจงของเวกเตอร์แรกนั้นไม่สำคัญ)

การค้นหาความหนาแน่น

เมื่อพิกัดนั้นเป็นจุดสุดท้ายความหนาแน่นที่จึงเป็นสัดส่วนกับพื้นที่ผิวนอนที่ความสูงระหว่างและบนทรงกลมยูนิต สัดส่วนนั้นเกิดขึ้นภายในเข็มขัดที่มีความสูงและรัศมีซึ่งโดยพื้นฐานแล้วคือfrustum รูปกรวยที่สร้างขึ้นจากของรัศมีของความสูงและความลาดชัน2} ความน่าจะเป็นนั้นมาจากสัดส่วนใดt[1,1]tt+dtdt1t2,SD21t2,dt1/1t2

(1t2)D21t2dt=(1t2)(D3)/2dt.

ปล่อยให้สร้างความ2u-1 การแทนค่าที่ลงไปก่อนหน้านี้จะให้องค์ประกอบความน่าจะเป็นค่าคงที่ normalizing:u=(t+1)/2[0,1]t=2u1

fD(u)du(1(2u1)2)(D3)/2d(2u1)=2D2(uu2)(D3)/2du.

โดยทันทีที่มีการแจกแจงแบบเบต้าเพราะ (ตามคำนิยาม) ความหนาแน่นของมันยังเป็นสัดส่วนกับu=(t+1)/2((D1)/2,(D1)/2)

u(D1)/21(1u)(D1)/21=(uu2)(D3)/2fD(u).

การกำหนดพฤติกรรมการ จำกัด

ข้อมูลเกี่ยวกับพฤติกรรมที่ จำกัด ดังต่อไปนี้ได้อย่างง่ายดายโดยใช้เทคนิคเบื้องต้น:สามารถบูรณาการเพื่อให้ได้สัดส่วนคงที่ ; สามารถบูรณาการ (โดยใช้คุณสมบัติของฟังก์ชั่นเบต้าเป็นต้น) เพื่อให้ได้ช่วงเวลาแสดงให้เห็นว่าความแปรปรวนคือและลดลงเหลือ (มาจากทฤษฎีบทของ Chebyshev ความน่าจะเป็นอยู่ใกล้กับ ); และการ จำกัด การกระจายนั้นถูกค้นพบโดยการพิจารณาค่าของความหนาแน่นของการแจกแจงแบบมาตรฐานสัดส่วนกับสำหรับค่าขนาดเล็กของfDΓ(n2)πΓ(D12)tkfD(t)1/D0t=0fD(t/D),t :

log(fD(t/D))=C(D)+D32log(1t2D)=C(D)(1/2+32D)t2+O(t4D)C12t2

โดยที่ค่าคงที่ s) ของค่าคงที่ของการรวมกลุ่ม เห็นได้ชัดว่าอัตราการเข้าสู่ภาวะปกติ (ซึ่งความหนาแน่นของบันทึกเท่ากับ ) คือC12t2O(1D).

รูป

พล็อตนี้แสดงความหนาแน่นของผลิตภัณฑ์ดอทสำหรับซึ่งเป็นค่ามาตรฐานสำหรับความแปรปรวนของหน่วยและความหนาแน่นที่ จำกัด ค่าที่เพิ่มขึ้นด้วย (จากสีน้ำเงินถึงแดงทองและเขียวสำหรับความหนาแน่นปกติมาตรฐาน) ความหนาแน่นสำหรับจะแยกไม่ออกจากความหนาแน่นปกติที่ความละเอียดนี้D=4,6,100DD=1000


4
(+1) ขอบคุณมาก @whuber นี่เป็นคำตอบที่ยอดเยี่ยม! ขอขอบคุณเป็นพิเศษสำหรับการกล่าวถึงคำว่า "frustum" มันเกิดขึ้นว่าฉันได้รับคำตอบอีกไม่กี่นาทีก่อนที่คุณจะโพสต์ของคุณและฉันไม่ต้องการที่จะยกเลิกมันตอนนี้ หวังว่าคุณจะเข้าใจ. น่าเสียดายที่ไม่สามารถยอมรับทั้งสองได้! โดยวิธีการที่ให้สังเกตหลักฐานที่ง่ายมากของการแสดงออกสำหรับความแปรปรวนจากคำตอบที่: หนึ่งสามารถดูได้โดยตรงโดยไม่ต้องยุ่งกับฟังก์ชั่นเบต้า! ความแปรปรวนของดอทโปรดัคเท่ากับความแปรปรวนของพิกัดทรงกลมใด ๆ (ตามที่คุณเขียน) และผลรวมของทั้งหมดควรเท่ากับ , QED1/DD1
อะมีบาพูดว่า Reinstate Monica

1
นั่นเป็นการสังเกตที่ดีเกี่ยวกับความแปรปรวน
whuber

2
@amoeba, กิจกรรมล่าสุดทำให้ฉันสนใจที่นี่อีกครั้งและเท่าที่ฉันขอขอบคุณที่คุณยอมรับคำตอบของฉันกิจกรรมนี้เต็มอิ่มมากขึ้น ฉันจะไม่รังเกียจเลยถ้าคุณเปลี่ยน
ekvall

1
@ Student001: นี่เป็นความคิดเห็นที่ยุติธรรมและมีน้ำใจ ฉันเปลี่ยนคำตอบที่ยอมรับแล้ว ฉันได้พบหนึ่ง Q และหนึ่งใน A ของคุณที่จะ upvote เพื่อทำมัน :)
อะมีบาพูดว่า Reinstate Monica

1
@mat การกระจายตัวของเป็นที่ของ2U-1ที่ทำให้การกระจายเบต้าที่ได้รับการปรับขนาดและเปลี่ยนจากช่วงลงในช่วง[-1,1]t2U1[0,1][1,1]
whuber

11

ลองหาการกระจายตัวแล้วความแปรปรวนตามด้วยผลลัพธ์มาตรฐาน พิจารณาผลิตภัณฑ์เวคเตอร์และเขียนมันในรูปแบบโคไซน์นั่นคือสังเกตว่าเรามีที่คือมุมระหว่างและy ที่ในขั้นตอนสุดท้ายฉันใช้มันสำหรับเหตุการณ์ใด ๆและตอนนี้พิจารณาระยะy) เป็นที่ชัดเจนว่าเนื่องจากได้รับเลือกอย่างสม่ำเสมอเมื่อเทียบกับพื้นผิวทรงกลมจึงไม่สำคัญว่า

P(xyt)=P(|x||y|cosθt)=P(cosθt)=EP(cosθty),
θxyAB
EP(AB):=E[E[χAB]]=EχA=P(A).
P(cosθty)xyที่จริงแล้วมีเพียงแค่มุมระหว่างและสำคัญเท่านั้น ดังนั้นคำที่อยู่ในความคาดหมายจึงเป็นค่าคงที่ในฐานะฟังก์ชันของและเราสามารถรู้ได้ว่าจากนั้นเราจะได้แต่เนื่องจากเป็นพิกัดแรกของเวกเตอร์เกาส์นอร์แบบปกติใน เรามีว่าคือเกาส์ที่มีความแปรปรวนโดยเรียกผลลัพธ์แบบของกระดาษนี้xyyy=[1,0,0,].
P(xyt)=P(x1t).
x1Rn,xy1/n

สำหรับผลที่ชัดเจนของความแปรปรวนให้ใช้ความจริงที่ว่าสินค้า dot เป็นศูนย์โดยเฉลี่ยเป็นอิสระและเป็นที่ปรากฏข้างต้นกระจายเหมือนครั้งแรกพิกัดของxโดยผลเหล่านี้หาจำนวนเงินที่จะหา 2 ตอนนี้ให้สังเกตว่าต่อการก่อสร้างและเพื่อให้เราสามารถเขียนที่ความเสมอภาคสุดท้ายดังต่อไปนี้จากที่พิกัดของมีการกระจายตัวเหมือนกัน เมื่อนำสิ่งต่าง ๆ มารวมกันเราพบว่าxVar(xy)Ex12xx=1

1=Exx=Ei=1nxi2=i=1nExi2=nEx12,
xVar(xy)=Ex12=1/n

ขอบคุณ แต่ฉันสับสน: "ผลลัพธ์ที่ต้องการ" คืออะไรและมันทำตามจากสมการสุดท้ายหรือไม่ การกระจายความน่าจะเป็นครั้งสุดท้ายที่ควรขึ้นอยู่กับDD
อะมีบาพูดว่า Reinstate Monica

ที่จริงแล้วผลที่ตามมาจากสมการสุดท้ายของคุณคือสิ่งที่กล่าวถึงในเธรด math.SEที่คุณพบ มันเกี่ยวข้องกับการแจกแจงแบบเบต้า ฯลฯ และพฤติกรรมการ จำกัด อยู่ที่ (ไกล) จากที่เห็นได้ชัด ผมคิดว่าควรจะมีทางตรงง่ายที่จะเห็นว่า D σ2(D)1/D
อะมีบาพูดว่า Reinstate Monica

มันขึ้นอยู่กับขนาดตั้งแต่โดยที่คือเวกเตอร์เกาส์เซียนที่สร้างขึ้น ฉันจะอัปเดตคำตอบในวันนี้หรือพรุ่งนี้ในภายหลัง x1=z1|z|1z
ekvall

ว้าวเยี่ยมมากลิงค์สุดท้ายของคุณให้ขีด จำกัด ของนิพจน์ที่เกี่ยวข้องกับฟังก์ชันเบต้าผกผัน (ซึ่งฉันกลัวที่จะคำนวณ) ในสมการที่สามในหน้า 1 ดังนั้นเพื่อให้เหตุผลเสร็จสมบูรณ์: ถ้าทรงกลมมีรัศมี , แล้วเป็น (asymptotically) กระจายเป็น(0,1) ซึ่งหมายความว่าสำหรับรูปทรงกลมของรัศมีหน่วยความแปรปรวนเป็นครั้งมีขนาดเล็กเช่น D อย่างไรก็ตามฉันยังมีข้อกังวล: ฉันตรวจสอบจาก 1 ถึง 4 และดูเหมือนจะให้ความแปรปรวนที่แน่นอนแม้ว่าการแจกแจงสำหรับ D = 1 หรือ D = 2 นั้นไกลจากปกติมาก ควรมีเหตุผลที่ลึกกว่านั้น Dx1N(0,1)D1/DD1/D
อะมีบากล่าวว่า Reinstate Monica

@amoeba ใช่อัปเดตพร้อมหลักฐานว่า
ekvall

2

เพื่อที่จะตอบในส่วนแรกของคำถามของคุณแสดงว่าY_i กำหนด ผลิตภัณฑ์ขององค์ประกอบ ของและแสดงที่นี่ในฐานะจะถูกกระจายไปตามการจัดจำหน่ายร่วมกันของและY_i ตั้งแต่ , Z=X,Y=XiYi

fZi(zi)=fZ1,,ZD(z1,,zD)dzi
ithXYZiXiYi
fZi(zi)=fXi,Yi(x,zix)1|x|dx
Z=Zi
fZ(z)=fZ1,,ZD(z1,,zd)δ(zzi)dz1dzd

สำหรับส่วนที่สองฉันคิดว่าถ้าคุณต้องการพูดอะไรที่น่าสนใจเกี่ยวกับพฤติกรรมแบบอะซิมโทติคของอย่างน้อยคุณก็ต้องยอมรับความเป็นอิสระของและแล้วจึงใช้ CLTσXY

ตัวอย่างเช่นถ้าคุณมีความเต็มใจที่จะคิดว่ามี IID กับและคุณสามารถ บอกว่าและ0{Z1,,ZD}E[Zi]=μV[Zi]=σ2σ2(D)=σ2DlimDσ2(D)=0


ขอบคุณ แต่ฉันสับสนเกี่ยวกับส่วนที่สอง แน่นอนว่าและควรจะเป็นอิสระฉันจะเพิ่มคำถามนี้ คุณพูดว่าและฟังดูสมเหตุสมผล แต่พฤติกรรม asymptotic ของคืออะไร? ฉันคิดว่านิพจน์ที่ฉันค้นหาควรขึ้นอยู่กับเท่านั้น โดยวิธีใน 2Dถ้าฉันไม่ผิดฉันสงสัยว่าสิ่งนี้ยังคงเป็นจริงในมิติที่สูงขึ้น ...XYσ2(D)=Var(zi)/DVar(zi)DVar(zi)=1/2
อะมีบาพูดว่า Reinstate Monica

เป็นไปได้หรือไม่ที่จะเป็นอิสระจากข้อกำหนดที่และมีความยาวหน่วย ziXY
ekvall

@ Tom: โดยวิธีการที่ผมเป็นเข้าใจผิด: ในแบบ 2Dคือ 1, มันเป็นที่เท่ากับ 1/2 ฉันได้อัปเดตคำถามของฉันด้วยผลการจำลองบางอย่าง ดูเหมือนว่าสูตรที่ถูกต้องคือ D Var(zi)Var(z)1/D
อะมีบาพูดว่า Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.