อะไรคือลักษณะที่น่าแปลกใจที่สุดของการแจกแจงแบบเกาส์ (ปกติ)?


52

การแจกแจงแบบเกาส์มาตรฐานบนสามารถกำหนดได้โดยให้ความหนาแน่นอย่างชัดเจน: R

12πex2/2

หรือฟังก์ชั่นลักษณะของมัน

ตามที่นึกไว้ในคำถามนี้มันก็เป็นเพียงการแจกแจงที่ค่าเฉลี่ยและความแปรปรวนตัวอย่างเป็นอิสระ

อะไรคือคุณสมบัติทางเลือกที่น่าแปลกใจอื่น ๆ ของ Gaussian ที่คุณรู้ ฉันจะยอมรับคำตอบที่น่าประหลาดใจที่สุด

คำตอบ:


39

ส่วนบุคคลที่น่าประหลาดใจที่สุดของฉันคือสิ่งที่เกี่ยวกับค่าเฉลี่ยและความแปรปรวนตัวอย่าง แต่นี่เป็นอีกลักษณะที่น่าแปลกใจ: ถ้าและเป็น IID ที่มีความแปรปรวนแน่นอนที่มีและอิสระแล้วและเป็นปกติXYX+YXYXY

โดยทั่วไปเราสามารถระบุได้ว่าเมื่อใดที่ตัวแปรไม่ได้เป็นอิสระกับสแกตเตอร์แปลง ดังนั้นลองจินตนาการว่ามีสแกตเทอร์ล็อตของคู่ที่ดูเป็นอิสระ ทีนี้หมุนไปตาม 45 องศาแล้วดูอีกครั้ง: ถ้ามันยังดูเป็นอิสระอยู่พิกัดและทีละตัวต้องเป็นปกติX Y(X,Y)XY

หากต้องการดูว่าทำไมบิตที่ใช้งานง่ายนั้นลองดู

[cos45sin45sin45cos45][xy]=12[xyx+y]

3
เจย์ - นี่เป็นคำแถลงใหม่เกี่ยวกับค่าเฉลี่ยและความแปรปรวนที่เป็นอิสระ เป็นค่าเฉลี่ยที่ปรับขนาดใหม่และเป็นค่าเบี่ยงเบนมาตรฐานที่ปรับลดได้ X - YX+YXY
ความน่าจะเป็นทางการ

5
@probabilityislogic - ฉันชอบสัญชาตญาณของสิ่งที่คุณพูด แต่ฉันไม่คิดว่ามันเป็นการกล่าวซ้ำเพราะไม่ใช่การลดขนาด SD: SD ลืมสัญญาณ ดังนั้นความเป็นอิสระของค่าเฉลี่ยและ SD จะตามมาจากความเป็นอิสระของ , (เมื่อ ) แต่ไม่ใช่วิธีอื่น ๆ นั่นอาจเป็นสิ่งที่คุณหมายถึงโดยพื้นฐานแล้ว อย่างไรก็ตามมันเป็นสิ่งที่ดี X + Y X - Y n = 2XYX+YXYn=2

4
เราจะหาหลักฐานสำหรับอสังหาริมทรัพย์นี้ได้ที่ไหน?
Royi

1
@Royi ดู 16. ที่นี่ สำหรับ (a) ทราบว่า(XY) สำหรับ (b) โปรดทราบว่าซึ่งปรารถนาการทดแทนจากการที่คุณจะได้รับn}) หากแล้ว ดังนั้นสำหรับทุก ,และมีลำดับดังกล่าวว่าและสำหรับทั้งหมดซึ่งขัดแย้งกับความต่อเนื่องของที่φ ( 2 t ) φ ( - 2 t ) = ( φ ( t ) φ ( - t ) ) 4 ψ ( t ) = φ ( t ) φ ( - t ) ψ ( t ) = ψ 2 2 n2X=(X+Y)+(XY)φ(2t)φ(2t)=(φ(t)φ(t))4ψ(t)=φ(t)φ(t)φ(t0)=0ψ(t0)=0nψ(t0ψ(t)=ψ22n(t2n)φ(t0)=0ψ(t0)=0ntntn0φ(tn)=0nφ0ψ(t02n)=0tntn0φ(tn)=0nφ0. (c) ตรงไปตรงมา [ต่อ]
Gabriel Romon

1
สำหรับ (d)n}) โปรดทราบว่าจึง2) เสียบนี้ในความเท่าเทียมกันก่อนหน้านี้และพิสูจน์ว่าสำหรับการแก้ไข ,ซึ่งหมายถึงสำหรับทุกเสื้อนี่หมายความว่าเป็นจริงและความเท่าเทียมกันใน (a) กลายเป็นสิ่งที่ถูกถาม พิสูจน์อีกครั้งว่าและใช้ที่จะได้รับ2/2} ดังนั้นและφ(t)=1-t2γ(t)=γ2n(t2n)φ(t)=1t22+o(t2)γ(t)=1+o(t2)tlimnγ2n(t2n)=1γ(t)=1tφφ(t)=φ22n(t2n)φ(t)=1t22+o(t2)limnφ22n(t2n)=et2/2φ(t)=et2/2Xเป็นเรื่องปกติ
Gabriel Romon


22

มีหนังสือทั้งเล่มที่เขียนเกี่ยวกับเรื่องนี้: "ลักษณะของกฎความน่าจะเป็นปกติ", AM Mathai & G. Perderzoli บทวิจารณ์สั้น ๆ ในJASA (ธันวาคม 1978)กล่าวถึงสิ่งต่อไปนี้:

ให้เป็นตัวแปรสุ่มอิสระ ดังนั้นและมีความเป็นอิสระโดยที่ถ้าหาก [กระจาย] เป็นปกติX1,,Xni=1naixii=1nbixiaibi0Xi


3
จะต้องมีเงื่อนไขเช่นขาดหายไปหรือไม่ ตัวอย่างเช่นหาก n = 2 และไม่เป็นอิสระ <a,b>=0ai=bi=1 X1+X2X1+X2
robin girard

1
@ robin จับได้ดี ฉันก็งงกับปริมาณที่แน่นอนเช่นกัน น่าเสียดายที่ฉันมีสิทธิ์เข้าถึงคือใบเสนอราคา (titillating) จากการตรวจสอบไม่ใช่หนังสือ มันจะสนุกถ้าได้เจอมันในห้องสมุดและดูมัน ...
whuber

นี่เป็นความเห็นทั่วไปของคำตอบของ G. Jay Kerns (ปัจจุบัน # 1)
vqv

ฉันคิดว่าคุณอาจมองหากระดาษ Lukacs & King (1954) ดูคำตอบนี้ได้ที่ math.SEพร้อมลิงค์ไปยังเอกสารข้างต้น
พระคาร์ดินัล

2
ข้อเสนอนี้กล่าวว่า "โดยที่ " หมายความว่าสำหรับ scalars ทุกชุดที่ "หรือไม่ฉันเกลียดการดู" ที่ "ใช้แทน" สำหรับทุกคน "หรือ" สำหรับบางคน " ที่ไหน "ควรใช้เพื่ออธิบายสัญกรณ์ของคนเช่นเดียวกับใน" ที่คือความเร็วของแสงและเป็นผลิตภัณฑ์มวลรวมภายในประเทศ "ฯลฯaibi0aibi0cg
Michael Hardy

17

การแจกแจงแบบเกาส์เป็นดิสทริบิวชันผลรวมที่มีความผันแปร จำกัด เพียงอย่างเดียว


8
ว่าพวกเขามีความมั่นคงรวมและพวกเขาเป็นคนที่ไม่ซ้ำกับความแปรปรวน จำกัด ทั้ง CLT ส่วนที่น่าสนใจของการยืนยันนี้คือมีการแจกแจงผลรวมที่มีเสถียรภาพอื่น ๆ !
whuber

1
@whuber: แน่นอน! การจำแนกลักษณะนี้ค่อนข้างบิดเบี้ยวและการแจกแจงผลรวมความเสถียรอื่น ๆ อาจจะอยากรู้อยากเห็นมากกว่านี้
shabbychef

@ จริงแล้วฉันไม่เห็นว่า CLT มีความหมายอย่างไร ดูเหมือนว่าจะบอกเราเท่านั้นว่าasymptoticallyผลรวมของบรรทัดฐานเป็นเรื่องปกติไม่ใช่ว่าผลรวม จำกัด ใด ๆ จะกระจายตามปกติ หรือคุณต้องใช้ทฤษฎีบทของ Slutsky ด้วยเช่นกัน?
shabbychef

3
การนำมาตรฐานปกติมาใช้ผลรวมของสองบรรทัดฐานคือผลรวมของการแจกแจงปกติหนึ่ง X_0 บวกการ จำกัด การกระจายของชุด X_1, X_2, ... ดังนั้นผลรวมคือการกระจายที่ จำกัด ของ X_0, X_1, ... ซึ่ง โดย Lindeberg-Levy CLT เป็นเรื่องปกติ
whuber

17

สไตน์เลมม่ามีคุณสมบัติที่มีประโยชน์มาก เป็นมาตรฐานแบบเกาส์ iff สำหรับฟังก์ชั่นต่อเนื่องทุกอย่างกับ<\Z

Ef(Z)=EZf(Z)
fE|f(Z)|<

12

ทฤษฎีบท [เฮอร์เชล - แม็กซ์เวลล์]:ปล่อยเป็นเวกเตอร์สุ่มที่ (i) การคาดการณ์ในฉากย่อย orthogonal เป็นอิสระและ (ii) การกระจายของขึ้นอยู่กับความยาว. จากนั้นจะกระจายตัวตามปกติZRnZZZ

อ้างถึงโดย George Cobb ในสถิติการสอน: ความตึงเครียดที่สำคัญบางอย่าง (Chilean J. Statistics Vol. 2, No. 1, April 2011) at p. 54

Cobb ใช้คุณลักษณะนี้เป็นจุดเริ่มต้นสำหรับการหา , , และการแจกแจงแบบโดยไม่ต้องใช้แคลคูลัส (หรือทฤษฎีความน่าจะเป็นมาก)χ2tF


9

ให้และเป็นสองตัวแปรสุ่มอิสระที่มีการแจกแจงแบบสมมาตรทั่วไปเช่นนั้นηξ

P(|ξ+η2|t)P(|ξ|t).

จากนั้นตัวแปรสุ่มเหล่านี้คือ Gaussian (เห็นได้ชัดว่าถ้าและอยู่กึ่งกลาง gaussian มันเป็นเรื่องจริง)ξη

นี่คือทฤษฎีบทของ Bobkov-Houdre


9

นี่ไม่ใช่ลักษณะเฉพาะ แต่เป็นการคาดเดาซึ่งมีอายุย้อนกลับไปตั้งแต่ปี 2460 และเกิดจาก Cantelli:

ถ้าเป็นฟังก์ชันบวกบนและและเป็นตัวแปรสุ่มอิสระเช่นเป็นเรื่องปกติแล้วเป็นค่าคงที่เกือบทุกที่fRXYN(0,1)X+f(X)Yf

กล่าวโดยGérard Letac ที่นี่


มันเป็นเรื่องดีที่คุณพูดถึงมัน! ฉันไม่เข้าใจปรีชาใช่ไหม
robin girard

@robin นี่คือสิ่งที่ทำให้การคาดเดานี้เป็นพิเศษ: คำแถลงเบื้องต้นที่สมบูรณ์แนวทางที่ชัดเจนซึ่งล้มเหลวอย่างน่าสังเวช (ฟังก์ชั่นลักษณะ) และอีกวิธีหนึ่งที่เหลืออยู่โดยไม่มีอะไรที่จะเข้าใจ ... หรือเท็จ? แม้จะไม่ชัดเจน (สำหรับฉัน)
ทำ

2
ถ้าGérard Letac ไม่สามารถพิสูจน์ได้มันคงเป็นการคาดเดาที่เปิดอยู่พักหนึ่ง ... !
ซีอาน

@ ซีอาน: ฉันเห็นด้วยอย่างแน่นอน (ไม่ทราบว่าคุณกำลังใช้บริการโรมมิ่งในไตรมาสนี้ของเว็บ ... ข่าวดีว่าคุณมี.)
Did

6
@ ซีอานนี่คือตัวอย่างก่อนพิมพ์โดย Victor Kleptsyn และ Aline Kurtzmann ที่มีตัวอย่างของการคาดคะเน Cantelli การก่อสร้างใช้เป็นเครื่องมือใหม่ที่ผู้เขียนเรียกขนส่งมวลชน Brownian และมีผลเป็นฟังก์ชั่นต่อเนื่องฉผู้เขียนระบุว่าพวกเขาเชื่อว่าการคาดคะเนของ Cantelli จะถือเอาไว้ถ้ามีคนถามว่าเป็นแบบต่อเนื่อง ff
ทำ

8

สมมติว่าหนึ่งคือการประมาณพารามิเตอร์สถานที่โดยใช้ข้อมูล IID\} ถ้าเป็นตัวประมาณความเป็นไปได้สูงสุดการกระจายตัวตัวอย่างคือ Gaussian ตามทฤษฎีความน่าจะเป็นของเจย์เนส: ตรรกะของวิทยาศาสตร์หน้า 202-4 นี่คือวิธีที่เกาส์ได้รับมันมา{x1,...,xn}x¯


ฉันไม่แน่ใจว่าฉันเข้าใจสิ่งนี้เป็นลักษณะของการแจกแจงแบบปกติดังนั้นฉันอาจจะพลาดอะไรบางอย่างไป เกิดอะไรขึ้นถ้าเรามีข้อมูล IID Poisson และต้องการที่จะประเมิน ? MLE คือแต่การกระจายตัวตัวอย่างของไม่ใช่ Gaussian - ประการแรกจะต้องมีเหตุผล; ประการที่สองถ้าเป็นแบบเกาส์จึงจะแต่ที่MU) μx¯x¯x¯xiPoisson(nμ)
Silverfish

2
ค่าเฉลี่ยของปัวซองนั้นไม่ใช่พารามิเตอร์ตำแหน่ง!
kjetil b halvorsen

6

ลักษณะเฉพาะมากขึ้นของการกระจายปกติในหมู่ระดับของการหารเพียบกระจายจะนำเสนอในSteutel และรถตู้ในหาน (2004)

ตัวแปรสุ่มแบบสุ่มที่ไม่เสื่อมโทรมที่ไม่มีการแบ่งมีการแจกแจงแบบปกติหากว่าเป็นไปตาม X

lim supxlogP(|X|>x)xlog(x)=.

ผลลัพธ์นี้เป็นลักษณะการแจกแจงแบบปกติในแง่ของพฤติกรรมหาง


1
หลักฐานสั้น ๆ ของข้อ จำกัด ที่ระบุมีดังนี้: ถ้าเป็นมาตรฐานปกติแล้วเป็นดังนั้น0 แต่และดังนั้นผลลัพธ์จึงตามมา ร่างคร่าวๆของปัวซองดูเหมือนจะบ่งบอกว่าขีด จำกัด ที่กำหนดคือแต่ฉันไม่ได้ตรวจสอบอย่างใกล้ชิดเกินไป XxP(X>x)/φ(x)1xlogP(X>x)logφ(x)+logx02logφ(x)x2λ
พระคาร์ดินัล

6

ในบริบทของการปรับภาพให้เรียบ (เช่นพื้นที่สเกล ) เกาส์เซียนเป็นเคอร์เนล * ที่แยกได้แบบสมมาตร

นั่นคือถ้าเราต้องการ โดยที่ดังนั้นความสมมาตรในการหมุนจึงต้อง ซึ่งเทียบเท่ากับ\

F[x,y]=f[x]f[y]
[x,y]=r[cosθ,sinθ]
Fθ=f[x]f[y]xθ+f[x]f[y]yθ=f[x]f[y]y+f[x]f[y]x=0f[x]xf[x]=f[y]yf[y]=const.
log[f[x]]=cx

ต้องการให้เป็นเคอร์เนลที่เหมาะสมจากนั้นต้องการค่าคงที่เป็นค่าลบและค่าเริ่มต้นเป็นค่าบวกโดยให้เคอร์เนล Gaussianf[x]


* ในบริบทของการแจกแจงความน่าจะเป็นแบบแยกได้หมายถึงเป็นอิสระในขณะที่ในบริบทของการกรองภาพจะช่วยให้การลดความซับซ้อนของ 2D ในการคำนวณลดลงไปถึงการโน้มน้าวใจ 1D สองครั้ง


2
+1 แต่สิ่งนี้ไม่ได้ตามมาจากการประยุกต์ใช้ทฤษฎีบท Herschel-Maxwellใน 2D ทันทีหรือไม่
whuber

@whuber แน่นอนฉันพยายามที่จะมองข้ามคำตอบของคุณเมื่อมองผ่านหัวข้อนี้!
อะมีบาพูดว่า Reinstate Monica

@whuber ใช่ ฉันไม่ได้อ่านรายละเอียดของเธรดเก่าและเพิ่งเพิ่มคำตอบนี้ตามคำขอ
GeoMatt22

1
@amoeba ดูที่นี่ด้วย
GeoMatt22

3

เมื่อเร็ว ๆ นี้ Ejsmont [1] บทความที่ตีพิมพ์พร้อมการอธิบายลักษณะของเกาส์เซียนใหม่:

ปล่อยเป็นเวกเตอร์สุ่มอิสระทุกช่วงเวลาโดยที่ นั้นไม่ได้สร้างและให้สถิติ มีการจัดจำหน่ายซึ่งขึ้นอยู่เฉพาะในที่และ<n จากนั้นมีความเป็นอิสระและมีการกระจายปกติเดียวกันกับศูนย์วิธีการและสำหรับ\}(X1,,Xm,Y) and (Xm+1,,Xn,Z)Xii=1naiXi+Y+Zi=1nai2aiR1m<nXicov(Xi,Y)=cov(Xi,Z)=0i{1,,n}

[1] Ejsmont, Wiktor "ลักษณะของการแจกแจงแบบปกติโดยความเป็นอิสระของเวกเตอร์สุ่มคู่หนึ่ง" สถิติและความน่าจะเป็นที่จดหมาย 114 (2016): 1-5


1
นั่นเป็นลักษณะที่ละเอียดอ่อนและน่าหลงใหล ขอบคุณสำหรับการปรับปรุงหัวข้อนี้ด้วยการแบ่งปัน!
whuber

1

ฟังก์ชั่นลักษณะของมันมีรูปแบบเช่นเดียวกับ pdf ฉันไม่แน่ใจเกี่ยวกับการกระจายอื่นซึ่งทำเช่นนั้น


4
ดูคำตอบของฉันนี้สำหรับวิธีการสร้างตัวแปรสุ่มที่มีฟังก์ชั่นลักษณะเหมือนกับไฟล์ PDF ของพวกเขา
Dilip Sarwate

-1

ความคาดหวังบวกลบค่าเบี่ยงเบนมาตรฐานคือจุดอานของฟังก์ชัน


11
นี่คือคุณสมบัติของการแจกแจงแบบปกติเพื่อให้แน่ใจ แต่ไม่ได้ระบุลักษณะเพราะการกระจายอื่น ๆ มากมายมีคุณสมบัตินี้
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.