เหตุใดการแจกแจงที่รู้จักทั้งหมดจึงไม่เหมือนกัน?


13

ฉันไม่ทราบว่ามีการแจกแจงแบบหลายรูปแบบใด ๆ

เหตุใดการแจกแจงที่รู้จักทั้งหมดจึงไม่เหมือนกัน? มีการกระจาย "มีชื่อเสียง" ที่มีมากกว่าหนึ่งโหมดหรือไม่

แน่นอนว่าการผสมของการแจกแจงมักจะต่อเนื่องหลายรูปแบบ แต่ฉันต้องการที่จะรู้ว่ามีการกระจาย "ไม่ผสม" ใด ๆ ที่มีมากกว่าหนึ่งโหมด


5
คุณกำลังพูดถึงการแจกแจงแบบ "มาตรฐาน" มากกว่าการแจกแจงแบบ "รู้จัก"
Stéphane Laurent

12
แล้วเบต้ากับล่ะ? α=β=0.5
อะมีบาพูดว่า Reinstate Monica

1
หากคุณไม่ทราบขอบเขตการกระจาย bimodalวิกิพีเดียยังกล่าวถึงU-กำลังสองและการกระจาย arcsine ผมคิดว่าสิ่งเหล่านี้เป็นเพียงกรณีพิเศษของการกระจายเบต้า แต่ ... วิกิพีเดียยังกล่าวถึงตัวอย่างบางส่วนของเหตุการณ์ที่เกิดขึ้นตามธรรมชาติของการกระจายต่อเนื่อง
Nick Stauner

12
@ StéphaneLaurent: ฉันชอบ"ดิสทริบิวชั่นแบรนด์เนม"สำหรับการถ่ายทอดว่าการตั้งชื่อไม่ได้บ่งบอกถึงสถานะพิเศษใด ๆ สำหรับการจัดจำหน่าย การแจกแจง "รู้จัก" ทำให้ดูเหมือนว่าที่เหลืออาจจะอยู่ที่นั่นที่ไหนสักแห่งที่รอการค้นพบเช่นสัตว์ประหลาด Loch-Ness หรือสสารมืด
Scortchi - Reinstate Monica

5
ยอดเยี่ยม @Scortchi คำศัพท์ที่ยอดเยี่ยม! นักวิทยาศาสตร์ที่ไม่ใช่นักคณิตศาสตร์จำนวนมากที่ฉันพบเจออยู่ภายใต้ความประทับใจที่ไม่มีชื่อจำหน่าย บางทีอาจมีความจริงเกี่ยวกับปรัชญาที่ลึกซึ้งกว่านั้นความสับสนของชื่อและสิ่งที่เขียนโดยชื่อนี้ (ดังที่รัสเซลกล่าวว่า "คำว่า 'สุนัข' ไม่มีความคล้ายคลึงกับสุนัข")
Stéphane Laurent

คำตอบ:


17

ส่วนแรกของคำถามที่ตอบในความคิดเห็นคำถาม: ความอุดมสมบูรณ์ของ "แบรนด์เนม" แจกแจงเนื่องหลายรูปแบบเช่นเบต้าใด ๆการกระจายกับและ1 ลองหันไปหาส่วนที่สองของคำถามa < 1 b < 1(a,b)a<1b<1

การกระจายแบบไม่ต่อเนื่องทั้งหมดเป็นการผสมกันอย่างชัดเจน (ของอะตอมซึ่งเป็นรูปแบบเดียว)

ฉันจะแสดงให้เห็นว่าการแจกแจงแบบต่อเนื่องส่วนใหญ่เป็นการผสมผสานของการกระจายแบบ unimodal สัญชาตญาณที่อยู่เบื้องหลังสิ่งนี้ง่ายมาก: เราสามารถ "ขจัด" การกระแทกจากกราฟที่เป็นหลุมเป็นบ่อของ PDF ทีละหนึ่งจนกว่ากราฟจะเป็นแนวนอน การกระแทกจะกลายเป็นส่วนประกอบของการผสมซึ่งแต่ละส่วนนั้นมีลักษณะแบบเดียวกับที่เห็นได้ชัด

ดังนั้นอาจมีการแจกแจงผิดปกติบางอย่างซึ่ง PDF นั้นไม่ต่อเนื่องสูงคำตอบสำหรับคำถามคือ "ไม่มี":การแจกแจงแบบหลายค่าทั้งหมดที่ต่อเนื่องอย่างไม่ต่อเนื่องหรือการรวมกันของสองอย่างนี้เป็นส่วนผสมของการแจกแจงแบบเดี่ยว


พิจารณาการแจกแจงแบบต่อเนื่องซึ่งไฟล์ PDF เป็นต่อเนื่อง (นี่คือการแจกแจง "ต่อเนื่อง" (ความต่อเนื่องไม่ใช่ข้อ จำกัด มากมันสามารถผ่อนคลายได้มากขึ้นโดยการวิเคราะห์อย่างระมัดระวังมากขึ้นโดยสมมติว่าจุดที่ไม่ต่อเนื่องนั้นแยกออกจากกัน) FFf

เพื่อรับมือกับ "plateaus" ของค่าคงที่ที่อาจเกิดขึ้นให้กำหนด "โหมด" ให้เป็นช่วง (ซึ่งอาจเป็นจุดเดียวที่ ) เช่นนั้นx l = x um=[xl,xu]xl=xu

  1. m , yfมีค่าคงที่ต่อพูดYm,y

  2. เมตรfไม่ได้อย่างต่อเนื่องในช่วงเวลาใด ๆ ที่มีอย่างเคร่งครัดเมตรm

  3. มีอยู่ในเชิงบวกจำนวนดังกล่าวว่าค่าสูงสุดของบรรลุบนเท่ากับYf [ x l - ϵ , x u + ϵ ] yϵf[xlϵ,xu+ϵ]y

ให้เป็นโหมดของการใด ๆฉเนื่องจากเป็นแบบต่อเนื่องจึงมีช่วงที่มีซึ่งไม่ได้ลดลงใน (ซึ่งเป็นช่วงเวลาที่เหมาะสมไม่ใช่แค่จุด) และไม่เพิ่มขึ้น (ซึ่งเป็นช่วงเวลาที่เหมาะสมเช่นกัน) ให้เป็นค่าที่น้อยที่สุดของค่าทั้งหมดและค่าสูงสุดของค่าดังกล่าวทั้งหมดf f [ x l , x u ] m f [ x l , x l ] [ x u , x u ] x l x um=[xl,xu]ff[xl,xu]mf[xl,xl][xu,xu]xlxu

การก่อสร้างนี้ได้กำหนดหนึ่ง "โคก" บนกราฟของยื่นออกมาจากที่จะx_uLetเป็นขนาดใหญ่ของและนายก) จากการก่อสร้างชุดของจุดในซึ่งเป็นช่วงเวลาที่เหมาะสมบรรจุอย่างเคร่งครัด(เพราะมีทั้งหรือ )x l x u y f ( x l ) f ( x u ) x [ x l , x u ] f ( x ) y m m [ x l , x l ] [ x u , x u ]fxlxuyf(xl)f(xu)x[xl,xu]f(x)ymm[xl,xl][xu,xu]

รูป

ในภาพประกอบนี้ของ PDF แบบหลายมิติ, โหมดถูกระบุด้วยจุดสีแดงบนแกนนอน ขอบเขตแนวนอนของส่วนสีแดงของการเติมเป็นช่วง : มันเป็นฐานของโคกที่กำหนดโดยโหมดเมตรฐานของโคกที่อยู่ที่ความสูง0.16 PDF ต้นฉบับคือผลรวมของการเติมสีแดงและการเติมสีน้ำเงิน โปรดสังเกตว่าการเติมสีน้ำเงินมีเพียงโหมดเดียวใกล้ ; ลบโหมดดั้งเดิมที่แล้วm m y 0.16 2 [ 0 , 0 ]m=[0,0]mmy0.162[0,0]

เขียนสำหรับความยาวของ , definem |m|m

pm=PrF(m)y|m|

และ

fm(x)=f(x)ypm

เมื่อและอย่างอื่น (ทำให้นี้ฟังก์ชั่นอย่างต่อเนื่องบังเอิญ.) เศษเป็นจำนวนเงินที่เพิ่มขึ้นสูงกว่าและหารอยู่ในพื้นที่ระหว่างกราฟของและYดังนั้นจึงไม่เป็นลบและมีพื้นที่ทั้งหมด : เป็น PDF ของการแจกแจงความน่าจะเป็น โดยการก่อสร้างจะมีโหมดที่ไม่ซ้ำกันเมตรf m ( x ) = 0 f m f y p m f y f m 1 mxmfm(x)=0fmfypmfyfm1m

ด้วยการก่อสร้างฟังก์ชั่น

fm(x)=f(x)pmfm(x)1pm

เป็นรูปแบบไฟล์ PDF ที่มีให้1 (เห็นได้ชัดว่าถ้าไม่มีอะไรเหลืออยู่ของซึ่งจะต้องเริ่มต้นด้วย unimodal) ยิ่งไปกว่านั้นมันไม่มีโหมดในช่วง (ซึ่งเป็นค่าคงที่ซึ่งเป็นเหตุผลที่นิยามก่อนหน้านี้อย่างระมัดระวังของ จำเป็นต้องใช้โหมดตามช่วงเวลา) นอกจากนี้p m = 1 f , m pm<1pm=1f,m

f(x)=pmfm(x)+(1pm)fm(x)

เป็นส่วนผสมของรูปแบบไฟล์ PDF unimodalและรูปแบบไฟล์ PDF f_mf mfmfm

ทำซ้ำขั้นตอนนี้ด้วย (ซึ่งเป็นการรวมกันเชิงเส้นของฟังก์ชันต่อเนื่องยังคงเป็นฟังก์ชั่นต่อเนื่องทำให้เราสามารถดำเนินการได้เหมือนเดิม) สร้างลำดับโหมด ; ลำดับที่สอดคล้องกันของน้ำหนัก ; และ PDF มีข้อ จำกัด ของผลลัพธ์เนื่องจาก (a) ช่วงเวลาที่แบนรวมถึงช่วงเวลาที่เหมาะสมซึ่งไม่ได้ถูกแบนในก่อนหน้า= ม. 1 , ม. 2 , ... P 1 = P M , P 2 = P ม. 2 , ... 1 = , 2 = F ม. 2 , ... f ฉันฉัน- 1 ffmm=m1,m2,p1=pm,p2=pm2,f1=fm,f2=fm2,.fii1การดำเนินงานและ (b) จำนวนจริงไม่สามารถแบ่งออกเป็นจำนวนที่มากกว่านับได้ของช่วงเวลาดังกล่าว ขีด จำกัด ไม่สามารถมีโหมดใด ๆ และดังนั้นจึงเป็นค่าคงที่ซึ่งจะต้องเป็นศูนย์ ดังนั้นจึงถูกแสดงออกมา (อาจจะไม่ซ้ำกันเพราะลำดับที่เลือกโหมดจะมีความสำคัญ) เป็นส่วนผสมf

f(x)=ipifi(x)

ของการกระจาย unimodal, QED


7

ฉันคิดว่า OP ชัดแจ้งโดยชัดแจ้งว่ามีโหมดตกแต่งภายในเพียงโหมดเดียว (เช่นไม่รวมโซลูชันมุม) คำถามจึงถามจริง ๆ ...

why is it that brand name distributions do NOT have more than one interior mode?

นั่นเป็นเหตุผลว่าทำไมการกระจายชื่อแบรนด์ส่วนใหญ่จึงมีลักษณะดังนี้:

ป้อนคำอธิบายรูปภาพที่นี่

... บวกหรือลบความเบ้หรือความไม่ต่อเนื่องบ้างไหม? เมื่อคำถามถูกวางดังนั้นการกระจายเบต้าจะไม่เป็นตัวอย่างการนับที่ถูกต้อง

ดูเหมือนว่าการคาดคะเนของ OP มีความถูกต้อง: การแจกแจงชื่อแบรนด์ทั่วไปส่วนใหญ่ไม่อนุญาตให้ใช้โหมดตกแต่งภายในมากกว่าหนึ่งโหมด อาจมีเหตุผลทางทฤษฎีสำหรับสิ่งนี้ ตัวอย่างเช่นการแจกจ่ายใด ๆ ที่เป็นสมาชิกของครอบครัวเพียร์สัน (ซึ่งรวมถึงเบต้า) จะต้องเป็นแบบ unimodal (ภายใน) (ภายใน) ซึ่งเป็นผลมาจากความแตกต่างของผู้ปกครองที่กำหนดทั้งครอบครัว และตระกูลเพียร์สันนั้นเป็นที่รู้จักกันดีในชื่อแบรนด์ส่วนใหญ่

อย่างไรก็ตามนี่คือตัวอย่างตัวนับชื่อแบรนด์ ...

ตัวอย่างเคาน์เตอร์

ตัวอย่างเคาน์เตอร์แบรนด์หนึ่งคือการกระจายพร้อม pdf:Sinc2

f(x)=sin2(x)πx2

กำหนดไว้ในสายจริง นี่คือเนื้อเรื่องของ pdf:Sinc2

ป้อนคำอธิบายรูปภาพที่นี่

เราอาจเพิ่มตระกูลของ cardiod และดิสทริบิวชันที่เกี่ยวข้องกับคลาสนี้ ... ด้วยรูปแบบไฟล์ PDF เช่น:

ป้อนคำอธิบายรูปภาพที่นี่

ตระกูลของการแจกแจงชื่อแบรนด์ที่สะท้อนอาจจะเป็นชื่อแบรนด์ที่เป็นไปได้ (แม้ว่าสิ่งเหล่านี้อาจคิดว่าเป็น 'สูตรโกง' ... แต่พวกเขายังคงเป็นชื่อแบรนด์) เช่น Reflected Weibull แสดงไว้ที่นี่:

ป้อนคำอธิบายรูปภาพที่นี่


1
ของฉัน, พล็อตของแน่นอนว่ามันมีค่าลบ! (นั่นอาจเป็นสิ่งประดิษฐ์พล็อตหรือไม่) ... และการแจกแจงแบบคาร์ดิโอดดูเหมือนว่าพวกมันจะมีโหมดการตกแต่งภายในเพียงโหมดเดียวเท่านั้น Sinc2
whuber

1
สวัสดี @whuber ... ต้องยอมรับสิ่งประดิษฐ์ที่วางแผนใหม่ (ฉันจะใช้มันกับMathematica SE!) ครอบครัวที่มีหัวใจซ้ำ: ความคิดคือใคร ๆ ก็สามารถขยายขอบเขตของครอบครัวให้เป็นหนึ่งเดียวได้โปรดและเช่นเดียวกับคลื่นไซน์มันยังคงให้ :)
Wolfies

1
(+1) มันเป็นสิ่งประดิษฐ์แปลก ๆ : พล็อตสุดท้ายของคุณ (จากการแจกแจงแบบสะท้อน) ดูเหมือนจะไม่แสดง คุณอาจติดตามการสร้างพล็อตจุดในพล็อตเพื่อดูว่าพวกเขาอยู่ที่ไหน ฉันสงสัยว่าค่าลบเล็กน้อยอาจเป็นการปรับแก้เส้นโค้งจำนวนจุดเล็ก ๆ Sinc2
whuber

ฉันคิดว่ามันเป็นเพราะเส้นที่พล็อตหนากว่าเส้นแกนดังนั้นดูเหมือนว่า 'แหกคอก' แกนเมื่อใกล้ถึงศูนย์ หากเส้นถูกบางลงสิ่งประดิษฐ์จะหายไป
wolfies

แต่ไม่มีสิ่งประดิษฐ์ดังกล่าวในรูปด้านล่างของคุณซึ่งมีเส้นหนากว่าแกน
whuber

3

การที่คุณไม่คิดว่าสิ่งใดไม่ได้หมายความว่าจะไม่มีเลย

ฉันสามารถตั้งชื่อ "รู้จัก" การแจกแจงที่ไม่ใช่ unimodal

ยกตัวอย่างเช่นการกระจายเบต้ากับและทั้ง<1บีตา< 1αβ<1

http://en.wikipedia.org/wiki/Beta_distribution

ยังเห็น

http://en.wikipedia.org/wiki/U-quadratic_distribution

(นี่ไม่ใช่กรณีพิเศษของการเผยแพร่เบต้าแม้ว่าจะมีความคิดเห็นที่ระบุว่าเป็นอย่างไรก็ตามทั้งสองตระกูลมีการทับซ้อนกันบ้าง)

การกระจายตัวของส่วนผสมเป็นที่รู้จักกันอย่างแน่นอนและหลายคนเป็นหลายต่อเนื่อง


U-quadratic เป็นการแจกแจงแบบเบต้าที่ถูกปัดเศษ
becko

1

การแจกแจงแบบอัลฟ่าปกติ(Elal-Olivero 2010)มี PDF:

(1αxμσ)2+12+α2φ(xμσ),

โดยที่เป็น PDF ของ Gaussian มาตรฐานφ

สำหรับการแจกแจงนั้นคือ bimodal พล็อตตัวอย่างสำหรับ :|α|>1.34μ=1,σ=0.5,a=2

ป้อนคำอธิบายรูปภาพที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.