เหตุใดการผสมของตัวแปรที่แจกแจงสองแบบปกติเท่านั้น bimodal หากค่าเฉลี่ยของพวกเขาแตกต่างกันอย่างน้อยสองเท่าของค่าเบี่ยงเบนมาตรฐานทั่วไป?


28

ภายใต้การผสมผสานของการแจกแจงปกติสองรายการ:

https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions

"การผสมของการแจกแจงปกติสองแบบมีพารามิเตอร์ห้าตัวที่จะประมาณ: สองวิธี, ความแปรปรวนสองตัวและพารามิเตอร์การผสมการผสมของการแจกแจงสองแบบปกติที่มีค่าเบี่ยงเบนมาตรฐานเท่ากันนั้น bimodal เฉพาะในกรณีที่ค่าเฉลี่ยแตกต่างกันอย่างน้อยสองครั้ง ."

ฉันกำลังมองหาคำอธิบายที่ได้มาหรือคำอธิบายที่เข้าใจง่ายว่าทำไมสิ่งนี้ถึงเป็นจริง ฉันเชื่อว่ามันสามารถอธิบายได้ในรูปแบบของการทดสอบตัวอย่างสองตัวอย่าง:

μ1μ2σp

โดยที่คือค่าเบี่ยงเบนมาตรฐานที่รวมไว้σp


1
สัญชาตญาณคือถ้าหากค่าใกล้เกินไปจากนั้นจะมีการทับซ้อนกันมากในมวลของความหนาแน่น 2 ดังนั้นความแตกต่างในวิธีการจะไม่เห็นเพราะความแตกต่างจะได้รับการหุ้มด้วยมวลของทั้งสอง ความหนาแน่น หากทั้งสองวิธีนั้นแตกต่างกันเพียงพอมวลของความหนาแน่นทั้งสองจะไม่ทับซ้อนกันมากนักและความแตกต่างของค่าเฉลี่ยจะมองเห็นได้ แต่ฉันต้องการเห็นหลักฐานทางคณิตศาสตร์ของเรื่องนี้ มันเป็นคำสั่งที่น่าสนใจ ฉันไม่เคยเห็นมันมาก่อน
mlofton

2
สำหรับการผสม 50:50 ของการแจกแจงปกติสองแบบด้วย SDถ้าคุณเขียนความหนาแน่นในรูปแบบเต็มแสดงพารามิเตอร์คุณจะ เห็นว่าการเปลี่ยนแปลงของอนุพันธ์ที่สองลงชื่อที่จุดกึ่งกลางระหว่างสองหมายถึงเมื่อระยะห่างระหว่างหมายถึงเพิ่มขึ้นจากด้านล่างไปด้านบน f ( x ) = 0.5 g 1 ( x ) + 0.5 g 2 ( x ) 2 σσ,f(x)=0.5g1(x)+0.5g2(x)2σ
BruceET

1
ดูที่ "เกณฑ์ของ Rayleigh" en.wikipedia.org/wiki/Angular_resolution#Explanation
Carl Witthoft

คำตอบ:


53

รูปนี้จากบทความที่เชื่อมโยงในบทความวิกินั้นมีภาพประกอบที่ดี: ป้อนคำอธิบายรูปภาพที่นี่

หลักฐานที่พวกเขาให้นั้นขึ้นอยู่กับความจริงที่ว่าการแจกแจงแบบปกตินั้นเป็นเว้าภายใน SD หนึ่งหน่วยของค่าเฉลี่ย (SD นั้นเป็นจุดผันของไฟล์ pdf ปกติซึ่งจะไปจากเว้าถึงนูน) ดังนั้นหากคุณเพิ่มไฟล์ PDF ปกติสองไฟล์เข้าด้วยกัน (ในสัดส่วนที่เท่ากัน) ตราบใดที่ค่าเฉลี่ยของพวกเขาแตกต่างกันน้อยกว่า SDS สองตัว sum-pdf (เช่นส่วนผสม) จะถูกเว้าในพื้นที่ระหว่างสองช่องทางและดังนั้น ค่าสูงสุดทั่วโลกจะต้องอยู่ในจุดที่แน่นอนระหว่างค่าเฉลี่ยทั้งสอง

อ้างอิง: ชิลลิง, MF, Watkins, AE, และ Watkins, W. (2002) ความสูงของมนุษย์ Bimodal คืออะไร? นักสถิติชาวอเมริกัน 56 (3), 223–229 ดอย: 10.1198 / 00031300265


11
+1 นี่เป็นอาร์กิวเมนต์ที่ดีและน่าจดจำ
whuber

2
คำบรรยายใต้ภาพยังแสดงภาพประกอบที่ดีของการผูก 'ฟลอริด้า' ที่ถูกบิดเบือนใน 'inflection' :-P
nekomatic

2
@Axeman: ขอบคุณที่เพิ่มการอ้างอิง - เนื่องจากนี่มันระเบิดขึ้นเล็กน้อยฉันวางแผนที่จะเพิ่มมันด้วยตัวเองเพราะฉันแค่ทำซ้ำการโต้เถียงของพวกเขาและฉันไม่ต้องการเครดิตมากเกินไป
Ruben van Bergen

14

นี่เป็นกรณีที่รูปภาพสามารถหลอกลวงได้เนื่องจากผลลัพธ์นี้เป็นลักษณะพิเศษของสารผสมปกติ : อะนาล็อกไม่จำเป็นต้องมีไว้สำหรับสารผสมอื่น ๆ แม้ว่าจะเป็นส่วนประกอบที่มีการกระจายแบบสมมาตรแบบสมมาตร! ตัวอย่างเช่นการผสมที่เท่าเทียมกันของการแจกแจงของนักเรียนสองคนที่แยกกันโดยค่าเบี่ยงเบนมาตรฐานร่วมกันเล็กน้อยจะน้อยกว่าสองเท่าของพวกเขาจะเป็น bimodal สำหรับข้อมูลเชิงลึกที่แท้จริงเราต้องทำคณิตศาสตร์หรือดึงดูดคุณสมบัติพิเศษของการแจกแจงแบบปกติ


เลือกหน่วยของการวัด (โดย recentering และ rescaling ตามความจำเป็น) ที่จะวางวิธีการของการแจกแจงองค์ประกอบที่±μ, μ0,และเพื่อให้มีความเป็นเอกภาพความแปรปรวนของพวกเขาร่วมกัน Let p, 0<p<1,เป็นปริมาณขององค์ประกอบที่มีขนาดใหญ่เฉลี่ยในส่วนผสม สิ่งนี้ทำให้เราสามารถแสดงความหนาแน่นของการผสมในลักษณะทั่วไปอย่างเต็มที่

2πf(x;μ,p)=pexp((xμ)22)+(1p)exp((x+μ)22).

เพราะทั้งสองมีความหนาแน่นเพิ่มองค์ประกอบที่x<μและลดที่x>μ,เท่านั้นที่เป็นไปได้เกิดขึ้นที่โหมดμxμ. ค้นหาพวกมันโดยแยกความแตกต่างfเทียบกับxแล้วตั้งค่าเป็นศูนย์ การล้างค่าสัมประสิทธิ์เชิงบวกใด ๆ ที่เราได้รับ

0=e2xμp(xμ)+(1p)(x+μ).

การดำเนินการที่คล้ายกันกับอนุพันธ์อันดับสองของf และแทนที่e2xμโดยค่าที่กำหนดโดยสมการก่อนหน้านี้บอกเราว่าสัญลักษณ์ของอนุพันธ์อันดับสองที่จุดวิกฤติใด ๆ คือเครื่องหมายของ

f(x;μ,p)(1+x2μ2)xμ.

ตั้งแต่ตัวหารเป็นลบเมื่อμ<x<μ,สัญลักษณ์ของfเป็นที่ของ(1μ2+x2).เป็นที่ชัดเจนว่าเมื่อμ1,ป้ายจะต้องเป็นเชิงลบ อย่างไรก็ตามในการแจกแจงแบบมัลติโมดัล (เนื่องจากความหนาแน่นนั้นต่อเนื่อง) จะต้องมีแอนทายไดดรอระหว่างโหมดสองโหมดโดยที่เครื่องหมายนั้นไม่เป็นลบ ดังนั้นเมื่อμน้อยกว่า1 (SD) การกระจายจะต้องเป็นแบบ unimodal

เนื่องจากการแยกของค่าเฉลี่ยคือ2μ,ข้อสรุปของการวิเคราะห์นี้คือ

ส่วนผสมของการแจกแจงแบบปกติเป็นแบบ unimodal เมื่อใดก็ตามที่ค่าเฉลี่ยถูกคั่นด้วยค่าเบี่ยงเบนมาตรฐานทั่วไปไม่เกินสองเท่า

มันมีเหตุผลเทียบเท่ากับข้อความในคำถาม


12

ความคิดเห็นจากด้านบนวางที่นี่เพื่อความต่อเนื่อง:

f(x)=0.5g1(x)+0.5g2(x)

ความคิดเห็นต่อ:

σ=1.3σ,2σ,σ,

enter image description here

รหัส R สำหรับรูป:

par(mfrow=c(1,3))
  curve(dnorm(x, 0, 1)+dnorm(x,3,1), -3, 7, col="green3", 
    lwd=2,n=1001, ylab="PDF", main="3 SD: Dip")
  curve(dnorm(x, .5, 1)+dnorm(x,2.5,1), -4, 7, col="orange", 
    lwd=2, n=1001,ylab="PDF", main="2 SD: Flat")
  curve(dnorm(x, 1, 1)+dnorm(x,2,1), -4, 7, col="violet", 
    lwd=2, n=1001, ylab="PDF", main="1 SD: Peak")
par(mfrow=c(1,3))

1
คำตอบทั้งหมดนั้นยอดเยี่ยม ขอบคุณ
mlofton

3
2/30.001.

1
0.1% fx0)
f(x0)f(x)0.001f(x0)  |xx0|0.333433,
0.0010.95832
f(x0)f(x)0.001  |xx0|0.47916.

จุดที่ดี จริงๆแล้วสิ่งที่ฉันหมายถึงโดยย่อภาษา 'แบน' เป็นศูนย์ 2 อนุพันธ์ที่ตรงกลาง
BruceET
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.