ผลรวมของตัวแปรสุ่ม lognormal อิสระปรากฏขึ้น lognormal?

11

ฉันพยายามที่จะเข้าใจว่าทำไมผลรวมของตัวแปรสุ่มสองตัว (หรือมากกว่า) เข้าสู่การแจกแจงแบบปกติขณะที่คุณเพิ่มจำนวนการสังเกต ฉันดูออนไลน์และไม่พบผลลัพธ์ใด ๆ ที่เกี่ยวข้องกับสิ่งนี้

เห็นได้ชัดว่าถ้าและเป็นตัวแปร lognormal ที่เป็นอิสระจากนั้นด้วยคุณสมบัติของ exponents และตัวแปรสุ่ม gaussianก็เป็น lognormal เช่นกัน อย่างไรก็ตามไม่มีเหตุผลที่จะแนะนำว่าเป็น lognormal เช่นกัน $X$ $Y$ $X \times Y$ $X+Y$

อย่างไรก็ตาม

หากคุณสร้างตัวแปรสุ่มสุ่มอิสระ lognormalและและปล่อยให้และทำซ้ำขั้นตอนนี้หลายครั้งการกระจายของจะปรากฏขึ้น lognormal ดูเหมือนว่ามันจะเข้าใกล้การแจกแจงแบบปกติมากขึ้นเมื่อคุณเพิ่มจำนวนการสังเกต $X$ $Y$ $Z=X+Y$ $Z$

ตัวอย่างเช่น: หลังจากสร้าง 1 ล้านคู่การแจกแจงบันทึกธรรมชาติของ Zจะได้รับในฮิสโตแกรมด้านล่าง สิ่งนี้มีความคล้ายคลึงกับการแจกแจงแบบปกติมากโดยชัดแจ้งว่าเป็น lognormal แน่นอน $Z$

ใครบ้างมีความเข้าใจหรือการอ้างอิงถึงข้อความที่อาจใช้ในการทำความเข้าใจนี้

— ขนมพาย
แหล่งที่มา

คุณสมมติว่าผลต่างเท่ากันสำหรับและหรือไม่ หากคุณจำลองแล้วผลรวมของบันทึกจะดูไม่ปกติอีกต่อไป

X

$X$

Y

$Y$ xx <- rlnorm(1e6,0,3); yy <- rlnorm(1e6,0,1)

— Stephan Kolassa

ฉันถือว่าความแปรปรวนเท่ากัน - ฉันจะลองอีกครั้งกับความแปรปรวนที่ไม่เท่ากันและดูสิ่งที่ฉันท้ายด้วย

— Patty

ด้วยความแปรปรวนของ 2 และ 3 ฉันได้บางสิ่งบางอย่างที่ยังคงดูปกติเล็กน้อย albiet กับสิ่งที่ดูเหมือนว่าเล็ก ๆ น้อย ๆ เอียง

— Patty

1

การดูคำถามก่อนหน้าอาจเป็นประโยชน์ ที่นี่และที่นี่เป็นเอกสารที่มีประโยชน์ ดูดี!

— Stephan Kolassa

20

lognormality โดยประมาณนี้ของผลรวมของ lognormals เป็นกฎของหัวแม่มือที่รู้จักกันดี มันถูกกล่าวถึงในเอกสารจำนวนมาก - และในโพสต์บนเว็บไซต์จำนวนมาก

การประมาณ lognormal สำหรับผลรวมของ lognormals โดยการจับคู่สองช่วงเวลาแรกบางครั้งเรียกว่าการประมาณ Fenton-Wilkinson

คุณอาจพบว่าเอกสารนี้โดย Dufresne มีประโยชน์ (มีให้ที่นี่หรือที่นี่ )

บางครั้งฉันก็เคยชี้นำคนไปที่กระดาษของมิตเชลล์

Mitchell, RL (1968),
"ความคงทนของการแจกแจงแบบบันทึกปกติ" สังคมออปติคอลเจของอเมริกา
58: 1267-1272

แต่ตอนนี้ครอบคลุมการอ้างอิงของ Dufresne แล้ว

แต่ในขณะที่มันบรรจุอยู่ในชุดที่ค่อนข้างกว้างของกรณีที่ไม่เอียงเกินไปก็ไม่ได้ถือโดยทั่วไปแม้กระทั่งสำหรับ iid lognormals ไม่ได้เป็นก็ค่อนข้างใหญ่ $n$

นี่คือฮิสโตแกรมของค่า 1,000 จำลองแต่ละล็อกของผลรวมของlognormals ห้าหมื่นไอดี :

ตามที่คุณเห็น ... บันทึกค่อนข้างเบาบางดังนั้นผลรวมจึงไม่ใกล้เคียงกับบันทึกปกติ

อันที่จริงตัวอย่างนี้จะนับเป็นตัวอย่างที่มีประโยชน์สำหรับคนที่คิด (เพราะทฤษฎีบทขีด จำกัด กลาง) ที่ในจำนวนหลายร้อยหรือหลายพันจะให้ค่าเฉลี่ยใกล้เคียงปกติมาก อันนี้เอียงมากจนท่อนซุงนั้นเอียงไปทางขวา แต่ทฤษฎีบทขีด จำกัด กลางยังคงใช้ที่นี่ จะต้องมีจำนวนล้านเป็นล้าน * ก่อนที่มันจะเริ่มมองไปที่ใดก็ได้ที่อยู่ใกล้กับสมมาตร $n$ $n$

* ฉันไม่ได้พยายามคิดออกว่ามีกี่คน แต่เนื่องจากวิธีการที่ความเบ้ของจำนวนเงิน (เท่ากันโดยเฉลี่ย) มีพฤติกรรมบางล้านคนจะไม่เพียงพออย่างชัดเจน

เนื่องจากมีการร้องขอรายละเอียดเพิ่มเติมในความคิดเห็นคุณสามารถรับผลลัพธ์ที่คล้ายกันกับตัวอย่างด้วยรหัสต่อไปนี้ซึ่งสร้าง 1,000 ซ้ำของผลรวมของ 50,000 ตัวแปรสุ่ม lognormal ด้วยพารามิเตอร์ scaleและพารามิเตอร์รูปร่าง : $\mu=0$ $\sigma=4$

res <- replicate(1000,sum(rlnorm(50000,0,4)))
hist(log(res),n=100)

(ตั้งแต่ฉันได้ลองไฟล์บันทึกของมันยังเอียงไม่ถูก) $n=10^6$

— Glen_b -Reinstate Monica
แหล่งที่มา

คุณช่วยเพิ่มพารามิเตอร์ (หรือโค้ดขนาดเล็ก) เพื่อสร้างฮิสโตแกรมในรูปได้หรือไม่

— altroware

1

นั่นเป็นสองปีที่แล้วฉันจำไม่ได้ว่าพารามิเตอร์ lognormal คืออะไร แต่ให้เราใช้ตรรกะง่ายๆ คุณไม่จำเป็นต้องกังวลเกี่ยวกับพารามิเตอร์เนื่องจากจะมีผลกับค่าในระดับแกน x เท่านั้นไม่ใช่รูปร่าง (สิ่งที่สะดวกเช่นจะถูกใช้) ดังนั้นนั่นทำให้พารามิเตอร์เป็นเพียงหนึ่งเดียวที่มีผลกระทบต่อรูปร่าง สมมติว่าและกลับมาทำงานอย่างคร่าวๆจากสเกลในฮิสโตแกรมด้านบนเราจะได้รับจะต้องอยู่ในสนามเบสบอลหรือมากกว่านั้น (ระวังให้ดีว่านี่คืออะไร) และเพียงแค่ลองให้รูปลักษณ์ที่คล้ายกันกับด้านบน

μ

$\mu$

μ = 0

$\mu=0$

σ

$\sigma$

μ = 0

$\mu=0$

σ

$\sigma$

4

$4$

4

$4$

— Glen_b

1

res <- replicate(1000,sum(rlnorm(50000,0,4))); hist(log(res),n=100)

26.5

$26.5$

2

ต้องการปรับปรุงโพสต์นี้หรือไม่? ให้คำตอบโดยละเอียดสำหรับคำถามนี้รวมถึงการอ้างอิงและคำอธิบายว่าทำไมคำตอบของคุณถึงถูกต้อง คำตอบที่ไม่มีรายละเอียดเพียงพออาจแก้ไขหรือลบออกได้

มันอาจจะสายเกินไป แต่ฉันได้พบบทความต่อไปนี้เกี่ยวกับผลรวมของการแจกแจงแบบปกติซึ่งครอบคลุมหัวข้อ มันไม่ใช่ lognormal แต่มีบางอย่างที่แตกต่างและทำงานได้ยาก

— Ivan Svetunkov
แหล่งที่มา

1

กระดาษแนะนำจาก Dufresne ของ 2009 และหนึ่งนี้จาก 2004 พร้อมกับกระดาษที่มีประโยชน์นี้ ครอบคลุมประวัติในการประมาณผลรวมของการแจกแจงล็อกปกติและให้ผลทางคณิตศาสตร์ผลรวม.

$\mu$ $\sigma$

บางที [กระดาษนี้] ( http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6029348 ) ให้คุณในบางกรณีทฤษฎีบทขีด จำกัด กลางสำหรับผลรวมของ log-normals แต่ยังมี ขาดทั่วไป อย่างไรก็ตามตัวอย่างที่ได้รับจาก Glen_b นั้นไม่เหมาะสมจริง ๆ เพราะเป็นกรณีที่คุณสามารถใช้ทฤษฎีขีด จำกัด กลางแบบคลาสสิกได้อย่างง่ายดายและแน่นอนในกรณีนั้นผลรวมของบันทึกปกติคือเกาส์เซียน

$n\to \infty$

— Mimì
แหล่งที่มา

1

คุณพูดว่าในตัวอย่างของฉัน "คุณสามารถใช้ทฤษฎีบทขีด จำกัด กลางแบบคลาสสิกได้อย่างง่ายดาย" แต่ถ้าคุณเข้าใจว่าฮิสโตแกรมแสดงให้เห็นอย่างชัดเจนคุณไม่สามารถใช้ CLT เพื่อยืนยันว่าการประมาณปกติใช้กับ n = 50,000 ผลรวมนั้นเบ้ที่ถูกต้องจนล็อกมันยังเอียงขวาอย่างหนัก ประเด็นของตัวอย่างก็คือมันเอียงเกินกว่าที่จะประมาณโดย lognormal (หรือฮิสโตแกรมนั้นจะดูใกล้เคียงกับสมมาตร) การประมาณความเบ้น้อยลง (เช่นปกติ) จะ * แย่ลง * /

— Glen_b

ฉันเห็นด้วย แต่ในตัวอย่างคุณอาจจะไม่ถึงการรวมกันของตัวเลข (1,000 การทดลองน้อยเกินไป) หรือการบรรจบกันทางสถิติไม่ถึง (50,000 การผนวกน้อยเกินไป) แต่สำหรับการกระจายแบบไม่ จำกัด เป็นเกาส์เนื่องจากเราอยู่ในเงื่อนไข CLT ใช่ไหม

— Mimì

ตัวอย่าง 1,000 ตัวอย่างนั้นเพียงพอที่จะมองเห็นรูปร่างของการกระจายตัวของผลรวม - จำนวนตัวอย่างที่เราถ่ายไม่เปลี่ยนรูปร่างเพียงแค่เราเห็น "ชัดเจน" ความเบ้ที่ชัดเจนนั้นจะไม่หายไปหากเราใช้ตัวอย่างที่มีขนาดใหญ่ขึ้นมันจะดูราบรื่นขึ้น ใช่ 50,000 น้อยเกินไปสำหรับผลรวมที่จะดูเป็นปกติ - มันถูกต้องมากจนบันทึกยังคงดูเบ้มาก มันอาจต้องใช้หลายล้านก่อนที่จะดูปกติพอสมควร ใช่ CLT มีผลบังคับใช้อย่างแน่นอน มันเป็น iid และความแปรปรวนมีขอบเขตดังนั้นวิธีการมาตรฐานจึงต้องเข้าสู่ภาวะปกติ

— Glen_b -Reinstate Monica

1

กฎหมาย Lognormal มีอยู่อย่างกว้างขวางในปรากฏการณ์ทางกายภาพผลรวมของการแจกแจงตัวแปรชนิดนี้มีความจำเป็นเช่นเพื่อศึกษาพฤติกรรมการปรับขนาดของระบบ ฉันรู้ว่าบทความนี้ (ยาวมากและแข็งแกร่งมากจุดเริ่มต้นสามารถทำได้ถ้าคุณไม่ได้ specilist!), "ผลการกระจายทั่วไปในผลรวมของตัวแปรสุ่ม lognormal" ตีพิมพ์ในปี 2003 (วารสารกายภาพยุโรป B-Condensed Matter และ Complex ระบบ 32, 513) และสามารถใช้ได้https://arxiv.org/pdf/physics/0211065.pdf

— ผู้มีชัย
แหล่งที่มา