ผลรวมของตัวแปรสุ่ม lognormal อิสระปรากฏขึ้น lognormal?


11

ฉันพยายามที่จะเข้าใจว่าทำไมผลรวมของตัวแปรสุ่มสองตัว (หรือมากกว่า) เข้าสู่การแจกแจงแบบปกติขณะที่คุณเพิ่มจำนวนการสังเกต ฉันดูออนไลน์และไม่พบผลลัพธ์ใด ๆ ที่เกี่ยวข้องกับสิ่งนี้

เห็นได้ชัดว่าถ้าและเป็นตัวแปร lognormal ที่เป็นอิสระจากนั้นด้วยคุณสมบัติของ exponents และตัวแปรสุ่ม gaussianก็เป็น lognormal เช่นกัน อย่างไรก็ตามไม่มีเหตุผลที่จะแนะนำว่าเป็น lognormal เช่นกันY X × Y X + YXYX×YX+Y

อย่างไรก็ตาม

หากคุณสร้างตัวแปรสุ่มสุ่มอิสระ lognormalและและปล่อยให้และทำซ้ำขั้นตอนนี้หลายครั้งการกระจายของจะปรากฏขึ้น lognormal ดูเหมือนว่ามันจะเข้าใกล้การแจกแจงแบบปกติมากขึ้นเมื่อคุณเพิ่มจำนวนการสังเกตY Z = X + Y ZXYZ=X+YZ

ตัวอย่างเช่น: หลังจากสร้าง 1 ล้านคู่การแจกแจงบันทึกธรรมชาติของ Zจะได้รับในฮิสโตแกรมด้านล่าง สิ่งนี้มีความคล้ายคลึงกับการแจกแจงแบบปกติมากโดยชัดแจ้งว่าเป็น lognormal แน่นอนZ

ป้อนคำอธิบายรูปภาพที่นี่

ใครบ้างมีความเข้าใจหรือการอ้างอิงถึงข้อความที่อาจใช้ในการทำความเข้าใจนี้


คุณสมมติว่าผลต่างเท่ากันสำหรับและหรือไม่ หากคุณจำลองแล้วผลรวมของบันทึกจะดูไม่ปกติอีกต่อไป YXYxx <- rlnorm(1e6,0,3); yy <- rlnorm(1e6,0,1)
Stephan Kolassa

ฉันถือว่าความแปรปรวนเท่ากัน - ฉันจะลองอีกครั้งกับความแปรปรวนที่ไม่เท่ากันและดูสิ่งที่ฉันท้ายด้วย
Patty

ด้วยความแปรปรวนของ 2 และ 3 ฉันได้บางสิ่งบางอย่างที่ยังคงดูปกติเล็กน้อย albiet กับสิ่งที่ดูเหมือนว่าเล็ก ๆ น้อย ๆ เอียง
Patty

1
การดูคำถามก่อนหน้าอาจเป็นประโยชน์ ที่นี่และที่นี่เป็นเอกสารที่มีประโยชน์ ดูดี!
Stephan Kolassa

คำตอบ:


20

lognormality โดยประมาณนี้ของผลรวมของ lognormals เป็นกฎของหัวแม่มือที่รู้จักกันดี มันถูกกล่าวถึงในเอกสารจำนวนมาก - และในโพสต์บนเว็บไซต์จำนวนมาก

การประมาณ lognormal สำหรับผลรวมของ lognormals โดยการจับคู่สองช่วงเวลาแรกบางครั้งเรียกว่าการประมาณ Fenton-Wilkinson

คุณอาจพบว่าเอกสารนี้โดย Dufresne มีประโยชน์ (มีให้ที่นี่หรือที่นี่ )

บางครั้งฉันก็เคยชี้นำคนไปที่กระดาษของมิตเชลล์

Mitchell, RL (1968),
"ความคงทนของการแจกแจงแบบบันทึกปกติ" สังคมออปติคอลเจของอเมริกา
58: 1267-1272

แต่ตอนนี้ครอบคลุมการอ้างอิงของ Dufresne แล้ว

แต่ในขณะที่มันบรรจุอยู่ในชุดที่ค่อนข้างกว้างของกรณีที่ไม่เอียงเกินไปก็ไม่ได้ถือโดยทั่วไปแม้กระทั่งสำหรับ iid lognormals ไม่ได้เป็นก็ค่อนข้างใหญ่n

นี่คือฮิสโตแกรมของค่า 1,000 จำลองแต่ละล็อกของผลรวมของlognormals ห้าหมื่นไอดี :

ฮิสโตแกรมของผลรวมของห้าหมื่น lognormals

ตามที่คุณเห็น ... บันทึกค่อนข้างเบาบางดังนั้นผลรวมจึงไม่ใกล้เคียงกับบันทึกปกติ

อันที่จริงตัวอย่างนี้จะนับเป็นตัวอย่างที่มีประโยชน์สำหรับคนที่คิด (เพราะทฤษฎีบทขีด จำกัด กลาง) ที่ในจำนวนหลายร้อยหรือหลายพันจะให้ค่าเฉลี่ยใกล้เคียงปกติมาก อันนี้เอียงมากจนท่อนซุงนั้นเอียงไปทางขวา แต่ทฤษฎีบทขีด จำกัด กลางยังคงใช้ที่นี่ จะต้องมีจำนวนล้านเป็นล้าน * ก่อนที่มันจะเริ่มมองไปที่ใดก็ได้ที่อยู่ใกล้กับสมมาตรnnn

* ฉันไม่ได้พยายามคิดออกว่ามีกี่คน แต่เนื่องจากวิธีการที่ความเบ้ของจำนวนเงิน (เท่ากันโดยเฉลี่ย) มีพฤติกรรมบางล้านคนจะไม่เพียงพออย่างชัดเจน


เนื่องจากมีการร้องขอรายละเอียดเพิ่มเติมในความคิดเห็นคุณสามารถรับผลลัพธ์ที่คล้ายกันกับตัวอย่างด้วยรหัสต่อไปนี้ซึ่งสร้าง 1,000 ซ้ำของผลรวมของ 50,000 ตัวแปรสุ่ม lognormal ด้วยพารามิเตอร์ scaleและพารามิเตอร์รูปร่าง :μ=0σ=4

res <- replicate(1000,sum(rlnorm(50000,0,4)))
hist(log(res),n=100)

(ตั้งแต่ฉันได้ลองไฟล์บันทึกของมันยังเอียงไม่ถูก)n=106


คุณช่วยเพิ่มพารามิเตอร์ (หรือโค้ดขนาดเล็ก) เพื่อสร้างฮิสโตแกรมในรูปได้หรือไม่
altroware

1
นั่นเป็นสองปีที่แล้วฉันจำไม่ได้ว่าพารามิเตอร์ lognormal คืออะไร แต่ให้เราใช้ตรรกะง่ายๆ คุณไม่จำเป็นต้องกังวลเกี่ยวกับพารามิเตอร์เนื่องจากจะมีผลกับค่าในระดับแกน x เท่านั้นไม่ใช่รูปร่าง (สิ่งที่สะดวกเช่นจะถูกใช้) ดังนั้นนั่นทำให้พารามิเตอร์เป็นเพียงหนึ่งเดียวที่มีผลกระทบต่อรูปร่าง สมมติว่าและกลับมาทำงานอย่างคร่าวๆจากสเกลในฮิสโตแกรมด้านบนเราจะได้รับจะต้องอยู่ในสนามเบสบอลหรือมากกว่านั้น (ระวังให้ดีว่านี่คืออะไร) และเพียงแค่ลองให้รูปลักษณ์ที่คล้ายกันกับด้านบน μ = 0 σ μ = 0 σ 4 4μμ=0σμ=0σ44
Glen_b

1
res <- replicate(1000,sum(rlnorm(50000,0,4))); hist(log(res),n=100)26.5

2

มันอาจจะสายเกินไป แต่ฉันได้พบบทความต่อไปนี้เกี่ยวกับผลรวมของการแจกแจงแบบปกติซึ่งครอบคลุมหัวข้อ มันไม่ใช่ lognormal แต่มีบางอย่างที่แตกต่างและทำงานได้ยาก


1

กระดาษแนะนำจาก Dufresne ของ 2009 และหนึ่งนี้จาก 2004 พร้อมกับกระดาษที่มีประโยชน์นี้ ครอบคลุมประวัติในการประมาณผลรวมของการแจกแจงล็อกปกติและให้ผลทางคณิตศาสตร์ผลรวม.

μσ

บางที [กระดาษนี้] ( http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6029348 ) ให้คุณในบางกรณีทฤษฎีบทขีด จำกัด กลางสำหรับผลรวมของ log-normals แต่ยังมี ขาดทั่วไป อย่างไรก็ตามตัวอย่างที่ได้รับจาก Glen_b นั้นไม่เหมาะสมจริง ๆ เพราะเป็นกรณีที่คุณสามารถใช้ทฤษฎีขีด จำกัด กลางแบบคลาสสิกได้อย่างง่ายดายและแน่นอนในกรณีนั้นผลรวมของบันทึกปกติคือเกาส์เซียน

n


1
คุณพูดว่าในตัวอย่างของฉัน "คุณสามารถใช้ทฤษฎีบทขีด จำกัด กลางแบบคลาสสิกได้อย่างง่ายดาย" แต่ถ้าคุณเข้าใจว่าฮิสโตแกรมแสดงให้เห็นอย่างชัดเจนคุณไม่สามารถใช้ CLT เพื่อยืนยันว่าการประมาณปกติใช้กับ n = 50,000 ผลรวมนั้นเบ้ที่ถูกต้องจนล็อกมันยังเอียงขวาอย่างหนัก ประเด็นของตัวอย่างก็คือมันเอียงเกินกว่าที่จะประมาณโดย lognormal (หรือฮิสโตแกรมนั้นจะดูใกล้เคียงกับสมมาตร) การประมาณความเบ้น้อยลง (เช่นปกติ) จะ * แย่ลง * /
Glen_b

ฉันเห็นด้วย แต่ในตัวอย่างคุณอาจจะไม่ถึงการรวมกันของตัวเลข (1,000 การทดลองน้อยเกินไป) หรือการบรรจบกันทางสถิติไม่ถึง (50,000 การผนวกน้อยเกินไป) แต่สำหรับการกระจายแบบไม่ จำกัด เป็นเกาส์เนื่องจากเราอยู่ในเงื่อนไข CLT ใช่ไหม
Mimì

ตัวอย่าง 1,000 ตัวอย่างนั้นเพียงพอที่จะมองเห็นรูปร่างของการกระจายตัวของผลรวม - จำนวนตัวอย่างที่เราถ่ายไม่เปลี่ยนรูปร่างเพียงแค่เราเห็น "ชัดเจน" ความเบ้ที่ชัดเจนนั้นจะไม่หายไปหากเราใช้ตัวอย่างที่มีขนาดใหญ่ขึ้นมันจะดูราบรื่นขึ้น ใช่ 50,000 น้อยเกินไปสำหรับผลรวมที่จะดูเป็นปกติ - มันถูกต้องมากจนบันทึกยังคงดูเบ้มาก มันอาจต้องใช้หลายล้านก่อนที่จะดูปกติพอสมควร ใช่ CLT มีผลบังคับใช้อย่างแน่นอน มันเป็น iid และความแปรปรวนมีขอบเขตดังนั้นวิธีการมาตรฐานจึงต้องเข้าสู่ภาวะปกติ
Glen_b -Reinstate Monica

1

กฎหมาย Lognormal มีอยู่อย่างกว้างขวางในปรากฏการณ์ทางกายภาพผลรวมของการแจกแจงตัวแปรชนิดนี้มีความจำเป็นเช่นเพื่อศึกษาพฤติกรรมการปรับขนาดของระบบ ฉันรู้ว่าบทความนี้ (ยาวมากและแข็งแกร่งมากจุดเริ่มต้นสามารถทำได้ถ้าคุณไม่ได้ specilist!), "ผลการกระจายทั่วไปในผลรวมของตัวแปรสุ่ม lognormal" ตีพิมพ์ในปี 2003 (วารสารกายภาพยุโรป B-Condensed Matter และ Complex ระบบ 32, 513) และสามารถใช้ได้https://arxiv.org/pdf/physics/0211065.pdf

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.