แกมมากับการแจกแจงล็อกปกติ


29

ฉันมีการแจกแจงที่สังเกตได้จากการทดลองซึ่งดูคล้ายกับการแจกแจงแกมม่าหรือ lognormal ฉันได้อ่านแล้วว่าการแจกแจงแบบล็อกนอเรนเป็นการแจกแจงความน่าจะเป็นเอนโทรปีสูงสุดสำหรับตัวแปรแบบสุ่มซึ่งค่าเฉลี่ยและความแปรปรวนของได้รับการแก้ไข การกระจายของแกมม่ามีคุณสมบัติคล้ายกันหรือไม่?Xln(X)


2
เหตุใดคุณสมบัติเช่นนี้จึงมีค่าในการตัดสินใจซึ่งจะเป็นรูปแบบที่เหมาะสม
Glen_b -Reinstate Monica

@Glen_b ฉันยังเป็นผู้เริ่มต้นเมื่อพูดถึงสถิติดังนั้นความรู้ของฉันจึงค่อนข้างพื้นฐาน เมื่อมองไปที่แปลงของแกมม่าและการแจกแจงล็อกนอร์ม, พวกมันดูคล้ายกันมาก ฉันกำลังมองหาความแตกต่างเชิงปริมาณระหว่างสอง ตัวอย่างเช่นบางตัวอย่างของแอปพลิเคชันทางกายภาพที่มีการแจกแจงแกมม่าหรือ lognormal เกิดขึ้นคืออะไร?
OSE

ในความเป็นจริงมีแนวโน้มที่ไม่เคยเกิดขึ้นจริง; มันเป็นแบบจำลองที่ธรรมดามากซึ่งบางครั้งก็มีประโยชน์ (ถ้าหยาบ) ประมาณความเป็นจริง ฉันจะโพสต์คำตอบที่กล่าวถึงความแตกต่างเชิงคุณภาพ
Glen_b -Reinstate Monica

1
@glen_b: เหตุผลคือถ้าคุณวัดเฉพาะสถิติเหล่านั้นแล้วการกระจายขั้นต่ำแบบสมมุติคือการแจกแจงแบบครอบครัวแทนด้วยสถิติที่เพียงพอเหล่านั้น ในขณะที่การแจกแจงใด ๆ อาจจะเป็นแบบจำลองของความเป็นจริงที่น่าสงสารหากไม่มีใครสามารถเลือกได้ว่าจะใช้การวัดแบบใดนี่เป็นวิธีที่ยอดเยี่ยมในการเลือกแบบจำลอง
Neil G

1
@Glen_b ฉันเดาว่าการกระจาย lognormal ควรปรากฏในบางสถานการณ์ทางกายภาพเพราะ CLT
Stéphane Laurent

คำตอบ:


27

สำหรับความแตกต่างเชิงคุณภาพนั้น lognormal และ gamma นั้นค่อนข้างจะคล้ายกัน

อันที่จริงแล้วในทางปฏิบัติพวกมันมักถูกใช้เพื่อจำลองปรากฏการณ์เดียวกัน (บางคนจะใช้แกมม่าที่คนอื่นใช้ lognormal) ยกตัวอย่างเช่นทั้งคู่แบบจำลองสัมประสิทธิ์คงที่ (CV สำหรับ lognormal คือสำหรับแกมม่าที่ )eσ211/α

[จะเป็นไปได้อย่างไรถ้ามันขึ้นอยู่กับพารามิเตอร์คุณถาม? มันใช้เมื่อคุณจำลองขนาด (สถานที่ตั้งสำหรับระดับบันทึก); สำหรับ lognormalทำหน้าที่เป็นพารามิเตอร์สเกลในขณะที่แกมม่าสเกลเป็นพารามิเตอร์ที่ไม่ใช่พารามิเตอร์รูปร่าง (หรือส่วนกลับหากคุณใช้การกำหนดพารามิเตอร์ของอัตรารูปร่าง) ฉันจะเรียกพารามิเตอร์ขนาดสำหรับการกระจายแกมมา\ Gamma GLMs เป็นค่าเฉลี่ย ( ) ในขณะที่คงค่า ; ในกรณีนั้นก็เป็นพารามิเตอร์ขนาด แบบจำลองที่มีและค่าคงที่หรือตามลำดับจะมีค่า CV คงที่]μβμ=αβαμμασ

คุณอาจพบว่าเป็นการแนะนำให้ดูความหนาแน่นของบันทึกซึ่งมักแสดงความแตกต่างที่ชัดเจนมาก

บันทึกของตัวแปรสุ่ม lognormal คือ ... ปกติ มันสมมาตร

บันทึกของตัวแปรสุ่มแกมม่านั้นเอียงซ้าย ขึ้นอยู่กับค่าของพารามิเตอร์รูปร่างอาจจะค่อนข้างเอียงหรือเกือบจะสมมาตร

นี่คือตัวอย่างที่มีทั้ง lognormal และ gamma ที่มีค่าเฉลี่ย 1 และผลต่าง 1/4 พล็อตด้านบนแสดงความหนาแน่น (แกมม่าในสีเขียว, lognormal เป็นสีน้ำเงิน) และที่ต่ำกว่าจะแสดงความหนาแน่นของบันทึก:

gamma และ lognormal, densitiy และความหนาแน่นของ log

(การพล็อตบันทึกของความหนาแน่นของบันทึกก็มีประโยชน์เช่นกันนั่นคือการบันทึกมาตราส่วนบนแกน y ด้านบน)

ความแตกต่างนี้บ่งบอกว่าแกมม่ามีหางทางด้านซ้ายมากขึ้นและมีหางที่อยู่ทางขวาน้อยกว่า หางขวาสุดของ lognormal หนักกว่าและหางซ้ายเบา และถ้าคุณดูความเบ้ของ lognormal และ gamma เพื่อหาค่าสัมประสิทธิ์การเปลี่ยนแปลง lognormal จะเอียงขวามากกว่า ( ) มากกว่า gamma ( )CV3+3CV2CV


+1 คุณรู้หรือไม่ว่ามีสูตรปิดสำหรับความเบ้ของบันทึกของแกมม่าหรือไม่? สำหรับ lognormal ความเบ้ของบันทึกนั้นเป็นศูนย์อย่างชัดเจนและฉันสงสัยว่ามีการแสดงออกของแกมม่าบ้างไหม Wikipedia ให้สูตรสำหรับค่าเฉลี่ยและความแปรปรวนของ log (gamma) แต่ไม่ใช่สำหรับความเบ้
อะมีบาพูดว่า Reinstate Monica

Gradshteyn & Ryzhik (ส่วน 4.358, 7 ed) รายการปิดแบบฟอร์มอย่างชัดเจนสำหรับสำหรับในขณะที่คดีเสร็จสิ้นใน 4.352 (สมมติว่าคุณถือว่านิพจน์ในและทำหน้าที่เป็นรูปแบบปิด) - ซึ่งแน่นอนว่าสามารถทำได้ถึง kurtosis; พวกมันให้อินทิกรัลสำหรับทั้งหมดในฐานะอนุพันธ์ของฟังก์ชันแกมม่าดังนั้นน่าจะเป็นไปได้ที่จะสูงขึ้น ดังนั้นความเบ้จึงเป็นไปได้ แต่ไม่แน่นอนโดยเฉพาะ "เรียบร้อย" หากคุณต้องการติดตามมันฉันสามารถมอบอินทิเกรตให้คุณ 0xν1eμx(lnx)pdxp=2,3,4p=1Γ,ψζp
Glen_b -Reinstate Monica

อย่างไรก็ตามเราไม่จำเป็นต้องประเมินความเบ้เพื่อให้มองเห็นสัญลักษณ์ การตรวจสอบบันทึกของความหนาแน่นของบันทึกควรเพียงพอที่จะสร้างสิ่งนั้นเพราะด้านหนึ่งครอบงำอีกด้านหนึ่งอย่างชัดเจน
Glen_b -Reinstate Monica

ขอบคุณเกลน ฉันตัดสินใจที่จะโพสต์เป็นคำถามใหม่: stats.stackexchange.com/questions/312803 ฉันใช้เวลาค้นหาคำตอบที่พร้อม แต่ไม่สามารถหาได้ดังนั้นมันอาจมีประโยชน์สำหรับอนาคตที่จะเขียนลงที่ไหนสักแห่งที่มันหาง่าย มันอาจจะเหมาะกับ Math.SE มากกว่า แต่ฉันอยากได้ที่นี่จริงๆ
อะมีบาพูดว่า Reinstate Monica

11

ใช่การแจกแจงแกมมาเป็นการกระจายเอนโทรปีสูงสุดซึ่งค่าเฉลี่ยและค่าเฉลี่ยล็อกได้รับการแก้ไข เช่นเดียวกับการแจกแจงแบบครอบครัวแบบเลขชี้กำลังทั้งหมดมันเป็นการแจกแจงแบบเอนโทรปีสูงสุดที่ไม่ซ้ำกันสำหรับสถิติที่เพียงพอที่คาดไว้E(X)E(logX)

ในการตอบคำถามของคุณเกี่ยวกับกระบวนการทางกายภาพที่สร้างการแจกแจงเหล่านี้: การแจกแจงแบบปกติจะเกิดขึ้นเมื่อลอการิทึมของ X กระจายตัวอย่างเช่นถ้า X เป็นผลผลิตของปัจจัยขนาดเล็กจำนวนมาก ถ้า X เป็นการกระจายแกมมามันเป็นผลรวมของความแปรปรวนแบบกระจายจำนวนมาก ตัวอย่างเช่นเวลารอคอยสำหรับเหตุการณ์หลายอย่างของกระบวนการปัวซง


5
ไม่จำเป็นต้องมีการแจกแจงเอ็กซ์โพเนนเชียล "หลาย" เป็นแกมม่า
Stéphane Laurent
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.