สามช่วงเวลาไม่ได้กำหนดรูปแบบการกระจาย หากคุณเลือกการแจกจ่ายแบบแฟมิลี่ด้วยพารามิเตอร์สามตัวที่เกี่ยวข้องกับช่วงเวลาสามช่วงประชากรแรกคุณสามารถทำการจับคู่ช่วงเวลา ("เมธอดของช่วงเวลา") เพื่อประมาณค่าพารามิเตอร์ทั้งสามแล้วสร้างค่าจากการแจกแจงแบบนั้น มีการแจกแจงดังกล่าวมากมาย
บางครั้งการมีช่วงเวลาทั้งหมดไม่เพียงพอในการพิจารณาการกระจาย หากฟังก์ชันการสร้างโมเมนต์มีอยู่ (ในละแวกใกล้เคียง 0) มันจะระบุการแจกแจงแบบไม่ซ้ำกัน (โดยหลักการแล้วคุณสามารถทำการแปลงลาปลาสแบบผกผันเพื่อรับได้)
[หากบางช่วงเวลาไม่ จำกัด นี่อาจหมายถึง mgf ไม่มีอยู่จริง แต่ก็มีบางกรณีที่ทุกช่วงเวลามี จำกัด แต่ mgf ยังคงไม่มีอยู่ในละแวกที่ 0]
เนื่องจากมีตัวเลือกการแจกแจงเราอาจถูกล่อลวงให้พิจารณาวิธีการแก้ปัญหาเอนโทรปีสูงสุดด้วยข้อ จำกัด ในช่วงเวลาสามช่วงแรก แต่ไม่มีการแจกแจงในบรรทัดจริงที่บรรลุนั้น
กระบวนการจะทำงานอย่างไรสำหรับตัวเลือกการกระจายเฉพาะ
เราสามารถลดความซับซ้อนของกระบวนการของการได้รับการจับคู่การกระจายสามช่วงเวลาโดยไม่สนใจค่าเฉลี่ยและความแปรปรวนและการทำงานกับช่วงเวลาที่สามปรับขนาด - ช่วงเวลาที่-เบ้ ( γ1= μ3/ μ3 / 22 )
เราสามารถทำได้เพราะเลือกการกระจายที่มีความเบ้ที่เกี่ยวข้องเราสามารถถอยกลับค่าเฉลี่ยและความแปรปรวนที่ต้องการโดยการปรับขนาดและการเลื่อน
ลองพิจารณาตัวอย่าง เมื่อวานนี้ฉันสร้างชุดข้อมูลขนาดใหญ่ (ซึ่งยังคงเกิดขึ้นในเซสชัน R ของฉัน) ซึ่งการแจกจ่ายฉันไม่ได้พยายามคำนวณรูปแบบการทำงานของ (เป็นชุดของค่าขนาดใหญ่ของบันทึกของความแปรปรวนตัวอย่างของ Cauchy ที่ n = 10) เรามีช่วงเวลาดิบสามช่วงแรกเป็น 1.519, 3.597 และ 11.479 ตามลำดับหรือมีค่าเฉลี่ย 1.518 ค่าเบี่ยงเบนมาตรฐาน * เท่ากับ 1.136 และความเบ้ 1.429 (ดังนั้นนี่คือค่าตัวอย่างจากตัวอย่างขนาดใหญ่)
อย่างเป็นทางการวิธีการของช่วงเวลาจะพยายามจับคู่ช่วงเวลาดิบ แต่การคำนวณนั้นง่ายกว่าถ้าเราเริ่มต้นด้วยความเบ้ (เปลี่ยนการแก้สมการสามในสามสิ่งที่ไม่รู้จักในการแก้สำหรับพารามิเตอร์หนึ่งครั้งงานที่ง่ายกว่า)
* ฉันจะแจกแจงความแตกต่างระหว่างการใช้ n- ส่วนบนความแปรปรวน - ตามที่จะสอดคล้องกับวิธีการช่วงเวลาที่เป็นทางการ - และตัวหาร n-1 และใช้การคำนวณตัวอย่าง
ความเบ้นี้ (~ 1.43) บ่งบอกว่าเราแสวงหาการกระจายที่เอียงขวา ฉันสามารถเลือกยกตัวอย่างเช่นการกระจาย lognormal แบบเลื่อน (สามพารามิเตอร์ lognormal, รูปร่างσ , scale μและ location-shift γ ) ในเวลาเดียวกัน เรามาเริ่มต้นด้วยการจับคู่ความเบ้ ความเบ้ของประชากรของ lognormal ของพารามิเตอร์สองตัวคือ:
γ1= ( eσ2+ 2 ) eσ2- 1-----√
σ2σ~2
γ21( τ+ 2 )2( τ- 1 )τ= eσ2τ3+ 3 τ2- 4 = γ21τ~≈ 1.1995σ~2≈ 0.1819γ1
μ
แต่เราสามารถเลือก gamma หรือ shifted-Weibull ได้อย่างง่ายดาย (หรือ shifted-F หรือตัวเลือกอื่น ๆ จำนวนมาก) และดำเนินการผ่านกระบวนการเดียวกัน แต่ละคนจะแตกต่างกัน
[สำหรับตัวอย่างที่ฉันติดต่อด้วยรังสีแกมม่าที่ถูกเลื่อนอาจจะเป็นทางเลือกที่ดีกว่า lognormal ที่ถูกเลื่อนเนื่องจากการกระจายของบันทึกของค่านั้นเอียงไปทางซ้ายและการกระจายของรากลูกบาศก์ของพวกเขาอยู่ใกล้กับสมมาตรมาก สิ่งเหล่านี้สอดคล้องกับสิ่งที่คุณจะเห็นด้วยความหนาแน่นแกมม่า (ไม่ จำกัด ) แต่ความหนาแน่นของบันทึกที่เบ้ซ้ายไม่สามารถทำได้เมื่อบันทึกการเปลี่ยนแปลงใด ๆ ]
เราสามารถใช้แผนภาพความเบ้ (skewness-kurtosis) ในเพียร์สันพล็อตและวาดเส้นที่ความเบ้ที่ต้องการและได้การแจกแจงแบบสองจุด, ลำดับของการแจกแจงแบบเบตา, การแจกแจงแกมม่า, การแจกแจงแกมมาและการแจกแจงเพียร์สันประเภท IV ทั้งหมดที่มีความเบ้เหมือนกัน
β1= γ21β2
γ21= 2.042σ
ช่วงเวลาเพิ่มเติม
ช่วงเวลาที่ไม่กระจายการแจกแจงที่ดีมากดังนั้นแม้ว่าคุณจะระบุหลายช่วงเวลา แต่ก็ยังมีการแจกแจงที่แตกต่างกันมากมาย (โดยเฉพาะอย่างยิ่งที่เกี่ยวข้องกับพฤติกรรมสุดโต่งของพวกเขา) ที่จะจับคู่พวกเขา
แน่นอนคุณสามารถเลือกตระกูลการกระจายที่มีพารามิเตอร์อย่างน้อยสี่ตัวและพยายามจับคู่มากกว่าสามช่วงเวลา ตัวอย่างการกระจายของเพียร์สันด้านบนทำให้เราสามารถจับคู่ช่วงเวลาสี่ช่วงแรกและมีตัวเลือกการกระจายอื่น ๆ ที่จะช่วยให้มีความยืดหยุ่นในระดับใกล้เคียงกัน
หนึ่งสามารถใช้กลยุทธ์อื่น ๆ เพื่อเลือกการแจกแจงที่สามารถจับคู่คุณสมบัติการกระจาย - การกระจายการผสมการสร้างแบบจำลองความหนาแน่นของบันทึกโดยใช้เส้นโค้งและอื่น ๆ
อย่างไรก็ตามบ่อยครั้งหากมีใครกลับไปที่จุดเริ่มต้นที่คนหนึ่งพยายามจะหาการกระจายมันมักจะปรากฎว่ามีบางสิ่งที่ดีกว่าที่สามารถทำได้มากกว่ากลยุทธ์ที่ระบุไว้ที่นี่