ฉันจะกำหนดพารามิเตอร์ weibull จากข้อมูลได้อย่างไร


10

ฉันมีฮิสโตแกรมของข้อมูลความเร็วลมซึ่งมักแสดงโดยใช้การแจกแจงแบบ Weibull ฉันต้องการคำนวณรูปร่างของ weibull และสเกลแฟคเตอร์ที่เหมาะสมที่สุดกับฮิสโตแกรม

ฉันต้องการโซลูชันเชิงตัวเลข (ตรงข้ามกับโซลูชันกราฟิก ) เนื่องจากเป้าหมายคือการกำหนดรูปแบบ weibull โดยทางโปรแกรม

แก้ไข: เก็บตัวอย่างทุก 10 นาทีความเร็วลมเฉลี่ยตลอด 10 นาที ตัวอย่างรวมถึงความเร็วลมสูงสุดและต่ำสุดที่บันทึกไว้ในแต่ละช่วงเวลาซึ่งจะถูกละเว้นในปัจจุบัน แต่ฉันต้องการรวมไว้ในภายหลัง ความกว้างของช่องเก็บคือ 0.5 m / s

ฮิสโตแกรมสำหรับข้อมูล 1 เดือน


1
เมื่อคุณบอกว่าคุณมีฮิสโตแกรม - คุณหมายถึงมีข้อมูลเกี่ยวกับการสังเกตการณ์หรือคุณรู้จักความกว้างและความสูงของถังขยะด้วยหรือไม่
suncoolsu

@suncoolsu ฉันมีจุดข้อมูลทั้งหมด ชุดข้อมูลมีตั้งแต่ 5,000 ถึง 50,000 รายการ
klonq

คุณไม่สามารถสุ่มตัวอย่างข้อมูลและดำเนินการ MLE ของพารามิเตอร์ได้หรือไม่
schenectady

2
วัตถุประสงค์ของการประเมินคืออะไร? เพื่อย้อนอดีตลักษณะสภาพที่ผ่านมา? หากต้องการทำนายการสร้างพลังงานในอนาคตในที่เดียว เพื่อทำนายการสร้างพลังงานภายในกริดกังหันหรือไม่? เพื่อสอบเทียบโมเดลอุตุนิยมวิทยา? ฯลฯ สำหรับคำถามนี้การพิจารณาโซลูชันที่เหมาะสมนั้นขึ้นอยู่กับวิธีการใช้งาน
whuber

@whuber ในปัจจุบันความคิดคือการสรุปชุดข้อมูลลมในรูปแบบที่ช่วยให้การเปรียบเทียบจากช่วงเวลากับงวดและ / หรือเว็บไซต์ไปยังเว็บไซต์ ต่อมาเป้าหมายจะเปรียบเทียบแนวโน้มและอย่างที่คุณพูดเพื่อตัดสินการผลิตในอนาคต ฯลฯ ฉันเป็นมือใหม่มาก ๆ เกี่ยวกับสถิติ แต่ฉันมีแหล่งข้อมูลมากมาย (ซึ่งฉันแบ่งปันไม่ได้) และต้องการแยกเป็น ข้อมูลมากมายจากที่เป็นไปได้ หากคุณสามารถชี้ให้ฉันอ่านใด ๆ ในเรื่องนี้มันจะได้รับการชื่นชมมาก
klonq

คำตอบ:


11

การประมาณความน่าจะเป็นสูงสุดของพารามิเตอร์ Weibull อาจเป็นความคิดที่ดีในกรณีของคุณ รูปแบบการแจกแจงแบบ Weibull มีลักษณะดังนี้:

(γ/θ)(x)γ1exp(xγ/θ)

θ,γ>0X1,,Xn

L(θ,γ)=i=1nlogf(Xi|θ,γ)

ทางออกหนึ่ง "การเขียนโปรแกรมที่ใช้" จะเป็นการเพิ่มประสิทธิภาพของฟังก์ชั่นนี้โดยใช้การเพิ่มประสิทธิภาพแบบ จำกัด การหาทางออกที่เหมาะสม:

logLγ=nγ+1nlogxi1θ1nxiγlogxi=0
logLθ=nθ+1θ21nxiγ=0

θ

[1nxiγlogxi1nxiγ1γ]=1n1nlogxi

γ^

θγ^

θ^=Σ1nxผมγ^n

สิ่งหนึ่งที่ฉันจะระมัดระวังก็คือดูเหมือนว่าเรามีข้อมูลอนุกรมเวลาที่นี่ หากข้อมูลถูกสุ่มตัวอย่างในช่วงเวลาสั้น ๆ การถือว่าความเป็นอิสระอาจเป็นอันตรายได้ ที่กล่าวว่า (+1)
พระคาร์ดินัล

@cardinal โปรดอธิบาย ช่วงข้อมูลในช่วงเวลาหนึ่งเดือนหรือไม่เกินหนึ่งปี แต่สุ่มตัวอย่างอย่างสม่ำเสมอ (10 นาที) สิ่งนี้อาจหมายถึงอะไร
klonq

@ cardinal ขอบคุณสำหรับการชี้ให้เห็น ฉันไม่แน่ใจเหมือนกันว่าการสันนิษฐานว่าเป็นอิสระนั้นเหมาะสมหรือไม่
suncoolsu

1
@klonq ตัวอย่างที่นำมาเป็นอย่างไร ความเร็วเฉลี่ยในช่วงสิบนาทีระหว่างการบันทึกหรือไม่ มากกว่าหนึ่งนาทีก่อนที่จะบันทึก? ความเร็วทันทีในขณะบันทึก? ส่วนใหญ่ฉันจะมองหาความสัมพันธ์แบบอนุกรมซึ่งสามารถลดขนาดตัวอย่างที่มีประสิทธิภาพของคุณได้อย่างมาก การใช้การประมาณค่า ML จะขึ้นอยู่กับสมมติฐานของกลุ่มตัวอย่างที่เป็นอิสระอาจหรืออาจยังไม่ให้การประมาณที่ดีในบริบทนั้นและควรระมัดระวังเป็นพิเศษเกี่ยวกับการอนุมานใด ๆตามการประมาณการ แนวทางของ Suncoolsu นั้นให้การโจมตีแนวแรกอย่างแน่นอน
พระคาร์ดินัล

@klonq - ถ้าเป็นไปได้คุณช่วยอธิบายวิธีเก็บตัวอย่างของคุณได้อย่างไร ข้อมูลมีลักษณะอย่างไร
suncoolsu

12

ใช้ fitdistrplus:

ต้องการความช่วยเหลือในการระบุการแจกแจงโดยฮิสโตแกรม

นี่คือตัวอย่างการกระจาย Weibull ที่พอดี:

library(fitdistrplus)

#Generate fake data
shape <- 1.9
x <- rweibull(n=1000, shape=shape, scale=1)

#Fit x data with fitdist
fit.w <- fitdist(x, "weibull")
summary(fit.w)
plot(fit.w)


Fitting of the distribution ' weibull ' by maximum likelihood 
Parameters : 
       estimate Std. Error
shape 1.8720133 0.04596699
scale 0.9976703 0.01776794
Loglikelihood:  -636.1181   AIC:  1276.236   BIC:  1286.052 
Correlation matrix:
          shape     scale
shape 1.0000000 0.3166085
scale 0.3166085 1.0000000

ป้อนคำอธิบายรูปภาพที่นี่


ขอบคุณ แต่ฉันพยายามหาทางออกใน Java
klonq

ตัวชี้ใด ๆ ในการเข้ารหัส R เพื่อให้ได้ปัจจัยรูปร่างและสัดส่วน ขอบคุณ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.