ทำไมต้องใช้ทฤษฎีที่มีค่ามาก


18

ฉันมาจากวิศวกรรมโยธาที่เราใช้ทฤษฎีค่าสุดขีดเช่นการกระจายของ GEV เพื่อทำนายค่าของเหตุการณ์บางอย่างเช่นความเร็วลมที่ยิ่งใหญ่ที่สุดนั่นคือค่าที่ 98.5% ของความเร็วลมจะลดลง

คำถามของฉันคือว่าทำไมต้องใช้เช่นการกระจายค่ามาก ? มันจะไม่ง่ายถ้าเราเพียงแค่ใช้การกระจายโดยรวมและได้รับค่าสำหรับความน่าจะเป็น 98.5% ?

คำตอบ:


24

ข้อจำกัดความรับผิดชอบ: ณ จุดต่อไปนี้ GROSSLY จะถือว่าข้อมูลของคุณได้รับการกระจายตามปกติ หากคุณเป็นวิศวกรรมอะไรจริง ๆ แล้วพูดคุยกับมืออาชีพสถิติที่แข็งแกร่งและปล่อยให้บุคคลนั้นลงนามในบรรทัดว่าสิ่งที่ระดับจะ คุยกับห้าคนหรือ 25 คน คำตอบนี้มีไว้สำหรับนักเรียนวิศวกรรมโยธาถามว่า "ทำไม" ไม่ใช่สำหรับมืออาชีพด้านวิศวกรรมถามว่า "อย่างไร"

ฉันคิดว่าคำถามที่อยู่เบื้องหลังคำถามคือ "การกระจายมูลค่ามากคืออะไร" ใช่มันคือพีชคณิต - สัญลักษณ์ แล้วอะไรล่ะ ขวา?

ลองนึกถึงเหตุการณ์น้ำท่วม 1,000 ปี พวกเขาใหญ่

เมื่อพวกเขาเกิดขึ้นพวกเขาจะฆ่าผู้คนจำนวนมาก สะพานจำนวนมากกำลังลง
คุณรู้ไหมว่าสะพานอะไรไม่ลง? ฉันทำ. คุณยังไม่ ...

คำถาม:สะพานใดไม่ลงไปในน้ำท่วม 1,000 ปี?
คำตอบ:สะพานที่ออกแบบมาเพื่อทนต่อมัน

ข้อมูลที่คุณต้องการในแบบของคุณ:
สมมติว่าคุณมีข้อมูลน้ำ 200 ปีต่อวัน มีน้ำท่วม 1,000 ปีในนั้นไหม? ไม่ไกล คุณมีตัวอย่างหางหนึ่งส่วนของการแจกแจง คุณไม่มีประชากร ถ้าคุณรู้ประวัติน้ำท่วมทั้งหมดคุณก็จะมีจำนวนประชากรทั้งหมด ให้คิดเกี่ยวกับสิ่งนี้ คุณต้องใช้ข้อมูลเป็นเวลากี่ปีเท่าไหร่เพื่อที่จะมีค่าอย่างน้อยหนึ่งค่าที่มีโอกาสเป็น 1 ใน 1,000 ในโลกที่สมบูรณ์แบบคุณต้องมีอย่างน้อย 1,000 ตัวอย่าง โลกแห่งความจริงยุ่งเหยิงดังนั้นคุณต้องการมากกว่านี้ คุณเริ่มได้รับ 50/50 อัตราต่อรองที่ประมาณ 4000 ตัวอย่าง คุณเริ่มรับประกันว่าจะมีมากกว่า 1 ตัวอย่างประมาณ 20,000 ตัวอย่าง ตัวอย่างไม่ได้หมายถึง "น้ำหนึ่งวินาทีกับถัดไป" แต่เป็นการวัดสำหรับแหล่งที่มาของการเปลี่ยนแปลงที่ไม่ซ้ำกัน - เช่นการเปลี่ยนแปลงปีต่อปี หนึ่งวัดในหนึ่งปี พร้อมกับอีกวัดหนึ่งในอีกหนึ่งปีประกอบด้วยสองตัวอย่าง หากคุณไม่มีข้อมูลที่ดี 4,000 ปีคุณอาจไม่มีตัวอย่าง 1,000 ปีที่ท่วมข้อมูล สิ่งที่ดีคือ - คุณไม่ต้องการข้อมูลจำนวนมากเพื่อให้ได้ผลลัพธ์ที่ดี

นี่คือวิธีการรับผลลัพธ์ที่ดีขึ้นด้วยข้อมูลน้อยลง:
ถ้าคุณดูที่ maxima ประจำปีคุณสามารถใส่ "การกระจายค่าที่มากที่สุด" กับ 200 ค่าของระดับสูงสุดปีและคุณจะมีการกระจายที่มีน้ำท่วม 1,000 ปี ระดับพื้นดิน มันจะเป็นพีชคณิตไม่ใช่ของจริง "มันใหญ่แค่ไหน" คุณสามารถใช้สมการเพื่อกำหนดว่าน้ำท่วม 1,000 ปีจะมีขนาดใหญ่เพียงใด จากนั้นเมื่อปริมาณน้ำนั้น - คุณสามารถสร้างสะพานเพื่อต้านทานมันได้ อย่ายิงตามมูลค่าที่แน่นอนยิงให้ใหญ่ขึ้นมิฉะนั้นคุณจะออกแบบให้ล้มเหลวในช่วงน้ำท่วม 1,000 ปี หากคุณกล้าได้กล้าเสียคุณสามารถใช้การทดสอบซ้ำเพื่อหาว่าเกินกว่ามูลค่า 1,000 ปีที่แน่นอนที่คุณต้องการสร้างไว้เพื่อที่จะต้านทานมัน

นี่คือเหตุผลที่ EV / GEV เป็นรูปแบบการวิเคราะห์ที่เกี่ยวข้อง:
การแจกแจงค่าสุดขีดทั่วไปโดยทั่วไปเกี่ยวกับจำนวนสูงสุดที่แตกต่างกันไป ความแปรปรวนของค่าสูงสุดนั้นแตกต่างจากการเปลี่ยนแปลงในค่าเฉลี่ยมากที่สุด การแจกแจงแบบปกติผ่านทฤษฎีบทขีด จำกัด กลางอธิบาย "แนวโน้มกลาง" มากมาย

ขั้นตอน:

  1. ทำ 1,000 ครั้งต่อไปนี้:
    i. เลือก 1,000 หมายเลขจากการแจกแจงแบบปกติมาตรฐาน
    ii คำนวณจำนวนสูงสุดของกลุ่มตัวอย่างนั้นและเก็บไว้
  2. ตอนนี้วางแผนการกระจายของผลลัพธ์

    #libraries
    library(ggplot2)
    
    #parameters and pre-declarations
    nrolls <- 1000
    ntimes <- 10000
    store <- vector(length=ntimes)
    
    #main loop
    for (i in 1:ntimes){
    
         #get samples
         y <- rnorm(nrolls,mean=0,sd=1)
    
         #store max
         store[i] <- max(y)
    }
    
    #plot
    ggplot(data=data.frame(store), aes(store)) + 
         geom_histogram(aes(y = ..density..),
                        col="red", 
                        fill="green", 
                        alpha = .2) + 
         geom_density(col=2) + 
         labs(title="Histogram for Max") +
         labs(x="Max", y="Count")
    

นี่ไม่ใช่ "การแจกแจงแบบปกติมาตรฐาน": ป้อนคำอธิบายรูปภาพที่นี่

จุดสูงสุดอยู่ที่ 3.2 แต่ค่าสูงสุดจะเพิ่มขึ้นเป็น 5.0 มันมีความเบ้ ไม่ต่ำกว่าประมาณ 2.5 หากคุณมีข้อมูลจริง (มาตรฐานปกติ) และคุณเลือกหางคุณจะสุ่มเลือกบางอย่างตามโค้งนี้ หากคุณโชคดีคุณจะไปที่ตรงกลางไม่ใช่หางล่าง วิศวกรรมเป็นสิ่งที่ตรงกันข้ามกับโชค - มันเกี่ยวกับการบรรลุผลลัพธ์ที่ต้องการอย่างสม่ำเสมอทุกครั้ง " ตัวเลขสุ่มมีความสำคัญเกินกว่าที่จะปล่อยให้เป็นไปได้ " (ดูเชิงอรรถ) โดยเฉพาะอย่างยิ่งสำหรับวิศวกร ตระกูลฟังก์ชั่นการวิเคราะห์ที่เหมาะกับข้อมูลนี้มากที่สุดคือตระกูลการกระจายที่มีคุณค่า

ตัวอย่างพอดี:
สมมติว่าเรามีค่าสุ่มสูงสุดถึง 200 ค่าจากการแจกแจงแบบปกติมาตรฐานและเราจะแกล้งทำเป็นว่าพวกเขาเป็นประวัติศาสตร์ 200 ปีของระดับน้ำสูงสุดของเรา ในการรับการแจกจ่ายเราจะทำสิ่งต่อไปนี้:

  1. ตัวอย่างตัวแปร "store" (เพื่อทำรหัสสั้น / ง่าย)
  2. เหมาะสมกับการกระจายค่าสุดขีดทั่วไป
  3. หาค่าเฉลี่ยของการแจกแจง
  4. ใช้ bootstrapping เพื่อหาขีด จำกัด สูงสุด 95% CI ในรูปแบบของค่าเฉลี่ยดังนั้นเราจึงสามารถกำหนดเป้าหมายวิศวกรรมของเราสำหรับสิ่งนั้น

(รหัสถือว่าข้างต้นถูกเรียกใช้ก่อน)

library(SpatialExtremes) #if it isn't here install it, it is the ev library
y2 <- sample(store,size=200,replace=FALSE)  #this is our data

myfit <- gevmle(y2)

สิ่งนี้ให้ผลลัพธ์:

> gevmle(y2)    
       loc      scale      shape     
 3.0965530  0.2957722 -0.1139021     

สิ่งเหล่านี้สามารถเสียบเข้ากับฟังก์ชันสร้างเพื่อสร้างตัวอย่าง 20,000 ตัวอย่าง

y3 <- rgev(20000,loc=myfit[1],scale=myfit[2],shape=myfit[3])

การสร้างสิ่งต่อไปนี้จะทำให้โอกาสล้มเหลว 50/50 ในทุกปี:

ค่าเฉลี่ย (y3)
3.23681

นี่คือรหัสเพื่อกำหนดระดับ "ท่วม" 1,000 ปี:

p1000 <- qgev(1-(1/1000),loc=myfit[1],scale=myfit[2],shape=myfit[3])
p1000

การสร้างสิ่งต่อไปนี้จะทำให้คุณมีโอกาส 50/50 ที่จะล้มเหลวจากเหตุการณ์น้ำท่วม 1,000 ปี

P1000
4.510931

เพื่อกำหนด CI บน 95% ฉันใช้รหัสต่อไปนี้:

myloc <- 3.0965530
myscale <- 0.2957722
myshape <- -0.1139021

N <- 1000
m <- 200
p_1000 <- vector(length=N)
yd <- vector(length=m)

for (i in 1:N){

      #generate samples
    yd <- rgev(m,loc=myloc,scale=myscale,shape=myshape)

    #compute fit
    fit_d <- gevmle(yd)

    #compute quantile
    p_1000[i] <- qgev(1-(1/1000),loc=fit_d[1],scale=fit_d[2],shape=fit_d[3])

}

mytarget <- quantile(p_1000,probs=0.95)

ผลลัพธ์คือ:

> mytarget
     95% 
4.812148

ซึ่งหมายความว่าในการที่จะต่อต้านน้ำท่วมใหญ่ 1,000 ปีส่วนใหญ่เนื่องจากข้อมูลของคุณเป็นปกติอย่างไม่มีมลทิน (ไม่น่าจะเป็นไปได้) คุณจะต้องสร้าง ...

> out <- pgev(4.812148,loc=fit_d[1],scale=fit_d[2],shape=fit_d[3])
> 1/(1-out)

หรือ

> 1/(1-out)
   shape 
1077.829 

... 1,078 ปีน้ำท่วม

เส้นด้านล่าง:

  • คุณมีตัวอย่างของข้อมูลไม่ใช่จำนวนประชากรทั้งหมดที่แท้จริง นั่นหมายความว่าปริมาณของคุณเป็นค่าประมาณและอาจถูกปิด
  • การแจกแจงเช่นการแจกแจงค่าสุดขีดทั่วไปถูกสร้างขึ้นเพื่อใช้ตัวอย่างเพื่อพิจารณาก้อยที่แท้จริง พวกมันประเมินได้แย่กว่าการใช้ค่าตัวอย่างน้อยมากแม้ว่าคุณจะมีตัวอย่างไม่เพียงพอสำหรับวิธีแบบดั้งเดิม
  • หากคุณแข็งแกร่งเพดานสูง แต่ผลที่ได้คือ - คุณจะไม่ล้มเหลว

ขอให้โชคดี

PS:

  • 1/(1-0.985)67
    วิธีการที่นั่น, imo, คือการค้นหาการแจกแจงสำหรับพายุ 67 ปี, จากนั้นเพื่อตรวจสอบความแปรปรวนรอบ ๆ ค่าเฉลี่ย, และรับการเติมเพื่อให้มันได้รับการออกแบบให้ประสบความสำเร็จในพายุปีที่ 67 แทนที่จะล้มเหลว
  • เมื่อพิจารณาจากจุดก่อนหน้านี้โดยเฉลี่ยทุก ๆ 67 ปีชาวบ้านควรจะสร้างใหม่ ดังนั้นด้วยค่าใช้จ่ายทั้งหมดของวิศวกรรมและการก่อสร้างทุก ๆ 67 ปีเนื่องจากอายุการใช้งานของโครงสร้างทางแพ่ง (ฉันไม่รู้ว่ามันคืออะไร) ในบางครั้งมันอาจมีราคาถูกกว่าสำหรับวิศวกรในช่วงระหว่างพายุที่ยาวนานกว่า โครงสร้างพื้นฐานทางแพ่งที่ยั่งยืนนั้นได้รับการออกแบบมาให้มีอายุการใช้งานอย่างน้อยหนึ่งช่วงเวลาของมนุษย์

PS: สนุกมากขึ้น - วิดีโอ youtube (ไม่ใช่ของฉัน)
https://www.youtube.com/watch?v=EACkiMRT0pc

เชิงอรรถ: Coveyou, Robert R. "การสร้างตัวเลขสุ่มมีความสำคัญเกินกว่าที่จะปล่อยให้เป็นไปได้" ความน่าจะเป็นประยุกต์และวิธีการมอนติคาร์โลและแง่มุมที่ทันสมัยของการเปลี่ยนแปลง การศึกษาคณิตศาสตร์ประยุกต์ 3 (1969): 70-111


2
ฉันอาจจะไม่ชัดเจนพอ ความกังวลหลักของฉันคือทำไมใช้extreme value distributionแทนที่จะthe overall distributionพอดีกับข้อมูลและรับค่า 98.5%
cqcn1991

ประชากรโดยรวมหมายถึงอะไร
kjetil b halvorsen

1
อัปเดตคำตอบ
EngrStudent - Reinstate Monica

2
@EngrStudent คำตอบที่ดี แต่มันจะดียิ่งขึ้นถ้าคุณแสดงให้เห็นว่า EVT ทำงานได้ดีกว่าการใช้การแจกแจงแบบปกตินอกเหนือจากการแสดงภาพประกอบ
ทิม

2
หลังจากทำแบบจำลองแล้วฉันจะบอกว่าการใช้การกระจายแบบผู้ปกครองนั้นมีอันตรายเพียงเพราะข้อมูลมีน้อยมากและการคาดการณ์มีความอันตรายและไม่แน่นอนสำหรับการสร้างแบบจำลองเหตุการณ์ที่สุดขั้ว และนั่นคือวิธีที่เราควรใช้ทฤษฎี EV แทน
cqcn1991

7

คุณใช้ทฤษฎีค่าสุดขีดเพื่อคาดการณ์จากข้อมูลที่สังเกตได้ บ่อยครั้งที่ข้อมูลที่คุณมีไม่ใหญ่พอที่จะให้คุณประเมินความน่าจะเป็นหางได้อย่างเหมาะสม รับตัวอย่างของ @ EngrStudent ของเหตุการณ์ 1 ใน 1,000 ปี: ที่สอดคล้องกับการค้นหาควอไทล์ 99.9% ของการแจกแจง แต่ถ้าคุณมีข้อมูลเพียง 200 ปีคุณสามารถคำนวณควอนตัมเชิงประจักษ์ได้สูงสุดถึง 99.5%

ทฤษฎีค่าสุดขีดช่วยให้คุณประเมินควอนไทล์ 99.9% โดยการตั้งสมมติฐานต่าง ๆ เกี่ยวกับรูปร่างของการกระจายตัวของคุณที่ส่วนท้าย: ว่ามันราบรื่นมันสลายตัวด้วยรูปแบบบางอย่างและอื่น ๆ

คุณอาจคิดว่าความแตกต่างระหว่าง 99.5% และ 99.9% นั้นน้อยกว่าปกติ เป็นเพียง 0.4% หลังจากทั้งหมด แต่นั่นเป็นความแตกต่างในความน่าจะเป็นและเมื่อคุณอยู่ในท้ายมันก็สามารถแปลความแตกต่างในปริมาณมาก นี่คือภาพประกอบของสิ่งที่ดูเหมือนว่าเป็นการกระจายแกมม่าซึ่งไม่มีหางยาวมากเมื่อสิ่งเหล่านี้ดำเนินไป เส้นสีฟ้าสอดคล้องกับควอไทล์ 99.5% และเส้นสีแดงคือควอไทล์ 99.9% ในขณะที่ความแตกต่างระหว่างสิ่งเหล่านี้มีขนาดเล็กบนแกนตั้งการแยกบนแกนนอนนั้นมีความสำคัญมาก การแยกนั้นใหญ่ขึ้นสำหรับการแจกแจงแบบหางยาวอย่างแท้จริง แกมมาเป็นกรณีที่ไม่น่ากลัวเลยทีเดียว

ป้อนคำอธิบายรูปภาพที่นี่


คำตอบของคุณไม่ถูกต้อง จุด 99.9% ของการตายปกติรายปีไม่ตรงกับเหตุการณ์ 1 ใน 1,000 ปี จำนวนสูงสุด 1000 Normals มีการแจกแจงที่แตกต่างกัน ฉันคิดว่านั่นเป็นคำตอบอื่น ๆ
Mark L. Stone

@ MarkL.Stone ไม่มีที่ไหนที่ฉันจะพูดอะไรเกี่ยวกับจำนวนสูงสุด 1,000 บรรทัดฐาน
Hong Ooi

1
นั่นคือจุดของฉัน เหตุการณ์ 1 ใน 1,000 ปีควรเป็นไปตามปกติสูงสุด 1,000 ปี นั่นแตกต่างอย่างมากจากจุด 99.9 $ ในแบบรายปี ดูความคิดเห็นของฉันต่อคำตอบของ Karel Macek ด้านล่าง
Mark L. Stone

@ MarkL.Stone จุดของกราฟเป็นเพียงการแสดงให้เห็นว่าเมื่อคุณอยู่ในหางการเปลี่ยนแปลงเล็กน้อยในความน่าจะเป็นสอดคล้องกับการเปลี่ยนแปลงขนาดใหญ่ในปริมาณ คุณสามารถแทนที่ quantile 99% ของ GEV หรือ GPD หรือการกระจายอื่น ๆ (และฉันไม่ได้พูดถึงการแจกแจงแบบปกติ)
Hong Ooi

นอกจากนี้การประมาณค่าสูงสุดผ่านทาง GEV เป็นเพียงวิธีหนึ่งในการหาปริมาณหาง อีกวิธีคือการประมาณปริมาณโดยตรงผ่าน GPD (สมมติว่ามีการแจกแจงแบบหนา)
Hong Ooi

7

หากคุณสนใจหางเท่านั้นมันทำให้รู้สึกว่าคุณมุ่งเน้นการเก็บรวบรวมข้อมูลของคุณและความพยายามวิเคราะห์ที่ส่วนท้าย มันควรจะมีประสิทธิภาพมากกว่านี้ ฉันเน้นการรวบรวมข้อมูลเนื่องจากลักษณะนี้มักจะถูกละเว้นเมื่อแสดงอาร์กิวเมนต์สำหรับการแจกแจง EVT ในความเป็นจริงมันเป็นไปไม่ได้ที่จะรวบรวมข้อมูลที่เกี่ยวข้องเพื่อประเมินสิ่งที่คุณเรียกการแจกจ่ายโดยรวมในบางสาขา ฉันจะอธิบายรายละเอียดเพิ่มเติมด้านล่าง

หากคุณดูที่ 1 ใน 1,000 ปีที่ผ่านมาอย่างท่วมท้นเช่นในตัวอย่างของ @ EngrStudent จากนั้นสร้างโครงสร้างการกระจายแบบปกติที่คุณต้องการข้อมูลจำนวนมากเพื่อเติมเต็มด้วยการสังเกต คุณอาจต้องการน้ำท่วมทุกครั้งที่เกิดขึ้นในช่วงหลายร้อยปีที่ผ่านมา

ตอนนี้หยุดสักครู่แล้วคิดว่าอะไรคือน้ำท่วม? เมื่อสวนหลังบ้านของฉันถูกน้ำท่วมหลังจากฝนตกหนักมันเป็นน้ำท่วมหรือไม่? อาจไม่ได้ แต่ที่เส้นตรงที่แยกน้ำท่วมจากเหตุการณ์ที่ไม่ใช่น้ำท่วมอยู่ที่ไหน คำถามง่าย ๆ นี้เน้นให้เห็นปัญหากับการรวบรวมข้อมูล คุณจะแน่ใจได้อย่างไรว่าเรารวบรวมข้อมูลทั้งหมดในร่างกายตามมาตรฐานเดียวกันมานานหลายสิบปีหรืออาจนานหลายศตวรรษ? เป็นไปไม่ได้ในทางปฏิบัติในการรวบรวมข้อมูลในร่างกายของการกระจายของน้ำท่วม

ดังนั้นมันไม่ใช่แค่เรื่องของการวิเคราะห์ที่มีประสิทธิภาพแต่เป็นเรื่องของความเป็นไปได้ของข้อมูลคอลเลกชัน : ไม่ว่าจะรูปแบบการกระจายทั้งหมดหรือเพียงแค่หาง?

โดยปกติแล้วการรวบรวมข้อมูลจะง่ายกว่ามาก หากเรากำหนดขีด จำกัด ที่สูงพอสำหรับสิ่งที่เกิดน้ำท่วมใหญ่เราอาจมีโอกาสมากขึ้นที่เหตุการณ์ดังกล่าวทั้งหมดหรือเกือบทั้งหมดจะถูกบันทึกไว้ในบางวิธี มันยากที่จะพลาดเหตุการณ์น้ำท่วมครั้งใหญ่และหากมีอารยธรรมใด ๆ ปรากฏขึ้นจะมีการบันทึกความทรงจำเกี่ยวกับเหตุการณ์ไว้ ดังนั้นจึงเหมาะสมที่จะสร้างเครื่องมือวิเคราะห์ที่เน้นเฉพาะในส่วนท้ายเนื่องจากการรวบรวมข้อมูลมีความแข็งแกร่งมากในเหตุการณ์ที่รุนแรงมากกว่าที่จะไม่รุนแรงในหลาย ๆ ด้านเช่นการศึกษาความน่าเชื่อถือ


+1 คะแนนที่น่าสนใจและตรงประเด็นโดยเฉพาะในหมายเหตุท้ายที่สุด
whuber

(+1) เกี่ยวข้องกับจุดสุดท้ายของคุณ (หน่วยความจำที่เก็บรักษาไว้) ผล Sadlerอาจเป็นที่สนใจ
GeoMatt22

@ GeoMatt22 นี่เป็นครั้งแรกที่ฉันเห็นกระดาษและคำศัพท์ Sadler Effect ขอบคุณสำหรับลิงค์
Aksakal

นั่นคือจุดที่ยอดเยี่ยมอย่างแท้จริง มันเป็นระบบดังนั้นวิธีการที่เป็นระบบสามารถให้ผลตอบแทนที่ดีเยี่ยม การวิเคราะห์ที่ดีที่สุดในโลกสามารถวางยาพิษด้วยข้อมูลขยะ การวิเคราะห์ที่ค่อนข้างง่ายเมื่อป้อนด้วยข้อมูลที่ดีสามารถให้ผลลัพธ์ที่ยอดเยี่ยม คะแนนดีมาก!
EngrStudent - Reinstate Monica

6

โดยปกติแล้วการกระจายของข้อมูลพื้นฐาน (เช่นความเร็วลมแบบเกาส์เชียน) เป็นเพียงจุดตัวอย่างเดียว เปอร์เซ็นไทล์ที่ 98 จะบอกคุณว่าสำหรับจุดที่เลือกแบบสุ่มใด ๆมีโอกาส 2% ที่ค่าจะยิ่งใหญ่กว่าไทล์ไทล์ที่ 98

ฉันไม่ใช่วิศวกรโยธา แต่ฉันคิดว่าสิ่งที่คุณอยากรู้ไม่ใช่ความน่าจะเป็นของความเร็วลมในแต่ละวันที่สูงกว่าจำนวนที่กำหนด แต่การกระจายตัวของกระแสลมที่ใหญ่ที่สุดที่เป็นไปได้พูด หลักสูตรของปี ในกรณีดังกล่าวถ้าลมกระโชกแรงดันสูงสุดประจำวันกระจายออกไปแบบเอกซ์โปเนนเชียลสิ่งที่คุณต้องการคือการกระจายของลมกระโชกสูงสุดตลอด 365 วัน ... นี่คือสิ่งที่การกระจายค่ามากที่สุดคือการแก้ไข


1

การใช้ quantile ทำให้การคำนวณง่ายขึ้น วิศวกรโยธาสามารถแทนที่ค่า (ความเร็วลมเป็นต้น) เป็นสูตรแรกของพวกเขาและพวกเขาได้รับพฤติกรรมของระบบสำหรับเงื่อนไขที่รุนแรงเหล่านั้นที่สอดคล้องกับควอไทล์ 98.5%

การใช้การแจกแจงทั้งหมดอาจให้ข้อมูลเพิ่มเติม แต่จะทำให้การคำนวณซับซ้อนขึ้น อย่างไรก็ตามอาจอนุญาตให้ใช้วิธีการจัดการความเสี่ยงขั้นสูงซึ่งจะทำให้เกิดความสมดุลระหว่างต้นทุนที่เกี่ยวข้องกับ (i) การก่อสร้างและ (ii) ความเสี่ยงของความล้มเหลว


ดี ... ฉันอาจไม่ชัดเจนเพียงพอ ฉันแค่อยากรู้ว่าทำไมใช้ทฤษฎีค่าสุดโต่งมากกว่าการแจกแจงทั่วไป (การกระจายตัวทั้งหมด?) ที่ปกติเราใช้?
cqcn1991

1
ถ้าฟังก์ชันการแจกแจงสะสมสำหรับอินสแตนซ์ใด ๆ เช่นความเร็วลมสูงสุดรายวันคือ F (x) ดังนั้นฟังก์ชันการแจกแจงสะสมสำหรับสูงสุดของอินสแตนซ์อิสระ n อิสระ (เช่น n = 365 สำหรับปีที่มีความเร็วลมสูงสุดประจำวัน ) คือ F ^ n (x) สิ่งนี้แตกต่างจาก F (x)
Mark L. Stone
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.