คำถามติดแท็ก extreme-value

ค่าสูงสุดคือการสังเกตที่ใหญ่ที่สุดหรือน้อยที่สุดในกลุ่มตัวอย่าง เช่นค่าต่ำสุดตัวอย่าง (สถิติลำดับแรก) และค่าสูงสุดของตัวอย่าง (สถิติลำดับที่ n) ที่เกี่ยวข้องกับค่ามากคือการแจกแจงค่ามากแบบไม่แสดงอาการ *

10
Taleb และ Black Swan
หนังสือของ Taleb "The Black Swan" เป็นหนังสือขายดีที่สุดของ New York Times เมื่อมีข่าวออกมาเมื่อหลายปีก่อน หนังสือเล่มนี้อยู่ในรุ่นที่สองของมัน หลังจากพบกับนักสถิติในงาน JSM (การประชุมสถิติประจำปี) Taleb ก็ปรับลดคำวิจารณ์ของเขาลงเล็กน้อย แต่แรงผลักดันของหนังสือเล่มนี้ก็คือสถิติไม่ได้มีประโยชน์มากนักเพราะมันขึ้นอยู่กับการแจกแจงแบบปกติและเหตุการณ์ที่หายากมาก: "แบล็กสวอน" ไม่มีการแจกแจงแบบปกติ คุณคิดว่านี่เป็นคำวิจารณ์ที่ถูกต้องหรือไม่? Taleb ขาดส่วนสำคัญของการสร้างแบบจำลองทางสถิติหรือไม่? สามารถทำนายเหตุการณ์ที่เกิดขึ้นได้น้อยอย่างน้อยในแง่ที่ว่าความน่าจะเป็นของการเกิดขึ้นสามารถประมาณได้?

2
ทฤษฎี Extreme Value - แสดง: Normal ถึง Gumbel
จำนวนสูงสุดของ IID Standardnormals ลู่กับมาตรฐานกัมเบลจัดจำหน่ายตามมากราคาทฤษฎีX1,…,Xn.∼X1,…,Xn.∼X_1,\dots,X_n. \sim เราจะแสดงสิ่งนั้นได้อย่างไร เรามี P(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(\max X_i \leq x) = P(X_1 \leq x, \dots, X_n \leq x) = P(X_1 \leq x) \cdots P(X_n \leq x) = F(x)^n เราจำเป็นต้องค้นหา / เลือกan>0,bn∈Ran>0,bn∈Ra_n>0,b_n\in\mathbb{R}ลำดับของค่าคงที่เช่น: F(anx+bn)n→n→∞G(x)=e−exp(−x)F(anx+bn)n→n→∞G(x)=e−exp⁡(−x)F\left(a_n x+b_n\right)^n\rightarrow^{n\rightarrow\infty} G(x) = e^{-\exp(-x)} คุณสามารถแก้ไขหรือค้นหามันในวรรณคดี? มีบางตัวอย่างหน้า 6/71แต่ไม่ใช่สำหรับกรณีปกติ: Φ(anx+bn)n=(12π−−√∫anx+bn−∞e−y22dy)n→e−exp(−x)Φ(anx+bn)n=(12π∫−∞anx+bne−y22dy)n→e−exp⁡(−x)\Phi\left(a_n x+b_n\right)^n=\left(\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{a_n x+b_n} e^{-\frac{y^2}{2}}dy\right)^n\rightarrow e^{-\exp(-x)}

5
ทำไมต้องใช้ทฤษฎีที่มีค่ามาก
ฉันมาจากวิศวกรรมโยธาที่เราใช้ทฤษฎีค่าสุดขีดเช่นการกระจายของ GEV เพื่อทำนายค่าของเหตุการณ์บางอย่างเช่นความเร็วลมที่ยิ่งใหญ่ที่สุดนั่นคือค่าที่ 98.5% ของความเร็วลมจะลดลง คำถามของฉันคือว่าทำไมต้องใช้เช่นการกระจายค่ามาก ? มันจะไม่ง่ายถ้าเราเพียงแค่ใช้การกระจายโดยรวมและได้รับค่าสำหรับความน่าจะเป็น 98.5% ?

2
การแจกแจงของตัวแปรปกติที่มีความสัมพันธ์สูงสุดสองตัว
ว่าฉันมีสองมาตรฐานตัวแปรสุ่มปกติX1X1X_1และที่มีร่วมกันตามปกติที่มีค่าสัมประสิทธิ์สหสัมพันธ์R rX2X2X_2rrr ฟังก์ชั่นการกระจายของคืออะไร?max(X1,X2)max(X1,X2)\max(X_1, X_2)

1
ตัวอย่างของตัวแปรอิสระ (ประมาณ) ที่ขึ้นอยู่กับค่าที่สุดขั้ว?
ฉันกำลังมองหาตัวอย่างของตัวแปรสุ่ม 2 ตัว , Y แบบนั้นXXXYYY |cor(X,Y)|≈0|cor(X,Y)|≈0\newcommand{\cor}{{\rm cor}}|\cor(X,Y)| \approx 0 แต่เมื่อพิจารณาส่วนหางของการแจกแจงพวกมันมีความสัมพันธ์สูง (ฉันพยายามหลีกเลี่ยง 'สหสัมพันธ์' / 'สหสัมพันธ์' ของหางเพราะมันอาจไม่ใช่เชิงเส้น) อาจใช้สิ่งนี้: |cor(X′,Y′)|≫0|cor(X′,Y′)|≫0|\cor(X', Y')| \gg 0 โดยที่มีเงื่อนไขบนX > 90 %ของประชากรของXและY ′ถูกกำหนดในความหมายเดียวกันX′X′X'X>90%X>90%X > 90\%XXXY′Y′Y'

1
ผู้เล่นหมากรุกชายและหญิง - ความคลาดเคลื่อนที่คาดหวังที่ส่วนท้ายของการแจกแจง
ฉันสนใจผลการวิจัยของบทความนี้จาก 2009: ทำไมผู้หญิงถึงเก่งที่สุดในการเล่นหมากรุก? อัตราการมีส่วนร่วมและความแตกต่างทางเพศในโดเมนทางปัญญา บทความนี้พยายามอธิบายว่าทำไมผู้เล่นหมากรุกชายที่เก่งที่สุดจึงดีกว่าผู้เล่นเพศหญิงที่ดีที่สุด (เพศหญิงคิดเป็นเพียง 2% ของผู้เล่น 1,000 คนที่ดีที่สุดในโลก) โดยเฉพาะพวกเขาอ้างว่าความแตกต่างระหว่างผู้เล่นหมากรุกที่ดีที่สุดกับผู้เล่นหมากรุกหญิงที่ดีที่สุดนั้นถูกอธิบายโดยข้อเท็จจริง 2 ประการ: มีผู้เล่นหมากรุกมากกว่าตัวเมียถึง 15 เท่า เราคาดว่าอัตราส่วนนี้จะทวีความรุนแรงมากที่ปลายสุดของการกระจายทั้งหมดด้วยเหตุผลทางสถิติ วิธีเสนอราคากระดาษ: แม้ว่าสองกลุ่มจะมีค่าเฉลี่ยเดียวกัน (หมายถึง) และความแปรปรวน (sd) บุคคลที่มีประสิทธิภาพสูงสุดมีแนวโน้มที่จะมาจากกลุ่มที่ใหญ่กว่า ยิ่งความแตกต่างของขนาดระหว่างสองกลุ่มมากเท่าไหร่ก็ยิ่งมีความแตกต่างมากขึ้นระหว่างนักแสดงอันดับต้น ๆ ในทั้งสองกลุ่ม และอีกครั้ง, การศึกษาครั้งนี้แสดงให้เห็นว่าความแตกต่างที่ยอดเยี่ยมในการเล่นหมากรุกของชายและหญิงสามารถนำมาประกอบกับข้อเท็จจริงทางสถิติอย่างง่าย - ค่าที่มากขึ้นนั้นพบมากในประชากรที่มีขนาดใหญ่ขึ้น ถ้าผู้เล่นหมากรุกเพียง 6% เป็นเพศหญิงเราคาดว่าจะมีเพียง 2% ใน 1,000 อันดับแรกดังนั้นจึงไม่มีคำอธิบายอื่น ๆ เกี่ยวกับความแตกต่างทางชีวภาพหรือความเอนเอียงทางสังคม คำถามของฉัน ฉันไม่สามารถเข้าใจความคิดที่ว่าความแตกต่างเล็ก ๆ ของขนาดประชากรนั้นเลวร้ายไปกว่าตอนปลายสุดของการกระจาย โดยเฉพาะอย่างยิ่งมีอะไรผิดปกติกับตัวอย่างเคาน์เตอร์นี้: ผู้เล่นหมากรุกประมาณ 1 ใน 12 คนเกิดในเดือนมกราคม ดังนั้นพวกเขาจึงทำขึ้นเล็กน้อยของผู้เล่นหมากรุกทั้งหมด …

2
ขอบเขตท้ายของ Euclidean norm สำหรับการกระจายแบบสม่ำเสมอบน
สิ่งที่เป็นที่รู้กันว่าขอบเขตบนของยุคลิดเป็นองค์ประกอบที่ได้รับการแต่งตั้งอย่างสม่ำเสมอของจะใหญ่กว่าเกณฑ์ที่กำหนดหรือไม่{−n, −(n−1), ..., n−1, n}d{−n, −(n−1), ..., n−1, n}d\:\{-n,~-(n-1),~...,~n-1,~n\}^d\: ฉันสนใจส่วนใหญ่อยู่ในขอบเขตที่มาบรรจบกันชี้แจงให้เป็นศูนย์เมื่อnnnมีมากน้อยกว่าdddd

2
การกระจายสำหรับสูงสุด (ขั้นต่ำ) ของตัวแปรสุ่มแบบอิสระสองตัวคืออะไร
โดยเฉพาะสมมติว่า XXX และ YYYเป็นตัวแปรสุ่มปกติ (อิสระ แต่ไม่จำเป็นต้องมีการกระจายเหมือนกัน) รับเฉพาะใด ๆaaaมีสูตรที่ดีสำหรับ P( สูงสุด( X), วาย) ≤ x )P(max(X,Y)≤x)P(\max(X,Y)\leq x)หรือแนวคิดที่คล้ายกัน เราจะรู้ว่าสูงสุด( X, วาย)max(X,Y)\max(X,Y)มีการกระจายตามปกติอาจจะเป็นสูตรสำหรับค่าเบี่ยงเบนมาตรฐานค่าเฉลี่ยและในแง่ของเหล่านั้นสำหรับXXXและYYY ? ฉันตรวจสอบสถานที่ปกติ (วิกิพีเดีย google) แต่ไม่พบอะไรเลย

2
การกระจายเชิงสถิติของลำดับสูงสุดของบรรทัดฐานแบบสุ่ม IID
สูงสุด( X1, X2, . . . , Xn)สูงสุด(X1,X2,...,Xn)\max( X_1,X_2,...,X_n) nnn∞∞\inftyσ2σ2\sigma^2 นี่เป็นปัญหาที่รู้จักกันดีด้วยหลักฐานอันชาญฉลาดและวิธีแก้ปัญหาที่ดี แต่ฉันขุดมาแล้วไม่พบอะไรเลย

2
อะไรคือผลลัพธ์ที่ทรงพลังที่สุดเกี่ยวกับ iid Gaussians สูงสุด? ใช้มากที่สุดในการฝึก?
รับ iid, พิจารณาตัวแปรสุ่มX1,…,Xn,…∼N(0,1)X1,…,Xn,…∼N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1) Zn: =สูงสุด1 ≤ ฉัน≤ nXผม.Zn=สูงสุด1≤ผม≤nXผม. Z_n := \max_{1 \le i \le n} X_i\,. คำถาม:ผลลัพธ์ที่ "สำคัญ" ที่สุดเกี่ยวกับตัวแปรสุ่มเหล่านี้คืออะไร เพื่อชี้แจง "ความสำคัญ" ซึ่งผลลัพธ์ใดที่มีผลลัพธ์เช่นอื่น ๆ มากที่สุดซึ่งเป็นผลลัพธ์เชิงตรรกะ? ผลลัพธ์ใดที่ใช้บ่อยที่สุดในทางปฏิบัติ โดยเฉพาะอย่างยิ่งดูเหมือนว่าจะเป็นชาวบ้านมีความรู้ในทางสถิติ (ทางทฤษฎี) ว่านั้น "โดยทั่วไปเหมือนกับ" \ sqrt {2 \ log n}อย่างน้อยที่สุด (ดูคำถามที่เกี่ยวข้องนี้)ZnZnZ_n2 บันทึกn-----√2เข้าสู่ระบบ⁡n\sqrt{2 \log n} อย่างไรก็ตามมีผลลัพธ์ที่เกี่ยวข้องมากมายในประเภทนี้และดูเหมือนว่าเป็นกรณีที่ส่วนใหญ่ไม่เท่ากันหรือบ่งบอกถึงกันและกัน ตัวอย่างเช่น* * * ** * …

1
การใช้ bootstrap เพื่อรับการกระจายตัวตัวอย่างของค่าร้อยละที่ 1
ฉันมีกลุ่มตัวอย่าง (ขนาด 250) จากประชากร ฉันไม่ทราบว่าการกระจายตัวของประชากร คำถามหลัก:ฉันต้องการประมาณจุดของ 1 เซนต์ - เปอร์เซ็นไทล์ของประชากรแล้วฉันต้องการช่วงความมั่นใจ 95% รอบการประเมินจุดของฉัน ประมาณการจุดของฉันจะเป็นตัวอย่าง 1 เซนต์ -percentile ผมหมายถึงมันxxxx หลังจากนั้นฉันพยายามสร้างช่วงความมั่นใจรอบค่าประมาณจุด ฉันสงสัยว่ามันสมเหตุสมผลหรือไม่ที่จะใช้ bootstrap ที่นี่ ฉันไม่มีประสบการณ์มากกับ bootstrap ดังนั้นขออภัยถ้าฉันไม่สามารถใช้คำศัพท์ที่เหมาะสมเป็นต้น นี่คือวิธีที่ฉันพยายามทำ ฉันดึงตัวอย่างสุ่ม 1,000 ตัวอย่างโดยแทนที่จากตัวอย่างดั้งเดิมของฉัน ฉันได้รับอันดับ 1 จากแต่ละคน ดังนั้นฉันมี 1,000 คะแนน - "1 เซนต์ - เปอร์เซ็นไทล์" ฉันดูการกระจายเชิงประจักษ์ของ 1,000 คะแนน ผมหมายถึงความหมายของมัน{} ผมหมายถึงว่า "อคติ" ดังต่อไปนี้: \ฉันใช้เวลา 2.5 วัน -percentile …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.