คำถามติดแท็ก order-statistics

สถิติการสั่งซื้อของตัวอย่างคือค่าที่เรียงลำดับจากน้อยไปมาก สถิติลำดับที่ i ของตัวอย่างทางสถิติเท่ากับค่าที่น้อยที่สุดที่ i ดังนั้นค่าต่ำสุดของตัวอย่างคือสถิติลำดับแรกและค่าสูงสุดของตัวอย่างคือค่าสุดท้าย บางครั้ง "สถิติการสั่งซื้อ" ถูกใช้เพื่อหมายถึงชุดสถิติคำสั่งทั้งหมดนั่นคือค่าข้อมูลที่ไม่คำนึงถึงลำดับที่เกิดขึ้น ใช้สำหรับปริมาณที่เกี่ยวข้องเช่นระยะห่าง

2
การแปลงสถิติคำสั่งซื้อ
สมมติว่าตัวแปรสุ่มและเป็นอิสระและกระจาย แสดงว่ามี\ การแจกแจงข้อความ {Exp} (1)X1, . . . ,XnX1,...,XnX_1, ... , X_nY1, . . . ,YnY1,...,YnY_1, ..., Y_nยู( 0 , a )ยู(0,a)U(0,a)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))Zn=nlog⁡max(Y(n),X(n))min(Y(n),X(n))Z_n= n\log\frac{\max(Y_{(n)},X_{(n)})}{\min(Y_{(n)},X_{(n)})}Exp(1)Exp(1)\text{Exp}(1) ฉันได้เริ่มต้นปัญหานี้ด้วยการตั้งค่า{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}\{X_1,...,X_n,Y_1,...Y_n\} = \{Z_1,...,Z_n\}แล้วmax(Yn,Xn)=Z(2n)max(Yn,Xn)=Z(2n)\max(Y_n,X_n)= Z_{(2n)}จะกระจายเป็น(za)2n(za)2n(\frac{z}{a})^{2n}และmin(Yn,Xn)=Z(1)min(Yn,Xn)=Z(1)\min(Y_n,X_n)= Z_{(1)}จะกระจายเป็น1−(1−za)2n1−(1−za)2n1 - (1 - \frac{z}{a})^{2n} ความหนาแน่นสามารถพบได้ง่ายเหมือนกับfZ1(z)=(2n)(1−za)2n−11afZ1(z)=(2n)(1−za)2n−11af_{Z_{1}}(z) = (2n)(1-\frac{z}{a})^{2n-1}\frac{1}{a}และfZ(2n)(z)=(2n)(za)2n−11afZ(2n)(z)=(2n)(za)2n−11af_{Z_{(2n)}}(z) = (2n)(\frac{z}{a})^{2n-1} \frac{1}{a} นี่คือที่ฉันมีเวลายากที่จะรู้ว่าจะไปที่ไหนต่อไปตอนนี้สิ่งเหล่านี้จะถูกคำนวณ ฉันคิดว่ามันต้องทำอะไรบางอย่างกับการเปลี่ยนแปลง แต่ฉันไม่แน่ใจ ...

1
ค่าสถิติเชิงลำดับของการแจกแจงแบบเทลด์หนัก
พื้นหลัง: ฉันมีตัวอย่างที่ฉันต้องการสร้างแบบจำลองที่มีการกระจายแบบเทลด์อย่างหนัก ฉันมีค่ามากเช่นการแพร่กระจายของการสังเกตมีขนาดค่อนข้างใหญ่ ความคิดของฉันคือทำแบบนี้ด้วยการแจกแจงแบบพาเรโตทั่วไปและฉันก็ทำไปแล้ว ตอนนี้ quantile 0.975 ของข้อมูลเชิงประจักษ์ของฉัน (ประมาณ 100 datapoints) ต่ำกว่า 0.975 quantile ของการแจกแจง Generalized Pareto ที่ฉันพอดีกับข้อมูลของฉัน ตอนนี้ฉันคิดว่ามีวิธีตรวจสอบว่าความแตกต่างนี้เป็นสิ่งที่ต้องกังวลหรือไม่ เรารู้ว่าการแจกแจงเชิงเส้นกำกับของควอนไทล์จะได้รับเป็น: ดังนั้นฉันจึงคิดว่ามันเป็นความคิดที่ดีที่จะสร้างความบันเทิงด้วยความอยากรู้อยากเห็นของฉันโดยพยายามพล็อตแถบความเชื่อมั่น 95% รอบ ๆ 0.975 ควอไทล์ของการแจกแจงแบบพาเรโตทั่วไปด้วยพารามิเตอร์เดียวกับที่ฉันได้รับ อย่างที่คุณเห็นเรากำลังทำงานกับค่าที่สุดยอดบางอย่างที่นี่ และเนื่องจากการแพร่กระจายมีขนาดใหญ่มากฟังก์ชั่นความหนาแน่นมีค่าน้อยมากทำให้วงความเชื่อมั่นไปที่คำสั่งของโดยใช้ความแปรปรวนของสูตรเชิงบรรทัดฐานเชิงเส้นกำกับด้านบน:±1012±1012\pm 10^{12} ± 1.960.975 ∗ 0.025n (ฉจีพีD(Q0.975))2±1.960.975* * * *0.025n(ฉGPD(Q0.975))2\pm 1.96\frac{0.975*0.025}{n({f_{GPD}(q_{0.975})})^2} ดังนั้นนี่ไม่สมเหตุสมผลเลย ฉันมีการแจกจ่ายที่มีผลลัพธ์เชิงบวกเท่านั้นและช่วงความมั่นใจรวมถึงค่าลบ มีบางอย่างเกิดขึ้นที่นี่ ถ้าผมคำนวณวงรอบ 0.5 quantile, วงดนตรีที่จะไม่ว่าขนาดใหญ่ แต่ยังคงขนาดใหญ่ ผมดำเนินการต่อเพื่อดูวิธีการนี้ไปกับการกระจายอีกคือกระจาย จำลองการสังเกตจากการแจกแจงและตรวจสอบว่า quantiles อยู่ในช่วงความเชื่อมั่นหรือไม่ …

1
ค่าที่คาดหวังของสถิติการสั่งซื้อขั้นต่ำจากตัวอย่างปกติ
อัพเดท 25 มกราคม 2014: ความผิดพลาดได้รับการแก้ไขแล้ว โปรดเพิกเฉยค่าที่คำนวณได้ของค่าที่คาดหวังในภาพที่อัปโหลด - มันผิด - ฉันไม่ลบภาพเพราะมันได้สร้างคำตอบให้กับคำถามนี้ อัพเดท 10 มกราคม 2014: พบข้อผิดพลาด - พิมพ์ผิดทางคณิตศาสตร์ในหนึ่งในแหล่งที่ใช้ กำลังเตรียมการแก้ไข ... ความหนาแน่นของสถิติการสั่งซื้อขั้นต่ำจากการรวบรวมตัวแปรสุ่มแบบต่อเนื่อง iid ด้วย cdfและ pdfคือ nnnFX(x)FX(x)F_X(x)fX(x)fX(x)f_X(x)fX(1)(x(1))=nfX(x(1))[1−FX(x(1))]n−1[1]fX(1)(x(1))=nfX(x(1))[1−FX(x(1))]n−1[1]f_{X_{(1)}}(x_{(1)}) = nf_X(x_{(1)})\left[1-F_X(x_{(1)})\right]^{n-1} \qquad [1] หากตัวแปรสุ่มเหล่านี้เป็นมาตรฐานปกติแล้ว fX(1)(x(1))=nϕ(x(1))[1−Φ(x(1))]n−1=nϕ(x(1))[Φ(−x(1))]n−1[2]fX(1)(x(1))=nϕ(x(1))[1−Φ(x(1))]n−1=nϕ(x(1))[Φ(−x(1))]n−1[2]f_{X_{(1)}}(x_{(1)}) = n\phi(x_{(1)})\left[1-\Phi(x_{(1)})\right]^{n-1} = n\phi(x_{(1)})\left[\Phi(-x_{(1)})\right]^{n-1}\qquad [2] ดังนั้นค่าที่คาดหวังคือ E(X(1))=n∫∞−∞x(1)ϕ(x(1))[Φ(−x(1))]n−1dx(1)[3]E(X(1))=n∫−∞∞x(1)ϕ(x(1))[Φ(−x(1))]n−1dx(1)[3]E\left(X_{(1)}\right) = n\int_{-\infty}^{\infty}x_{(1)}\phi(x_{(1)})\left[\Phi(-x_{(1)})\right]^{n-1}dx_{(1)}\qquad [3] ที่เราได้ใช้คุณสมบัติสมมาตรของมาตรฐานปกติ ในโอเวน 1980 , p.402, eq. [ n, 011 …

1
วิธีการคำนวณ
ฉันพยายามที่จะแก้ปัญหาสำหรับวิทยานิพนธ์ของฉันและฉันไม่เห็นวิธีที่จะทำ ฉันมีการสังเกต 4 ครั้งสุ่มจากการแจกแจงแบบสม่ำเสมอฉันต้องการที่จะคำนวณความน่าจะเป็นที่{(3)} เป็นสถิติลำดับที่หนึ่ง (ฉันรับสถิติการสั่งซื้อเพื่อให้การสังเกตของฉันถูกจัดอันดับจากน้อยที่สุดไปหามากที่สุด) ฉันได้แก้ไขมันเพื่อกรณีที่ง่ายกว่า แต่ที่นี่ฉันหลงทางไปแล้วว่าจะทำอย่างไร(0,1)(0,1)(0,1)3X(1)≥X(2)+X(3)3X(1)≥X(2)+X(3)3 X_{(1)}\ge X_{(2)}+X_{(3)}X(i)X(i)X_{(i)} ยินดีต้อนรับทุกความช่วยเหลือ

2
การกระจายของชิ้นส่วน 'ไม่ได้ผสม' ตามคำสั่งของการผสม
สมมติว่าฉันได้จับคู่ข้อสังเกตวาด iid เป็น Xผม∼ N( 0 ,σ2x) ,Yผม∼ N( 0 ,σ2Y) ,Xผม~ยังไม่มีข้อความ(0,σx2),Yผม~ยังไม่มีข้อความ(0,σY2),X_i \sim \mathcal{N}\left(0,\sigma_x^2\right), Y_i \sim \mathcal{N}\left(0,\sigma_y^2\right), สำหรับ i = 1 , 2 , … , nผม=1,2,...,ni=1,2,\ldots,n. ปล่อยZผม=Xผม+Yผม,Zผม=Xผม+Yผม,Z_i = X_i + Y_i, และแสดงโดย ZผมJZผมJZ_{i_j} JJjค่าที่สังเกตได้มากที่สุดคือ ZZZ. การกระจาย (เงื่อนไข) ของคืออะไรXผมJXผมJX_{i_j}? (หรือเทียบเท่าจากYผมJYผมJY_{i_j}) นั่นคืออะไรคือการกระจายตัวของ XผมXผมX_i เงื่อนไข ZผมZผมZ_i เป็น JJjที่ใหญ่ที่สุดของ nnn ค่าสังเกตของ ZZZ? ฉันเดาว่าเป็น …

4
วิธีการทดสอบไคสแควร์หลังการทดสอบหลายตารางในตาราง 2 X 3
ชุดข้อมูลของฉันประกอบด้วยการเสียชีวิตโดยรวมหรือการอยู่รอดของสิ่งมีชีวิตที่ไซต์สามประเภททั้งฝั่งกลางและกลาง ตัวเลขในตารางด้านล่างแสดงถึงจำนวนเว็บไซต์ 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 ฉันต้องการทราบว่า # ของเว็บไซต์ที่มีอัตราการตาย 100% มีความสำคัญตามประเภทของไซต์หรือไม่ ถ้าฉันใช้ไคสแควร์ 2 x 3 ฉันจะได้ผลลัพธ์ที่สำคัญ มีการเปรียบเทียบแบบคู่หลังที่ฉันสามารถเรียกใช้หรือฉันควรใช้ ANOVA จิสติกส์หรือการถดถอยด้วยการแจกแจงแบบทวินามหรือไม่ ขอบคุณ!
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.