คำถามติดแท็ก distributions

การแจกแจงเป็นการอธิบายทางคณิตศาสตร์ของความน่าจะเป็นหรือความถี่

2
การวาดตัวอย่างจากการแจกแจงปกติหลายตัวแปรภายใต้ข้อ จำกัด กำลังสอง
ผมอยากจะได้อย่างมีประสิทธิภาพวาดตัวอย่างจากภายใต้ข้อ จำกัด ที่|| x || _2 = 1x∈Rdx∈Rdx \in \mathbb{R}^dN(μ,Σ)N(μ,Σ)\mathcal{N}(\mu, \Sigma)||x||2=1||x||2=1||x||_2 = 1

1
เราสามารถเขียนการแจกแจงเบ้ที่ถูกต้องได้เสมอในแง่ขององค์ประกอบของการแจกแจงโดยพลการและสมมาตรหรือไม่?
พิจารณาละสองครั้งอนุพันธ์และการกระจายสมมาตร\ทีนี้ลองพิจารณาการแจกแจงที่แตกต่างกันสองครั้งที่สอง rigth บิดเบือนในแง่ที่FXFX\mathcal{F}_XFZFZ\mathcal{F}_Z ( 1 )FX⪯คFZ.(1)FX⪯cFZ.(1)\quad\mathcal{F}_X\preceq_c\mathcal{F}_Z. โดยที่⪯ค⪯c\preceq_cเป็นคำสั่งนูนของ van Zwet [0] ดังนั้น( 1 )(1)(1)จึงเท่ากับ: ( 2 )F- 1ZFX( x ) เป็นนูน ∀ x ∈ R(2)FZ−1FX(x) is convex ∀x∈R.(2)\quad F^{-1}_ZF_X(x)\text{ is convex $\forall x\in\mathbb{R}.$} ลองพิจารณาการแจกแจงที่แตกต่างกันสองสามครั้งFYFY\mathcal{F}_Yน่าพอใจ: ( 3 )FY⪯คFZ.(3)FY⪯cFZ.(3)\quad\mathcal{F}_Y\preceq_c\mathcal{F}_Z. คำถามของฉันคือเราสามารถหาการแจกแจงFYFY\mathcal{F}_YและการกระจายแบบสมมาตรFXFX\mathcal{F}_Xเพื่อเขียน\ mathcal {F} _Zใด ๆFZFZ\mathcal{F}_Z (ทั้งสามนิยามไว้ข้างต้น) ในแง่ขององค์ประกอบของFXFX\mathcal{F}_Xและ FYFY\mathcal{F}_Yเป็น: FZ( z) =FYF- 1XFY( z)FZ(z)=FYFX−1FY(z)F_Z(z)=F_YF_X^{-1}F_Y(z) หรือไม่? …

4
การกระจายความน่าจะเป็นโกศเปลี่ยนไปเมื่อคุณดึงออกมาโดยไม่เปลี่ยนค่าเฉลี่ยหรือไม่
สมมติว่าฉันมีโกศที่มีลูกบอลหลากสี N สีและแต่ละสีที่ต่างกันสามารถปรากฏจำนวนครั้งที่แตกต่างกัน (ถ้ามีลูกบอลสีแดง 10 ลูกก็ไม่จำเป็นต้องเป็นลูกบอลสีฟ้า 10 อัน) ถ้าเรารู้เนื้อหาที่แน่นอนของโกศก่อนวาดเราสามารถสร้างการแจกแจงความน่าจะเป็นแบบแยกซึ่งบอกเราถึงความน่าจะเป็นในการวาดลูกบอลแต่ละสี สิ่งที่ฉันสงสัยคือการกระจายตัวเปลี่ยนหลังจากวาดลูก k โดยไม่เปลี่ยนจากโกศโดยเฉลี่ยแล้ว. ฉันเข้าใจว่าเมื่อเราดึงออกมาจากโกศเราสามารถอัปเดตการกระจายด้วยความรู้เกี่ยวกับสิ่งที่ถูกนำออกไป แต่สิ่งที่ฉันอยากรู้คือสิ่งที่เราคาดหวังว่ารูปร่างของการแจกแจงจะเป็นหลังจากที่เราเอาลูก k ออก การกระจายการเปลี่ยนแปลงโดยเฉลี่ยหรือมันยังคงเหมือนเดิมหรือไม่ ถ้ามันไม่เหมือนเดิมเราสามารถเขียนสูตรสำหรับสิ่งที่เราคาดหวังว่าการแจกแจงแบบใหม่จะดูเหมือนโดยเฉลี่ยหลังจากทำการวาด k


2
การรวมกันเชิงเส้นของสองแบบที่ไม่ใช่บรรทัดฐานแบบสุ่มที่ยังคงเป็นสมาชิกของตระกูลเดียวกัน
เป็นที่ทราบกันดีว่าการรวมกันเชิงเส้นของตัวแปรปกติแบบสุ่ม 2 ตัวนั้นก็เป็นตัวแปรแบบสุ่มด้วยเช่นกัน มีตระกูลการแจกจ่ายที่ไม่ธรรมดาทั่วไป (เช่น Weibull) ที่ใช้คุณสมบัตินี้ด้วยหรือไม่ ดูเหมือนจะมีตัวอย่างมากมาย ตัวอย่างเช่นการรวมกันเชิงเส้นของเครื่องแบบมักไม่เหมือนกัน โดยเฉพาะมีตระกูลการกระจายที่ไม่ปกติซึ่งทั้งสองอย่างต่อไปนี้เป็นจริง: การรวมกันเชิงเส้นของตัวแปรสุ่มสองตัวจากตระกูลนั้นเทียบเท่ากับการกระจายตัวบางอย่างในตระกูลนั้น พารามิเตอร์ผลลัพธ์สามารถระบุได้ว่าเป็นฟังก์ชันของพารามิเตอร์ดั้งเดิมและค่าคงที่ในชุดค่าผสมเชิงเส้น ฉันสนใจชุดค่าผสมเชิงเส้นนี้เป็นพิเศษ: Y=X1⋅ w +X2⋅( 1 -W2)-------√Y=X1⋅W+X2⋅(1-W2)Y = X_1 \cdot w + X_2 \cdot \sqrt{(1-w^2)} ที่ไหน X1X1X_1 และ X2X2X_2 ถูกสุ่มตัวอย่างจากบางตระกูลที่ไม่ปกติโดยมีพารามิเตอร์ θ1θ1\theta_1 และ θ2θ2\theta_2และ YYY มาจากตระกูลเดียวกันที่ไม่ปกติพร้อมพารามิเตอร์ θY= f(θ1,θ2, w )θY=ฉ(θ1,θ2,W)\theta_Y = f(\theta_1, \theta_2, w). ฉันกำลังอธิบายตระกูลการแจกจ่ายด้วยพารามิเตอร์ 1 ตัวเพื่อความง่าย แต่ฉันเปิดให้ตระกูลการแจกจ่ายที่มีพารามิเตอร์หลายตัว นอกจากนี้ฉันกำลังมองหาตัวอย่างที่มีพื้นที่พารามิเตอร์มากมาย θ1θ1\theta_1 …

2
ผลการถดถอยมีขอบเขตบนที่ไม่คาดคิด
ฉันพยายามทำนายคะแนนสมดุลและลองวิธีการถดถอยที่แตกต่างกันหลายวิธี สิ่งหนึ่งที่ฉันสังเกตเห็นคือค่าคาดการณ์ดูเหมือนจะมีขอบเขตบนบางอย่าง นั่นคือความสมดุลที่เกิดขึ้นจริงในแต่คาดการณ์ของฉันที่ด้านบนสุดที่ประมาณ0.8พล็อตต่อไปนี้แสดงยอดคงเหลือตามจริงกับยอดคงเหลือที่คาดการณ์ไว้ (ทำนายด้วยการถดถอยเชิงเส้น):[ 0.0 , 1.0 )[0.0,1.0)[0.0, 1.0)0.80.80.8 และนี่คือแผนการแจกแจงสองข้อมูลเดียวกัน: เนื่องจากตัวทำนายของฉันเบ้มาก (ข้อมูลผู้ใช้ที่มีการแจกแจงกฎหมายพลังงาน) ฉันจึงใช้การแปลงแบบบ็อกซ์ค็อกซ์ซึ่งเปลี่ยนผลลัพธ์เป็นต่อไปนี้: แม้ว่ามันจะเปลี่ยนการกระจายตัวของการทำนาย แต่ก็ยังคงมีขอบเขตบน ดังนั้นคำถามของฉันคือ: อะไรคือเหตุผลที่เป็นไปได้สำหรับขอบเขตบนดังกล่าวในผลการทำนาย? ฉันจะแก้ไขการคาดการณ์เพื่อให้สอดคล้องกับการแจกแจงของค่าจริงได้อย่างไร โบนัส:เนื่องจากการกระจายหลังจากแปลงบ็อกซ์ค็อกซ์ดูเหมือนว่าจะเป็นไปตามการกระจายตัวของตัวทำนายที่ถูกแปลงเป็นไปได้หรือไม่ว่ามันเชื่อมโยงโดยตรงหรือไม่ ถ้าเป็นเช่นนั้นจะมีการเปลี่ยนแปลงที่ฉันสามารถนำไปใช้เพื่อให้เหมาะสมกับการกระจายตัวกับค่าจริงหรือไม่? แก้ไข:ฉันใช้การถดถอยเชิงเส้นอย่างง่ายพร้อมตัวทำนาย 5 ตัว

1
ถ้า
นี่คือปัญหาที่เกิดขึ้นในการสอบภาคการศึกษาในมหาวิทยาลัยของเราไม่กี่ปีหลังซึ่งฉันพยายามที่จะแก้ปัญหา ถ้า X1,X2X1,X2X_1,X_2 มีความเป็นอิสระ ββ\beta ตัวแปรสุ่มที่มีความหนาแน่น β(n1,n2)β(n1,n2)\beta(n_1,n_2) และ β(n1+12,n2)β(n1+12,n2)\beta(n_1+\dfrac{1}{2},n_2) ตามลำดับแล้วแสดงว่า X1X2-----√X1X2\sqrt{X_1X_2} ดังต่อไปนี้ β( 2)n1, 2n2)β(2n1,2n2)\beta(2n_1,2n_2). ฉันใช้วิธีจาโคเบียนเพื่อรับความหนาแน่นของ Y=X1X2-----√Y=X1X2Y=\sqrt{X_1X_2} มีดังนี้: ฉY( y) =4Y2n1B (n1,n2) B (n1+12,n2)∫1Y1x2( 1 -x2)n2- 1( 1 -Y2x2)n2- 1dxfY(y)=4y2n1B(n1,n2)B(n1+12,n2)∫y11x2(1−x2)n2−1(1−y2x2)n2−1dxf_Y(y)=\dfrac{4y^{2n_1}}{B(n_1,n_2)B(n_1+\dfrac{1}{2},n_2)}\int_y^1\dfrac{1}{x^2}(1-x^2)^{n_2-1}(1-\dfrac{y^2}{x^2})^{n_2-1}dx ตอนนี้ฉันหลงทางไปแล้ว ตอนนี้ในบทความหลักฉันพบว่ามีการให้คำใบ้ ฉันพยายามใช้คำใบ้ แต่ไม่สามารถรับการแสดงออกที่ต้องการ คำใบ้คือคำต่อคำดังนี้ คำแนะนำ: หาสูตรสำหรับความหนาแน่นของ Y=X1X2-----√Y=X1X2Y=\sqrt{X_1X_2} ในแง่ของความหนาแน่นที่กำหนดของ X1X1X_1 และ X2X2X_2 และลองใช้การเปลี่ยนแปลงของตัวแปรด้วย Z=Y2xz=y2xz=\dfrac{y^2}{x}. ดังนั้น ณ จุดนี้ฉันพยายามใช้ประโยชน์จากคำใบ้นี้โดยพิจารณาการเปลี่ยนแปลงของตัวแปรนี้ ดังนั้นฉันได้รับฉY( y) =4Y2n1B …

1
วิธีการคำนวณฟังก์ชั่นความน่าจะเป็น
อายุการใช้งาน 3 ส่วนอิเล็กทรอนิกส์และ2.1 ตัวแปรสุ่มได้รับการจำลองเป็นตัวอย่างที่สุ่มจากขนาด 3 จากการกระจายชี้แจงกับพารามิเตอร์\ theta ฟังก์ชันความน่าจะเป็นคือสำหรับ\ theta> 0X1= 3 ,X2= 1.5 ,X1=3,X2=1.5,X_{1} = 3, X_{2} = 1.5,X3= 2.1X3=2.1X_{3} = 2.1θθ\thetaθ > 0θ>0\theta > 0 ฉ3( x | θ ) =θ3e x p ( - 6.6 θ )ฉ3(x|θ)=θ3อีxพี(-6.6θ)f_{3}(x|\theta) = \theta^{3} exp(-6.6\theta)ที่x = ( 2 , 1.5 , 2.1 )x=(2,1.5,2.1)x …

2
การสุ่มตัวอย่าง CDF ผกผันสำหรับการแจกแจงแบบผสม
เวอร์ชันย่อที่ไม่อยู่ในบริบท ปล่อยให้เป็นตัวแปรสุ่มด้วย CDF yyyF(⋅)≡{θθ+(1−θ)×CDFlog-normal(⋅;μ,σ) y = 0 y > 0F(⋅)≡{θ y = 0 θ+(1−θ)×CDFlog-normal(⋅;μ,σ) y > 0 F(\cdot) \equiv \cases{\theta & y = 0 \\ \theta + (1-\theta) \times \text{CDF}_{\text{log-normal}}(\cdot; \mu, \sigma) & y > 0} สมมติว่าฉันต้องการจำลองการจับด้วยวิธี inverse CDF เป็นไปได้ไหม ฟังก์ชั่นนี้ไม่ได้มีสิ่งที่ตรงกันข้าม จากนั้นอีกครั้งมีการสุ่มตัวอย่างการแปลงผกผันสำหรับการกระจายการผสมของการแจกแจงปกติสองรายการซึ่งแสดงให้เห็นว่ามีวิธีที่รู้จักในการใช้การสุ่มตัวอย่างการแปลงผกผันที่นี่yyy ฉันทราบวิธีสองขั้นตอน แต่ฉันไม่ทราบวิธีนำไปใช้กับสถานการณ์ของฉัน (ดูด้านล่าง) รุ่นยาวที่มีพื้นหลัง ฉันติดตั้งโมเดลต่อไปนี้สำหรับการตอบสนองที่มีค่าเวกเตอร์โดยใช้ MCMC (โดยเฉพาะสแตน):yi=(y1,…,yK)iyi=(y1,…,yK)iy^i = …

4
วิธีสุ่มตัวอย่างเมื่อคุณไม่รู้การกระจาย
ฉันค่อนข้างใหม่กับสถิติ (หยิบของหลักสูตร Uni ระดับเริ่มต้น) และสงสัยเกี่ยวกับการสุ่มตัวอย่างจากการแจกแจงที่ไม่รู้จัก โดยเฉพาะถ้าคุณไม่มีความคิดเกี่ยวกับการแจกแจงพื้นฐานมีวิธีใดที่จะ "รับประกัน" ว่าคุณได้รับตัวอย่างตัวแทนหรือไม่? ตัวอย่างเพื่ออธิบาย: สมมติว่าคุณพยายามเข้าใจการกระจายความมั่งคั่งทั่วโลก สำหรับบุคคลใดก็ตามคุณสามารถค้นหาความมั่งคั่งที่แน่นอนของพวกเขา; แต่คุณไม่สามารถ "ตัวอย่าง" ทุกคนบนโลกนี้ได้ สมมุติว่าคุณสุ่มตัวอย่าง n = 1,000 คนโดยการสุ่ม หากตัวอย่างของคุณไม่รวม Bill Gates คุณอาจคิดว่าไม่มีเศรษฐีพันล้านคน หากคุณมีตัวอย่างรวมถึง Bill Gates คุณอาจคิดว่าเศรษฐีมีเงินมากกว่าที่เป็นอยู่จริง ไม่ว่าในกรณีใดคุณไม่สามารถบอกได้ว่าเศรษฐีทั่วไปหรือหายากเป็นอย่างไร คุณอาจไม่สามารถบอกได้ว่ามีอยู่จริงหรือไม่ มีกลไกการสุ่มตัวอย่างที่ดีกว่าสำหรับกรณีเช่นนี้หรือไม่? คุณจะบอกขั้นตอนเบื้องต้นในการใช้ตัวอย่าง (และจำเป็นต้องมีตัวอย่างจำนวนเท่าใด) ฉันคิดว่าคุณอาจจะต้อง "สุ่มตัวอย่าง" เปอร์เซ็นต์ของประชากรจำนวนมากที่จะรู้ว่ามีอะไรเข้าใกล้ความเชื่อมั่นที่สมเหตุสมผลว่าเศรษฐีทั่วไปหรือหายากอยู่บนโลกและสิ่งนี้เกิดจากการกระจายตัวของพื้นฐานค่อนข้างยาก ที่จะทำงานกับ

1
การกระจายรุ่นใดที่จะใช้ในการอ่านหน้าเว็บโมเดล?
ฉันมีฟังก์ชั่นที่คืนค่าเวลารอโดยเฉลี่ยสำหรับผู้ใช้เว็บ กล่าวคือมันให้เวลาเฉลี่ยที่ผู้ใช้โดยเฉลี่ยอาจอยู่ในหน้าเว็บโดยให้ความยาวของทรัพยากรเว็บเป็นคำ ฉันต้องการใช้ฟังก์ชั่นนี้ (และค่าเฉลี่ยที่เกิดขึ้น) ร่วมกับการแจกจ่ายเพื่อวางโมเดล 'ผู้ใช้เว็บเฉลี่ย' เรียกดูเว็บ การกระจายแบบใดที่เหมาะสมสำหรับเรื่องนี้และเพราะอะไร แก้ไข: ฉันต้องการทราบความสามารถในการใช้การแจกแจงเอ็กซ์โปเนนเชียลเพื่อวัตถุประสงค์นี้โดยเฉพาะ ขอบคุณ

3
ถ้า ,
สมมติต่อไปนี้การตั้งค่า: Let Zi=min{ki,Xi},i=1,...,nZi=min{ki,Xi},i=1,...,nZ_i = \min\{k_i, X_i\}, i=1,...,n n นอกจากนี้Xi∼U[ai,bi],ai,bi>0Xi∼U[ai,bi],ai,bi>0X_i \sim U[a_i, b_i], \; a_i, b_i >0 0 นอกจากนี้ki=cai+(1−c)bi,0<c<1ki=cai+(1−c)bi,0<c<1k_i = ca_i + (1-c)b_i,\;\; 0 k_i) = 1- \Pr(X_i \le k_i) =1−ki−aibi−ai=1−(1−c)(bi−ai)bi−ai=c=1−ki−aibi−ai=1−(1−c)(bi−ai)bi−ai=c= 1- \frac {k_i - a_i}{b_i-a_i} = 1-\frac {(1-c)(b_i-a_i)}{b_i-a_i} =c ดังนั้นใน FZi(zi)=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪0zi<aizi−aibi−aiai≤zi<ki1ki≤ziFZi(zi)={0zi<aizi−aibi−aiai≤zi<ki1ki≤ziF_{Z_i}(z_i) = \begin{cases} 0\qquad z_i0ที่zi=kizi=kiz_i = k_ik_i โดยรวมแล้วจะรวมกันเป็นหนึ่งเดียวกับ reals ฉันต้องการที่จะสามารถที่จะได้รับหรือพูดอะไรเกี่ยวกับการจัดจำหน่ายและ …

1
เงื่อนไขแบบเต็มสามารถกำหนดการกระจายข้อต่อได้หรือไม่?
ฉันได้ยินมาว่าเงื่อนไขทั้งหมด (ตามที่ใช้ในการสุ่มตัวอย่างกิ๊บส์) สามารถกำหนดการกระจายข้อต่อได้ แต่ฉันไม่เข้าใจว่าทำไมและอย่างไร หรือว่าฉันเข้าใจผิด? ขอบคุณ!

1
สามารถใช้ bootstrap resampling ใหม่เพื่อคำนวณช่วงความมั่นใจสำหรับความแปรปรวนของชุดข้อมูลได้หรือไม่?
ฉันรู้ว่าถ้าคุณสุ่มตัวอย่างจากชุดข้อมูลซ้ำหลาย ๆ ครั้งและคำนวณค่าเฉลี่ยในแต่ละครั้งค่าเฉลี่ยเหล่านี้จะเป็นไปตามการแจกแจงแบบปกติ (โดย CLT) ดังนั้นคุณสามารถคำนวณช่วงความมั่นใจในค่าเฉลี่ยของชุดข้อมูลได้โดยไม่ต้องทำการตั้งสมมติฐานใด ๆ เกี่ยวกับการแจกแจงความน่าจะเป็นของชุดข้อมูล ฉันสงสัยว่าถ้าคุณสามารถทำสิ่งที่คล้ายกันกับความแปรปรวน นั่นคือถ้าฉันต้องสุ่มตัวอย่างใหม่จากชุดข้อมูลหลาย ๆ ครั้งและคำนวณความแปรปรวนในแต่ละครั้งความแปรปรวนเหล่านี้จะเป็นไปตามการแจกแจงที่แน่นอน (ไม่ว่าการแจกแจงความน่าจะเป็นดั้งเดิมของชุดข้อมูลนั้นคืออะไร) ฉันรู้ว่าถ้าชุดข้อมูลดั้งเดิมนั้นเป็นเรื่องปกติความแปรปรวนจะเป็นไปตามการแจกแจงแบบไคสแควร์ แต่ในกรณีที่มันไม่ปกติ

2
ความหมายของการแสดง simplex เป็นพื้นผิวรูปสามเหลี่ยมในการแจกแจง Dirichlet คืออะไร?
ฉันกำลังอ่านจากหนังสือที่แนะนำการแจกแจง Dirchilet แล้วนำเสนอตัวเลขเกี่ยวกับมัน แต่ฉันไม่สามารถเข้าใจตัวเลขเหล่านั้นได้ ฉันแนบรูปที่นี่ที่ด้านล่าง สิ่งที่ฉันไม่เข้าใจคือความหมายของสามเหลี่ยม โดยปกติเมื่อเราต้องการพล็อตฟังก์ชั่นของตัวแปร 2 ตัวคุณใช้ค่าของ var1 และ va2 จากนั้นพล็อตค่าของฟังก์ชั่นค่าของตัวแปรสองตัวนั้น ... ซึ่งให้การสร้างภาพข้อมูลในมิติสามมิติ แต่ที่นี่มี 3 มิติและอีกหนึ่งค่าสำหรับค่าฟังก์ชั่นดังนั้นมันจึงสร้างภาพในพื้นที่ 4D ฉันไม่เข้าใจตัวเลขเหล่านั้น! ฉันหวังว่าบางคนสามารถชี้แจงได้โปรด! แก้ไข: นี่คือสิ่งที่ฉันไม่เข้าใจจากรูปที่ 2.14 ก ดังนั้นเราได้วาดจาก K = 3 dirichlet ตัวอย่างทีต้า (ซึ่งโดยทั่วไปคือเวกเตอร์) นั่นคือ: theta = [theta1, theta2, theta3] สามเหลี่ยมแปลง [theta1, theta2, theta3] ระยะทางจากจุดเริ่มต้นไปยังแต่ละ theta_i คือค่าของ theta_i จากนั้นสำหรับ theta_i แต่ละอันให้ใส่จุดยอดและเชื่อมต่อจุดยอดทั้งสามและทำรูปสามเหลี่ยม ฉันรู้ว่าถ้าฉันเสียบ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.