คำถามติดแท็ก probability

ความน่าจะเป็นให้คำอธิบายเชิงปริมาณของเหตุการณ์ที่เกิดขึ้นโดยเฉพาะ

1
การสร้างกราฟเส้นโค้งความน่าจะเป็นสำหรับโมเดล Logit พร้อมตัวทำนายหลายตัว
ฉันมีฟังก์ชั่นความน่าจะเป็นดังต่อไปนี้: Prob=11+e−zProb=11+e−z\text{Prob} = \frac{1}{1 + e^{-z}} ที่ไหน z=B0+B1X1+⋯+BnXn.z=B0+B1X1+⋯+BnXn.z = B_0 + B_1X_1 + \dots + B_nX_n. แบบจำลองของฉันดูเหมือน Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)])Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(bid)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid})]\right)} สิ่งนี้ถูกมองเห็นผ่านเส้นโค้งความน่าจะเป็นซึ่งดูเหมือนกับด้านล่าง ฉันกำลังพิจารณาเพิ่มตัวแปรสองตัวในสมการการถดถอยเดิมของฉัน สมมติว่าฉันเพิ่มเพศ (หมวดหมู่: F และ M) และอายุ (หมวดหมู่: <25 และ> 26) ลงในโมเดลฉันท้ายด้วย: Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)+0.25×(gender)+0.15×(age)])Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(bid)+0.25×(gender)+0.15×(age)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid}) + 0.25\times(\text{gender}) + 0.15\times(\text{age})]\right)} ใน RI …

1
การสลายตัวของการแจกแจงแบบปกติ
มีการแจกแจงเชิงบวกอย่างเดียวหรือไม่ว่าความแตกต่างของตัวอย่างอิสระสองรายการจากการแจกแจงนี้กระจายตามปกติหรือไม่? ถ้าเป็นเช่นนั้นจะมีรูปแบบที่เรียบง่ายหรือไม่?

2
ตัวประมาณค่าเป็นกลางของเลขชี้กำลังของการวัดชุด?
สมมติว่าเรามี (ที่วัดได้และเหมาะสมมีความประพฤติดี) ชุดที่มีขนาดกะทัดรัด นอกจากนี้สมมติว่าเราสามารถวาดตัวอย่างจากการกระจายชุดมากกว่า wrt เกอวัดและที่เรารู้ว่าวัด(B) เช่นบางทีBเป็นกล่อง[ - C , C ] nมีSS⊆B⊂RnS⊆B⊂RnS\subseteq B\subset\mathbb R^nBBBBBBλ(⋅)λ(⋅)\lambda(\cdot)λ(B)λ(B)\lambda(B)BBB[−c,c]n[−c,c]n[-c,c]^nSSS สำหรับการแก้ไขα∈Rα∈R\alpha\in\mathbb Rจะมีวิธีการที่เป็นกลางที่เรียบง่ายในการประมาณการe−αλ(S)e−αλ(S)e^{-\alpha \lambda(S)}โดยสม่ำเสมอสุ่มตัวอย่างในจุดBBBและการตรวจสอบหากพวกเขาเป็นภายในหรือภายนอกของSSS ? เป็นตัวอย่างของบางสิ่งบางอย่างที่ไม่ได้ทำงานค่อนข้างสมมติว่าเราตัวอย่างkkkจุดp1,…,pk∼Uniform(B)p1,…,pk∼Uniform(B)p_1,\ldots,p_k\sim\textrm{Uniform}(B) ) แล้วเราสามารถใช้การประมาณการ Monte Carlo λ(S)≈λ^:=#{pi∈S}kλ(B).λ(S)≈λ^:=#{pi∈S}kλ(B).\lambda(S)\approx \hat\lambda:= \frac{\#\{p_i\in S\}}{k}\lambda(B). แต่ในขณะที่ λเป็นประมาณการที่เป็นกลางของλ(S)ผมไม่คิดว่ามันเป็นกรณีที่อี-อัลฟ่า λเป็นประมาณการที่เป็นกลางของอี-อัลฟ่าλ(S) มีวิธีแก้ไขอัลกอริทึมนี้ไหม?λ^λ^\hat\lambdaλ(S)λ(S)\lambda(S)e−αλ^e−αλ^e^{-\alpha\hat\lambda}e−αλ(S)e−αλ(S)e^{-\alpha\lambda(S)}

5
เป็นไปได้ว่าตัวแปรสุ่มสองตัวจากตระกูลการแจกจ่ายเดียวกันมีความคาดหวังและความแปรปรวนเหมือนกัน แต่ช่วงเวลาที่สูงกว่าต่างกันหรือไม่
ฉันกำลังคิดถึงความหมายของครอบครัวในระดับตำแหน่ง ความเข้าใจของฉันคือสำหรับสมาชิกทุกคนในตระกูลมาตราส่วนตำแหน่งที่ตั้งที่มีพารามิเตอร์ตำแหน่งและมาตราส่วนจากนั้นการกระจายของไม่ขึ้นอยู่กับพารามิเตอร์ใด ๆ และมันก็เหมือนกันสำหรับทุกที่เป็นของตระกูลนั้นXXXaaabbbZ=(X- a ) / bZ=(X−a)/bZ =(X-a)/bXXX ดังนั้นคำถามของฉันคือคุณสามารถให้ตัวอย่างที่สุ่มสองตัวจากตระกูลการแจกจ่ายเดียวกันเป็นมาตรฐาน แต่ไม่ส่งผลให้ตัวแปรสุ่มที่มีการแจกแจงแบบเดียวกันได้หรือไม่ พูดว่าและมาจากตระกูลการแจกจ่ายเดียวกัน (โดยที่ครอบครัวฉันหมายถึงตัวอย่างเช่น Normal หรือ Gamma และอื่น ๆ .. ) กำหนด:XXXYYY Z1=X-μσZ1=X−μσZ_1 = \dfrac{X-\mu}{\sigma} Z2=Y-μσZ2=Y−μσZ_2 = \dfrac{Y-\mu}{\sigma} เรารู้ว่าทั้งสองและมีความคาดหวังเหมือนกันและแปรปรวน 1Z1Z1Z_1Z2Z2Z_2μZ= 0 , σ2Z= 1μZ=0,σZ2=1\mu_Z =0, \sigma^2_Z =1 แต่พวกเขาสามารถมีช่วงเวลาที่สูงขึ้นแตกต่างกันได้หรือไม่ ความพยายามของฉันที่จะตอบคำถามนี้คือถ้าการแจกแจงของและขึ้นอยู่กับพารามิเตอร์มากกว่า 2 ตัว และฉันกำลังคิดถึง general ทั่วไปที่มี 3 พารามิเตอร์XXXYYYt - s t ude n …

2
การกระจายเบต้าเมื่อพลิกเหรียญ
หนังสือ Bayesian ของ Kruschke กล่าวว่าเกี่ยวกับการใช้การแจกแจงเบต้าสำหรับการพลิกเหรียญ ตัวอย่างเช่นหากเราไม่มีความรู้มาก่อนนอกจากความรู้ที่ว่าเหรียญมีด้านหัวและด้านท้ายนั่นเท่ากับการสังเกตก่อนหน้านี้หนึ่งหัวและหนึ่งหางซึ่งสอดคล้องกับ a = 1 และ b = 1 ทำไมไม่มีข้อมูลใดเท่ากับการได้เห็นหัวหนึ่งและหนึ่งหาง - 0 หัวและ 0 หางดูเหมือนเป็นธรรมชาติสำหรับฉัน

1
ตัวอย่างที่ใช้งานง่ายของการสุ่มตัวอย่างที่สำคัญ
พื้นหลังของฉันคือวิทยาศาสตร์คอมพิวเตอร์ ฉันค่อนข้างใหม่สำหรับวิธีการสุ่มตัวอย่าง monte carlo และแม้ว่าฉันจะเข้าใจคณิตศาสตร์ฉันมีเวลายากลำบากในการหาตัวอย่างที่ใช้งานง่ายสำหรับการสุ่มตัวอย่างที่สำคัญ แม่นยำยิ่งขึ้นใครบางคนสามารถให้ตัวอย่างของ: การแจกแจงเริ่มต้นหนึ่งไม่สามารถสุ่มตัวอย่างได้ แต่สามารถประมาณได้ การแจกแจงที่สำคัญซึ่งสามารถสุ่มตัวอย่างและเพียงพอสำหรับการแจกแจงเริ่มต้นนี้

1
เงื่อนไขที่จำเป็นและเพียงพอในการร่วม MGF เพื่อความเป็นอิสระ
สมมติว่าฉันมีร่วมฟังก์ชั่นช่วงเวลาที่สร้างสำหรับการจัดจำหน่ายร่วมกับ CDFy) คือทั้งที่จำเป็นและเพียงพอเงื่อนไขในการเป็นอิสระของและ ? ฉันตรวจสอบหนังสือสองเล่มซึ่งกล่าวถึงความจำเป็นเท่านั้น:F X , Y ( x , y ) M X , Y ( s , t ) = M X , Y ( s , 0 ) ⋅ M X , Y ( 0 , t )MX,Y(s,t)MX,Y(s,t)M_{X,Y}(s,t)FX,Y(x,y)FX,Y(x,y)F_{X,Y}(x,y)MX, วาย( s , t ) = MX, วาย( …

1
การแจกแจงแบบใดที่ไม่สัมพันธ์กันแสดงถึงความเป็นอิสระ?
การเตือนความทรงจำที่มีเกียรติในสถิติคือ "ความสัมพันธ์ไม่ได้หมายถึงความเป็นอิสระ" โดยปกติการแจ้งเตือนนี้จะเสริมด้วยคำสั่งที่ผ่อนคลายทางจิตวิทยา (และถูกต้องทางวิทยาศาสตร์) "เมื่อ แต่อย่างไรก็ตามทั้งสองตัวแปรมีการกระจายตามปกติร่วมกันแล้ว uncorrelatedness หมายถึงความเป็นอิสระ" ฉันสามารถเพิ่มจำนวนข้อยกเว้นที่มีความสุขจากหนึ่งเป็นสอง: เมื่อตัวแปรสองตัวถูกแจกจ่ายโดยBernoulliจากนั้นอีกครั้งความไม่สัมพันธ์กันหมายถึงความเป็นอิสระ ถ้าและเป็นสอง Bermoulli rv's,ซึ่งเรามีและคล้ายคลึงกับความแปรปรวนร่วมของพวกมันคือXXXYYYX∼ B ( qx) ,Y∼ B ( qY)X~B(Qx),Y~B(QY)X \sim B(q_x),\; Y \sim B(q_y)P( X= 1 ) = E( X) = qxP(X=1)=E(X)=QxP(X=1) = E(X) = q_xYYY Cov( X, วาย) = E( XY) - E( X) E( Y) = ∑SXYp …

2
MCMC ที่เติมเต็มด้วยความสมดุลโดยละเอียดทำให้การกระจายแบบอยู่กับที่หรือไม่?
ฉันเดาว่าฉันเข้าใจสมการของเงื่อนไขสมดุลโดยละเอียดซึ่งระบุว่าสำหรับความเป็นไปได้ในการเปลี่ยนแปลงและการแจกแจงแบบคงที่ , ห่วงโซ่มาร์คอฟตอบสนองความสมดุลโดยละเอียดถ้าπ q ( x | y ) π ( y ) = q ( y | x ) π ( x ) ,qqqππ\piq(x|y)π(y)=q(y|x)π(x),q(x|y)π(y)=q(y|x)π(x),q(x|y)\pi(y)=q(y|x)\pi(x), ทำให้ฉันมีเหตุผลมากขึ้นถ้าฉันย้ำเป็น: q(x|y)q(y|x)=π(x)π(y).q(x|y)q(y|x)=π(x)π(y).\frac{q(x|y)}{q(y|x)}= \frac{\pi(x)}{\pi(y)}. โดยทั่วไปความน่าจะเป็นของการเปลี่ยนจากสถานะเป็นสถานะควรเป็นสัดส่วนกับอัตราส่วนของความหนาแน่นของความน่าจะเป็นyxxxyyy

5
ช่วงความเชื่อมั่นและความน่าจะเป็น - ข้อผิดพลาดในคำสั่งนี้อยู่ที่ไหน?
หากมีคนทำคำสั่งเช่นด้านล่าง: "โดยรวมผู้ที่ไม่สูบบุหรี่ที่สัมผัสกับควันสิ่งแวดล้อมมีความเสี่ยงสัมพัทธ์ของโรคหลอดเลือดหัวใจที่ 1.25 (ช่วงความเชื่อมั่น 95 เปอร์เซ็นต์, 1.17-1.32) เมื่อเทียบกับผู้สูบบุหรี่ที่ไม่ได้สัมผัสกับควัน" อะไรคือความเสี่ยงสัมพัทธ์ของประชากรโดยรวม? สิ่งที่เกี่ยวข้องกับโรคหลอดเลือดหัวใจ? ในหลาย ๆ สิ่งที่สามารถทดสอบได้มีเพียงไม่กี่คนเท่านั้นที่เชื่อมโยงกับโรคหลอดเลือดหัวใจดังนั้นโอกาสที่สิ่งใดก็ตามที่ถูกเลือกแบบสุ่มนั้นเชื่อมต่อกันจะหายไป ดังนั้นเราจึงสามารถพูดได้ว่าความเสี่ยงสัมพัทธ์สำหรับประชากรคือ 1 แต่ช่วงเวลาที่ยกมาไม่มีค่า 1 ดังนั้นอย่างใดอย่างหนึ่งมีการเชื่อมต่อระหว่างสองสิ่งความน่าจะเป็นที่มีขนาดเล็กหายไปหรือนี่คือหนึ่งใน 5% ของช่วงเวลาที่ไม่มีพารามิเตอร์ ในฐานะที่เป็นหลังมีโอกาสมากขึ้นกว่าในอดีตมันเป็นสิ่งที่เราควรคิด ดังนั้นข้อสรุปที่เหมาะสมคือชุดข้อมูลเกือบผิดปกติของประชากร แน่นอนถ้ามีพื้นฐานบางอย่างที่สมมติว่ามากกว่า 5% ของสิ่งต่าง ๆ เชื่อมโยงกับโรคหลอดเลือดหัวใจอาจมีหลักฐานบางอย่างในสถิติเพื่อสนับสนุนข้อเสนอแนะว่าควันสิ่งแวดล้อมเป็นหนึ่งในนั้น สามัญสำนึกแนะนำว่าสิ่งนี้ไม่น่าเป็นไปได้ อะไรคือข้อผิดพลาดในการใช้เหตุผลของพวกเขา (เนื่องจากองค์กรด้านสุขภาพทั้งหมดเห็นด้วยว่ามีวรรณกรรมสำคัญเกี่ยวกับผลกระทบที่เป็นอันตรายจากการสูบบุหรี่มือสอง) เป็นเพราะหลักฐานของพวกเขาที่ว่า "ในจำนวนที่มากของสิ่งที่สามารถทดสอบได้จริง ๆ น้อยมากที่เชื่อมต่อกับโรคหลอดเลือดหัวใจ"? ประโยคนี้อาจเป็นจริงสำหรับปัจจัยที่สุ่มเลือกใด ๆ (เช่นจำนวนสุนัขที่บุคคลหนึ่งเป็นเจ้าของที่มีความเสี่ยงต่อโรคหลอดเลือดหัวใจ) แต่ความน่าจะเป็นนิรนัยนั้นสูงกว่าการสูบบุหรี่มือสองและโรคหลอดเลือดหัวใจมากกว่าแค่ 'ปัจจัยสุ่มใด ๆ ' . นี่เป็นเหตุผลที่ถูกต้องหรือไม่? หรือมีอย่างอื่นอีกไหม

1
การเปลี่ยนแปลงความหนาแน่นของความน่าจะเป็นต่างกันเนื่องจากปัจจัยจาโคเบียน
ในการจดจำรูปแบบของอธิการและการเรียนรู้ของเครื่องจักรฉันอ่านสิ่งต่อไปนี้หลังจากความหนาแน่นของความน่าจะเป็นถูกนำมาใช้:p(x∈(a,b))=∫bap(x)dxp(x∈(a,b))=∫abp(x)dxp(x\in(a,b))=\int_a^bp(x)\textrm{d}x ภายใต้การเปลี่ยนแปลงของตัวแปรแบบไม่เชิงเส้นความหนาแน่นของความน่าจะเป็นจะเปลี่ยนไปจากฟังก์ชันแบบง่ายเนื่องจากปัจจัยจาโคเบียน ตัวอย่างเช่นถ้าเราพิจารณาการเปลี่ยนแปลงของตัวแปรแล้วฟังก์ชันจะกลายเป็น (y)) ตอนนี้ให้พิจารณาความหนาแน่นของความน่าจะเป็นที่สอดคล้องกับความหนาแน่น เทียบกับตัวแปรใหม่ซึ่ง suf fi ces แสดงถึงความจริงที่ว่าและมีความหนาแน่นต่างกัน การสังเกตการณ์ที่ตกอยู่ในช่วงจะเปลี่ยนเป็นค่าเล็ก ๆ ของ เป็นช่วงx=g(y)x=g(y)x = g(y)f(x)f(x)f(x)f~(y)=f(g(y))f~(y)=f(g(y))\tilde{f}(y) = f(g(y))px(x)px(x)p_x(x)พีY( y)พีY(Y)p_y(y)YYyพีx( x )พีx(x)p_x(x)พีY( y)พีY(Y)p_y(y)( x , x + δx )(x,x+δx)(x, x + \delta x)δxδx\delta x( y, y+ δY(Y,Y+δY(y, y + \delta y ) โดยที่ พีx( x ) δx≃py(y)δypx(x)δx≃py(y)δyp_x(x)\delta x \simeq p_y(y)δyและด้วยเหตุนี้py(y)=px(x)|dxdy|=px(g(y))|g′(y)|py(y)=px(x)|dxdy|=px(g(y))|g′(y)|p_y(y) = …

1
วิธีกำหนดการแจกแจงแบบนั้นมีความสัมพันธ์กับการจับฉลากจากการแจกแจงแบบอื่นที่กำหนดไว้ล่วงหน้าได้อย่างไร?
ฉันจะกำหนดกระจายของตัวแปรสุ่มดังกล่าวที่วาดจากมีความสัมพันธ์กับที่เป็นวาดเดียวจากการกระจายกับฟังก์ชันการกระจายสะสม ? Y ρ x 1 x 1 F X ( x )YYYYYYρρ\rhox1x1x_1x1x1x_1FX( x )FX(x)F_{X}(x)

2
ฉันจะค้นหาความน่าจะเป็นของข้อผิดพลาด type II ได้อย่างไร
ฉันรู้ว่าข้อผิดพลาด Type II เป็นที่ที่ H1 เป็นจริง แต่ H0 ไม่ถูกปฏิเสธ คำถาม ฉันจะคำนวณความน่าจะเป็นของข้อผิดพลาด Type II ที่เกี่ยวข้องกับการแจกแจงแบบปกติที่ค่าเบี่ยงเบนมาตรฐานเป็นที่รู้จักได้อย่างไร

2
การกระจายอย่างเป็นหมวดหมู่หมายถึงอะไร
นี่คือการกระจายประเภทที่แยกต่างหาก (เช่น: ทวินาม, เบอร์นูลลี, Multinomial) หรือการกระจายใด ๆ สามารถแสดงด้วยวิธีนี้ ใครบางคนสามารถอธิบายรายละเอียดด้วยตัวอย่างง่ายๆ

2
ทำไมรุ่น“ ข้อผิดพลาดใน X” จึงไม่ใช้กันอย่างแพร่หลาย?
เมื่อเราคำนวณผิดพลาดมาตรฐานของค่าสัมประสิทธิ์การถดถอยเราไม่บัญชีสำหรับแบบแผนในการออกแบบเมทริกซ์Xใน OLS เราจะคำนวณเป็นXXXvar(β^)var(β^)\text{var}(\hat{\beta})var((XTX)−1XTY)=σ2(XTX)−1var((XTX)−1XTY)=σ2(XTX)−1\text{var}((X^TX)^{-1}X^TY) = \sigma^2(X^TX)^{-1} หากถูกพิจารณาแบบสุ่มกฎความแปรปรวนโดยรวมจะเรียกร้องการสนับสนุนเพิ่มเติมของความแปรปรวนของเช่นกัน กล่าวคือXXXXXX วาร์( β^) = var ( E.)( β^| X) ) + E( var ( β)^| X) )var(β^)=var(E(β^|X))+E(var(β^|X)).\text{var}(\hat{\beta}) = \text{var}(E(\hat{\beta}|X)) + E(\text{var}(\hat{\beta}|X)). ซึ่งหากตัวประมาณค่า OLS ไม่มีความเป็นกลางอย่างแท้จริงเทอมแรกก็หายไปเนื่องจากความคาดหวังนั้นคงที่ ระยะที่สองจะกลายเป็นจริง:1}σ2cov ( X)- 1σ2cov(X)−1\sigma^2 \text{cov}(X)^{-1} หากเป็นที่รู้จักกันในแบบจำลองพารามิเตอร์สำหรับทำไมเราไม่แทนที่ด้วยการประมาณความแปรปรวนร่วมที่แท้จริง ตัวอย่างเช่นถ้าเป็นการสุ่มมอบหมายการรักษาความแปรปรวนทวินามควรเป็นการประมาณที่มีประสิทธิภาพมากกว่าหรือไม่XXXXTXXTXX^TXXXXE( X) ( 1 - E( X) )E(X)(1−E(X))E(X)(1-E(X)) ทำไมเราไม่พิจารณาใช้โมเดลที่ไม่ใช่พารามิเตอร์ที่ยืดหยุ่นเพื่อประเมินแหล่งที่มาของความเอนเอียงที่เป็นไปได้ในการประมาณค่า OLS และพิจารณาความไวในการออกแบบ (เช่นการกระจายของ ) ในเทอมที่แปรปรวนเทอมแรก …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.