คำถามติดแท็ก mathematical-statistics

ทฤษฎีทางคณิตศาสตร์ของสถิติที่เกี่ยวข้องกับคำจำกัดความที่เป็นทางการและผลลัพธ์ทั่วไป

2
ฉันจะทราบวิธีการประมาณค่าพารามิเตอร์ที่จะเลือกได้อย่างไร
มีวิธีการค่อนข้างน้อยสำหรับการประมาณค่าพารามิเตอร์ที่นั่น MLE, UMVUE, MoM, การตัดสินใจเชิงทฤษฎีและอื่น ๆ ทั้งหมดดูเหมือนว่าพวกเขามีเหตุผลเชิงเหตุผลว่าทำไมพวกเขาถึงมีประโยชน์สำหรับการประมาณค่าพารามิเตอร์ มีวิธีใดวิธีหนึ่งที่ดีกว่าวิธีอื่นหรือเป็นเพียงแค่วิธีที่เรากำหนดว่าตัวประเมินที่ "เหมาะสมที่สุด" (คล้ายกับวิธีการลดข้อผิดพลาด orthogonal ให้เกิดการประมาณที่แตกต่างจากวิธีกำลังสองน้อยที่สุด)?

3
วิธีใช้สถิติ CDF และ PDF สำหรับการวิเคราะห์
นี่อาจเป็นคำถามทั่วไปมากเกินไป แต่ฉันหวังว่าฉันจะขอความช่วยเหลือได้ที่นี่ ฉันกำลังเริ่มงาน RA ในมหาวิทยาลัยของฉันและหัวข้อของฉันจะเกี่ยวข้องกับการวิเคราะห์การจราจรทางอินเทอร์เน็ต ฉันค่อนข้างใหม่สำหรับโลกแห่งการวิเคราะห์ แต่ฉันเดาว่าในโลกของการวิจัยนี่คือสิ่งที่ฉันต้องทำมากมาย ฉันเคยผ่านบทความสองสามฉบับและในหนังสือเหล่านั้นมากมายฉันพบว่าพวกเขาใช้ Probability Density (PDF), CDF, CCDF และอื่น ๆ เพื่ออธิบายผลลัพธ์ที่ได้รับ ตัวอย่างเช่น PDF ของระยะเวลาเซสชันของผู้ใช้ CDF ของจำนวนไบต์ที่ถ่ายโอนในแต่ละวันเป็นต้นฉันมีโอกาสในการเรียนและสถิติดังนั้นฉันจึงเข้าใจว่ามันคืออะไร แต่ฉันยังสับสนกับกรณีที่เลือกตัวแทน ดังนั้นหากมีใครออกไปทำกราฟและการวิเคราะห์ (ในหัวข้ออื่นใดโดยทั่วไปหรือสิ่งนี้) คุณสามารถบอกฉันได้ง่ายๆว่าในสถานการณ์ใดฉันจะใช้ตัวแทนอย่างใดอย่างหนึ่งหรืออย่างอื่นแทน

5
การอ้างอิงมาตรฐานสำหรับสถิติทางคณิตศาสตร์แบบดั้งเดิม?
ใครบ้างที่สามารถแนะนำหนังสือบางเล่มที่ถือเป็นการอ้างอิงมาตรฐานสำหรับสถิติแบบคลาสสิก IE ค่อนข้างครอบคลุมและอยู่ในช่วงระยะเวลาหนึ่งเพื่อให้การพิมพ์ผิดและผิดพลาดในสูตรมีโอกาสตรวจสอบและแก้ไข

5
เป็นไปได้ว่าตัวแปรสุ่มสองตัวจากตระกูลการแจกจ่ายเดียวกันมีความคาดหวังและความแปรปรวนเหมือนกัน แต่ช่วงเวลาที่สูงกว่าต่างกันหรือไม่
ฉันกำลังคิดถึงความหมายของครอบครัวในระดับตำแหน่ง ความเข้าใจของฉันคือสำหรับสมาชิกทุกคนในตระกูลมาตราส่วนตำแหน่งที่ตั้งที่มีพารามิเตอร์ตำแหน่งและมาตราส่วนจากนั้นการกระจายของไม่ขึ้นอยู่กับพารามิเตอร์ใด ๆ และมันก็เหมือนกันสำหรับทุกที่เป็นของตระกูลนั้นXXXaaabbbZ=(X- a ) / bZ=(X−a)/bZ =(X-a)/bXXX ดังนั้นคำถามของฉันคือคุณสามารถให้ตัวอย่างที่สุ่มสองตัวจากตระกูลการแจกจ่ายเดียวกันเป็นมาตรฐาน แต่ไม่ส่งผลให้ตัวแปรสุ่มที่มีการแจกแจงแบบเดียวกันได้หรือไม่ พูดว่าและมาจากตระกูลการแจกจ่ายเดียวกัน (โดยที่ครอบครัวฉันหมายถึงตัวอย่างเช่น Normal หรือ Gamma และอื่น ๆ .. ) กำหนด:XXXYYY Z1=X-μσZ1=X−μσZ_1 = \dfrac{X-\mu}{\sigma} Z2=Y-μσZ2=Y−μσZ_2 = \dfrac{Y-\mu}{\sigma} เรารู้ว่าทั้งสองและมีความคาดหวังเหมือนกันและแปรปรวน 1Z1Z1Z_1Z2Z2Z_2μZ= 0 , σ2Z= 1μZ=0,σZ2=1\mu_Z =0, \sigma^2_Z =1 แต่พวกเขาสามารถมีช่วงเวลาที่สูงขึ้นแตกต่างกันได้หรือไม่ ความพยายามของฉันที่จะตอบคำถามนี้คือถ้าการแจกแจงของและขึ้นอยู่กับพารามิเตอร์มากกว่า 2 ตัว และฉันกำลังคิดถึง general ทั่วไปที่มี 3 พารามิเตอร์XXXYYYt - s t ude n …

1
อะไรคือความแตกต่างระหว่างความเป็นกลางและความสอดคล้องของ asymptotic?
แต่ละคนหมายความถึงกันและกันหรือไม่? ถ้าไม่เป็นเช่นนั้น ทำไม / ทำไมไม่ ปัญหานี้ขึ้นมาเพื่อตอบสนองต่อความคิดเห็นในคำตอบที่ผมโพสต์ที่นี่ แม้ว่า google การค้นหาคำที่เกี่ยวข้องไม่ได้ผลิตอะไรที่ดูเหมือนมีประโยชน์เป็นพิเศษ แต่ฉันก็สังเกตเห็นคำตอบในการคำนวณทางคณิตศาสตร์ อย่างไรก็ตามฉันคิดว่าคำถามนี้เหมาะสำหรับไซต์นี้ด้วย แก้ไขหลังจากอ่านความคิดเห็น เทียบกับคำตอบ math.stackexchange ผมหลังจากที่บางสิ่งบางอย่างเพิ่มเติมในเชิงลึกครอบคลุมบางส่วนของปัญหาการจัดการใน@whuber ด้ายความคิดเห็นที่เชื่อมโยง นอกจากนี้ตามที่ฉันเห็นมันคำถาม math.stackexchange แสดงให้เห็นว่าความสอดคล้องไม่ได้หมายความถึงความเป็นกลางทาง asymptotically แต่ไม่ได้อธิบายอะไรมากหากเกิดอะไรขึ้น OP ที่นั่นยังยอมรับว่าความเป็นกลางทางซีมโทติคนั้นไม่ได้บ่งบอกถึงความมั่นคงและดังนั้นผู้ตอบคำถามเพียงคนเดียวไม่ได้อธิบายว่าทำไมถึงเป็นเช่นนี้

1
การแจกแจงแบบใดที่ไม่สัมพันธ์กันแสดงถึงความเป็นอิสระ?
การเตือนความทรงจำที่มีเกียรติในสถิติคือ "ความสัมพันธ์ไม่ได้หมายถึงความเป็นอิสระ" โดยปกติการแจ้งเตือนนี้จะเสริมด้วยคำสั่งที่ผ่อนคลายทางจิตวิทยา (และถูกต้องทางวิทยาศาสตร์) "เมื่อ แต่อย่างไรก็ตามทั้งสองตัวแปรมีการกระจายตามปกติร่วมกันแล้ว uncorrelatedness หมายถึงความเป็นอิสระ" ฉันสามารถเพิ่มจำนวนข้อยกเว้นที่มีความสุขจากหนึ่งเป็นสอง: เมื่อตัวแปรสองตัวถูกแจกจ่ายโดยBernoulliจากนั้นอีกครั้งความไม่สัมพันธ์กันหมายถึงความเป็นอิสระ ถ้าและเป็นสอง Bermoulli rv's,ซึ่งเรามีและคล้ายคลึงกับความแปรปรวนร่วมของพวกมันคือXXXYYYX∼ B ( qx) ,Y∼ B ( qY)X~B(Qx),Y~B(QY)X \sim B(q_x),\; Y \sim B(q_y)P( X= 1 ) = E( X) = qxP(X=1)=E(X)=QxP(X=1) = E(X) = q_xYYY Cov( X, วาย) = E( XY) - E( X) E( Y) = ∑SXYp …

1
ตัวประมาณความน่าจะเป็นสูงสุด - ช่วงความมั่นใจ
ฉันจะสร้างช่วงความมั่นใจแบบซีมโทติคสำหรับพารามิเตอร์จริงโดยเริ่มจาก MLE สำหรับพารามิเตอร์นั้นได้อย่างไร

1
MLE สำหรับการกระจายสามเหลี่ยม?
เป็นไปได้หรือไม่ที่จะใช้ขั้นตอน MLE ปกติกับการแจกแจงสามเหลี่ยม? - ฉันกำลังพยายาม แต่ฉันดูเหมือนจะถูกบล็อกในขั้นตอนเดียวหรืออย่างอื่นในวิชาคณิตศาสตร์ตามวิธีการแจกแจงที่กำหนดไว้ ฉันพยายามใช้ความจริงที่ว่าฉันรู้จำนวนตัวอย่างด้านบนและด้านล่าง c (โดยไม่รู้ตัว c): ตัวเลขทั้งสองนี้คือ cn และ (1-c) n หาก n คือจำนวนตัวอย่างทั้งหมด อย่างไรก็ตามดูเหมือนว่าจะไม่ได้ช่วยในการสืบมา ช่วงเวลาของช่วงเวลาให้ตัวประมาณค่าสำหรับ c โดยไม่มีปัญหามาก อะไรคือลักษณะที่แน่นอนของการอุดตันของ MLE ที่นี่ (ถ้ามี) รายละเอียดเพิ่มเติม: ลองพิจารณาในและการแจกแจงที่นิยามไว้ในโดย: [ 0 , 1 ] [ 0 , 1 ]คคc[ 0 , 1 ][0,1][0,1][ 0 , 1 ][0,1][0,1] ฉ( x ; c …

1
ความสัมพันธ์ระหว่าง Hessian Matrix และ Covariance Matrix
ในขณะที่ฉันกำลังศึกษาการประมาณความเป็นไปได้สูงสุดเพื่อทำการอนุมานในการประมาณความน่าจะเป็นสูงสุดเราจำเป็นต้องทราบความแปรปรวน หากต้องการทราบความแปรปรวนฉันต้องรู้ว่า Rao Lower Bound ของแครเมอร์ซึ่งดูเหมือนเมทริกซ์ของ Hessian ที่มีอนุพันธ์อันดับสองเกี่ยวกับความโค้ง ฉันสับสนในการกำหนดความสัมพันธ์ระหว่างเมทริกซ์ความแปรปรวนร่วมกับเมทริกซ์แบบเฮสเซียน หวังว่าจะได้ยินคำอธิบายบางอย่างเกี่ยวกับคำถาม ตัวอย่างง่ายๆจะได้รับการชื่นชม

3
เป็นไปได้หรือไม่ที่จะใช้ KL divergence ระหว่างการกระจายแบบไม่ต่อเนื่องและต่อเนื่อง?
ฉันไม่ใช่นักคณิตศาสตร์ ฉันค้นหาอินเทอร์เน็ตเกี่ยวกับ KL Divergence สิ่งที่ฉันเรียนรู้คือ KL divergence วัดข้อมูลที่หายไปเมื่อเราประมาณการกระจายตัวแบบที่เกี่ยวกับการกระจายสัญญาณ ฉันได้เห็นสิ่งเหล่านี้ระหว่างการแจกแจงแบบต่อเนื่องหรือแบบแยก เราสามารถทำระหว่างต่อเนื่องและไม่ต่อเนื่องหรือในทางกลับกันได้หรือไม่?

2
คำจำกัดความของ“ เปอร์เซ็นไทล์”
ตอนนี้ฉันกำลังอ่านบันทึกเกี่ยวกับชีวสถิติที่เขียนโดย PMT Education และสังเกตประโยคต่อไปนี้ในหัวข้อ 2.7: เด็กที่เกิดในเปอร์เซ็นไทล์ที่ 50 สำหรับมวลนั้นหนักกว่าทารก 50% ทารกที่เกิดในเปอร์เซนต์ไทล์ที่ 25 สำหรับมวลนั้นหนักกว่า 75% ของทารก เด็กที่เกิดที่ 75 เปอร์เซ็นไทล์ต่อมวลนั้นหนักกว่าทารก 25% แต่อย่างที่ฉันรู้เด็กทารกที่เกิดในเปอร์เซนต์ไทล์ที่ 25 สำหรับมวลควรหนักกว่าเด็ก 25% มีคำจำกัดความพิเศษของ "เปอร์เซ็นไทล์" ในฟิลด์นี้หรือไม่หรือฉันเข้าใจผิดว่าประโยคในฐานะผู้พูดที่ไม่ใช่เจ้าของภาษา?

5
ช่วงความมั่นใจมีประโยชน์หรือไม่?
ในสถิติที่ใช้บ่อยช่วงความมั่นใจ 95% เป็นขั้นตอนการสร้างช่วงเวลาซึ่งหากทำซ้ำจำนวนครั้งไม่สิ้นสุดจะมีพารามิเตอร์ที่แท้จริง 95% ของเวลา ทำไมถึงมีประโยชน์ ช่วงความเชื่อมั่นมักเข้าใจผิด พวกเขาไม่ใช่ช่วงเวลาที่เราสามารถมั่นใจได้ 95% ว่าพารามิเตอร์นั้นอยู่ใน (ยกเว้นว่าคุณกำลังใช้ช่วงความน่าเชื่อถือแบบเบย์ที่คล้ายกัน) ช่วงเวลาความมั่นใจรู้สึกเหมือนเป็นเหยื่อและสลับมาที่ฉัน กรณีการใช้งานอย่างหนึ่งที่ฉันคิดได้ก็คือกำหนดช่วงของค่าที่เราไม่สามารถปฏิเสธสมมติฐานว่างได้ว่าพารามิเตอร์คือค่านั้น ค่า p จะไม่ให้ข้อมูลนี้ แต่จะดีกว่าไหม โดยไม่ทำให้เข้าใจผิด? ในระยะสั้น: ทำไมเราต้องมีช่วงความมั่นใจ? เมื่อตีความอย่างถูกต้องมีประโยชน์อย่างไร?

3
ตาย 100 ม้วนหน้าไม่ปรากฏมากกว่า 20 ครั้ง
ฉันกำลังพยายามปิดหัวปัญหานี้ ดายถูกรีด 100 ครั้ง ความน่าจะเป็นที่ไม่ปรากฏใบหน้าเกิน 20 ครั้งเป็นเท่าไหร่? ความคิดแรกของฉันคือการใช้การแจกแจงแบบทวินาม P (x) = 1 - 6 cmf (100, 1/6, 20) แต่สิ่งนี้ผิดอย่างเห็นได้ชัดเนื่องจากเรานับบางกรณีมากกว่าหนึ่งครั้ง ความคิดที่สองของฉันคือการแจกแจงม้วนที่เป็นไปได้ทั้งหมด x1 + x2 + x3 + x4 + x5 + x6 = 100 เช่นนั้น xi <= 20 และรวมผลรวมของ multinomials แต่มันดูเหมือนเข้มข้นเกินไป วิธีแก้ปัญหาโดยประมาณนั้นจะได้ผลกับฉันเช่นกัน

2
ถ้า
ฉันพยายามพิสูจน์ข้อความนี้: ถ้าและเป็นตัวแปรสุ่มอิสระX∼N(0,σ21)X∼N(0,σ12)X\sim\mathcal{N}(0,\sigma_1^2)Y∼N(0,σ22)Y∼N(0,σ22)Y\sim\mathcal{N}(0,\sigma_2^2) ดังนั้นก็เป็นตัวแปรสุ่มแบบปกติเช่นกันXYX2+Y2√XYX2+Y2\frac{XY}{\sqrt{X^2+Y^2}} สำหรับกรณีพิเศษ (พูด) เรามีผลลัพธ์ที่รู้จักกันดีว่าเมื่อใดก็ตามที่และเป็นอิสระตัวแปร ในความเป็นจริงเป็นที่รู้กันโดยทั่วไปว่าเป็นอิสระตัวแปรσ1=σ2=σσ1=σ2=σ\sigma_1=\sigma_2=\sigmaXYX2+Y2√∼N(0,σ24)XYX2+Y2∼N(0,σ24)\frac{XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}\left(0,\frac{\sigma^2}{4}\right)XXXYYYN(0,σ2)N(0,σ2)\mathcal{N}(0,\sigma^2)XYX2+Y2√,X2−Y22X2+Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N(0,σ24)N(0,σ24)\mathcal{N}\left(0,\frac{\sigma^2}{4}\right) หลักฐานของผลลัพธ์สุดท้ายตามด้วยการใช้การแปลงโดยที่และtheta) แน่นอน, ที่นี่และ . ฉันพยายามเลียนแบบหลักฐานนี้สำหรับปัญหาที่เกิดขึ้น แต่ดูเหมือนว่าจะยุ่ง(X,Y)→(R,Θ)→(U,V)(X,Y)→(R,Θ)→(U,V)(X,Y)\to(R,\Theta)\to(U,V)x=rcosθ,y=rsinθx=rcos⁡θ,y=rsin⁡θx=r\cos\theta,y=r\sin\thetau=r2sin(2θ),v=r2cos(2θ)u=r2sin⁡(2θ),v=r2cos⁡(2θ)u=\frac{r}{2}\sin(2\theta),v=\frac{r}{2}\cos(2\theta)U=XYX2+Y2√U=XYX2+Y2U=\frac{XY}{\sqrt{X^2+Y^2}}V=X2−Y22X2+Y2√V=X2−Y22X2+Y2V=\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}} หากฉันไม่ได้ทำผิดพลาดสำหรับฉันจบลงด้วยความหนาแน่นร่วมของเช่น(u,v)∈R2(u,v)∈R2(u,v)\in\mathbb{R}^2(U,V)(U,V)(U,V) fU,V(u,v)=2σ1σ2πexp[−u2+v2−−−−−−√(u2+v2−−−−−−√+vσ21+u2+v2−−−−−−√−vσ22)]fU,V(u,v)=2σ1σ2πexp⁡[−u2+v2(u2+v2+vσ12+u2+v2−vσ22)]f_{U,V}(u,v)=\frac{2}{\sigma_1\sigma_2\pi}\exp\left[-\sqrt{u^2+v^2}\left(\frac{\sqrt{u^2+v^2}+v}{\sigma_1^2}+\frac{\sqrt{u^2+v^2}-v}{\sigma_2^2}\right)\right] ฉันมีตัวคูณด้านบนเนื่องจากการแปลงไม่ใช่แบบหนึ่งต่อหนึ่ง222 ดังนั้นความหนาแน่นของจะได้รับโดยซึ่งไม่ได้รับการประเมินอย่างง่ายดายUUU∫RfU,V(u,v)dv∫RfU,V(u,v)dv\displaystyle \int_{\mathbb{R}}f_{U,V}(u,v)\,\mathrm{d}v ตอนนี้ฉันสนใจที่จะรู้ว่ามีหลักฐานที่ฉันสามารถทำงานกับเท่านั้นและไม่ต้องพิจารณาเพื่อแสดงว่าเป็นเรื่องปกติ การค้นหา CDF ของไม่ได้ดูน่าเชื่อถือสำหรับฉันในขณะนี้ ผมยังต้องการที่จะทำเช่นเดียวกันสำหรับกรณีที่\UUUVVVUUUUUUσ1=σ2=σσ1=σ2=σ\sigma_1=\sigma_2=\sigma นั่นคือถ้าและเป็นอิสระตัวแปรแล้วฉันต้องการแสดงให้เห็นว่าโดยไม่ต้องใช้การเปลี่ยนแปลงของตัวแปร ถ้าอย่างใดฉันสามารถยืนยันว่าแล้วฉันทำ ดังนั้นคำถามสองข้อที่นี่กรณีทั่วไปและกรณีเฉพาะXXXYYYN(0,σ2)N(0,σ2)\mathcal{N}(0,\sigma^2)Z=2XYX2+Y2√∼N(0,σ2)Z=2XYX2+Y2∼N(0,σ2)Z=\frac{2XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}(0,\sigma^2)Z=dXZ=dXZ\stackrel{d}{=}X โพสต์ที่เกี่ยวข้องกับ Math.SE: X2−Y2/X2+Y2−−−−−−−√∼N(0,1)X2−Y2/X2+Y2∼N(0,1)X^2-Y^2/ \sqrt{X^2+Y^2}\sim N(0,1)เมื่อX,Y∼N(0,1)X,Y∼N(0,1)X,Y\sim N(0,1)เป็นอิสระ ระบุว่าเป็น iidแสดงให้เห็นว่าจะ IIDX,YX,YX,YN(0,1)N(0,1)N(0,1)XYX2+Y2√,X2−Y22X2+Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N(0,14)N(0,14)N(0,\frac{1}{4}){4}) แก้ไข ปัญหานี้เกิดขึ้นจริงเนื่องจาก L. Shepp ตามที่ฉันค้นพบในแบบฝึกหัดของทฤษฎีความน่าจะเป็นเบื้องต้นและการประยุกต์ใช้ (ฉบับที่ II) โดย Feller พร้อมด้วยคำแนะนำที่เป็นไปได้: แน่นอนและฉันมีความหนาแน่นของในมือU=XYX2+Y2√=11X2+1Y2√U=XYX2+Y2=11X2+1Y2U=\frac{XY}{\sqrt{X^2+Y^2}}=\frac{1}{\sqrt{\frac{1}{X^2}+\frac{1}{Y^2}}}1X21X2\frac{1}{X^2} เรามาดูกันว่าฉันสามารถทำอะไรได้บ้าง นอกเหนือจากนี้เรายินดีต้อนรับความช่วยเหลือเล็กน้อยเกี่ยวกับอินทิกรัลด้านบนด้วย

1
การตีความอนุพันธ์ Radon-Nikodym ระหว่างความน่าจะเป็นเป็นอย่างไร
ฉันเคยเห็นบางจุดการใช้เรดอน - นิโคดีมาของการวัดความน่าจะเป็นหนึ่งโดยเทียบกับอีกประการหนึ่งที่โดดเด่นที่สุดใน Kullback-Leibler divergence ซึ่งเป็นอนุพันธ์ของการวัดความน่าจะเป็นของแบบจำลองสำหรับพารามิเตอร์โดยพลการเกี่ยวกับพารามิเตอร์จริง :θ 0θθ\thetaθ0θ0\theta_0 dPθdPθ0dPθdPθ0\frac {dP_\theta}{dP_{\theta_0}} ที่ไหนเหล่านี้มีทั้งที่เป็นมาตรการในพื้นที่ของ datapoints เงื่อนไขเกี่ยวกับค่าพารามิเตอร์:theta)Pθ(D)=P(D|θ)Pθ(D)=P(D|θ)P_\theta(D)=P(D|\theta) การตีความของอนุพันธ์ Radon-Nikodym เช่นนี้ในการเบี่ยงเบน Kullback-Leibler คืออะไรหรือโดยทั่วไประหว่างความน่าจะเป็นสองมาตรการ?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.