คำถามติดแท็ก mathematical-statistics

ทฤษฎีทางคณิตศาสตร์ของสถิติที่เกี่ยวข้องกับคำจำกัดความที่เป็นทางการและผลลัพธ์ทั่วไป

2
อะไรคือผลลัพธ์ที่ทรงพลังที่สุดเกี่ยวกับ iid Gaussians สูงสุด? ใช้มากที่สุดในการฝึก?
รับ iid, พิจารณาตัวแปรสุ่มX1,…,Xn,…∼N(0,1)X1,…,Xn,…∼N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1) Zn: =สูงสุด1 ≤ ฉัน≤ nXผม.Zn=สูงสุด1≤ผม≤nXผม. Z_n := \max_{1 \le i \le n} X_i\,. คำถาม:ผลลัพธ์ที่ "สำคัญ" ที่สุดเกี่ยวกับตัวแปรสุ่มเหล่านี้คืออะไร เพื่อชี้แจง "ความสำคัญ" ซึ่งผลลัพธ์ใดที่มีผลลัพธ์เช่นอื่น ๆ มากที่สุดซึ่งเป็นผลลัพธ์เชิงตรรกะ? ผลลัพธ์ใดที่ใช้บ่อยที่สุดในทางปฏิบัติ โดยเฉพาะอย่างยิ่งดูเหมือนว่าจะเป็นชาวบ้านมีความรู้ในทางสถิติ (ทางทฤษฎี) ว่านั้น "โดยทั่วไปเหมือนกับ" \ sqrt {2 \ log n}อย่างน้อยที่สุด (ดูคำถามที่เกี่ยวข้องนี้)ZnZnZ_n2 บันทึกn-----√2เข้าสู่ระบบ⁡n\sqrt{2 \log n} อย่างไรก็ตามมีผลลัพธ์ที่เกี่ยวข้องมากมายในประเภทนี้และดูเหมือนว่าเป็นกรณีที่ส่วนใหญ่ไม่เท่ากันหรือบ่งบอกถึงกันและกัน ตัวอย่างเช่น* * * ** * …

2
ความพอเพียงแบบเบย์เกี่ยวข้องกับความพอเพียงของผู้ถี่บ่อยอย่างไร
ความหมายที่ง่ายที่สุดของสถิติที่เพียงพอในมุมมอง frequentist จะได้รับที่นี่ในวิกิพีเดีย อย่างไรก็ตามเมื่อเร็ว ๆ นี้ฉันเจอหนังสือ Bayesian พร้อมคำจำกัดความP( θ | x , t ) = P( θ | t )P(θ|x,t)=P(θ|t)P(\theta|x,t)=P(\theta|t). มันระบุไว้ในลิงค์ว่าทั้งสองจะเท่ากัน แต่ฉันไม่เห็นว่า นอกจากนี้ในหน้าเดียวกันนั้นในส่วน«ประเภทอื่น ๆ ของความพอเพียง»มันระบุไว้ว่าคำจำกัดความทั้งสองนั้นไม่เท่ากันในช่องว่างมิติ ... นอกจากนี้ความพอเพียงเชิงทำนายยังเกี่ยวข้องกับความพอเพียงแบบดั้งเดิมอย่างไร

2
การแสดง
ถ้า X∼ C( 0 , 1 )X∼C(0,1)X\sim\mathcal C(0,1)หาการกระจายของ Y=2 X1 -X2Y=2X1−X2Y=\frac{2X}{1-X^2}. เรามี FY( y) = P r ( Y≤ y)FY(y)=Pr(Y≤y)F_Y(y)=\mathrm{Pr}(Y\le y) = P r (2 X1 -X2≤ y)=Pr(2X1−X2≤y)\qquad\qquad\qquad=\mathrm{Pr}\left(\frac{2X}{1-X^2}\le y\right) =⎧⎩⎨⎪⎪⎪⎪⎪⎪Pr(X∈(−∞,−1−1+y2√y])+Pr(X∈(−1,−1+1+y2√y]),ify&gt;0Pr(X∈(−1,−1+1+y2√y])+Pr(X∈(1,−1−1+y2√y]),ify&lt;0={Pr(X∈(−∞,−1−1+y2y])+Pr(X∈(−1,−1+1+y2y]),ify&gt;0Pr(X∈(−1,−1+1+y2y])+Pr(X∈(1,−1−1+y2y]),ify&lt;0\qquad\qquad=\begin{cases} \mathrm{Pr}\left(X\in\left(-\infty,\frac{-1-\sqrt{1+y^2}}{y}\right]\right)+\mathrm{Pr}\left(X\in\left(-1,\frac{-1+\sqrt{1+y^2}}{y}\right]\right),\text{if}\quad y>0\\ \mathrm{Pr}\left(X\in\left(-1,\frac{-1+\sqrt{1+y^2}}{y}\right]\right)+\mathrm{Pr}\left(X\in\left(1,\frac{-1-\sqrt{1+y^2}}{y}\right]\right),\text{if}\quad y<0 \end{cases} ฉันสงสัยว่าความแตกต่างของกรณีด้านบนนั้นถูกต้องหรือไม่ ในทางตรงกันข้ามต่อไปนี้ดูเหมือนว่าวิธีที่ง่ายกว่า: เราสามารถเขียน Y=tan(2tan- 1X)Y=tan⁡(2tan−1⁡X)Y=\tan(2\tan^{-1}X) ใช้ตัวตน 2 ตันZ1 -สีน้ำตาล2Z= ผิวสีแทน2 z2tan⁡z1−tan2⁡z=tan⁡2z\frac{2\tan z}{1-\tan^2z}=\tan 2z ตอนนี้ X∼ …

1
เราสามารถสรุปได้จากที่เป็นอิสระหรือไม่?
เราไม่สามารถดูตัวอย่างhttps://en.wikipedia.org/wiki/Subindependence สำหรับตัวอย่างที่น่าสนใจ แต่คำถามที่แท้จริงคือ: มีวิธีที่จะเสริมสร้างสภาพเพื่อให้ความเป็นอิสระดังต่อไปนี้? ตัวอย่างเช่นมีชุดของฟังก์ชั่นดังนั้นถ้าสำหรับทั้งหมดจึงเป็นอิสระต่อไปนี้? และชุดฟังก์ชั่นดังกล่าวต้องใหญ่ขนาดไหนไม่มีที่สิ้นสุด?g1,…,gng1,…,gng_1, \dotsc, g_nEgi(X)gj(Y)=Egi(X)Egj(Y)E⁡gi(X)gj(Y)=E⁡gi(X)E⁡gj(Y)\E g_i(X) g_j(Y) =\E g_i(X) \E g_j(Y)i,ji,ji,j และนอกจากนี้มีการอ้างอิงที่ดีที่ปฏิบัติต่อคำถามนี้หรือไม่?

1
การวิเคราะห์เชิงหน้าที่และพื้นที่ฮิลแบร์ตมีประโยชน์ในการเรียนรู้ของเครื่องหรือไม่ ถ้าเป็นเช่นนั้นได้อย่างไร
ฉันสงสัยว่าช่องว่างของฮิลแบร์ตและการวิเคราะห์การทำงานมีประโยชน์ต่อการเรียนรู้ของเครื่องอย่างไร ฉันคิดว่าการเรียนรู้ของเครื่องเป็นการผสมผสานระหว่างสถิติวิทยาการคอมพิวเตอร์และการเพิ่มประสิทธิภาพ การวิเคราะห์การทำงานมีความสัมพันธ์กับสิ่งนั้นอย่างไร

1
ทอพอโลยีที่ชุดการแจกแจงความน่าจะเป็นเสร็จสมบูรณ์
ฉันได้รับการดิ้นรนค่อนข้างน้อยด้วยการปรับความเข้าใจที่เข้าใจง่ายของการแจกแจงความน่าจะเป็นกับคุณสมบัติแปลก ๆ ที่ทอพอโลยีเกือบทั้งหมดเกี่ยวกับการแจกแจงความน่าจะเป็นมี ตัวอย่างเช่นลองพิจารณาตัวแปรสุ่มแบบผสม : เลือกแบบเกาส์ที่กึ่งกลางที่ 0 ด้วยความแปรปรวน 1 และด้วยความน่าจะเป็นเพิ่มในผลลัพธ์ ลำดับของตัวแปรสุ่มดังกล่าวจะมาบรรจบกัน (อย่างอ่อนและในรูปแบบทั้งหมด) ไปยังเกาส์เป็นศูนย์กลางที่ 0 กับความแปรปรวน 1 แต่ค่าเฉลี่ยของเสมอและผลต่างมาบรรจบกันที่จะ+ฉันไม่ชอบบอกว่าลำดับนี้มาบรรจบกันเพราะสิ่งนั้นXnXnX_n1n1n\frac{1}{n}nnnXnXnX_n111+ ∞+∞+\infty ฉันใช้เวลาพอสมควรที่จะจำทุกสิ่งที่ฉันลืมเกี่ยวกับทอพอโลยี แต่ในที่สุดฉันก็พบว่าอะไรที่ทำให้ฉันไม่พอใจกับตัวอย่างเช่น: ขีด จำกัด ของลำดับไม่ใช่การแจกแจงแบบเดิม ในตัวอย่างข้างต้นขีด จำกัด คือ "Gaussian ของค่าเฉลี่ย 1 และค่าความแปรปรวนอนันต์" แปลก ในแง่ทอพอโลยีชุดการแจกแจงความน่าจะเป็นยังไม่สมบูรณ์ภายใต้จุดอ่อน (และทีวีและทอพอโลยีอื่น ๆ ทั้งหมดที่ฉันเคยดู) จากนั้นฉันก็พบกับคำถามต่อไปนี้: โทโพโลยีมีอยู่ไหมว่าชุดการกระจายความน่าจะเป็นเสร็จสมบูรณ์หรือไม่ ถ้าไม่การขาดนั้นสะท้อนถึงคุณสมบัติที่น่าสนใจของการแจกแจงความน่าจะเป็นทั้งหมดหรือไม่? หรือมันน่าเบื่อ? หมายเหตุ: ฉันได้เขียนคำถามเกี่ยวกับ "การแจกแจงความน่าจะเป็น" แล้ว สิ่งเหล่านี้ไม่สามารถปิดได้เพราะพวกเขาสามารถรวมเข้ากับ Dirac และสิ่งต่าง ๆ เช่นที่ไม่มี pdf แต่มาตรการยังไม่ปิดภายใต้ทอพอโลยีที่อ่อนแอดังนั้นคำถามของฉันยังคงอยู่ …

1
ความแปรปรวนของความสัมพันธ์กับการแปลงเชิงเส้น:
นี่เป็นหนึ่งในปัญหาในBasic Econometricsรุ่นที่ 4 (Q3.11) ของ Gujarati และกล่าวว่าสัมประสิทธิ์สหสัมพันธ์นั้นมีค่าคงที่เมื่อเทียบกับการเปลี่ยนแปลงของต้นกำเนิดและมาตราส่วนนั่นคือโดยที่ , , ,เป็นค่าคงที่โดยพลการcorr ( a X)+ b , c Y+ d) = corr ( X, วาย)corr(aX+b,cY+d)=corr(X,Y)\text{corr}(aX+b, cY+d) = \text{corr}(X,Y)aaaขbbคccddd แต่คำถามหลักของฉันคือต่อไปนี้: Letและจะจับคู่สังเกตและคิดว่าและมีความสัมพันธ์ในเชิงบวกคือ 0 ฉันรู้ว่าจะเป็นลบตามสัญชาตญาณ อย่างไรก็ตามถ้าเราใช้ , มันจะตามมาว่าซึ่งทำ ไม่สมเหตุสมผลXXXYYYXXXYYYcorr ( X), วาย) &gt; 0corr(X,Y)&gt;0\text{corr}(X,Y)>0corr ( - X, วาย)corr(-X,Y)\text{corr}(-X,Y)a = - 1 , b = 0 …

3
ชุดของตัวแปรที่ไม่เกี่ยวข้อง แต่เชิงเส้น
เป็นไปได้ไหมที่จะมีชุดของ KKK ตัวแปรที่ไม่เกี่ยวข้อง แต่เชิงเส้นขึ้นอยู่กับ? กล่าวคือ c o r (xผม,xJ) = 0cor(xi,xj)=0cor(x_i, x_j)=0 และ ΣKi = 1aผมxผม= 0∑i=1Kaixi=0 \sum_{i=1}^K a_ix_i=0 ถ้าใช่คุณสามารถเขียนตัวอย่างได้หรือไม่? แก้ไข: จากคำตอบมันตามมาว่ามันเป็นไปไม่ได้ อย่างน้อยมันจะเป็นไปได้ไหม P(|ρ^xi,xj−ρ^xi,v|&lt;ϵ)P(|ρ^xi,xj−ρ^xi,v|&lt;ϵ)\mathbb{P}(|\hat \rho_{x_i, x_j}-\hat \rho_{x_i, v}|<\epsilon) ที่ไหน ρ^ρ^\hat\rho คือค่าสัมประสิทธิ์สหสัมพันธ์ประมาณจาก nnn ตัวอย่างของตัวแปรและ vvv เป็นตัวแปรที่ไม่เกี่ยวข้องกับ xixix_i. ฉันกำลังคิดอะไรบางอย่างเช่น xK=1K∑K−1i=1xixK=1K∑i=1K−1xix_K=\dfrac{1}{K} \sum_{i=1}^{K-1} x_i K&gt;&gt;0K&gt;&gt;0K>>0


1
วิธีการสร้างเมทริกซ์มุมฉากแบบสุ่มของดีเทอร์มิแนนต์ดี?
ฉันอาจมีคำถามโง่ ๆ เกี่ยวกับสิ่งที่ฉันต้องยอมรับฉันสับสน ลองนึกภาพที่ก่อให้เกิดซ้ำของการกระจายอย่างสม่ำเสมอสุ่มมุมฉาก (orthonormal) เมทริกซ์ที่มีขนาดบางหนบางครั้งเมทริกซ์ที่สร้างขึ้นมีปัจจัยที่และบางครั้งก็มีปัจจัย-1(มีเพียงสองค่าที่เป็นไปได้จากมุมมองของการหมุนมุมฉากหมายความว่ามีการสะท้อนเพิ่มอีกหนึ่งนอกเหนือจากการหมุน)ppp111−1−1-1det=−1det=−1\det=-1 เราสามารถเปลี่ยนสัญลักษณ์ของdetdet\detของเมทริกซ์มุมฉากจากลบเป็นบวกได้โดยเปลี่ยนสัญลักษณ์ของคอลัมน์ใดคอลัมน์หนึ่ง (หรือโดยทั่วไปคอลัมน์ใด ๆ ที่มีเลขคี่) คำถามของฉันคือ: เมื่อเราสร้างเมทริกซ์แบบสุ่มซ้ำแล้วซ้ำอีกเราจะแนะนำอคติบางอย่างในลักษณะการสุ่มแบบสม่ำเสมอหรือไม่หากทุกครั้งที่เราเลือกที่จะเปลี่ยนสัญญาณของคอลัมน์ที่ระบุเฉพาะ (พูดเสมอที่ 1 หรือตลอดไป) หรือเราควรจะมีการเลือกคอลัมน์สุ่มเพื่อให้การฝึกอบรมแทนการสุ่มคอลเลกชันกระจายเหมือนกัน?

1
สังเกตข้อมูลชาวประมงภายใต้การเปลี่ยนแปลง
จาก "ในทุกโอกาส: การสร้างแบบจำลองทางสถิติและการอนุมานโดยใช้โอกาส" โดย Y. Pawitan ความน่าจะเป็นของการกำหนดพารามิเตอร์ใหม่ถูกกำหนดเป็น ดังนั้นถ้าgเป็นแบบหนึ่งต่อหนึ่งดังนั้นL ^ * (\ psi) = L (g ^ {- 1} (\ psi)) (หน้า 45) ฉันพยายามแสดงแบบฝึกหัด 2.20 ซึ่งระบุว่าถ้า\ thetaเป็นสเกลาร์ (และฉันคิดว่าgควรเป็นฟังก์ชันสเกลาร์เช่นกัน) จากนั้น ฉัน ^ * (g (\ hat {\ theta})) = I ( \ hat {\ theta}) \ left | \ frac {\ partial …

1
ทวินามลบนั้นไม่สามารถแสดงออกได้เหมือนในตระกูลเอ็กซ์โพเนนเชียลหรือไม่ถ้ามี 2 นิรนาม?
ฉันมีการบ้านเพื่อแสดงการกระจายตัวแบบทวินามลบเป็นตระกูลการแจกแจงแบบเลขชี้กำลังเนื่องจากพารามิเตอร์การกระจายตัวเป็นค่าคงที่ที่รู้จัก นี่ค่อนข้างง่าย แต่ฉันสงสัยว่าทำไมพวกเขาถึงต้องการให้เราเก็บพารามิเตอร์นั้นไว้ ฉันพบว่าฉันไม่สามารถหาวิธีที่จะใส่มันในรูปแบบที่ถูกต้องโดยไม่ทราบพารามิเตอร์สองตัว ดูออนไลน์ฉันพบการอ้างสิทธิ์ว่าเป็นไปไม่ได้ อย่างไรก็ตามฉันไม่พบหลักฐานว่านี่เป็นเรื่องจริง ฉันดูเหมือนจะไม่เกิดขึ้นกับตัวเองอย่างใดอย่างหนึ่ง ใครบ้างมีข้อพิสูจน์เรื่องนี้? ตามที่ร้องขอด้านล่างนี้ฉันได้แนบข้อเรียกร้องสองสามข้อ: "ตระกูลการแจกแจงลบแบบทวินามที่มีจำนวนความล้มเหลวคงที่ (aka พารามิเตอร์การหยุดเวลา) r คือตระกูลแบบเอ็กซ์โพเนนเชียลอย่างไรก็ตามเมื่อพารามิเตอร์คงที่ใด ๆ ที่กล่าวถึงข้างต้นได้รับอนุญาตให้เปลี่ยนแปลง " http://en.wikipedia.org/wiki/Exponential_family "การแจกแจงทวินามลบสองพารามิเตอร์ไม่ได้เป็นสมาชิกของตระกูลเอ็กซ์โพเนนเชียล แต่ถ้าเราปฏิบัติต่อพารามิเตอร์การกระจายตัวเป็นค่าคงที่ที่รู้จักกันคงที่แล้วมันก็เป็นสมาชิก" http://www.unc.edu/courses/2006spring/ecol/145/001/docs/lectures/lecture21.htm

1
การสลายตัวของสารเติมแต่ง vs
คำถามของฉันเป็นคำถามง่าย ๆ แต่เป็นคำถามที่ทำให้ฉันได้รับจริง ๆ :) ฉันไม่รู้จริง ๆ ว่าจะประเมินได้อย่างไรว่าอนุกรมเวลาที่เฉพาะเจาะจงนั้นจะต้องสลายตัวโดยใช้วิธีการเติมหรือวิธีการสลายตัวแบบทวีคูณ ฉันรู้ว่ามีตัวชี้นำทางสายตาที่บอกพวกเขาแยกจากกัน แต่ฉันไม่เข้าใจ ยกตัวอย่างเช่นซีรี่ส์เวลานี้: คุณจะอธิบายมันอย่างไร ขอบคุณล่วงหน้าสำหรับความช่วยเหลือของ.

1
การจำลองการบรรจบกันของความน่าจะเป็นให้คงที่
ผลลัพธ์แบบอะซิมโทติคไม่สามารถพิสูจน์ได้ด้วยการจำลองด้วยคอมพิวเตอร์เนื่องจากเป็นข้อความที่เกี่ยวข้องกับแนวคิดของอนันต์ แต่เราควรจะได้รับความรู้สึกว่าสิ่งต่าง ๆ เป็นจริงตามที่ทฤษฎีบอกเรา พิจารณาผลลัพธ์ทางทฤษฎี limn→∞P(|Xn|&gt;ϵ)=0,ϵ&gt;0limn→∞P(|Xn|&gt;ϵ)=0,ϵ&gt;0\lim_{n\rightarrow\infty}P(|X_n|>\epsilon) = 0, \qquad \epsilon >0 โดยที่XnXnX_nเป็นฟังก์ชั่นของตัวแปรสุ่มnnnพูดกันอย่างอิสระและกระจายตัว นี่บอกว่าXnXnX_nแปรเปลี่ยนความน่าจะเป็นเป็นศูนย์ ตัวอย่างต้นแบบที่นี่ฉันเดาว่าเป็นกรณีที่XnXnX_nเป็นค่าเฉลี่ยตัวอย่างลบด้วยค่าที่คาดหวังร่วมกันของตัวอย่าง iidrv Xn=1n∑i=1nYi−E[Y1]Xn=1n∑i=1nYi−E[Y1]X_n = \frac 1n\sum_{i=1}^nY_i - E[Y_1] คำถาม: เราจะแสดงให้คนเห็นได้อย่างไรว่าความสัมพันธ์ข้างต้น "ปรากฏขึ้นในโลกแห่งความเป็นจริง" โดยใช้ผลการจำลองด้วยคอมพิวเตอร์จากตัวอย่างที่มีความจำเป็น โปรดทราบว่าฉันเลือกลู่เข้าเป็นค่าคงที่โดยเฉพาะ ฉันให้วิธีการด้านล่างของฉันเป็นคำตอบและฉันหวังว่าสำหรับคนที่ดีกว่า UPDATE:มีบางอย่างที่ด้านหลังศีรษะของฉันรบกวนฉัน - และฉันก็รู้ว่าอะไร ฉันขุดขึ้นมาเป็นคำถามเก่าที่สนทนาที่น่าสนใจมากที่สุดไปในในความคิดเห็นเพื่อหนึ่งในคำตอบ ในนั้น @ Cardinal ให้ตัวอย่างของตัวประมาณว่ามันสอดคล้องกัน แต่ความแปรปรวนของมันยังคงไม่เป็นศูนย์และแน่นอนที่ไม่มีอาการ ดังนั้นคำถามที่แตกต่างของคำถามของฉันจะรุนแรงขึ้น: เราจะแสดงโดยการจำลองว่าสถิติมาบรรจบกันในความน่าจะเป็นเป็นค่าคงที่ได้อย่างไรเมื่อสถิตินี้รักษาความแปรปรวนที่ไม่เป็นศูนย์และไม่มีขอบเขตแบบ asymptotically

4
หลักสูตรคณิตศาสตร์บริสุทธิ์ที่สำคัญสำหรับนักศึกษาปริญญาเอกด้านสถิติคืออะไร?
ฉันรู้ว่าพีชคณิตเชิงเส้นและการวิเคราะห์ (โดยเฉพาะทฤษฎีการวัด) มีความสำคัญ การใช้หลักสูตรระดับบัณฑิตศึกษาในการวิเคราะห์ที่แท้จริงและซับซ้อนมีประโยชน์หรือไม่ ฉันควรเรียนรายวิชาพีชคณิตนามธรรมนอกเหนือจากหลักสูตรเบื้องต้นเช่นพีชคณิตสับเปลี่ยนและเรขาคณิตเชิงพีชคณิตหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.