คำถามติดแท็ก asymptotics

ทฤษฎีแบบอะซิมโทติคศึกษาคุณสมบัติของตัวประมาณค่าและสถิติการทดสอบเมื่อขนาดตัวอย่างใกล้ถึงระยะอนันต์

1
MLE ของ
สมมติว่ามี pdf(X,Y)(X,Y)(X,Y) fθ(x,y)=e−(x/θ+θy)1x>0,y>0,θ>0fθ(x,y)=e−(x/θ+θy)1x>0,y>0,θ>0f_{\theta}(x,y)=e^{-(x/\theta+\theta y)}\mathbf1_{x>0,y>0}\quad,\,\theta>0 ความหนาแน่นของตัวอย่างดึงมาจากประชากรนี้จึงเป็น(X,Y)=(Xi,Yi)1≤i≤n(X,Y)=(Xi,Yi)1≤i≤n(\mathbf X,\mathbf Y)=(X_i,Y_i)_{1\le i\le n} gθ(x,y)=∏i=1nfθ(xi,yi)=exp[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn>0=exp[−nx¯θ−θny¯]1x(1),y(1)>0,θ>0gθ(x,y)=∏i=1nfθ(xi,yi)=exp⁡[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn>0=exp⁡[−nx¯θ−θny¯]1x(1),y(1)>0,θ>0\begin{align} g_{\theta}(\mathbf x,\mathbf y)&=\prod_{i=1}^n f_{\theta}(x_i,y_i) \\&=\exp\left[{-\sum_{i=1}^n\left(\frac{x_i}{\theta}+\theta y_i\right)}\right]\mathbf1_{x_1,\ldots,x_n,y_1,\ldots,y_n>0} \\&=\exp\left[-\frac{n\bar x}{\theta}-\theta n\bar y\right]\mathbf1_{x_{(1)},y_{(1)}>0}\quad,\,\theta>0 \end{align} ตัวประมาณโอกาสสูงสุดของสามารถได้รับเป็นθθ\theta θ^(X,Y)=X¯¯¯¯Y¯¯¯¯−−−√θ^(X,Y)=X¯Y¯\hat\theta(\mathbf X,\mathbf Y)=\sqrt\frac{\overline X}{\overline Y} ฉันต้องการทราบว่าการ จำกัด การกระจายของ MLE นี้เป็นปกติหรือไม่ เป็นที่ชัดเจนว่าเป็นสถิติที่เพียงพอสำหรับตามกลุ่มตัวอย่างคือY)θθ\theta(X¯¯¯¯,Y¯¯¯¯)(X¯,Y¯)(\overline X,\overline Y) ตอนนี้ฉันจะได้กล่าวว่า MLE เป็นอาการปกติโดยไม่ต้องสงสัยถ้ามันเป็นสมาชิกของตระกูลเลขชี้กำลังหนึ่งพารามิเตอร์แบบปกติ ฉันไม่คิดว่าเป็นเช่นนั้นส่วนหนึ่งเป็นเพราะเรามีสถิติเพียงพอสองมิติสำหรับพารามิเตอร์หนึ่งมิติ (เช่นในการแจกแจง )N(θ,θ2)N(θ,θ2)N(\theta,\theta^2) การใช้ความจริงที่ว่าและเป็นตัวแปรเอกซ์โปเนนเชียลที่เป็นอิสระฉันสามารถแสดงให้เห็นว่าการกระจายที่แน่นอนของเป็นเช่นนั้นXXXYYYθθ^θ^\hat\theta θ^θ=dF−−√, where F∼F2n,2nθ^θ=dF, where F∼F2n,2n\frac{\hat\theta}{\theta}\stackrel{d}{=} \sqrt F\quad,\text{ where …

4
เราจะอธิบายได้อย่างไรว่าตัวประเมินที่ไม่เอนเอียงคืออะไรสำหรับคนธรรมดา?
สมมติว่าเป็นประมาณการที่เป็นกลางสำหรับ\แล้วแน่นอน\ θE[ θ |θ]=θθ^θ^\hat{\theta}θθ\thetaE[θ^∣θ]=θE[θ^∣θ]=θ\mathbb{E}[\hat{\theta} \mid \theta] = \theta เราอธิบายเรื่องนี้กับคนทั่วไปได้อย่างไร? ในอดีตสิ่งที่ฉันพูดคือถ้าคุณเฉลี่ยค่าของเป็นจำนวนมากเมื่อขนาดตัวอย่างใหญ่ขึ้นคุณจะได้ประมาณดีขึ้น θθ^θ^\hat{\theta}θθ\theta สำหรับฉันแล้วนี่เป็นปัญหา ฉันคิดว่าสิ่งที่ฉันอธิบายจริง ๆ นี่คือปรากฏการณ์ของการเป็นแบบไม่ลำเอียงแบบไม่มีสัญญาณแทนที่จะเป็นแบบไม่เอนเอียงคือ ที่\ hat {\ theta}มีแนวโน้มที่จะขึ้นอยู่กับnlimn→∞E[θ^∣θ]=θ,limn→∞E[θ^∣θ]=θ,\lim_{n \to \infty}\mathbb{E}[\hat{\theta} \mid \theta] = \theta\text{,}θ^θ^\hat{\theta}nnn ดังนั้นเราจะอธิบายได้อย่างไรว่าตัวประมาณที่เป็นกลางคืออะไรกับคนธรรมดา?

2
คำจำกัดความทางคณิตศาสตร์ของ Infill Asymptotics
ฉันกำลังเขียนกระดาษที่ใช้ asymptotics infill และหนึ่งในผู้ตรวจสอบของฉันได้ขอให้ฉันให้คำจำกัดความทางคณิตศาสตร์ที่เข้มงวดของสิ่งที่ asymptotics infill คือ (เช่นมีสัญลักษณ์ทางคณิตศาสตร์และสัญกรณ์) ฉันดูเหมือนจะไม่พบสิ่งใดในวรรณคดีและหวังว่าจะมีใครบางคนชี้แนะฉันในทิศทางของบางคนหรือให้คำจำกัดความที่เขียนด้วยตัวเอง หากคุณไม่คุ้นเคยกับ infill asymptotics (หรือที่เรียกว่า asymptotics ของโดเมนแบบคงที่) พวกเขามีดังต่อไปนี้: Infill asymptotics ขึ้นอยู่กับการสังเกตที่มีความหนาแน่นมากขึ้นในบางพื้นที่ที่แน่นอนและมีขอบเขตเมื่อจำนวนเพิ่มขึ้น ระบุไว้มิฉะนั้น infill asymptotics เป็นที่เก็บข้อมูลเพิ่มเติมโดยการสุ่มตัวอย่างหนาแน่นขึ้นในโดเมนคงที่ ฉันได้ดู Stein 1999 และ Cressie 1993 แล้ว แต่ไม่มีอะไร "ทางคณิตศาสตร์" ที่นั่นอย่างเข้มงวด นี่คือข้อความที่ยกมาจากกระดาษของฉัน ดังนั้นจึงเป็นสิ่งสำคัญที่จะรับรู้ชนิดของ asymptotics ที่เรากำลังเผชิญอยู่ ในกรณีของเรา asymptotics ที่เราจัดการนั้นมีพื้นฐานมาจากการสังเกตที่หนาแน่นมากขึ้นในบางพื้นที่ที่แน่นอนและมีขอบเขตเมื่อจำนวนเพิ่มขึ้น asymptotics ประเภทนี้เรียกว่าasymptotics แบบโดเมนคงที่ (Stein, 1999) หรือasymptotics infill (Cressie, 1993) Infill …

2
สถิติของ Chi Squared ของ Pearson ประมาณว่าการกระจายตัวของ Chi Squared อย่างไร
ดังนั้นหากได้รับสถิติ Chi Squared ของ Pearson สำหรับตารางรูปแบบของมันคือ:1×N1×N1 \times N ∑i=1n(Oi−Ei)2Ei∑i=1n(Oi−Ei)2Ei\sum_{i=1}^n\frac{(O_i - E_i)^2}{E_i} จากนั้นสิ่งนี้จะประมาณการกระจาย Chi-Squared ที่มีอิสระขององศาเมื่อขนาดตัวอย่างมีขนาดใหญ่ขึ้น χ2n−1χn−12\chi_{n-1}^2n−1n−1n-1NNN สิ่งที่ฉันไม่เข้าใจก็คือวิธีการประมาณ asymptotic นี้ทำงานอย่างไร ฉันรู้สึกเหมือน 's ในหารจะถูกแทนที่ด้วย{} นับได้ว่าจะให้คุณสำหรับ(0,1) แต่แน่นอนว่ามันมีอิสระแบบองศาไม่ใช่ดังนั้นจึงมีบางอย่างที่ชัดเจนเกิดขึ้นEiEiE_is2inisi2ni\frac{s_i^2}{n_i}χ2n=∑ni=1Z2iχn2=∑i=1nZi2\chi_n^2 = \sum_{i=1}^nZ_i^2Zi∼n(0,1)Zi∼n(0,1)Z_i\sim n(0,1)nnnn−1n−1n-1

2
สามารถใช้การทำซ้ำ MCMC หลังจากการเบิร์นเพื่อการประมาณความหนาแน่นได้หรือไม่?
หลังจากเบิร์นอินเราสามารถใช้การทำซ้ำ MCMC โดยตรงสำหรับการประมาณความหนาแน่นเช่นโดยการพล็อตฮิสโตแกรมหรือการประมาณความหนาแน่นของเคอร์เนล ความกังวลของฉันคือการทำซ้ำ MCMC ไม่จำเป็นต้องเป็นอิสระแม้ว่าจะมีการกระจายตัวเหมือนกันมากที่สุด จะเป็นอย่างไรถ้าเราใช้การทำ MCMC ซ้ำต่อไป ความกังวลของฉันคือการทำซ้ำ MCMC นั้นไม่เกี่ยวข้องกันมากที่สุดและยังไม่เป็นอิสระ พื้นดินที่ฉันเรียนรู้สำหรับการใช้ฟังก์ชันการแจกแจงเชิงประจักษ์เป็นการประมาณค่าของฟังก์ชันการแจกแจงที่แท้จริงขึ้นอยู่กับทฤษฎีบท Glivenko - Cantelliที่ซึ่งฟังก์ชันการแจกแจงเชิงประจักษ์ถูกคำนวณตามตัวอย่าง iid ฉันดูเหมือนจะเห็นบางสิ่ง (ผลลัพธ์แบบอะซิมโทติค) สำหรับการใช้ฮิสโตแกรมหรือการประมาณความหนาแน่นของเคอร์เนลเป็นการประมาณความหนาแน่น แต่ฉันจำไม่ได้

1
ความหนาแน่นของหุ่นยนต์ที่เดินแบบสุ่มในกราฟเรขาคณิตแบบสุ่มที่ไม่มีที่สิ้นสุด
พิจารณาอนันต์กราฟเรขาคณิตแบบสุ่มในสถานที่ที่โหนดเป็นไปตามกระบวนการจุด Poisson ที่มีความหนาแน่นและขอบจะอยู่ระหว่างโหนดที่อยู่ใกล้กว่าง ดังนั้นความยาวของขอบจึงเป็นไปตาม PDF ดังต่อไปนี้:ρρ\rhoddd f(l)={2ld2l≤d0l>df(l)={2ld2l≤d0l>d f(l)= \begin{cases} \frac{2 l}{d^2} \;\quad l \le d \\ 0 \qquad\; l > d \end{cases} ในกราฟข้างต้นพิจารณาโหนดภายในวงกลมของรัศมีศูนย์กลางที่แหล่งกำเนิด สมมติว่าในเวลาt = 0เราวางหุ่นยนต์ตัวเล็ก ๆ ไว้ในแต่ละโหนดที่กล่าวถึง นั่นคือความหนาแน่นของหุ่นยนต์บนเครื่องบินโดย:rrrt=0t=0t=0 โดยที่lคือระยะทางจากจุดกำเนิด รูปต่อไปนี้แสดงตัวอย่างตำแหน่งเริ่มต้นของหุ่นยนต์g(l)={ρl≤r0l>dg(l)={ρl≤r0l>d g(l)= \begin{cases} \rho \quad l \le r \\ 0 \quad\; l > d \end{cases} lll ในแต่ละขั้นตอนหุ่นยนต์จะไปที่หนึ่งในเพื่อนบ้านแบบสุ่ม ทีนี้คำถามของฉันคือ: ฟังก์ชันความหนาแน่นของหุ่นยนต์ที่คืออะไร? เป็นไปได้ที่จะคำนวณฟังก์ชั่นความหนาแน่นเมื่อt …

4
การกระจายแบบไม่แสดงอาการของมัลติโนเมียล
ฉันกำลังมองหาการ จำกัด การกระจายตัวของการกระจายตัวแบบมัลติโนเมียมากกว่าผลลัพธ์ IE กระจายดังต่อไปนี้ limn→∞n−12Xnlimn→∞n−12Xn\lim_{n\to \infty} n^{-\frac{1}{2}} \mathbf{X_n} โดยที่เป็นตัวแปรสุ่มค่าเวกเตอร์ที่มีความหนาแน่นf n ( x )สำหรับxเช่นนั้น∑ ฉันx ฉัน = n , x ฉัน ∈ Z , x ฉัน ≥ 0และ 0 สำหรับxอื่น ๆ ทั้งหมดโดยที่XnXn\mathbf{X_n}fn(x)fn(x)f_n(\mathbf{x})xx\mathbf{x}∑ixi=n∑ixi=n\sum_i x_i=nxi∈Z,xi≥0xi∈Z,xi≥0x_i\in \mathbb{Z}, x_i\ge 0xx\mathbf{x} fn(x)=n!∏i=1dpxiixi!fn(x)=n!∏i=1dpixixi!f_{n}(\mathbf{x})=n!\prod_{i=1}^d\frac{p_i^{x_i}}{x_i!} ฉันพบหนึ่งรูปแบบใน "ทฤษฎีทั้งหมด" ของ Larry Wasserman 14.6 หน้า 237แต่สำหรับการ จำกัด การกระจายมันให้ Normal กับเมทริกซ์ความแปรปรวนร่วมเอกพจน์ดังนั้นฉันไม่แน่ใจว่าจะทำให้มาตรฐานเป็นปกติได้อย่างไร คุณสามารถฉายเวกเตอร์สุ่มลงในช่องว่างมิติ …

1
เมทริกซ์ความแปรปรวนร่วมซีโมติกคืออะไร?
มันเป็นความจริงไหมที่เมทริกซ์ความแปรปรวนร่วมซีโมติกเท่ากับเมทริกซ์ความแปรปรวนร่วมของการประมาณค่าพารามิเตอร์? ถ้าไม่มันคืออะไร อะไรคือความแตกต่างระหว่างเมทริกซ์ความแปรปรวนร่วมกับเมทริกซ์ความแปรปรวนร่วมแบบเชิงซ้อนในกรณีนั้น? ขอบคุณล่วงหน้า!

1
ค่าสถิติเชิงลำดับของการแจกแจงแบบเทลด์หนัก
พื้นหลัง: ฉันมีตัวอย่างที่ฉันต้องการสร้างแบบจำลองที่มีการกระจายแบบเทลด์อย่างหนัก ฉันมีค่ามากเช่นการแพร่กระจายของการสังเกตมีขนาดค่อนข้างใหญ่ ความคิดของฉันคือทำแบบนี้ด้วยการแจกแจงแบบพาเรโตทั่วไปและฉันก็ทำไปแล้ว ตอนนี้ quantile 0.975 ของข้อมูลเชิงประจักษ์ของฉัน (ประมาณ 100 datapoints) ต่ำกว่า 0.975 quantile ของการแจกแจง Generalized Pareto ที่ฉันพอดีกับข้อมูลของฉัน ตอนนี้ฉันคิดว่ามีวิธีตรวจสอบว่าความแตกต่างนี้เป็นสิ่งที่ต้องกังวลหรือไม่ เรารู้ว่าการแจกแจงเชิงเส้นกำกับของควอนไทล์จะได้รับเป็น: ดังนั้นฉันจึงคิดว่ามันเป็นความคิดที่ดีที่จะสร้างความบันเทิงด้วยความอยากรู้อยากเห็นของฉันโดยพยายามพล็อตแถบความเชื่อมั่น 95% รอบ ๆ 0.975 ควอไทล์ของการแจกแจงแบบพาเรโตทั่วไปด้วยพารามิเตอร์เดียวกับที่ฉันได้รับ อย่างที่คุณเห็นเรากำลังทำงานกับค่าที่สุดยอดบางอย่างที่นี่ และเนื่องจากการแพร่กระจายมีขนาดใหญ่มากฟังก์ชั่นความหนาแน่นมีค่าน้อยมากทำให้วงความเชื่อมั่นไปที่คำสั่งของโดยใช้ความแปรปรวนของสูตรเชิงบรรทัดฐานเชิงเส้นกำกับด้านบน:±1012±1012\pm 10^{12} ± 1.960.975 ∗ 0.025n (ฉจีพีD(Q0.975))2±1.960.975* * * *0.025n(ฉGPD(Q0.975))2\pm 1.96\frac{0.975*0.025}{n({f_{GPD}(q_{0.975})})^2} ดังนั้นนี่ไม่สมเหตุสมผลเลย ฉันมีการแจกจ่ายที่มีผลลัพธ์เชิงบวกเท่านั้นและช่วงความมั่นใจรวมถึงค่าลบ มีบางอย่างเกิดขึ้นที่นี่ ถ้าผมคำนวณวงรอบ 0.5 quantile, วงดนตรีที่จะไม่ว่าขนาดใหญ่ แต่ยังคงขนาดใหญ่ ผมดำเนินการต่อเพื่อดูวิธีการนี้ไปกับการกระจายอีกคือกระจาย จำลองการสังเกตจากการแจกแจงและตรวจสอบว่า quantiles อยู่ในช่วงความเชื่อมั่นหรือไม่ …

1
การจำลองการบรรจบกันของความน่าจะเป็นให้คงที่
ผลลัพธ์แบบอะซิมโทติคไม่สามารถพิสูจน์ได้ด้วยการจำลองด้วยคอมพิวเตอร์เนื่องจากเป็นข้อความที่เกี่ยวข้องกับแนวคิดของอนันต์ แต่เราควรจะได้รับความรู้สึกว่าสิ่งต่าง ๆ เป็นจริงตามที่ทฤษฎีบอกเรา พิจารณาผลลัพธ์ทางทฤษฎี limn→∞P(|Xn|>ϵ)=0,ϵ>0limn→∞P(|Xn|>ϵ)=0,ϵ>0\lim_{n\rightarrow\infty}P(|X_n|>\epsilon) = 0, \qquad \epsilon >0 โดยที่XnXnX_nเป็นฟังก์ชั่นของตัวแปรสุ่มnnnพูดกันอย่างอิสระและกระจายตัว นี่บอกว่าXnXnX_nแปรเปลี่ยนความน่าจะเป็นเป็นศูนย์ ตัวอย่างต้นแบบที่นี่ฉันเดาว่าเป็นกรณีที่XnXnX_nเป็นค่าเฉลี่ยตัวอย่างลบด้วยค่าที่คาดหวังร่วมกันของตัวอย่าง iidrv Xn=1n∑i=1nYi−E[Y1]Xn=1n∑i=1nYi−E[Y1]X_n = \frac 1n\sum_{i=1}^nY_i - E[Y_1] คำถาม: เราจะแสดงให้คนเห็นได้อย่างไรว่าความสัมพันธ์ข้างต้น "ปรากฏขึ้นในโลกแห่งความเป็นจริง" โดยใช้ผลการจำลองด้วยคอมพิวเตอร์จากตัวอย่างที่มีความจำเป็น โปรดทราบว่าฉันเลือกลู่เข้าเป็นค่าคงที่โดยเฉพาะ ฉันให้วิธีการด้านล่างของฉันเป็นคำตอบและฉันหวังว่าสำหรับคนที่ดีกว่า UPDATE:มีบางอย่างที่ด้านหลังศีรษะของฉันรบกวนฉัน - และฉันก็รู้ว่าอะไร ฉันขุดขึ้นมาเป็นคำถามเก่าที่สนทนาที่น่าสนใจมากที่สุดไปในในความคิดเห็นเพื่อหนึ่งในคำตอบ ในนั้น @ Cardinal ให้ตัวอย่างของตัวประมาณว่ามันสอดคล้องกัน แต่ความแปรปรวนของมันยังคงไม่เป็นศูนย์และแน่นอนที่ไม่มีอาการ ดังนั้นคำถามที่แตกต่างของคำถามของฉันจะรุนแรงขึ้น: เราจะแสดงโดยการจำลองว่าสถิติมาบรรจบกันในความน่าจะเป็นเป็นค่าคงที่ได้อย่างไรเมื่อสถิตินี้รักษาความแปรปรวนที่ไม่เป็นศูนย์และไม่มีขอบเขตแบบ asymptotically

1
ตัวอย่างของ CLT เมื่อไม่มีช่วงเวลา
พิจารณา Xn=⎧⎩⎨1−12kw.p. (1−2−n)/2w.p. (1−2−n)/2w.p. 2−k for k>nXn={1w.p. (1−2−n)/2−1w.p. (1−2−n)/22kw.p. 2−k for k>nX_n = \begin{cases} 1 & \text{w.p. } (1 - 2^{-n})/2\\ -1 & \text{w.p. } (1 - 2^{-n})/2\\ 2^k & \text{w.p. } 2^{-k} \text{ for } k > n\\ \end{cases} ฉันต้องแสดงให้เห็นว่าถึงแม้จะมีช่วงเวลาไม่สิ้นสุด n−−√(X¯n)→dN(0,1)n(X¯n)→dN(0,1)\sqrt{n}(\bar{X}_n) \overset{d}{\to} N(0,1) ฉันได้ลองแสดงสิ่งนี้โดยใช้ทฤษฎีความต่อเนื่องของเลวีคือพยายามแสดงให้เห็นว่าฟังก์ชั่นลักษณะของด้านซ้ายบรรจบกับฟังก์ชั่นลักษณะของมาตรฐานปกติ อย่างไรก็ตามเรื่องนี้ดูเหมือนจะเป็นไปไม่ได้ที่จะแสดง คำแนะนำที่มีให้สำหรับปัญหานี้คือการตัดส่วนแต่ละส่วนออก XiXiX_iคือปล่อยให้และใช้สภาพ Lindeberg เพื่อแสดงว่า …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.