คำถามติดแท็ก mathematical-statistics

ทฤษฎีทางคณิตศาสตร์ของสถิติที่เกี่ยวข้องกับคำจำกัดความที่เป็นทางการและผลลัพธ์ทั่วไป

3
ถ้าเป็น IID ให้คำนวณโดยที่
คำถาม หากมี IID แล้วคำนวณที่x_iX1,⋯,Xn∼N(μ,1)X1,⋯,Xn∼N(μ,1)X_1,\cdots,X_n \sim \mathcal{N}(\mu, 1)E(X1∣T)E(X1∣T)\mathbb{E}\left( X_1 \mid T \right)T=∑iXiT=∑iXiT = \sum_i X_i ความพยายาม : โปรดตรวจสอบว่าด้านล่างถูกต้องหรือไม่ สมมติว่าเราใช้ผลรวมของความคาดหวังตามเงื่อนไขเหล่านั้น หมายความว่าแต่ละตั้งแต่คือ IID∑iE(Xi∣T)=E(∑iXi∣T)=T.∑iE(Xi∣T)=E(∑iXi∣T)=T.\begin{align} \sum_i \mathbb{E}\left( X_i \mid T \right) = \mathbb{E}\left( \sum_i X_i \mid T \right) = T . \end{align}E(Xi∣T)=TnE(Xi∣T)=Tn\mathbb{E}\left( X_i \mid T \right) = \frac{T}{n}X1,…,XnX1,…,XnX_1,\ldots,X_n ดังนั้นE(X1∣T)=TnE(X1∣T)=Tn\mathbb{E}\left( X_1 \mid T \right) = \frac{T}{n}{n} …

3
สามารถสร้างการกระจายข้อต่อ 3D ได้อีกครั้งด้วยระยะขอบ 2 มิติหรือไม่
สมมติว่าเรารู้ว่า p (x, y), p (x, z) และ p (y, z), จริงไหมที่การกระจายข้อต่อ p (x, y, z) สามารถระบุได้? นั่นคือมีเพียง p (x, y, z) ที่เป็นไปได้ซึ่งมีระยะขอบเกินหรือไม่

3
CDF ปกติใดของการแจกแจงแบบแปรผันตามตัวแปรสุ่มเบต้า
สมมติว่าคุณกำหนด: X∼Beta(α,β)X∼Beta(α,β)X\sim\mbox{Beta}(\alpha,\beta) Y∼Φ−1(X)Y∼Φ−1(X)Y\sim \Phi^{-1}(X) ที่Φ−1Φ−1\Phi^{-1}เป็นสิ่งที่ตรงกันข้ามของCDF ของการกระจายแบบปกติมาตรฐาน คำถามของฉันคือมีการกระจายง่ายที่YYYต่อไปนี้หรือที่สามารถใกล้เคียงกับYYY ? ฉันถามเพราะฉันสงสัยอย่างมากจากผลการจำลอง (แสดงด้านล่าง) ที่YYYเปลี่ยนเป็นการแจกแจงแบบปกติเมื่อαα\alphaและββ\betaสูง แต่ฉันไม่รู้ว่าทำไมมันถึงเป็นคณิตศาสตร์ (แน่นอนว่าเมื่อα=1;β=1α=1;β=1\alpha=1;\beta=1 , XXXจะเหมือนกันและYYYจะเป็นมาตรฐานปกติ แต่ทำไมมันจะเป็นจริงสำหรับค่าที่สูงขึ้น?) หากไม่มาบรรจบกันเพื่อปกติสิ่งที่จะพารามิเตอร์ของการที่เป็นปกติในแง่ของαα\alphaและββ\beta ? (ฉันคาดหวังว่าค่าเฉลี่ยจะเป็นΦ−1(αα+β)Φ−1(αα+β)\Phi^{-1}(\frac{\alpha}{\alpha+\beta})เนื่องจากเป็นการเปลี่ยนแปลงของโหมด แต่ฉันไม่รู้ค่าเบี่ยงเบนมาตรฐาน) (วางวิธีอื่นนี้อาจจะถามว่า "ไม่Φ(Norm(μ,σ))Φ(Norm(μ,σ))\Phi(\mbox{Norm}(\mu, \sigma))บรรจบกับการกระจายเบต้าสำหรับทิศทางของบางμμ\muและσσ\sigma " ผมไม่แน่ใจว่าไม่ว่าจะเป็นเรื่องง่ายที่จะตอบ) ผลการจำลอง ที่นี่ฉันแสดงเหตุผลที่ฉันสงสัยว่าผลที่ได้เป็นเรื่องปกติ (เนื่องจากฉันไม่สามารถสำรองด้วยคณิตศาสตร์) การจำลองการสามารถทำได้ใน R กับและ ตัวอย่างเช่นการเลือกพารามิเตอร์สูงα = 3000และβ = 7000 :YYYqnormrnormα=3000α=3000\alpha=3000β=7000β=7000\beta=7000 hist(qnorm(rbeta(5000, 3000, 7000))) สิ่งนี้ดูปกติqqnormและการทดสอบ Shapiro-Wilk (ซึ่งปกติคือสมมุติฐานว่าง) แนะนำเช่น: qqnorm(qnorm(rbeta(5000, 3000, 7000))) shapiro.test(qnorm(rbeta(5000, 3000, 7000))) …

2
คุณช่วยอธิบายความขัดแย้งของ Simpson ด้วยสมการแทนที่จะเป็นตารางฉุกเฉินได้ไหม
ฉันอาจไม่ได้มีความเข้าใจที่ชัดเจนของความขัดแย้งซิมป์สัน ฉันรู้ว่าค่าเฉลี่ยของการตอบสนอง Y1 ซึ่งจัดกลุ่มตามระดับของปัจจัย A ที่เป็นไปได้ทั้งหมดอาจสูงกว่าค่าเฉลี่ยของการตอบสนอง Y2 ในทุกระดับของ A แม้ว่าค่าเฉลี่ยของ Y1 สำหรับแต่ละระดับของ A (แต่ละกลุ่ม) คือ น้อยกว่าค่าเฉลี่ยของ Y2 ที่สอดคล้องกันเสมอ ฉันได้อ่านตัวอย่าง แต่ฉันก็ยังประหลาดใจในแต่ละครั้งที่ฉันเห็นอาจเป็นเพราะฉันไม่ได้เรียนรู้อย่างดีจากตัวอย่างที่เฉพาะเจาะจง: ฉันมีปัญหาในการพูดคุยทั่วไป ฉันเรียนรู้ได้ดีที่สุดและอยากจะเห็นคำอธิบายในสูตร คุณช่วยอธิบายความขัดแย้งที่อาศัยสมการแทนที่จะเป็นตารางนับได้ไหม นอกจากนี้ฉันคิดว่าเหตุผลที่ทำให้ฉันประหลาดใจก็คือฉันอาจตั้งสมมติฐานบางอย่างเกี่ยวกับค่าเฉลี่ยที่เกี่ยวข้องในความขัดแย้งซึ่งอาจไม่เป็นความจริงโดยทั่วไปโดยไม่รู้ตัว บางทีฉันอาจลืมน้ำหนักด้วยจำนวนตัวอย่างในแต่ละกลุ่ม? แต่จากนั้นฉันอยากเห็นสมการที่แสดงให้ฉันเห็นว่าการประเมินค่าเฉลี่ยโดยรวมมีความแม่นยำมากขึ้นถ้าฉันให้น้ำหนักแต่ละกลุ่มเฉลี่ยตามจำนวนตัวอย่างในแต่ละกลุ่มเพราะ (ถ้าเป็นจริง) จะไม่ชัดเจน ถึงฉันโดยทั่วไป อย่างไร้เดียงสาฉันคิดว่าการประมาณค่าของE [ Y1]E[Y1]\mathbf{E}[Y_1]มีข้อผิดพลาดมาตรฐานที่ต่ำกว่าเมื่อฉันมีตัวอย่างมากขึ้นโดยไม่คำนึงถึงน้ำหนัก

5
เส้นทางสู่สถิติทางคณิตศาสตร์ที่ไม่มีพื้นฐานการวิเคราะห์: หนังสือเรียนที่เหมาะสำหรับการศึกษาด้วยตนเอง
ฉันมีความโน้มเอียงทางคณิตศาสตร์ค่อนข้างมาก - มีคณิตศาสตร์ 6 ภาคการศึกษาในระดับปริญญาตรีของฉัน - แม้ว่าฉันจะไม่ได้ฝึกฝนสักหน่อยและพูดช้าๆด้วยสมการเชิงอนุพันธ์ย่อยบางส่วนและการบูรณาการเส้นทางที่แนวคิดของฉันกลับมา ฉันยังไม่เคยมีหลักสูตรเกี่ยวกับการพิสูจน์ทางคณิตศาสตร์ (การคิดเชิงคณิตศาสตร์) หรือการวิเคราะห์ ฉันเข้าใจความน่าจะเป็นในระดับบัณฑิตศึกษาด้วย - ได้ศึกษาอย่างเป็นทางการและฟื้นฟูความรู้ของฉันเมื่อไม่นานมานี้ ฉันยังมีหลักสูตรระดับบัณฑิตศึกษาสองสามหลักสูตรเกี่ยวกับสถิติและการเรียนรู้ทางสถิติ ฉันต้องการศึกษาสถิติทางคณิตศาสตร์ในอีก 18-24 เดือนข้างหน้าโดยไม่สนใจผลประโยชน์ส่วนตัว ฉันต้องการสละเวลาเรียน 5 ชั่วโมงโดยเฉลี่ยต่อสัปดาห์ ฉันเป็นบิตที่สูญเสียในการทำ ฉันลองศึกษาจากหนังสือCasella และ Bergerแต่ไม่สามารถทำอะไรได้เลย ฉันพบว่าหนังสือเล่มนี้น่าเบื่อนิดหน่อยและวิธีการรักษายาก สิ่งที่ฉันพบยากเกี่ยวกับ Casella และ Berger: อายที่จะพูดแบบนี้ แต่การเริ่มต้นสำหรับการตั้งค่าประเภท - วิธีการบรรจุเพื่อลดพื้นที่สีขาวทำให้ฉันหมดแรง มีหลักฐานมากมายที่อยู่ที่นั่น แต่ฉันรู้สึกว่าขาดสัญชาตญาณว่าทำไมเราจึงพยายามบรรลุผลและสิ่งที่เป็นเป้าหมายที่ใหญ่กว่าในมือ การอ้างอิงของบทพิสูจน์จากบทก่อนหน้านี้เป็นวิธีที่ทำให้วัสดุค่อนข้างยากสำหรับฉัน - ฉันจะกลับไปมากจนกระทั่งในที่สุดฉันก็ยอมแพ้ ตัวอย่างดูเหมือนจะเป็นไปได้มาก แต่ฉันไม่สามารถแก้ไขปัญหาได้ - ปัญหาดูเหมือนว่าจะอยู่ในชั้นเรียนด้วยตัวเอง ฉันไม่สามารถเข้าไปในเนื้อหา - และฉันสงสัยว่าวิธีการทำงานของจิตใจของฉันฉันต้องการการรักษาที่เข้มงวดมากขึ้น - ฉันควรพิจารณาวิธีการทางทฤษฎีการวัดทางสถิติสถิติหรือไม่? ดังนั้นคำถาม : มีตำราเรียนที่ใครบางคนในรองเท้าของฉันสามารถเรียนรู้และสอนตัวเองได้ …

1
ค่าเฉลี่ยเดียวกัน, ความแปรปรวนต่างกัน
สมมติว่าคุณมีนักวิ่งแปดคนวิ่งแข่ง การกระจายตัวของเวลาทำงานส่วนตัวของพวกเขาคือปกติและแต่ละช่วงเวลามีความยาว111111วินาที ค่าเบี่ยงเบนมาตรฐานของรองชนะเลิศอันดับหนึ่งคือค่าที่เล็กที่สุดสองค่าที่สองที่เล็กที่สุดค่าที่สามน้อยที่สุดและแปดค่าที่ใหญ่ที่สุด คำถามสองข้อทำให้ฉันสับสน: (1) ความน่าจะเป็นที่ผู้ชนะคนสุดท้ายคืออะไรและ (2) ใครที่มีแนวโน้มจะชนะการแข่งขันมากที่สุด? คำตอบของฉันมี1/21/21/2และ888ตามลำดับ เนื่องจากพวกเขาแบ่งปันค่าเฉลี่ยเท่ากันน่าจะเป็นที่x¯1−x¯8<0x¯1−x¯8<0\bar x_1-\bar x_8\lt 0เป็นเพียง1/21/21/2ไม่? ฉันจะแสดงให้เห็นถึงส่วนที่สองอย่างจริงจังและสามารถคำนวณความน่าจะเป็นที่แน่นอนได้อย่างไร ขอบคุณล่วงหน้า.

1
เหตุใดคำจำกัดความของตัวประมาณที่สอดคล้องกันจึงเป็นเช่นนั้น แล้วนิยามทางเลือกของความสอดคล้องล่ะ
อ้างอิงจากวิกิพีเดีย: ในสถิติการประมาณการที่สอดคล้องกันหรือประมาณการสอดคล้อง asymptotically เป็นประมาณการ-กฎสำหรับการประมาณการของพารามิเตอร์การคำนวณθ∗θ∗θ^* -having ทรัพย์สินที่เป็นจำนวนจุดข้อมูลที่ใช้เพิ่มขึ้นเรื่อย ๆ ตามลำดับที่เกิดจากลู่ประมาณการในความน่าจะเป็นθ∗θ∗θ^* . ที่จะทำให้คำสั่งนี้ช่วยให้แม่นยำθ∗θ∗\theta^*เป็นค่าของพารามิเตอร์ที่แท้จริงคุณต้องการที่จะประเมินและให้θ ( S n )เป็นกฎสำหรับการประเมินพารามิเตอร์นี้เป็นหน้าที่ของข้อมูล จากนั้นคำจำกัดความของความสอดคล้องของตัวประมาณสามารถแสดงด้วยวิธีต่อไปนี้:θ^(Sn)θ^(Sn)\hat\theta(S_n) limn→∞Pr[|θ(Sn^)−θ∗|≥ϵ]=0limn→∞Pr[|θ(Sn^)−θ∗|≥ϵ]=0\lim_{n \to \infty} Pr[|\hat{\theta(S_{n}}) - \theta^*|\geq \epsilon ]=0 คำถามของฉันดูเหมือนผิวเผินตั้งแต่แรกเห็น แต่เป็น: ทำไมคำว่า "ความสอดคล้อง / สอดคล้องกัน" ใช้เพื่ออธิบายพฤติกรรมของตัวประมาณนี้ เหตุผลที่ฉันสนใจเรื่องนี้ก็เพราะว่าสำหรับฉันโดยสังหรณ์ใจคำที่สอดคล้องกันหมายถึงสิ่งที่แตกต่าง (หรืออย่างน้อยก็ดูเหมือนจะแตกต่างจากฉันบางทีพวกเขาอาจจะแสดงให้เห็นว่าเท่ากัน) ให้ฉันบอกความหมายของตัวอย่างด้วย พูดว่า "คุณ" มีความสม่ำเสมอ "ดี" (สำหรับคำนิยามบางอย่างของความดี) จากนั้นก็หมายความว่าทุกครั้งที่คุณมีโอกาสที่จะพิสูจน์ / แสดงให้ฉันเห็นว่าคุณเป็นคนดีจริง ๆ คุณพิสูจน์ฉันว่าคุณเป็นคนดีทุกครั้ง (หรืออย่างน้อยก็ในเวลาส่วนใหญ่) ให้ใช้สัญชาตญาณของฉันเพื่อกำหนดความสอดคล้องของตัวประมาณ ขอให้ "คุณ" เป็นฟังก์ชั่นการคำนวณθและปล่อยให้ "ดี" หมายถึงวิธีการที่คุณจะห่างไกลจากการประมาณการจริงθ …

3
เหตุใดข้อความที่ตัดตอนมานี้บอกว่าการประมาณค่าเบี่ยงเบนมาตรฐานโดยปกติจะไม่เกี่ยวข้องกัน
ฉันอ่านเกี่ยวกับการคำนวณการประมาณค่าเบี่ยงเบนมาตรฐานและแหล่งข้อมูลที่ฉันอ่านระบุไว้ (... ) ยกเว้นในบางสถานการณ์ที่สำคัญงานมีความเกี่ยวข้องเพียงเล็กน้อยกับการใช้งานสถิติเนื่องจากความต้องการของมันถูกหลีกเลี่ยงโดยขั้นตอนมาตรฐานเช่นการใช้การทดสอบที่สำคัญและช่วงความเชื่อมั่นหรือโดยใช้การวิเคราะห์แบบเบย์ ฉันสงสัยว่าถ้าใครสามารถอธิบายเหตุผลของข้อความนี้ได้ตัวอย่างเช่นช่วงความมั่นใจไม่ได้ใช้ค่าเบี่ยงเบนมาตรฐานเป็นส่วนหนึ่งของการคำนวณหรือไม่ ดังนั้นช่วงความเชื่อมั่นจะไม่ได้รับผลกระทบจากค่าเบี่ยงเบนมาตรฐานแบบเอนเอียงหรือไม่? แก้ไข: ขอบคุณสำหรับคำตอบจนถึงตอนนี้ แต่ฉันไม่แน่ใจว่าฉันทำตามเหตุผลบางอย่างของพวกเขาดังนั้นฉันจะเพิ่มตัวอย่างง่าย ๆ ประเด็นก็คือว่าถ้าแหล่งข้อมูลนั้นถูกต้องแล้วก็มีบางอย่างผิดปกติจากการสรุปตัวอย่างและฉันอยากให้ใครสักคนชี้ให้เห็นว่าค่า p ไม่ได้ขึ้นอยู่กับค่าเบี่ยงเบนมาตรฐานอย่างไร สมมติว่านักวิจัยต้องการทดสอบว่าคะแนนเฉลี่ยของนักเรียนระดับประถมห้าในการทดสอบในเมืองของเขาหรือเธอแตกต่างจากค่าเฉลี่ยของชาติที่ 76 ด้วยระดับนัยสำคัญ 0.05 หรือไม่ ผู้วิจัยสุ่มตัวอย่างนักเรียน 20 คน ค่าเฉลี่ยตัวอย่างเท่ากับ 80.85 ค่าเบี่ยงเบนมาตรฐานตัวอย่างเท่ากับ 8.87 ซึ่งหมายความว่า: t = (80.85-76) / (8.87 / sqrt (20)) = 2.44 จากนั้นใช้ตาราง t เพื่อคำนวณว่าค่าความน่าจะเป็นแบบสองด้านที่เท่ากับ 2.44 กับ 19 df เท่ากับ 0.025 นี่ต่ำกว่าระดับนัยสำคัญ 0.05 เราจึงปฏิเสธสมมติฐานว่าง ดังนั้นในตัวอย่างนี้ค่า p …

4
มีซีมโทติคอันดับสามอยู่หรือไม่?
ผลลัพธ์เชิงสถิติส่วนใหญ่พิสูจน์ว่าn→∞n→∞n \rightarrow \inftyตัวประมาณ (เช่น MLE) มาบรรจบกับการแจกแจงแบบปกติตามการขยายตัวของเทย์เลอร์อันดับสองของฟังก์ชันความน่าจะเป็น ฉันเชื่อว่ามีผลคล้ายกันในวรรณกรรม Bayesian, "ทฤษฎีบท Bayesian Central Limit" ซึ่งแสดงให้เห็นว่าด้านหลังบรรจบกันแบบอะซิมทีโทรติกกลับมาเป็นปกติเหมือนn→∞n→∞n \rightarrow \infty คำถามของฉันคือ - การกระจายเข้าหากันกับบางสิ่งบางอย่าง "ก่อนหน้า" จะกลายเป็นเรื่องปกติหรือไม่ขึ้นอยู่กับเทอมที่สามในซีรีส์ของ Taylor หรือเป็นไปไม่ได้ที่จะทำโดยทั่วไป?

1
Caret glmnet กับ cv.glmnet
ดูเหมือนจะมีความสับสนมากในการเปรียบเทียบการใช้glmnetภายในcaretเพื่อค้นหาแลมบ์ดาที่ดีที่สุดและใช้cv.glmnetในการทำงานเดียวกัน มีการตั้งคำถามมากมายเช่น: โมเดลการจำแนกประเภท train.glmnet vs. cv.glmnet วิธีที่เหมาะสมในการใช้ glmnet กับคาเร็ตคืออะไร? การตรวจสอบข้าม `glmnet 'โดยใช้` คาเร็ต' แต่ไม่ได้รับคำตอบซึ่งอาจเป็นเพราะความสามารถในการทำซ้ำของคำถาม ตามคำถามแรกฉันให้ตัวอย่างที่คล้ายกัน แต่มีคำถามเดียวกัน: ทำไม lambdas โดยประมาณแตกต่างกันอย่างไร library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to …

1
GAM กับ LOESS และ splines
บริบท : ผมอยากจะวาดเส้นใน scatterplot ที่ไม่ปรากฏพาราดังนั้นฉันใช้geom_smooth()ในในggplot Rมันจะส่งคืนโดยอัตโนมัติที่geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.ฉันรวบรวม GAM มาสำหรับโมเดลเสริมทั่วไปและใช้ลูกบาศก์อิสระ การรับรู้ต่อไปนี้ถูกต้องหรือไม่ ดินเหลืองคาดการณ์การตอบสนองที่ค่าเฉพาะ เส้นโค้งเป็นการประมาณที่เชื่อมต่อฟังก์ชั่นที่แตกต่างกันที่เหมาะสมกับข้อมูล (ซึ่งประกอบเป็นแบบจำลองการเติมทั่วไป) และลูกบาศก์ Splines เป็นประเภทของเส้นโค้งที่ใช้เฉพาะที่นี่ ในที่สุดควรใช้ splines เมื่อใดควรใช้ LOESS เมื่อใด

2
สืบทอดการกระจายปัวซอง
เมื่อไม่นานมานี้ฉันได้พบกับการแจกแจงปัวซองแบบกระจายตัว แต่ฉันสับสนเล็กน้อยว่ามันจะเกิดขึ้นได้อย่างไร การกระจายมอบให้โดย: P(X=x,Y=y)=e−(θ1+θ2+θ0)θx1x!θy2y!∑i=0min(x,y)(xi)(yi)i!(θ0θ1θ2)iP(X=x,Y=y)=e−(θ1+θ2+θ0)θ1xx!θ2yy!∑i=0min(x,y)(xi)(yi)i!(θ0θ1θ2)iP(X = x, Y = y) = e^{-(\theta_{1}+\theta_{2}+\theta_{0})} \displaystyle\frac{\theta_{1}^{x}}{x!}\frac{\theta_{2}^{y}}{y!} \sum_{i=0}^{min(x,y)}\binom{x}{i}\binom{y}{i}i!\left(\frac{\theta_{0}}{\theta_{1}\theta_{2}}\right)^{i} จากสิ่งที่ฉันสามารถรวบรวมได้θ0θ0\theta_{0}เทอมคือการวัดความสัมพันธ์ระหว่างXXXและYYY ; ดังนั้นเมื่อXXXและYYYเป็นอิสระθ0=0θ0=0\theta_{0} = 0และการกระจายจะกลายเป็นผลคูณของการแจกแจงแบบปัวซองแบบสองตัวแปร แบริ่งในใจ, สับสนของฉันคือการบอกกล่าวกับคำบวก - ฉันสมมติว่าในระยะนี้จะอธิบายถึงความสัมพันธ์ระหว่างXXXและYYYY ดูเหมือนว่าฉันว่า summand ถือเป็นผลคูณของฟังก์ชันการแจกแจงแบบทวินามที่น่าจะเป็นของ "ความสำเร็จ" โดย(θ0θ1θ2)(θ0θ1θ2)\left(\frac{\theta_{0}}{\theta_{1}\theta_{2}}\right)และความน่าจะเป็นของ "ความล้มเหลว" มอบให้โดยi!1min(x,y)−ii!1min(x,y)−ii!^{\frac{1}{min(x,y)-i}}เพราะ(i!1min(x,y)−i!)(min(x,y)−i)=i!(i!1min(x,y)−i!)(min(x,y)−i)=i!\left(i!^{\frac{1}{min(x,y)-i!}}\right)^{(min(x,y)-i)} = i!แต่ฉันสามารถออกไปได้ด้วยสิ่งนี้ ใครช่วยให้ความช่วยเหลือเกี่ยวกับวิธีการที่จะได้รับการกระจาย? นอกจากนี้ถ้ามันสามารถรวมอยู่ในคำตอบใด ๆ ว่ารูปแบบนี้อาจขยายไปยังสถานการณ์หลายตัวแปร (พูดว่าตัวแปรสุ่มสามตัวหรือมากกว่า) นั่นจะดีมาก! (ในที่สุดฉันได้ตั้งข้อสังเกตว่ามีคำถามที่คล้ายกันที่โพสต์ก่อนหน้านี้ ( ทำความเข้าใจเกี่ยวกับการแจกแจงปัวซอง bivariate ) แต่ที่มาไม่ได้สำรวจจริง ๆ )

1
ทำไมเราถึงสนใจว่ากระบวนการ MA กลับด้านได้หรือไม่?
ฉันมีปัญหาในการทำความเข้าใจว่าทำไมเราถึงสนใจว่ากระบวนการ MA นั้นกลับด้านหรือไม่ โปรดแก้ไขให้ฉันถ้าฉันผิด แต่ฉันสามารถเข้าใจได้ว่าทำไมเราถึงสนใจว่ากระบวนการ AR นั้นเป็นสาเหตุหรือไม่เช่นถ้าเราสามารถ "เขียนซ้ำ" เพื่อพูดเป็นผลรวมของพารามิเตอร์และเสียงสีขาว - เช่นกระบวนการเฉลี่ยเคลื่อนที่ ถ้าเป็นเช่นนั้นเราสามารถเห็นได้อย่างง่ายดายว่ากระบวนการ AR นั้นเป็นสาเหตุ อย่างไรก็ตามฉันมีปัญหาในการทำความเข้าใจว่าทำไมเราสนใจว่าเราสามารถแสดงกระบวนการ MA เป็นกระบวนการ AR ได้หรือไม่โดยแสดงให้เห็นว่ามันกลับไม่ได้ ฉันไม่เข้าใจว่าทำไมเราถึงสนใจ ความเข้าใจใด ๆ จะดีมาก

2
ปรีชาสักครู่เกี่ยวกับความหมายของการแจกแจงหรือไม่?
ใครสามารถให้สัญชาตญาณว่าทำไมช่วงเวลาที่สูงขึ้นของการแจกแจงความน่าจะเป็นเช่นช่วงเวลาที่สามและสี่สอดคล้องกับความเบ้และความโด่งตามลำดับ? ทำไมค่าเบี่ยงเบนเกี่ยวกับค่าเฉลี่ยยกกำลังสามหรือสี่จึงแปลเป็นตัวชี้วัดความเบ้และความโด่ง มีวิธีที่เกี่ยวข้องกับสิ่งนี้กับอนุพันธ์อันดับสามหรือสี่ของฟังก์ชันหรือไม่?pXpXp_X พิจารณาคำจำกัดความของความเบ้และความโด่ง: Skewness(X)=E[(X−μX)3]/σ3,Kurtosis(X)=E[(X−μX)4]/σ4.Skewness(X)=E[(X−μX)3]/σ3,Kurtosis(X)=E[(X−μX)4]/σ4.\begin{matrix} \text{Skewness}(X) = \mathbb{E}[(X - \mu_{X})^3] / \sigma^3, \\[6pt] \text{Kurtosis}(X) = \mathbb{E}[(X - \mu_{X})^4] / \sigma^4. \\[6pt] \end{matrix} ในสมการเหล่านี้เราเพิ่มค่าปกติเป็นพลังงานและนำค่าที่คาดไว้ ไม่ชัดเจนสำหรับฉันว่าทำไมการเพิ่มตัวแปรสุ่มให้เป็นกำลังสี่ให้ "ความแหลม" หรือทำไมการเพิ่มตัวแปรสุ่มให้เป็นกำลังสามควรให้ "ความเบ้" ดูเหมือนว่ามหัศจรรย์และลึกลับ!(X−μ)/σ(X−μ)/σ(X-\mu)/\sigma

3
ทำไมการบูตสแตรปมีประโยชน์หรือไม่
หากสิ่งที่คุณทำคือการสุ่มตัวอย่างใหม่จากการกระจายเชิงประจักษ์ทำไมไม่เพียงแค่ศึกษาการกระจายเชิงประจักษ์? ตัวอย่างเช่นแทนที่จะศึกษาความแปรปรวนโดยการสุ่มตัวอย่างซ้ำ ๆ ทำไมไม่เพียงแค่หาค่าความแปรปรวนจากการแจกแจงเชิงประจักษ์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.