คำถามติดแท็ก misspecification

11
ทำไมฉันถึงต้องเป็น Bayesian เมื่อแบบจำลองของฉันผิด
แก้ไข:ฉันได้เพิ่มเป็นตัวอย่างง่ายๆอนุมานของค่าเฉลี่ยของx_iฉันยังได้ชี้แจงด้วยเล็กน้อยว่าทำไมช่วงเวลาที่น่าเชื่อถือและไม่ตรงกับช่วงความมั่นใจไม่ดีXiXผมX_i ฉันเป็นคนเบย์เซียนที่มีใจศรัทธาอย่างยุติธรรมฉันกำลังอยู่ในช่วงวิกฤตการณ์แห่งศรัทธาแปลก ๆ ปัญหาของฉันคือต่อไปนี้ สมมติว่าผมต้องการที่จะวิเคราะห์ข้อมูล IID บางx_iสิ่งที่ฉันจะทำคือ:XiXผมX_i ก่อนเสนอแบบจำลองตามเงื่อนไข: p(X|θ)พี(X|θ) p(X|\theta) จากนั้นเลือกก่อนหน้าบน : θθ\thetap(θ)พี(θ) p(\theta) ในที่สุดใช้กฎของเบย์คำนวณหลัง: (หรือประมาณโดยประมาณถ้ามันไม่ควรคำนวณได้) และตอบคำถามทั้งหมดที่ฉันมีเกี่ยวกับθp(θ|X1…Xn)พี(θ|X1...Xn)p(\theta | X_1 \dots X_n )θθ\theta นี่เป็นวิธีการที่สมเหตุสมผล: ถ้าแบบจำลองที่แท้จริงของข้อมูลเป็น "ข้างใน" ของเงื่อนไขของฉัน (มันสอดคล้องกับค่าบางอย่างθ 0 ) จากนั้นฉันสามารถเรียกทฤษฎีการตัดสินใจทางสถิติเพื่อบอกว่าวิธีการของฉันเป็นที่ยอมรับ (ดู Robert's "ตัวเลือก Bayesian" สำหรับรายละเอียด; "สถิติทั้งหมด" ยังให้ข้อมูลที่ชัดเจนในบทที่เกี่ยวข้องด้วย)XiXผมX_iθ0θ0\theta_0 อย่างไรก็ตามอย่างที่ทุกคนรู้ว่าสมมติว่าแบบจำลองของฉันถูกต้องค่อนข้างหยิ่ง: ทำไมธรรมชาติควรอยู่ในกล่องแบบจำลองที่ฉันได้พิจารณาอย่างเป็นธรรมชาติ มันเป็นจริงมากขึ้นที่จะคิดว่ารูปแบบที่แท้จริงของข้อมูลที่แตกต่างจากP ( X | θ )สำหรับทุกค่าของθ ซึ่งมักเรียกว่าแบบจำลอง "misspecified"ptrue(X)พีเสื้อRยูอี(X)p_{true}(X)p(X|θ)พี(X|θ)p(X|\theta)θθ\theta ปัญหาของฉันคือว่าในกรณีที่สะกดผิดพลาดเหมือนจริงมากขึ้นฉันไม่มีข้อโต้แย้งที่ดีสำหรับการเป็น Bayesian (เช่นการคำนวณการกระจายหลัง) …

5
การรวมตัวแปรขึ้นอยู่กับความล่าช้าในการถดถอย
ฉันสับสนมากว่าการรวมตัวแปรที่ล้าหลังลงในแบบจำลองการถดถอยนั้นถูกต้องหรือไม่ โดยทั่วไปฉันคิดว่าถ้ารุ่นนี้มุ่งเน้นไปที่ความสัมพันธ์ระหว่างการเปลี่ยนแปลงใน Y และตัวแปรอิสระอื่น ๆ จากนั้นการเพิ่มตัวแปรที่ขึ้นต่อกันล้าหลังในด้านขวามือสามารถรับประกันได้ว่าสัมประสิทธิ์ก่อนค่า IV อื่น ๆ เป็นอิสระจากค่าก่อนหน้าของ Y บางคนบอกว่าการรวม LDV จะทำให้ค่าสัมประสิทธิ์ของ IV อื่น ๆ ลดลง บางคนบอกว่าสามารถรวม LDV ซึ่งสามารถลดความสัมพันธ์แบบอนุกรม ฉันรู้ว่าคำถามนี้ค่อนข้างทั่วไปในแง่ของการถดถอยชนิดใด แต่ความรู้ทางสถิติของฉันมี จำกัด และฉันมีเวลายากมากที่จะหาว่าถ้าฉันควรรวมตัวแปรที่ล้าหลังลงในแบบจำลองการถดถอยเมื่อโฟกัสคือการเปลี่ยนแปลงของ Y เมื่อเวลาผ่านไป มีวิธีอื่นที่จะจัดการกับอิทธิพลของ Xs ที่มีต่อการเปลี่ยนแปลงของ Y เมื่อเวลาผ่านไปหรือไม่? ฉันลองใช้คะแนนการเปลี่ยนแปลงที่แตกต่างกันเช่น DV แต่ R กำลังสองในสถานการณ์นั้นต่ำมาก

2
เป็นความจริงที่ว่าวิธีการแบบเบย์ไม่เหมาะสมหรือไม่
เป็นความจริงที่ว่าวิธีการแบบเบย์ไม่เหมาะสมหรือไม่ (ฉันเห็นเอกสารและแบบฝึกหัดที่อ้างสิทธิ์นี้) ตัวอย่างเช่นหากเราใช้กระบวนการแบบเกาส์เซียนกับ MNIST (การจำแนกตัวเลขด้วยลายมือ) แต่แสดงเพียงตัวอย่างเดียวมันจะเปลี่ยนเป็นการกระจายก่อนหน้าสำหรับอินพุตใด ๆ ที่แตกต่างจากตัวอย่างเดี่ยว แต่มีความแตกต่างเล็กน้อยหรือไม่?

2
เหตุใดการพิสูจน์ของวิลก์ในปี 1938 จึงไม่ทำงานกับแบบจำลองที่ผิดพลาด
ใน 1,938 กระดาษที่มีชื่อเสียง (" การกระจายตัวอย่างขนาดใหญ่ของอัตราส่วนความน่าจะเป็นสำหรับการทดสอบสมมติฐานประกอบ ", พงศาวดารของคณิตศาสตร์สถิติ, 9: 60-62), ซามูเอล Wilks มากระจาย asymptotic (อัตราส่วนความน่าจะเป็นบันทึก ) สำหรับสมมติฐานที่ซ้อนกันภายใต้สมมติฐานว่ามีการระบุสมมติฐานที่ใหญ่กว่าอย่างถูกต้อง การ จำกัด การแจกแจงคือχ 2 (ไค - สแควร์) ที่มีองศาอิสระh - mโดยที่hคือจำนวนพารามิเตอร์ในสมมติฐานขนาดใหญ่และm2×LLR2×LLR2 \times LLRχ2χ2\chi^2h−mh−mh-mhhhmmmคือจำนวนของพารามิเตอร์อิสระในสมมติฐานที่ซ้อนกัน อย่างไรก็ตามเป็นที่ทราบกันดีว่าผลลัพธ์นี้ไม่ได้เก็บไว้เมื่อสมมติฐานถูกสะกดผิด (กล่าวคือเมื่อสมมติฐานที่ใหญ่กว่านั้นไม่ใช่การแจกแจงที่แท้จริงสำหรับข้อมูลตัวอย่าง) มีใครอธิบายได้บ้างไหม สำหรับฉันแล้วดูเหมือนว่าการพิสูจน์ของวิลก์สควรจะทำงานกับการดัดแปลงเล็กน้อย มันขึ้นอยู่กับมาตรฐานเชิงเส้นกำกับของการประมาณความน่าจะเป็นสูงสุด (MLE) ซึ่งยังคงมีรูปแบบที่ผิดพลาด ความแตกต่างเพียงอย่างเดียวคือเมทริกซ์ความแปรปรวนของการ จำกัด หลายตัวแปรปกติ: สำหรับรุ่นที่ระบุไว้อย่างถูกต้องเราสามารถใกล้เคียงกับเมทริกซ์ความแปรปรวนร่วมกับผกผันฟิชเชอร์ข้อมูลเมทริกซ์กับ misspecification เราสามารถใช้การประมาณการแซนวิชของเมทริกซ์ความแปรปรวนร่วม ( J - 1 K J - 1 ) …

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
การอนุมานเชิงสถิติภายใต้การสะกดผิด
การรักษาแบบดั้งเดิมของการอนุมานทางสถิติอาศัยสมมติฐานที่ว่ามีการใช้สถิติที่ระบุอย่างถูกต้อง นั่นคือการกระจายP∗(Y)P∗(Y)\mathbb{P}^*(Y)ที่สร้างข้อมูลที่สังเกตได้เป็นส่วนหนึ่งของแบบจำลองทางสถิติ : อย่างไรก็ตามในสถานการณ์ส่วนใหญ่เราไม่สามารถสรุปได้ว่านี่เป็นเรื่องจริง ฉันสงสัยว่าจะเกิดอะไรขึ้นกับขั้นตอนการอนุมานเชิงสถิติหากเราทิ้งสมมติฐานที่ระบุไว้อย่างถูกต้องyyyMM\mathcal{M}P∗(Y)∈M={Pθ(Y):θ∈Θ}P∗(Y)∈M={Pθ(Y):θ∈Θ}\mathbb{P}^*(Y) \in \mathcal{M}=\{\mathbb{P}_\theta(Y) :\theta \in \Theta\} ฉันได้พบงานบางอย่างของWhite 1982ในการประมาณ ML ภายใต้การสะกดผิด มันเป็นที่ถกเถียงกันอยู่ว่ามีความเป็นไปได้มากที่สุดคือการประเมินที่สอดคล้องกันสำหรับการแจกแจง ที่ช่วยลด KL-แตกต่างจากการกระจายทั้งหมดภายในแบบจำลองทางสถิติและการจัดจำหน่ายจริง\ mathbb {P} ^ *Pθ1=argminPθ∈MKL(P∗,Pθ)Pθ1=arg⁡minPθ∈MKL(P∗,Pθ)\mathbb{P}_{\theta_1}=\arg \min_{\mathbb{P}_\theta \in \mathcal{M}} KL(\mathbb{P}^*,\mathbb{P}_\theta)P∗P∗\mathbb{P}^* เกิดอะไรขึ้นกับตัวประมาณค่าความเชื่อมั่น ให้สรุปความเชื่อมั่นชุดประเมิน Let δ:ΩY→2Θδ:ΩY→2Θ\delta:\Omega_Y \rightarrow 2^\Thetaเป็นประมาณการที่ตั้งไว้ที่ΩYΩY\Omega_Yเป็นพื้นที่ตัวอย่างและ2Θ2Θ2^\Thetaชุดไฟมากกว่าพื้นที่พารามิเตอร์\ΘΘ\Thetaสิ่งที่เราอยากรู้คือความน่าจะเป็นของเหตุการณ์ที่ชุดที่สร้างโดยδδ\deltaรวมการแจกแจงที่แท้จริงP∗P∗\mathbb{P}^*นั่นคือP∗(P∗∈{Pθ:θ∈δ(Y)}):=A.P∗(P∗∈{Pθ:θ∈δ(Y)}):=A.\mathbb{P}^*(\mathbb{P}^* \in \{P_\theta : \theta \in \delta(Y)\}):=A. อย่างไรก็ตามเราแน่นอนไม่ทราบความจริงการกระจาย * สมมติฐานที่กำหนดไว้อย่างถูกต้องบอกเราว่า{M} อย่างไรก็ตามเรายังไม่ทราบว่าเป็นรุ่นใด แต่เป็นผูกพันที่ต่ำกว่าสำหรับความน่าจะเป็น Equationคือการ จำกัด คลาสสิกของระดับความเชื่อมั่นสำหรับตัวประมาณค่าชุดความเชื่อมั่นP∗P∗\mathbb{P}^*P∗∈MP∗∈M\mathbb{P}^* \in \mathcal{M}infθ∈ΘPθ(θ∈δ(Y)):=Binfθ∈ΘPθ(θ∈δ(Y)):=B\inf_{\theta \in \Theta} \mathbb{P}_\theta(\theta …

2
ควรใช้การทดสอบแบบพาราเมตริกเมื่อใดที่จะใช้การทดสอบแบบ homoscedasticity
หากหนึ่งคือการทดสอบสมมติฐานของ homoscedasticity ตัวแปร (Bartlett ทดสอบความสม่ำเสมอของผลต่าง, bartlett.test) และไม่ใช่ตัวแปร (Figner-คิลลีนการทดสอบความสม่ำเสมอของผลต่าง, fligner.test) การทดสอบที่มีอยู่ จะบอกได้อย่างไรว่าจะใช้แบบไหน? สิ่งนี้ควรขึ้นอยู่กับความเป็นปกติของข้อมูลหรือไม่

2
การอนุมานเชิงสถิติภายใต้การสะกดผิดโมเดล
ฉันมีคำถามเกี่ยวกับระเบียบวิธีทั่วไป อาจได้รับคำตอบก่อนหน้านี้ แต่ฉันไม่สามารถค้นหาเธรดที่เกี่ยวข้องได้ ฉันจะขอบคุณพอยน์เตอร์ถึงความซ้ำซ้อนที่เป็นไปได้ ( นี่คืออันที่ยอดเยี่ยม แต่ไม่มีคำตอบนี่ก็คล้าย ๆ กับวิญญาณแม้จะมีคำตอบ แต่อันหลังนั้นเฉพาะเจาะจงมากเกินไปจากมุมมองของฉันนี่ยังปิดอยู่ค้นพบหลังจากโพสต์คำถาม) รูปแบบที่มีวิธีการทำที่ถูกต้องอนุมานทางสถิติเมื่อรูปแบบสูตรก่อนที่จะเห็นข้อมูลไม่เพียงพอที่จะอธิบายขั้นตอนการสร้างข้อมูล คำถามทั่วไปมาก แต่ฉันจะเสนอตัวอย่างโดยเฉพาะเพื่ออธิบายประเด็น อย่างไรก็ตามฉันคาดหวังคำตอบที่จะมุ่งเน้นไปที่คำถามที่เกี่ยวกับระเบียบวิธีโดยทั่วไปมากกว่าที่จะพูดถึงเรื่องรายละเอียดของตัวอย่าง ลองพิจารณาตัวอย่างคอนกรีต: ในการตั้งค่าอนุกรมเวลาผมถือว่ากระบวนการผลิตข้อมูลที่จะ กับ2) ผมมุ่งมั่นที่จะทดสอบสมมติฐานเรื่องเรื่องที่ 1 ฉันใช้สิ่งนี้ในแง่ของแบบจำลองเพื่อให้ได้สถิติเชิงสถิติที่เป็นไปได้ของสมมติฐานในเรื่องของฉันและนี่คือ จนถึงตอนนี้ดีมาก แต่เมื่อฉันสังเกตข้อมูลฉันค้นพบว่าตัวแบบไม่ได้อธิบายข้อมูลอย่างเพียงพอ ให้เราบอกว่ามีแนวโน้มเชิงเส้นดังนั้นกระบวนการสร้างข้อมูลจริงคือ ด้วยyt=β0+β1xt+ut(1)(1)yt=β0+β1xt+ut y_t=\beta_0 + \beta_1 x_t+u_t \tag{1} ut∼i.i.N(0,σ2u)ut∼i.i.N(0,σu2)u_t \sim i.i.N(0,\sigma_u^2)dYdx= 1dydx=1\frac{dy}{dx}=1( 1 )(1)(1)H0: β1= 1H0: β1=1. H_0\colon \ \beta_1=1. Yเสื้อ=γ0+γ1xเสื้อ+γ2t +โวลต์เสื้อ(2)(2)yt=γ0+γ1xt+γ2t+vt y_t=\gamma_0 + \gamma_1 x_t+\gamma_2 t + v_t …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.