คำถามติดแท็ก fitting

กระบวนการรวมแบบจำลองทางสถิติกับชุดข้อมูลเฉพาะ ส่วนใหญ่ทำบนคอมพิวเตอร์และใช้วิธีการเชิงตัวเลขที่หลากหลายเช่นการเพิ่มประสิทธิภาพหรือการรวมตัวเลขหรือการจำลอง

1
AIC / BIC: การเปลี่ยนลำดับของพารามิเตอร์จะมีจำนวนเท่าใด?
สมมติว่าฉันมีปัญหาในการเลือกรุ่นและฉันพยายามใช้AICหรือBICเพื่อประเมินโมเดล ตรงไปตรงมาสำหรับรุ่นที่มีบางส่วนจำนวนของพารามิเตอร์ค่าจริงkkk อย่างไรก็ตามจะเกิดอะไรขึ้นถ้าหนึ่งในโมเดลของเรา (ตัวอย่างเช่นโมเดล Mallows ) มีการเปลี่ยนแปลงรวมถึงพารามิเตอร์ที่มีมูลค่าจริงแทนที่จะเป็นพารามิเตอร์ที่มีมูลค่าจริง ผมยังสามารถเพิ่มความเป็นไปได้มากกว่าพารามิเตอร์แบบเช่นการได้รับการเปลี่ยนแปลงและพารามิเตอร์พี แต่วิธีการที่หลายพารามิเตอร์ไม่πนับรวมในการคำนวณ AIC / BIC?ππ\piพีppππ\pi

3
การคำนวณโหมดของข้อมูลที่สุ่มตัวอย่างจากการแจกแจงแบบต่อเนื่อง
อะไรคือวิธีที่ดีที่สุดในการปรับ 'โหมด' ของข้อมูลตัวอย่างจากการกระจายอย่างต่อเนื่อง? เนื่องจากโหมดนี้ไม่ได้กำหนดทางเทคนิค (ใช่ไหม) สำหรับการแจกแจงแบบต่อเนื่องฉันจึงถามว่า 'คุณจะพบคุณค่าที่พบได้บ่อยที่สุด' ได้อย่างไร? หากคุณถือว่าการกระจายตัวของผู้ปกครองนั้นเป็น gaussian คุณสามารถ bin ข้อมูลและหาว่าโหมดนั้นเป็นที่ตั้งของ bin ที่มีจำนวนมากที่สุด อย่างไรก็ตามคุณจะกำหนดขนาดถังขยะได้อย่างไร มีการใช้งานที่แข็งแกร่งหรือไม่? (เช่นแข็งแกร่งถึงค่าผิดปกติ) ฉันใช้python/ scipy/ numpyแต่ฉันสามารถแปลได้Rโดยไม่ยากเกินไป

2
เมื่อทำการปรับเส้นโค้งฉันจะคำนวณช่วงความมั่นใจ 95% สำหรับพารามิเตอร์ที่ติดตั้งได้อย่างไร
ฉันกำลังปรับเส้นโค้งให้เหมาะสมกับข้อมูลของฉันเพื่อแยกพารามิเตอร์หนึ่งตัว อย่างไรก็ตามฉันไม่แน่ใจว่าความแน่นอนของพารามิเตอร์นั้นคืออะไรและฉันจะคำนวณ / แสดงช่วงความมั่นใจ % ได้อย่างไร959595 พูดสำหรับชุดข้อมูลที่มีข้อมูลที่อธิบายการสลายตัวแบบทวีคูณฉันพอดีกับเส้นโค้งกับชุดข้อมูลแต่ละชุด จากนั้นข้อมูลที่ผมต้องการที่จะเป็นสารสกัดจากตัวแทนขฉันรู้ค่าของและค่าของฉันไม่สนใจ (นั่นคือตัวแปรที่มาจากประชากรไม่ใช่กระบวนการที่ฉันพยายามทำแบบจำลอง)t abbbtttaaa ฉันใช้การถดถอยเชิงเส้นเพื่อให้พอดีกับพารามิเตอร์เหล่านี้ อย่างไรก็ตามฉันไม่รู้วิธีคำนวณช่วงความมั่นใจ % สำหรับวิธีการใดดังนั้นคำตอบที่กว้างขึ้นก็ยินดีต้อนรับเช่นกัน959595 f=a⋅e−btf=a⋅e−btf= a\cdot e^{-bt} เมื่อฉันมีค่าของฉันสำหรับฉันจะคำนวณช่วงความมั่นใจ % ได้อย่างไร ขอบคุณล่วงหน้า!95bbb959595

3
ความน่าเชื่อถือของโค้งที่เหมาะสมหรือไม่
ฉันต้องการประเมินความไม่แน่นอนหรือความน่าเชื่อถือของเส้นโค้งที่พอดี ฉันตั้งใจไม่ตั้งชื่อปริมาณทางคณิตศาสตร์ที่แม่นยำที่ฉันกำลังมองหาเนื่องจากฉันไม่รู้ว่ามันคืออะไร นี่ (พลังงาน) เป็นตัวแปรตาม (ตอบสนอง) และ (ปริมาณ) เป็นตัวแปรอิสระ ฉันต้องการหาเส้นโค้ง Energy-Volume,ของวัสดุบางอย่าง ดังนั้นฉันจึงคำนวณด้วยโปรแกรมคอมพิวเตอร์เคมีควอนตัมเพื่อรับพลังงานสำหรับปริมาตรตัวอย่าง (วงกลมสีเขียวในพล็อต)V E ( V )EEEVVVE(V)E(V)E(V) จากนั้นฉันติดตั้งตัวอย่างข้อมูลเหล่านี้ด้วยฟังก์ชัน Birch – Murnaghan : ซึ่งขึ้นอยู่กับ สี่พารามิเตอร์:ฉันยังสันนิษฐานว่านี่เป็นฟังก์ชั่นปรับแต่งที่ถูกต้องดังนั้นข้อผิดพลาดทั้งหมดจึงมาจากเสียงรบกวนของตัวอย่าง ในสิ่งต่อไปนี้ฟังก์ชั่นที่ติดตั้งจะได้รับการเขียนเป็นฟังก์ชั่นของVE 0 , V 0 , B 0 , B ' 0 ( E ) VE(E|V)=E0+9V0B016⎧⎩⎨[(V0V)23−1]3B′0+[(V0V)23−1]2[6−4(V0V)23]⎫⎭⎬,E(E|V)=E0+9V0B016{[(V0V)23−1]3B0′+[(V0V)23−1]2[6−4(V0V)23]}, \mathbb{E}(E|V) = E_0 + \frac{9V_0B_0}{16} \left\{ \left[\left(\frac{V_0}{V}\right)^\frac{2}{3}-1\right]^3B_0^\prime + \left[\left(\frac{V_0}{V}\right)^\frac{2}{3}-1\right]^2 \left[6-4\left(\frac{V_0}{V}\right)^\frac{2}{3}\right]\right\}\;, …

1
เปรียบเทียบความพอดีของโมเดลกับการตอบสนองที่เปลี่ยนแปลงและไม่แปลงรูปแบบ
ฉันต้องการเปรียบเทียบข้อมูลที่มีสัดส่วนระหว่างกลุ่มต่าง ๆ สามกลุ่มเช่น: ID Group Prop.Nitrogen 1 A 0.89 2 A 0.85 3 B 0.92 4 B 0.97 ติดตาม Wharton และ Hui (ดอย: 10.1890 / 10-0340.1 1 ) ฉันว่าฉันจะดูว่าข้อมูลเหล่านี้จะจัดการกับการใช้ logit ที่ดีขึ้นหรือไม่ เมื่อฉันดูพล็อตการวินิจฉัยสำหรับตัวแบบเชิงเส้นบนข้อมูลที่ถูกแปลงและไม่ถูกแปลงพวกมันดูคล้ายกันมากโดยไม่มีปัญหาที่ชัดเจนและมีความแตกต่างเพียงเล็กน้อยในพารามิเตอร์ที่ประมาณไว้ อย่างไรก็ตามฉันยังต้องการที่จะพูดอะไรบางอย่างเกี่ยวกับรูปแบบที่เหมาะกับข้อมูลที่ถูกแปลงและไม่มีการแปลงรูปแบบได้อย่างไร - ฉันรู้ว่าฉันไม่สามารถเปรียบเทียบค่า AIC ได้โดยตรง มีการแก้ไขและฉันสามารถตรวจสอบสิ่งนี้ได้หรือไม่? หรือฉันควรจะใช้วิธีการที่แตกต่างกันอย่างไร

2
ความแตกต่างระหว่างข้อมูลเฉลี่ยแล้วทำการปรับและปรับข้อมูลให้เหมาะสม
หากมีให้ปรับเส้นให้พอดีกับ "การทดลอง" แยกหลายครั้งจากนั้นทำการหาค่าเฉลี่ยพอดีหรือเฉลี่ยข้อมูลจากการทดลองแยกต่างหากจากนั้นทำการปรับข้อมูลเฉลี่ยให้พอดี ให้ฉันทำอย่างละเอียด: ฉันทำการจำลองคอมพิวเตอร์ซึ่งสร้างเส้นโค้งดังที่แสดงด้านล่าง เราดึงปริมาณออกมาเรียกมันว่า "A" โดยการปรับพื้นที่เชิงเส้นของพล็อต (นาน ๆ ) ค่าเป็นความชันของภูมิภาคเชิงเส้น แน่นอนว่ามีข้อผิดพลาดที่เกี่ยวข้องกับการถดถอยเชิงเส้นนี้ โดยทั่วไปเราจะเรียกใช้การจำลองเหล่านี้ 100 ครั้งหรือมากกว่าด้วยเงื่อนไขเริ่มต้นที่แตกต่างกันเพื่อคำนวณค่าเฉลี่ยของ "A" ฉันได้รับการบอกว่าเป็นการดีกว่าที่จะเฉลี่ยข้อมูลดิบ (จากพล็อตด้านล่าง) เป็นกลุ่มที่พูด 10 แล้วเหมาะสำหรับ "A" และเฉลี่ย 10 "A" ด้วยกัน ฉันไม่มีสัญชาตญาณว่ามีข้อดีหรือไม่และดีกว่าการปรับค่า "A" ให้เหมาะสมกับบุคคล 100 คนและหาค่าเฉลี่ยเหล่านั้น
10 error  fitting  average 

1
การกระจายที่เหมาะสมกับข้อมูลเชิงพื้นที่
ข้ามการโพสต์คำถามของฉันจาก mathoverflowเพื่อค้นหาความช่วยเหลือเฉพาะสถิติ ฉันกำลังศึกษากระบวนการทางกายภาพในการสร้างข้อมูลซึ่งมีโครงงานเป็นสองมิติด้วยค่าที่ไม่เป็นลบ แต่ละขั้นตอนมีแทร็ก (ที่คาดการณ์) จุด - - ดูภาพด้านล่างxxxYYy แทร็กตัวอย่างเป็นสีน้ำเงินแทร็กที่มีปัญหาได้รับการวาดด้วยสีเขียวและพื้นที่ที่มีข้อกังวลเป็นสีแดง: แต่ละแทร็กเป็นผลมาจากการทดสอบอิสระ มีการทดลองกว่ายี่สิบล้านครั้งในช่วงหลายปีที่ผ่านมา แต่จากการทดสอบเพียงสองพันครั้งนั้นแสดงให้เห็นถึงคุณลักษณะที่เราวางแผนไว้ เรากังวลเฉพาะกับการทดลองที่สร้างแทร็กดังนั้นชุดข้อมูลของเราคือ (โดยประมาณ) สองพันแทร็ก มีความเป็นไปได้สำหรับแทร็กที่จะเข้าสู่พื้นที่ที่น่าเป็นห่วงและเราคาดหวังว่าจะเรียงตามลำดับในแทร็ก การประมาณจำนวนนั้นเป็นคำถามในมือ:11110410410^4 เราจะคำนวณความน่าจะเป็นของการติดตามโดยพลการเข้าสู่พื้นที่ที่น่าเป็นห่วงได้อย่างไร เป็นไปไม่ได้ที่จะทำการทดลองอย่างรวดเร็วพอที่จะดูว่ามีการสร้างแทร็กบ่อยครั้งเพียงใดซึ่งเข้าสู่พื้นที่ที่น่าเป็นห่วงดังนั้นเราจึงจำเป็นต้องประเมินจากข้อมูลที่มีอยู่ เราได้ติดตั้งตัวอย่างเช่นค่าให้ไว้แต่สิ่งนี้ไม่สามารถจัดการข้อมูลได้อย่างเพียงพอเช่นแทร็กสีเขียว - ดูเหมือนว่าจำเป็นต้องมีโมเดลที่ครอบคลุมทั้งสองมิติxxxY≥ 200Y≥200y\ge200 เราได้ติดตั้งระยะห่างขั้นต่ำจากแต่ละแทร็กไปยังพื้นที่ที่น่ากังวล แต่เราไม่มั่นใจว่าสิ่งนี้จะให้ผลลัพธ์ที่สมเหตุสมผล 1) มีวิธีทราบที่เหมาะสมกับการกระจายข้อมูลประเภทนี้เพื่อการประมาณค่าหรือไม่? -หรือ- 2) มีวิธีที่ชัดเจนในการใช้ข้อมูลนี้เพื่อสร้างแบบจำลองสำหรับการสร้างแทร็กหรือไม่? ตัวอย่างเช่นใช้การวิเคราะห์องค์ประกอบหลักบนแทร็กเป็นจุดในพื้นที่ขนาดใหญ่จากนั้นปรับการกระจาย (Pearson?) ให้พอดีกับแทร็กที่ฉายลงบนส่วนประกอบเหล่านั้น

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

2
จะทำอย่างไรเมื่อ CFA เหมาะสมกับหลายรายการที่ไม่ดี
ฉันไม่แน่ใจว่าจะดำเนินการอย่างไรกับ CFA im นี้ในภาษาลาวา ฉันมีตัวอย่างของผู้เข้าร่วม 172 คน (ฉันรู้ว่าไม่มากนักสำหรับ CFA) และ 28 รายการที่มีเครื่องชั่ง Likert 7 จุดที่ควรโหลดในเจ็ดปัจจัย ฉันทำ CFA ด้วย„ mlm“ - ตัวประเมินผล แต่โมเดลพอดีนั้นแย่มาก (χ2 (df = 329) = 739.36; ดัชนีเปรียบเทียบแบบพอดี (CFI) = .69 รากมาตรฐานที่ได้มาตรฐานหมายถึงส่วนที่เหลือเป็นตาราง (SRMR) = 10 รูตหมายถึงความคลาดเคลื่อนกำลังสองของการประมาณ (RMSEA) =. 09; RMSEA ช่วงความเชื่อมั่น 90% (CI) = [.08, .10] ฉันได้ลองทำสิ่งต่อไปนี้แล้ว: แบบจำลอง bifactor …

1
มีวิธีในการประมาณค่าพารามิเตอร์การกระจายที่ได้รับเพียงแค่จำนวน
มีวิธีที่จะพอดีกับการกระจายที่ระบุถ้าคุณได้รับเพียงไม่กี่ quantiles? ตัวอย่างเช่นถ้าฉันบอกคุณว่าฉันมีชุดข้อมูลแกมม่ากระจายและเชิงประจักษ์ 20%, 30%, 50% และ 90% - คุณสมบัติคือตามลำดับ: 20% 30% 50% 90% 0.3936833 0.4890963 0.6751703 1.3404074 ฉันจะไปและประมาณค่าพารามิเตอร์ได้อย่างไร มีหลายวิธีในการทำเช่นนั้นหรือมีขั้นตอนเฉพาะอยู่แล้ว? แก้ไขเพิ่มเติม:ฉันไม่ได้ขอการกระจายแกมม่าโดยเฉพาะนี่เป็นเพียงตัวอย่างเพราะฉันกังวลว่าฉันไม่สามารถอธิบายคำถามได้อย่างเหมาะสม งานของฉันคือฉันมี quantiles ที่กำหนด (2-4) และต้องการประเมินพารามิเตอร์ (1-3) ของการแจกแจงไม่กี่อย่างที่เป็น "ปิด" ที่สุด บางครั้งมีวิธีแก้ปัญหาที่แน่นอน (หรือไม่มีที่สิ้นสุด) บางครั้งไม่ถูกต้องใช่ไหม
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.