คำถามติดแท็ก variability

11
ค่าเบี่ยงเบนสัมบูรณ์เฉลี่ยกับส่วนเบี่ยงเบนมาตรฐาน
ในหนังสือข้อความ"คณิตศาสตร์ที่ครอบคลุมแบบใหม่สำหรับระดับ O"โดยเกรียร์ (1983) ฉันเห็นการเบี่ยงเบนเฉลี่ยที่คำนวณดังนี้: สรุปความแตกต่างที่แน่นอนระหว่างค่าเดียวกับค่าเฉลี่ย จากนั้นรับค่าเฉลี่ย ตลอดบทที่ระยะเบี่ยงเบนเฉลี่ยจะใช้ แต่ฉันเพิ่งเห็นการอ้างอิงหลายอย่างที่ใช้ค่าเบี่ยงเบนมาตรฐานของคำศัพท์และนี่คือสิ่งที่พวกเขาทำ: คำนวณกำลังสองของความแตกต่างระหว่างค่าเดียวกับค่าเฉลี่ย จากนั้นรับค่าเฉลี่ยและในที่สุดก็เป็นรากของคำตอบ ฉันลองทั้งสองวิธีในชุดข้อมูลทั่วไปและคำตอบต่างกัน ฉันไม่ใช่นักสถิติ ฉันสับสนในขณะที่พยายามสอนการเบี่ยงเบนให้กับลูก ๆ ของฉัน ดังนั้นในระยะสั้นค่าเบี่ยงเบนมาตรฐานของคำศัพท์และค่าเบี่ยงเบนเฉลี่ยเท่ากันหรือเป็นตำราตำราเก่าของฉันหรือไม่

1
การประมาณความแปรปรวนเมื่อเวลาผ่านไป
ฉันมีชุดข้อมูลที่มี ~ 7,500 การตรวจเลือดจาก ~ 2,500 คน ฉันกำลังพยายามหาว่าความแปรปรวนในการตรวจเลือดเพิ่มขึ้นหรือลดลงตามระยะเวลาระหว่างการทดสอบสองครั้งหรือไม่ ตัวอย่างเช่น - ฉันวาดเลือดของคุณสำหรับการทดสอบพื้นฐานแล้ววาดตัวอย่างที่สองทันที หกเดือนต่อมาฉันวาดอีกตัวอย่าง หนึ่งอาจคาดว่าความแตกต่างระหว่างพื้นฐานและการทดสอบซ้ำทันทีจะมีขนาดเล็กกว่าความแตกต่างระหว่างพื้นฐานและการทดสอบหกเดือน แต่ละจุดบนพล็อตด้านล่างสะท้อนความแตกต่างระหว่างการทดสอบสองครั้ง X คือจำนวนวันระหว่างการทดสอบสองครั้ง Y คือขนาดของความแตกต่างระหว่างการทดสอบทั้งสอง อย่างที่คุณเห็นการทดสอบไม่ได้กระจายไปตาม X อย่างสม่ำเสมอ - การศึกษาไม่ได้ออกแบบมาเพื่อตอบคำถามนี้ เนื่องจากคะแนนมีการซ้อนกันอย่างมากในค่าเฉลี่ยฉันจึงได้รวมสายควอไทล์ 95% (สีน้ำเงิน) และ 99% (แดง) ตามหน้าต่าง 28 วัน เห็นได้ชัดว่าสิ่งเหล่านี้ได้รับการดึงออกมาจากจุดที่รุนแรงกว่า แต่คุณก็เข้าใจ ข้อความ ALT http://a.imageshack.us/img175/6595/diffsbydays.png ฉันคิดว่าความแปรปรวนค่อนข้างคงที่ หากมีสิ่งใดสูงกว่าเมื่อการทดสอบซ้ำภายในระยะเวลาอันสั้น ฉันจะจัดการเรื่องนี้ด้วยวิธีที่เป็นระบบบัญชีสำหรับการเปลี่ยนแปลง n ในแต่ละช่วงเวลาได้อย่างไร (และบางช่วงที่ไม่มีการทดสอบเลย) ความคิดของคุณได้รับการชื่นชมอย่างมาก เพื่อการอ้างอิงนี่คือการกระจายจำนวนวันระหว่างการทดสอบและการทดสอบซ้ำ: ข้อความ ALT http://a.imageshack.us/img697/6572/testsateachtimepoint.png

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
ปัญหาหรือเกมใดที่เป็นวิธีแก้ไขปัญหาความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานที่ดีที่สุด
สำหรับตัวแปรสุ่มที่กำหนด (หรือประชากรหรือกระบวนการสุ่ม) ความคาดหวังทางคณิตศาสตร์คือคำตอบสำหรับคำถามการคาดการณ์จุดใดที่ช่วยลดการสูญเสียกำลังสองที่คาดการณ์ไว้ได้? . นอกจากนี้มันเป็นทางออกที่ดีที่สุดสำหรับเกมเดาการตระหนักถึงตัวแปรสุ่มต่อไป (หรือการจับฉลากใหม่จากประชากร) และฉันจะลงโทษคุณด้วยระยะห่างกำลังสองระหว่างค่าและการเดาของคุณหากคุณมีความไม่ตรงเชิงเส้นในแง่ ของการลงโทษ ค่ามัธยฐานคือคำตอบของคำถามที่เกี่ยวข้องภายใต้การสูญเสียที่แน่นอนและโหมดคือคำตอบภายใต้การสูญเสีย "ทั้งหมดหรือไม่มีอะไร" คำถาม:ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานตอบคำถามที่คล้ายกันหรือไม่ พวกเขาคืออะไร แรงจูงใจสำหรับคำถามนี้เกิดขึ้นจากการสอนมาตรการพื้นฐานของแนวโน้มกลางและการแพร่กระจาย ในขณะที่มาตรการของแนวโน้มกลางสามารถถูกกระตุ้นด้วยปัญหาการตัดสินใจเชิงทฤษฎีข้างต้นฉันสงสัยว่าจะกระตุ้นให้เกิดมาตรการแพร่กระจายได้อย่างไร
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.