คำถามติดแท็ก survey

หมายถึงเครื่องมือที่ใช้ในการเก็บตัวอย่างจากประชากร การสำรวจมักหมายถึงการสุ่มตัวอย่างประชากรมนุษย์และส่วนใหญ่ทำโดยการจัดการแบบสอบถามหรือสัมภาษณ์บุคคล การสุ่มตัวอย่างบุคคลสำหรับการสำรวจในกลุ่มประชากรแบบแบ่งชั้นอาจต้องใช้การสุ่มตัวอย่างที่ซับซ้อนมากกว่าการสุ่มอย่างง่ายเพื่อให้ได้ค่าประมาณพารามิเตอร์ประชากรที่แม่นยำยิ่งขึ้น การออกแบบการสุ่มตัวอย่างและการวิเคราะห์ข้อมูลการสำรวจอยู่ภายใต้ 'วิธีการสำรวจ'

1
SurveyMonkey เพิกเฉยต่อข้อเท็จจริงที่ว่าคุณได้รับตัวอย่างที่ไม่ใช่แบบสุ่มหรือไม่?
SurveyMonkey มีขั้นตอนและแผนภูมิสำหรับคุณในการหาขนาดตัวอย่างที่คุณต้องการสำหรับระยะขอบข้อผิดพลาดหรือช่วงความเชื่อมั่นที่กำหนดตามขนาดประชากรของคุณ ขนาดตัวอย่าง SurveyMonkey แผนภูมินี้ไม่สนใจความจริงที่ว่าคุณจะไม่ได้รับตัวอย่างแบบสุ่มเนื่องจากคุณจะได้รับเฉพาะผู้ที่สนใจตอบแบบสอบถามเท่านั้น ฉันได้รับคำเตือนเมื่อฉันพิมพ์สิ่งนี้ว่าคำถามดูเหมือนเป็นอัตวิสัยดังนั้นฉันอาจไม่ได้ถามอย่างถูกต้อง มันไม่ได้เกี่ยวกับ SurveyMonkey แต่เป็นคำถามทั่วไป - คุณสามารถคำนวณช่วงความมั่นใจจากข้อมูลการตอบกลับโดยสมัครใจโดยใช้เทคนิคขั้นสูงที่ฉันไม่รู้หรือไม่? ในการสำรวจความคิดเห็นหรือการสำรวจระดับชาติเห็นได้ชัดว่าพวกเขาจะต้องจัดการกับปัญหานี้ การศึกษาของฉันไม่ได้ครอบคลุมเทคนิคการสุ่มตัวอย่างแบบสำรวจในเชิงลึก แต่ฉันคิดว่ามันเกี่ยวข้องกับการรวบรวมข้อมูลประชากรและการใช้เพื่อทราบว่าตัวแทนตัวอย่างของคุณมีวิธีอย่างไร แต่นอกเหนือจากนั้นสำหรับการสำรวจออนไลน์อย่างง่ายพวกเขาเพียงแค่สมมติว่าคนที่ใส่ใจที่จะตอบสนองนั้นเป็นกลุ่มตัวอย่างแบบสุ่มของประชากรหรือไม่

1
วิธีการตีความ biplot PCA นี้มาจากการสำรวจสิ่งที่ผู้คนมีความสนใจในพื้นที่?
ความเป็นมา:ฉันถามผู้เข้าร่วมหลายร้อยคนในแบบสำรวจของฉันว่าพวกเขาสนใจในพื้นที่ที่เลือกไว้มากเพียงใด (โดยห้าจุด Likert มี 1 ตัวบ่งชี้ว่า "ไม่สนใจ" และ 5 ระบุว่า "สนใจ") จากนั้นฉันก็ลอง PCA ภาพด้านล่างเป็นการฉายภาพลงในองค์ประกอบหลักสองประการแรก สีที่ใช้สำหรับเพศและลูกศร PCA เป็นตัวแปรดั้งเดิม (เช่นความสนใจ) ฉันสังเกตว่า: จุด (ผู้ตอบแบบสอบถาม) ค่อนข้างแยกจากกันโดยองค์ประกอบที่สอง ไม่มีลูกศรชี้ไปทางซ้าย ลูกศรบางตัวสั้นกว่าลูกศรอื่นมาก ตัวแปรมีแนวโน้มที่จะสร้างกลุ่ม แต่ไม่ใช่การสังเกต ดูเหมือนว่าลูกศรชี้ลง (สำหรับผู้ชาย) ส่วนใหญ่เป็นความสนใจของผู้ชายและลูกศรชี้ขึ้นส่วนใหญ่เป็นความสนใจของผู้หญิง ลูกศรบางตัวชี้ไม่ขึ้นหรือลง คำถาม:วิธีการตีความความสัมพันธ์ระหว่างจุดอย่างถูกต้อง (ผู้ตอบแบบสอบถาม), สี (เพศ) และลูกศร (ตัวแปร) ได้อย่างไร? ข้อสรุปอื่น ๆ เกี่ยวกับผู้ตอบและความสนใจของพวกเขาสามารถขุดได้จากแผนนี้ ข้อมูลที่สามารถพบได้ที่นี่

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
ช่วงความเชื่อมั่นสำหรับผลการรักษาโดยเฉลี่ยจากน้ำหนักคะแนนความชอบ?
ฉันพยายามที่จะประเมินผลการรักษาโดยเฉลี่ยจากข้อมูลการสังเกตโดยใช้น้ำหนักคะแนนความชอบ (โดยเฉพาะ IPTW) ฉันคิดว่าฉันคำนวณ ATE อย่างถูกต้อง แต่ฉันไม่ทราบวิธีคำนวณช่วงความมั่นใจของ ATE ในขณะที่คำนึงถึงน้ำหนักความชอบแบบผกผัน นี่คือสมการที่ฉันใช้ในการคำนวณผลการรักษาโดยเฉลี่ย (อ้างอิง Med Med. 10 ก.ย. 2010; 29 (20): 2137–2148): โดยที่จำนวนวิชาทั้งหมด,สถานะการรักษา,สถานะผลลัพธ์และคะแนนความชอบTE=1ยังไม่มีข้อความΣ1ยังไม่มีข้อความZผมYผมพีผม-1ยังไม่มีข้อความΣ1ยังไม่มีข้อความ( 1 -Zผม)Yผม1 -พีผมATE=1ยังไม่มีข้อความΣ1ยังไม่มีข้อความZผมYผมพีผม-1ยังไม่มีข้อความΣ1ยังไม่มีข้อความ(1-Zผม)Yผม1-พีผมATE=\frac1N\sum_1^N\frac{Z_iY_i}{p_i}-\frac1N\sum_1^N\frac{(1-Z_i)Y_i}{1-p_i}ยังไม่มีข้อความ=ยังไม่มีข้อความ=N=Zผม=Zผม=Z_i=Yผม=Yผม=Y_i=พีผม=พีผม=p_i= ไม่มีใครทราบแพ็คเกจ R ที่จะคำนวณช่วงความมั่นใจของผลการรักษาโดยเฉลี่ยโดยคำนึงถึงน้ำหนักหรือไม่ สามารถระบุsurveyความช่วยเหลือในแพคเกจที่นี่? ฉันสงสัยว่าสิ่งนี้จะได้ผลหรือไม่: library(survey) sampsvy=svydesign(id=~1,weights=~iptw,data=df) svyby(~surgery=='lump',~treatment,design=sampsvy,svyciprop,vartype='ci',method='beta') #which produces this result: treatment surgery == "lump" ci_l ci_u No 0.1644043 0.1480568 0.1817876 Yes 0.2433215 0.2262039 0.2610724 ฉันไม่รู้ว่าจะไปจากที่นี่เพื่อหาช่วงความมั่นใจของความแตกต่างระหว่างสัดส่วน …

1
วิธีการสำรวจความคิดเห็นส่วนบุคคล
เพื่อนนักสถิติของฉันบอกฉันถึงเทคนิคที่น่าสนใจที่ใช้ในการรับการตอบกลับอย่างซื่อสัตย์จากการสำรวจที่จัดการกับปัญหาที่ละเอียดอ่อน ฉันจำส่วนสำคัญของวิธีการนี้ได้ แต่สงสัยว่ามีใครรู้รายละเอียดบ้างหรือไม่และมีการอ้างอิงที่ใด เรื่องราวคือฟลอริด้าอะ AMA ต้องการประเมินการใช้ยาในหมู่แพทย์ พวกเขาส่งแบบสอบถามพร้อมคนตายหนึ่งคน IIRC คำแนะนำเป็นบางสิ่งบางอย่างตามแนวของ "หมุนตายถ้าคุณเคยเสพยาหรือได้ 6 เขียนลงหก; มิฉะนั้นเขียนลงเลขอะไรก็ตาม" ความคิดที่ว่าถ้ามีคนดึงแบบสอบถามของแพทย์และเห็นหกเขาสามารถบอกว่าเขาไม่ได้ใช้ยาเสพติดเขาเพิ่งเกิดขึ้นหก

1
EFA สนับสนุนปัจจัยหนึ่งอย่างชัดเจนการวัดมีความสอดคล้องกันภายใน แต่ CFA นั้นเหมาะสมหรือไม่
ฉันกำลังสำรวจคุณสมบัติไซโครเมทของการวัดรายงานตนเอง 10 ข้อ ฉันมีประมาณ 400 รายในสองตัวอย่างอิสระ รายการจะแล้วเสร็จในสเกล Likert 4 จุด EFA สนับสนุนการแก้ปัญหาปัจจัยเดียวอย่างชัดเจน (เช่นค่าเริ่มต้นแรกที่มากกว่า 6 ค่าอื่น ๆ ทั้งหมดต่ำกว่า 1) และค่าอัลฟาของ Cronbach นั้นดี (เช่น. 90) ไม่มีรายการใดที่มีความสัมพันธ์กับผลรวมรายการต่ำ เดิมทีฉันต้องการทำ CFA (EFA เป็นเพียงการติดตามหลังจากที่ฉันเห็น CFA ไม่ดี) ทดสอบแบบจำลองปัจจัยเดียว สำหรับความประหลาดใจของฉันแบบสำหรับรุ่นนั้นค่อนข้างแย่: CFI=.91 TLI=.88 RMSEA=.13 ยิ่งไปกว่านั้นการโหลดสำหรับแต่ละรายการค่อนข้างดี (.65+) ผิดปกติSRMR=.05ซึ่งเป็นที่ยอมรับ / ดี ดัชนีการปรับเปลี่ยนแนะนำให้ฉันเชื่อมโยงข้อผิดพลาดทั่วทุกที่ หากมีเหตุผลที่ชัดเจนในการทำเช่น (บางรายการมีถ้อยคำที่คล้ายกันมาก) ฉันจะทำเช่นนี้; แม้กระนั้นมาตรการทั้งหมดจะถูกพูดในทำนองเดียวกันและความสัมพันธ์ข้อผิดพลาดทั้งหมดจะแปลกและเจ็บปวด ฉันไม่เคยเห็นกรณีเช่นนี้ มาตรการดังกล่าวมีความสอดคล้องกันภายในและประกอบด้วยปัจจัยหนึ่งใน EFA อย่างชัดเจน แต่แสดงให้เห็นถึงความพอดีใน …

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.