คำถามติดแท็ก standard-error

หมายถึงค่าเบี่ยงเบนมาตรฐานของการกระจายตัวตัวอย่างของสถิติที่คำนวณจากตัวอย่าง ข้อผิดพลาดมาตรฐานมักจำเป็นเมื่อสร้างช่วงความเชื่อมั่นหรือทดสอบสมมติฐานเกี่ยวกับประชากรที่เก็บตัวอย่างทางสถิติ

1
การแปลง betas ที่ได้มาตรฐานกลับไปเป็นตัวแปรดั้งเดิม
ฉันรู้ว่านี่อาจเป็นคำถามง่าย ๆ แต่หลังจากค้นหาฉันไม่พบคำตอบที่ฉันค้นหา ฉันมีปัญหาที่ฉันจำเป็นต้องสร้างมาตรฐานให้กับตัวแปรที่เรียกใช้ (การถดถอยริดจ์) เพื่อคำนวณค่าประมาณสันเขาของเบต้า ฉันต้องแปลงกลับไปเป็นขนาดดั้งเดิม แต่ฉันจะทำสิ่งนี้ได้อย่างไร ฉันพบสูตรสำหรับกรณีที่มีการแปรสภาพนั้น β∗=β^SxSy.β∗=β^SxSy. \beta^* = \hat\beta \frac{S_x}{S_y} \>. สิ่งนี้ได้รับใน D. Gujarati เศรษฐมิติพื้นฐานหน้า 175 สูตร (6.3.8) โดยที่เป็นตัวประมาณจากการถดถอยที่ทำงานบนตัวแปรมาตรฐานและเป็นตัวประมาณเดียวกันที่แปลงกลับไปเป็นมาตราส่วนดั้งเดิมคือค่าเบี่ยงเบนมาตรฐานตัวอย่างของรีจีสเตอร์และคือค่าเบี่ยงเบนมาตรฐานตัวอย่างβ∗β∗\beta^*β^β^\hat\betaSySyS_ySxSxS_x น่าเสียดายที่หนังสือเล่มนี้ไม่ครอบคลุมผลลัพธ์ที่คล้ายคลึงกันสำหรับการถดถอยหลายครั้ง นอกจากนี้ฉันไม่แน่ใจว่าฉันเข้าใจคดี bivariate หรือไม่ การปรับพีชคณิตอย่างง่ายให้สูตรในระดับเดิม:β^β^\hat\beta β^=β∗SySxβ^=β∗SySx \hat\beta=\beta^* \frac{S_y}{S_x} ดูเหมือนว่าแปลกสำหรับฉันที่ที่คำนวณกับตัวแปรที่ได้รับการยุบแล้วจะต้องมีการยุบโดยอีกครั้งเพื่อที่จะถูกแปลงกลับ? (และทำไมค่าเฉลี่ยไม่ถูกเพิ่มเข้ามา)β^β^\hat\betaSxSxS_xSxSxS_x ดังนั้นใครบางคนสามารถอธิบายวิธีการทำเช่นนี้สำหรับกรณีหลายตัวแปรโดยมีแหล่งที่มาเพื่อให้ฉันเข้าใจผลลัพธ์

3
ข้อผิดพลาดมาตรฐานของค่ามัธยฐาน
สูตรต่อไปนี้ถูกต้องหรือไม่หากฉันต้องการวัดความคลาดเคลื่อนมาตรฐานของค่ามัธยฐานในกรณีตัวอย่างขนาดเล็กที่มีการแจกแจงแบบไม่ปกติ (ฉันใช้ไพ ธ อน) sigma=np.std(data) n=len(data) sigma_median=1.253*sigma/np.sqrt(n)

3
เหตุใดข้อความที่ตัดตอนมานี้บอกว่าการประมาณค่าเบี่ยงเบนมาตรฐานโดยปกติจะไม่เกี่ยวข้องกัน
ฉันอ่านเกี่ยวกับการคำนวณการประมาณค่าเบี่ยงเบนมาตรฐานและแหล่งข้อมูลที่ฉันอ่านระบุไว้ (... ) ยกเว้นในบางสถานการณ์ที่สำคัญงานมีความเกี่ยวข้องเพียงเล็กน้อยกับการใช้งานสถิติเนื่องจากความต้องการของมันถูกหลีกเลี่ยงโดยขั้นตอนมาตรฐานเช่นการใช้การทดสอบที่สำคัญและช่วงความเชื่อมั่นหรือโดยใช้การวิเคราะห์แบบเบย์ ฉันสงสัยว่าถ้าใครสามารถอธิบายเหตุผลของข้อความนี้ได้ตัวอย่างเช่นช่วงความมั่นใจไม่ได้ใช้ค่าเบี่ยงเบนมาตรฐานเป็นส่วนหนึ่งของการคำนวณหรือไม่ ดังนั้นช่วงความเชื่อมั่นจะไม่ได้รับผลกระทบจากค่าเบี่ยงเบนมาตรฐานแบบเอนเอียงหรือไม่? แก้ไข: ขอบคุณสำหรับคำตอบจนถึงตอนนี้ แต่ฉันไม่แน่ใจว่าฉันทำตามเหตุผลบางอย่างของพวกเขาดังนั้นฉันจะเพิ่มตัวอย่างง่าย ๆ ประเด็นก็คือว่าถ้าแหล่งข้อมูลนั้นถูกต้องแล้วก็มีบางอย่างผิดปกติจากการสรุปตัวอย่างและฉันอยากให้ใครสักคนชี้ให้เห็นว่าค่า p ไม่ได้ขึ้นอยู่กับค่าเบี่ยงเบนมาตรฐานอย่างไร สมมติว่านักวิจัยต้องการทดสอบว่าคะแนนเฉลี่ยของนักเรียนระดับประถมห้าในการทดสอบในเมืองของเขาหรือเธอแตกต่างจากค่าเฉลี่ยของชาติที่ 76 ด้วยระดับนัยสำคัญ 0.05 หรือไม่ ผู้วิจัยสุ่มตัวอย่างนักเรียน 20 คน ค่าเฉลี่ยตัวอย่างเท่ากับ 80.85 ค่าเบี่ยงเบนมาตรฐานตัวอย่างเท่ากับ 8.87 ซึ่งหมายความว่า: t = (80.85-76) / (8.87 / sqrt (20)) = 2.44 จากนั้นใช้ตาราง t เพื่อคำนวณว่าค่าความน่าจะเป็นแบบสองด้านที่เท่ากับ 2.44 กับ 19 df เท่ากับ 0.025 นี่ต่ำกว่าระดับนัยสำคัญ 0.05 เราจึงปฏิเสธสมมติฐานว่าง ดังนั้นในตัวอย่างนี้ค่า p …

2
ข้อผิดพลาดมาตรฐานของการนับ
ฉันมีชุดข้อมูลของเหตุการณ์ที่เกิดขึ้นตามฤดูกาลของโรคที่หายาก ตัวอย่างเช่นสมมติว่ามี 180 กรณีในฤดูใบไม้ผลิ 90 ในฤดูร้อน 45 ในฤดูใบไม้ร่วงและ 210 ในฤดูหนาว ฉันกำลังดิ้นรนกับว่ามันเหมาะสมที่จะแนบข้อผิดพลาดมาตรฐานกับตัวเลขเหล่านี้ เป้าหมายการวิจัยมีความสำคัญในแง่ที่ว่าเรากำลังมองหารูปแบบตามฤดูกาลในการเกิดโรคที่อาจเกิดขึ้นอีกในอนาคต ดังนั้นจึงรู้สึกอย่างสังหรณ์ใจว่าควรเป็นไปได้ที่จะแนบการวัดความไม่แน่นอนกับผลรวม อย่างไรก็ตามฉันไม่แน่ใจว่าจะคำนวณข้อผิดพลาดมาตรฐานในกรณีนี้อย่างไรเนื่องจากเรากำลังจัดการกับการนับง่าย ๆ แทนที่จะเป็นเช่นวิธีการหรือสัดส่วน ท้ายที่สุดคำตอบนั้นขึ้นอยู่กับว่าข้อมูลแสดงถึงจำนวนผู้ป่วย (ทุกกรณีที่เคยเกิดขึ้น) หรือสุ่มตัวอย่างหรือไม่? หากฉันไม่ผิดพลาดโดยทั่วไปไม่เหมาะสมที่จะแสดงข้อผิดพลาดมาตรฐานกับสถิติประชากรเนื่องจากไม่มีการอนุมาน

4
ติดตามผล: ในแบบผสมภายในระหว่างการวางแผน ANOVA ประมาณ SEs หรือ SE จริง
ขณะนี้ฉันกำลังเขียนบทความและสะดุดกับคำถามนี้เมื่อวานนี้ซึ่งทำให้ฉันตั้งคำถามเดียวกันกับตัวเอง มันจะดีกว่าหรือไม่ที่จะให้กราฟกับข้อผิดพลาดมาตรฐานจริงจากข้อมูลหรือประมาณจาก ANOVA ของฉัน เนื่องจากคำถามจากเมื่อวานค่อนข้างไม่เจาะจงและของฉันค่อนข้างเจาะจงฉันคิดว่ามันเหมาะสมที่จะถามคำถามติดตามนี้ รายละเอียด: ฉันได้ทำการทดลองในโดเมนจิตวิทยาเกี่ยวกับความรู้ความเข้าใจ (การใช้เหตุผลเชิงเงื่อนไข) เปรียบเทียบสองกลุ่ม (คำแนะนำแบบอุปนัยและนิรนัยคือการยักย้ายระหว่างอาสาสมัคร) กับการแก้ไขภายในสองวิชา (ประเภทปัญหาและเนื้อหาของปัญหาแต่ละรายการด้วย สองระดับปัจจัย) ผลลัพธ์มีลักษณะเช่นนี้ (แผงด้านซ้ายที่มีการประมาณค่า SE จาก ANOVA เอาท์พุท, แผงด้านขวาที่มีการประมาณค่า SE จากข้อมูล): โปรดสังเกตว่าบรรทัดที่แตกต่างกันแสดงถึงกลุ่มที่แตกต่างกันสองกลุ่ม (เช่น การปรับเปลี่ยนวิชาจะถูกพล็อตบนแกน x (เช่นระดับปัจจัย 2x2) ในข้อความที่ฉันให้ผลลัพธ์ตามความต้องการของ ANOVA และแม้แต่การเปรียบเทียบที่วางแผนไว้สำหรับการโต้ตอบข้ามที่สำคัญตรงกลาง SE อยู่ที่นั่นเพื่อให้คำแนะนำผู้อ่านเกี่ยวกับความแปรปรวนของข้อมูล ฉันชอบ SEs มากกว่าส่วนเบี่ยงเบนมาตรฐานและช่วงความเชื่อมั่นเนื่องจากไม่ใช่เรื่องธรรมดาที่จะพล็อต SD และมีปัญหาที่รุนแรงเมื่อเปรียบเทียบ CIs ภายในและระหว่างวิชา จากพวกเขา). หากต้องการทำซ้ำคำถามของฉัน: จะดีกว่าที่จะวางแผน SEs ที่ประเมินจาก ANOVA หรือฉันควรจะแปลง SEs ที่ประเมินจากข้อมูลดิบ? ปรับปรุง: …

4
ทำไมเราถึงพูดว่า“ ข้อผิดพลาดมาตรฐานที่ตกค้าง”?
มีข้อผิดพลาดมาตรฐานคือประมาณค่าเบี่ยงเบนมาตรฐานσ ( θ )ของประมาณการθสำหรับพารามิเตอร์θσ^(θ^)σ^(θ^)\hat \sigma(\hat\theta)θ^θ^\hat\thetaθθ\theta ทำไมค่าเบี่ยงเบนมาตรฐานโดยประมาณของส่วนที่เหลือเรียกว่า "ข้อผิดพลาดมาตรฐานส่วนที่เหลือ" (เช่นในผลลัพธ์ของsummary.lmฟังก์ชันR ) และไม่ใช่ "ค่าเบี่ยงเบนมาตรฐานส่วนที่เหลือ"? เราประมาณค่าพารามิเตอร์ที่จัดให้มีข้อผิดพลาดมาตรฐานที่นี่? เราพิจารณาแต่ละค่าส่วนที่เหลือเป็นตัวประมาณสำหรับข้อผิดพลาด "ของ" และประเมินข้อผิดพลาดมาตรฐาน "รวม" ของตัวประมาณเหล่านี้ทั้งหมดหรือไม่

1
ทำไมข้อผิดพลาดมาตรฐานของการดักจับเพิ่มขึ้นอีกมาจาก 0
ข้อผิดพลาดมาตรฐานของคำดักจับ ( ) ในมอบให้โดย ที่คือ ค่าเฉลี่ยของ 'sβ^0β^0\hat{\beta}_0y=β1x+β0+εy=β1x+β0+εy=\beta_1x+\beta_0+\varepsilonSE(β^0)2=σ2[1n+x¯2∑ni=1(xi−x¯)2]SE(β^0)2=σ2[1n+x¯2∑i=1n(xi−x¯)2]SE(\hat{\beta}_0)^2 = \sigma^2\left[\frac{1}{n}+\frac{\bar{x}^2}{\sum_{i=1}^n(x_i-\bar{x})^2}\right]x¯x¯\bar{x}xixix_i จากสิ่งที่ฉันเข้าใจ SE คำนวณปริมาณความไม่แน่นอนของคุณ - ในตัวอย่าง 95%, ช่วงเวลาจะมีจริง . ผมไม่เข้าใจว่าทางทิศตะวันออก, ตัวชี้วัดของความไม่แน่นอนที่เพิ่มขึ้นกับ{x} ถ้าฉันเปลี่ยนข้อมูลของฉันดังนั้นความไม่แน่นอนของฉันลดลง ดูเหมือนว่าไม่มีเหตุผลβ 0 ˉ x ˉ x = 0[β^0−2SE,β^0+2SE][β^0−2SE,β^0+2SE][\hat{\beta}_0-2SE,\hat{\beta}_0+2SE]β0β0\beta_0x¯x¯\bar{x}x¯=0x¯=0\bar{x}=0 การตีความแบบอะนาล็อกคือ - ในเวอร์ชันที่ไม่มีข้อมูลของฉันสอดคล้องกับการทำนายของฉันที่ในขณะที่อยู่ตรงกลางข้อมูลสอดคล้องกับการทำนายของฉันที่{x} ดังนั้นนี้ไม่แล้วหมายความว่าความไม่แน่นอนของฉันเกี่ยวกับการทำนายของฉันที่มีค่ามากกว่าความไม่แน่นอนของฉันเกี่ยวกับการทำนายของฉันที่ ? ที่ดูเหมือนว่าไม่มีเหตุผลเกินไปข้อผิดพลาดมีความแปรปรวนเหมือนกันสำหรับทุกค่าของดังนั้นความไม่แน่นอนของฉันในค่าคาดการณ์ของฉันควรจะเหมือนกันสำหรับทุกxx=0 β 0x= ˉ x x=0x= ˉ x εxxβ^0β^0\hat{\beta}_0x=0x=0x=0β^0β^0\hat{\beta}_0x=x¯x=x¯x=\bar{x}x=0x=0x=0x=x¯x=x¯x=\bar{x}ϵϵ\epsilonxxxxxx มีช่องว่างในความเข้าใจของฉันฉันแน่ใจ มีใครช่วยให้ฉันเข้าใจว่าเกิดอะไรขึ้น?

1
คำนวณข้อผิดพลาดมาตรฐาน Newey-West โดยไม่มีวัตถุ lm ใน R
ฉันถามคำถามนี้เมื่อวานนี้ใน StackOverflow และได้รับคำตอบ แต่เราเห็นพ้องกันว่ามันดูค่อนข้างแฮ็คและอาจมีวิธีที่ดีกว่าในการดู คำถาม: ฉันต้องการคำนวณข้อผิดพลาดมาตรฐาน Newey-West (HAC) สำหรับเวกเตอร์ (ในกรณีนี้เวกเตอร์ที่มีผลตอบแทนสต็อก) ฟังก์ชั่นNeweyWest()ในsandwichแพ็คเกจทำสิ่งนี้ แต่รับlmวัตถุเป็นอินพุต วิธีการแก้ไธ MEYS นำเสนอเป็นโครงการเวกเตอร์บน 1 NeweyWest()ซึ่งจะเปลี่ยนเวกเตอร์ของฉันเป็นสิ่งตกค้างที่จะป้อนเข้าสู่ นั่นคือ: as.numeric(NeweyWest(lm(rnorm(100) ~ 1))) สำหรับความแปรปรวนของค่าเฉลี่ย ฉันควรจะทำอย่างนี้ไหม หรือมีวิธีที่จะทำสิ่งที่ฉันต้องการโดยตรงมากกว่านี้อีกไหม ขอบคุณ!

3
การเพิ่มค่าสัมประสิทธิ์เพื่อให้ได้เอฟเฟกต์การโต้ตอบ - จะทำอย่างไรกับ SEs?
ฉันมีการถดถอยหลายตัวแปรซึ่งรวมถึงการโต้ตอบ ตัวอย่างเช่นเพื่อให้ได้ค่าประมาณของผลการรักษาสำหรับควินไทล์ที่แย่ที่สุดฉันจำเป็นต้องเพิ่มค่าสัมประสิทธิ์จาก regressor ของการรักษาไปที่ค่าสัมประสิทธิ์จากตัวแปรปฏิสัมพันธ์ (ซึ่งมีปฏิสัมพันธ์กับการรักษาและควินไทล์ 1) เมื่อเพิ่มสองสัมประสิทธิ์จากการถดถอยหนึ่งจะได้รับข้อผิดพลาดมาตรฐานได้อย่างไร เป็นไปได้หรือไม่ที่จะเพิ่มข้อผิดพลาดมาตรฐานจากสัมประสิทธิ์ทั้งสองนี้? สิ่งที่เกี่ยวกับสถิติ t? เป็นไปได้ที่จะเพิ่มเหล่านี้เช่นกัน? ฉันคาดเดาไม่ได้ แต่ฉันไม่พบคำแนะนำเกี่ยวกับเรื่องนี้ ขอบคุณล่วงหน้ามากสำหรับความช่วยเหลือของคุณ!

5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
การค้นหาความแม่นยำของการจำลองสถานการณ์ของ Monte Carlo
พื้นหลัง ฉันออกแบบการจำลองมอนติคาร์โลที่รวมเอาท์พุทของชุดของแบบจำลองและฉันต้องการให้แน่ใจว่าการจำลองจะช่วยให้ฉันสามารถเรียกร้องที่สมเหตุสมผลเกี่ยวกับความน่าจะเป็นของผลลัพธ์ที่จำลองและความแม่นยำของการประมาณความน่าจะเป็น การจำลองจะพบว่ามีความเป็นไปได้ที่คณะลูกขุนที่ดึงมาจากชุมชนที่ระบุจะลงโทษจำเลยที่หนึ่ง นี่คือขั้นตอนของการจำลอง: ใช้ข้อมูลที่มีอยู่แล้วสร้างแบบจำลองความน่าจะเป็นแบบโลจิสติกส์ ( M ) โดยการลงคะแนน“ juror first ballot vote” บนตัวทำนายกลุ่มประชากร ใช้วิธีการ Monte Carlo เพื่อจำลองM 1,000 เวอร์ชัน(เช่น 1,000 สัมประสิทธิ์สำหรับพารามิเตอร์รุ่น) เลือกรุ่นหนึ่งใน 1,000 รุ่น ( M i ) Empanel 1,000 คณะลูกขุนโดยการสุ่มเลือก 12 คณะลูกขุน 12 คนจาก "ชุมชน" ( C ) ของบุคคลที่มีการแจกแจงลักษณะประชากร deterministically คำนวณความน่าจะเป็นครั้งแรกของการลงคะแนนเสียงการโหวตว่ามีความผิดในแต่ละตุลาการใช้Mฉัน แสดงผลคะแนนที่น่าจะเป็น "ลูกขุน" ในการลงคะแนนเสียงแบบกำหนด (ขึ้นอยู่กับว่ามันมีค่ามากกว่าหรือน้อยกว่าค่าที่เลือกแบบสุ่มระหว่าง 0-1) พิจารณา“ การลงคะแนนเสียงรอบสุดท้าย” …

1
R / mgcv: เพราะเหตุใดผลิตภัณฑ์ te () และ ti () เทนเซอร์จึงให้พื้นผิวที่แตกต่างกัน
mgcvแพคเกจสำหรับการRมีสองฟังก์ชั่นสำหรับการปฏิสัมพันธ์กระชับเมตริกซ์ผลิตภัณฑ์: และte() ti()ฉันเข้าใจการแบ่งขั้นพื้นฐานของการใช้แรงงานระหว่างคนทั้งสอง (ปรับให้เหมาะสมกับการทำงานแบบไม่เป็นเชิงเส้นเปรียบเทียบกับการย่อยสลายการโต้ตอบนี้เป็นผลกระทบหลักและการโต้ตอบ) สิ่งที่ฉันไม่เข้าใจคือสาเหตุte(x1, x2)และti(x1) + ti(x2) + ti(x1, x2)อาจให้ผลลัพธ์ที่แตกต่าง (เล็กน้อย) MWE (ดัดแปลงมาจาก?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
วิธีทั่วไปสำหรับการรับข้อผิดพลาดมาตรฐาน
ฉันไม่สามารถหาวิธีทั่วไปในการรับข้อผิดพลาดมาตรฐานได้ทุกที่ ฉันดูใน google เว็บไซต์นี้และแม้แต่ในตำราเรียน แต่สิ่งที่ฉันสามารถค้นหาได้คือสูตรข้อผิดพลาดมาตรฐานสำหรับค่าเฉลี่ยความแปรปรวนสัดส่วนสัดส่วนความเสี่ยง ฯลฯ ... และไม่ใช่ว่าสูตรเหล่านี้มาถึงอย่างไร หากร่างกายใด ๆ สามารถอธิบายได้ด้วยคำง่ายๆหรือแม้กระทั่งเชื่อมโยงฉันไปยังแหล่งข้อมูลที่ดีซึ่งอธิบายว่าฉันจะขอบคุณ

2
การเผยแพร่ข้อผิดพลาด SD vs SE
ฉันมีการวัดลักษณะนิสัยแบบ 3 ถึง 5 ข้อต่อบุคคลในสองเงื่อนไขที่แตกต่างกัน (A และ B) ฉันวางแผนค่าเฉลี่ยสำหรับแต่ละบุคคลในแต่ละสภาพและฉันจะใช้ข้อผิดพลาดมาตรฐาน ( เช่น ,กับ = จำนวนวัด) เป็นแถบข้อผิดพลาด NSD/N−−√SD/NSD/\sqrt{N}NNN ตอนนี้ฉันต้องการพล็อตความแตกต่างระหว่างการวัดเฉลี่ยต่อบุคคลในสภาพ A และเงื่อนไข B ฉันรู้ว่าฉันสามารถระบุข้อผิดพลาดที่แพร่กระจายได้: SD=SD2A+SD2B−−−−−−−−−−√SD=SDA2+SDB2SD=\sqrt{SD_A^2+SD_B^2} แต่ฉันจะเผยแพร่ข้อผิดพลาดมาตรฐานได้อย่างไร (เนื่องจากฉันจัดการกับค่าเฉลี่ยของการวัด) แทนที่จะเป็นค่าเบี่ยงเบนมาตรฐาน มันสมเหตุสมผลหรือไม่?

1
พล็อตช่องทางเลือกโดยไม่ใช้ข้อผิดพลาดมาตรฐาน (SE)
ก่อนส่ง meta-analysis ของฉันฉันต้องการทำพล็อตช่องทางเพื่อทดสอบความหลากหลายและอคติการตีพิมพ์ ฉันมีขนาดเอฟเฟกต์พูลและขนาดเอฟเฟกต์จากการศึกษาแต่ละครั้งที่รับค่าจาก -1 ถึง +1 ฉันมีขนาดตัวอย่าง n1, n2 สำหรับผู้ป่วยและการควบคุมจากการศึกษาแต่ละครั้ง เนื่องจากฉันไม่สามารถคำนวณข้อผิดพลาดมาตรฐาน (SE) ได้ฉันจึงไม่สามารถทำการถดถอยของ Egger ได้ ฉันไม่สามารถใช้ SE หรือความแม่นยำ = 1 / SE บนแกนตั้ง คำถาม ฉันยังสามารถสร้างช่องทางที่มีขนาดเอฟเฟกต์บนซอนแนวนอนและขนาดตัวอย่างทั้งหมด n (n = n1 + n2) บนแกนตั้งได้หรือไม่ พล็อตช่องทางดังกล่าวควรตีความอย่างไร เอกสารที่เผยแพร่บางฉบับแสดงพล็อตช่องทางดังกล่าวพร้อมขนาดตัวอย่างทั้งหมดบนแกนตั้ง (Pubmed PMIDs: 10990474, 10456970) และวิกิพีเดียช่องทาง wiki เห็นด้วยกับสิ่งนี้ แต่ที่สำคัญที่สุดคือกระดาษของ Mathhias Egger ใน BMJ 1999 (PubMed PMID: …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.