คำถามติดแท็ก standard-error

หมายถึงค่าเบี่ยงเบนมาตรฐานของการกระจายตัวตัวอย่างของสถิติที่คำนวณจากตัวอย่าง ข้อผิดพลาดมาตรฐานมักจำเป็นเมื่อสร้างช่วงความเชื่อมั่นหรือทดสอบสมมติฐานเกี่ยวกับประชากรที่เก็บตัวอย่างทางสถิติ

3
วิธีการตีความรูตหมายความว่าข้อผิดพลาดกำลังสอง (RMSE) กับค่าเบี่ยงเบนมาตรฐาน?
สมมติว่าฉันมีแบบจำลองที่ให้ค่าที่คาดการณ์กับฉัน ฉันคำนวณ RMSE ของค่าเหล่านั้น แล้วค่าเบี่ยงเบนมาตรฐานของค่าจริง มันสมเหตุสมผลไหมที่จะเปรียบเทียบค่าทั้งสอง (ความแปรปรวน)? สิ่งที่ฉันคิดคือถ้า RMSE และส่วนเบี่ยงเบนมาตรฐานเหมือนกัน / เหมือนกันข้อผิดพลาด / ความแปรปรวนของโมเดลของฉันจะเหมือนกับสิ่งที่เกิดขึ้นจริง แต่ถ้ามันไม่สมเหตุสมผลที่จะเปรียบเทียบค่าเหล่านั้นดังนั้นข้อสรุปนี้อาจผิด หากความคิดของฉันเป็นจริงแสดงว่าแบบจำลองนั้นดีเท่าที่ควรเพราะมันไม่สามารถบอกได้ว่าอะไรทำให้เกิดความแปรปรวน? ฉันคิดว่าส่วนสุดท้ายอาจผิดหรืออย่างน้อยต้องการข้อมูลเพิ่มเติมเพื่อตอบ

1
ข้อผิดพลาดมาตรฐานของค่าเบี่ยงเบนมาตรฐานตัวอย่างคืออะไร
ผมอ่านจากที่นั่นว่าข้อผิดพลาดมาตรฐานความแปรปรวนของกลุ่มตัวอย่างคือ SEs2=2σ4N−1−−−−−−√SEs2=2σ4N−1SE_{s^2} = \sqrt{\frac{2 \sigma^4}{N-1}} ข้อผิดพลาดมาตรฐานของค่าเบี่ยงเบนมาตรฐานตัวอย่างคืออะไร ฉันจะถูกล่อลวงให้เดาและพูดว่าแต่ผมไม่แน่ใจว่าSEs=SEs2−−−−√SEs=SEs2SE_{s} = \sqrt{SE_{s^2}}

1
วิธีการใช้วิธีเดลต้าสำหรับข้อผิดพลาดมาตรฐานของผลกระทบเล็กน้อย?
ฉันสนใจที่จะเข้าใจวิธีการเดลต้าในการประมาณข้อผิดพลาดมาตรฐานของผลกระทบส่วนเพิ่มโดยเฉลี่ยของตัวแบบการถดถอยซึ่งรวมถึงคำศัพท์การโต้ตอบ ฉันได้ดูคำถามที่เกี่ยวข้องภายใต้วิธีเดลต้าแต่ไม่มีผู้ใดได้ให้สิ่งที่ฉันกำลังมองหา พิจารณาข้อมูลตัวอย่างต่อไปนี้เป็นตัวอย่างที่สร้างแรงบันดาลใจ: set.seed(1) x1 <- rnorm(100) x2 <- rbinom(100,1,.5) y <- x1 + x2 + x1*x2 + rnorm(100) m <- lm(y ~ x1*x2) ฉันสนใจในผลกระทบที่ขอบเฉลี่ย (อาเมส) ของและx1 x2ในการคำนวณเหล่านี้ฉันทำต่อไปนี้: cf <- summary(m)$coef me_x1 <- cf['x1',1] + cf['x1:x2',1]*x2 # MEs of x1 given x2 me_x2 <- cf['x2',1] + cf['x1:x2',1]*x1 # MEs of …

2
วิธีหาข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอยเชิงเส้น
สำหรับโมเดลการถดถอยเชิงเส้นแบบไม่ ได้รับชุดข้อมูลการประมาณค่าสัมประสิทธิ์คือ \ hat \ beta_0 = \ bar y - \ hat \ beta_1 \ bar x นี่คือคำถามของฉันตาม หนังสือและWikipediaข้อผิดพลาดมาตรฐานของ\ hat \ beta_1คือs _ {\ hat \ beta_1} = \ sqrt {\ frac {\ sum_i \ hat \ epsilon_i ^ 2} {(n-2) \ sum_i (x_i- \ bar x ) ^ …

6
รายงานข้อผิดพลาดมาตรฐานที่แข็งแกร่ง (ขาว) เสมอหรือไม่
ได้รับการแนะนำโดย Angrist และ Pischke ว่า Robust (เช่นมีความทนทานต่อ heteroskedasticity หรือความแปรปรวนไม่เท่ากัน) มีการรายงานข้อผิดพลาดมาตรฐานเป็นเรื่องของหลักสูตรมากกว่าการทดสอบ สองคำถาม: อะไรคือผลกระทบต่อข้อผิดพลาดมาตรฐานของการทำเช่นนั้นเมื่อมีความเป็นรักร่วมเพศ มีใครทำสิ่งนี้ในงานของพวกเขาบ้างไหม?

1
เมื่อมีการวิเคราะห์จาโคเบียนจะดีกว่าหรือไม่ที่จะประมาณชาวเฮสเซียนโดยหรือโดยความแตกต่างที่ จำกัด ของจาโคเบียน
สมมติว่าฉันกำลังคำนวณพารามิเตอร์ของแบบจำลองฉันลดจำนวนผลรวมส่วนที่เหลือกำลังสองลดลงและฉันสมมติว่าข้อผิดพลาดของฉันคือเกาส์เซียน แบบจำลองของฉันสร้างอนุพันธ์การวิเคราะห์ดังนั้นเครื่องมือเพิ่มประสิทธิภาพจึงไม่จำเป็นต้องใช้ความแตกต่างที่แน่นอน เมื่อพอดีแล้วฉันต้องการคำนวณข้อผิดพลาดมาตรฐานของพารามิเตอร์ที่ติดตั้ง โดยทั่วไปในสถานการณ์นี้ Hessian ของฟังก์ชั่นข้อผิดพลาดจะต้องเกี่ยวข้องกับเมทริกซ์ความแปรปรวนร่วมโดย: โดยที่เป็นความแปรปรวนของเศษเหลือσ 2σ2H−1=Cσ2H−1=C \sigma^2 H^{-1} = C σ2σ2\sigma^2 เมื่อไม่มีการวิเคราะห์อนุพันธ์ของข้อผิดพลาดก็มักจะไม่สามารถคำนวณ Hessian ดังนั้นจึงถูกนำมาใช้เป็นค่าประมาณที่ดีJTJJTJJ^TJ อย่างไรก็ตามในกรณีของฉันฉันมีการวิเคราะห์ J ดังนั้นมันค่อนข้างถูกสำหรับฉันที่จะคำนวณ H โดยการหาผลต่าง จำกัด ดังนั้นคำถามของฉันคือ: มันจะแม่นยำกว่าถ้าประมาณ H โดยใช้ J ที่แน่นอนของฉันและใช้การประมาณข้างต้นหรือใช้ H ประมาณโดยการหาผลต่าง จำกัด J?

5
วิธีการแสดงแถบข้อผิดพลาดสำหรับการทดลองข้ามคู่
สถานการณ์ต่อไปนี้ได้กลายเป็นคำถามที่พบบ่อยที่สุดในสามผู้ตรวจสอบ (I) ผู้ตรวจสอบ / บรรณาธิการ (R ไม่เกี่ยวข้องกับ CRAN) และฉัน (M) ในฐานะผู้สร้างพล็อต เราสามารถสรุปได้ว่า (R) เป็นผู้ตรวจทานบอสใหญ่ทางการแพทย์โดยทั่วไปที่รู้ว่าแต่ละพล็อตต้องมีแถบข้อผิดพลาดมิฉะนั้นจะผิด เมื่อผู้ตรวจทานเชิงสถิติเข้ามาเกี่ยวข้องปัญหาก็สำคัญน้อยกว่ามาก สถานการณ์ ในการศึกษาทางเภสัชวิทยาทั่วไปพบว่ามีการทดสอบยา A และ B สองตัวเพื่อดูผลของระดับน้ำตาลในเลือด ผู้ป่วยแต่ละรายจะถูกทดสอบสองครั้งตามลำดับแบบสุ่มและอยู่ภายใต้ข้อสมมติว่าไม่มีการพกพา จุดสิ้นสุดหลักคือความแตกต่างระหว่างกลูโคส (BA) และเราคิดว่าการทดสอบแบบจับคู่นั้นเพียงพอแล้ว (I) ต้องการพล็อตที่แสดงระดับน้ำตาลที่แน่นอนในทั้งสองกรณี เขากลัวความต้องการของแถบข้อผิดพลาดและขอข้อผิดพลาดมาตรฐานในกราฟแท่ง อย่าเริ่มสงครามกราฟแท่งที่นี่เลย) (I): นั่นไม่เป็นความจริง แท่งมีการทับซ้อนกันและเรามี p = 0.03? นั่นไม่ใช่สิ่งที่ฉันได้เรียนรู้ในโรงเรียนมัธยม (M): เรามีการออกแบบที่จับคู่ที่นี่ แถบข้อผิดพลาดที่ร้องขอนั้นไม่เกี่ยวข้องทั้งหมดสิ่งที่นับคือ SE / CI ของความแตกต่างที่จับคู่ซึ่งไม่ได้แสดงในพล็อต ถ้าฉันมีตัวเลือกและมีข้อมูลไม่มากเกินไปฉันจะชอบพล็อตต่อไปนี้ เพิ่ม 1:นี่คือพล็อตพิกัดขนานที่กล่าวถึงในหลายคำตอบ (M): เส้นแสดงการจับคู่และเส้นส่วนใหญ่ขึ้นไปและนั่นคือความประทับใจที่ถูกต้องเพราะความลาดชันคือสิ่งที่นับได้ (ตกลงนี่คือการจัดหมวดหมู่ แต่อย่างไรก็ตาม) …

3
วิธีการคำนวณข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอยโลจิสติก
ฉันใช้ Scikit เรียนรู้ของ Python ในการฝึกอบรมและทดสอบการถดถอยโลจิสติก scikit-Learn จะส่งกลับค่าสัมประสิทธิ์การถดถอยของตัวแปรอิสระ แต่ไม่ได้ให้ข้อผิดพลาดมาตรฐานของสัมประสิทธิ์ ฉันต้องการข้อผิดพลาดมาตรฐานเหล่านี้เพื่อคำนวณสถิติ Wald สำหรับค่าสัมประสิทธิ์แต่ละค่าและเปรียบเทียบค่าสัมประสิทธิ์เหล่านี้กับแต่ละอื่น ๆ ฉันได้พบคำอธิบายวิธีการคำนวณข้อผิดพลาดมาตรฐานสำหรับค่าสัมประสิทธิ์ของการถดถอยโลจิสติก ( ที่นี่ ) แต่มันค่อนข้างยากที่จะติดตาม หากคุณรู้วิธีอธิบายง่ายๆเกี่ยวกับการคำนวณข้อผิดพลาดมาตรฐานเหล่านี้และ / หรือสามารถให้ข้อผิดพลาดมาตรฐานกับฉันได้ฉันขอขอบคุณจริงๆ! ฉันไม่ได้หมายถึงรหัสเฉพาะ (แต่โปรดโพสต์รหัสใด ๆ ที่อาจเป็นประโยชน์) แต่เป็นคำอธิบายอัลกอริทึมของขั้นตอนที่เกี่ยวข้อง

3
ฉันจะประเมินข้อผิดพลาดมาตรฐานสัมประสิทธิ์ได้อย่างไรเมื่อใช้การถดถอยแบบสัน
ฉันใช้การถดถอยแบบสันบนข้อมูลที่มีค่าหลายระดับสูง ใช้ OLS ฉันได้รับข้อผิดพลาดมาตรฐานขนาดใหญ่ในค่าสัมประสิทธิ์เนื่องจากความหลากหลายทางชีวภาพ ฉันรู้ว่าการถดถอยของสันเขาเป็นวิธีการจัดการกับปัญหานี้ แต่ในการนำไปใช้ทั้งหมดของการถดถอยสันที่ฉันได้ดูไม่มีข้อผิดพลาดมาตรฐานที่รายงานสำหรับสัมประสิทธิ์ ฉันต้องการประเมินว่าการถดถอยของสันเขาช่วยได้มากน้อยเพียงใดโดยดูว่ามันลดความผิดพลาดมาตรฐานของสัมประสิทธิ์ที่เฉพาะเจาะจงได้อย่างไร มีวิธีการประเมินพวกเขาในการถดถอยสัน?

1
ข้อผิดพลาดมาตรฐานสำหรับสัมประสิทธิ์การถดถอยหลายค่า?
ฉันรู้ว่านี่เป็นคำถามพื้นฐาน แต่ฉันไม่สามารถหาคำตอบได้ทุกที่ ฉันคำนวณสัมประสิทธิ์การถดถอยโดยใช้สมการปกติหรือการสลายตัว QR ฉันจะคำนวณข้อผิดพลาดมาตรฐานสำหรับแต่ละสัมประสิทธิ์ได้อย่างไร ฉันมักจะคิดว่าข้อผิดพลาดมาตรฐานที่คำนวณเป็น: SEx¯ =σx¯n√SEx¯ =σx¯nSE_\bar{x}\ = \frac{\sigma_{\bar x}}{\sqrt{n}} คืออะไรสำหรับแต่ละค่าสัมประสิทธิ์? วิธีที่มีประสิทธิภาพมากที่สุดในการคำนวณสิ่งนี้ในบริบทของ OLS คืออะไร?σx¯σx¯\sigma_{\bar x}

3
ข้อผิดพลาดมาตรฐานทำงานอย่างไร
เมื่อไม่นานมานี้ฉันได้ตรวจสอบการทำงานภายในของข้อผิดพลาดมาตรฐานและฉันพบว่าตัวเองไม่สามารถเข้าใจได้ว่ามันทำงานอย่างไร ความเข้าใจของฉันเกี่ยวกับความคลาดเคลื่อนมาตรฐานคือความเบี่ยงเบนมาตรฐานของการกระจายตัวของค่าเฉลี่ยตัวอย่าง คำถามของฉันคือ: •เราจะรู้ได้อย่างไรว่าข้อผิดพลาดมาตรฐานคือค่าเบี่ยงเบนมาตรฐานของตัวอย่างหมายถึงเมื่อเรามักจะใช้เพียงตัวอย่างเดียว? •ทำไมไม่สมการในการคำนวณข้อผิดพลาดมาตรฐานสะท้อนให้เห็นถึงสมการเบี่ยงเบนมาตรฐานสำหรับตัวอย่างเดียว?

3
ทำไมเราต้องใช้ Bootstrapping
ขณะนี้ฉันกำลังอ่าน "สถิติทั้งหมด" ของ Larry Wasserman และสับสนกับบางสิ่งที่เขาเขียนในบทเกี่ยวกับการประเมินฟังก์ชันทางสถิติของแบบจำลองที่ไม่ใช่พารามิเตอร์ เขาเขียน "บางครั้งเราสามารถค้นหาข้อผิดพลาดมาตรฐานโดยประมาณของฟังก์ชันทางสถิติโดยทำการคำนวณบางอย่างอย่างไรก็ตามในกรณีอื่น ๆ มันไม่ชัดเจนว่าจะประมาณข้อผิดพลาดมาตรฐานได้อย่างไร" ฉันต้องการจะชี้ให้เห็นว่าในบทถัดไปเขาพูดถึง bootstrap เพื่อแก้ไขปัญหานี้ แต่เนื่องจากฉันไม่เข้าใจคำแถลงนี้จริง ๆ ฉันจึงไม่ได้รับแรงจูงใจเบื้องหลัง Bootstrapping? มีตัวอย่างอะไรบ้างเมื่อไม่ทราบวิธีการประเมินข้อผิดพลาดมาตรฐานอย่างชัดเจน ตัวอย่างทั้งหมดที่ฉันเคยเห็น "ชัดเจน" เช่นดังนั้น^ s E ( P n ) = √X1,...Xn Ber(p)X1,...Xn Ber(p)X_1,...X_n ~Ber(p)se^(p^n)=p^⋅(1−p^)/n−−−−−−−−−−√se^(p^n)=p^⋅(1−p^)/n \hat{se}(\hat{p}_n )=\sqrt{\hat{p}\cdot(1-\hat{p})/n}

2
ข้อผิดพลาดของคอมพิวเตอร์มาตรฐานในการประมาณค่าเฉลี่ยถ่วงน้ำหนัก
สมมติว่าและจะวาดแต่ละIIDจากการกระจายบางกับอิสระจากx_iw_iเป็นบวกอย่างเคร่งครัด คุณสังเกตเห็นw_iทั้งหมดแต่ไม่ใช่x_i ; มากกว่าที่คุณสังเกต\ sum_i x_i w_i ฉันสนใจที่จะประมาณ\ operatorname {E} \ left [x \ right]จากข้อมูลนี้ เห็นได้ชัดว่าตัวประมาณ \ bar {x} = \ frac {\ sum_i w_i x_i} {\ sum_i w_i} นั้นไม่เอนเอียงและสามารถคำนวณได้เมื่อมีข้อมูลอยู่ในมือx 1 , x 2 , . . , x nw1,w2,…,wnw1,w2,…,wnw_1,w_2,\ldots,w_nx1,x2,...,xnx1,x2,...,xnx_1,x_2,...,x_nx ฉันW ฉันW ฉันx ฉันΣ ฉันx ฉันW ฉัน E [ x …

2
หาก "ข้อผิดพลาดมาตรฐาน" และ "ช่วงความมั่นใจ" วัดความแม่นยำของการวัดแล้วการวัดความถูกต้องคืออะไร
ในหนังสือ "ชีวสถิติสำหรับหุ่น" ในหน้า 40 ฉันอ่าน: ข้อผิดพลาดมาตรฐาน (ตัวย่อ SE) เป็นวิธีหนึ่งในการระบุความแม่นยำในการประมาณการหรือการวัดของคุณ และ ช่วงความเชื่อมั่นเป็นอีกวิธีหนึ่งในการระบุความแม่นยำของการประมาณหรือการวัดบางสิ่ง แต่ไม่มีการเขียนอะไรเพื่อแสดงความแม่นยำของการวัด คำถาม:จะระบุได้อย่างไรว่าการวัดบางอย่างนั้นแม่นยำแค่ไหน? วิธีใดที่ใช้สำหรับสิ่งนั้น เพื่อไม่ให้สับสนกับความแม่นยำและความแม่นยำของการทดสอบ: https://en.wikipedia.org/wiki/Accuracy_and_precision#In_binary_classification

2
การคำนวณช่วงความมั่นใจสำหรับการถดถอยโลจิสติก
ฉันใช้การถดถอยโลจิสติกแบบทวินามเพื่อระบุว่าการสัมผัสhas_xหรือhas_yส่งผลกระทบต่อโอกาสที่ผู้ใช้จะคลิกบนบางสิ่ง โมเดลของฉันมีดังต่อไปนี้: fit = glm(formula = has_clicked ~ has_x + has_y, data=df, family = binomial()) นี่คือผลลัพธ์จากรุ่นของฉัน: Call: glm(formula = has_clicked ~ has_x + has_y, family = binomial(), data = active_domains) Deviance Residuals: Min 1Q Median 3Q Max -0.9869 -0.9719 -0.9500 1.3979 1.4233 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.