คำถามติดแท็ก diagnostic

มาตรการวินิจฉัย (เช่นเศษเหลือหรือสถิติสรุปบางอย่างที่คำนวณจากเศษเหลือ) ใช้เพื่อประเมินคุณภาพของแบบจำลองบางประการที่เหมาะสมกับข้อมูล

2
วิธีการอ่านแปลงระยะทางของ Cook?
ไม่มีใครรู้วิธีการทำงานว่าคะแนน 7, 16 และ 29 เป็นคะแนนที่มีอิทธิพลหรือไม่? ฉันอ่านบางที่เพราะระยะทางของ Cook ต่ำกว่า 1 พวกเขาไม่ใช่ ฉันถูกไหม?

3
การตีความแปลงการวินิจฉัยที่เหลือสำหรับรุ่น GLM?
ฉันกำลังมองหาแนวทางในการตีความพล็อตที่เหลือของแบบจำลอง GLM โดยเฉพาะปัวซอง, ทวินามลบ, โมเดลทวินาม เราคาดหวังอะไรจากแปลงเหล่านี้เมื่อแบบจำลองนั้น "ถูกต้อง"? (ตัวอย่างเช่นเราคาดว่าความแปรปรวนจะเพิ่มขึ้นเมื่อค่าที่คาดการณ์เพิ่มขึ้นเมื่อใช้กับแบบจำลองปัวซอง) ฉันรู้ว่าคำตอบนั้นขึ้นอยู่กับรุ่น การอ้างอิงใด ๆ (หรือประเด็นทั่วไปที่ควรพิจารณา) จะเป็นประโยชน์ / ได้รับการชื่นชม

5
เหตุใดช่วงเวลาบูตของฉันจึงมีความครอบคลุมที่แย่มาก
ฉันต้องการทำการสาธิตคลาสที่ฉันเปรียบเทียบช่วงเวลา t กับช่วง bootstrap และคำนวณความน่าจะเป็นที่ครอบคลุมของทั้งคู่ ฉันต้องการข้อมูลที่มาจากการแจกแจงแบบเบ้ดังนั้นฉันเลือกที่จะสร้างข้อมูลเป็นexp(rnorm(10, 0, 2)) + 1ตัวอย่างขนาด 10 จาก lognormal ที่เปลี่ยนไป ฉันเขียนสคริปต์เพื่อวาดตัวอย่าง 1,000 รายการและสำหรับแต่ละตัวอย่างให้คำนวณทั้งช่วงเวลา 95% t และช่วงเวลาบูตเปอร์เซ็นต์ไทล์ 95% จากการจำลองซ้ำ 1,000 ครั้ง เมื่อฉันเรียกใช้สคริปต์วิธีการทั้งสองให้ช่วงเวลาที่คล้ายกันมากและทั้งสองมีโอกาสครอบคลุม 50-60% ฉันประหลาดใจเพราะฉันคิดว่าช่วงบูทสแตรปจะดีกว่า คำถามของฉันคือฉันมี ทำผิดพลาดในรหัส? ทำผิดพลาดในการคำนวณช่วงเวลาหรือไม่? ทำผิดพลาดโดยคาดหวังว่าช่วงเวลา bootstrap จะมีคุณสมบัติครอบคลุมที่ดีขึ้นหรือไม่ นอกจากนี้ยังมีวิธีการสร้าง CI ที่น่าเชื่อถือมากขึ้นในสถานการณ์นี้หรือไม่? tCI.total <- 0 bootCI.total <- 0 m <- 10 # sample size true.mean <- …

1
มีแผนการวินิจฉัยอะไรบ้างสำหรับการถดถอยแบบควอไทล์
ตามคำถามของฉันสำหรับ OLSฉันสงสัยว่ามีแผนการวินิจฉัยอะไรบ้างสำหรับการถดถอยแบบควอไทล์ (และมีการนำไปปฏิบัติของพวกเขาหรือไม่?) การค้นหา google อย่างรวดเร็วได้เกิดขึ้นกับตัวหนอน (ซึ่งฉันไม่เคยได้ยินมาก่อน) และฉันยินดีที่จะรู้วิธีการเพิ่มเติมที่คุณอาจรู้ (เป็นหนึ่งในนั้นจาก OLS พอร์ตสำหรับ quantile-regression?)

2
การทดสอบอัตราส่วนความน่าจะเป็นใน R
สมมติว่าฉันจะทำการถดถอยแบบลอจิสติกที่ไม่มีตัวแปรในตัวแปรอิสระหลายตัวเช่นนี้ mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) ฉันทำการเปรียบเทียบแบบจำลอง (การทดสอบอัตราส่วนความน่าจะเป็น) เพื่อดูว่าแบบจำลองนั้นดีกว่าตัวแบบโมฆะโดยคำสั่งนี้หรือไม่ 1-pchisq(mod.a$null.deviance-mod.a$deviance, mod.a$df.null-mod.a$df.residual) จากนั้นฉันสร้างโมเดลอื่นพร้อมตัวแปรทั้งหมดในนั้น mod.c <- glm(x ~ a+b, data=z, family=binomial("logistic")) เพื่อดูว่าตัวแปรมีนัยสำคัญทางสถิติในโมเดลหลายตัวแปรหรือไม่ฉันใช้lrtestคำสั่งจากepicalc lrtest(mod.c,mod.a) ### see if variable b is statistically significant after adjustment of a lrtest(mod.c,mod.b) ### see if variable a is statistically …
25 r  logistic  diagnostic 

2
MCMC Geweke การวินิจฉัย
ฉันกำลังเรียกใช้ตัวอย่างเมือง (C ++) และต้องการใช้ตัวอย่างก่อนหน้านี้เพื่อประมาณอัตราการลู่เข้า สิ่งหนึ่งที่ง่ายต่อการใช้การวินิจฉัยที่ฉันพบคือการวินิจฉัยของ Gewekeซึ่งคำนวณความแตกต่างระหว่างตัวอย่างสองวิธีหมายถึงหารด้วยข้อผิดพลาดมาตรฐานโดยประมาณ ข้อผิดพลาดมาตรฐานประมาณจากความหนาแน่นสเปกตรัมที่ศูนย์ Zn=θ¯A−θ¯B1nASAθ^(0)+1nBSBθ^(0)−−−−−−−−−−−−−−−−√,Zn=θ¯A−θ¯B1nASθA^(0)+1nBSθB^(0),Z_n=\frac{\bar{\theta}_A-\bar{\theta}_B}{\sqrt{\frac{1}{n_A}\hat{S_{\theta}^A}(0)+\frac{1}{n_B}\hat{S_{\theta}^B}(0)}}, โดยที่ , Bเป็นหน้าต่างสองบานภายในเชนมาร์คอฟ ฉันได้ทำการวิจัยเกี่ยวกับ^ S A θ ( 0 )และ^ S B θ ( 0 )แต่อ่านความยุ่งเหยิงของวรรณคดีเรื่องความหนาแน่นสเปกตรัมพลังงานและความหนาแน่นสเปกตรัมพลังงานแต่ฉันไม่ใช่ผู้เชี่ยวชาญในหัวข้อเหล่านี้ ฉันต้องการคำตอบด่วน: ปริมาณเหล่านี้เหมือนกับความแปรปรวนตัวอย่างหรือไม่ ถ้าไม่เป็นสูตรในการคำนวณพวกเขาคืออะไร?AAABBBSAθ^(0)SθA^(0)\hat{S_{\theta}^A}(0)SBθ^(0)SθB^(0)\hat{S_{\theta}^B}(0) θθ\thetaθ(X)θ(X)\theta(X)SAθ^(0)SθA^(0)\hat{S_{\theta}^A}(0) SSS
14 mcmc  diagnostic 

3
มันถูกต้องหรือไม่ในการวิเคราะห์ข้อมูลการตรวจจับสัญญาณโดยไม่ใช้ตัวชี้วัดที่ได้มาจากทฤษฎีการตรวจจับสัญญาณ?
โดยทั่วไปแล้วการทดสอบการตรวจจับสัญญาณจะนำเสนอผู้สังเกตการณ์ (หรือระบบการวินิจฉัย) ด้วยสัญญาณหรือไม่ใช่สัญญาณและผู้สังเกตการณ์จะถูกขอให้รายงานว่าพวกเขาคิดว่ารายการที่นำเสนอนั้นเป็นสัญญาณหรือไม่ใช่สัญญาณ การทดลองดังกล่าวให้ผลข้อมูลที่เติมเมทริกซ์ 2x2: ทฤษฎีการตรวจจับสัญญาณหมายถึงข้อมูลดังกล่าวที่แสดงถึงสถานการณ์ที่การตัดสินใจ "สัญญาณ / ไม่ใช่สัญญาณ" ขึ้นอยู่กับความต่อเนื่องของสัญญาณ - สัญญาณซึ่งการทดลองสัญญาณโดยทั่วไปมีค่าสูงกว่าการทดลองที่ไม่ใช่สัญญาณและผู้สังเกตการณ์เพียงอย่างเดียว เลือกค่าเกณฑ์ด้านบนซึ่งพวกเขาจะรายงาน "สัญญาณ": ในแผนภาพด้านบนการแจกแจงสีเขียวและสีแดงหมายถึงการแจกแจง "สัญญาณ" และ "ไม่ใช่สัญญาณ" ตามลำดับและเส้นสีเทาแสดงถึงเกณฑ์ที่เลือกโดยผู้สังเกตการณ์ที่กำหนด ทางด้านขวาของเส้นสีเทาพื้นที่ใต้เส้นโค้งสีเขียวหมายถึงจำนวนที่พบและพื้นที่ใต้เส้นโค้งสีแดงแสดงถึงสัญญาณเตือนที่ผิด ทางด้านซ้ายของเส้นสีเทาพื้นที่ใต้เส้นโค้งสีเขียวจะชดเชยการพลาดและพื้นที่ใต้เส้นโค้งสีแดงแสดงถึงการปฏิเสธที่ถูกต้อง ตามที่คาดการณ์ไว้ตามโมเดลนี้สัดส่วนของการตอบสนองที่ตกอยู่ในแต่ละเซลล์ของตาราง 2x2 ด้านบนนั้นพิจารณาจาก: สัดส่วนสัมพัทธ์ของการทดลองสุ่มตัวอย่างจากการแจกแจงสีเขียวและสีแดง (อัตราฐาน) เกณฑ์ที่ผู้สังเกตการณ์เลือกไว้ การแยกระหว่างการแจกแจง ความแปรปรวนของการแจกแจงแต่ละครั้ง การออกจากความเสมอภาคของความแปรปรวนระหว่างการแจกแจงใด ๆ รูปร่างของการแจกแจงแต่ละแบบ (ทั้งคู่เป็นแบบเกาส์เหนือ) บ่อยครั้งที่การประเมินอิทธิพลของ # 5 และ # 6 สามารถประเมินได้โดยการให้ผู้สังเกตการณ์ทำการตัดสินใจในระดับเกณฑ์ที่แตกต่างกันจำนวนหนึ่งดังนั้นเราจะไม่สนใจสิ่งนั้นในตอนนี้ นอกจากนี้ # 3 และ # 4 เท่านั้นที่สมเหตุสมผลเมื่อเทียบกับอีกคนหนึ่ง (เช่นขนาดของการแยกที่สัมพันธ์กับความแปรปรวนของการแจกแจงเป็นเท่าใด) สรุปโดยการวัด "discriminability" …

1
พิสูจน์ความสัมพันธ์ระหว่างระยะทาง Mahalanobis กับ Leverage ได้หรือไม่?
ฉันเคยเห็นสูตรในWikipedia ที่เกี่ยวข้องกับระยะทางและ Mahalanobis Leverage: ระยะทาง Mahalanobis มีความสัมพันธ์อย่างใกล้ชิดกับสถิติการใช้ประโยชน์แต่มีระดับที่แตกต่าง:hhhD2=(N−1)(h−1N).D2=(N−1)(h−1N).D^2 = (N - 1)(h - \tfrac{1}{N}). ในบทความที่มีการเชื่อมโยง Wikipedia อธิบายในเงื่อนไขเหล่านี้hhh ในโมเดลการถดถอยเชิงเส้นคะแนนความสามารถในการใช้ประโยชน์สำหรับหน่วยข้อมูลถูกกำหนดเป็น:องค์ประกอบส่วนของเมทริกซ์หมวกโดยที่หมายถึงเมทริกซ์ทรานสดิวเซอร์ithithi^{th}hii=(H)ii,hii=(H)ii,h_{ii}=(H)_{ii},ithithi^{th}H=X(X⊤X)−1X⊤H=X(X⊤X)−1X⊤H=X(X^{\top}X)^{-1}X^{\top}⊤⊤^{\top} ฉันไม่สามารถหาหลักฐานได้ทุกที่ ฉันพยายามเริ่มจากคำจำกัดความ แต่ฉันไม่สามารถก้าวหน้าได้ ทุกคนสามารถให้คำใบ้ได้บ้าง

3
แบบจำลองของฉันดีหรือไม่ขึ้นอยู่กับค่าการวินิจฉัยของเมตริก (
ฉันติดตั้งโมเดลของฉันแล้วและพยายามเข้าใจว่ามันดีหรือไม่ ฉันได้คำนวณตัวชี้วัดที่แนะนำเพื่อประเมิน ( ข้อผิดพลาด / AUC / ความถูกต้อง / การคาดการณ์ / ฯลฯ ) แต่ไม่ทราบว่าจะตีความได้อย่างไร ในระยะสั้นฉันจะบอกได้อย่างไรว่าแบบจำลองของฉันดีตามเมตริกหรือไม่ เป็น 0.6 (ตัวอย่าง) เพียงพอที่จะแจ้งให้เราดำเนินการวาดข้อสรุปหรือการตัดสินใจธุรกิจ / วิทยาศาสตร์ฐาน?R2R2R^2R2R2R^2 คำถามนี้ตั้งใจกว้างเพื่อครอบคลุมสถานการณ์ที่สมาชิกเผชิญบ่อยครั้ง คำถามดังกล่าวอาจถูกปิดซ้ำซ้อนกับคำถามนี้ การแก้ไขเพื่อขยายขอบเขตนอกเหนือจากตัวชี้วัดที่กล่าวถึงที่นี่ยินดีต้อนรับเช่นเดียวกับคำตอบเพิ่มเติมโดยเฉพาะอย่างยิ่งสิ่งที่ให้ข้อมูลเชิงลึกเกี่ยวกับเมตริกประเภทอื่น

1
เหตุใดการวินิจฉัยจึงขึ้นอยู่กับส่วนที่เหลือ
ในการถดถอยเชิงเส้นอย่างง่ายเรามักจะต้องการตรวจสอบว่าสมมติฐานบางอย่างตรงตามความสามารถในการอนุมาน (เช่นกระจายตามปกติ) มันมีเหตุผลที่จะตรวจสอบสมมติฐานโดยการตรวจสอบว่าค่าติดตั้งมีการกระจายตามปกติ?

1
วิธีการตีความผลลัพธ์ของรุ่น TBATS และการวิเคราะห์แบบจำลอง
ฉันได้รับข้อมูลความต้องการรายครึ่งชั่วโมงซึ่งเป็นช่วงเวลาตามฤดูกาล ฉันใช้tbatsในforecastแพ็คเกจใน R และได้ผลลัพธ์ดังนี้: TBATS(1, {5,4}, 0.838, {<48,6>, <336,6>, <17520,5>}) หมายความว่าชุดข้อมูลไม่จำเป็นต้องใช้การแปลง Box-Cox หรือไม่และมีข้อผิดพลาดคือ ARMA (5, 4) และคำ 6, 6 และ 5 ใช้เพื่ออธิบายฤดูกาล พารามิเตอร์ที่ทำให้ชื้นคือ 0.8383 หมายความว่ามันคือการแปลงด้วยหรือไม่ ต่อไปนี้เป็นพล็อตการสลายตัวของรุ่น: ฉันสงสัยว่าจะทำอย่างไรlevelและslopeบอกเกี่ยวกับตัวแบบ 'ความชัน' บอกแนวโน้ม แต่จะเป็นlevelอย่างไร วิธีการรับพล็อตที่ชัดเจนสำหรับsession 1และsession 2ซึ่งเป็นฤดูกาลรายวันและรายสัปดาห์ตามลำดับ ฉันยังต้องรู้วิธีการวินิจฉัยแบบจำลองtbatsเพื่อประเมินโมเดลยกเว้นค่า RMSE วิธีปกติคือการตรวจสอบว่าข้อผิดพลาดเป็นสัญญาณรบกวนสีขาว แต่ที่นี่ข้อผิดพลาดควรจะเป็นซีรีส์ ARMA ฉันพล็อตข้อผิดพลาด 'acf' และ 'pacf' และฉันไม่คิดว่ามันจะดูเหมือน ARMA (5,4) หมายความว่าแบบจำลองของฉันไม่ดีหรือไม่? acf(resid(model1),lag.max = 1000) pacf(resid(model1),lag.max=1000) …

4
มีการทดสอบการตั้งค่าตัวแปรที่ละเว้นใน OLS หรือไม่
ฉันทราบเกี่ยวกับการทดสอบการตั้งค่าใหม่ของ Ramsey ซึ่งอาจตรวจพบการพึ่งพาแบบไม่เชิงเส้น อย่างไรก็ตามหากคุณเพิ่งโยนหนึ่งในสัมประสิทธิ์การถดถอย (เพียงแค่การอ้างอิงเชิงเส้น) คุณอาจได้รับอคติขึ้นอยู่กับความสัมพันธ์ เห็นได้ชัดว่านี่ไม่ถูกตรวจพบโดยการทดสอบการรีเซ็ต ฉันไม่พบการทดสอบสำหรับกรณีนี้ แต่คำสั่งนี้: "คุณไม่สามารถทดสอบ OVB ยกเว้นโดยรวมถึงตัวแปรที่อาจตัดทิ้ง" มันอาจเป็นข้อความที่สมเหตุสมผลใช่มั้ย

2
นามสกุลที่เป็นไปได้สำหรับแผนการวินิจฉัยเริ่มต้นสำหรับ lm (ใน R และโดยทั่วไป)?
ฉันเริ่มขุดลงไปในฟังก์ชั่นplot.lmฟังก์ชั่นนี้ให้หกพล็อตสำหรับ lm คือ: พล็อตของสารตกค้างต่อค่าติดตั้ง พล็อตที่ตั้งมาตราส่วนของ sqrt (| residuals |) เทียบกับค่าติดตั้ง พล็อต QQ ปกติพล็อตระยะทางของ Cook เทียบกับฉลากแถว เนื้อเรื่องของส่วนที่เหลือเทียบกับการยกระดับ เนื้อเรื่องของระยะทาง Cook เทียบกับ leverage / (1-leverage) และฉันสงสัยว่าส่วนขยายทั่วไป / ที่เป็นประโยชน์อื่น ๆ ของแปลงปัจจุบันมีอยู่สำหรับตัวแบบเชิงเส้นและพวกเขาสามารถทำได้ใน R อย่างไร (ยินดีต้อนรับลิงก์ไปยังบทความของแพ็คเกจ) ดังนั้นฟังก์ชั่น boxcox (จาก {MASS}) เป็นตัวอย่างของพล็อตการวินิจฉัยอีกประโยชน์ (และเช่นคำตอบจะดี) แต่ผมอยากรู้เพิ่มเติมเกี่ยวกับรูปแบบ / ส่วนขยายในที่มีอยู่แปลงวินิจฉัยเริ่มต้นสำหรับ LM ใน R (แม้ว่าโดยทั่วไป ข้อสังเกตอื่น ๆ ในหัวข้อยินดีเสมอ) นี่คือตัวอย่างง่ายๆของสิ่งที่ฉันหมายถึง: #Some example code …

4
เส้นตรงในแนวทแยงในส่วนที่เหลือเทียบกับพล็อตค่าติดตั้งสำหรับการถดถอยหลายครั้ง
ฉันกำลังสังเกตรูปแบบแปลก ๆ ที่เหลืออยู่สำหรับข้อมูลของฉัน: [แก้ไข] นี่คือพล็อตการถดถอยบางส่วนสำหรับตัวแปรสองตัว: [EDIT2] เพิ่มแผนการของ PP การกระจายดูเหมือนจะทำได้ดี (ดูด้านล่าง) แต่ฉันไม่มีเงื่อนงำที่เส้นตรงนี้อาจมาจาก ความคิดใด ๆ [อัพเดท 31.07] มันกลับกลายเป็นว่าคุณพูดถูกฉันมีหลายกรณีที่จำนวนทวีตซ้ำเป็น 0 อย่างแน่นอนและ 15 รายนี้ส่งผลให้มีรูปแบบที่เหลือแปลก ๆ ส่วนที่เหลือดูดีขึ้นมากในขณะนี้: ฉันได้รวมการถดถอยบางส่วนเข้ากับเส้นเหลือง

7
ความไวหรือความจำเพาะเป็นหน้าที่ของการแพร่หลายหรือไม่
การสอนมาตรฐานกล่าวว่าความไวและความจำเพาะเป็นคุณสมบัติของแบบทดสอบและไม่ขึ้นกับความชุก แต่นี่ไม่ใช่แค่ข้อสันนิษฐานใช่ไหม หลักการของแฮร์ริสันเกี่ยวกับอายุรศาสตร์ที่ 19 เอ็ดกล่าวว่า มีการยืนยันมานานแล้วว่าความไวและความจำเพาะเป็นพารามิเตอร์ที่ไม่ขึ้นอยู่กับความแม่นยำของการทดสอบและข้อความจำนวนมากยังคงสร้างข้อความนี้ อย่างไรก็ตามสมมติฐานที่มีประโยชน์เชิงสถิตินี้เป็นแบบง่าย ๆ ในทางคลินิก ... ความไวของการทดสอบจะสูงขึ้นในผู้ป่วยในโรงพยาบาลและการทดสอบความจำเพาะสูงในผู้ป่วยนอก (ความชุกโดยทั่วไปจะสูงกว่าในผู้ป่วยในกว่าผู้ป่วยนอก) มีความสัมพันธ์ทางคณิตศาสตร์หรือกราฟิกโดยประมาณระหว่างพารามิเตอร์เหล่านี้หรือไม่? แม้แต่ลิงค์นี้ก็เรียกว่า 'การทำให้เข้าใจง่าย' ทำไม? แก้ไข: ฉันรู้วิธีการกำหนดความไว ไม่มีคำศัพท์ใดที่เกี่ยวข้องกับการแพร่หลายดังที่ได้กล่าวไว้ในคำตอบ ตัวฉันเองยืนยันว่าสิ่งเหล่านี้เป็นคุณสมบัติของการทดสอบที่ไม่ได้รับผลกระทบจากประชากรที่ใช้จนกระทั่งฉันเจอข้อความนี้ดังนั้นคำถาม แต่ฉันคิดว่าความสับสนนี้เกิดขึ้นไม่ใช่เพราะคำจำกัดความ แต่การคำนวณค่าเหล่านี้ในทางปฏิบัติ ความเจาะจงและความไวถูกคำนวณโดยใช้ตาราง 2x2 ความชุกของประชากรอ้างอิงที่นี่สำคัญหรือไม่ นั่นคือสิ่งที่พวกเขากำลังอ้างถึง? ถ้าเป็นเช่นนั้นฟังก์ชั่นคืออะไร?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.