คำถามติดแท็ก data-augmentation

3
เหตุใดจึงมีความแตกต่างระหว่างการคำนวณช่วงความเชื่อมั่นแบบโลจิสติก 95% ด้วยตนเองและการใช้ฟังก์ชัน confint () ใน R
เรียนคุณทุกคน - ฉันสังเกตเห็นบางสิ่งแปลก ๆ ที่ไม่สามารถอธิบายได้ไหม โดยสรุป: แนวทางแบบแมนนวลเพื่อคำนวณช่วงความมั่นใจในโมเดลการถดถอยโลจิสติกและฟังก์ชัน R confint()ให้ผลลัพธ์ที่แตกต่างกัน ฉันเคยผ่านการถดถอยโลจิสติกประยุกต์ของ Hosmer & Lemeshow แล้ว (ฉบับที่ 2) ในบทที่ 3 มีตัวอย่างของการคำนวณอัตราส่วนอัตราต่อรองและช่วงความมั่นใจ 95% ด้วย R ฉันสามารถสร้างโมเดลได้อย่างง่ายดาย: Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
เทคนิคการเพิ่มข้อมูลสำหรับชุดข้อมูลทั่วไป?
ในหลาย ๆ แอปพลิเคชันการเรียนรู้ของเครื่องวิธีการเสริมข้อมูลที่เรียกว่าได้อนุญาตให้สร้างแบบจำลองที่ดีกว่า ตัวอย่างเช่นสมมติชุดฝึกสุนัขและแมวจำนวนภาพ โดยการหมุน, การทำมิเรอร์, การปรับคอนทราสต์ ฯลฯ เป็นไปได้ที่จะสร้างภาพเพิ่มเติมจากภาพต้นฉบับ100100100 ในกรณีของภาพการเพิ่มข้อมูลค่อนข้างตรงไปตรงมา อย่างไรก็ตามสมมติว่ามีตัวอย่างชุดฝึกอบรมจำนวนตัวอย่างและตัวแปรต่อเนื่องสองสามร้อยตัวที่เป็นตัวแทนของสิ่งต่าง ๆ การเพิ่มข้อมูลดูเหมือนจะไม่ง่ายอีกต่อไป จะทำอะไรได้บ้างในกรณีเช่นนี้?100100100

3
จะทำการแยกข้อมูลและตรวจสอบความถูกต้องของรถไฟได้อย่างไร?
ฉันกำลังจำแนกภาพโดยใช้การเรียนรู้ของเครื่อง สมมติว่าฉันมีข้อมูลการฝึกอบรม (ภาพ) และจะแบ่งข้อมูลออกเป็นชุดการฝึกอบรมและการตรวจสอบความถูกต้อง และฉันยังต้องการที่จะเพิ่มข้อมูล (สร้างภาพใหม่จากภาพต้นฉบับ) โดยการหมุนแบบสุ่มและการฉีดสัญญาณรบกวน augmentaion ทำแบบออฟไลน์ วิธีใดที่ถูกต้องในการเพิ่มข้อมูล? ขั้นแรกให้แบ่งข้อมูลออกเป็นชุดฝึกอบรมและตรวจสอบความถูกต้องจากนั้นทำการเพิ่มข้อมูลทั้งชุดฝึกอบรมและชุดตรวจสอบ ขั้นแรกให้แบ่งข้อมูลออกเป็นชุดฝึกอบรมและตรวจสอบความถูกต้องจากนั้นทำการเพิ่มข้อมูลในชุดฝึกอบรมเท่านั้น ก่อนอื่นทำการเพิ่มข้อมูลบนข้อมูลจากนั้นแบ่งข้อมูลออกเป็นชุดฝึกอบรมและตรวจสอบความถูกต้อง

3
กลยุทธ์การเพิ่มข้อมูลสำหรับการพยากรณ์อนุกรมเวลา
ฉันกำลังพิจารณาสองกลยุทธ์ในการทำ "การเพิ่มข้อมูล" ในการพยากรณ์อนุกรมเวลา ครั้งแรกพื้นหลังเล็กน้อย ตัวทำนายPPPเพื่อคาดการณ์ขั้นตอนถัดไปของอนุกรมเวลา{ Aผม}{Aผม}\lbrace A_i\rbraceเป็นฟังก์ชันที่โดยทั่วไปจะขึ้นอยู่กับสองสิ่งคือสถานะของอนุกรมเวลาที่ผ่านมา แต่ยังรวมถึงรัฐในอดีตของผู้ทำนายด้วย: P( { Aฉัน≤ t - 1} , PSt - 1)P({Aผม≤เสื้อ-1},PSเสื้อ-1)P(\lbrace A_{i\leq t-1}\rbrace,P_{S_{t-1}}) หากเราต้องการปรับ / ฝึกอบรมระบบของเราเพื่อให้ได้PPPที่ดีเราจะต้องมีข้อมูลที่เพียงพอ บางครั้งข้อมูลที่มีอยู่อาจไม่เพียงพอดังนั้นเราจึงพิจารณาเพิ่มข้อมูล วิธีแรก สมมติว่าเรามีชุดเวลา{ Aผม}{Aผม}\lbrace A_i \rbraceกับ1 ≤ ฉัน≤ n1≤ผม≤n1 \leq i \leq n n และสมมติว่าเรามีεε\epsilonที่ตรงตามเงื่อนไขต่อไปนี้: 0 &lt; ϵ &lt; | ฉัน+ 1- กผม| ∀ฉัน∈{1,…,n}0&lt;ε&lt;|Aผม+1-Aผม|∀ผม∈{1,...,n}0<\epsilon < |A_{i+1} - …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.