คำถามติดแท็ก mgcv

2
โมเดลสารเติมแต่งทั่วไป - ใครทำการวิจัยกับพวกเขานอกเหนือจาก Simon Wood
ฉันใช้เกมมากขึ้นเรื่อย ๆ เมื่อฉันไปเพื่อให้การอ้างอิงสำหรับส่วนประกอบต่าง ๆ ของพวกเขา (การเลือกพารามิเตอร์ให้เรียบฐาน spline ต่างๆ p-values ​​ของคำศัพท์ที่ราบเรียบ) พวกเขาทั้งหมดมาจากนักวิจัยคนหนึ่ง - Simon Wood ที่ University of Bath ในอังกฤษ เขายังเป็นผู้ดูแลmgcvใน R ซึ่งใช้ร่างกายของเขาในการทำงาน mgcvมีความซับซ้อนอย่างมาก แต่ทำงานได้ดีอย่างน่าทึ่ง มีสิ่งที่มีอายุมากกว่าแน่นอน แนวความคิดดั้งเดิมนั้นให้เครดิตกับ Hastie & Tibshirani และตำราเก่าที่ยิ่งใหญ่เขียนโดย Ruppert et al ในปี 2003 ในฐานะที่เป็นคนสมัครฉันไม่ค่อยมีความรู้สึกกับนัก Zeitgeist ในหมู่นักสถิติ งานของเขาได้รับการยกย่องอย่างไร เป็นเรื่องแปลกไหมที่นักวิจัยคนหนึ่งทำได้มากในพื้นที่หนึ่ง? หรือมีงานอื่นที่ไม่ได้สังเกตมากเพราะมันไม่ได้อยู่ข้างในmgcv? ฉันไม่เห็นว่ามีการใช้เกมมากนักแม้ว่าเนื้อหาจะสามารถเข้าถึงได้โดยผู้ใช้ที่มีการฝึกอบรมทางสถิติและซอฟต์แวร์ได้รับการพัฒนาค่อนข้างดี มี "เรื่องย้อนหลัง" มากมายหรือไม่? คำแนะนำของมุมมองชิ้นและสิ่งที่คล้ายกันอื่น ๆ จากวารสารสถิติจะได้รับการชื่นชม

1
วิธีปรับแต่งการปรับให้เรียบใน mgcv GAM model
ฉันพยายามหาวิธีควบคุมพารามิเตอร์การปรับให้เรียบใน mgcv: แบบจำลอง gam ฉันมีตัวแปรทวินามฉันกำลังพยายามสร้างแบบจำลองเป็นฟังก์ชันหลักของพิกัด x และ y บนกริดคงที่รวมถึงตัวแปรอื่น ๆ ที่มีอิทธิพลน้อยกว่า ในอดีตฉันได้สร้างรูปแบบการถดถอยในท้องถิ่นที่ดีพอสมควรโดยใช้แพ็คเกจ locfit และค่า (x, y) อย่างไรก็ตามฉันต้องการลองรวมตัวแปรอื่น ๆ เข้ากับโมเดลและดูเหมือนว่าโมเดลเสริมทั่วไป (GAM) มีความเป็นไปได้ที่ดี หลังจากดูแพ็คเกจเกมและ mgcv ซึ่งทั้งสองอย่างมีฟังก์ชั่น GAM ฉันเลือกใช้หลังเนื่องจากมีความคิดเห็นจำนวนมากในเธรดรายการจดหมายดูเหมือนจะแนะนำ ข้อเสียอย่างหนึ่งก็คือดูเหมือนว่ามันจะไม่สนับสนุนการถดถอยในท้องถิ่นอย่างราบรื่นเช่นเหลืองหรือ locfit ในการเริ่มต้นฉันแค่ต้องการลองทำซ้ำประมาณโมเดล locfit โดยใช้เพียงพิกัด (x, y) ฉันลองด้วยการทำให้ผลิตภัณฑ์เรียบเนียนทั้งปกติและเทนเซอร์: my.gam.te <- gam(z ~ te(x, y), family=binomial(logit), data=my.data, scale = -1) my.gam.s <- gam(z ~ s(x, …
14 r  smoothing  mgcv 

1
โมเดลสารเติมแต่งทั่วไป (GAMs), การโต้ตอบและ covariates
ฉันสำรวจเครื่องมือจำนวนหนึ่งเพื่อการคาดการณ์และพบว่าแบบจำลองการเติมทั่วไป (เกม) เพื่อให้มีศักยภาพมากที่สุดสำหรับจุดประสงค์นี้ เกมยอดเยี่ยม! พวกเขาอนุญาตให้ระบุแบบจำลองที่ซับซ้อนอย่างรัดกุม อย่างไรก็ตามความกระชับแบบเดียวกันนั้นทำให้ฉันสับสนโดยเฉพาะอย่างยิ่งในเรื่องที่ว่า GAMs เข้าใจถึงเงื่อนไขการมีปฏิสัมพันธ์และเพื่อนร่วมรัฐอย่างไร ลองพิจารณาชุดข้อมูลตัวอย่าง (โค้ดที่ทำซ้ำได้เมื่อสิ้นสุดการโพสต์) ซึ่งyเป็นฟังก์ชั่นแบบโมโนโทนิกที่รบกวนโดย gaussians สองคู่พร้อมเสียงรบกวน: ชุดข้อมูลมีตัวแปรตัวทำนายบางอย่าง: x: ดัชนีของข้อมูล (1-100) w: คุณลักษณะรองที่ทำเครื่องหมายส่วนต่างๆของyที่ซึ่งมีเกาส์เซียนอยู่ wมีค่า 1-20 โดยxอยู่ระหว่าง 11 ถึง 30 และ 51 ถึง 70 มิฉะนั้นwเท่ากับ 0 w2: w + 1เพื่อที่จะไม่มีค่า 0 mgcvแพ็คเกจของ R ทำให้ง่ายต่อการระบุจำนวนโมเดลที่เป็นไปได้สำหรับข้อมูลเหล่านี้: โมเดล 1 และ 2 นั้นใช้งานง่าย การคาดการณ์yเฉพาะจากค่าดัชนีในxที่ความเรียบเริ่มต้นสร้างสิ่งที่ถูกต้องราง แต่เรียบเกินไป การคาดการณ์yจากwผลลัพธ์ในรูปแบบของ "เฉลี่ย gaussian" ที่มีอยู่yและไม่มี …
12 r  modeling  gam  mgcv 

1
R / mgcv: เพราะเหตุใดผลิตภัณฑ์ te () และ ti () เทนเซอร์จึงให้พื้นผิวที่แตกต่างกัน
mgcvแพคเกจสำหรับการRมีสองฟังก์ชั่นสำหรับการปฏิสัมพันธ์กระชับเมตริกซ์ผลิตภัณฑ์: และte() ti()ฉันเข้าใจการแบ่งขั้นพื้นฐานของการใช้แรงงานระหว่างคนทั้งสอง (ปรับให้เหมาะสมกับการทำงานแบบไม่เป็นเชิงเส้นเปรียบเทียบกับการย่อยสลายการโต้ตอบนี้เป็นผลกระทบหลักและการโต้ตอบ) สิ่งที่ฉันไม่เข้าใจคือสาเหตุte(x1, x2)และti(x1) + ti(x2) + ti(x1, x2)อาจให้ผลลัพธ์ที่แตกต่าง (เล็กน้อย) MWE (ดัดแปลงมาจาก?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
การทำนายด้วยเอฟเฟกต์แบบสุ่มในเกม mgcv
ฉันสนใจในการสร้างแบบจำลองการจับปลาทั้งหมดโดยใช้ gam ใน mgcv เพื่อสร้างเอฟเฟกต์แบบสุ่มง่าย ๆ สำหรับเรือแต่ละลำ ฉันมีวิชา 98 วิชาดังนั้นฉันคิดว่าฉันจะใช้ gam แทน gamm เพื่อจำลองเอฟเฟกต์แบบสุ่ม แบบจำลองของฉันคือ: modelGOM <- gam(TotalFish ~ factor(SetYear) + factor(SetMonth) + factor(TimePeriod) + s(SST) + s(VesselID, bs = "re", by = dum) + s(Distance, by = TimePeriod) + offset(log(HooksSet)), data = GOM, family = tw(), method = "REML") …

1
จะตีความค่า P-GAM ได้อย่างไร?
ฉันชื่อฮิวจ์และฉันเป็นนักศึกษาปริญญาเอกโดยใช้แบบจำลองสารเติมแต่งทั่วไปเพื่อทำการวิเคราะห์เชิงสำรวจ ฉันไม่แน่ใจว่าจะตีความค่า p ที่มาจากแพ็คเกจ MGCV และต้องการตรวจสอบความเข้าใจของฉันได้อย่างไร (ฉันใช้รุ่น 1.7-29 และได้อ่านเอกสารของ Simon Wood แล้ว) ฉันค้นหาคำถาม CV อื่น ๆ ก่อน แต่คำถามที่เกี่ยวข้องที่สุดดูเหมือนจะเกี่ยวกับการถดถอยทั่วไปไม่ใช่ค่า p-GAM โดยเฉพาะ ฉันรู้ว่ามีอาร์กิวเมนต์ที่แตกต่างมากมายกับ GAM และค่า p เป็นค่าโดยประมาณเท่านั้น แต่ฉันเพิ่งเริ่มต้นง่ายๆเพื่อดูว่ามี "สัญญาณ" ใด ๆ สำหรับเพื่อนร่วมทุนของฉัน เช่น: Y ~ s (a, k = 3) + s (b, k = 3) + s (c, k = 3) …
10 p-value  mgcv 

2
การตรวจสอบข้าม GAM เพื่อทดสอบข้อผิดพลาดการทำนาย
คำถามของฉันเกี่ยวกับเกมในแพ็คเกจ mgcv R เนื่องจากขนาดตัวอย่างเล็กฉันต้องการตรวจสอบข้อผิดพลาดการทำนายโดยใช้การตรวจสอบความถูกต้องแบบลาก่อน มันสมเหตุสมผลหรือไม่ ฉันมีแพคเกจหรือรหัสที่ฉันสามารถทำได้หรือไม่? errorest()ฟังก์ชั่นในIPREDแพคเกจไม่ทำงาน ชุดข้อมูลการทดสอบอย่างง่ายคือ: library(mgcv) set.seed(0) dat <- gamSim(1,n=400,dist="normal",scale=2) b<-gam(y~s(x0)+s(x1)+s(x2)+s(x3),data=dat) summary(b) pred <- predict(b, type="response") ขอบคุณมากสำหรับความช่วยเหลือของคุณ!
10 r  cross-validation  gam  mgcv 

4
จะรับค่าที่ใช้ใน plot.gam เป็น mgcv ได้อย่างไร?
ฉันต้องการทราบค่าที่(x, y)ใช้ในการลงจุดplot(b, seWithMean=TRUE)ในแพ็คเกจmgcv ไม่มีใครรู้ว่าฉันสามารถแยกหรือคำนวณค่าเหล่านี้ได้อย่างไร นี่คือตัวอย่าง: library(mgcv) set.seed(0) dat <- gamSim(1, n=400, dist="normal", scale=2) b <- gam(y~s(x0), data=dat) plot(b, seWithMean=TRUE)

1
Adaptive GAM ทำให้เรียบเป็น mgcv
หนังสือของ Simon Wood เกี่ยวกับ GAMs และแพ็คเกจ R ที่เกี่ยวข้อง mgcv นั้นมีทั้งรายละเอียดสูงและให้ข้อมูลเมื่อพูดถึงทฤษฎี GAM และการปรับโมเดลให้เหมาะสมกับข้อมูลจริงและจำลอง สำหรับสมูทต์ 1D นั้นไม่ต้องกังวลมากนักประหยัดสำหรับการตัดสินใจว่าจะใช้ฟังก์ชั่นแบบวัฏจักรเทียบกับแบบปรับตัวได้หรือไม่ซึ่งสามารถให้ผลการทำนายที่แตกต่างกันมากเมื่อเทียบกับลูกบาศก์, แผ่นบางและ P-spline กรณีที่ปรับตัวได้เกมหลายเกมมีการติดตั้งไปยังภูมิภาคต่างๆตามแนวโค้ง เท่าที่ฉันสามารถบอกได้ว่าฐานวงจรเป็นเรื่องธรรมดาในการสร้างแบบจำลองอนุกรมเวลาในขณะที่การปรับให้เรียบแบบปรับได้นั้นควรได้รับการพิจารณาเมื่อข้อมูลมีความหลากหลายมากเมื่อเทียบกับตัวแปรตอบสนอง แม้กระนั้นการปรับตัวให้ราบรื่นควรใช้ "เท่าที่จำเป็นและด้วยความระมัดระวัง" ฉันได้รับการตรวจสอบเกมมาระยะหนึ่งแล้วและเมื่อถามคำถามการวิจัยของฉันฉันพบว่าตัวเองเปลี่ยนใจได้มากเมื่อพูดถึงเรื่องการใช้งานที่ราบรื่น mgcv มี 17 smooths ที่แตกต่างกันให้เลือก (โดยการนับของฉัน) ฉันได้พิจารณาทั้งลูกบาศก์และ P-spline ให้เรียบ คำถามของฉันคือ : เมื่อใดควรพิจารณาความราบรื่นในการปรับตัวเมื่อพิจารณาจากคู่ที่ไม่ได้ปรับตัวถ้าเป้าหมายท้ายที่สุดคือการใช้ GAMs ที่พอดีเพื่อการคาดการณ์? สำหรับวัตถุประสงค์ของฉันฉันกำลังยึดติดกับเกณฑ์ความราบรื่น GCV เริ่มต้นแม้ว่ามันจะมีแนวโน้มที่จะไม่ราบรื่น วรรณกรรมกำลังเติบโตขึ้นใน GAMs เชิงนิเวศน์ประยุกต์ แต่ฉันยังไม่เจอการศึกษาที่ใช้การปรับตัวที่ราบรื่น คำแนะนำใด ๆ ที่ชื่นชม
9 r  mgcv 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.