คำถามติดแท็ก regression

เทคนิคในการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปร "dependent" และตัวแปร "อิสระ" หนึ่งตัว

3
วิธีการรับค่า p ของสัมประสิทธิ์จากการถดถอย bootstrap?
จากQuick-Rของ Robert Kabacoff ฉันมี # Bootstrap 95% CI for regression coefficients library(boot) # function to obtain regression weights bs <- function(formula, data, indices) { d <- data[indices,] # allows boot to select sample fit <- lm(formula, data=d) return(coef(fit)) } # bootstrapping with 1000 replications results <- boot(data=mtcars, statistic=bs, R=1000, formula=mpg~wt+disp) …

1
ฉันควรเลือกรูปแบบการถดถอยแบบ Bootstrapped
ฉันมีรูปแบบการถดถอยโลจิสติกแบบไบนารีที่มี DV (โรค: ใช่ / ไม่ใช่) และ 5 ตัวทำนาย (ประชากร [อายุ, เพศ, การสูบบุหรี่ (ใช่ / ไม่ใช่)], ดัชนีทางการแพทย์ (ลำดับ) และหนึ่งการรักษาแบบสุ่ม [ใช่ / ไม่ใช่ ]) ฉันได้ทำแบบจำลองเงื่อนไขการโต้ตอบสองด้านทั้งหมดเช่นกัน ตัวแปรหลักอยู่กึ่งกลางและไม่มีสัญลักษณ์ของความสัมพันธ์หลายระดับ (VIF ทั้งหมด <2.5) ฉันมีคำถาม: การบูตสแตรปมีประโยชน์เหนือรุ่นเดียวของฉันหรือไม่ ถ้าเป็นเช่นนั้น ฉันควรเลือกรุ่น bootstrapped ใด ฉันแค่อยากจะดูว่าอัลกอริทึมการบูตสแตรปทำตามวิธีการสุ่มสำหรับการสร้างตัวอย่างใหม่หรือไม่หรือว่าพวกมันมีอัลกอริธึมที่เข้มงวด ดังนั้นฉันจึงลองใหม่อีกครั้ง 1,000 ครั้งในแต่ละครั้ง (ดังนั้นฉันจึงมีโมเดล bootstrapped หลายแบบแต่ละอันมีการทดลอง 1,000 ครั้ง) อย่างไรก็ตามแต่ละครั้งที่ค่าสัมประสิทธิ์ของรุ่น bootstrapped แตกต่างกัน (แม้ว่าจำนวนการทดลองจะ 1,000 ครั้งอย่างต่อเนื่อง) ดังนั้นฉันสงสัยว่าฉันควรเลือกอันไหนสำหรับรายงานของฉัน …

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

3
ช่วงที่เป็นไปได้ของ
สมมติว่าเป็นอนุกรมเวลาสามชุด ,และX1X1X_1X2X2X_2YYY เล่นการถดถอยเชิงเส้นสามัญ ~ ( ) เราได้รับU สามัญถดถอยเชิงเส้น ~รับV สมมติว่าYYYX1X1X_1Y=bX1+b0+ϵY=bX1+b0+ϵY = b X_1 + b_0 + \epsilonR2=UR2=UR^2 = UYYYX2X2X_2R2=VR2=VR^2 = VU&lt;VU&lt;VU < V ค่าต่ำสุดและสูงสุดที่เป็นไปได้ของจากการถดถอยคือ ~ ( )R2R2R^2YYYX1+X2X1+X2X_1 + X_2Y=b1X1+b2X2+b0+ϵY=b1X1+b2X2+b0+ϵY = b_1 X_1 + b_2 X_2 + b_0 + \epsilon ฉันเชื่อว่าค่าต่ำสุดควรเป็น + ค่าเล็กเนื่องจากการเพิ่มตัวแปรใหม่จะเพิ่มเสมอ แต่ฉันไม่ทราบวิธีการหาจำนวนค่าเล็ก ๆ นี้และฉันไม่รู้วิธีหาช่วงสูงสุด .R2R2R^2VVVR2R2R^2

1
เป็นที่ยอมรับหรือไม่ที่เรียกใช้โมเดลเชิงเส้นสองชุดในชุดข้อมูลเดียวกัน
สำหรับการถดถอยเชิงเส้นที่มีหลายกลุ่ม (กลุ่มธรรมชาติที่กำหนดเบื้องต้น) เป็นที่ยอมรับหรือไม่ที่จะเรียกใช้สองรุ่นที่แตกต่างกันในชุดข้อมูลเดียวกันเพื่อตอบคำถามสองข้อต่อไปนี้ แต่ละกลุ่มมีความชันที่ไม่เป็นศูนย์และการสกัดกั้นที่ไม่ใช่ศูนย์และพารามิเตอร์สำหรับแต่ละกลุ่มภายในการถดถอยกลุ่มคืออะไร? มีไม่ว่าจะเป็นสมาชิกกลุ่มแนวโน้มที่ไม่เป็นศูนย์และการสกัดกั้นที่ไม่เป็นศูนย์หรือไม่และพารามิเตอร์สำหรับการถดถอยแบบกลุ่มนี้คืออะไร? ใน R, รุ่นแรกจะเป็นเพื่อให้ค่าสัมประสิทธิ์ประมาณอาจตีความได้โดยตรงขณะที่ตัดและความลาดชันสำหรับแต่ละรุ่นที่สองจะเป็นlm(y ~ group + x:group - 1) group.Thelm(y ~ x + 1) ทางเลือกจะเป็นlm(y ~ x + group + x:group + 1)ซึ่งส่งผลในตารางสรุปค่าสัมประสิทธิ์ที่ซับซ้อนภายในกลุ่มลาดและดักต้องคำนวณจากความแตกต่างในลาดและดักจากการอ้างอิงบางส่วน นอกจากนี้คุณต้องเรียงลำดับกลุ่มใหม่และเรียกใช้แบบจำลองเป็นครั้งที่สองต่อไปเพื่อรับค่า p สำหรับความแตกต่างของกลุ่มสุดท้าย (บางครั้ง) สิ่งนี้ใช้สองรุ่นแยกกันส่งผลเสียต่อการอนุมานในทางใดทางหนึ่งหรือการปฏิบัติตามมาตรฐานนี้หรือไม่? ในการพิจารณาเรื่องนี้ให้พิจารณาว่า x เป็นปริมาณยาและกลุ่มที่มีเชื้อชาติต่างกัน อาจเป็นเรื่องที่น่าสนใจที่จะทราบความสัมพันธ์ของการตอบสนองต่อขนาดยาสำหรับแพทย์เฉพาะทางหรือยาที่ใช้ในการแข่งขัน แต่บางครั้งก็น่าสนใจที่จะทราบความสัมพันธ์ของการตอบสนองต่อยาสำหรับประชากรทั้งหมด (มนุษย์) โดยไม่คำนึงถึงเชื้อชาติสำหรับเจ้าหน้าที่สาธารณสุข นี่เป็นเพียงตัวอย่างของวิธีการที่คนอาจสนใจทั้งภายในกลุ่มและระหว่างการถดถอยกลุ่ม ความสัมพันธ์ระหว่างปริมาณและการตอบสนองควรเป็นเชิงเส้นหรือไม่ไม่ใช่สิ่งสำคัญ

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(&gt;|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
vcovHC, vcovHAC, NeweyWest - ใช้ฟังก์ชั่นใด?
ฉันกำลังพยายามอัปเดตโมเดลตาม LM ของฉันเพื่อรับข้อผิดพลาดและการทดสอบมาตรฐานที่ถูกต้อง ฉันสับสนจริง ๆ ว่าเมทริกซ์ VC ที่จะใช้ sandwichแพคเกจราคาพิเศษvcovHC, และvcovHAC NeweyWestในขณะที่อดีตเพียงบัญชี heteroskedasticity สองหลังบัญชีทั้งความสัมพันธ์ต่อเนื่องและ heteroskedasticity กระนั้นเอกสารไม่ได้บอกอะไรมากมายเกี่ยวกับความแตกต่างระหว่างสองอันหลัง (อย่างน้อยฉันก็ไม่เข้าใจ) เมื่อมองไปที่ฟังก์ชั่นของตัวเองฉันรู้ว่า NeweyWest โทรหา vcovHAC จริงๆ สังเกตุผลลัพธ์coeftest(mymodel, vcov. = vcovHAC)และcoeftest(mymodel, vcov. = NeweyWest)แตกต่างอย่างบ้าคลั่ง แม้ว่าvcovHACจะค่อนข้างใกล้เคียงกับผลลัพธ์ที่ไร้เดียงสา แต่การใช้ NeweyWest สัมประสิทธิ์ทั้งหมดจะเปลี่ยนไปเล็กน้อย (การทดสอบใกล้เคียงกับ 1)

1
เราสามารถเปรียบเทียบความสัมพันธ์ระหว่างกลุ่มโดยการเปรียบเทียบความชันถดถอยได้หรือไม่?
ในคำถามนี้พวกเขาถามวิธีเปรียบเทียบ Pearson r สำหรับกลุ่มอิสระสองกลุ่ม (เช่นเพศชายและหญิง) ตอบและแสดงความคิดเห็นแนะนำสองวิธี: ใช้สูตรที่รู้จักกันดีของฟิชเชอร์โดยใช้ "z-tranformation" ของ r; ใช้การเปรียบเทียบความชัน (สัมประสิทธิ์การถดถอย) หลังสามารถทำได้อย่างง่ายดายเพียงแค่ผ่านโมเดลเชิงเส้นอิ่มตัว: Y= a + b X+ c G + dXGY=a+bX+cG+dXGY = a + bX + cG + dXGที่ไหน XXX และ YYY เป็นตัวแปรที่มีความสัมพันธ์และ GGGเป็นตัวแปรดัมมี่ (0 vs 1) ที่ระบุถึงสองกลุ่ม ขนาดของddd (ค่าสัมประสิทธิ์การโต้ตอบ) คือความแตกต่างของสัมประสิทธิ์ bbb หลังจากรูปแบบ Y=a+bXY=a+bXY = a + bX ดำเนินการในสองกลุ่มเป็นรายบุคคลและ …

3
การถดถอยเชิงเส้นกับปัจจัยใน R
ฉันพยายามที่จะเข้าใจว่าปัจจัยการทำงานในอาร์ว่ากันว่าฉันต้องการที่จะเรียกใช้การถดถอยโดยใช้ข้อมูลตัวอย่างบางอย่างใน R: &gt; data(CO2) &gt; colnames(CO2) [1] "Plant" "Type" "Treatment" "conc" "uptake" &gt; levels(CO2$Type) [1] "Quebec" "Mississippi" &gt; levels(CO2$Treatment) [1] "nonchilled" "chilled" &gt; lm(uptake ~ Type + Treatment, data = CO2) Call: lm(formula = uptake ~ Type + Treatment, data = CO2) Coefficients: (Intercept) TypeMississippi Treatmentchilled 36.97 -12.66 -6.86 ฉันเข้าใจว่าTypeMississippiและTreatmentchilledได้รับการปฏิบัติเหมือนเป็นบูลีน: …

2
ไม่ว่าจะใช้การชดเชยในการถดถอยปัวซองเมื่อทำนายเป้าหมายการทำงานทั้งหมดที่ผู้เล่นฮอกกี้ทำคะแนน
ฉันมีคำถามเกี่ยวกับสิ่งที่ดีกว่าหรือไม่ใช้การชดเชย สมมติว่าเป็นโมเดลที่ง่ายมากที่คุณต้องการอธิบายจำนวนเป้าหมาย (โดยรวม) ในฮอกกี้ ดังนั้นคุณมีเป้าหมายจำนวนเกมที่เล่นและตัวแปรดัมมี่ "กองหน้า" ซึ่งเท่ากับ 1 หากผู้เล่นเป็นกองหน้าและ 0 อย่างอื่น ดังนั้นรุ่นใดต่อไปนี้ที่ระบุไว้ถูกต้อง? เป้าหมาย = เกม + กองหน้าหรือ เป้าหมาย = ชดเชย (เกม) + กองหน้า อีกครั้งเป้าหมายคือเป้าหมายโดยรวมและจำนวนเกมเป็นเกมโดยรวมสำหรับผู้เล่นคนเดียว ตัวอย่างเช่นอาจมีผู้เล่นที่หยิบขึ้นมาที่มี 50 เป้าหมายใน 100 เกมและผู้เล่นอีกคนที่มี 20 เป้าหมายใน 50 เกมเป็นต้น ฉันควรทำอย่างไรเมื่อฉันต้องการประเมินจำนวนเป้าหมาย จำเป็นหรือไม่ที่จะใช้การชดเชยตรงนี้ อ้างอิง: ดูคำถามก่อนหน้านี้ที่พูดถึงเมื่อใช้ offsets ในการถดถอยปัวซองโดยทั่วไป

2
สังเกตพบการกระจายตัวแบบเบ้ซ้ายและสมมาตร
มันค่อนข้างยากสำหรับฉันที่จะอธิบาย แต่ฉันจะพยายามทำให้ปัญหาของฉันเป็นที่เข้าใจได้ ก่อนอื่นคุณต้องรู้ว่าฉันได้ทำการถดถอยเชิงเส้นอย่างง่ายจนถึงตอนนี้ ก่อนที่ผมจะประมาณค่าสัมประสิทธิ์ฉันดูการกระจายของฉันYมันหนักไปทางซ้ายเบ้ หลังจากที่ฉันประเมินแบบจำลองแล้วฉันค่อนข้างแน่ใจว่าจะสังเกตสิ่งที่เหลืออยู่แบบเบ้ซ้ายในรูปแบบ QQ-Plot เป็น wel แต่ฉันไม่ได้ทำอย่างแน่นอน อะไรคือสาเหตุของการแก้ไขนี้? ความผิดพลาดอยู่ที่ไหน หรือมีการกระจายอะไรจะทำอย่างไรกับการกระจายของระยะข้อผิดพลาดหรือไม่YYyYYy

1
ช่วงความเชื่อมั่นสำหรับความแตกต่างของวิธีการในการถดถอย
สมมติว่าฉันมีรูปแบบการถดถอยแบบสมการกำลังสอง โดยมีข้อผิดพลาดเป็นไปตามสมมติฐานปกติ (อิสระปกติเป็นอิสระจากค่า ) ให้เป็นค่าประมาณกำลังสองน้อยที่สุดY=β0+β1X+β2X2+ϵY=β0+β1X+β2X2+ϵ Y = \beta_0 + \beta_1 X + \beta_2 X^2 + \epsilon ϵϵ\epsilonXXXb0,b1,b2b0,b1,b2b_0, b_1, b_2 ฉันมีค่าใหม่สองค่าและและฉันสนใจที่จะรับช่วงความมั่นใจสำหรับ2)XXXx1x1x_1x2x2x_2v=E(Y|X=x2)−E(Y|X=x1)=β1(x2−x1)+β2(x22−x21)v=E(Y|X=x2)−E(Y|X=x1)=β1(x2−x1)+β2(x22−x12)v = E(Y|X = x_2) - E(Y|X=x_1) = \beta_1 (x_2 - x_1) + \beta_2 (x_2^2 - x_1^2) การประมาณจุดคือและ (แก้ไขฉันถ้าฉันผิด) ฉันสามารถประมาณความแปรปรวนโดยโดยใช้การประมาณค่าความแปรปรวนและความแปรปรวนร่วมของค่าสัมประสิทธิ์ที่ได้รับจากซอฟต์แวร์v^=b1(x2−x1)+b2(x22−x21)v^=b1(x2−x1)+b2(x22−x12)\hat{v} = b_1 (x_2 - x_1) + b_2 (x_2^2 - x_1^2)s^2= (x2-x1)2วาร์(ข1) …

2
จะสรุปและเปรียบเทียบความสัมพันธ์ที่ไม่ใช่เชิงเส้นได้อย่างไร
ฉันมีข้อมูลเกี่ยวกับเปอร์เซ็นต์ของอินทรียวัตถุในตะกอนทะเลสาบจาก 0 ซม. (กล่าวคือตะกอน - อินเทอร์เฟซน้ำ) ลงไป 9 ซม. สำหรับทะเลสาบประมาณ 25 ในแต่ละทะเลสาบ 2 แกนถูกนำมาจากแต่ละสถานที่ดังนั้นฉันจึงมีการทำซ้ำ 2 เปอร์เซ็นต์ของปริมาณอินทรียวัตถุในแต่ละระดับความลึกของตะกอนสำหรับแต่ละทะเลสาบ ฉันสนใจที่จะเปรียบเทียบความแตกต่างของความสัมพันธ์ระหว่างอินทรียวัตถุเปอร์เซ็นต์กับความลึกของตะกอนในทะเลสาบ (เช่นความชัน) ในบางทะเลสาบความสัมพันธ์ระหว่างเปอร์เซ็นต์อินทรียวัตถุและความลึกของตะกอนปรากฏเป็นเส้นตรง แต่ในกรณีอื่นความสัมพันธ์นั้นซับซ้อนมากขึ้น (ดูตัวอย่างด้านล่าง) ความคิดเริ่มต้นของฉันคือการปรับความสัมพันธ์เชิงเส้นให้เหมาะสมกับทั้งเส้นโค้งทั้งหมดหรือส่วนย่อยของเส้นโค้งถ้ามันเป็นเส้นตรง "ส่วนใหญ่" และเปรียบเทียบทะเลสาบเหล่านั้นเท่านั้นที่พบความสัมพันธ์เชิงเส้นที่สำคัญ อย่างไรก็ตามฉันไม่พอใจกับวิธีการนี้ในการที่จะต้องกำจัดข้อมูลด้วยเหตุผลอื่นที่ไม่ใช่แบบจำลองเชิงเส้นและไม่สนใจข้อมูลที่น่าสนใจเกี่ยวกับความสัมพันธ์ระหว่างเปอร์เซ็นต์อินทรีย์วัตถุและความลึกของตะกอน อะไรจะเป็นวิธีที่ดีในการสรุปและเปรียบเทียบโค้งจากทะเลสาบต่าง ๆ ขอบคุณ ตัวอย่างเส้นโค้ง: ในทุกกรณีแกน y คืออินทรียวัตถุร้อยละในตะกอนและแกน x คือความลึกของตะกอนที่ 0 = อินเทอร์เฟซของตะกอนน้ำ ตัวอย่างเชิงเส้นที่ดี: 2 ตัวอย่างที่ไม่ใช่เชิงเส้น: ตัวอย่างที่ไม่มีความสัมพันธ์ที่ชัดเจน:

6
การหาจุดเปลี่ยนแปลงในข้อมูลจากฟังก์ชันเชิงเส้นแบบต่อเนื่อง
ทักทาย, ฉันกำลังทำการวิจัยที่จะช่วยกำหนดขนาดของพื้นที่ที่สังเกตและเวลาที่ผ่านไปนับตั้งแต่บิ๊กแบง หวังว่าคุณจะช่วยได้! ฉันมีข้อมูลที่สอดคล้องกับฟังก์ชันเชิงเส้นเป็นเส้นตรงซึ่งฉันต้องการดำเนินการถดถอยเชิงเส้นสองแบบ มีประเด็นที่ความชันและการสกัดกั้นเปลี่ยนไปและฉันต้องการ (เขียนโปรแกรมเป็น) เพื่อหาจุดนี้ คิด?

1
ในการถดถอยเชิงเส้นเหตุใดการทำให้เป็นมาตรฐานจึงลงโทษค่าพารามิเตอร์ด้วย
ขณะนี้การเรียนรู้การถดถอยสันเขาและฉันสับสนเล็กน้อยเกี่ยวกับการลงโทษของแบบจำลองที่ซับซ้อนมากขึ้น (หรือคำจำกัดความของแบบจำลองที่ซับซ้อนมากขึ้น) จากสิ่งที่ฉันเข้าใจความซับซ้อนของโมเดลไม่จำเป็นต้องสัมพันธ์กับลำดับพหุนาม ดังนั้น:2 + 3 + 4x2+ 5x3+ 6x42+3+4x2+5x3+6x4 2 + 3+ 4x^2 + 5x^3 + 6x^4 เป็นรูปแบบที่ซับซ้อนกว่า: 5x55x5 5x^5 และฉันรู้ว่าจุดของการทำให้เป็นมาตรฐานคือการทำให้ความซับซ้อนของโมเดลต่ำดังนั้นตัวอย่างเช่นเรามีพหุนามลำดับที่ 5 ฉ( x ; w ) =W0+W1x +W2x2+W3x3+W4x4+W5x5f(x;w)=w0+w1x+w2x2+w3x3+w4x4+w5x5 f(x; w) = w_0 + w_1x + w_2x^2 + w_3x^3 + w_4x^4 + w_5x^5 พารามิเตอร์เพิ่มเติมที่เป็น 0 จะดีกว่า แต่สิ่งที่ฉันไม่เข้าใจคือถ้าเป็นพหุนามคำสั่งเดียวกันทำไมค่าพารามิเตอร์ที่ต่ำกว่าจึงถูกลงโทษน้อยกว่า ดังนั้นจะ: 2 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.