คำถามติดแท็ก multiple-regression

การถดถอยที่มีตัวแปรอิสระไม่คงที่สองตัวหรือมากกว่า

1
การติดตามของ Pillai มีลักษณะทั่วไปและการติดตามของ Hotelling-Lawley หรือไม่
ในการตั้งค่าการถดถอยหลายตัวแปรหลายตัวแปร (vector regressor และ regressand) การทดสอบหลักสี่แบบสำหรับสมมติฐานทั่วไป (Wilk's Lambda, Pillai-Bartlett, Hotelling-Lawley และรูตที่ใหญ่ที่สุดของ Roy) ทั้งหมดขึ้นอยู่กับค่าลักษณะเฉพาะของเมทริกซ์ , โดยที่และคือเมทริกซ์รูปแบบ 'อธิบาย' และ 'รวม'HE−1HE−1H E^{-1}HHHEEE ฉันสังเกตเห็นว่าสถิติของ Pillai และ Hotelling-Lawley สามารถแสดงเป็น สำหรับตามลำดับ0 ฉันกำลังมองหาที่แอพลิเคชันที่กระจายของร่องรอยนี้, ที่กำหนดไว้สำหรับ analogues ประชากรของและเป็นที่น่าสนใจสำหรับกรณี (ข้อผิดพลาดแบบโมดูโลในการทำงานของฉัน) ฉันอยากรู้ว่ามีการรวมกันของสถิติตัวอย่างสำหรับทั่วไปหรือการวางนัยทั่วไปอื่น ๆ ที่รวบรวมการทดสอบแบบดั้งเดิมสองรายการหรือมากกว่านั้น ฉันรู้ว่าไม่เท่ากับหรือψκ=Tr(H[κH+E]−1),ψκ=Tr(H[κH+E]−1),\psi_{\kappa} = \mbox{Tr}\left(H\left[\kappa H + E\right]^{-1}\right),κ=1,0κ=1,0\kappa = 1, 0HHHEEEκ κ 0 1κ=2κ=2\kappa = 2κκ\kappaκκ\kappa000111ตัวเศษดูเหมือน Chi-square ภายใต้ null …

1
ความช่วยเหลือเกี่ยวกับการสร้างแบบจำลอง SEM (OpenMx, polycor)
ฉันมีปัญหามากมายกับชุดข้อมูลเดียวที่ฉันพยายามใช้ SEM เราสมมติว่ามีปัจจัยแฝง 5 ตัวคือ A, B, C, D, E พร้อมด้วยตัวชี้วัด A1 ถึง A5 (ปัจจัยที่สั่ง), B1 ถึง B3 (เชิงปริมาณ), C1, D1, E1 (ทั้งหมดสามปัจจัยสุดท้ายที่สั่งโดยมีเพียง 2 ระดับสำหรับ E1 เรามีความสนใจในความแปรปรวนร่วมระหว่างปัจจัยทั้งหมด ฉันพยายามที่จะใช้OpenMxเพื่อทำเช่นนั้น นี่คือความพยายามของฉัน: ฉันก่อนพยายามใช้การฝึกอบรมขีด จำกัด สำหรับปัจจัยที่สั่งทั้งหมด แต่การบรรจบล้มเหลว ฉันตัดสินใจที่จะใช้ความสัมพันธ์แบบ polychoric / polyserial แทนข้อมูลดิบด้วยฟังก์ชั่นhetcorจากห้องสมุดpolycor(ฉันวางแผนที่จะบูตตัวอย่างเพื่อรับช่วงความมั่นใจ) มันก็ล้มเหลวที่จะมาบรรจบกัน! ฉันพยายาม จำกัด เฉพาะบุคคลที่มีข้อมูลครบถ้วน แต่ก็ล้มเหลวด้วย! คำถามแรกของฉันคือ: มีวิธีธรรมชาติในการตีความความล้มเหลวเหล่านี้? คำถามที่สองของฉันคือฉันควรทำอย่างไร ??? แก้ไข: สำหรับผู้อ่านในอนาคตที่อาจพบปัญหาเดียวกันหลังจากที่ไปถึงรหัสของฟังก์ชั่นในการpolycor... การแก้ปัญหาเป็นเพียงการใช้งานที่มีตัวเลือกhetcor() …

1
เมื่อใดที่จะเปลี่ยนตัวแปรตัวทำนายเมื่อทำการถดถอยหลายครั้ง?
ขณะนี้ฉันกำลังเรียนการถดถอยเชิงเส้นเป็นครั้งแรกในระดับบัณฑิตศึกษาและกำลังดิ้นรนกับการเปลี่ยนแปลงตัวแปรตัวทำนายในการถดถอยเชิงเส้นหลายครั้ง ข้อความที่ฉันใช้ Kutner et al "โมเดลเชิงสถิติเชิงเส้นประยุกต์" ดูเหมือนจะไม่ครอบคลุมคำถามที่ฉันมี (นอกเหนือจากการแนะนำว่ามีวิธี Box-Cox สำหรับเปลี่ยนการทำนายหลายตัว) เมื่อต้องเผชิญกับตัวแปรตอบสนองและตัวแปรทำนายหลายตัวเงื่อนไขใดบ้างที่มุ่งมั่นที่จะพบกับตัวแปรตัวทำนายแต่ละตัว ฉันเข้าใจว่าท้ายที่สุดเรากำลังมองหาความแปรปรวนของความคลาดเคลื่อนและการแจกแจงข้อผิดพลาดตามปกติ (อย่างน้อยที่สุดในเทคนิคที่ฉันได้รับการสอนมา) ฉันเคยมีแบบฝึกหัดมากมายกลับมาซึ่งวิธีแก้ปัญหาเป็นตัวอย่างy ~ x1 + (1/x2) + log(x3)ที่ ตัวทำนายหนึ่งตัวหรือมากกว่าถูกเปลี่ยน ฉันเข้าใจเหตุผลภายใต้การถดถอยเชิงเส้นอย่างง่ายเนื่องจากมันง่ายที่จะดู y ~ x1 และการวินิจฉัยที่เกี่ยวข้อง (พล็อตของคิวคิวของส่วนที่เหลือ, ส่วนที่เหลือเทียบกับ y, ส่วนที่เหลือเทียบกับ x, ฯลฯ ) และทดสอบเพื่อดูว่า y ~ log ( x1) เหมาะสมกับสมมติฐานของเราดีกว่า มีสถานที่ที่ดีที่จะเริ่มทำความเข้าใจเมื่อมีการเปลี่ยนแปลงตัวทำนายในที่ที่มีผู้ทำนายหลายคนหรือไม่? ขอบคุณล่วงหน้า. ด้าน

2
ในการถดถอยเชิงเส้นเหตุใดเราจึงควรรวมเทอมกำลังสองเมื่อเราสนใจเฉพาะเงื่อนไขการโต้ตอบ
สมมติว่าฉันสนใจโมเดลการถดถอยเชิงเส้นสำหรับ Yผม=β0+β1x1+β2x2+β3x1x2Yi=β0+β1x1+β2x2+β3x1x2Y_i = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2เพราะฉันต้องการดูว่าปฏิสัมพันธ์ระหว่าง covariates ทั้งสองมีผลต่อ Y หรือไม่ ในบันทึกรายวิชาของอาจารย์ (ซึ่งฉันไม่ได้ติดต่อด้วย) จะกล่าวถึง: เมื่อรวมถึงคำศัพท์เชิงโต้ตอบคุณควรรวมคำศัพท์ระดับปริญญาที่สองของพวกเขาไว้ด้วย กล่าวคือYผม=β0+β1x1+β2x2+β3x1x2+β4x21+β5x22Yi=β0+β1x1+β2x2+β3x1x2+β4x12+β5x22Y_i = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2 +\beta_4x_1^2 + \beta_5x_2^2 ควรรวมอยู่ในการถดถอย ทำไมหนึ่งควรรวมถึงข้อกำหนดระดับที่สองเมื่อเราสนใจเฉพาะการโต้ตอบ?

1
ทำไมคุณถึงทำนายจากโมเดลเอฟเฟกต์ผสมโดยไม่รวมเอฟเฟกต์แบบสุ่มสำหรับการทำนาย
นี้เป็นอีกคำถามที่คิด แต่ที่ผมใช้ผมจะอ้างถึงแพคเกจในR Rหากเป้าหมายคือการทำให้แบบจำลองเชิงเส้นตรงกับวัตถุประสงค์ของการทำนายและจากนั้นทำการคาดการณ์ว่าจะไม่มีเอฟเฟกต์แบบสุ่มมีประโยชน์ใด ๆ ในการใช้แบบจำลองเอฟเฟกต์ผสมหรือควรใช้โมเดลเอฟเฟกต์คงที่แทน? ตัวอย่างเช่นถ้าฉันมีข้อมูลเกี่ยวกับน้ำหนักเทียบกับส่วนสูงกับข้อมูลอื่นและสร้างแบบจำลองต่อไปนี้โดยใช้โดยlme4ที่ตัวแบบเป็นปัจจัยที่มีnnn ระดับ (n=no.samplesn=no.samplesn=no.samples): mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F) จากนั้นฉันต้องการที่จะสามารถทำนายน้ำหนักจากแบบจำลองโดยใช้ข้อมูลส่วนสูงและอายุใหม่ เห็นได้ชัดว่าความแปรปรวนของเรื่องในข้อมูลต้นฉบับนั้นถูกจับในแบบจำลอง แต่เป็นไปได้ไหมที่จะใช้ข้อมูลนี้ในการทำนาย? สมมติว่าฉันมีข้อมูลส่วนสูงและอายุใหม่และต้องการคาดการณ์น้ำหนักฉันสามารถทำได้ดังนี้: predict(mod1,newdata=newdf) # newdf columns for height, age, subject สิ่งนี้จะใช้predict.merModและฉันสามารถรวมคอลัมน์สำหรับหัวเรื่อง (ใหม่) ในnewdfหรือตั้งค่าre.form =~0ได้ ในอินสแตนซ์แรกมันไม่ชัดเจนว่าแบบจำลองทำอะไรกับปัจจัยเรื่อง 'ใหม่' และในอินสแตนซ์ที่สองความแปรปรวนของเรื่องที่ถูกจับในแบบจำลองจะถูกละเว้น (โดยเฉลี่ย) สำหรับการทำนายหรือไม่ ไม่ว่าในกรณีใดฉันจะเห็นว่าโมเดลเชิงเส้นเอฟเฟกต์คงที่อาจเหมาะสมกว่า ที่จริงถ้าความเข้าใจของฉันถูกต้องแล้วตัวแบบผลคงที่ควรทำนายค่าเช่นเดียวกับตัวแบบผสมถ้าไม่ได้ใช้ผลแบบสุ่มในการทำนาย ควรเป็นกรณีนี้หรือไม่? ในRมันไม่ได้เป็นเช่น: mod1 <- lmer(weight ~ height + …

3
ข้อมูลอนุกรมเวลาพยากรณ์พร้อมตัวแปรภายนอก
ขณะนี้ฉันกำลังทำงานในโครงการเพื่อคาดการณ์ข้อมูลอนุกรมเวลา (ข้อมูลรายเดือน) ฉันใช้ R เพื่อทำการพยากรณ์ ฉันมีตัวแปรอิสระ 1 ตัว (y) และตัวแปรอิสระ 3 ตัว (x1, x2, x3) ตัวแปร y มีการสังเกต 73 ครั้งและตัวแปรอีก 3 ตัว (alos 73) ตั้งแต่เดือนมกราคม 2009 ถึงมกราคม 2015 ฉันได้ตรวจสอบความสัมพันธ์และค่า p และมันสำคัญมากที่จะนำมาเป็นแบบจำลอง คำถามของฉันคือ: ฉันจะทำให้การคาดการณ์ที่ดีโดยใช้ตัวแปรอิสระทั้งหมดได้อย่างไร ฉันไม่มีค่าในอนาคตสำหรับตัวแปรเหล่านี้ สมมติว่าฉันต้องการทำนายตัวแปร y ของฉันใน 2 ปี (ในปี 2560) ฉันจะทำสิ่งนี้ได้อย่างไร ฉันลองรหัสต่อไปนี้: model = arima(y, order(0,2,0), xreg = externaldata) …

3
ความสัมพันธ์ระหว่างของการถดถอยอย่างง่ายและการถดถอยหลายครั้ง
คำถามพื้นฐานที่เกี่ยวข้องกับการถดถอย OLS ของR2R2R^2 เรียกใช้ OLS regression y ~ x1 เรามีบอกว่า 0.3R2R2R^2 รัน OLS regression y ~ x2 เรามีอีกอันบอกว่า 0.4R2R2R^2 ตอนนี้เราเรียกใช้การถดถอย y ~ x1 + x2 ค่า R ของการถดถอยนี้มีค่าเท่าไหร่ ฉันคิดว่ามันชัดเจนว่าสำหรับการถดถอยหลายครั้งไม่ควรน้อยกว่า 0.4 แต่เป็นไปได้หรือที่จะมากกว่า 0.7?R2R2R^2

3
ความสำคัญของหมวกเมทริกซ์คืออะไรในการถดถอยเชิงเส้น?
ความสำคัญของเมทริกซ์ของหมวกคืออะไรในการวิเคราะห์การถดถอยH=X(X′X)−1X′H=X(X′X)−1X′H=X(X^{\prime}X )^{-1}X^{\prime} มันเป็นเพียงการคำนวณง่ายขึ้น?

1
ฉันควรเลือกรูปแบบการถดถอยแบบ Bootstrapped
ฉันมีรูปแบบการถดถอยโลจิสติกแบบไบนารีที่มี DV (โรค: ใช่ / ไม่ใช่) และ 5 ตัวทำนาย (ประชากร [อายุ, เพศ, การสูบบุหรี่ (ใช่ / ไม่ใช่)], ดัชนีทางการแพทย์ (ลำดับ) และหนึ่งการรักษาแบบสุ่ม [ใช่ / ไม่ใช่ ]) ฉันได้ทำแบบจำลองเงื่อนไขการโต้ตอบสองด้านทั้งหมดเช่นกัน ตัวแปรหลักอยู่กึ่งกลางและไม่มีสัญลักษณ์ของความสัมพันธ์หลายระดับ (VIF ทั้งหมด <2.5) ฉันมีคำถาม: การบูตสแตรปมีประโยชน์เหนือรุ่นเดียวของฉันหรือไม่ ถ้าเป็นเช่นนั้น ฉันควรเลือกรุ่น bootstrapped ใด ฉันแค่อยากจะดูว่าอัลกอริทึมการบูตสแตรปทำตามวิธีการสุ่มสำหรับการสร้างตัวอย่างใหม่หรือไม่หรือว่าพวกมันมีอัลกอริธึมที่เข้มงวด ดังนั้นฉันจึงลองใหม่อีกครั้ง 1,000 ครั้งในแต่ละครั้ง (ดังนั้นฉันจึงมีโมเดล bootstrapped หลายแบบแต่ละอันมีการทดลอง 1,000 ครั้ง) อย่างไรก็ตามแต่ละครั้งที่ค่าสัมประสิทธิ์ของรุ่น bootstrapped แตกต่างกัน (แม้ว่าจำนวนการทดลองจะ 1,000 ครั้งอย่างต่อเนื่อง) ดังนั้นฉันสงสัยว่าฉันควรเลือกอันไหนสำหรับรายงานของฉัน …

3
ช่วงที่เป็นไปได้ของ
สมมติว่าเป็นอนุกรมเวลาสามชุด ,และX1X1X_1X2X2X_2YYY เล่นการถดถอยเชิงเส้นสามัญ ~ ( ) เราได้รับU สามัญถดถอยเชิงเส้น ~รับV สมมติว่าYYYX1X1X_1Y=bX1+b0+ϵY=bX1+b0+ϵY = b X_1 + b_0 + \epsilonR2=UR2=UR^2 = UYYYX2X2X_2R2=VR2=VR^2 = VU&lt;VU&lt;VU < V ค่าต่ำสุดและสูงสุดที่เป็นไปได้ของจากการถดถอยคือ ~ ( )R2R2R^2YYYX1+X2X1+X2X_1 + X_2Y=b1X1+b2X2+b0+ϵY=b1X1+b2X2+b0+ϵY = b_1 X_1 + b_2 X_2 + b_0 + \epsilon ฉันเชื่อว่าค่าต่ำสุดควรเป็น + ค่าเล็กเนื่องจากการเพิ่มตัวแปรใหม่จะเพิ่มเสมอ แต่ฉันไม่ทราบวิธีการหาจำนวนค่าเล็ก ๆ นี้และฉันไม่รู้วิธีหาช่วงสูงสุด .R2R2R^2VVVR2R2R^2

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(&gt;|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
ความแปรปรวนร่วมที่ใช้ร่วมกันระหว่าง IV ทั้งหมดในสมการการถดถอยเชิงเส้นหลายเชิงเส้นคืออะไร?
ในสมการการถดถอยหลายแบบเชิงเส้นหากตุ้มน้ำหนักเบต้าสะท้อนการมีส่วนร่วมของตัวแปรอิสระแต่ละตัวมากกว่าและสูงกว่าการมีส่วนร่วมของ IV อื่น ๆ ทั้งหมดซึ่งในสมการการถดถอยคือความแปรปรวนที่แบ่งปันโดย IV ทั้งหมดที่ทำนาย DV? ตัวอย่างเช่นหากแผนภาพ Venn แสดงด้านล่าง (และนำมาจากหน้า 'เกี่ยวกับ' ของ CV ที่นี่: https://stats.stackexchange.com/about ) ได้รับการติดป้ายใหม่เป็น 3 IV และ 1 DV พื้นที่ที่มีเครื่องหมายดอกจันจะใส่เข้าไป ในสมการการถดถอยแบบหลายค่า?

4
เป็นไปได้หรือไม่ที่จะย่อยสลายส่วนตกค้างที่ติดตั้งให้เป็นอคติและความแปรปรวนหลังจากติดตั้งแบบจำลองเชิงเส้นแล้ว?
ฉันต้องการจัดประเภทจุดข้อมูลว่าต้องการโมเดลที่ซับซ้อนกว่าหรือไม่ต้องการโมเดลที่ซับซ้อนกว่านี้อีก ความคิดปัจจุบันของฉันคือการปรับข้อมูลทั้งหมดให้เป็นแบบจำลองเชิงเส้นอย่างง่ายและสังเกตขนาดของเศษเหลือเพื่อทำการจัดหมวดหมู่นี้ จากนั้นฉันก็อ่านเรื่องอคติและความแปรปรวนของข้อผิดพลาดและรู้ว่าถ้าฉันสามารถคำนวณอคติโดยตรงมันอาจเป็นการวัดที่ดีกว่าจากนั้นก็ทำงานกับข้อผิดพลาดทั้งหมด (ส่วนที่เหลือหรือส่วนที่เป็นมาตรฐาน) เป็นไปได้หรือไม่ที่จะประเมินความลำเอียงโดยตรงกับตัวแบบเชิงเส้น? มีหรือไม่มีข้อมูลทดสอบหรือไม่ การตรวจสอบข้ามจะช่วยได้ไหม ถ้าไม่เราสามารถใช้ bootstrapping ทั้งชุดแบบเส้นตรง (ฉันคิดว่ามันเรียกว่า bagging) เพื่อหาค่าอคติโดยประมาณได้หรือไม่?

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
พื้นที่ข้อมูลพื้นที่ผันแปรพื้นที่สังเกตพื้นที่จำลอง (เช่นในการถดถอยเชิงเส้น)
สมมติว่าเรามี data matrixซึ่งก็คือ -by-และ label vectorซึ่งก็คือ -by-one ที่นี่แต่ละแถวของเมทริกซ์คือการสังเกตและแต่ละคอลัมน์สอดคล้องกับมิติ / ตัวแปร (สมมติ )XX\mathbf{X}nnnpppYYYnnnn&gt;pn&gt;pn>p แล้วสิ่งที่ไม่data space, variable space, observation space, model spaceหมายความว่าอย่างไร พื้นที่ที่ถูกขยายโดยเวกเตอร์คอลัมน์, ช่องว่าง(ลดลง) -D เนื่องจากมันมีพิกัดในขณะที่อยู่ในอันดับซึ่งเรียกว่าพื้นที่ว่างเนื่องจากมันถูกขยายโดยตัวแปร-เวกเตอร์? หรือเรียกว่าพื้นที่สังเกตการณ์เนื่องจากแต่ละมิติ / พิกัดสอดคล้องกับการสังเกต?nnnnnnppp แล้วเวกเตอร์แถวที่ถูกขยายออกมาล่ะ?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.