คำถามติดแท็ก regression

เทคนิคในการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปร "dependent" และตัวแปร "อิสระ" หนึ่งตัว

2
เหตุใดการถดถอยของโลจิสติกจึงถูกสอบเทียบอย่างดีและจะทำลายการสอบเทียบได้อย่างไร
ใน Scikit เรียนรู้เอกสารเกี่ยวกับการสอบเทียบความน่าจะเป็นพวกเขาเปรียบเทียบการถดถอยโลจิสติกกับวิธีการอื่นและสังเกตว่าป่าสุ่มมีการสอบเทียบน้อยกว่าการถดถอยโลจิสติก เหตุใดการปรับเทียบการถดถอยโลจิสติกจึงดี หนึ่งจะทำลายการสอบเทียบของการถดถอยโลจิสติกได้อย่างไร (ไม่ใช่ว่าจะต้องการ - เหมือนการออกกำลังกาย)

3
การถดถอยลอจิสติกส์การถดถอยที่เหลือจากการถดถอยอื่น ๆ
ด้วยการถดถอย OLS นำไปใช้กับการตอบสนองอย่างต่อเนื่องเราสามารถสร้างสมการการถดถอยแบบหลายสมการได้ คำถามของฉันคือมีวิธีทำเช่นนี้กับการถดถอยโลจิสติกผ่านเศษเหลือการถดถอยโลจิสติก ? นั่นคือถ้าฉันต้องการประมาณโดยใช้วิธีการสร้างแบบจำลองเชิงเส้นแบบมาตรฐานทั่วไปมีวิธีเรียกใช้การถดถอยแบบลอจิสติกกับxและรับ pseudo-residuals R_1จากนั้นถดถอยR_1บนzถึง รับตัวประมาณค่าสัมประสิทธิ์การถดถอยโลจิสติก การอ้างอิงถึงตำราหรือวรรณกรรมจะได้รับการชื่นชมPr ( Y= 1 | x , z)Pr(Y=1|x,z)\Pr(Y = 1 | x, z)xxxR1R1R_1R1R1R_1Zzz

1
เชิงเส้นตรงกับ RKHS- การถดถอย
ฉันกำลังศึกษาความแตกต่างระหว่างการทำให้เป็นปกติในการถดถอย RKHS และการถดถอยเชิงเส้น แต่ฉันมีเวลายากที่จะเข้าใจความแตกต่างที่สำคัญระหว่างทั้งสอง รับคู่อินพุต - เอาต์พุต (xi,yi)(xi,yi)(x_i,y_i)ฉันต้องการประเมินฟังก์ชั่น f(⋅)f(⋅)f(\cdot) ดังนี้ f(x)≈u(x)=∑i=1mαiK(x,xi),f(x)≈u(x)=∑i=1mαiK(x,xi),\begin{equation}f(x)\approx u(x)=\sum_{i=1}^m \alpha_i K(x,x_i),\end{equation} ที่ไหน K(⋅,⋅)K(⋅,⋅)K(\cdot,\cdot)เป็นฟังก์ชั่นเคอร์เนล ค่าสัมประสิทธิ์αmαm\alpha_m สามารถพบได้โดยการแก้ minα∈Rn1n∥Y−Kα∥2Rn+λαTKα,minα∈Rn1n‖Y−Kα‖Rn2+λαTKα,\begin{equation} {\displaystyle \min _{\alpha\in R^{n}}{\frac {1}{n}}\|Y-K\alpha\|_{R^{n}}^{2}+\lambda \alpha^{T}K\alpha},\end{equation} ที่มีการละเมิดบางส่วนของโน้ตที่i,ji,ji,j 'รายการของเมทริกซ์เคอร์เนลวันที่KKKคือK(xi,xj)K(xi,xj){\displaystyle K(x_{i},x_{j})} {J})} สิ่งนี้จะให้ α∗=(K+λnI)−1Y.α∗=(K+λnI)−1Y.\begin{equation} \alpha^*=(K+\lambda nI)^{-1}Y. \end{equation} อีกวิธีหนึ่งเราสามารถรักษาปัญหาดังกล่าวเป็นปัญหาการถดถอยแบบเส้นตรง / ปัญหาการถดถอยเชิงเส้น: minα∈Rn1n∥Y−Kα∥2Rn+λαTα,minα∈Rn1n‖Y−Kα‖Rn2+λαTα,\begin{equation} {\displaystyle \min _{\alpha\in R^{n}}{\frac {1}{n}}\|Y-K\alpha\|_{R^{n}}^{2}+\lambda \alpha^{T}\alpha},\end{equation} พร้อมทางออก α∗=(KTK+λnI)−1KTY.α∗=(KTK+λnI)−1KTY.\begin{equation} {\alpha^*=(K^{T}K +\lambda nI)^{-1}K^{T}Y}. \end{equation} …

1
เทอมความแปรปรวนในการย่อยสลายอคติความแปรปรวนของการถดถอยเชิงเส้น
ใน 'องค์ประกอบของการเรียนรู้ทางสถิติ' นิพจน์สำหรับการสลายตัวของความแปรปรวนแบบอคติของแบบจำลองเชิงเส้นจะได้รับเป็น ที่เป็นฟังก์ชันเป้าหมายจริงคือความแปรปรวนของข้อผิดพลาดแบบสุ่มในโมเดลและเป็นประมาณการเชิงเส้นของ(x)Err(x0)=σ2ϵ+E[f(x0)−Ef^(x0)]2+||h(x0)||2σ2ϵ,Err(x0)=σϵ2+E[f(x0)−Ef^(x0)]2+||h(x0)||2σϵ2,Err(x_0)=\sigma_\epsilon^2+E[f(x_0)-E\hat f(x_0)]^2+||h(x_0)||^2\sigma_\epsilon^2,f(x0)f(x0)f(x_0)σ2ϵσϵ2 \sigma_\epsilon^2y=f(x)+ϵy=f(x)+ϵy=f(x)+\epsilonf^(x)f^(x)\hat f(x)f(x)f(x)f(x) คำแปรปรวนทำให้ฉันหนักใจที่นี่เพราะสมการบอกเป็นนัยว่าความแปรปรวนจะเป็นศูนย์ถ้าเป้าหมายไม่มีเสียงนั่นคือแต่มันก็ไม่สมเหตุสมผลสำหรับฉันเพราะแม้จะมีสัญญาณรบกวนเป็นศูนย์ฉันยังสามารถรับตัวประมาณแตกต่างกันสำหรับชุดการฝึกอบรมที่แตกต่างกันซึ่งหมายถึงความแปรปรวนไม่ใช่ศูนย์σ2ϵ=0.σϵ2=0.\sigma_\epsilon^2=0.f^(x0)f^(x0)\hat f(x_0) ตัวอย่างเช่นสมมติว่าฟังก์ชันเป้าหมายเป็นกำลังสองและข้อมูลการฝึกอบรมมีสองจุดตัวอย่างที่สุ่มจากกำลังสองนี้ ชัดเจนฉันจะได้เส้นตรงที่แตกต่างกันทุกครั้งที่ฉันสุ่มตัวอย่างสองคะแนนจากการสุ่มกำลังสอง - เป้าหมาย แล้วความแปรปรวนเป็นศูนย์ได้อย่างไรf(x0)f(x0)f(x_0) ใครช่วยให้ฉันรู้ว่ามีอะไรผิดปกติในความเข้าใจของฉันเกี่ยวกับการย่อยสลายความแปรปรวนแบบอคติ?

4
เป็นไปได้หรือไม่ที่จะย่อยสลายส่วนตกค้างที่ติดตั้งให้เป็นอคติและความแปรปรวนหลังจากติดตั้งแบบจำลองเชิงเส้นแล้ว?
ฉันต้องการจัดประเภทจุดข้อมูลว่าต้องการโมเดลที่ซับซ้อนกว่าหรือไม่ต้องการโมเดลที่ซับซ้อนกว่านี้อีก ความคิดปัจจุบันของฉันคือการปรับข้อมูลทั้งหมดให้เป็นแบบจำลองเชิงเส้นอย่างง่ายและสังเกตขนาดของเศษเหลือเพื่อทำการจัดหมวดหมู่นี้ จากนั้นฉันก็อ่านเรื่องอคติและความแปรปรวนของข้อผิดพลาดและรู้ว่าถ้าฉันสามารถคำนวณอคติโดยตรงมันอาจเป็นการวัดที่ดีกว่าจากนั้นก็ทำงานกับข้อผิดพลาดทั้งหมด (ส่วนที่เหลือหรือส่วนที่เป็นมาตรฐาน) เป็นไปได้หรือไม่ที่จะประเมินความลำเอียงโดยตรงกับตัวแบบเชิงเส้น? มีหรือไม่มีข้อมูลทดสอบหรือไม่ การตรวจสอบข้ามจะช่วยได้ไหม ถ้าไม่เราสามารถใช้ bootstrapping ทั้งชุดแบบเส้นตรง (ฉันคิดว่ามันเรียกว่า bagging) เพื่อหาค่าอคติโดยประมาณได้หรือไม่?

1
เหตุใดช่วงเวลาที่น่าเชื่อถือของเบย์ในการถดถอยพหุนามนี้จึงเอนเอียงในขณะที่ช่วงความเชื่อมั่นนั้นถูกต้อง
พิจารณาพล็อตด้านล่างที่ฉันจำลองข้อมูลดังนี้ เราดูผลลัพธ์แบบไบนารีซึ่งความน่าจะเป็นที่แท้จริงที่จะเป็น 1 ถูกระบุด้วยเส้นสีดำ ความสัมพันธ์การทำงานระหว่าง covariateและคือพหุนามลำดับที่ 3 ที่มีลิงค์โลจิสติก (ดังนั้นจึงไม่ใช่เชิงเส้นในสองทาง)Yo b sYโอขsy_{obs}xxxp (Yo b s= 1 | x )พี(Yโอขs=1|x)p(y_{obs}=1 | x) เส้นสีเขียวคือการถดถอยโลจิสติก GLM โดยที่ถูกนำมาใช้เป็นพหุนามลำดับที่ 3 เส้นสีเขียวประคือช่วงความมั่นใจ 95% รอบการคาดการณ์โดยที่สัมประสิทธิ์การถดถอยที่พอดี ฉันใช้และสำหรับสิ่งนี้xxxp (Yo b s= 1 | x ,β^)พี(Yโอขs=1|x,β^)p(y_{obs}=1 | x, \hat{\beta})β^β^\hat{\beta}R glmpredict.glm บรรทัด pruple เป็นค่าเฉลี่ยของช่วงหลังที่น่าเชื่อถือ 95% สำหรับของแบบจำลองการถดถอยโลจิสติกแบบเบย์โดยใช้เครื่องแบบก่อนหน้า ฉันใช้แพคเกจพร้อมฟังก์ชั่นสำหรับสิ่งนี้ (การตั้งค่าให้ความรู้เบื้องต้นที่ไม่เหมือนกันมาก่อน)p (Yo b s= 1 …

1
เมื่อใดจึงควรใช้ Deming regression
ฉันกำลังทำงานเกี่ยวกับวิธีการแปลงค่าการทดสอบฟอสฟอรัสที่แตกต่างกันสองค่าให้กัน พื้นหลัง มีหลายวิธีในการวัดฟอสฟอรัสที่มีอยู่ในดิน ประเทศที่แตกต่างกันใช้วิธีการที่แตกต่างกันดังนั้นเพื่อเปรียบเทียบความอุดมสมบูรณ์ของ P ทั่วประเทศมีความจำเป็นต้องคำนวณค่าการทดสอบ P x ตามค่า P-test y และในทางกลับกัน ดังนั้นการตอบสนองและความแปรปรวนร่วมสามารถเปลี่ยนได้ ปริมาณ P ในสารสกัด 1 = P_CAL ใน [mg / 100 กรัมดิน] P จำนวนในสารสกัด 2 = P_DL ใน [mg / 100 กรัมดิน] เพื่อสร้าง "สมการการเปลี่ยนแปลง" ดังกล่าวเนื้อหา P ของตัวอย่างดิน 136 ตัวอย่างถูกวิเคราะห์ด้วยสารสกัดจาก CAL และ DL วัดพารามิเตอร์เพิ่มเติมเช่น pH ดินคาร์บอนอินทรีย์รวมไนโตรเจนทั้งหมดดินและคาร์บอเนต วัตถุประสงค์คือเพื่อให้ได้แบบจำลองการถดถอยอย่างง่าย ในขั้นตอนที่สองยังมีหลายรุ่น เพื่อให้ภาพรวมของข้อมูลที่ฉันแสดงให้คุณเห็นสอง …

3
การกำหนดนัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอยเชิงเส้นในที่ที่มีความสัมพันธ์แบบหลายค่า
สมมติว่าฉันมีหลายเมืองที่มีขนาดประชากรแตกต่างกันและฉันต้องการที่จะดูว่ามีความสัมพันธ์เชิงบวกระหว่างจำนวนร้านขายเหล้าในเมืองและจำนวน DUIs หรือไม่ ที่ฉันกำหนดว่าความสัมพันธ์นี้มีความสำคัญหรือไม่ขึ้นอยู่กับ t-test ของสัมประสิทธิ์การถดถอยประมาณ ตอนนี้ชัดเจนป๊อป ขนาดของเมืองจะมีความสัมพันธ์เชิงบวกกับจำนวน DUIs และจำนวนร้านขายเหล้า ดังนั้นถ้าฉันเรียกใช้การถดถอยเชิงเส้นอย่างง่ายในร้านขายเหล้าและดูว่าค่าสัมประสิทธิ์การถดถอยนั้นมีนัยสำคัญทางสถิติหรือไม่ฉันอาจพบปัญหาหลายสายสัมพันธ์และประเมินผลกระทบของร้านขายสุราใน DUIs ฉันควรใช้วิธีใดในสองวิธีนี้เพื่อแก้ไขปัญหานี้ ฉันควรแบ่งจำนวนร้านขายเหล้าในเมืองด้วยจำนวนประชากรเพื่อที่จะได้รับร้านขายเหล้าต่อมูลค่าประชากรและจากนั้นถอยกลับไปที่ ฉันควรถอยกลับไปที่ร้านขายเหล้าและขนาดแล้วดูเพื่อดูว่าค่าสัมประสิทธิ์ร้านขายเหล้ามีความสำคัญเมื่อควบคุมขนาดหรือไม่ วิธีอื่นบ้าง ฉันไม่สามารถตัดสินใจได้ว่าอะไรจะสมเหตุสมผลกว่า ฉันโยกย้ายระหว่างพวกเขาขึ้นอยู่กับว่าฉันคิดว่าฉันสามารถโน้มน้าวตัวเองได้ว่าเป็นวิธีที่ถูกต้อง ในร้านขายสุรามือเดียวต่อหัวดูเหมือนว่าตัวแปรที่ถูกต้องที่จะใช้เนื่องจาก DUI มีความมุ่งมั่นของแต่ละบุคคล แต่นั่นไม่ได้ดูเข้มงวดมากนัก ในทางกลับกันการควบคุมขนาดดูเหมือนเข้มงวดทางสถิติ แต่ค่อนข้างทางอ้อม นอกจากนี้ถ้าฉันลดขนาดหลังจากคำนวณค่าเก็บเหล้าต่อหัวของประชากรฉันได้รับค่าสัมประสิทธิ์การถดถอยที่คล้ายกันมากระหว่างสองวิธี แต่วิธีที่ 1 ให้ค่า p น้อยลง

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

4
ฉันจะตีความกราฟความอยู่รอดของโมเดลอันตราย Cox ได้อย่างไร
คุณจะตีความเส้นโค้งการอยู่รอดจากโมเดลอันตรายตามสัดส่วนของค็อกซ์ได้อย่างไร ในตัวอย่างของเล่นนี้สมมติว่าเรามีโมเดลอันตรายตามสัดส่วนในageตัวแปรในkidneyข้อมูลและสร้างเส้นโค้งการอยู่รอด library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() ตัวอย่างเช่น ณ เวลาคำสั่งใดเป็นจริง หรือทั้งสองอย่างผิดปกติ?200200200 คำแถลงที่ 1: เราจะเหลือวิชา 20% (เช่นถ้าเรามีคนโดยวันที่เราควรเหลืออีกประมาณ ) 100010001000200200200200200200 งบ 2: สำหรับคนที่ได้รับหนึ่งเขา / เธอมีมีโอกาสที่จะอยู่รอดได้ในวันที่20020%20%20\%200200200 ความพยายามของฉัน: ฉันไม่คิดว่าทั้งสองงบจะเหมือนกัน (แก้ไขฉันถ้าฉันผิด) เนื่องจากเราไม่ได้มีการสันนิษฐาน iid (เวลารอดสำหรับทุกคนไม่ได้มาจากการกระจายอย่างอิสระ) มันคล้ายกับการถดถอยโลจิสติกในคำถามของฉันที่นี่อัตราความเป็นอันตรายของแต่ละคนขึ้นอยู่กับสำหรับบุคคลนั้นβTxβTx\beta^Tx

1
เหตุใดจึงมีการรายงานในเอกสารที่ใช้ผลบวกของรูปสี่เหลี่ยมในผลลัพธ์ Anova บ่อยครั้ง
จากประสบการณ์สั้น ๆ ของฉันในสถิติดูเหมือนว่าชนิดของผลรวมของสแควร์ส (ประเภท I, II, III, IV ... ) ที่ใช้ในการรับผลลัพธ์ ANOVA สามารถสร้างความแตกต่างอย่างมากในผลการทดสอบ (โดยเฉพาะรุ่นที่มีปฏิสัมพันธ์ ข้อมูล). อย่างไรก็ตามฉันยังไม่เห็นกระดาษรายงานเลย เหตุผลที่เป็นเช่นนั้น? ฉันจะขอบคุณจริง ๆ หากมีตัวอย่างกระดาษรายงาน (ไม่ใช่สถิติเอง) ไม่ทางใดก็ทางหนึ่งหรือเหตุผลที่ไม่ธรรมดา

2
การถดถอยเชิงเส้น: * ทำไม * คุณสามารถแบ่งผลรวมของช่องสี่เหลี่ยมได้?
โพสต์นี้หมายถึงรูปแบบการถดถอย bivariate เชิงเส้น\ ฉันมักจะแบ่งพาร์ติชันของผลรวมของกำลังสอง (SSTO) เป็นผลรวมของกำลังสองสำหรับข้อผิดพลาด (SSE) และผลรวมของกำลังสองสำหรับโมเดล (SSR) โดยความเชื่อ แต่เมื่อฉันเริ่มคิดจริงๆฉันไม่เข้าใจทำไมมันถึงทำงาน ...Yi=β0+β1xiYi=β0+β1xiY_i = \beta_0 + \beta_1x_i ส่วนที่ผมไม่เข้าใจ yiyiy_i : ค่าที่สังเกตได้ของ y y¯y¯\bar{y} : ค่าเฉลี่ยของyiyiy_i s ที่สังเกตได้ทั้งหมด y^iy^i\hat{y}_i : ค่าติดตั้ง / ทำนายของ y สำหรับการสังเกตของ x yi−y^iyi−y^iy_i - \hat{y}_i : ส่วนที่เหลือ / ข้อผิดพลาด (ถ้ายกกำลังสองและบวกกันสำหรับการสังเกตทั้งหมดนี่คือ SSE) y^i−y¯y^i−y¯\hat{y}_i - \bar{y} : ค่าติดตั้งโมเดลแตกต่างจากค่าเฉลี่ย (ถ้ายกกำลังสองและบวกสำหรับการสังเกตทั้งหมดนี่คือ SSR) …

1
ความสัมพันธ์ระหว่าง MLE และกำลังสองน้อยที่สุดในกรณีของการถดถอยเชิงเส้น
Hastie และ Tibshirani พูดถึงในหัวข้อ 4.3.2 ของหนังสือของพวกเขาว่าในการตั้งค่าการถดถอยเชิงเส้นแนวทางสแควร์สน้อยที่สุดในความเป็นจริงเป็นกรณีพิเศษของความน่าจะเป็นสูงสุด เราจะพิสูจน์ผลลัพธ์นี้ได้อย่างไร? PS: อะไหล่ไม่มีรายละเอียดทางคณิตศาสตร์

1
ข้อสงสัยเกี่ยวกับการกำเนิดสมการการถดถอยแบบเกาส์ในเอกสาร
ฉันกำลังอ่านบทความนี้และฉันมีปัญหาในการติดตามสมการสำหรับการถดถอยแบบเกาส์กระบวนการ พวกเขาใช้การตั้งค่าและสัญกรณ์ของรัสมุสและวิลเลียมส์ ดังนั้นสารเติมแต่งศูนย์เฉลี่ยนิ่งและกระจายตามปกติเสียงที่มีความแปรปรวนจะสันนิษฐาน:σ2noiseσnoise2\sigma^2_{noise} y=f(x)+ϵ,ϵ∼N(0,σ2noise)y=f(x)+ϵ,ϵ∼N(0,σnoise2)y=f(\mathbf{x})+\epsilon, \quad \epsilon\sim N(0,\sigma^2_{noise}) GP ก่อนที่มีค่าเฉลี่ยศูนย์จะถือว่าเป็นซึ่งหมายความว่า ,เป็นเวกเตอร์แบบเกาส์ที่มีค่าเฉลี่ย 0 และเมทริกซ์ความแปรปรวนร่วมf(x)f(x)f(\mathbf{x})∀ d∈N∀ d∈N\forall \ d\in Nf={f(x1),…,f(xd)}f={f(x1),…,f(xd)}\mathbf{f}=\{f(\mathbf{x_1}),\dots,f(\mathbf{x_d})\} Σd=⎛⎝⎜⎜k(x1,x1)k(xd,x1)⋱k(x1,xd)k(xd,xd)⎞⎠⎟⎟Σd=(k(x1,x1)k(x1,xd)⋱k(xd,x1)k(xd,xd))\Sigma_d=\pmatrix{k(\mathbf{x_1},\mathbf{x_1})& & k(\mathbf{x_1},\mathbf{x_d}) \\ & \ddots & \\k(\mathbf{x_d},\mathbf{x_1})& & k(\mathbf{x_d},\mathbf{x_d}) } จากนี้ไปเราจะสันนิษฐานว่าเป็นที่รู้จักกันในนามพารามิเตอร์ จากนั้นเห็นได้ชัดว่า Eq. (4) ของกระดาษ: p(f,f∗)=N(0,(Kf,fKf∗,fKf∗,fKf∗,f∗))p(f,f∗)=N(0,(Kf,fKf∗,fKf∗,fKf∗,f∗))p(\mathbf{f},\mathbf{f^*})=N\left(0,\pmatrix { K_{\mathbf{f},\mathbf{f}} & K_{\mathbf{f^*},\mathbf{f}} \\K_{\mathbf{f^*},\mathbf{f}} & K_{\mathbf{f^*},\mathbf{f^*}}} \right) มาที่นี่ข้อสงสัย: สมการ (5): p(y|f)=N(f,σ2noiseI)p(y|f)=N(f,σnoise2I)p(\mathbf{y}|\mathbf{f})=N\left(\mathbf{f},\sigma^2_{noise}I \right) E[f]=0E[f]=0E[\mathbf{f}]=0แต่ฉันเดา เพราะเมื่อฉันมีเงื่อนไขในแล้ว โดยที่เป็นเวกเตอร์คงที่และมีเพียง …

3
อะไรคือผลของการมีความแปรปรวนแบบไม่คงที่ในเงื่อนไขข้อผิดพลาดในการถดถอยเชิงเส้น
หนึ่งในสมมติฐานของการถดถอยเชิงเส้นคือควรมีความแปรปรวนคงที่ในข้อผิดพลาดและว่าช่วงความเชื่อมั่นและการทดสอบสมมติฐานที่เกี่ยวข้องกับรูปแบบขึ้นอยู่กับสมมติฐานนี้ จะเกิดอะไรขึ้นเมื่อเงื่อนไขข้อผิดพลาดไม่มีความแปรปรวนคงที่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.