คำถามติดแท็ก nonlinear

แท็กนี้เลิกใช้งานแล้วเนื่องจากกว้างเกินไป โปรดค้นหาแท็กที่เฉพาะเจาะจงมากขึ้น

6
'ไม่มีเส้นตรงสูง' หมายถึงอะไร
ฉันมักจะอ่านเกี่ยวกับฟังก์ชั่นที่ว่า ในความเข้าใจของฉันมี "เส้นตรง" และ "ไม่ใช่เชิงเส้น" ดังนั้นสิ่งนี้ 'สูง' เกี่ยวกับอะไร มีความแตกต่างอย่างเป็นทางการจากไม่ใช่เชิงเส้นหรือไม่? มันถูกกำหนดอย่างไร?

1
แบบจำลองเชิงเส้นแบบไม่เชิงเส้นกับแบบเชิงเส้นทั่วไป: คุณอ้างถึงการถดถอยแบบลอจิสติกปัวซอง ฯลฯ อย่างไร
ฉันมีคำถามเกี่ยวกับความหมายที่ฉันต้องการความคิดเห็นของนักสถิติเพื่อน เรารู้ว่าแบบจำลองต่างๆเช่นโลจิสติกปัวซอง ฯลฯ ตกอยู่ภายใต้ร่มของตัวแบบเชิงเส้นทั่วไป ตัวแบบมีฟังก์ชั่นไม่เชิงเส้นของพารามิเตอร์ซึ่งอาจถูกจำลองโดยใช้เฟรมเวิร์กโมเดลเชิงเส้นโดยใช้ฟังก์ชันลิงก์ที่เหมาะสม ฉันสงสัยว่าถ้าคุณพิจารณาสถานการณ์ (สอน?) เช่นการถดถอยโลจิสติกเป็น: แบบไม่เชิงเส้นกำหนดรูปแบบของพารามิเตอร์ โมเดลเชิงเส้นเนื่องจากลิงก์เปลี่ยนเราเป็นเฟรมเวิร์กโมเดลเชิงเส้น พร้อมกัน (1) และ (2): มัน "เริ่มต้น" เป็นโมเดลที่ไม่ใช่เชิงเส้น แต่อาจทำงานด้วยวิธีที่ทำให้เราคิดว่ามันเป็นโมเดลเชิงเส้น หวังว่าฉันจะสามารถตั้งค่าแบบสำรวจที่แท้จริง ...

6
ตัวอย่างการสร้างแบบจำลองการถดถอยขั้นสูง
ฉันกำลังมองหากรณีศึกษาการถดถอยเชิงเส้นขั้นสูงซึ่งแสดงขั้นตอนที่จำเป็นสำหรับการสร้างแบบจำลองที่ซับซ้อนความสัมพันธ์ที่ไม่ใช่เชิงเส้นหลาย ๆ แบบโดยใช้ GLM หรือ OLS มันเป็นเรื่องยากที่จะหาแหล่งข้อมูลที่นอกเหนือไปจากโรงเรียนตัวอย่าง: หนังสือส่วนใหญ่ที่ฉันอ่านจะไม่ไปไกลกว่าการแปลงบันทึกการตอบสนองควบคู่ไปกับ BoxCox ของผู้ทำนายหนึ่งคนหรือแนวความคิดตามธรรมชาติในกรณีที่ดีที่สุด นอกจากนี้ตัวอย่างทั้งหมดที่ฉันเห็นมาถึงปัญหาการแปลงข้อมูลในรูปแบบที่แยกต่างหากมักจะอยู่ในรูปแบบการทำนายเดียว ฉันรู้ว่าการแปลง BoxCox หรือ YeoJohnson คืออะไร สิ่งที่ฉันกำลังมองหาคือกรณีศึกษาในชีวิตจริงที่มีรายละเอียดซึ่งการตอบสนอง / ความสัมพันธ์ไม่ชัดเจน ตัวอย่างเช่นการตอบสนองไม่ได้เป็นเชิงบวกอย่างเคร่งครัด (ดังนั้นคุณจึงไม่สามารถใช้ log หรือ BoxCox) ผู้ทำนายมีความสัมพันธ์แบบไม่เป็นเส้นตรงระหว่างตัวเองและต่อการตอบสนองและการแปลงข้อมูลความน่าจะเป็นสูงสุดไม่ได้บ่งบอกถึงมาตรฐาน 0.33 หรือ 0.5 เลขยกกำลัง นอกจากนี้ความแปรปรวนที่เหลือพบว่าไม่คงที่ (ไม่เคยเป็น) ดังนั้นการตอบสนองจะต้องมีการเปลี่ยนแปลงเช่นกันและตัวเลือกจะต้องทำระหว่างการถดถอยครอบครัว GLM ที่ไม่ได้มาตรฐานหรือการเปลี่ยนแปลงการตอบสนอง นักวิจัยมีแนวโน้มที่จะตัดสินใจเลือกที่จะหลีกเลี่ยงการเก็บข้อมูลมากเกินไป แก้ไข จนถึงตอนนี้ฉันรวบรวมทรัพยากรต่อไปนี้: กลยุทธ์การสร้างแบบจำลองการถดถอย, F. Harrell อนุกรมเวลาเศรษฐมิติประยุกต์ว. วชิรเอนเดอร์ โมเดลเชิงเส้นไดนามิกพร้อม R, G. Petris การวิเคราะห์การถดถอยประยุกต์, D. Kleinbaum บทนำสู่การเรียนรู้เชิงสถิติ, …

3
สิ่งที่ทำให้เครือข่ายประสาทเทียมเป็นรูปแบบการจำแนกแบบไม่เชิงเส้น?
ฉันพยายามเข้าใจความหมายทางคณิตศาสตร์ของตัวแบบการจำแนกแบบไม่เชิงเส้น: ฉันเพิ่งอ่านบทความที่พูดคุยเกี่ยวกับอวนประสาทเป็นรูปแบบการจัดหมวดหมู่ที่ไม่ใช่เชิงเส้น แต่ฉันเพิ่งรู้ว่า: ชั้นแรก: h1=x1∗wx1h1+x2∗wx1h2h1=x1∗wx1h1+x2∗wx1h2h_1=x_1∗w_{x1h1}+x_2∗w_{x1h2} h2=x1∗wx2h1+x2∗wx2h2h2=x1∗wx2h1+x2∗wx2h2h_2=x_1∗w_{x2h1}+x_2∗w_{x2h2} ชั้นต่อมา y=b∗wby+h1∗wh1y+h2∗wh2yy=b∗wby+h1∗wh1y+h2∗wh2yy=b∗w_{by}+h_1∗w_{h1y}+h_2∗w_{h2y} สามารถทำให้ง่ายขึ้นไป =b'+(x1∗wx1h1+x2∗wx1h2)∗wh1y+(x1∗wx2h1+x2∗wx2h2)∗wh2y=b′+(x1∗wx1h1+x2∗wx1h2)∗wh1y+(x1∗wx2h1+x2∗wx2h2)∗wh2y=b′+(x_1∗w_{x1h1}+x_2∗w_{x1h2})∗w_{h1y}+(x_1∗w_{x2h1}+x_2∗w_{x2h2})∗w_{h2y} =b'+x1(wh1y∗wx1h1+wx2h1∗wh2y)+x2(wh1y∗wx1h1+wx2h2∗wh2y)=b′+x1(wh1y∗wx1h1+wx2h1∗wh2y)+x2(wh1y∗wx1h1+wx2h2∗wh2y)=b′+x_1(w_{h1y}∗w_{x1h1}+w_{x2h1}∗w_{h2y})+x_2(w_{h1y}∗w_{x1h1}+w_{x2h2}∗w_{h2y}) โครงข่ายประสาทสองชั้นเป็นเพียงการถดถอยเชิงเส้นอย่างง่าย =b′+x1∗W′1+x2∗W′2=b′+x1∗W1′+x2∗W2′=b^′+x_1∗W_1^′+x_2∗W_2^′ สิ่งนี้สามารถแสดงให้เห็นถึงจำนวนเลเยอร์ใด ๆ เนื่องจากการรวมกันเชิงเส้นของจำนวนน้ำหนักใด ๆ เป็นเส้นตรงอีกครั้ง อะไรที่ทำให้โครงข่ายประสาทเทียมเป็นแบบจำลองการจำแนกแบบไม่เชิงเส้น ฟังก์ชั่นการเปิดใช้งานจะส่งผลกระทบต่อความไม่เป็นเชิงเส้นของรุ่นอย่างไร คุณอธิบายฉันได้ไหม

2
หากโมเดลอนุกรมเวลาถอยหลังอัตโนมัติเป็นแบบไม่ใช่เชิงเส้นมันยังต้องใช้ความคงที่หรือไม่?
กำลังคิดเกี่ยวกับการใช้เครือข่ายประสาทที่เกิดขึ้นอีกสำหรับการพยากรณ์อนุกรมเวลา โดยพื้นฐานแล้วพวกเขาใช้การเรียงลำดับของการถดถอยอัตโนมัติแบบไม่ใช่เชิงเส้นทั่วไปเมื่อเปรียบเทียบกับแบบจำลอง ARMA และ ARIMA ซึ่งใช้การถดถอยเชิงเส้นแบบอัตโนมัติ หากเรากำลังทำการถดถอยอัตโนมัติแบบไม่เป็นเชิงเส้นมันยังคงจำเป็นสำหรับอนุกรมเวลาที่จะหยุดนิ่งและเราจะต้องดำเนินการแตกต่างจากวิธีที่เราทำในแบบจำลอง ARIMA หรือไม่? หรือตัวละครที่ไม่ใช่เชิงเส้นของแบบจำลองให้ความสามารถในการจัดการกับอนุกรมเวลาที่ไม่หยุดนิ่งหรือไม่? ที่จะนำคำถามอีกวิธี: ข้อกำหนดความคงที่ (ในค่าเฉลี่ยและความแปรปรวน) สำหรับโมเดล ARMA และ ARIMA เนื่องจากความจริงที่ว่าโมเดลเหล่านี้เป็นแบบเส้นตรงหรือเป็นเพราะอย่างอื่นหรือไม่

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
อธิบายขั้นตอนของอัลกอริธึม LLE (การฝังเชิงเส้นในพื้นที่) ไหม
ฉันเข้าใจหลักการพื้นฐานที่อยู่เบื้องหลังอัลกอริทึมสำหรับ LLE ประกอบด้วยสามขั้นตอน การค้นหาย่านที่คุ้นเคยของแต่ละจุดข้อมูลด้วยตัวชี้วัดบางอย่างเช่น k-nn ค้นหาน้ำหนักสำหรับแต่ละเพื่อนบ้านซึ่งแสดงถึงผลกระทบที่เพื่อนบ้านมีต่อจุดข้อมูล สร้างการฝังข้อมูลในระดับต่ำตามน้ำหนักที่คำนวณ แต่คำอธิบายทางคณิตศาสตร์ของขั้นตอนที่ 2 และ 3 นั้นสร้างความสับสนในหนังสือเรียนและแหล่งข้อมูลออนไลน์ทั้งหมดที่ฉันได้อ่าน ฉันไม่สามารถให้เหตุผลว่าทำไมจึงใช้สูตรนี้ ขั้นตอนเหล่านี้มีการปฏิบัติอย่างไรในทางปฏิบัติ มีวิธีที่เข้าใจง่าย ๆ ในการอธิบายสูตรทางคณิตศาสตร์ที่ใช้หรือไม่? ข้อมูลอ้างอิง: http://www.cs.nyu.edu/~roweis/lle/publications.html

4
ความแตกต่างระหว่างโมเดลเชิงเส้นและไม่เชิงเส้น
ฉันได้อ่านคำอธิบายบางอย่างเกี่ยวกับคุณสมบัติของตัวแบบเชิงเส้นตรงและแบบไม่เชิงเส้น แต่บางครั้งฉันก็ไม่แน่ใจว่าแบบจำลองในมือเป็นแบบเส้นตรงหรือแบบไม่เชิงเส้น ตัวอย่างเช่นโมเดลเชิงเส้นหรือไม่เชิงเส้นต่อไปนี้คืออะไร yt=β0+β1B(L;θ)Xt+εtyt=β0+β1B(L;θ)Xt+εty_t=\beta_0 + \beta_1B(L;\theta)X_t+\varepsilon_t ด้วย: B(L;θ)=∑k=1Kb(k;θ)LkB(L;θ)=∑k=1Kb(k;θ)LkB(L;\theta)=\sum_{k=1}^{K}b(k;\theta)L^k LkXt=Xt−kLkXt=Xt−kL^kX_t=X_{t-k} โดยที่แทน (การสลาย) ฟังก์ชันเลขชี้กำลังพหุนาม Almon ของรูปแบบ:b(k;θ)b(k;θ)b(k;\theta) b(k;θ)=exp(θ1k+θ2k2)∑Kk=1exp(θ1k+θ2k2)b(k;θ)=exp⁡(θ1k+θ2k2)∑k=1Kexp⁡(θ1k+θ2k2)b(k;\theta)=\frac{\exp(\theta_1 k+\theta_2k^2)}{\sum_{k=1}^{K}\exp(\theta_1k+\theta_2k^2)} ในมุมมองของฉันสมการหลักของฉัน (อันแรก) เป็นแบบเชิงเส้นเทียบกับเพราะเทอมนี้คูณด้วยน้ำหนัก แต่ผมจะบอกว่าฟังก์ชั่นการถ่วงน้ำหนัก (สมการที่ผ่านมา) คือไม่เชิงเส้นที่เกี่ยวกับพารามิเตอร์θ 1 ans θ 2XtXtX_tθ1θ1\theta_1θ2θ2\theta_2 ใครสามารถอธิบายให้ฉันฟังก์ชั่นหลักของฉันเป็นเชิงเส้นหรือไม่เชิงเส้นและสิ่งที่มันมีความหมายสำหรับขั้นตอนการประเมิน - ฉันต้องใช้วิธีการเชิงเส้นหรือไม่เชิงเส้นอย่างน้อยสี่เหลี่ยม? นอกจากนี้คุณสมบัติที่มองเห็นได้โดยใช้วิธีการที่ฉันสามารถระบุได้อย่างแน่นอนว่าฟังก์ชั่นเป็นแบบไม่เชิงเส้นหรือเชิงเส้นหรือไม่?

3
ทำไมการแยกความแตกต่างระหว่างการ "เชิงเส้น" และ "การไม่เชิงเส้น" จึงเป็นสิ่งสำคัญ
อะไรคือความสำคัญของความแตกต่างระหว่างตัวแบบเชิงเส้นและแบบไม่ใช่เชิงเส้น? คำถามแบบไม่เชิงเส้นเทียบกับโมเดลเชิงเส้นทั่วไป: คุณจะอ้างถึงการถดถอยโลจิสติกปัวซอง ฯลฯ อย่างไร และคำตอบคือการให้คำอธิบายที่เป็นประโยชน์อย่างมากเกี่ยวกับความเป็นเชิงเส้น / ไม่เชิงเส้นของแบบจำลองเชิงเส้นทั่วไป ดูเหมือนว่าสำคัญอย่างยิ่งที่จะแยกแยะเชิงเส้นจากตัวแบบที่ไม่ใช่เชิงเส้น แต่ทำไมฉันถึงไม่ชัดเจน ตัวอย่างเช่นพิจารณาโมเดลการถดถอยเหล่านี้: E[Y∣X]E[Y∣X]E[Y∣X]E[Y∣X]=β0+β1X=β0+β1X+β2X2=β0+β21X={1+exp(−[β0+β1X]}−1(1)(2)(3)(4)(1)E[Y∣X]=β0+β1X(2)E[Y∣X]=β0+β1X+β2X2(3)E[Y∣X]=β0+β12X(4)E[Y∣X]={1+exp⁡(−[β0+β1X]}−1\begin{align} E[Y \mid X] & = \beta_0 + \beta_1 X \tag{1} \\ E[Y \mid X] & = \beta_0 + \beta_1 X + \beta_2 X^2 \tag{2} \\ E[Y \mid X] & = \beta_0 + \beta_1^2 X \tag{3} \\ E[Y \mid …

3
กลยุทธ์สำหรับการปรับฟังก์ชั่นที่ไม่ใช่เชิงเส้นอย่างเหมาะสม
สำหรับการวิเคราะห์ข้อมูลจากการทดลองด้านชีวฟิสิกส์ตอนนี้ฉันกำลังพยายามทำเส้นโค้งที่เหมาะสมกับตัวแบบที่ไม่ใช่เชิงเส้น ฟังก์ชั่นโมเดลดูเหมือนจะเป็น: y=ax+bx−1/2y=ax+bx−1/2y = ax + bx^{-1/2} ที่นี่โดยเฉพาะอย่างยิ่งคุณค่าของเป็นที่น่าสนใจอย่างยิ่งbbb พล็อตสำหรับฟังก์ชั่นนี้: (โปรดทราบว่าฟังก์ชั่นแบบจำลองนั้นมีพื้นฐานมาจากคำอธิบายทางคณิตศาสตร์อย่างละเอียดของระบบและดูเหมือนว่าจะทำงานได้ดีมาก --- เป็นเพียงแค่อุปกรณ์อัตโนมัติเท่านั้นที่มีความยุ่งยาก) แน่นอนฟังก์ชั่นแบบจำลองนั้นมีปัญหา: กลยุทธ์ที่เหมาะสมที่ฉันได้ลองมาจนถึงตอนนี้ล้มเหลวเนื่องจากเส้นกำกับที่คมชัดที่โดยเฉพาะกับข้อมูลที่มีเสียงดังx=0x=0x=0 ความเข้าใจของฉันของปัญหาที่นี่เป็นที่เรียบง่ายอย่างน้อยสี่เหลี่ยมกระชับ (ผมเคยเล่นกับทั้งเชิงเส้นและการถดถอยที่ไม่ใช่เชิงเส้นใน MATLAB; ส่วนใหญ่ Levenberg-Marquardt) เป็นมากไวต่อสิ้นสุดแนวตั้งเพราะข้อผิดพลาดเล็ก ๆ ใน x จะขยายอย่างมหาศาล . ใครช่วยชี้ให้ฉันเห็นกลยุทธ์ที่เหมาะสมที่สามารถแก้ไขได้? ฉันมีความรู้พื้นฐานเกี่ยวกับสถิติ แต่ก็ยังค่อนข้าง จำกัด ฉันกระตือรือร้นที่จะเรียนรู้ถ้าเพียง แต่ฉันรู้ว่าจะเริ่มมองหาที่ไหน :) ขอบคุณมากสำหรับคำแนะนำของคุณ! แก้ไขการขออภัยโทษจากที่ลืมพูดถึงข้อผิดพลาด เสียงรบกวนที่สำคัญเพียงอย่างเดียวคือในและมันเป็นสารเติมแต่งxxx แก้ไข 2ข้อมูลเพิ่มเติมบางอย่างเกี่ยวกับพื้นหลังของคำถามนี้ กราฟด้านบนเป็นแบบจำลองพฤติกรรมการยืดของโพลีเมอร์ @whuber ชี้ให้เห็นในความคิดเห็นคุณจะต้องเพื่อให้ได้กราฟดังด้านบนb≈−200ab≈−200ab \approx -200 a สำหรับวิธีที่ผู้คนปรับโค้งนี้จนถึงจุดนี้: ดูเหมือนว่าคนทั่วไปจะตัดเส้นกำกับแนวดิ่งจนกว่าพวกเขาจะเจอแบบที่ดี ตัวเลือกการตัดออกยังคงเป็นกฎเกณฑ์ทำให้กระบวนการที่เหมาะสมไม่น่าเชื่อถือและไม่สามารถพิสูจน์ได้ แก้ไขกราฟ3 และ 4คงที่

3
Non-linearity ก่อนชั้น Softmax สุดท้ายในเครือข่ายประสาทเทียม
ฉันกำลังศึกษาและพยายามใช้โครงข่ายประสาทเทียม แต่ฉันคิดว่าคำถามนี้ใช้ได้กับผู้เรียนหลายคนโดยทั่วไป เซลล์ส่งออกในเครือข่ายของฉันเป็นตัวแทนของการเปิดใช้งานของแต่ละชั้นเรียน: เซลล์ประสาทที่ใช้งานมากที่สุดสอดคล้องกับระดับที่คาดการณ์ไว้สำหรับการป้อนข้อมูลที่กำหนด ในการพิจารณาค่าใช้จ่ายข้ามเอนโทรปีสำหรับการฝึกอบรมฉันเพิ่มเลเยอร์ softmax ที่ส่วนท้ายของเครือข่ายเพื่อให้ค่าการเปิดใช้งานของเซลล์ประสาทแต่ละค่าถูกตีความเป็นค่าความน่าจะเป็น คำถามของฉันคือ: เซลล์ประสาทในชั้นเอาต์พุตควรใช้ฟังก์ชันที่ไม่ใช่เชิงเส้นกับอินพุตหรือไม่ สัญชาตญาณของฉันคือมันไม่จำเป็น: ถ้าอินพุตกับ th เอาต์พุตเซลล์ประสาทคือจุดผลิตภัณฑ์ระหว่างเวกเตอร์ (มาจากเลเยอร์ก่อนหน้า) และน้ำหนักสำหรับเซลล์ประสาทนั้นx T θ ฉัน x θ ฉันผมผมixTθผมxTθผมx^T\theta_ixxxθผมθผม\theta_i และถ้าฉันใช้ฟังก์ชั่นที่ไม่ใช่เชิงเส้นเดียวเช่น sigmoid หรือ ReLU ดังนั้นการเปิดใช้งานเอาต์พุตขนาดใหญ่จะยังคงสอดคล้องกับใหญ่ที่สุดดังนั้นจากมุมมองนี้ฟังก์ชั่นที่ไม่ใช่เชิงเส้นจะไม่เปลี่ยนการทำนายxTθผมxTθผมx^T\theta_i มีอะไรผิดปกติกับการตีความนี้หรือไม่? มีปัจจัยการฝึกอบรมบางอย่างที่ฉันมองเห็นหรือไม่ และถ้าฉันพูดถูกสิ่งใดจะเปลี่ยนไปถ้าแทนที่จะใช้ฟังก์ชั่น sigmoid ฉันใช้ฟังก์ชั่น ReLUซึ่งไม่ใช่ฟังก์ชั่นโมโนโทนิกอย่างแน่นอนสูงสุด( 0 , xTθผม)สูงสุด(0,xTθผม)\max(0,x^T\theta_i) แก้ไข จากการอ้างอิงถึงคำตอบของ Karel ซึ่งคำตอบโดยทั่วไปคือ "ขึ้นอยู่กับ" นี่คือคำอธิบายโดยละเอียดเพิ่มเติมเกี่ยวกับเครือข่ายและข้อสงสัยของฉัน: สมมติว่าฉันมีเลเยอร์ที่ซ่อนอยู่ N ชั้นและชั้นการส่งออกของฉันเป็นเพียงชั้น softmax เหนือชุดของเซลล์ประสาทที่เป็นตัวแทนของคลาส (ดังนั้นผลลัพธ์ที่คาดหวังของฉันคือความน่าจะเป็นที่ข้อมูลอินพุตเป็นของแต่ละชั้นเรียน) สมมติว่าเลเยอร์ N-1 แรกมีเซลล์ประสาทแบบไม่เชิงเส้นอะไรคือความแตกต่างระหว่างการใช้เซลล์ประสาทแบบไม่เชิงเส้นกับเชิงเส้นตรงในเลเยอร์ …

1
วิธี Nystroem สำหรับการประมาณเคอร์เนล
ฉันได้อ่านเกี่ยวกับวิธีNyströmสำหรับการประมาณเคอร์เนลระดับต่ำ วิธีนี้ถูกนำมาใช้ในการเรียนรู้ scikit [1] เป็นวิธีการฉายตัวอย่างข้อมูลไปยังการประมาณระดับต่ำของการแมปฟีเจอร์เคอร์เนล ตามความรู้ของฉันที่สุดให้ชุดฝึกอบรมและฟังก์ชันเคอร์เนลมันสร้างการประมาณอันดับต่ำของเคอร์เนลเมทริกซ์โดยใช้ SVD กับและC{xi}ni=1{xi}i=1n\{x_i\}_{i=1}^nn×nn×nn \times nKKKWWWCCC K=[WK21KT21K22]K=[WK21TK21K22]K = \left [ \begin{array}{cc} W & K_{21}^T \\ K_{21} & K_{22} \end{array} \right ] C=[WK21]C=[WK21]C = \left [\begin{array}{cc} W \\ K_{21} \end{array}\right ] ,W∈Rl×lW∈Rl×lW \in \mathbb{R}^{l\times l} อย่างไรก็ตามฉันไม่เข้าใจว่าการประมาณระดับต่ำของเมทริกซ์เคอร์เนลสามารถใช้เพื่อฉายตัวอย่างใหม่ไปยังพื้นที่คุณลักษณะเคอร์เนลโดยประมาณได้อย่างไร เอกสารที่ฉันได้พบ (เช่น [2]) ไม่ได้ช่วยอะไรมากเพราะมันเป็นการสอนน้อย นอกจากนี้ฉันยังสงสัยเกี่ยวกับความซับซ้อนในการคำนวณของวิธีนี้ทั้งในขั้นตอนการฝึกอบรมและการทดสอบ [1] http://scikit-learn.org/stable/modules/kernel_approximation.html#nystroem-kernel-approx [2] http://www.jmlr.org/papers/volume13/kumar12a/kumar12a.pdf

3
เกณฑ์และการตัดสินใจสำหรับความไม่เป็นเส้นตรงในแบบจำลองทางสถิติคืออะไร
ฉันหวังว่าคำถามทั่วไปต่อไปนี้จะสมเหตุสมผล โปรดทราบว่าสำหรับวัตถุประสงค์ของคำถามนี้โดยเฉพาะฉันไม่สนใจเหตุผลทางทฤษฎี (โดเมนหัวเรื่อง) สำหรับการแนะนำที่ไม่ใช่เชิงเส้น ดังนั้นฉันจะกำหนดคำถามแบบเต็มดังนี้: กรอบตรรกะคืออะไร( เกณฑ์และหากเป็นไปได้กระบวนการตัดสินใจ ) สำหรับการนำเสนอแบบไม่เป็นเชิงเส้นในแบบจำลองเชิงสถิติด้วยเหตุผลนอกเหนือจากเชิงทฤษฎี (โดเมนเรื่อง)? เช่นเคยทรัพยากรและการอ้างอิงที่เกี่ยวข้องก็ยินดีต้อนรับเช่นกัน

2
ฉันจะสร้างแบบจำลองการโต้ตอบระหว่างตัวแปรอธิบายได้อย่างไรเมื่อหนึ่งในนั้นอาจมีสมการกำลังสองและลูกบาศก์?
ฉันหวังเป็นอย่างยิ่งว่าฉันจะได้ใช้คำถามนี้ในลักษณะที่สามารถตอบได้อย่างชัดเจน - หากไม่ได้โปรดแจ้งให้เราทราบและฉันจะลองอีกครั้ง! ฉันควรเดาด้วยว่าฉันจะใช้ R สำหรับการวิเคราะห์เหล่านี้ ฉันมีหลายมาตรการplant performance (Ys)ที่ฉันสงสัยว่าได้รับอิทธิพลจากสี่รักษาผม imposed-- และflower thinning (X1), fertilization (X2), leaf clipping (X3) biased flower thinning (X4)สำหรับ Ys ที่เป็นไปได้ทั้งหมด N มีอย่างน้อย 242 ดังนั้นขนาดตัวอย่างของฉันจึงใหญ่ แผนการทั้งหมดถูกทำให้ผอมบางหรือไม่ แต่แต่ละแปลงก็ต้องมีหนึ่ง (และเพียงหนึ่ง) ของการรักษาอีกสาม (หรือไม่ - มีแผนการควบคุมด้วย) แนวคิดของการออกแบบนี้คือการทดสอบว่าอีกสามวิธีการรักษามีความสามารถในการ "กำบัง" หรือ "การเสริมสร้าง" ผลของการทำให้ผอมบาง ดังนั้นด้วยการออกแบบการรักษาทั้งสามหลัง (X2-X4) จึงไม่สามารถโต้ตอบกันได้เพราะพวกเขาไม่ได้ถูกข้าม แต่พวกเขาแต่ละคนสามารถโต้ตอบกับการทำให้ผอมบางของดอกไม้ - และพวกเขาอาจทำ สมมติฐานที่ชัดเจนของฉันคือ 1) การทำให้ผอมบางดอกจะมีนัยสำคัญและ 2) …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.