คำถามติดแท็ก nonlinear-regression

ใช้แท็กนี้เฉพาะสำหรับโมเดลการถดถอยซึ่งการตอบสนองเป็นฟังก์ชันที่ไม่เชิงเส้นของพารามิเตอร์ ห้ามใช้แท็กนี้สำหรับการแปลงข้อมูลแบบไม่เชิงเส้น

4
เลเยอร์ที่ซ่อนอยู่ในคอมพิวเตอร์คำนวณจากอะไร
ฉันแน่ใจว่าหลายคนจะตอบสนองด้วยลิงก์เพื่อ 'ให้ฉัน google สำหรับคุณ' ดังนั้นฉันอยากจะบอกว่าฉันพยายามที่จะคิดออกดังนั้นโปรดยกโทษให้ฉันขาดความเข้าใจที่นี่ แต่ฉันไม่สามารถหาวิธี การใช้งานจริงของเครือข่ายประสาทใช้งานได้จริง ฉันเข้าใจเลเยอร์อินพุตและวิธีทำให้ข้อมูลเป็นมาตรฐานฉันยังเข้าใจหน่วยอคติ แต่เมื่อพูดถึงเลเยอร์ที่ซ่อนอยู่การคำนวณที่แท้จริงคืออะไรในเลเยอร์นั้นและวิธีที่แมปกับเอาต์พุตเป็นเพียงหมอกเล็กน้อย ฉันเห็นไดอะแกรมที่มีเครื่องหมายคำถามในเลเยอร์ที่ซ่อนอยู่ฟังก์ชันบูลีนเช่น AND / OR / XOR ฟังก์ชั่นการเปิดใช้งานและโหนดอินพุตที่แมปไปยังหน่วยที่ซ่อนอยู่ทั้งหมดและโหนดอินพุตที่แมปหน่วยที่ซ่อนอยู่เพียงไม่กี่ตัวเท่านั้น ฉันมีคำถามสองสามข้อเกี่ยวกับการใช้งานจริง แน่นอนคำอธิบายง่ายๆเกี่ยวกับกระบวนการโครงข่ายประสาททั้งหมดเหมือนกับที่คุณจะอธิบายให้เด็กฟังจะน่ากลัว การคำนวณอะไรที่ทำในเลเยอร์ที่ซ่อนอยู่? การคำนวณเหล่านั้นถูกแม็พกับเลเยอร์เอาต์พุตอย่างไร เลเยอร์ ouput ทำงานอย่างไร ยกเลิกการทำให้ข้อมูลเป็นปกติจากเลเยอร์ที่ซ่อนอยู่หรือไม่ ทำไมบางเลเยอร์ในเลเยอร์อินพุตเชื่อมต่อกับเลเยอร์ที่ซ่อนอยู่และบางเลเยอร์ไม่ได้?

3
เหตุใดการถดถอยพหุนามจึงถือว่าเป็นกรณีพิเศษของการถดถอยเชิงเส้นหลายเส้น
หากแบบจำลองพหุนามถดถอยความสัมพันธ์แบบไม่เชิงเส้นจะพิจารณาเป็นกรณีพิเศษของการถดถอยเชิงเส้นหลายแบบได้อย่างไร วิกิพีเดียตั้งข้อสังเกตว่า "แม้ว่าการถดถอยพหุนามจะเหมาะกับโมเดลที่ไม่เป็นเชิงเส้นกับข้อมูล แต่เป็นปัญหาการประมาณเชิงสถิติมันเป็นเชิงเส้นในแง่ที่ว่าฟังก์ชันการถดถอยเป็นเส้นตรงในพารามิเตอร์ที่ไม่รู้จักซึ่งประมาณจากข้อมูล "E(y|x)E(y|x)\mathbb{E}(y | x) การถดถอยเชิงเส้นพหุนามเป็นอย่างไรในพารามิเตอร์ที่ไม่รู้จักหากพารามิเตอร์เป็นค่าสัมประสิทธิ์สำหรับคำที่มีคำสั่ง 2≥≥\ge

5
ฉันจะทดสอบความสัมพันธ์ที่ไม่เชิงเส้นได้อย่างไร
สำหรับเนื้อเรื่องที่ 1 ฉันสามารถทดสอบการเชื่อมโยงระหว่าง x และ y ได้โดยทำการสหสัมพันธ์อย่างง่าย สำหรับพล็อต 2 ที่ความสัมพันธ์ไม่เป็นเชิงเส้น แต่มีความสัมพันธ์ที่ชัดเจนระหว่าง x และ y ฉันจะทดสอบความสัมพันธ์และเลเบลลักษณะของมันได้อย่างไร

1
การคำนวณซ้ำของเอฟเฟกต์จากโมเดล lmer
ฉันเพิ่งอ่านบทความนี้ซึ่งอธิบายถึงวิธีการคำนวณความสามารถในการทำซ้ำ (ความน่าเชื่อถือหรือความสัมพันธ์ภายในอินทราเน็ต) ของการวัดผ่านการสร้างแบบจำลองเอฟเฟกต์ผสม รหัส R จะเป็น: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

3
จะบอกความแตกต่างระหว่างตัวแบบการถดถอยเชิงเส้นและแบบไม่เชิงเส้นได้อย่างไร?
ผมอ่านลิงค์ต่อไปนี้ไม่ใช่การถดถอยเชิงเส้นSAS องค์กรไม่เชิงเส้น ความเข้าใจของฉันจากการอ่านส่วนแรก "การถดถอยเชิงเส้นกับการถดถอยเชิงเส้น" คือว่าสมการด้านล่างนี้เป็นจริงแล้วการถดถอยเชิงเส้นนั้นถูกต้องหรือไม่ ถ้าเป็นเช่นนั้นทำไม y=b1x3+b2x2+b3x+cy=b1x3+b2x2+b3x+cy = b_1x^3 + b_2x^2 + b_3x + c ฉันต้องเข้าใจด้วยหรือไม่ว่าในการถดถอยเชิงเส้นพหุสัมพันธ์ไม่ใช่ปัญหา? ฉันรู้ว่า multicollinearity สามารถเป็นปัญหาในการถดถอยเชิงเส้นได้ดังนั้นหากโมเดลข้างต้นเป็นจริงแล้วการถดถอยเชิงเส้นจะมีความหลากหลายทางชีวภาพหรือไม่


2
การถดถอยสำหรับรูปแบบของ ?
ฉันมีชุดข้อมูลซึ่งเป็นสถิติจากฟอรัมสนทนาทางเว็บ ฉันกำลังดูจำนวนการตอบกลับที่คาดว่าจะมี โดยเฉพาะฉันได้สร้างชุดข้อมูลที่มีรายการของการตอบหัวข้อแล้วจำนวนของหัวข้อที่มีการตอบกลับจำนวนนั้น "num_replies","count" 0,627568 1,156371 2,151670 3,79094 4,59473 5,39895 6,30947 7,23329 8,18726 หากฉันพล็อตชุดข้อมูลบนพล็อตการบันทึกล็อกฉันจะได้รับสิ่งที่เป็นเส้นตรง: (นี่คือการกระจาย Zipfian ) วิกิพีเดียบอกว่าเส้นตรงในแปลงเข้าสู่ระบบเข้าสู่ระบบบ่งบอกถึงฟังก์ชั่นที่สามารถสร้างแบบจำลองโดย monomial ของแบบฟอร์มที่ k และในความเป็นจริงฉันได้ฟังฟังก์ชั่นดังกล่าว:Y= a xkY=axky = ax^k lines(data$num_replies, 480000 * data$num_replies ^ -1.62, col="green") เห็นได้ชัดว่าดวงตาของฉันไม่แม่นยำเท่ากับอาร์ดังนั้นฉันจะได้ R เพื่อให้พอดีกับพารามิเตอร์ของโมเดลนี้สำหรับฉันได้อย่างแม่นยำมากขึ้นได้อย่างไร? ฉันลองการถดถอยพหุนาม แต่ฉันไม่คิดว่า R พยายามปรับเลขชี้กำลังเป็นพารามิเตอร์ - ชื่อที่เหมาะสมสำหรับรุ่นที่ฉันต้องการคืออะไร แก้ไข: ขอบคุณสำหรับคำตอบทุกคน ตามที่แนะนำตอนนี้ฉันได้จัดวางโมเดลเชิงเส้นตรงกับบันทึกของข้อมูลอินพุตโดยใช้สูตรนี้: data <- read.csv(file="result.txt") # Avoid …

1
การใช้ข้อผิดพลาดมาตรฐานของการกระจาย bootstrap
(เพิกเฉยต่อรหัส R หากจำเป็นเนื่องจากคำถามหลักของฉันคือภาษาที่ไม่ขึ้นต่อกัน) หากฉันต้องการดูความแปรปรวนของสถิติอย่างง่าย (เช่นค่าเฉลี่ย) ฉันรู้ว่าฉันสามารถทำได้ผ่านทางทฤษฎีเช่น: x = rnorm(50) # Estimate standard error from theory summary(lm(x~1)) # same as... sd(x) / sqrt(length(x)) หรือด้วย bootstrap เช่น: library(boot) # Estimate standard error from bootstrap (x.bs = boot(x, function(x, inds) mean(x[inds]), 1000)) # which is simply the standard *deviation* of the bootstrap distribution... …

2
ข้อผิดพลาดการไล่ระดับสีเอกพจน์ใน nls ด้วยค่าเริ่มต้นที่ถูกต้อง
ฉันพยายามใส่เส้นโค้ง + เอ็กซ์โพเนนเชียลให้พอดีกับข้อมูลบางอย่าง เป็นการเริ่มต้นฉันพยายามทำสิ่งนี้กับข้อมูลเทียมบางอย่าง ฟังก์ชั่นคือ: มันเป็นเส้นโค้งเอ็กซ์โพเนนเชียลได้อย่างมีประสิทธิภาพกับส่วนเชิงเส้นเช่นเดียวกับพารามิเตอร์ shift แนวนอนเพิ่มเติม ( m ) อย่างไรก็ตามเมื่อฉันใช้ฟังก์ชั่นของ R ฉันได้รับข้อผิดพลาด " เมทริกซ์การไล่ระดับสีเอกพจน์ที่การประมาณการพารามิเตอร์เริ่มต้น " ที่น่ากลัวแม้ว่าฉันจะใช้พารามิเตอร์เดียวกันกับที่ฉันใช้ในการสร้างข้อมูลตั้งแต่แรก ฉันลองใช้อัลกอริทึมที่แตกต่างกันค่าเริ่มต้นที่แตกต่างกันและพยายามใช้Y= a + b ⋅ r( x - m )+ c ⋅ xY=a+ข⋅R(x-ม.)+ค⋅xy=a+b\cdot r^{(x-m)}+c\cdot xnls()optimเพื่อลดผลรวมที่เหลือของกำลังสองทั้งหมดนี้จะไม่มีประโยชน์ ฉันได้อ่านว่าสาเหตุที่เป็นไปได้สำหรับการทำเช่นนี้อาจเป็นการทำให้เกินขอบเขตของสูตร แต่ฉันไม่คิดว่ามันจะเป็น (คืออะไร) มีใครมีข้อเสนอแนะสำหรับปัญหานี้หรือไม่? หรือนี่เป็นเพียงโมเดลที่น่าอึดอัดใจ? ตัวอย่างสั้น ๆ : #parameters used to generate the data reala=-3 realb=5 realc=0.5 …

2
อะไรคือวิธีที่ปราศจากความเจ็บปวดที่สุดในการปรับเส้นโค้งการเติบโตของโลจิสติกส์ใน R
นี่ไม่ใช่เรื่องง่ายสำหรับ Google เช่นเดียวกับสิ่งอื่น ๆ อย่างชัดเจนฉันไม่ได้พูดถึงการถดถอยแบบลอจิสติกในแง่ของการใช้การถดถอยเพื่อทำนายตัวแปรเด็ดขาด ฉันกำลังพูดถึงการปรับกราฟการเติบโตโลจิสติกให้เหมาะสมกับจุดข้อมูลที่กำหนด จะเฉพาะเจาะจง, เป็นปีที่ได้รับ 1958-2012 และปีคือประมาณ ppm CO2 ทั่วโลก (ส่วนต่อล้านส่วนของก๊าซคาร์บอนไดออกไซด์) ในเดือนพฤศจิกายนปีxxxxyyyxxx ตอนนี้มันกำลังเร่งความเร็ว แต่มันก็ต้องหยุดลงในบางจุด ดังนั้นฉันต้องการเส้นโค้งโลจิสติก ฉันยังไม่พบวิธีที่ตรงไปตรงมาในการทำเช่นนี้

3
สิ่งที่ทำให้เครือข่ายประสาทเทียมเป็นรูปแบบการจำแนกแบบไม่เชิงเส้น?
ฉันพยายามเข้าใจความหมายทางคณิตศาสตร์ของตัวแบบการจำแนกแบบไม่เชิงเส้น: ฉันเพิ่งอ่านบทความที่พูดคุยเกี่ยวกับอวนประสาทเป็นรูปแบบการจัดหมวดหมู่ที่ไม่ใช่เชิงเส้น แต่ฉันเพิ่งรู้ว่า: ชั้นแรก: h1=x1∗wx1h1+x2∗wx1h2h1=x1∗wx1h1+x2∗wx1h2h_1=x_1∗w_{x1h1}+x_2∗w_{x1h2} h2=x1∗wx2h1+x2∗wx2h2h2=x1∗wx2h1+x2∗wx2h2h_2=x_1∗w_{x2h1}+x_2∗w_{x2h2} ชั้นต่อมา y=b∗wby+h1∗wh1y+h2∗wh2yy=b∗wby+h1∗wh1y+h2∗wh2yy=b∗w_{by}+h_1∗w_{h1y}+h_2∗w_{h2y} สามารถทำให้ง่ายขึ้นไป =b'+(x1∗wx1h1+x2∗wx1h2)∗wh1y+(x1∗wx2h1+x2∗wx2h2)∗wh2y=b′+(x1∗wx1h1+x2∗wx1h2)∗wh1y+(x1∗wx2h1+x2∗wx2h2)∗wh2y=b′+(x_1∗w_{x1h1}+x_2∗w_{x1h2})∗w_{h1y}+(x_1∗w_{x2h1}+x_2∗w_{x2h2})∗w_{h2y} =b'+x1(wh1y∗wx1h1+wx2h1∗wh2y)+x2(wh1y∗wx1h1+wx2h2∗wh2y)=b′+x1(wh1y∗wx1h1+wx2h1∗wh2y)+x2(wh1y∗wx1h1+wx2h2∗wh2y)=b′+x_1(w_{h1y}∗w_{x1h1}+w_{x2h1}∗w_{h2y})+x_2(w_{h1y}∗w_{x1h1}+w_{x2h2}∗w_{h2y}) โครงข่ายประสาทสองชั้นเป็นเพียงการถดถอยเชิงเส้นอย่างง่าย =b′+x1∗W′1+x2∗W′2=b′+x1∗W1′+x2∗W2′=b^′+x_1∗W_1^′+x_2∗W_2^′ สิ่งนี้สามารถแสดงให้เห็นถึงจำนวนเลเยอร์ใด ๆ เนื่องจากการรวมกันเชิงเส้นของจำนวนน้ำหนักใด ๆ เป็นเส้นตรงอีกครั้ง อะไรที่ทำให้โครงข่ายประสาทเทียมเป็นแบบจำลองการจำแนกแบบไม่เชิงเส้น ฟังก์ชั่นการเปิดใช้งานจะส่งผลกระทบต่อความไม่เป็นเชิงเส้นของรุ่นอย่างไร คุณอธิบายฉันได้ไหม

5
นักสถิติสันนิษฐานว่าไม่มีใครสามารถรดน้ำต้นไม้ได้หรือฉันแค่ใช้คำค้นหาที่ผิดสำหรับการถดถอยเชิงเส้นโค้ง?
เกือบทุกอย่างที่ฉันอ่านเกี่ยวกับการถดถอยเชิงเส้นและ GLM จะลดลงถึงสิ่งนี้:โดยที่เป็นฟังก์ชั่นที่ไม่เพิ่มขึ้นหรือลดลงของและเป็นพารามิเตอร์ของคุณ ประมาณการและทดสอบสมมติฐานเกี่ยวกับ มีหลายสิบของฟังก์ชั่นการเชื่อมโยงและการเปลี่ยนแปลงของการเป็นและจะทำให้ฟังก์ชันเชิงเส้นของ\)y=f(x,β)y=f(x,β)y = f(x,\beta)f(x,β)f(x,β)f(x,\beta)xxxββ\betayyyxxxyyyf(x,β)f(x,β)f(x,\beta) ตอนนี้ถ้าคุณลบข้อกำหนดที่ไม่เพิ่ม / ไม่ลดสำหรับฉันรู้เพียงสองทางเลือกสำหรับการปรับโมเดลพาราเมตริกเมทริกซ์ที่ปรับให้เหมาะสม: ฟังก์ชันตรีโกณมิติและพหุนาม ทั้งคู่สร้างการพึ่งพาอาศัยกันระหว่างแต่ละคาดการณ์และทั้งชุดของทำให้พวกเขาพอดีไม่แข็งแรงมากเว้นแต่มีเหตุผลก่อนที่จะเชื่อว่าข้อมูลของคุณถูกสร้างขึ้นจริงโดยกระบวนการวัฏจักรหรือพหุนามy Xf(x,β)f(x,β)f(x,\beta)yyyXXX นี่ไม่ใช่กรณีขอบลึกลับบางอย่าง มันคือความสัมพันธ์ที่เกิดขึ้นจริงและสามัญสำนึกระหว่างน้ำกับผลผลิต (เมื่อแปลงอยู่ลึกพอใต้น้ำผลผลิตของพืชจะเริ่มลดลง) หรือระหว่างแคลอรี่ที่บริโภคในอาหารเช้าและประสิทธิภาพในการตอบคำถามคณิตศาสตร์หรือจำนวนคนงานในโรงงาน และจำนวนของวิดเจ็ตที่พวกเขาสร้าง ... โดยสังเขปเกือบทุกกรณีในชีวิตจริงที่ใช้โมเดลเชิงเส้น แต่ด้วยข้อมูลที่ครอบคลุมช่วงกว้างพอที่คุณไปผ่านการลดขนาดลงของผลตอบแทนเป็นผลตอบแทนติดลบ ฉันพยายามค้นหาคำว่า 'เว้า', 'นูน', 'โค้ง', 'ไม่ใช่โมโนโทนิก', 'อ่างอาบน้ำ' และฉันลืมว่ามีคนอื่นอีกกี่คน คำถามที่เกี่ยวข้องน้อยและคำตอบที่ใช้ได้น้อยลง ดังนั้นในทางปฏิบัติหากคุณมีข้อมูลต่อไปนี้ (รหัส R y เป็นฟังก์ชันของตัวแปร x ต่อเนื่องและกลุ่มตัวแปรแยก): updown<-data.frame(y=c(46.98,38.39,44.21,46.28,41.67,41.8,44.8,45.22,43.89,45.71,46.09,45.46,40.54,44.94,42.3,43.01,45.17,44.94,36.27,43.07,41.85,40.5,41.14,43.45,33.52,30.39,27.92,19.67,43.64,43.39,42.07,41.66,43.25,42.79,44.11,40.27,40.35,44.34,40.31,49.88,46.49,43.93,50.87,45.2,43.04,42.18,44.97,44.69,44.58,33.72,44.76,41.55,34.46,32.89,20.24,22,17.34,20.14,20.36,24.39,22.05,24.21,26.11,28.48,29.09,31.98,32.97,31.32,40.44,33.82,34.46,42.7,43.03,41.07,41.02,42.85,44.5,44.15,52.58,47.72,44.1,21.49,19.39,26.59,29.38,25.64,28.06,29.23,31.15,34.81,34.25,36,42.91,38.58,42.65,45.33,47.34,50.48,49.2,55.67,54.65,58.04,59.54,65.81,61.43,67.48,69.5,69.72,67.95,67.25,66.56,70.69,70.15,71.08,67.6,71.07,72.73,72.73,81.24,73.37,72.67,74.96,76.34,73.65,76.44,72.09,67.62,70.24,69.85,63.68,64.14,52.91,57.11,48.54,56.29,47.54,19.53,20.92,22.76,29.34,21.34,26.77,29.72,34.36,34.8,33.63,37.56,42.01,40.77,44.74,40.72,46.43,46.26,46.42,51.55,49.78,52.12,60.3,58.17,57,65.81,72.92,72.94,71.56,66.63,68.3,72.44,75.09,73.97,68.34,73.07,74.25,74.12,75.6,73.66,72.63,73.86,76.26,74.59,74.42,74.2,65,64.72,66.98,64.27,59.77,56.36,57.24,48.72,53.09,46.53), x=c(216.37,226.13,237.03,255.17,270.86,287.45,300.52,314.44,325.61,341.12,354.88,365.68,379.77,393.5,410.02,420.88,436.31,450.84,466.95,477,491.89,509.27,521.86,531.53,548.11,563.43,575.43,590.34,213.33,228.99,240.07,250.4,269.75,283.33,294.67,310.44,325.36,340.48,355.66,370.43,377.58,394.32,413.22,428.23,436.41,455.58,465.63,475.51,493.44,505.4,521.42,536.82,550.57,563.17,575.2,592.27,86.15,91.09,97.83,103.39,107.37,114.78,119.9,124.39,131.63,134.49,142.83,147.26,152.2,160.9,163.75,172.29,173.62,179.3,184.82,191.46,197.53,201.89,204.71,214.12,215.06,88.34,109.18,122.12,133.19,148.02,158.72,172.93,189.23,204.04,219.36,229.58,247.49,258.23,273.3,292.69,300.47,314.36,325.65,345.21,356.19,367.29,389.87,397.74,411.46,423.04,444.23,452.41,465.43,484.51,497.33,507.98,522.96,537.37,553.79,566.08,581.91,595.84,610.7,624.04,637.53,649.98,663.43,681.67,698.1,709.79,718.33,734.81,751.93,761.37,775.12,790.15,803.39,818.64,833.71,847.81,88.09,105.72,123.35,132.19,151.87,161.5,177.34,186.92,201.35,216.09,230.12,245.47,255.85,273.45,285.91,303.99,315.98,325.48,343.01,360.05,373.17,381.7,398.41,412.66,423.66,443.67,450.39,468.86,483.93,499.91,511.59,529.34,541.35,550.28,568.31,584.7,592.33,615.74,622.45,639.1,651.41,668.08,679.75,692.94,708.83,720.98,734.42,747.83,762.27,778.74,790.97,806.99,820.03,831.55,844.23), group=factor(rep(c('A','B'),c(81,110)))); plot(y~x,updown,subset=x<500,col=group); คุณอาจลองใช้การแปลงแบบ Box-Cox ก่อนและดูว่ามันเหมาะสมหรือไม่และคุณอาจจะพอดีกับโมเดลกำลังสองที่ไม่เชิงเส้นด้วยฟังก์ชันลอจิสติกหรือการเชื่อมโยงแบบอะซิมโทติก ดังนั้นทำไมคุณควรเลิกใช้พารามิเตอร์แบบจำลองอย่างสมบูรณ์และถอยกลับด้วยวิธีกล่องดำเหมือนเส้นโค้งเมื่อคุณพบว่าชุดข้อมูลแบบเต็มมีลักษณะเช่นนี้ ... plot(y~x,updown,col=group); คำถามของฉันคือ: ฉันควรค้นหาคำใดเพื่อค้นหาฟังก์ชันลิงก์ที่เป็นตัวแทนของคลาสของความสัมพันธ์การทำงานนี้ หรือ ฉันควรอ่านอะไรและ …

2
การทบทวนวรรณกรรมเกี่ยวกับการถดถอยแบบไม่เชิงเส้น
ไม่มีใครรู้บทความตรวจสอบที่ดีสำหรับวรรณกรรมทางสถิติเกี่ยวกับการถดถอยแบบไม่เชิงเส้นหรือไม่? ฉันสนใจหลักในผลลัพธ์ที่สอดคล้องและ asymptotics สิ่งที่น่าสนใจเป็นพิเศษคือรูปแบบ yit=m(xit,θ)+ϵit,yit=m(xit,θ)+ϵit,y_{it} = m(x_{it},\theta) + \epsilon_{it}, สำหรับข้อมูลแผง ที่น่าสนใจน้อยกว่าคือวิธีการที่ไม่ใช่พารามิเตอร์ ข้อเสนอแนะสำหรับวารสารที่มองเข้าไปก็ยินดีต้อนรับเช่นกัน ในขณะนี้ฉันกำลังอ่าน Amemiya (1983) ในคู่มือเศรษฐมิติแต่ฉันหวังว่าจะได้รับบางสิ่งที่ทันสมัยกว่านี้ Wooldridge, JM (1996) "การประมาณค่าระบบของสมการด้วยเครื่องมือต่าง ๆ สำหรับสมการที่แตกต่างกัน" ในJournal of Econometricsเป็นตัวอย่างของการมีส่วนร่วมในภายหลังกว่าการตรวจสอบข้างต้นดังนั้นจึงไม่รวม

1
วิธีคำนวณแถบคาดคะเนสำหรับการถดถอยแบบไม่เชิงเส้น
หน้าความช่วยเหลือสำหรับปริซึมให้คำอธิบายต่อไปนี้สำหรับวิธีการคำนวณวงดนตรีทำนายสำหรับการถดถอยที่ไม่ใช่เชิงเส้น โปรดแก้ตัวอ้างนาน แต่ผมไม่ได้ดังต่อไปนี้วรรคสอง (ที่อธิบายถึงวิธีมีการกำหนดและd Y / d Pคำนวณ) ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชมอย่างมาก.G|xG|xG|xdY/dPdY/dPdY/dP การคำนวณค่าความเชื่อมั่นและการคาดคะเนนั้นค่อนข้างเป็นมาตรฐาน อ่านรายละเอียดเกี่ยวกับวิธีที่ Prism คำนวณแถบการทำนายและความมั่นใจของการถดถอยแบบไม่เชิงเส้น ก่อนอื่นเรามากำหนด G | x ซึ่งเป็นการไล่ระดับของพารามิเตอร์ที่ค่าเฉพาะของ X และใช้ค่าที่เหมาะสมที่สุดของพารามิเตอร์ ผลลัพธ์คือเวกเตอร์โดยมีหนึ่งองค์ประกอบต่อพารามิเตอร์ สำหรับแต่ละพารามิเตอร์จะถูกกำหนดเป็น dY / dP โดยที่ Y คือค่า Y ของเส้นโค้งที่ให้ค่าเฉพาะของ X และค่าพารามิเตอร์ที่ดีที่สุดและ P เป็นหนึ่งในพารามิเตอร์) G '| x เป็นเวกเตอร์ไล่ระดับสีที่ถูกย้ายดังนั้นจึงเป็นคอลัมน์แทนที่จะเป็นแถวของค่า Cov เป็นเมทริกซ์ความแปรปรวนร่วม (inversed Hessian จากการทำซ้ำครั้งล่าสุด) มันเป็นเมทริกซ์จตุรัสที่มีจำนวนแถวและคอลัมน์เท่ากับจำนวนพารามิเตอร์ แต่ละรายการในเมทริกซ์คือความแปรปรวนร่วมระหว่างสองพารามิเตอร์ ตอนนี้คำนวณ c = …

1
ปัญหาพารามิเตอร์เล็กน้อย
ฉันมักจะดิ้นรนเพื่อให้ได้แก่นแท้ที่แท้จริงของปัญหาพารามิเตอร์โดยบังเอิญ ฉันอ่านหลายครั้งว่าตัวประมาณค่าผลกระทบคงที่ของโมเดลข้อมูลแผงไม่เชิงเส้นสามารถลำเอียงอย่างรุนแรงเพราะปัญหาพารามิเตอร์ "ที่รู้จักกันดี" เมื่อฉันขอคำอธิบายที่ชัดเจนของปัญหานี้คำตอบทั่วไปคือ: สมมติว่าข้อมูลพาเนลมีบุคคล N คนในช่วงเวลา T ถ้า T ได้รับการแก้ไขเนื่องจาก N ที่เพิ่มขึ้นการประมาณค่าโควาเรียตจะกลายเป็นอคติ สิ่งนี้เกิดขึ้นเนื่องจากจำนวนของพารามิเตอร์รบกวนเพิ่มขึ้นอย่างรวดเร็วเมื่อ N เพิ่มขึ้น ฉันจะขอบคุณมาก คำอธิบายที่แม่นยำยิ่งขึ้น แต่ก็ยังง่าย (ถ้าเป็นไปได้) และ / หรือตัวอย่างที่เป็นรูปธรรมที่ฉันสามารถออกกำลังด้วย R หรือ Stata

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.