คำถามติดแท็ก logit

โดยทั่วไปหมายถึงขั้นตอนทางสถิติที่ใช้ฟังก์ชันโลจิสติกส์ซึ่งส่วนใหญ่มักเป็นรูปแบบต่างๆของการถดถอยโลจิสติกส์

5
วิธีจัดการกับข้อมูลแบบลำดับชั้น / ซ้อนในการเรียนรู้ของเครื่อง
ฉันจะอธิบายปัญหาด้วยตัวอย่าง สมมติว่าคุณต้องการที่จะทำนายรายได้ของแต่ละบุคคลที่มีคุณลักษณะบางอย่าง: {อายุ, เพศ, ประเทศ, ภูมิภาค, เมือง} คุณมีชุดข้อมูลการฝึกอบรมเช่นนั้น train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

2
ค่า logit จริงหมายถึงอะไร
ฉันมีโมเดล logit ซึ่งมีตัวเลขระหว่าง 0 ถึง 1 ในหลาย ๆ กรณี แต่เราจะ interprete นี้ได้อย่างไร ใช้กรณีกับ logit ของ 0.20 เราสามารถยืนยันได้หรือไม่ว่ามีความเป็นไปได้ 20% ที่กรณีเป็นของกลุ่ม B กับกลุ่ม A? นั่นเป็นวิธีที่ถูกต้องในการตีความค่า logit หรือไม่

1
ความแตกต่างระหว่างการถดถอยโลจิสติกและ Logit คืออะไร?
ความแตกต่างระหว่างการถดถอยโลจิสติกและ Logit คืออะไร? ฉันเข้าใจว่าพวกเขาเหมือนกัน (หรือแม้กระทั่งสิ่งเดียวกัน) แต่มีคนอธิบายความแตกต่างระหว่างสองสิ่งนี้ได้ไหม เป็นเรื่องเกี่ยวกับอัตราต่อรองหรือไม่

3
การถดถอยเชิงเส้นของล็อกเทียบกับการถดถอยโลจิสติก
ใครสามารถให้รายการที่ชัดเจนของความแตกต่างระหว่างการถดถอยเชิงเส้นและการถดถอยโลจิสติก? ฉันเข้าใจว่าอดีตเป็นรูปแบบการถดถอยเชิงเส้นอย่างง่าย แต่ฉันไม่ชัดเจนว่าเมื่อใดควรใช้แต่ละอัน

3
วิธีการตั้งค่าและประเมินโมเดล logom แบบมัลติโนเมียลใน R
ฉันใช้โมเดล login แบบหลายมิติใน JMP และได้ผลลัพธ์กลับมาซึ่งรวมถึง AIC และค่า p-chi-squared สำหรับการประมาณพารามิเตอร์แต่ละตัว แบบจำลองมีผลลัพธ์เด็ดขาดหนึ่งรายการและมีคำอธิบายอย่างละเอียด 7 ข้อ ฉันพอดีกับสิ่งที่ฉันคิดว่าจะสร้างรูปแบบเดียวกันใน R โดยใช้multinomฟังก์ชั่นในแพ็คเกจnnet รหัสนั้นเป็นพื้น: fit1 <- multinom(y ~ x1+x2+...xn,data=mydata); summary(fit1); อย่างไรก็ตามทั้งสองให้ผลลัพธ์ที่แตกต่าง ด้วย JMP AIC คือ 2923.21 และnnet::multinomAIC คือ 3116.588 ดังนั้นคำถามแรกของฉันคือ: หนึ่งในรุ่นผิดหรือเปล่า? สิ่งที่สองคือ JMP ให้ค่า chi-squared สำหรับการประมาณการพารามิเตอร์แต่ละครั้งซึ่งฉันต้องการ การสรุปผลการทำงานบน multinom fit1ไม่ได้ - เพียงแค่ให้ค่าประมาณ, AIC และ Deviance คำถามที่สองของฉันคือ: มีวิธีรับค่า p สำหรับแบบจำลองและการประมาณค่าเมื่อใช้nnet::multinomหรือไม่ …
20 r  logistic  multinomial  logit  jmp 

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 


2
วิธีการตีความค่าสัมประสิทธิ์จากการถดถอยโลจิสติก?
ฉันมีฟังก์ชั่นความน่าจะเป็นดังต่อไปนี้: Prob = 11 + e- zprob=11+อี-Z\text{Prob} = \frac{1}{1 + e^{-z}} ที่ไหน Z= B0+ B1X1+ ⋯ + BnXn.Z=B0+B1X1+⋯+BnXn.z = B_0 + B_1X_1 + \dots + B_nX_n. แบบจำลองของฉันดูเหมือน ราคา ( Y= 1 ) = 11 + ประสบการณ์( - [ - 3.92 +) 0.014 × ( เพศ) ] )ราคา(Y=1)=11+ประสบการณ์⁡(-[-3.92+0.014×(เพศ)])\Pr(Y=1) = \frac{1}{1 + …

3
อัลกอริทึมการเพิ่มประสิทธิภาพใดที่ใช้ในฟังก์ชัน glm ใน R
หนึ่งสามารถทำการถดถอย logit ใน R โดยใช้รหัสดังกล่าว: > library(MASS) > data(menarche) > glm.out = glm(cbind(Menarche, Total-Menarche) ~ Age, + family=binomial(logit), data=menarche) > coefficients(glm.out) (Intercept) Age -21.226395 1.631968 ดูเหมือนว่าอัลกอริทึมการออปติไมซ์ได้แปรสภาพ - มีข้อมูลเกี่ยวกับจำนวนขั้นตอนของอัลกอริทึมการให้คะแนนฟิชเชอร์: Call: glm(formula = cbind(Menarche, Total - Menarche) ~ Age, family = binomial(logit), data = menarche) Deviance Residuals: Min 1Q Median 3Q Max …

1
ค่าสัมประสิทธิ์เชิงลบในการถดถอยโลจิสติกสั่ง
สมมติว่าเรามีการตอบสนองลำดับy:{Bad, Neutral, Good}→{1,2,3}y:{Bad, Neutral, Good}→{1,2,3}y:\{\text{Bad, Neutral, Good}\} \rightarrow \{1,2,3\}และชุดของตัวแปรX:=[x1,x2,x3]X:=[x1,x2,x3]X:=[x_1,x_2,x_3]ที่เราคิดว่าจะอธิบายYจากนั้นเราจะทำการถดถอยโลจิสติกสั่งของ (เมทริกซ์การออกแบบ) ใน (การตอบสนอง)yyyXXXyyy สมมติว่าค่าสัมประสิทธิ์ประมาณx1x1x_1เรียกว่าเบต้า 1ในสั่งการถดถอยโลจิสติกคือ- 0.5 ฉันจะตีความอัตราเดิมพัน (OR) ของe - 0.5 = 0.607 ได้อย่างไรβ^1β^1\hat{\beta}_1−0.5−0.5-0.5e−0.5=0.607e−0.5=0.607e^{-0.5} = 0.607 ฉันพูดว่า "สำหรับการเพิ่มขึ้น 1 หน่วยในx1x1x_1 , ceteris paribus ต่อรองในการสังเกตGoodGood\text{Good}เป็นครั้งต่อรองในการสังเกตและเปลี่ยนแปลงเดียวกันในที่ โอกาสของการสังเกต\ text {เป็นกลาง} \ cup \ text {ดี}คือ0.607เท่าของการสังเกต\ text {Bad} "0.6070.6070.607Bad∪NeutralBad∪Neutral\text{Bad}\cup \text{Neutral}x1x1x_1Neutral∪GoodNeutral∪Good\text{Neutral} \cup \text{Good}0.6070.6070.607BadBad\text{Bad} ฉันไม่พบตัวอย่างของการตีความสัมประสิทธิ์เชิงลบในหนังสือเรียนหรือ Google

2
การคำนวณช่วงความมั่นใจสำหรับการถดถอยโลจิสติก
ฉันใช้การถดถอยโลจิสติกแบบทวินามเพื่อระบุว่าการสัมผัสhas_xหรือhas_yส่งผลกระทบต่อโอกาสที่ผู้ใช้จะคลิกบนบางสิ่ง โมเดลของฉันมีดังต่อไปนี้: fit = glm(formula = has_clicked ~ has_x + has_y, data=df, family = binomial()) นี่คือผลลัพธ์จากรุ่นของฉัน: Call: glm(formula = has_clicked ~ has_x + has_y, family = binomial(), data = active_domains) Deviance Residuals: Min 1Q Median 3Q Max -0.9869 -0.9719 -0.9500 1.3979 1.4233 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) …

3
วิธีการทดสอบความเท่าเทียมกันพร้อมกันของสัมประสิทธิ์เลือกใน logit หรือ probit model?
วิธีการทดสอบความเท่าเทียมกันพร้อมกันของสัมประสิทธิ์เลือกใน logit หรือ probit model? วิธีมาตรฐานคืออะไรและสถานะของศิลปะคืออะไร?

2
ทำไมต้องใช้ลิงค์ logit ในการถดถอยเบต้า
เมื่อเร็ว ๆ นี้ฉันมีความสนใจในการใช้รูปแบบการถดถอยเบต้าสำหรับผลลัพธ์ที่เป็นสัดส่วน โปรดทราบว่าผลลัพธ์นี้จะไม่สอดคล้องกับบริบททวินามเนื่องจากไม่มีแนวคิดที่มีความหมายของ "ความสำเร็จ" ที่ไม่ต่อเนื่องในบริบทนี้ ในความเป็นจริงผลลัพธ์ที่ได้เป็นสัดส่วนของระยะเวลา ตัวเศษเป็นจำนวนวินาทีในขณะที่เงื่อนไขบางอย่างมีการใช้งานมากกว่าจำนวนวินาทีทั้งหมดซึ่งเงื่อนไขนั้นมีสิทธิ์ที่จะใช้งานได้ ฉันขอโทษสำหรับคนจรจัด แต่ฉันไม่ต้องการที่จะให้ความสำคัญกับบริบทที่แม่นยำนี้เพราะฉันรู้ว่ามีหลายวิธีที่กระบวนการดังกล่าวสามารถสร้างแบบจำลองนอกเหนือจากการถดถอยแบบเบต้าและตอนนี้ฉันสนใจเฉพาะทางทฤษฎีมากขึ้น คำถามที่เกิดขึ้นในความพยายามของฉันที่จะใช้รูปแบบดังกล่าว (แน่นอนว่าฉันเป็น ไม่ว่าในกรณีใดทรัพยากรทั้งหมดที่ฉันสามารถค้นหาได้ระบุว่าการถดถอยแบบเบต้ามักจะเหมาะสมกับการใช้ลิงค์ logit (หรือ probit / cloglog) และพารามิเตอร์ตีความว่าเป็นการเปลี่ยนแปลงของอัตราต่อรอง อย่างไรก็ตามฉันยังไม่พบการอ้างอิงที่ให้เหตุผลใด ๆ จริง ๆ ว่าเพราะเหตุใดจึงต้องการใช้ลิงก์นี้ กระดาษ Ferrari และ Cribari-Neto (2004) ต้นฉบับไม่ได้ให้เหตุผลอะไรเลย พวกเขาทราบเพียงว่าฟังก์ชั่น logit นั้น "มีประโยชน์อย่างยิ่ง" เนื่องจากการตีความอัตราส่วนอัตราต่อรองของพารามิเตอร์แบบเอ็กซ์โปเนนเชียล แหล่งข้อมูลอื่นอ้างถึงความปรารถนาในการแมปจากช่วงเวลา (0,1) ไปยังเส้นจริง อย่างไรก็ตามเราจำเป็นต้องมีฟังก์ชั่นลิงก์สำหรับการทำแผนที่ดังกล่าวหรือไม่เนื่องจากเราสมมติว่ามีการแจกแจงเบต้าอยู่แล้ว ฟังก์ชั่นการเชื่อมโยงมีประโยชน์อะไรบ้างที่มีให้เหนือกว่าข้อ จำกัด ที่กำหนดโดยสมมติว่าการกระจายเบต้าเริ่มต้นด้วย?ฉันใช้การจำลองอย่างรวดเร็วสองสามครั้งและไม่ได้เห็นการคาดการณ์นอกช่วง (0,1) ด้วยลิงก์ตัวตนแม้ว่าจะจำลองจากการแจกแจงแบบเบต้าซึ่งมวลความน่าจะเป็นกระจุกอยู่ใกล้กับ 0 หรือ 1 แต่บางทีแบบจำลองของฉัน ยังไม่กว้างพอที่จะตรวจพบโรคบางอย่าง ดูเหมือนว่าฉันจะขึ้นอยู่กับว่าแต่ละบุคคลในทางปฏิบัติตีความพารามิเตอร์ประมาณการจากตัวแบบการถดถอยเบต้า …

1
แพคเกจ GBM กับ Caret ใช้ GBM
ฉันเคยใช้การจูนโมเดลcaretแต่แล้วก็รันโมเดลอีกครั้งโดยใช้gbmแพ็คเกจ ฉันเข้าใจว่าcaretแพ็กเกจที่ใช้gbmและเอาต์พุตควรเหมือนกัน อย่างไรก็ตามการทดสอบการทำงานอย่างรวดเร็วโดยใช้data(iris)แสดงความแตกต่างในรูปแบบประมาณ 5% โดยใช้ RMSE และ R ^ 2 เป็นตัวชี้วัดการประเมินผล ฉันต้องการค้นหาประสิทธิภาพของแบบจำลองที่ดีที่สุดโดยใช้caretแต่เรียกใช้อีกครั้งgbmเพื่อใช้ประโยชน์จากแผนการพึ่งพาบางส่วน รหัสด้านล่างสำหรับการทำซ้ำ คำถามของฉันจะเป็น: 1) เหตุใดฉันจึงเห็นความแตกต่างระหว่างแพ็คเกจทั้งสองนี้ถึงแม้ว่าพวกเขาจะเหมือนกัน (ฉันเข้าใจว่าพวกมันสุ่ม แต่ 5% ค่อนข้างแตกต่างกันมากโดยเฉพาะอย่างยิ่งเมื่อฉันไม่ได้ใช้ชุดข้อมูลที่ดีirisสำหรับการสร้างแบบจำลองของฉัน) . 2) มีข้อดีหรือข้อเสียในการใช้ทั้งสองแพคเกจหรือไม่ 3) ไม่เกี่ยวข้อง: การใช้irisชุดข้อมูลที่ดีที่สุดinteraction.depthคือ 5 แต่สูงกว่าที่ฉันได้อ่านควรจะใช้สูงสุดfloor(sqrt(ncol(iris)))ซึ่งควรจะเป็น 2 นี่เป็นกฎง่ายๆหรือเข้มงวดหรือไม่? library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric …

1
การถดถอยโลจิสติกอันดับใน Python
ฉันต้องการเรียกใช้การถดถอยแบบลอจิสติกอันดับใน Python สำหรับตัวแปรตอบกลับที่มีสามระดับและมีปัจจัยที่อธิบายน้อย statsmodelsแพคเกจสนับสนุน logit ไบนารีและ logit พหุนาม (MNLogit) รุ่น แต่ไม่ได้รับคำสั่ง logit เนื่องจากคณิตศาสตร์พื้นฐานไม่แตกต่างกันฉันจึงสงสัยว่ามันสามารถนำไปใช้งานได้อย่างง่ายดายโดยใช้สิ่งเหล่านี้หรือไม่ (อีกทางหนึ่งคือแพ็คเกจ Python อื่น ๆ ที่ใช้งานได้)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.