คำถามติดแท็ก logistic

โดยทั่วไปหมายถึงกระบวนการทางสถิติที่ใช้ฟังก์ชันลอจิสติกซึ่งเป็นรูปแบบต่าง ๆ ส่วนใหญ่ของการถดถอยโลจิสติก

1
ข้อมูลจากเมทริกซ์ของหมวกสำหรับการถดถอยโลจิสติก
เป็นที่ชัดเจนสำหรับฉันและอธิบายได้ดีในหลาย ๆ ไซต์ข้อมูลที่มีค่าในแนวทแยงของเมทริกซ์หมวกให้การถดถอยเชิงเส้น หมวกเมทริกซ์ของโมเดลการถดถอยแบบโลจิสติกส์นั้นชัดเจนน้อยกว่าสำหรับฉัน มันเหมือนกับข้อมูลที่คุณได้รับจากหมวกเมทริกซ์ที่ใช้การถดถอยเชิงเส้นหรือไม่? นี่คือคำจำกัดความของ hat matrix ที่ฉันพบในหัวข้ออื่นของ CV (ที่มา 1): H=VX(X′VX)−1X′VH=VX(X′VX)−1X′VH=VX ( X'V X)^-1 X' V กับ X เวกเตอร์ของตัวแปรและวีเป็นเส้นทแยงมุมกับเมทริกซ์(π(1−π))−−−−−−−−√(π(1−π))\sqrt{(π(1−π))}(1-π))} มันคือความจริงที่ว่าค่าเฉพาะของเมทริกซ์หมวกของการสังเกตนั้นยังแสดงถึงตำแหน่งของโควาเรียร์ในอวกาศ covariate และไม่มีอะไรเกี่ยวข้องกับค่าผลลัพธ์ของการสังเกตนั้นหรือไม่? นี่เขียนไว้ในหนังสือ "การวิเคราะห์ข้อมูลหมวดหมู่" ของ Agresti: ความสามารถในการสังเกตก็จะยิ่งเพิ่มมากขึ้นเท่านั้น เช่นเดียวกับในการถดถอยสามัญเลเวอเรจจะอยู่ระหว่าง 0 และ 1 และรวมกับจำนวนพารามิเตอร์โมเดล ซึ่งแตกต่างจากการถดถอยทั่วไปค่าหมวกขึ้นอยู่กับความพอดีเช่นเดียวกับแบบจำลองเมทริกซ์และจุดที่มีค่าตัวทำนายที่รุนแรงนั้นไม่จำเป็นต้องใช้ประโยชน์สูง ดังนั้นจากคำจำกัดความนี้ดูเหมือนว่าเราไม่สามารถใช้งานได้เหมือนที่เราใช้ในการถดถอยเชิงเส้นปกติ ที่มา 1: วิธีการคำนวณเมทริกซ์หมวกสำหรับการถดถอยโลจิสติกใน R?

1
การอนุมานเกี่ยวกับเอฟเฟกต์คงที่ในโมเดลเอฟเฟกต์ผสม
ฉันมีข้อมูลที่มีความสัมพันธ์กันและกำลังใช้แบบจำลองผลกระทบการถดถอยแบบโลจิสติกส์เพื่อประมาณผลกระทบระดับบุคคล (แบบมีเงื่อนไข) สำหรับการทำนายผลประโยชน์ ฉันรู้ว่าสำหรับโมเดลส่วนเพิ่มมาตรฐานการอนุมานพารามิเตอร์โมเดลโดยใช้การทดสอบ Wald นั้นสอดคล้องกับอัตราส่วนความน่าจะเป็นและการทดสอบคะแนน พวกเขามักจะประมาณเดียวกัน เนื่องจาก Wald นั้นง่ายต่อการคำนวณและพร้อมใช้งานในเอาต์พุต R ฉันจึงใช้ 99% ของเวลา อย่างไรก็ตามด้วยโมเดลเอฟเฟ็กต์แบบผสมฉันรู้สึกทึ่งที่เห็นความแตกต่างอย่างมากระหว่างการทดสอบ Wald สำหรับเอฟเฟกต์คงที่เนื่องจากมีการรายงานในโมเดลเอาท์พุทใน R และการทดสอบอัตราส่วนความน่าจะเป็น "ด้วยมือ" เหมาะสมจริงลดรูปแบบ โดยสังหรณ์ใจฉันสามารถเห็นว่าทำไมสิ่งนี้อาจสร้างความแตกต่างอย่างมากเพราะในโมเดลที่ลดลงความแปรปรวนของเอฟเฟกต์แบบสุ่มนั้นถูกประเมินใหม่และอาจส่งผลกระทบอย่างมีนัยสำคัญต่อโอกาส บางคนสามารถอธิบายได้ สถิติการทดสอบของ Wald คำนวณใน R เพื่อหาผลกระทบคงที่อย่างไร อะไรคือเมทริกซ์ข้อมูลสำหรับพารามิเตอร์โมเดลโดยประมาณในโมเดลเอฟเฟกต์ผสม? (และเป็น mx เดียวกันกับที่คำนวณสถิติการทดสอบของ Wald หรือไม่) อะไรคือความแตกต่างในการตีความระหว่างผลลัพธ์จากการทดสอบทั้งสองในกรณีที่ฉันอธิบาย โดยทั่วไปมีแรงจูงใจอะไรบ้างและนำไปใช้ในงานวรรณกรรมเพื่อการอนุมาน

3
Mundlak ใช้เอฟเฟกต์คงที่สำหรับการถดถอยโลจิสติกกับหุ่นหรือไม่
ฉันมีชุดข้อมูลที่มี 8000 คลัสเตอร์และการสังเกต 4 ล้านครั้ง น่าเสียดายที่ซอฟต์แวร์สถิติของฉัน Stata ทำงานค่อนข้างช้าเมื่อใช้ฟังก์ชันข้อมูลพาเนลสำหรับการถดถอยโลจิสติก: xtlogitแม้มีตัวอย่าง 10% อย่างไรก็ตามเมื่อใช้logitผลลัพธ์ฟังก์ชั่นที่ไม่ใช่แผงเซลล์ปรากฏเร็วกว่ามาก ดังนั้นฉันจึงอาจได้รับประโยชน์จากการใช้logitข้อมูลที่ถูกแก้ไขซึ่งมีผลกระทบคงที่ ฉันเชื่อว่ากระบวนการนี้มีชื่อว่า "Mundlak fixed effects procedure" (Mundlak, Y. 1978. การรวมกลุ่มของ Time-Series และข้อมูลข้ามส่วน Econometrica, 46 (1), 69-85) ฉันพบคำอธิบายที่เข้าใจง่ายของขั้นตอนนี้ในบทความโดยAntonakis, J. , Bendahan, S. , Jacquart, P. , & Lalive, R. (2010) ในการอ้างเหตุผล: การตรวจสอบและคำแนะนำ ความเป็นผู้นำรายไตรมาส, 21 (6) 1086-1120 ฉันพูด: วิธีหนึ่งในการแก้ไขปัญหาของเอฟเฟกต์ที่ถูกตัดออกและยังรวมถึงตัวแปรระดับ 2 คือการรวมวิธีการคลัสเตอร์ของทุกระดับ …

4
สามารถทำนายความน่าจะเป็นของการถดถอยโลจิสติกสามารถตีความเป็นความเชื่อมั่นในการจัดหมวดหมู่
เราสามารถตีความความน่าจะเป็นหลังที่ได้จากตัวจําแนกที่ส่งออกค่าคลาสที่ทำนายไว้และความน่าจะเป็น (ตัวอย่างเช่นการถดถอยโลจิสติกหรือ Naive Bayes) เป็นคะแนนความเชื่อมั่นบางอย่างที่กำหนดให้กับค่า

1
การสร้างกราฟเส้นโค้งความน่าจะเป็นสำหรับโมเดล Logit พร้อมตัวทำนายหลายตัว
ฉันมีฟังก์ชั่นความน่าจะเป็นดังต่อไปนี้: Prob=11+e−zProb=11+e−z\text{Prob} = \frac{1}{1 + e^{-z}} ที่ไหน z=B0+B1X1+⋯+BnXn.z=B0+B1X1+⋯+BnXn.z = B_0 + B_1X_1 + \dots + B_nX_n. แบบจำลองของฉันดูเหมือน Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)])Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(bid)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid})]\right)} สิ่งนี้ถูกมองเห็นผ่านเส้นโค้งความน่าจะเป็นซึ่งดูเหมือนกับด้านล่าง ฉันกำลังพิจารณาเพิ่มตัวแปรสองตัวในสมการการถดถอยเดิมของฉัน สมมติว่าฉันเพิ่มเพศ (หมวดหมู่: F และ M) และอายุ (หมวดหมู่: <25 และ> 26) ลงในโมเดลฉันท้ายด้วย: Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)+0.25×(gender)+0.15×(age)])Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(bid)+0.25×(gender)+0.15×(age)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid}) + 0.25\times(\text{gender}) + 0.15\times(\text{age})]\right)} ใน RI …

2
การวิเคราะห์ส่วนที่เหลือถดถอยโลจิสติก
คำถามนี้เป็นคำถามทั่วไปและยาวเหยียด แต่โปรดอดทนกับฉัน ในแอปพลิเคชันของฉันฉันมีชุดข้อมูลจำนวนมากแต่ละชุดประกอบด้วย ~ 20,000 ดาต้าพอยน์พร้อมด้วยคุณลักษณะ ~ 50 และตัวแปรไบนารีที่ขึ้นต่อกันเพียงตัวเดียว ฉันพยายามที่จะสร้างแบบจำลองชุดข้อมูลโดยใช้การถดถอยโลจิสติกปกติ (R package glmnet ) ในการวิเคราะห์ของฉันฉันได้สร้างแปลงที่เหลือดังนี้ สำหรับแต่ละคุณลักษณะฉันเรียงลำดับดาต้าพอยน์ตามค่าของฟีเจอร์นั้นแบ่งดาต้าพอยน์ออกเป็น 100 ถังแล้วคำนวณค่าเอาต์พุตเฉลี่ยและค่าการทำนายโดยเฉลี่ยภายในที่เก็บข้อมูลแต่ละชุด ฉันพล็อตความแตกต่างเหล่านี้ นี่คือตัวอย่างพล็อตที่เหลือ: ในพล็อตข้างต้นสถานที่มีช่วง [0,1] (มีความเข้มข้นมากที่ 1) อย่างที่คุณเห็นเมื่อค่าคุณลักษณะต่ำโมเดลจะมีอคติต่อการประเมินความเป็นไปได้ของ 1-output ตัวอย่างเช่นในที่ฝากข้อมูลด้านซ้ายสุดโมเดลจะประมาณค่าความน่าจะเป็นประมาณ 9% ด้วยข้อมูลนี้ฉันต้องการแก้ไขข้อกำหนดคุณลักษณะในลักษณะที่ตรงไปตรงมาเพื่อแก้ไขความลำเอียงนี้อย่างคร่าวๆ การเปลี่ยนแปลงเช่นการแทนที่ x→x−−√x→xx \rightarrow \sqrt{x} หรือ x→fa(x)={ax if x&lt;a elsex→fa(x)={a if x&lt;a x elsex \rightarrow f_a(x) = \cases{a & if $x<a$ \cr …

1
Logistic quantile regression - วิธีการถ่ายทอดผลลัพธ์
ในโพสต์ก่อนหน้านี้ฉันสงสัยว่าจะจัดการกับคะแนน EQ-5D ได้อย่างไร เมื่อเร็ว ๆ นี้ฉันได้พบกับการถดถอยเชิงปริมาณของโลจิสติกส์ที่Bottai และ McKeownแนะนำซึ่งนำเสนอวิธีการที่ยอดเยี่ยมในการจัดการกับผลลัพธ์ที่ถูกผูกไว้ สูตรง่าย: l o gฉันt ( y) = l o g( y- ym ฉันnYm a x- y)logit(y)=log(y−yminymax−y)logit(y)=log(\frac{y-y_{min}}{y_{max}-y}) เพื่อหลีกเลี่ยงการเข้าสู่ระบบ (0) และการหารด้วย 0 คุณขยายช่วงโดยมีค่าขนาดเล็กεสิ่งนี้ทำให้สภาพแวดล้อมที่เคารพขอบเขตของคะแนนεϵ\epsilon ปัญหาคือว่าใด ๆจะอยู่ในขนาด logit และที่ไม่ได้ทำให้รู้สึกใด ๆ เว้นแต่เปลี่ยนกลับเข้าสู่ระดับปกติ แต่นั่นหมายความว่าβจะไม่เชิงเส้น สำหรับจุดประสงค์ในการสร้างกราฟสิ่งนี้ไม่สำคัญ แต่ไม่ได้มีมากกว่าβ : s สิ่งนี้จะไม่สะดวกมากββ\betaββ\betaββ\beta คำถามของฉัน: คุณแนะนำให้รายงาน logit โดยไม่รายงานการขยายเต็มได้อย่างไรββ\beta ตัวอย่างการนำไปปฏิบัติ สำหรับการทดสอบการใช้งานฉันได้เขียนแบบจำลองโดยใช้ฟังก์ชั่นพื้นฐานนี้: outcome=β0+β1∗xtest3+β2∗sexoutcome=β0+β1∗xtest3+β2∗sexoutcome=\beta_0+\beta_1* xtest^3+\beta_2*sex β0=0β0=0\beta_0 …

2
การวิเคราะห์ค่าสัมประสิทธิ์การถดถอยโลจิสติก
นี่คือรายการของค่าสัมประสิทธิ์การถดถอยโลจิสติก (อันแรกคือการสกัดกั้น) -1059.61966694592 -1.23890500515482 -8.57185269220438 -7.50413155570413 0 1.03152408392552 1.19874787949191 -4.88083274930613 -5.77172565873336 -1.00610998453393 ฉันพบว่ามันแปลกที่การสกัดกั้นต่ำมากและฉันมีสัมประสิทธิ์ที่เท่ากับ 0 จริง ๆ แล้วฉันไม่แน่ใจว่าฉันจะตีความสิ่งนี้ได้อย่างไร 0 บ่งชี้ว่าตัวแปรที่ระบุไม่มีผลกับโมเดลเลยหรือไม่? แต่การสกัดกั้นที่เกิดขึ้นจากการใส่คอลัมน์ของคน ๆ หนึ่งนั้นสำคัญจริงๆหรือ? หรือข้อมูลของฉันเป็นเพียงอึและโมเดลไม่สามารถเหมาะสมกับมัน

4
การวิเคราะห์กำลังไฟสำหรับการถดถอยโลจิสติกอันดับ
ฉันกำลังมองหาโปรแกรม (ใน R หรือ SAS หรือสแตนด์อะโลนถ้าฟรีหรือต้นทุนต่ำ) ที่จะทำการวิเคราะห์พลังงานสำหรับการถดถอยโลจิสติกอันดับ

1
Hosmer-Lemeshow กับ AIC สำหรับการถดถอยโลจิสติก
หาก Hosmer-Lemeshow บ่งบอกถึงการขาดความพอดี แต่ AIC นั้นต่ำที่สุดในบรรดานางแบบทั้งหมด .... คุณควรจะใช้แบบจำลองนี้หรือไม่? ถ้าฉันลบตัวแปรสถิติของ Hosmer-Lemeshow นั้นไม่มีนัยสำคัญ (ซึ่งหมายความว่าไม่มีการขาดความพอดีทั้งหมด) แต่ AIC เพิ่มขึ้น แก้ไข : ฉันคิดว่าโดยทั่วไปถ้า AIC ของโมเดลที่แตกต่างกันอยู่ใกล้กัน (เช่น ) กันแล้วก็เหมือนกัน แต่ AIC นั้นแตกต่างกันมาก นี่ดูเหมือนจะบ่งบอกว่าสิ่งที่มีค่า AIC ต่ำสุดเป็นสิ่งที่ฉันควรใช้ถึงแม้ว่าการทดสอบ Hosmer-Lemeshow จะระบุเป็นอย่างอื่น&lt;2&lt;2<2 บางทีการทดสอบ HL ใช้กับตัวอย่างจำนวนมากเท่านั้นหรือ มันมีพลังงานต่ำสำหรับตัวอย่างขนาดเล็ก (ขนาดตัวอย่างของฉันคือ ~ 300) แต่ถ้าฉันได้รับผลลัพธ์ที่สำคัญ ... ซึ่งหมายความว่าแม้จะใช้พลังงานต่ำฉันก็จะถูกปฏิเสธ มันจะสร้างความแตกต่างถ้าฉันใช้ AICc กับ AIC หรือไม่? คุณจะได้รับ AICc ใน SAS …

3
ฉันจะได้อะไรถ้าฉันพิจารณาผลลัพธ์เป็นลำดับแทนที่จะเป็นหมวดหมู่?
มีวิธีการที่แตกต่างกันสำหรับการทำนายของตัวแปรลำดับและตัวแปรเด็ดขาด สิ่งที่ฉันไม่เข้าใจคือความแตกต่างนี้สำคัญอย่างไร มีตัวอย่างง่าย ๆ ที่สามารถบอกได้ชัดเจนว่าเกิดอะไรขึ้นถ้าฉันสั่งออเดอร์? ภายใต้สถานการณ์ใดมันไม่สำคัญ? ตัวอย่างเช่นหากตัวแปรอิสระทุกหมวดหมู่ / ลำดับก็จะมีความแตกต่าง? คำถามที่เกี่ยวข้องนี้มุ่งเน้นไปที่ประเภทของตัวแปรอิสระ ที่นี่ฉันถามเกี่ยวกับตัวแปรผลลัพธ์ แก้ไข: ฉันเห็นจุดที่ใช้โครงสร้างคำสั่งซื้อเพื่อลดจำนวนพารามิเตอร์โมเดล แต่ฉันก็ยังไม่มั่นใจจริงๆ นี่คือตัวอย่าง (นำมาจากบทนำสู่การถดถอยโลจิสติกที่ได้รับคำสั่งซึ่งเท่าที่ฉันสามารถเห็นการถดถอยโลจิสติกอันดับไม่ดีกว่าการถดถอยโลจิสติกพหุนาม library(nnet) library(MASS) gradapply &lt;- read.csv(url("http://www.ats.ucla.edu/stat/r/dae/ologit.csv"), colClasses=c("factor", "factor", "factor", "numeric")) ordered_result &lt;- function() { train_rows &lt;- sample(nrow(gradapply), round(nrow(gradapply)*0.9)) train_data &lt;- gradapply[train_rows,] test_data &lt;- gradapply[setdiff(1:nrow(gradapply), train_rows),] m &lt;- polr(apply~pared+gpa, data=train_data) pred &lt;- predict(m, test_data) return(sum(pred==test_data$apply)) } …

5
การจำแนกประเภทที่ดีกว่าของค่าเริ่มต้นในการถดถอยโลจิสติก
การเปิดเผยแบบเต็ม: นี่คือการบ้าน ฉันได้รวมลิงก์ไปยังชุดข้อมูล ( http://www.bertelsen.ca/R/logistic-regression.sav ) เป้าหมายของฉันคือการเพิ่มการคาดการณ์ของผู้ชำระหนี้ในชุดข้อมูลนี้ ทุกรุ่นที่ฉันคิดมานั้นคาดการณ์&gt; 90% ของผู้ไม่ defaulters แต่ &lt;40% ของผู้ defaulters ทำให้ประสิทธิภาพการจำแนกโดยรวมประมาณ 80% ดังนั้นฉันสงสัยว่ามีผลกระทบระหว่างการโต้ตอบตัวแปรหรือไม่ ภายในการถดถอยแบบโลจิสติกส์นอกเหนือจากการทดสอบชุดค่าผสมที่เป็นไปได้แต่ละวิธีมีวิธีการระบุผลกระทบที่อาจเกิดขึ้นจากการโต้ตอบ หรืออีกวิธีหนึ่งในการเพิ่มประสิทธิภาพของการจำแนกประเภทของ defaulters ฉันติดอยู่คำแนะนำใด ๆ จะเป็นประโยชน์ในการเลือกคำ R-code หรือไวยากรณ์ SPSS ของคุณ ตัวแปรหลักของฉันอยู่ในฮิสโทแกรมและสแกตเตอร์ล็อตต่อไปนี้ (ยกเว้นตัวแปร dichotomous) คำอธิบายของตัวแปรหลัก: age: Age in years employ: Years with current employer address: Years at current address income: Household income in …
12 r  logistic  spss  self-study 

4
วิธีการใช้วิธีกำลังสองน้อยที่สุด (IRLS) ที่ได้รับผลตอบแทนซ้ำกับโมเดล LASSO อย่างไร
ฉันมีโปรแกรมถดถอยโลจิสติกโดยใช้อัลกอริทึม IRLS ฉันต้องการใช้การลงโทษ LASSOเพื่อเลือกคุณสมบัติที่ถูกต้องโดยอัตโนมัติ ในการวนซ้ำแต่ละครั้งจะมีการแก้ไขดังต่อไปนี้: (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} ให้เป็นจำนวนจริงที่ไม่ลบ ฉันไม่ได้ทำการลงโทษดักตามที่แนะนำในองค์ประกอบของ การเรียนรู้ทางสถิติ เหมือนกันสำหรับสัมประสิทธิ์เป็นศูนย์อยู่แล้ว มิฉะนั้นฉันจะลบคำหนึ่งออกจากด้านขวา:λλ\lambda XT(y−p)−λ×sign(β^)XT(y−p)−λ×sign(β^)\mathbf{X^T\left(y-p\right)-\lambda\times \mathrm{sign}\left(\hat\beta\right)} อย่างไรก็ตามฉันไม่แน่ใจเกี่ยวกับการปรับเปลี่ยนอัลกอริทึม IRLS มันเป็นวิธีที่ถูกต้องหรือไม่ แก้ไข: แม้ว่าฉันไม่มั่นใจเกี่ยวกับเรื่องนี้ แต่นี่เป็นหนึ่งในวิธีแก้ปัญหาที่ฉันได้รับในที่สุด สิ่งที่น่าสนใจคือโซลูชันนี้สอดคล้องกับสิ่งที่ฉันเข้าใจเกี่ยวกับ LASSO ในขณะนี้ แน่นอนว่ามีสองขั้นตอนในการทำซ้ำแต่ละครั้งแทนที่จะเป็นเพียงขั้นตอนเดียว: ขั้นตอนแรกเหมือนกับเมื่อก่อน: เราทำการวนซ้ำของอัลกอริทึม (ราวกับว่าในสูตรสำหรับการไล่ระดับสีด้านบน)λ=0λ=0\lambda=0 ขั้นตอนที่สองคือขั้นตอนใหม่: เราใช้ซอฟต์ในแต่ละองค์ประกอบ (ยกเว้น componentซึ่งสอดคล้องกับการสกัดกั้น) ของ vectorได้รับในขั้นตอนแรก นี้เรียกว่าซ้ำอ่อน Thresholding อัลกอริทึมβ0β0\beta_0ββ\beta ∀i≥1,βi←sign(βi)×max(0,|βi|−λ)∀i≥1,βi←sign(βi)×max(0,|βi|−λ)\forall i \geq 1, \beta_{i}\leftarrow\mathrm{sign}\left(\beta_{i}\right)\times\max\left(0,\,\left|\beta_{i}\right|-\lambda\right)

1
การจัดการแบบจำลองการถดถอยโลจิสติก
ฉันต้องการเข้าใจว่าโค้ดต่อไปนี้กำลังทำอะไร คนที่เขียนรหัสไม่สามารถใช้งานได้ที่นี่อีกต่อไปและเกือบจะไม่มีเอกสารทั้งหมด ฉันถูกขอให้ตรวจสอบโดยคนที่คิดว่า " เป็นแบบจำลองการถดถอยโลจิสติกแบบเบย์ " bglm &lt;- function(Y,X) { # Y is a vector of binary responses # X is a design matrix fit &lt;- glm.fit(X,Y, family = binomial(link = logit)) beta &lt;- coef(fit) fs &lt;- summary.glm(fit) M &lt;- t(chol(fs$cov.unscaled)) betastar &lt;- beta + M %*% rnorm(ncol(M)) p &lt;- …

2
วิธีการรวมผลลัพธ์ของการถดถอยโลจิสติกและฟอเรสต์แบบสุ่ม
ฉันยังใหม่กับการเรียนรู้ของเครื่อง ฉันใช้การถดถอยโลจิสติกและฟอเรสต์แบบสุ่มบนชุดข้อมูลเดียวกัน ดังนั้นฉันจึงได้รับความสำคัญของตัวแปร (สัมประสิทธิ์สัมบูรณ์สำหรับการถดถอยโลจิสติกและความสำคัญของตัวแปรสำหรับฟอเรสต์แบบสุ่ม) ฉันกำลังคิดที่จะรวมสองสิ่งนี้เข้าด้วยกันเพื่อให้ได้ตัวแปรที่มีความสำคัญขั้นสุดท้าย ใครสามารถแบ่งปันประสบการณ์ของเขา / เธอ? ฉันได้ตรวจสอบการบรรจุถุงการส่งเสริมการสร้างแบบจำลองชุด แต่ไม่ใช่สิ่งที่ฉันต้องการ พวกเขารวมข้อมูลสำหรับรุ่นเดียวกันในแบบจำลองมากกว่า สิ่งที่ฉันกำลังมองหาคือการรวมผลของหลายรุ่น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.