คำถามติดแท็ก logistic

โดยทั่วไปหมายถึงกระบวนการทางสถิติที่ใช้ฟังก์ชันลอจิสติกซึ่งเป็นรูปแบบต่าง ๆ ส่วนใหญ่ของการถดถอยโลจิสติก

1
แบบจำลองเชิงเส้นแบบไม่เชิงเส้นกับแบบเชิงเส้นทั่วไป: คุณอ้างถึงการถดถอยแบบลอจิสติกปัวซอง ฯลฯ อย่างไร
ฉันมีคำถามเกี่ยวกับความหมายที่ฉันต้องการความคิดเห็นของนักสถิติเพื่อน เรารู้ว่าแบบจำลองต่างๆเช่นโลจิสติกปัวซอง ฯลฯ ตกอยู่ภายใต้ร่มของตัวแบบเชิงเส้นทั่วไป ตัวแบบมีฟังก์ชั่นไม่เชิงเส้นของพารามิเตอร์ซึ่งอาจถูกจำลองโดยใช้เฟรมเวิร์กโมเดลเชิงเส้นโดยใช้ฟังก์ชันลิงก์ที่เหมาะสม ฉันสงสัยว่าถ้าคุณพิจารณาสถานการณ์ (สอน?) เช่นการถดถอยโลจิสติกเป็น: แบบไม่เชิงเส้นกำหนดรูปแบบของพารามิเตอร์ โมเดลเชิงเส้นเนื่องจากลิงก์เปลี่ยนเราเป็นเฟรมเวิร์กโมเดลเชิงเส้น พร้อมกัน (1) และ (2): มัน "เริ่มต้น" เป็นโมเดลที่ไม่ใช่เชิงเส้น แต่อาจทำงานด้วยวิธีที่ทำให้เราคิดว่ามันเป็นโมเดลเชิงเส้น หวังว่าฉันจะสามารถตั้งค่าแบบสำรวจที่แท้จริง ...

2
เหตุใดจึงมีการกำหนด / การสูญเสียข้อมูลสองรายการที่แตกต่างกันในโลจิสติกส์
ฉันได้เห็นสูตรการสูญเสียโลจิสติกสองประเภท เราสามารถแสดงให้พวกเขามีความเหมือนที่แตกต่างเพียงอย่างเดียวคือความหมายของฉลากYyyy สูตร / สัญกรณ์ 1, :y∈{0,+1}y∈{0,+1}y \in \{0, +1\} L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) โดยที่โดยที่ฟังก์ชันโลจิสติกแมปจำนวนจริงเป็น 0,1 ช่วงเวลาp=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)}βTxβTx\beta^T x สูตร / สัญกรณ์ 2, :y∈{−1,+1}y∈{−1,+1}y \in \{-1, +1\} L(y,βTx)=log(1+exp(−y⋅βTx))L(y,βTx)=log⁡(1+exp⁡(−y⋅βTx)) L(y,\beta^Tx)=\log(1+\exp{(-y\cdot \beta^Tx})) การเลือกสัญกรณ์ก็เหมือนกับการเลือกภาษามีข้อดีข้อเสียที่จะใช้อย่างใดอย่างหนึ่ง ข้อดีและข้อเสียของเครื่องหมายทั้งสองนี้คืออะไร ความพยายามของฉันที่จะตอบคำถามนี้คือดูเหมือนว่าชุมชนสถิติชอบสัญกรณ์แรกและชุมชนวิทยาศาสตร์คอมพิวเตอร์ชอบสัญกรณ์ที่สอง สัญกรณ์แรกสามารถอธิบายได้ด้วยคำว่า "ความน่าจะเป็น" เนื่องจากฟังก์ชันโลจิสติกจะแปลงจำนวนจริงเป็นช่วงเวลา 0,1βTxβTx\beta^Tx และสัญกรณ์ที่สองนั้นรัดกุมกว่าและง่ายกว่าที่จะเปรียบเทียบกับการสูญเสียบานพับหรือการสูญเสีย 0-1 ฉันถูกไหม? ข้อมูลเชิงลึกอื่น ๆ

1
การตีความตัวแปรแฝงของตัวแบบเชิงเส้นทั่วไป (GLM)
เวอร์ชั่นสั้น: เรารู้ว่าการถดถอยโลจิสติกและการถดถอยแบบ probit สามารถตีความได้ว่าเกี่ยวข้องกับตัวแปรแฝงอย่างต่อเนื่องที่ได้รับการแยกตามเกณฑ์คงที่บางส่วนก่อนที่จะสังเกต การตีความตัวแปรแฝงที่คล้ายกันมีให้สำหรับการพูดการถดถอยของปัวซองหรือไม่ วิธีการเกี่ยวกับการถดถอยแบบทวินาม (เช่น logit หรือ probit) เมื่อมีผลลัพธ์ที่ไม่ต่อเนื่องกันมากกว่าสองรายการ ในระดับทั่วไปส่วนใหญ่มีวิธีการตีความ GLM ใด ๆ ในแง่ของตัวแปรแฝงหรือไม่? รุ่นยาว: วิธีมาตรฐานในการสร้างแรงจูงใจให้กับโมเดล probit สำหรับผลลัพธ์ไบนารี (เช่นจาก Wikipedia ) มีดังต่อไปนี้ เรามีไม่มีใครสังเกต / แฝงผลตัวแปรที่มีการกระจายตามปกติเงื่อนไขในการทำนายXตัวแปรแฝงนี้อยู่ภายใต้กระบวนการ thresholding เพื่อให้ผลที่ไม่ต่อเนื่องเราจริงสังเกตคือถ้า ,ถ้า<\ สิ่งนี้นำไปสู่ความน่าจะเป็นของให้เพื่อให้อยู่ในรูปแบบของ CDF ปกติพร้อมค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานฟังก์ชันของ thresholdและความชันของการถดถอยของบนX U = 1 Y ≥ γ U = 0 Y < γ U = 1 X …

2
การเพิ่มน้ำหนักให้กับการถดถอยโลจิสติกสำหรับข้อมูลที่ไม่สมดุล
ฉันต้องการสร้างแบบจำลองการถดถอยโลจิสติกด้วยข้อมูลที่ไม่สมดุล (9: 1) ฉันต้องการลองใช้ตัวเลือกตุ้มน้ำหนักในglmฟังก์ชันใน R แต่ฉันไม่แน่ใจ 100% ว่ามันทำอะไร c(0,0,0,0,0,0,0,0,0,1)ช่วยบอกตัวแปรเอาท์พุทของฉันคือ ตอนนี้ฉันต้องการเพิ่มน้ำหนัก "1" 10 เท่า weights=c(1,1,1,1,1,1,1,1,1,1,1,10)ดังนั้นผมจึงให้น้ำหนักการโต้แย้ง เมื่อฉันทำเช่นนั้นมันจะได้รับการพิจารณาในการคำนวณความเป็นไปได้สูงสุด ฉันถูกไหม? การจำแนกประเภทของ "1" นั้นแย่กว่านั้นเพียง 10 เท่าจากนั้นการจัดประเภทผิดพลาดเป็น "0"

1
การตีความประมาณการของการถดถอยโลจิสติก cloglog
ใครช่วยแนะนำฉันเกี่ยวกับวิธีการตีความประมาณการจากการถดถอยโลจิสติกโดยใช้ลิงค์ cloglog? ฉันได้ติดตั้งโมเดลต่อไปนี้ในlme4: glm(cbind(dead, live) ~ time + factor(temp) * biomass, data=mussel, family=binomial(link=cloglog)) ตัวอย่างเช่นเวลาโดยประมาณคือ 0.015 ถูกต้องหรือไม่ที่จะบอกว่าอัตราต่อรองของการตายต่อหน่วยเวลาคูณด้วย exp (0.015) = 1.015113 (เพิ่มขึ้น 1.5% ต่อหน่วยเวลา) กล่าวอีกนัยหนึ่งคือการประมาณค่าที่ได้รับใน cloglog ที่แสดงในอัตราต่อรองของล็อกเช่นเดียวกับกรณีของการถดถอยโลจิสติก logit หรือไม่?

3
จากกฎ Perceptron ไปยัง Gradient Descent: Perceptrons ที่มีฟังก์ชั่นการเปิดใช้งาน sigmoid แตกต่างจาก Logistic Regression อย่างไร
โดยพื้นฐานแล้วคำถามของฉันคือใน Multilayer Perceptrons, Perceptrons นั้นใช้กับฟังก์ชั่นการเปิดใช้งาน sigmoid ดังนั้นในการอัปเดตกฎจะถูกคำนวณดังนี้y^y^\hat{y} y^=11+exp(−wTxi)y^=11+exp⁡(−wTxi)\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)} Perceptron "sigmoid" นี้แตกต่างจากการถดถอยโลจิสติกอย่างไร ฉันจะบอกว่า sigmoid perceptron ชั้นเดียวเทียบเท่ากับการถดถอยโลจิสติกในแง่ที่ว่าทั้งสองใช้ในกฎการอัพเดท นอกจากนี้ทั้งสองส่งกลับในการทำนาย อย่างไรก็ตามในมัลติเลเยอร์ Perceptrons ฟังก์ชั่นการเปิดใช้งาน sigmoid จะใช้เพื่อคืนความน่าจะเป็นไม่ใช่สัญญาณเปิดปิดในทางตรงกันข้ามกับการถดถอยโลจิสติกและ perceptron ชั้นเดียวy^=11+exp(−wTxi)y^=11+exp⁡(−wTxi)\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)}sign(y^=11+exp(−wTxi))sign⁡(y^=11+exp⁡(−wTxi))\operatorname{sign}(\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)}) ฉันคิดว่าการใช้คำว่า "Perceptron" อาจจะคลุมเครือเล็กน้อยดังนั้นให้ฉันให้พื้นหลังตามความเข้าใจในปัจจุบันของฉันเกี่ยวกับ perceptrons ชั้นเดียว: กฎ Perceptron แบบคลาสสิก ประการแรกคลาสสิก perceptron โดย F. Rosenblatt ที่เรามีฟังก์ชั่นขั้นตอน: Δ wd= η( yผม- yผม^) xฉันdYผม, yผม^∈ …

1
ความแตกต่างระหว่างการถดถอยโลจิสติกและ Logit คืออะไร?
ความแตกต่างระหว่างการถดถอยโลจิสติกและ Logit คืออะไร? ฉันเข้าใจว่าพวกเขาเหมือนกัน (หรือแม้กระทั่งสิ่งเดียวกัน) แต่มีคนอธิบายความแตกต่างระหว่างสองสิ่งนี้ได้ไหม เป็นเรื่องเกี่ยวกับอัตราต่อรองหรือไม่

1
การเลือกรูปแบบที่มีการถดถอยโลจิสติก Firth
ในชุดข้อมูลขนาดเล็ก ( ) ที่ฉันทำงานกับหลายตัวแปรให้ฉันที่สมบูรณ์แบบการทำนาย / แยก ฉันจึงใช้การถดถอยโลจิสติก Firthเพื่อจัดการกับปัญหาn∼100n∼100n\sim100 หากฉันเลือกแบบจำลองที่ดีที่สุดโดยAICหรือBICฉันควรรวมคำว่าโทษ Firth ไว้ในความน่าจะเป็นเมื่อคำนวณเกณฑ์ข้อมูลเหล่านี้หรือไม่

2
วิธีการใช้ binomial GLMM (glmer) กับเปอร์เซ็นต์แทนที่จะเป็นจำนวนใช่หรือไม่?
ฉันมีการทดสอบซ้ำหลายครั้งโดยที่ตัวแปรตามคือร้อยละและฉันมีหลายปัจจัยเป็นตัวแปรอิสระ ฉันต้องการใช้glmerจากแพ็คเกจ R lme4เพื่อจัดการกับปัญหาการถดถอยโลจิสติก (โดยระบุfamily=binomial) เนื่องจากดูเหมือนว่าจะรองรับการตั้งค่านี้โดยตรง ข้อมูลของฉันมีลักษณะเช่นนี้: > head(data.xvsy) foldnum featureset noisered pooldur dpoolmode auc 1 0 mfcc-ms nr0 1 mean 0.6760438 2 1 mfcc-ms nr0 1 mean 0.6739482 3 0 melspec-maxp nr075 1 max 0.8141421 4 1 melspec-maxp nr075 1 max 0.7822994 5 0 chrmpeak-tpor1d nr075 1 max 0.6547476 …

3
การถดถอยเชิงเส้นของล็อกเทียบกับการถดถอยโลจิสติก
ใครสามารถให้รายการที่ชัดเจนของความแตกต่างระหว่างการถดถอยเชิงเส้นและการถดถอยโลจิสติก? ฉันเข้าใจว่าอดีตเป็นรูปแบบการถดถอยเชิงเส้นอย่างง่าย แต่ฉันไม่ชัดเจนว่าเมื่อใดควรใช้แต่ละอัน

1
การถดถอยโลจิสติกสำหรับอนุกรมเวลา
ฉันต้องการใช้แบบจำลองการถดถอยแบบลอจิสติกแบบไบนารีในบริบทของการสตรีมข้อมูล (อนุกรมเวลาหลายมิติ) เพื่อทำนายค่าของตัวแปรตามของข้อมูล (เช่นแถว) ที่เพิ่งมาถึงจากการสังเกตที่ผ่านมา เท่าที่ฉันทราบการถดถอยโลจิสติกส์นั้นใช้สำหรับการวิเคราะห์หลังการตายซึ่งตัวแปรตามแต่ละตัวได้ถูกตั้งค่าไว้แล้ว (ไม่ว่าจะโดยการตรวจสอบหรือโดยธรรมชาติของการศึกษา) สิ่งที่เกิดขึ้นในกรณีของอนุกรมเวลา แต่ที่เราต้องการที่จะทำให้การคาดการณ์ (การบิน) เกี่ยวกับตัวแปรในแง่ของข้อมูลทางประวัติศาสตร์ (ตัวอย่างเช่นในหน้าต่างเวลาของสุดท้ายวินาที) และแน่นอนก่อนหน้านี้ ประมาณการของตัวแปรตามเสื้อtt และถ้าคุณเห็นระบบข้างต้นเมื่อเวลาผ่านไปมันควรจะถูกสร้างขึ้นอย่างไรเพื่อให้การถดถอยทำงานได้? เราต้องฝึกมันก่อนโดยการติดฉลากสมมติว่า 50 แถวแรกของข้อมูลของเรา (เช่นการตั้งค่าตัวแปรตามเป็น 0 หรือ 1) จากนั้นใช้ประมาณการปัจจุบันของเวกเตอร์เพื่อประเมินความน่าจะเป็นใหม่ของตัวแปรตาม 0 หรือ 1 สำหรับข้อมูลที่เพิ่งมาถึง (เช่นแถวใหม่ที่เพิ่งเพิ่มไปยังระบบ)ββ{\beta} เพื่อทำให้ปัญหาของฉันชัดเจนยิ่งขึ้นฉันพยายามสร้างระบบที่แยกวิเคราะห์ชุดข้อมูลทีละแถวและพยายามคาดคะเนของผลลัพธ์ไบนารี (ตัวแปรตาม) ให้ความรู้ (การสังเกตหรือการประเมิน) ของทั้งหมดขึ้นอยู่กับหรืออธิบาย ตัวแปรที่มาถึงในช่วงเวลาที่แน่นอน ระบบของฉันอยู่ใน Rerl และใช้ R สำหรับการอนุมาน

3
จะตีความผลกระทบหลักได้อย่างไรเมื่อเอฟเฟกต์ปฏิสัมพันธ์ไม่สำคัญ
ฉันใช้โมเดลผสมแบบเส้นตรงทั่วไปใน R และรวมเอฟเฟกต์การโต้ตอบระหว่างตัวทำนายสองตัว ปฏิสัมพันธ์ไม่สำคัญ แต่ผลหลัก (ทั้งสองทำนาย) ทั้งสอง ตอนนี้ตัวอย่างหนังสือหลายเล่มบอกฉันว่าหากมีผลกระทบอย่างมีนัยสำคัญของการโต้ตอบผลกระทบหลักไม่สามารถตีความได้ แต่ถ้าการปฏิสัมพันธ์ของคุณไม่สำคัญ ฉันสามารถสรุปได้ว่าตัวทำนายสองตัวมีผลต่อการตอบสนองหรือไม่? หรือมันจะดีกว่าที่จะใช้รูปแบบใหม่ที่ฉันออกจากการมีปฏิสัมพันธ์? ฉันไม่ต้องการทำเช่นนั้นเพราะฉันจะต้องควบคุมการทดสอบหลายรายการ

4
จะทราบได้อย่างไรว่าข้อมูลแยกกันเป็นเส้นตรง?
ข้อมูลมีคุณสมบัติมากมาย (เช่น 100) และจำนวนอินสแตนซ์เท่ากับ 100,000 ข้อมูลกระจัดกระจาย ฉันต้องการให้พอดีกับข้อมูลโดยใช้การถดถอยโลจิสติกหรือ svm ฉันจะรู้ได้อย่างไรว่าคุณลักษณะเป็นแบบเชิงเส้นหรือไม่เชิงเส้นเพื่อให้ฉันสามารถใช้เคล็ดลับเคอร์เนลได้หากไม่ใช่แบบเชิงเส้น

1
มีคำอธิบายที่เข้าใจได้ง่ายหรือไม่ว่าเหตุใดการถดถอยโลจิสติกจึงไม่สามารถใช้กับกรณีแยกที่สมบูรณ์ได้ และทำไมการเพิ่มการทำให้เป็นมาตรฐานจะแก้ไขได้?
เรามีการสนทนาที่ดีมากมายเกี่ยวกับการแบ่งแยกที่สมบูรณ์แบบในการถดถอยโลจิสติก เช่นการถดถอยโลจิสติกใน R ทำให้เกิดการแยกที่สมบูรณ์แบบ (ปรากฏการณ์ Hauck-Donner) ตอนนี้คืออะไร และรูปแบบการถดถอยโลจิสติกไม่ได้มาบรรจบ ฉันเองก็ยังรู้สึกว่ามันไม่ง่ายสำหรับสาเหตุที่มันเป็นปัญหาและทำไมการเพิ่มการทำให้เป็นมาตรฐานจะแก้ไขได้ ฉันสร้างภาพเคลื่อนไหวและคิดว่ามันจะเป็นประโยชน์ ดังนั้นโพสต์คำถามของเขาและตอบด้วยตนเองเพื่อแบ่งปันกับชุมชน

3
การเรียนรู้ของเครื่องเพื่อทำนายความน่าจะเป็นในชั้นเรียน
ฉันกำลังมองหาตัวแยกประเภทที่เอาต์พุตความน่าจะเป็นซึ่งเป็นตัวอย่างของหนึ่งในสองคลาส ฉันรู้ว่าการถดถอยโลจิสติกและเบย์ไร้เดียงสา แต่คุณสามารถบอกฉันเกี่ยวกับคนอื่น ๆ ที่ทำงานในลักษณะเดียวกันได้หรือไม่? นั่นคือตัวแยกประเภทที่ไม่ได้คาดคะเนคลาสที่เป็นของตัวอย่าง แต่ความน่าจะเป็นที่ตัวอย่างนั้นเหมาะสมกับคลาสเฉพาะหรือไม่ คะแนนโบนัสสำหรับความคิดที่คุณสามารถแบ่งปันเกี่ยวกับข้อดีและข้อเสียของตัวแยกประเภทที่แตกต่างกันเหล่านี้ (รวมถึงการถดถอยโลจิสติกและ Bayes ไร้เดียงสา) ตัวอย่างเช่นมีการจัดหมวดหมู่หลายชั้นที่ดีกว่าบ้างไหม?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.