ในระยะสั้นการถดถอยโลจิสติกมีความหมายที่น่าจะเป็นไปได้ซึ่งนอกเหนือไปจากการใช้ตัวจําแนกใน ML ฉันมีบางอย่างเกี่ยวกับบันทึกการถดถอยโลจิสติกที่นี่
สมมติฐานในการถดถอยโลจิสติกให้การวัดความไม่แน่นอนในการเกิดขึ้นของผลไบนารีที่อยู่บนพื้นฐานของแบบจำลองเชิงเส้น เอาต์พุตมีขอบเขตแบบไม่แสดงสัญญาณระหว่าง0ถึง1และขึ้นอยู่กับโมเดลเชิงเส้นเช่นเมื่อเส้นการถดถอยพื้นฐานมีค่า0สมการโลจิสติกคือ0.5=e01+e0เป็นจุดตัดตามธรรมชาติสำหรับการจำแนกประเภท อย่างไรก็ตามมันมีค่าใช้จ่ายในการทิ้งข้อมูลความน่าจะเป็นในผลลัพธ์ที่แท้จริงของh(ΘTx)=eΘTx1+eΘTxซึ่งมักเป็นที่น่าสนใจ (เช่นความน่าจะเป็นของการผิดนัดชำระเงินตามรายได้คะแนนเครดิตอายุ ฯลฯ )
อัลกอริทึมตรอนจำแนกเป็นขั้นตอนขั้นพื้นฐานมากขึ้นบนพื้นฐานของผลคูณจุดระหว่างตัวอย่างและน้ำหนัก เมื่อใดก็ตามที่ตัวอย่างถูกจำแนกสัญญาณของผลิตภัณฑ์ dot จะขัดแย้งกับค่าการจำแนกประเภท ( −1และ1 ) ในชุดฝึกอบรม หากต้องการแก้ไขสิ่งนี้เวกเตอร์ตัวอย่างจะถูกเพิ่มหรือลบซ้ำ ๆ จากเวกเตอร์ของน้ำหนักหรือสัมประสิทธิ์การอัปเดตองค์ประกอบของมัน:
Vectorially ที่คุณสมบัติหรือคุณลักษณะของตัวอย่างมีxและความคิดที่จะ "ผ่าน" ตัวอย่างเช่นถ้า:dx
หรือ ...∑1dθixi>theshold
) ฟังก์ชั่นสัญญาณผลใน 1หรือ - 1ซึ่งตรงข้ามกับ 0และ 1ในการถดถอยโลจิสติกh(x)=sign(∑1dθixi−theshold)1−101
เกณฑ์จะถูกดูดซึมเข้าสู่อคติค่าสัมประสิทธิ์ 0 สูตรคือตอนนี้:+θ0
หรือ vectorized: H ( x ) = สัญญาณ( θ T x )h(x)=sign(∑0dθixi)h(x)=sign(θTx)
จุดแบ่งจะต้องหมายความว่าผลิตภัณฑ์ที่จุดของΘและx nจะเป็นบวก (เวกเตอร์ในทิศทางเดียวกัน) เมื่อปีnเป็นลบหรือผลิตภัณฑ์จุดจะเป็นค่าลบ (เวกเตอร์ ในทิศทางตรงข้าม) ในขณะที่ปีnเป็นบวกsign(θTx)≠ynΘxnynyn
ฉันได้ทำงานกับความแตกต่างระหว่างสองวิธีนี้ในชุดข้อมูลจากหลักสูตรเดียวกันซึ่งผลการทดสอบในการสอบแยกสองชุดนั้นเกี่ยวข้องกับการยอมรับขั้นสุดท้ายไปยังวิทยาลัย:
ขอบเขตการตัดสินใจสามารถพบได้อย่างง่ายดายด้วยการถดถอยโลจิสติก แต่เป็นที่น่าสนใจที่จะเห็นว่าแม้ว่าค่าสัมประสิทธิ์ที่ได้รับกับตรอนเป็นอย่างมากมายแตกต่างกว่าในการถดถอยโลจิสติก, แอพลิเคชันที่เรียบง่ายของฟังก์ชั่นกับผลให้ผลเช่นเดียวกับที่ดีการจำแนกประเภท ขั้นตอนวิธี ในความเป็นจริงแล้วความแม่นยำสูงสุด (ขีด จำกัด ที่กำหนดโดยการแยกเชิงเส้นของตัวอย่างบางส่วน) ทำได้โดยการทำซ้ำครั้งที่สอง นี่คือลำดับของเส้นแบ่งเขตแดนเป็น10รอบโดยประมาณน้ำหนักเริ่มต้นจากเวกเตอร์สุ่มของสัมประสิทธิ์:sign(⋅)10
ความแม่นยำในการจัดหมวดหมู่เป็นฟังก์ชันของจำนวนการวนซ้ำที่เพิ่มขึ้นอย่างรวดเร็วและเพลทที่สอดคล้องกันถึงขอบเขตการตัดสินใจที่ใกล้ที่สุดที่เหมาะสมที่สุดใน videoclip ด้านบน นี่คือพล็อตของเส้นโค้งการเรียนรู้:90%
รหัสที่ใช้คือ ที่นี่