อย่าสับสนในการจัดการตัวทำนาย (ผ่านผู้เรียนพื้นฐานเช่นตอ) และการจัดการฟังก์ชั่นการสูญเสียในการส่งเสริม ถึงแม้ว่า AdaBoost อาจคิดว่าเป็นการหาชุดค่าผสมของผู้เรียนพื้นฐานเพื่อลดข้อผิดพลาดการจัดประเภท แต่กระดาษ"Additive Logistic Regression" ที่คุณอ้างถึงแสดงให้เห็นว่ายังสามารถกำหนดสูตรเพื่อลดฟังก์ชันการสูญเสียเลขชี้กำลัง ความเข้าใจนี้เปิดขึ้นวิธีการส่งเสริมในระดับกว้างของปัญหาเครื่องการเรียนรู้ที่ลดฟังก์ชั่นการสูญเสียอนุพันธ์ผ่านทางลาดส่งเสริม ส่วนที่เหลือที่เหมาะสมในแต่ละขั้นตอนคือส่วนที่เหลือหลอกเทียมคำนวณจากการไล่ระดับสีของฟังก์ชั่นการสูญเสีย แม้ว่าตัวทำนายจะถูกสร้างแบบจำลองเป็นตอไม้ไบนารีเอาต์พุตของโมเดลจึงไม่จำเป็นต้องเป็นตัวเลือกไบนารี
ในฐานะที่เป็นรัฐอื่นคำตอบผู้เรียนพื้นฐานเชิงเส้นอาจไม่ทำงานสำหรับการส่งเสริม แต่ผู้เรียนพื้นฐานเชิงเส้นไม่จำเป็นสำหรับ "การถดถอยที่เพิ่มขึ้น" ทั้งในมาตรฐานหรือความรู้สึกโลจิสติก การรวมตอที่ไม่ใช่เชิงเส้นสามารถรวมกันเป็นผู้เรียนฐานช้าเพื่อลดฟังก์ชั่นการสูญเสียที่เหมาะสม มันยังคงเรียกว่า "เพิ่มการถดถอย" แม้ว่ามันจะห่างไกลจากรูปแบบการถดถอยมาตรฐานเชิงเส้นในค่าสัมประสิทธิ์ของการทำนาย ฟังก์ชั่นการสูญเสียสามารถทำหน้าที่เหมือนกันสำหรับโมเดลเชิงเส้นและโมเดล "เพิ่มการถดถอย" ด้วยตอไม้หรือต้นไม้เป็นตัวทำนาย บทที่ 8 ของISLRทำให้สิ่งนี้ชัดเจน
ดังนั้นหากคุณต้องการให้โลจิสติกส์ - การถดถอยเทียบเท่ากับการถดถอยที่เพิ่มขึ้นให้เน้นที่ฟังก์ชั่นการสูญเสียแทนที่จะเน้นที่ผู้เรียนพื้นฐาน นั่นคือสิ่งที่แนวทาง LogitBoost ในเอกสารที่คุณอ้างถึง: ลดการสูญเสียการบันทึกแทนที่จะลดการสูญเสียเลขชี้กำลังใน adaboost หน้า Wikipedia AdaBoostอธิบายความแตกต่างนี้
ผู้เข้าร่วมจำนวนมากในไซต์นี้จะยืนยันว่าการทำนายตามอัตราต่อรอง / ความน่าจะเป็นเป็นที่นิยมอย่างมากในการทำนายการจำแนกประเภทใช่ / ไม่ใช่อย่างเข้มงวดเนื่องจากในอดีตมักอนุญาตให้มีการแลกเปลี่ยนที่แตกต่างกันระหว่างค่าใช้จ่ายพิเศษ . ตามคำตอบของคำถามที่เกี่ยวข้องของคุณบ่งชี้ว่าเป็นไปได้ที่จะได้รับความน่าจะเป็นโดยประมาณจากตัวแยกประเภทที่คาดเดายากที่ได้มาจาก AdaBoost แต่ LogitBoost อาจให้ประสิทธิภาพที่ดีกว่า
การใช้การเพิ่มระดับความลาดชันสำหรับการจำแนกประเภทสามารถให้ข้อมูลเกี่ยวกับความน่าจะเป็นพื้นฐาน ตัวอย่างเช่นหน้านี้ในการเพิ่มการไล่ระดับสีแสดงให้เห็นว่าsklearn
รหัสอนุญาตให้เลือกระหว่างการสูญเสียความเบี่ยงเบนสำหรับการถดถอยโลจิสติกและการสูญเสียเลขชี้กำลังสำหรับ AdaBoost และฟังก์ชั่นเอกสารเพื่อทำนายความน่าจะเป็นจากรุ่นที่ไล่ระดับสี