คำถาม:
- อะไรคือความแตกต่างระหว่างต้นไม้ถดถอยที่ได้รับการส่งเสริม (BRT) และรุ่นที่ได้รับการส่งเสริมทั่วไป (GBM)? พวกเขาสามารถใช้แทนกันได้? เป็นรูปแบบเฉพาะของอื่น ๆ ?
- ทำไมริดจ์เวย์ใช้วลีที่ว่า "Generalized Boosted Regression Models" (GBM) เพื่ออธิบายสิ่งที่ Friedman เคยเสนอให้เป็น "Gradient Boosting Machine" (GBM) มาก่อน? คำย่อสองตัวนี้เหมือนกันอธิบายสิ่งเดียวกัน แต่มาจากวลีที่แตกต่างกัน
พื้นหลัง:
ฉันมีปัญหาในการพิจารณาว่าข้อกำหนด BRT และ GBM แตกต่างกันอย่างไร จากสิ่งที่ฉันเข้าใจทั้งสองเป็นคำศัพท์เพื่ออธิบายการจัดหมวดหมู่และต้นไม้การถดถอยที่มีการสุ่มรวมอยู่ด้วยการส่งเสริมบางอย่าง (เช่นการบรรจุถุง bootstrapping การตรวจสอบข้าม) นอกจากนี้จากสิ่งที่ฉันรวบรวมคำศัพท์ GBM ได้รับการประกาศเกียรติคุณเป็นครั้งแรกโดย Friedman (2001) ในกระดาษของเขา "การประมาณฟังก์ชั่นโลภ: เครื่องเร่งการไล่ระดับสี" ริดจ์เวย์ได้ดำเนินการตามขั้นตอนที่อธิบายโดยฟรีดแมนในปี 2549 ในแพ็คเกจของเขา "Generalized Boosted Regression Models" (GBM) ในสาขาของฉัน (นิเวศวิทยา) Elith และคณะ (2008) เป็นคนแรกที่แสดงให้เห็นถึงgbm
แพ็คเกจของ Ridgeway สำหรับการสร้างแบบจำลองการกระจายสายพันธุ์ อย่างไรก็ตามผู้เขียนใน Elith และคณะ ใช้คำว่า "ต้นไม้ถดถอยเพิ่มขึ้น" (BRT) เพื่ออธิบาย Friedman และ Ridgeway '
ฉันสับสนว่าข้อกำหนดเหล่านี้สามารถใช้แทนกันได้หรือไม่? มันค่อนข้างสับสนว่าผู้เขียนคนหนึ่งจะใช้ตัวย่อเดียวกัน (จากวลีที่แตกต่าง) เพื่ออธิบายทฤษฎีเดียวกันกับที่ผู้เขียนคนก่อนเสนอ นอกจากนี้ยังสับสนว่าผู้เขียนคนที่สามใช้คำที่แตกต่างอย่างสิ้นเชิงเมื่ออธิบายทฤษฎีนี้ในแง่ของนิเวศวิทยา
สิ่งที่ดีที่สุดที่ฉันสามารถทำได้คือ BRT เป็นรูปแบบเฉพาะของ GBM ซึ่งการกระจายนั้นเป็นแบบทวินาม แต่ฉันไม่แน่ใจในสิ่งนี้
Elith และคณะ กำหนดต้นไม้ถดถอยที่ได้รับการส่งเสริมเช่นนี้ ... "ต้นไม้ที่ได้รับการส่งเสริมเพิ่มความแข็งแกร่งของอัลกอริธึมสอง: ต้นไม้ถดถอย (แบบจำลองที่เกี่ยวข้องกับการตอบสนองต่อการพยากรณ์โดย recursive ไบนารีแยก) และการเพิ่ม (วิธีการปรับตัว ) แบบจำลอง BRT สุดท้ายสามารถเข้าใจได้ว่าเป็นแบบจำลองการถดถอยแบบเพิ่มเติมซึ่งคำศัพท์แต่ละคำนั้นเป็นต้นไม้ที่เรียบง่าย