ป่าสุ่มมีชื่อเสียงในหมู่ผู้ปฏิบัติงานซึ่งเป็นเทคนิคการจำแนกที่มีประสิทธิภาพมากที่สุด แต่เราไม่ได้พบพวกเขามากในวรรณกรรมการเรียนรู้เชิงทฤษฎีซึ่งฉันคาดการณ์ว่าจะไม่มีผลลัพธ์เชิงทฤษฎีที่ลึกซึ้ง หากใครอยากเจาะลึกทฤษฎีนี้ใครจะเริ่ม
ป่าสุ่มมีชื่อเสียงในหมู่ผู้ปฏิบัติงานซึ่งเป็นเทคนิคการจำแนกที่มีประสิทธิภาพมากที่สุด แต่เราไม่ได้พบพวกเขามากในวรรณกรรมการเรียนรู้เชิงทฤษฎีซึ่งฉันคาดการณ์ว่าจะไม่มีผลลัพธ์เชิงทฤษฎีที่ลึกซึ้ง หากใครอยากเจาะลึกทฤษฎีนี้ใครจะเริ่ม
คำตอบ:
ตามคำตอบของซีโมนเจอราร์ดเบียอูมีเอกสารที่ดีมากหลายฉบับที่ดูการบรรจบกันและความสม่ำเสมอของป่าที่สุ่ม การวิเคราะห์นั้นใช้สำหรับอัลกอริทึมรุ่นที่ง่ายขึ้นเล็กน้อยเมื่อเทียบกับ Breiman 2001 แต่จะง่ายกว่าผลลัพธ์ที่ผ่านมาเล็กน้อย
เอกสารของ Biau (รวมถึงผู้ทำงานร่วมกัน) มีอยู่ในเว็บไซต์ของเขา:
http://www.lsta.upmc.fr/BIAU/publications.html
สิ่งที่เกี่ยวข้องอย่างยิ่งคืองาน "in press" ที่สอดคล้อง: http://www.lsta.upmc.fr/BIAU/sbv.pdf
มีเอกสารอีก 2-3 ฉบับที่มีเนื้อหาฟอเรสต์แบบสุ่ม ฉันเพิ่งเข้าร่วม cstheory ดังนั้นฉันจึงไม่สามารถโพสต์ลิงก์มากกว่าสองลิงก์ได้ แต่เว็บไซต์สิ่งพิมพ์ด้านบนมีทั้งหมด
ฉันหวังว่านี่จะช่วยได้ ดูเหมือนว่าจะมีการระเบิดของกิจกรรมล่าสุดตั้งแต่ปี 2008 หลังจากช่วงเวลาของการใช้วิธีการเชิงประจักษ์ และข่าวดีก็คือการตรวจสอบทางทฤษฎีดูเหมือนจะแสดงให้เห็นว่าวิธีการนี้มีประสิทธิภาพและมีคุณสมบัติที่ดี
ฉันเดาว่าคุณได้อ่านบทความเกี่ยวกับ RF ของ Breiman แล้ว ฉันสามารถชี้ให้เห็นการอ้างอิงอื่น ๆ ไม่กี่:
การเปรียบเทียบเชิงประจักษ์ของการทำให้เข้าใจง่ายของ RF ที่แตกต่างกันซึ่งยอมให้การพิสูจน์ทฤษฎีบท: การลดช่องว่าง: ป่าสุ่มในทฤษฎีและในทางปฏิบัติ
นี่คือข้อมูลอ้างอิงล่าสุดที่ฉันสามารถให้ได้ ในบทความนี้คุณสามารถค้นหาเอกสารอ้างอิงของ Biau เกี่ยวกับงานเริ่มต้นในผลลัพธ์ทางทฤษฎีสำหรับ RF
หากคุณสนใจในผลลัพธ์ทางทฤษฎีเกี่ยวกับความสำคัญของตัวแปรใน RF: ทำความเข้าใจกับตัวแปรสำคัญในป่าของต้นไม้ที่สุ่ม
ที่จริงฉันเพิ่งค้นพบว่าผู้เขียนบทความสุดท้าย (Gilles Louppe) เพิ่งโพสต์เมื่อ arxiv วิทยานิพนธ์ปริญญาเอกของเขา (v2): ทำความเข้าใจป่าสุ่ม: จากทฤษฎีสู่การปฏิบัติ