ฉบับย่อ:ฉันกำลังมองหาแพ็คเกจ R ที่สามารถสร้างแผนภูมิการตัดสินใจในขณะที่ใบไม้แต่ละใบในแผนผังการตัดสินใจเป็นรูปแบบการถดถอยเชิงเส้นเต็มรูปแบบ AFAIK ไลบรารีrpart
สร้างแผนผังการตัดสินใจที่ตัวแปรตามคงที่ในแต่ละใบไม้ มีห้องสมุดอื่น (หรือการrpart
ตั้งค่าที่ฉันไม่ทราบ) ที่สามารถสร้างต้นไม้ดังกล่าวได้หรือไม่?
รุ่นยาว:ฉันกำลังมองหาอัลกอริทึมที่สร้างแผนภูมิการตัดสินใจตามชุดข้อมูลการฝึกอบรม การตัดสินใจแต่ละครั้งในต้นไม้จะแยกข้อมูลการฝึกอบรมออกเป็นสองส่วนตามเงื่อนไขของหนึ่งในตัวแปรอิสระ รูทของทรีมีชุดข้อมูลแบบเต็มและแต่ละไอเท็มในชุดข้อมูลนั้นมีอยู่ในโหนดใบเดียว
อัลกอริทึมเป็นดังนี้:
- เริ่มต้นด้วยชุดข้อมูลแบบเต็มซึ่งเป็นโหนดรูทของทรี เลือกโหนดนี้และเรียกว่าN
- สร้างรูปแบบการถดถอยเชิงเส้นกับข้อมูลในN
- หากโมเดลเชิงเส้นของNสูงกว่าขีด จำกัด บางθ R 2 แสดงว่าเราเสร็จด้วยNดังนั้นให้ทำเครื่องหมายNเป็นใบและข้ามไปยังขั้นตอนที่ 5
- ลองตัดสินใจแบบสุ่มและเลือกหนึ่งที่มีอัตราผลตอบแทนที่ดีที่สุดR 2ในโหนดย่อยนี้:
- เลือกตัวแปรอิสระแบบสุ่มเช่นเดียวกับเกณฑ์แบบสุ่มθ iฉัน
- การตัดสินใจแยกชุดข้อมูลของN เป็นสองโหนดใหม่ Nและ~ N N
- สร้างแบบจำลองการถดถอยเชิงเส้นทั้งNและ~ NและคำนวณของพวกเขาR 2 (เรียกพวกเขาrและ~ R )
- จากทั้งหมดที่ tuples ( วีฉัน , θ ฉัน , R , ~ R )เลือกหนึ่งที่มีสูงสุดเมตรฉันn ( R , ~ R ) นี้อัตราผลตอบแทนการตัดสินใจใหม่ในต้นไม้และNมีสองโหนดย่อยใหม่Nและ~ N
- เรามีการประมวลผลเสร็จแล้วNเลือกโหนดใหม่Nซึ่งยังไม่ได้ประมวลผลและกลับไปที่ขั้นตอนที่ 2 หากโหนดทั้งหมดได้รับการประมวลผลอัลกอริทึมจะสิ้นสุดลง
สิ่งนี้จะสร้างทรีการตัดสินใจซ้ำซึ่งแบ่งข้อมูลออกเป็นส่วนย่อย ๆ และคำนวณโมเดลเชิงเส้นในแต่ละส่วนเหล่านั้น
ขั้นตอนที่ 3 เป็นเงื่อนไขการออกซึ่งป้องกันไม่ให้อัลกอริทึมจากการล้น แน่นอนว่ายังมีเงื่อนไขการออกจากที่เป็นไปได้อื่น ๆ :
- Exit ถ้าความลึก 's ในต้นไม้อยู่เหนือθ d อีพีทีเอช
- Exit ถ้าชุดข้อมูลในมีขนาดเล็กกว่าθ d เสื้อs อีที
มีอัลกอริทึมในแพ็คเกจ R หรือไม่?