การแบ่งพาร์ติชันต้นไม้ใน R: party vs. rpart


15

ไม่นานมานี้ตั้งแต่ฉันดูที่การแยกต้นไม้ ครั้งล่าสุดที่ฉันทำสิ่งนี้ฉันชอบปาร์ตี้ใน R (สร้างโดย Hothorn) แนวคิดของการอนุมานแบบมีเงื่อนไขผ่านการสุ่มตัวอย่างทำให้ฉันมีเหตุผล แต่ rpart ก็มีการอุทธรณ์

ในแอปพลิเคชันปัจจุบัน (ฉันไม่สามารถให้รายละเอียดได้ แต่เกี่ยวข้องกับการพยายามกำหนดว่าใครจะเข้าคุกในกลุ่มตัวอย่างขนาดใหญ่ของผู้ถูกจับกุม) ฉันไม่สามารถใช้วิธีการขั้นสูงเช่นป่าสุ่มการบรรจุถุงการส่งเสริมเป็นต้น - ฉันต้องการความสะดวก กฎ.

ฉันจะยังชอบที่จะมีบางส่วนที่ควบคุมด้วยตนเองมากกว่าที่โหนดแยกตามที่แนะนำในวอชิงตันโพสต์และนักร้อง (2010) ซ้ำพาร์ทิชันและการประยุกต์ใช้ ฟรีแวร์ที่มาพร้อมกับหนังสือเล่มนี้อนุญาตให้ทำเช่นนี้ได้ แต่จะค่อนข้างดั้งเดิมในการป้อนข้อมูลของผู้ใช้

คำแนะนำหรือข้อเสนอแนะ?

คำตอบ:


8

ฉันเห็นด้วยกับ @Iterator ว่าวิธีการอธิบายได้ง่ายขึ้นสำหรับ rpart อย่างไรก็ตามหากคุณกำลังมองหากฎที่อธิบายได้ง่ายปาร์ตี้ (ไม่มีต้นไม้ที่ถูกใส่ถุง) จะไม่สูญเสียอะไรเลยในการอธิบายการทำนาย - คุณยังมีต้นไม้ต้นเดียว หากคุณสนใจที่จะดูไดรเวอร์ของตัวแปรผลลัพธ์ (ไม่ใช่แค่พลังการทำนายที่บริสุทธิ์) ฉันยังคงคิดว่าปาร์ตี้คือหนทางที่จะไป - อธิบายว่าต้นไม้การตัดสินใจ (เช่น rpart) นั้นค่อนข้างลำเอียงในการเลือก ตัวแปรมีความสำคัญและวิธีสร้างแยก พรรคใช้การทดสอบการเปลี่ยนรูปและสถิติกำหนดว่าตัวแปรใดมีความสำคัญที่สุดและวิธีการแยก ดังนั้นแทนที่จะเอนเอียงเอนเอียงไปยังตัวแปรเด็ดขาดที่มีหลายระดับเช่น rpart ตัวอย่างเช่นพรรคใช้การทดสอบทางสถิติเพื่อค้นหาโครงสร้างที่ดีที่สุด


1
คำตอบที่ดี ฉันคิดว่าคุณมีเหตุผลที่ดีว่าทำไมกลุ่มจึงดีกว่าสำหรับผู้ชมขั้นสูงและทำไมจึงเป็นความคิดที่ดีที่จะให้ความรู้แก่ผู้ชมเพื่อช่วยให้พวกเขายอมรับการใช้งานปาร์ตี้
Iterator

4

[หมายเหตุ:. ดูที่การปรับปรุง 1 ด้านล่าง] ผมพบว่าวิธีการสำหรับการอยู่ไกลง่ายกว่าที่จะอธิบายrpart partyอย่างไรก็ตามหลังนั้นมีความซับซ้อนและมีแนวโน้มที่จะสร้างแบบจำลองที่ดีกว่า วิธีที่ฉันอธิบายบางครั้งก็partyคือการพูดถึงมันเป็นพื้นฐานสำหรับการสร้างแบบจำลองเชิงเส้นท้องถิ่น (หรือ GLM) ฉันสร้างมันขึ้นมาโดยชี้ให้เห็นว่าผลลัพธ์สำหรับrpartค่าคงที่ในทุกองค์ประกอบที่อยู่ในโหนดใบเช่นกล่อง / ภูมิภาคล้อมรอบด้วยการแยก แม้ว่าอาจจะมีการปรับปรุงผ่านตัวแบบในท้องที่ แต่คุณก็ไม่ได้รับการคาดการณ์ใด ๆ

ในทางตรงกันข้ามpartyพัฒนาตัวแยกเพื่อเพิ่มประสิทธิภาพโมเดลสำหรับภูมิภาค จริงๆแล้วมันใช้เกณฑ์ที่แตกต่างจากการเพิ่มประสิทธิภาพของแบบจำลอง แต่คุณต้องประเมินความสามารถของคุณเองเพื่ออธิบายความแตกต่างเพื่อตัดสินว่าคุณสามารถอธิบายได้ดีหรือไม่ เอกสารสำหรับนักวิจัยสามารถเข้าถึงได้ แต่อาจจะค่อนข้างท้าทายสำหรับบางคนที่ไม่เต็มใจที่จะพิจารณาวิธีที่ง่ายกว่าเช่นป่าที่สุ่มการส่งเสริมและอื่น ๆ ในทางคณิตศาสตร์ฉันคิดว่าpartyมันมีความซับซ้อนมากกว่า ... อย่างไรก็ตามโมเดล CART นั้นง่ายกว่า อธิบายทั้งในแง่ของวิธีการและผลลัพธ์และสิ่งเหล่านี้เป็นก้าวที่ดีสำหรับการแนะนำโมเดลที่มีพื้นฐานจากต้นไม้ที่ซับซ้อนยิ่งขึ้น

ในระยะสั้นผมจะบอกว่าคุณต้องทำrpartเพื่อความชัดเจนและคุณสามารถใช้partyเพื่อความถูกต้อง / รอบการแสดง แต่ฉันจะไม่แนะนำโดยไม่ต้องแนะนำpartyrpart


อัปเดต 1. ฉันใช้คำตอบตามความเข้าใจpartyเหมือนเดิมเมื่อหนึ่งปีหรือสองปีที่แล้ว มันเติบโตขึ้นมาเล็กน้อย แต่ฉันจะแก้ไขคำตอบของฉันเพื่อบอกว่าฉันยังคงแนะนำrpartสำหรับความกะทัดรัดและมรดกของมันควร "ไม่แฟนซี" เป็นเกณฑ์ที่สำคัญสำหรับลูกค้า / ผู้ทำงานร่วมกันของคุณ แต่ผมจะพยายามที่จะโยกย้ายไปใช้ฟังก์ชันการทำงานเพิ่มเติมจากหลังจากที่ได้แนะนำให้รู้จักกับคนที่จะparty rpartเป็นการดีที่จะเริ่มต้นเล็ก ๆ ด้วยฟังก์ชั่นการสูญเสียเกณฑ์การแยก ฯลฯ ในบริบทง่ายๆก่อนที่จะแนะนำแพ็คเกจและวิธีการที่เกี่ยวข้องกับแนวคิดที่เกี่ยวข้องมากกว่า


2
ฉันคิดว่าคุณสับสนเล็กน้อยเกี่ยวกับสิ่งที่partyแพคเกจสามารถทำได้ partyฟังก์ชั่นบริสุทธิ์ทำให้ต้นไม้ง่าย ๆ เพียงต้นเดียวเช่นเดียวrpartกับการลงคะแนนส่วนใหญ่ในใบ mobฟังก์ชั่นในpartyคือสิ่งที่สร้างต้นไม้ที่มีรูปแบบที่ซับซ้อนมากขึ้นในใบ (และเลือกแยกบนพื้นฐานของความไม่แน่นอนพารามิเตอร์.)
เชีย Parkes

1
@SarkParkes คุณพูดถูก มันไม่นานมานี้และฉันไม่แน่ใจว่าฉันจะใช้mobหรือเพียงแค่ถ้าส่วนที่เหลือของแพคเกจโตขึ้นเล็กน้อย - ฉันจำไม่ได้ว่าเคยเห็นป่าสุ่มมาก่อน ฉันจะแก้ไขคำตอบของฉัน ...
Iterator

2
และที่จริงฉันก็ลืมไปเหมือนกัน มันctreeจะทำต้นไม้ต้นเดียวcforestเพื่อสร้างป่าสุ่มและmobเพื่อทำใบแบบจำลอง และ fyi, cforest เป็นเรื่องสนุก แต่ช้ามากที่จะทำนายด้วย
Shea Parkes

ผมจะมองเข้าไปในฝูงชนผมไม่คิดว่ามันมีอยู่ครั้งสุดท้ายที่ผมใช้ในงานปาร์ตี้ แอปพลิเคชันฟอเรสต์ไม่เหมาะสำหรับฉันในครั้งนี้
Peter Flom - Reinstate Monica

@ PeterFlom ฉันคิดว่าmobอาจจะมีตั้งแต่จุดเริ่มต้นหรืออย่างน้อยก็มาหลังจากctreeฉันคิดว่า มันมีมาตั้งแต่ปี 2009 หรือก่อนหน้า อย่างไรก็ตามเพียงแค่ไปแสดงให้เห็นว่าเราทุกคนสามารถเรียนรู้สิ่งใหม่ ๆ ใน SE :)
Iterator
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.