วิธีที่ดีที่สุดในการทำเช่นนี้จะแตกต่างกันอย่างมากขึ้นอยู่กับงานที่คุณกำลังแสดงอยู่ดังนั้นจึงเป็นไปไม่ได้ที่จะบอกว่าอะไรจะดีที่สุดในแบบที่ไม่ขึ้นกับงาน
มีสองสิ่งง่าย ๆ ที่จะลองถ้าระดับของคุณเป็นอันดับ:
- ถังขยะพวกเขา เช่น 0 = (0 250), 1 = (251 500), ฯลฯ คุณอาจต้องการเลือกข้อ จำกัด เพื่อให้แต่ละถังมีจำนวนรายการเท่ากัน
- นอกจากนี้คุณยังสามารถบันทึกการเปลี่ยนแปลงของระดับ นี่จะเป็นการกดช่วงลง
หากระดับไม่ใช่ลำดับคุณสามารถจัดกลุ่มระดับตามคุณลักษณะ / ตัวแปรอื่น ๆ ในชุดข้อมูลของคุณและแทนที่รหัสคลัสเตอร์สำหรับระดับก่อนหน้า มีหลายวิธีในการทำเช่นนี้เนื่องจากมีอัลกอริธึมการจัดกลุ่มดังนั้นฟิลด์จึงเปิดกว้าง ขณะที่ฉันอ่านนี่คือสิ่งที่combine.levels()
กำลังทำอยู่ คุณสามารถทำในทำนองเดียวกันการใช้หรือkmeans()
prcomp()
(คุณสามารถ / ควรฝึกตัวแยกประเภทเพื่อทำนายกลุ่มสำหรับดาต้าพอยน์ใหม่)