ดังนั้นการได้รับ "ความคิด" ของจำนวนที่ดีที่สุดของกลุ่มใน k- หมายถึงเป็นเอกสารที่ดี ฉันพบบทความเกี่ยวกับการทำเช่นนี้ในการผสมแบบเกาส์ แต่ไม่แน่ใจว่าฉันเชื่อมั่นในมันไม่เข้าใจดีนัก มี ... วิธีที่อ่อนโยนกว่าในการทำเช่นนี้?
ดังนั้นการได้รับ "ความคิด" ของจำนวนที่ดีที่สุดของกลุ่มใน k- หมายถึงเป็นเอกสารที่ดี ฉันพบบทความเกี่ยวกับการทำเช่นนี้ในการผสมแบบเกาส์ แต่ไม่แน่ใจว่าฉันเชื่อมั่นในมันไม่เข้าใจดีนัก มี ... วิธีที่อ่อนโยนกว่าในการทำเช่นนี้?
คำตอบ:
เพียงแค่ส่วนขยายบางส่วนเพื่อความคิดเห็นของ Dikran Marsupial (การตรวจสอบข้าม) แนวคิดหลักคือการแบ่งข้อมูลของคุณออกเป็นชุดการฝึกอบรมและการตรวจสอบความถูกต้องลองใช้จำนวนส่วนประกอบที่แตกต่างกันและเลือกชุดที่ดีที่สุดโดยพิจารณาจากค่าการฝึกอบรมและค่าความน่าเชื่อถือที่สอดคล้องกัน
โอกาสสำหรับ GMM นั้นเป็นเพียงแค่ ตามคำนิยามที่ไหน คือจำนวนขององค์ประกอบ (กลุ่ม) และ ,,เป็นพารามิเตอร์แบบจำลอง โดยการเปลี่ยนค่าของ คุณสามารถพล็อตโอกาส GMM สำหรับชุดการฝึกอบรมและการตรวจสอบดังต่อไปนี้
ในตัวอย่างนี้ควรเห็นได้ชัดว่าจำนวนส่วนประกอบที่เหมาะสมคือประมาณ 20 มีวิดีโอเกี่ยวกับสิ่งนี้ใน Coursera และเป็นที่ที่ฉันได้ภาพด้านบน
อีกวิธีที่ใช้กันทั่วไปคือเกณฑ์ข้อมูลแบบเบย์ (BIC) :