เมื่อใดที่จะใช้รูปแบบการผสมแบบเกาส์?


9

ฉันยังใหม่กับการใช้ GMM ฉันไม่สามารถค้นหาความช่วยเหลือที่เหมาะสมออนไลน์ได้ ใครช่วยกรุณาให้ทรัพยากรที่ถูกต้องกับ "วิธีการตัดสินใจว่าการใช้ GMM เหมาะกับปัญหาของฉันหรือไม่" หรือในกรณีที่มีปัญหาการจัดหมวดหมู่ "จะตัดสินใจได้อย่างไรว่าฉันต้องใช้การจำแนกประเภท SVM หรือการจำแนกประเภท GMM"


ชุดข้อมูลของคุณคืออะไรและปัญหาที่แน่นอนของคุณคืออะไร? มันใช้เมื่อข้อมูลดังต่อไปนี้ (เป็นส่วนผสมของ) มากกว่า 1 การกระจายปกติ ดูคำถามอื่น - stats.stackexchange.com/questions/236295/…
Arpit Sisodia

คุณสามารถคิดว่ามันเป็นรูปแบบของการจัดกลุ่มที่คุณไม่ได้ติดป้ายกำกับข้อมูลและเชื่อว่าการจัดกลุ่มที่แฝงอยู่นั้นมีหลายตัวแปรอย่างสมบูรณ์แบบปกติ
gung - Reinstate Monica

@ arpit-sisodia เรากำลังทำงานเกี่ยวกับความเป็นไปได้ของการตั้งค่าแป้นพิมพ์ฮาร์ดแวร์ซึ่งดูเหมือนจะมีคุณสมบัติเฉพาะและเรากำลังวางแผนที่จะทำแบบจำลองโดยใช้ GMM เราไม่รู้กระบวนการที่ชัดเจนและด้วยเหตุนี้เราจึงพยายามจำลองโดยใช้วิธีการเรียนรู้ของเครื่อง ดังนั้นเราไม่แน่ใจว่าจริงๆแล้วมีส่วนผสมของ gaussians ในกระบวนการพื้นฐานหรือไม่ ยิ่งไปกว่านั้นมันเป็นหลายมิติและเราไม่สามารถจินตนาการได้ว่ามันเป็นส่วนผสมของ gaussians หรือไม่
Vinay

@ arpit-sisodia, ลิงก์ที่คุณให้ไว้จะแนะนำวิธีการทดลองและข้อผิดพลาดเพิ่มเติมเพื่อดูว่า GMM เหมาะกับข้อมูลของฉันหรือไม่ มีวิธีสรุป / กฎ Thumb ในการตัดสินใจเกี่ยวกับรูปแบบที่จะใช้ วิธีการทดลองและข้อผิดพลาดในการเล่นที่มีส่วนผสมมากขึ้นสามารถทำให้ข้อมูลของฉันพอดี แต่มีวิธีการบางอย่างในการตัดสินใจหรือไม่ เช่นเดียวกับที่เราต้องมีการแยกข้อมูลเชิงเส้นสำหรับการจำแนก SVM
Vinay

คำตอบ:


4

ในความคิดของฉันคุณสามารถดำเนินการ GMM ได้เมื่อคุณรู้ว่าจุดข้อมูลเป็นส่วนผสมของการแจกแจงแบบเกาส์เซียน โดยพื้นฐานแล้วมีกลุ่มที่มีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานต่างกัน มีแผนภาพที่ดีในเว็บไซต์เรียนรู้ Scikit L

การจำแนกประเภท GMM

วิธีหนึ่งคือการค้นหากลุ่มโดยใช้วิธีการจัดกลุ่มแบบนุ่มแล้วดูว่าพวกเขาเป็นเกาส์เซียนหรือไม่ หากเป็นเช่นนั้นคุณสามารถใช้โมเดล GMM ซึ่งแสดงถึงชุดข้อมูลทั้งหมด


1
บ่อยครั้งที่เราไม่รู้ว่าจุดข้อมูลเป็นส่วนผสมของ Gaussians ดังนั้นนี่เป็นการเล่นกับ Gaussian และ MoG และดูว่าเหมาะสมหรือไม่ แต่ไม่มีทิศทาง / กฎหัวแม่มือจะไปเกี่ยวกับจีเอ็มเอ็ในการใช้สิทธิ
Vinay

2
จากประสบการณ์ของฉันคุณจำเป็นต้องค้นหารูปแบบในข้อมูลที่เป็นรูปแบบผสม กระดาษที่ดีสำหรับการอ่านน่าจะเป็น: stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
Slayer

0

GMMs เป็นจุดเริ่มต้นที่ดีถ้าเป้าหมายของคุณคือ (1) การสำรวจกลุ่ม (2) ระบุรูปแบบกำเนิดหรือ (3) ประเมินความหนาแน่น ในความเป็นจริงสำหรับการจัดกลุ่ม GMMs เป็นsupersetของ k- mean

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.