ฉันต้องพอดีกับการแจกแจงแบบเกาส์ทั่วไปกับคลาวด์ 7-point ที่บรรจุค่าผิดปกติจำนวนมากและมีเลเวอเรจสูง คุณรู้จักแพ็คเกจ R ที่ดีสำหรับงานนี้หรือไม่?
ฉันต้องพอดีกับการแจกแจงแบบเกาส์ทั่วไปกับคลาวด์ 7-point ที่บรรจุค่าผิดปกติจำนวนมากและมีเลเวอเรจสูง คุณรู้จักแพ็คเกจ R ที่ดีสำหรับงานนี้หรือไม่?
คำตอบ:
นอกจากนี้ยังมี mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html
อย่างไรก็ตามข้อควรระวังอย่างหนึ่ง: การสร้างแบบจำลองการผสมในพื้นที่ที่มีมิติสูงสามารถทำให้ซีพียูและหน่วยความจำค่อนข้างเข้มข้นหากระบบคลาวด์ของคุณมีขนาดใหญ่ ประมาณสี่ปีที่แล้วฉันกำลังทำชุดข้อมูล 11 มิติ, 50-200K จุดและมันก็มีแนวโน้มที่จะใช้ RAM 4-11GB และใช้เวลานานถึงหนึ่งสัปดาห์ในการคำนวณสำหรับแต่ละกรณี (และฉันมี 400) สิ่งนี้เป็นไปได้อย่างแน่นอน แต่อาจปวดหัวถ้าคุณใช้คลัสเตอร์การคำนวณที่ใช้ร่วมกันหรือมีทรัพยากร จำกัด
ฟังดูเหมือนแบบจำลองการผสมแบบเกาส์หลายตัวแปรหลายตัวแปร ฉันคิดว่าแพ็คเกจ BayesM อาจใช้งานได้
ต่อไปนี้เป็นแพคเกจส่วนผสมของ Gaussian Mix หลายตัวแปร