ฉันชอบแบบจำลองการผสมผสานแบบเกาส์ (GMM)
หนึ่งในคุณสมบัติของพวกเขาคือในโดเมน probitพวกเขาทำหน้าที่เหมือนผู้สอดแทรกคำ สิ่งหนึ่งที่บ่งบอกถึงสิ่งนี้คือพวกมันสามารถทำหน้าที่เป็นพื้นฐานการทดแทน ซึ่งหมายความว่าสำหรับการแจกแจงแบบ non-gaussian เช่น lognormal, weibull หรือ crazier ที่ไม่ใช่การวิเคราะห์ตราบใดที่พบกับเกณฑ์บางอย่าง - GMM สามารถประมาณการกระจายตัวได้
ดังนั้นหากคุณทราบพารามิเตอร์ของการประมาณค่าที่เหมาะสมที่สุดของ AICc หรือ BIC โดยใช้ GMM คุณสามารถฉายภาพนั้นให้มีขนาดเล็กลง คุณสามารถหมุนและดูแกนหลักของส่วนประกอบของ GMM ที่ประมาณได้
ผลที่ตามมาจะเป็นวิธีที่ให้ข้อมูลและเข้าถึงได้ทางสายตาเพื่อดูส่วนที่สำคัญที่สุดของข้อมูลมิติที่สูงขึ้นโดยใช้การรับรู้ภาพ 3 มิติของเรา
แก้ไข: (แน่นอนสิ่งที่ whuber)
มีหลายวิธีในการดูรูปร่าง
- คุณสามารถดูแนวโน้มในความหมาย lognormal จะถูกประมาณโดยชุดของ Gaussians ซึ่งหมายถึงได้ใกล้ชิดมากขึ้นและมีน้ำหนักที่เล็กลงตามความก้าวหน้า ผลรวมใกล้เคียงกับหางที่หนักกว่า ในมิติข้อมูลลำดับของส่วนประกอบดังกล่าวจะทำให้กลีบ คุณสามารถติดตามระยะทางระหว่างค่าเฉลี่ย (แปลงเป็นขนาดสูง) และทิศทางโคไซน์ระหว่างเช่นกัน สิ่งนี้จะแปลงเป็นมิติที่เข้าถึงได้มากขึ้น
- คุณสามารถสร้างระบบ 3 มิติซึ่งมีแกนคือน้ำหนักขนาดของค่าเฉลี่ยและขนาดของความแปรปรวน / ความแปรปรวนร่วม หากคุณมีการนับกลุ่มที่สูงมากนี่เป็นวิธีการดูพวกเขาเปรียบเทียบกัน มันเป็นวิธีที่มีค่าในการแปลงชิ้นส่วน 50k ด้วยการวัดขนาด 2k แต่ละก้อนให้กลายเป็นเมฆไม่กี่ชิ้นในพื้นที่ 3 มิติ ฉันสามารถดำเนินการควบคุมกระบวนการในพื้นที่นั้นถ้าฉันเลือก ฉันชอบการวนซ้ำของการใช้ตัวควบคุมแบบผสมแบบเกาส์เซียนตามส่วนประกอบของตัวแบบแบบผสมแบบเกาส์ที่เหมาะกับพารามิเตอร์ส่วนหนึ่ง
- ในแง่ของการขจัดความยุ่งเหยิงคุณสามารถทิ้งด้วยน้ำหนักที่น้อยมากหรือโดยน้ำหนักต่อความแปรปรวนร่วมหรือเช่นนั้น
- R2
- คุณอาจจะมองไปที่มันเหมือนฟองตัด ตำแหน่งของความน่าจะเป็นที่เท่ากัน (ศูนย์ Kullback-Leibler divergence) มีอยู่ระหว่างแต่ละกลุ่มของกลุ่ม GMM หากคุณติดตามตำแหน่งนั้นคุณสามารถกรองตามความน่าจะเป็นของการเป็นสมาชิกที่ตำแหน่งนั้นได้ มันจะให้คะแนนขอบเขตการจำแนกประเภทของคุณ สิ่งนี้จะช่วยให้คุณแยก "เหงา" คุณสามารถนับจำนวนของขอบเขตดังกล่าวเหนือขีด จำกัด ต่อสมาชิกและรับรายการ "connectness" ต่อคอมโพเนนต์ นอกจากนี้คุณยังสามารถดูมุมและระยะทางระหว่างสถานที่
- คุณสามารถสุ่มตัวอย่างพื้นที่ได้อีกครั้งโดยใช้ตัวเลขสุ่มที่กำหนดให้กับ Gaussian PDF จากนั้นทำการวิเคราะห์องค์ประกอบหลักที่อยู่บนนั้นและดูที่รูปร่าง eigen และค่าลักษณะเฉพาะที่เกี่ยวข้อง
แก้ไข:
รูปร่างหมายถึงอะไร? พวกเขากล่าวว่าความเฉพาะเจาะจงเป็นจิตวิญญาณของการสื่อสารที่ดีทั้งหมด
คุณหมายถึงอะไรเกี่ยวกับ "การวัด"
แนวคิดเกี่ยวกับความหมาย:
- ความรู้สึกปกติของลูกตา / ความรู้สึกในรูปแบบทั่วไป (การเข้าถึงที่มองเห็นได้ในเชิงคุณภาพอย่างมาก)
- การวัดรูปร่างของ GD&T (coplanarity, concentricity ฯลฯ ) (ปริมาณมาก)
- บางสิ่งบางอย่างที่เป็นตัวเลข (ค่าลักษณะเฉพาะ, ความแปรปรวนร่วม, ฯลฯ ... )
- พิกัดมิติที่มีประโยชน์ลดลง (เช่นพารามิเตอร์ GMM กลายเป็นมิติข้อมูล)
- ระบบลดเสียงรบกวน (เรียบในบางวิธีแล้วนำเสนอ)
"หลายวิธี" ส่วนใหญ่เป็นการเปลี่ยนแปลงบางอย่าง