ความไม่เหมาะสมของ ANOVA หลังจากการวิเคราะห์กลุ่ม k-mean


14

การแจ้งเตือนหลังจากตาราง ANOVA หลังจากการวิเคราะห์ค่า K บ่งชี้ว่าระดับความสำคัญไม่ควรถูกมองว่าเป็นการทดสอบที่มีความหมายเท่ากันเนื่องจากโซลูชันคลัสเตอร์ได้รับมาจากระยะทางแบบยุคลิดเพื่อเพิ่มระยะทาง ฉันควรใช้การทดสอบแบบใดเพื่อแสดงว่าค่าเฉลี่ยของตัวแปรการจัดกลุ่มแตกต่างกันในกลุ่มหรือไม่ ฉันได้เห็นคำเตือนนี้ในตารางค่า ANOVA ของ k- หมายถึงเอาต์พุต แต่ในการอ้างอิงบางอย่างฉันเห็นว่าการทดสอบ ANOVA หลังการเรียกใช้ ฉันควรละเว้น k-mean ANOVA และรัน one-way ANOVA ด้วยการทดสอบหลังการแปลและตีความมันด้วยวิธีดั้งเดิมหรือไม่? หรือฉันสามารถบอกนัยเกี่ยวกับขนาดของค่า F เท่านั้นและตัวแปรใดที่ทำให้เกิดความแตกต่างมากขึ้น? ความสับสนอีกประการหนึ่งคือตัวแปรการจัดกลุ่มไม่ได้กระจายการละเมิดสมมติฐานของ ANOVA จากนั้นฉันสามารถใช้การทดสอบที่ไม่ใช่พารามิเตอร์ของ Kruskal-Wallis แต่มีข้อสันนิษฐานเกี่ยวกับการแจกแจงแบบเดียวกัน การกระจายระหว่างกลุ่มสำหรับตัวแปรเฉพาะนั้นดูเหมือนจะไม่เหมือนกันบางตัวมีความเบ้เชิงบวกบางตัวมีค่าเป็นลบ ... ฉันมีตัวอย่างขนาดใหญ่ 1275 กลุ่ม 5 กลุ่มตัวแปรการทำคลัสเตอร์ 10 ตัวที่วัดในคะแนน PCA


ทำไมคุณต้องทดสอบความเท่าเทียมกันของค่าเฉลี่ย? คุณไม่เพียงแค่ทดสอบว่าแบบจำลองของคุณมีตัวอย่างเป็นอย่างไร
James

ฉันต้องการตรวจสอบว่าค่าเฉลี่ยของตัวแปรใดในกลุ่มเช่นค่าเฉลี่ยของ v1 ใน cluster1 นั้นแตกต่างจากค่าเฉลี่ยของ v1 ในกลุ่ม, 2, 3, 4, 5 แน่นอนว่าฉันสามารถดูได้โดยการทำกราฟ แต่มัน ไม่บอกเกี่ยวกับความแตกต่างทางสถิติ การทดสอบความแตกต่างทางสถิติทำให้ฉันสับสนเพราะ ANOVA ข้อมูลของฉันไม่ตรงกับการแจกแจงแบบปกติ แต่สำหรับ Kruskal Wallis ทดสอบการกระจายตัวของรูปร่างรูปร่างเดียวกันในกลุ่มคลัสเตอร์
Inga

1
@James ชี้ให้เห็นในคำตอบของเขาคุณคือ "การสอดแนม" อะไรคือเหตุผลในการทดสอบความสำคัญระหว่างกลุ่มที่คุณ (การจัดกลุ่มของคุณ) เลือกไว้ล่วงหน้าให้แตกต่างกันมากที่สุด ที่นี่ไม่มีเครื่องหมายใด ๆ ของการสุ่มหรือการสุ่มตัวอย่างแบบสัดส่วนจากประชากรที่มีความแตกต่างบนพื้นฐานของลักษณะภายนอกบางพื้นด้านหลัง
ttnphns

ขอบคุณสำหรับคำตอบ! ความสับสนของฉันปรากฏขึ้นในบางแหล่งฉันเห็นว่าการเปรียบเทียบค่าเฉลี่ยเชิงสถิติไม่เหมาะสมในสถานการณ์นี้ตามที่คุณได้ชี้ให้เห็น แต่ตัวอย่างเช่นอ้างจากบทที่ 1 เล่มของหนังสือบ่งชี้ตรงกันข้าม: "เรามักจะตรวจสอบวิธีการสำหรับแต่ละคลัสเตอร์ เพื่อประเมินความแตกต่างของคลัสเตอร์ของเราในทางอุดมคติเราจะได้รับวิธีการที่แตกต่างกันอย่างมีนัยสำคัญสำหรับส่วนใหญ่หากไม่ใช่ทุกมิติที่ใช้ในการวิเคราะห์ขนาดของค่า F ที่ดำเนินการในแต่ละมิตินั้นเป็นตัวบ่งชี้ว่า กลุ่ม "
Inga

1
คุณมีสิทธิ์ประเมินความแตกต่างระหว่างกลุ่มตามลักษณะที่ใช้เพื่อจัดกลุ่ม - เพื่อค้นหากลุ่มที่เลือกปฏิบัติมากที่สุด เมื่อทำเช่นนั้นคุณอาจคำนวณความแตกต่างสัมพัทธ์ค่า F และค่า p เป็นตัวชี้วัดขนาดของเอฟเฟกต์ ไม่เป็นตัวบ่งชี้นัยสำคัญทางสถิติ (ซึ่งอ้างถึงประชากร)
ttnphns

คำตอบ:


13

No!

คุณต้องไม่ใช้ข้อมูลเดียวกันกับ 1) ดำเนินการจัดกลุ่มและ 2) ค้นหาความแตกต่างที่สำคัญระหว่างจุดในกลุ่ม แม้ว่าจะไม่มีโครงสร้างที่แท้จริงในข้อมูลการจัดกลุ่มจะกำหนดโดยการจัดกลุ่มจุดที่อยู่ใกล้กัน สิ่งนี้จะลดความแปรปรวนภายในกลุ่มและเพิ่มความแปรปรวนข้ามกลุ่มซึ่งทำให้คุณมีความรู้สึกผิด

k

ผลการจำลองแสดงการแจกแจงแบบสม่ำเสมอของค่า pvalues ​​สำหรับการมอบหมายแบบสุ่มและการแจกแจงค่า p ที่บิดเบี้ยวอย่างมาก (เกือบทั้งหมด 0.05 หรือน้อยกว่า) หลังจากการทำคลัสเตอร์

ไม่มีอะไรพิเศษเกี่ยวกับ ANOVA ที่นี่ - คุณจะเห็นผลที่คล้ายกันโดยใช้การทดสอบที่ไม่ใช่พารามิเตอร์การถดถอยโลจิสติกส์อะไรก็ตาม โดยทั่วไปการตรวจสอบประสิทธิภาพของอัลกอริทึมการจัดกลุ่มนั้นเป็นเรื่องยากโดยเฉพาะอย่างยิ่งหากไม่มีการระบุข้อมูล อย่างไรก็ตามมีสองสามวิธีในการ "ตรวจสอบภายใน" หรือวัดคุณภาพของกลุ่มโดยไม่ต้องใช้แหล่งข้อมูลภายนอก พวกเขามักมุ่งเน้นไปที่ความกะทัดรัดและการแยกของกลุ่ม รีวิวนี้โดย Lui และคณะ (2010) อาจเป็นจุดเริ่มต้นที่ดี


4

ปัญหาที่แท้จริงของคุณคือการสอดแนมข้อมูล คุณไม่สามารถใช้ ANOVA หรือ KW หากการสังเกตถูกกำหนดให้กับกลุ่ม (กลุ่ม) โดยยึดตามข้อมูลอินพุตที่ตั้งค่าเอง สิ่งที่คุณสามารถทำได้คือใช้บางสิ่งบางอย่างเช่นสถิติ Gapเพื่อประเมินจำนวนกลุ่ม

ในทางกลับกันค่า p-snooped นั้นมีความเอนเอียงลงดังนั้นหากผลการทดสอบ ANOVA หรือ KW นั้นไม่มีนัยสำคัญดังนั้นค่า p "ของจริง" นั้นใหญ่กว่าและคุณอาจตัดสินใจรวมกลุ่ม


4

ฉันคิดว่าคุณสามารถใช้วิธีการดังกล่าว (เช่นโดยใช้สถิติเช่น F-สถิติหรือเสื้อสถิติหรืออะไรก็ตาม) ถ้าคุณโยนออกกระจาย null ปกติ

สิ่งที่คุณต้องทำคือจำลองสถานการณ์ที่มีค่า Null ของคุณเป็นจริงใช้ขั้นตอนทั้งหมด (การทำคลัสเตอร์ ฯลฯ ) แล้วคำนวณค่าสถิติในแต่ละครั้ง นำไปใช้กับการจำลองหลาย ๆ แบบคุณจะได้รับการแจกแจงสำหรับสถิติภายใต้ null ซึ่งเปรียบเทียบค่าตัวอย่างของคุณ โดยการรวมข้อมูลการสอดแนมในการคำนวณที่คุณบัญชีสำหรับผลกระทบ

[อีกวิธีหนึ่งอาจพัฒนาการทดสอบซ้ำตาม (ไม่ว่าจะเป็นการเรียงสับเปลี่ยน / การสุ่มหรือการบูต)


2
ใช่นั่นคือแนวคิดเบื้องหลังสถิติ Gap
James
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.