ทดสอบว่าการแจกแจงหลายตัวแปรสองตัวอย่างถูกสุ่มจากประชากรพื้นฐานเดียวกันได้อย่างไร


13

สมมติว่าคุณได้รับชุดข้อมูลหลายตัวแปรสองชุดกล่าวว่าชุดเก่าและชุดใหม่และควรถูกสร้างขึ้นด้วยกระบวนการเดียวกัน (ซึ่งคุณไม่มีรูปแบบ) แต่บางทีอยู่ที่ไหนสักแห่งตามแนวการรวบรวม / การสร้าง ข้อมูลมีบางสิ่งผิดพลาด คุณไม่ต้องการใช้ข้อมูลใหม่เป็นชุดการตรวจสอบความถูกต้องสำหรับข้อมูลเก่าหรือเพื่อเพิ่มลงในข้อมูลเก่า

คุณสามารถทำสถิติ 1 มิติ (ต่อตัวแปร) เช่นผลรวมอันดับ Wilcoxon และลองแก้ไขการทดสอบหลาย ๆ อย่าง แต่ฉันไม่แน่ใจว่าเหมาะสมที่สุด (เพื่อจับภาพความซับซ้อนของข้อมูลหลายตัวแปรทำให้เกิดปัญหาการทดสอบหลายครั้ง) วิธีหนึ่งคือการใช้ตัวจําแนกและดูว่าคุณสามารถแยกแยะระหว่างชุดข้อมูลสองชุด (ให้ตัวจําแนกที่ดีที่สุดที่เหมาะสมที่สุด) ดูเหมือนจะใช้งานได้ แต่ยังคงเป็น a) perhpas มีวิธีที่ดีกว่า b) มันไม่ได้ถูกออกแบบมาเพื่อบอกคุณว่าทำไมมันถึงแตกต่างกัน (ถ้าไม่มีอะไรเลยมันจะใช้ตัวทำนายที่ดีที่สุดและอาจพลาด

คำตอบ:


3
http://131.95.113.139/courses/multivariate/mantel.pdf

อธิบายวิธีที่เป็นไปได้สองวิธีในการทำเช่นนั้นถ้าชุดข้อมูลของคุณมีขนาดเท่ากัน วิธีการพื้นฐานคือการคำนวณระยะทางระหว่างเมทริกซ์ที่สังเกตได้สองตัว จากนั้นจะตรวจสอบว่าระยะทางที่มีความสำคัญคุณใช้ทดสอบการเปลี่ยนแปลง

หากชุดข้อมูลของคุณมีขนาดไม่เท่ากันคุณสามารถใช้การทดสอบการจับคู่แม้ว่าจะไม่ได้รับความนิยมมาก แทนที่จะเป็นแบบทดสอบการจับคู่แบบข้ามคุณสามารถลองขึ้นหรือลงเพื่อสุ่มตัวอย่างข้อมูลของคุณเพื่อให้มีขนาดเท่ากันจากนั้นใช้หนึ่งในวิธีการที่กล่าวถึงในบทความแรก


คุณพูดถึงว่าเรามีชุดข้อมูลขนาดไม่เท่ากันหรือไม่ให้ใช้การทดสอบการจับคู่ อย่างไรก็ตามหลังจากบทความที่คุณพูดถึงพวกเขาใช้ชุดข้อมูลที่เท่ากันและดูการจับคู่ตามระยะทาง คุณพบหลักฐานของการใช้นี้หรือไม่? แม้ในบันทึกประจำรุ่นสำหรับการจับคู่ตัวอย่างก็ใช้ชุดข้อมูลที่เท่ากัน
lukeg

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.