สมมติว่าคุณได้รับชุดข้อมูลหลายตัวแปรสองชุดกล่าวว่าชุดเก่าและชุดใหม่และควรถูกสร้างขึ้นด้วยกระบวนการเดียวกัน (ซึ่งคุณไม่มีรูปแบบ) แต่บางทีอยู่ที่ไหนสักแห่งตามแนวการรวบรวม / การสร้าง ข้อมูลมีบางสิ่งผิดพลาด คุณไม่ต้องการใช้ข้อมูลใหม่เป็นชุดการตรวจสอบความถูกต้องสำหรับข้อมูลเก่าหรือเพื่อเพิ่มลงในข้อมูลเก่า
คุณสามารถทำสถิติ 1 มิติ (ต่อตัวแปร) เช่นผลรวมอันดับ Wilcoxon และลองแก้ไขการทดสอบหลาย ๆ อย่าง แต่ฉันไม่แน่ใจว่าเหมาะสมที่สุด (เพื่อจับภาพความซับซ้อนของข้อมูลหลายตัวแปรทำให้เกิดปัญหาการทดสอบหลายครั้ง) วิธีหนึ่งคือการใช้ตัวจําแนกและดูว่าคุณสามารถแยกแยะระหว่างชุดข้อมูลสองชุด (ให้ตัวจําแนกที่ดีที่สุดที่เหมาะสมที่สุด) ดูเหมือนจะใช้งานได้ แต่ยังคงเป็น a) perhpas มีวิธีที่ดีกว่า b) มันไม่ได้ถูกออกแบบมาเพื่อบอกคุณว่าทำไมมันถึงแตกต่างกัน (ถ้าไม่มีอะไรเลยมันจะใช้ตัวทำนายที่ดีที่สุดและอาจพลาด