การทดสอบที่เปรียบเทียบการแจกแจงคือการทดสอบตามกฎ พวกเขาเริ่มต้นด้วยสมมติฐานว่างว่าประชากร 2 คนนั้นเหมือนกันจากนั้นลองปฏิเสธสมมติฐานนั้น เราไม่สามารถพิสูจน์ว่าโมฆะเป็นจริงเพียงแค่ปฏิเสธดังนั้นการทดสอบเหล่านี้ไม่สามารถนำมาใช้เพื่อแสดงให้เห็นว่าตัวอย่าง 2 ตัวอย่างมาจากประชากรเดียวกัน (หรือประชากรที่เหมือนกัน)
นี่เป็นเพราะอาจมีความแตกต่างเล็กน้อยในการแจกแจง (หมายถึงพวกเขาไม่เหมือนกัน) แต่มีขนาดเล็กมากที่การทดสอบไม่สามารถค้นหาความแตกต่างได้
พิจารณาการแจกแจง 2 แบบตัวแรกคือชุดจาก 0 ถึง 1 ส่วนที่สองคือการผสมกันของเครื่องแบบ 2 ชุดดังนั้นจึงเป็น 1 ระหว่าง 0 ถึง 0.999 และ 1 ระหว่าง 9.999 ถึง 10 (0 ที่อื่น) ชัดเจนว่าการกระจายเหล่านี้จะแตกต่างกัน (ไม่ว่าจะเป็นความแตกต่างที่มีความหมายเป็นคำถามอื่น) แต่ถ้าคุณใช้ขนาดตัวอย่าง 50 จากแต่ละ (รวม 100) มีโอกาส 90% ที่คุณจะเห็นค่าระหว่าง 0 ถึง 0.999 และ ไม่สามารถเห็นความแตกต่างที่แท้จริงได้
มีวิธีการทำสิ่งที่เรียกว่าการทดสอบความเท่ากันซึ่งคุณถามว่า 2 ดิสทริบิวชั่น / ประชากรนั้นเท่ากันหรือไม่ แต่คุณต้องกำหนดสิ่งที่คุณคิดว่าจะเทียบเท่า โดยทั่วไปแล้วการวัดความแตกต่างบางอย่างอยู่ในช่วงที่กำหนดนั่นคือความแตกต่างใน 2 วิธีนั้นน้อยกว่า 5% ของค่าเฉลี่ยของ 2 หมายถึงหรือสถิติ KS ต่ำกว่าค่าตัดที่กำหนดเป็นต้นหากคุณ จากนั้นสามารถคำนวณช่วงความเชื่อมั่นสำหรับสถิติที่แตกต่างกัน (ความแตกต่างของค่าเฉลี่ยอาจเป็นช่วงความเชื่อมั่น t, bootstrapping, การจำลองหรือวิธีการอื่นอาจจำเป็นสำหรับสถิติอื่น ๆ ) หากช่วงความเชื่อมั่นทั้งหมดตกอยู่ใน "ภูมิภาคความเท่าเทียม" เราจะพิจารณาประชากร 2 คน / การแจกแจงว่า "เทียบเท่า"
ส่วนที่ยากคือการหาว่าขอบเขตความเท่าเทียมควรเป็นเท่าไหร่