สิ่งที่คุณสรุปได้ว่าข้อมูล IID นั้นมาจากข้อมูลภายนอกไม่ใช่ข้อมูลเอง คุณในฐานะนักวิทยาศาสตร์ต้องพิจารณาว่ามีความสมเหตุสมผลหรือไม่ที่จะสมมติว่าข้อมูล IID นั้นขึ้นอยู่กับการรวบรวมข้อมูลและข้อมูลภายนอกอื่น ๆ
ลองพิจารณาตัวอย่าง
สถานการณ์ที่ 1: เราสร้างชุดข้อมูลแยกต่างหากจากการแจกแจงเดี่ยวที่เกิดจากการผสมผสานของ 2 บรรทัดฐาน
สถานการณ์ที่ 2: ก่อนอื่นเราสร้างตัวแปรเพศจากการแจกแจงแบบทวินามจากนั้นภายในเพศชายและเพศหญิงเราสร้างข้อมูลจากการแจกแจงแบบปกติ (แต่บรรทัดฐานแตกต่างกันสำหรับเพศชายและเพศหญิง) จากนั้นเราลบหรือสูญเสียข้อมูลเพศ
ในสถานการณ์ที่ 1 ข้อมูลคือ IID และในสถานการณ์ที่ 2 ข้อมูลไม่ได้กระจายอย่างชัดเจนเหมือนกัน (การแจกแจงที่แตกต่างกันสำหรับเพศชายและเพศหญิง) แต่การแจกแจง 2 แบบสำหรับสถานการณ์ 2 นั้นไม่สามารถแยกแยะได้จากข้อมูล ถูกสร้างขึ้นเพื่อกำหนดความแตกต่าง
สถานการณ์ที่ 3: ฉันใช้ตัวอย่างแบบสุ่มของผู้คนที่อาศัยอยู่ในเมืองของฉันและจัดการการสำรวจและวิเคราะห์ผลลัพธ์เพื่อทำการอนุมานเกี่ยวกับผู้คนทั้งหมดในเมือง
สถานการณ์ที่ 4: ฉันใช้ตัวอย่างแบบสุ่มของผู้คนที่อาศัยอยู่ในเมืองของฉันและจัดการการสำรวจและวิเคราะห์ผลลัพธ์เพื่อทำการอนุมานเกี่ยวกับผู้คนในประเทศ
ในสถานการณ์ที่ 3 อาสาสมัครจะได้รับการพิจารณาเป็นอิสระ (ตัวอย่างสุ่มอย่างง่ายของประชากรที่น่าสนใจ) แต่ในสถานการณ์ที่ 4 พวกเขาจะไม่ได้รับการพิจารณาว่าเป็นอิสระเพราะพวกเขาได้รับการคัดเลือกจากกลุ่มย่อยเล็ก ๆ ของประชากรที่น่าสนใจ การพึ่งพาอาศัยกัน แต่ชุดข้อมูล 2 ชุดนั้นเหมือนกันมันเป็นวิธีที่เราตั้งใจจะใช้ข้อมูลที่กำหนดว่าเป็นอิสระหรือขึ้นอยู่กับกรณีนี้
ดังนั้นจึงไม่มีวิธีทดสอบโดยใช้เฉพาะข้อมูลที่แสดงว่าข้อมูลคือ IID พล็อตและการวินิจฉัยอื่น ๆ สามารถแสดงประเภทที่ไม่ใช่ IID ได้ แต่การขาดสิ่งเหล่านี้ไม่รับประกันว่าข้อมูลนั้นเป็น IID นอกจากนี้คุณยังสามารถเปรียบเทียบกับสมมติฐานที่เฉพาะเจาะจง (IID ปกติง่ายต่อการพิสูจน์มากกว่า IID) การทดสอบใด ๆ ยังคงเป็นกฎ แต่ความล้มเหลวในการปฏิเสธการทดสอบไม่เคยพิสูจน์ว่าเป็น IID
การตัดสินใจเกี่ยวกับว่าคุณยินดีที่จะสมมติว่าเงื่อนไข IID ถูกระงับหรือไม่นั้นต้องขึ้นอยู่กับศาสตร์ของการรวบรวมข้อมูลว่าเกี่ยวข้องกับข้อมูลอื่น ๆ อย่างไรและจะนำไปใช้อย่างไร
การแก้ไข:
นี่คือตัวอย่างอีกชุดสำหรับแบบไม่เหมือนกัน
สถานการณ์ที่ 5: ข้อมูลเป็นส่วนที่เหลือจากการถดถอยที่มีความแตกต่างกัน (ความแตกต่างไม่เท่ากัน)
สถานการณ์ที่ 6: ข้อมูลมาจากการผสมผสานของ normals ที่มีค่าเฉลี่ย 0 แต่ความแปรปรวนที่แตกต่างกัน
ในสถานการณ์ที่ 5 เราสามารถเห็นได้อย่างชัดเจนว่าส่วนที่เหลือจะไม่กระจายตัวเหมือนกันถ้าเราพล็อตส่วนที่เหลือเทียบกับค่าติดตั้งหรือตัวแปรอื่น ๆ (ตัวทำนายหรือตัวทำนายที่อาจเกิดขึ้น) แต่ส่วนที่เหลือเอง