ฉันได้เรียนรู้ว่าฉันต้องทดสอบความเป็นปกติไม่ใช่ข้อมูลดิบ แต่เป็นของที่เหลืออยู่ ฉันควรคำนวณส่วนที่เหลือแล้วทำการทดสอบ W ของ Shapiro – Wilk หรือไม่
เศษที่เหลือคำนวณเป็น:หรือไม่
โปรดดูคำถามก่อนหน้านี้สำหรับข้อมูลและการออกแบบของฉัน
ฉันได้เรียนรู้ว่าฉันต้องทดสอบความเป็นปกติไม่ใช่ข้อมูลดิบ แต่เป็นของที่เหลืออยู่ ฉันควรคำนวณส่วนที่เหลือแล้วทำการทดสอบ W ของ Shapiro – Wilk หรือไม่
เศษที่เหลือคำนวณเป็น:หรือไม่
โปรดดูคำถามก่อนหน้านี้สำหรับข้อมูลและการออกแบบของฉัน
คำตอบ:
ทำไมคุณต้องทดสอบความเป็นปกติ?
สมมติฐานมาตรฐานในการถดถอยเชิงเส้นคือส่วนที่เหลือทางทฤษฎีมีความเป็นอิสระและกระจายตามปกติ ค่าสังเกตที่เหลืออยู่เป็นค่าประมาณของค่าทางทฤษฎี แต่ไม่ได้เป็นอิสระ (มีการแปลงค่าส่วนที่เหลือซึ่งทำให้ค่าการพึ่งพาบางส่วนหายไป แต่ยังคงให้ค่าประมาณค่าส่วนที่เหลือจริงเท่านั้น) ดังนั้นการทดสอบค่าตกค้างที่สังเกตได้ไม่ได้รับประกันว่าค่าตกค้างทางทฤษฎีจะตรงกับ
ถ้าส่วนที่เหลือตามทฤษฎีไม่ได้กระจายตามปกติอย่างแน่นอน แต่ขนาดตัวอย่างมีขนาดใหญ่พอแล้วทฤษฎีลิมิต จำกัด กล่าวว่าการอนุมานปกติ (การทดสอบและช่วงความเชื่อมั่น แต่ไม่จำเป็นต้องทำนายช่วงเวลา) ตามสมมติฐานของภาวะปกติจะยังคงถูกต้องโดยประมาณ .
นอกจากนี้โปรดทราบว่าการทดสอบความเป็นปกติคือการทดสอบออกกฎพวกเขาสามารถบอกคุณได้ว่าข้อมูลไม่น่าจะมาจากการแจกแจงแบบปกติ แต่ถ้าการทดสอบไม่สำคัญที่ไม่ได้หมายความว่าข้อมูลมาจากการแจกแจงแบบปกติก็อาจหมายความว่าคุณไม่มีพลังมากพอที่จะเห็นความแตกต่าง ขนาดตัวอย่างที่ใหญ่ขึ้นนั้นให้พลังมากขึ้นในการตรวจจับความไม่ปกติ แต่ตัวอย่างที่ใหญ่กว่าและ CLT นั้นหมายความว่าการไม่ได้มาตรฐานนั้นมีความสำคัญน้อยที่สุด ดังนั้นสำหรับกลุ่มตัวอย่างขนาดเล็กข้อสันนิษฐานของภาวะปกติจึงมีความสำคัญ แต่การทดสอบนั้นไม่มีความหมายสำหรับขนาดตัวอย่างขนาดใหญ่การทดสอบอาจมีความแม่นยำมากขึ้น แต่คำถามของภาวะปกตินั้นแน่นอนจะไม่มีความหมาย
ดังนั้นการรวมทั้งหมดข้างต้นสิ่งที่สำคัญกว่าการทดสอบความเป็นบรรทัดฐานที่แน่นอนคือความเข้าใจในวิทยาศาสตร์หลังข้อมูลเพื่อดูว่าประชากรอยู่ใกล้เพียงพอหรือไม่ กราฟเช่น qqplots สามารถวินิจฉัยได้ดี แต่จำเป็นต้องมีความเข้าใจในวิทยาศาสตร์ด้วยเช่นกัน หากมีความกังวลว่ามีความเบ้หรือศักยภาพมากเกินไปสำหรับผู้ผิดกฎหมายวิธีการที่ไม่ใช้พารามิเตอร์จะมีให้ซึ่งไม่จำเป็นต้องมีข้อสันนิษฐานทั่วไป
การคำนวณแบบเกาส์หมายถึงเศษเหลือจากแบบจำลอง ไม่มีข้อสมมติฐานที่จำเป็นเกี่ยวกับข้อมูลต้นฉบับ ในกรณีที่มีการกระจายการขายเบียร์รายวัน หลังจากรูปแบบที่เหมาะสมจับวันของสัปดาห์ผลวันหยุด / เหตุการณ์ระดับกะ / แนวโน้มเวลาที่เราได้รับ
ก่อนอื่นคุณสามารถ "eyeball it" โดยใช้QQ-plotเพื่อรับความรู้สึกทั่วไปที่นี่คือวิธีสร้างหนึ่งใน R
ตามคู่มือ Rคุณสามารถป้อนข้อมูลเวกเตอร์ข้อมูลของคุณลงในฟังก์ชัน shapiro.test () ได้โดยตรง
หากคุณต้องการคำนวณเศษซากด้วยตัวเองใช่ว่ามีการคำนวณเศษซากแต่ละส่วนด้วยวิธีนั้นเหนือชุดการสังเกตของคุณ ท่านสามารถดูรายละเอียดเพิ่มเติมเกี่ยวกับเรื่องนี้ที่นี่