การทดสอบทางสถิติมาตรฐานคืออะไรเพื่อดูว่าข้อมูลเป็นไปตามการแจกแจงแบบเอ็กซ์โพเนนเชียลหรือการแจกแจงปกติ?
การทดสอบทางสถิติมาตรฐานคืออะไรเพื่อดูว่าข้อมูลเป็นไปตามการแจกแจงแบบเอ็กซ์โพเนนเชียลหรือการแจกแจงปกติ?
คำตอบ:
ดูเหมือนว่าคุณกำลังพยายามตัดสินใจว่าจะสร้างแบบจำลองข้อมูลของคุณโดยใช้การแจกแจงแบบปกติหรือแบบเอ็กซ์โปเนนเชียล ดูเหมือนว่าจะแปลกสำหรับฉันเนื่องจากการกระจายเหล่านี้แตกต่างจากกันมาก
การแจกแจงแบบปกตินั้นสมมาตรในขณะที่การแจกแจงเอ็กซ์โพเนนเชียลบิดเบี้ยวไปทางขวาอย่างหนักโดยไม่มีค่าลบ โดยปกติจะเป็นตัวอย่างจากการกระจายการชี้แจงจะมีหลายข้อสังเกตค่อนข้างใกล้เคียงกับและ obervations ไม่กี่คนที่เบี่ยงเบนไปทางขวาห่างไกลจาก0ความแตกต่างนี้มักจะเห็นได้ชัดเจน
นี่คือตัวอย่างที่ฉันจำลองการสังเกตจากการแจกแจงแบบปกติที่มีค่าเฉลี่ยและความแปรปรวนและการแจกแจงเอ็กซ์โพเนนเชียลด้วยค่าเฉลี่ยและความแปรปรวน :
ความสมมาตรของการแจกแจงแบบปกติและความเบ้ของเลขชี้กำลังสามารถดูได้โดยใช้ฮิสโตแกรม, บ็อกซ์พล็อตและการกระจายแบบกระจายตามที่แสดงในภาพด้านบน
อีกหนึ่งเครื่องมือที่มีประโยชน์มากเป็นQQ พล็อต ในตัวอย่างด้านล่างคะแนนควรประมาณตามเส้นถ้าตัวอย่างมาจากการแจกแจงแบบปกติ อย่างที่คุณเห็นนี่เป็นกรณีของข้อมูลปกติ แต่ไม่ใช่สำหรับข้อมูลเอ็กซ์โปเนนเชียล
หากการตรวจสอบกราฟิกด้วยเหตุผลบางอย่างไม่เพียงพอสำหรับคุณคุณยังสามารถใช้การทดสอบเพื่อตรวจสอบว่าการกระจายของคุณเป็นปกติหรือเลขยกกำลัง เนื่องจากการแจกแจงแบบปกติเป็นแบบสเกลและตระกูลคุณจะต้องใช้การทดสอบที่ไม่เปลี่ยนแปลงภายใต้การเปลี่ยนแปลงขนาดและตำแหน่ง (เช่นผลการทดสอบไม่ควรเปลี่ยนแปลงหากคุณเปลี่ยนการวัดจากนิ้วเป็นเซนติเมตรหรือเพิ่มการสังเกตทั้งหมดของคุณ)
เมื่อสมมติฐานว่างเปล่าคือการแจกแจงปกติและสมมติฐานทางเลือกคือมันเป็นการยกกำลังการทดสอบตำแหน่งและมาตราส่วนคงที่ที่ทรงพลังที่สุดจะได้รับจากสถิติ โดยที่เป็นค่าเฉลี่ยตัวอย่างคือการสังเกตที่เล็กที่สุดในตัวอย่างและคือค่าเบี่ยงเบนมาตรฐานตัวอย่าง เรื่องปรกตินั้นถูกปฏิเสธเนื่องจากเห็นได้ว่าหากใหญ่เกินไป
การทดสอบนี้เป็นจริงรุ่นด้านเดียวของการทดสอบกรับส์สำหรับค่าผิดปกติ คุณจะพบว่าสิ่งนี้นำไปใช้กับซอฟต์แวร์ทางสถิติส่วนใหญ่ (แต่ให้แน่ใจว่าคุณใช้รุ่นที่ถูกต้อง - มีสถิติการทดสอบทางเลือกมากมายที่ใช้สำหรับการทดสอบที่ผิดปกติ!)
ข้อมูลอ้างอิงสำหรับเป็นแบบทดสอบที่มีประสิทธิภาพมากที่สุด:ส่วนที่ 4.2.4 ของการทดสอบตามปกติโดย HC Thode
ดู KC กะเปอร์และ LR Lamberson ความน่าเชื่อถือในการออกแบบทางวิศวกรรม ไวลีย์ 1977
สำหรับค่านิยมแอนเดอร์สัน - ดาร์ลิ่งและชาปิโร - วิลค์ถือว่าดีที่สุด สำหรับการทดสอบ Lillerfors เอ็กซ์โพเนนเชียลนั้นได้รับการออกแบบมาโดยเฉพาะสำหรับมัน
คุณได้พิจารณาวิธีกราฟิกเพื่อดูว่าข้อมูลทำงานอย่างไร
เทคนิคกราฟความน่าจะเป็นมักจะเกี่ยวข้องกับการจัดอันดับข้อมูลโดยใช้การผกผัน CDF แล้ววางแผนผลลัพธ์บนระนาบคาร์ทีเซียน สิ่งนี้ช่วยให้คุณเห็นว่าหลายค่าเบี่ยงเบนไปจากการแจกแจงแบบตั้งสมมติฐานและอาจอธิบายสาเหตุของการเบี่ยงเบน