การตีความพล็อต QQ


12

พิจารณารหัสและผลลัพธ์ต่อไปนี้:

  par(mfrow=c(3,2))
  # generate random data from weibull distribution
  x = rweibull(20, 8, 2)
  # Quantile-Quantile Plot for different distributions
  qqPlot(x, "log-normal")
  qqPlot(x, "normal")
  qqPlot(x, "exponential", DB = TRUE)
  qqPlot(x, "cauchy")
  qqPlot(x, "weibull")
  qqPlot(x, "logistic")

ป้อนคำอธิบายรูปภาพที่นี่

ดูเหมือนว่าพล็อต QQ สำหรับบันทึกปกติเกือบจะเหมือนกับพล็อต QQ สำหรับ weibull เราจะแยกแยะพวกมันได้อย่างไร นอกจากนี้หากคะแนนอยู่ในพื้นที่ที่กำหนดโดยเส้นสีดำด้านนอกสองเส้นนั่นแสดงว่ามันเป็นไปตามการแจกแจงที่ระบุหรือไม่?


ฉันเชื่อว่าคุณกำลังใช้แพ็คเกจรถใช่ไหม? ถ้าเป็นเช่นนั้นคุณควรรวมคำสั่งlibrary(car)ในรหัสของคุณเพื่อให้ผู้คนติดตามได้ง่ายขึ้น โดยทั่วไปคุณอาจต้องการตั้งค่าเมล็ดพันธุ์ (เช่นset.seed(1)) เพื่อทำซ้ำตัวอย่างเพื่อให้ทุกคนสามารถได้รับจุดข้อมูลเดียวกันกับที่คุณได้รับแม้ว่ามันอาจจะไม่สำคัญเท่านี้
gung - Reinstate Monica

2
สิ่งนี้จะไม่ทำงานบนคอมพิวเตอร์ของฉันตามที่เขียนไว้ ตัวอย่างเช่น qqPlot จากแพ็กเกจรถยนต์ต้องการบรรทัดฐานสำหรับปกติและ lnorm สำหรับล็อกออฟปกติ ฉันกำลังคิดถึงอะไร
Tom

2
@ Tom ฉันเข้าใจผิดเกี่ยวกับแพคเกจ เห็นได้ชัดว่าเป็นแพ็คเกจเครื่องมือคุณภาพ นอกจากนี้ตัวอย่างที่ดูเหมือนว่าจะนำมาจากที่นี่
gung - Reinstate Monica

ทางเลือกที่น่าสนใจคือกราฟ Cullen และ Frey ดูที่stats.stackexchange.com/questions/243973/… ตัวอย่าง
kjetil b halvorsen

คำตอบ:


12

มีบางสิ่งที่จะพูดที่นี่:

  1. รูปร่างของ CDF สำหรับบันทึกปกติจะคล้ายกับรูปร่างของ CDF ของWeibullเพื่อทำให้แยกแยะได้ยากกว่าระดับความคล้ายคลึงระหว่าง Weibull และอื่น ๆ
  2. เส้นสีดำด้านนอกรูปแบบวงความเชื่อมั่น การใช้งานของกลุ่มความเชื่อมั่นในการอนุมานเป็นเช่นเดียวกับรูปแบบมาตรฐานอื่น ๆ ของการอนุมานทางสถิติประจำ นั่นคือเมื่อค่าตกอยู่ในวงเราไม่สามารถปฏิเสธสมมติฐานว่างได้ว่าการกระจายที่ถูกต้องเป็นค่าที่ถูกต้อง สิ่งนี้ไม่เหมือนกับการบอกว่าเรารู้ว่าการแจกแจงแบบโพสต์เป็นสิ่งที่ถูกต้อง (หมายเหตุว่านี่เป็นตัวอย่างที่ดีของสิ่งที่ผมกล่าวถึงในคำตอบอื่นที่นี่ของสถานการณ์ที่มุมมอง Fisherian ในการทดสอบสมมติฐานจะเป็นที่นิยมในการ Neyman-เพียร์สัน.)
  3. ยังไม่มีข้อความ

มีวิธีในการตรวจสอบการแจกแจงสำหรับตัวอย่างขนาดเล็กหรือไม่?
โปรตอน

ในความเป็นจริงดูเหมือนว่าคะแนนอยู่ในแถบความเชื่อมั่นสำหรับการแจกแจงทั้งหมด ดังนั้นเราจึงแยกแยะการกระจายไม่ได้?
โปรตอน

1
n=205%

2
+1 กับตัวอย่างขนาดเล็ก การใช้ 300 ตัวอย่างจะช่วยแยกแยะสิ่งต่าง ๆ มากมาย โปรตอน: ไม่คุณไม่สามารถแยกแยะการแจกแจงด้วยตัวอย่างเล็ก ๆ ได้ ทำไมคุณถึงได้? มันเหมือนกับพยายามระบุใบหน้าด้วย 20 พิกเซล
Wayne

3

ดูเหมือนว่าพล็อต QQ สำหรับบันทึกปกติเกือบจะเหมือนกับพล็อต QQ สำหรับ weibull

ใช่.

เราจะแยกแยะพวกมันได้อย่างไร

ที่ขนาดตัวอย่างคุณอาจไม่สามารถทำได้

นอกจากนี้หากคะแนนอยู่ในพื้นที่ที่กำหนดโดยเส้นสีดำด้านนอกสองเส้นนั่นแสดงว่ามันเป็นไปตามการแจกแจงที่ระบุหรือไม่?

ไม่มันบ่งบอกว่าคุณไม่สามารถบอกการกระจายของข้อมูลว่าแตกต่างจากการแจกจ่ายนั้น มันไม่มีหลักฐานของความแตกต่างไม่ใช่หลักฐานของการขาดความแตกต่าง

คุณสามารถเป็นเกือบจะแน่ใจว่าข้อมูลจากการจัดจำหน่ายที่ไม่ได้ใด ๆ ของคนที่คุณได้รับการพิจารณาเป็น (ทำไมมันจะตรงจากส่วนใดของเหล่านั้นหรือไม่)


เช่นเดียวกับถ้อยคำ: "มันไม่มีหลักฐานของความแตกต่างไม่ใช่หลักฐานของการขาดความแตกต่าง"
jlandercy
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.