หากเราต้องการเห็นการกระจายของข้อมูลอย่างต่อเนื่องเห็นได้ชัดว่าควรใช้อันใดในฮิสโตแกรมและ pdf
ฮิสโทแกรมและ pdf ต่างกันอย่างไร?
หากเราต้องการเห็นการกระจายของข้อมูลอย่างต่อเนื่องเห็นได้ชัดว่าควรใช้อันใดในฮิสโตแกรมและ pdf
ฮิสโทแกรมและ pdf ต่างกันอย่างไร?
คำตอบ:
เพื่อชี้แจงจุด Dirks:
สมมติว่าข้อมูลของคุณเป็นตัวอย่างของการแจกแจงแบบปกติ คุณสามารถสร้างพล็อตต่อไปนี้:
เส้นสีแดงคือการประมาณความหนาแน่นเชิงประจักษ์เส้นสีฟ้าเป็น pdf เชิงทฤษฎีของการแจกแจงแบบปกติพื้นฐาน โปรดทราบว่าฮิสโตแกรมจะแสดงเป็นความหนาแน่นไม่ใช่ในความถี่ที่นี่ สิ่งนี้ทำเพื่อจุดประสงค์ในการวางแผนโดยทั่วไปจะใช้ความถี่ในฮิสโตแกรม
ดังนั้นเพื่อตอบคำถามของคุณ: คุณใช้การแจกแจงเชิงประจักษ์ (เช่นฮิสโตแกรม) หากคุณต้องการอธิบายตัวอย่างของคุณและ pdf หากคุณต้องการอธิบายการแจกแจงแบบตั้งสมมติฐาน
พล็อตถูกสร้างขึ้นโดยรหัสต่อไปนี้ใน R:
x <- rnorm(100)
y <- seq(-4,4,length.out=200)
hist(x,freq=F,ylim=c(0,0.5))
lines(density(x),col="red",lwd=2)
lines(y,dnorm(y),col="blue",lwd=2)
ฮิสโตแกรมเป็นการประมาณอายุก่อนคอมพิวเตอร์ของความหนาแน่น การประเมินความหนาแน่นเป็นทางเลือก
วันนี้เราใช้ทั้งคู่และมีวรรณกรรมมากมายที่ควรใช้เป็นค่าเริ่มต้น
ในทางตรงกันข้าม PDF เป็นนิพจน์แบบปิดสำหรับการแจกแจงที่กำหนด ซึ่งแตกต่างจากการอธิบายชุดข้อมูลของคุณด้วยความหนาแน่นหรือฮิสโตแกรมโดยประมาณ
ไม่มีกฎที่ยากและรวดเร็วที่นี่ ถ้าคุณรู้ว่าความหนาแน่นของประชากร PDF จะดีกว่าไหม ในทางกลับกันเรามักจะจัดการกับตัวอย่างและฮิสโตแกรมอาจถ่ายทอดข้อมูลบางอย่างที่ความหนาแน่นโดยประมาณครอบคลุม ตัวอย่างเช่น Andrew Gelman ทำให้ประเด็นนี้:
ข้อดีที่สำคัญของฮิสโตแกรมก็คือในส่วนของข้อมูลดิบมันมีเมล็ดของการประเมินความผิดพลาดของมันเอง หรืออีกวิธีหนึ่งความขรุขระของฮิสโตแกรมที่ไม่ได้เลื่อนไปเล็กน้อยนั้นทำหน้าที่ให้บริการที่เป็นประโยชน์โดยแสดงให้เห็นความแปรปรวนของการสุ่มตัวอย่าง นั่นเป็นเหตุผลที่ถ้าคุณดูฮิสโตแกรมในหนังสือของฉันและบทความที่ตีพิมพ์ฉันแค่ใช้ถังขยะจำนวนมาก ฉันก็แทบจะไม่ชอบประมาณการความหนาแน่นของเคอร์เนลที่บางครั้งผู้คนใช้เพื่อแสดงการแจกแจงแบบหนึ่งมิติ ฉันอยากเห็นฮิสโตแกรมและรู้ว่าข้อมูลอยู่ที่ไหน
ฮิสโตแกรมความถี่สัมพัทธ์ ( ไม่ต่อเนื่อง )
ฮิสโตแกรมความหนาแน่น ( ไม่ต่อเนื่อง )
ฟังก์ชันความหนาแน่นของความน่าจะเป็น PDF ( ต่อเนื่อง )
การอ้างอิงเหล่านี้มีประโยชน์ :) http://stattrek.com/statistics/dictionary.aspx?definition=Probability_density_function
Continuous_probability_distributionจากเว็บไซต์ด้านบน
http://www.geog.ucsb.edu/~joel/g210_w07/lecture_notes/lect04/oh07_04_1.html