วิธีการตีความความสูงของพล็อตความหนาแน่น


12

ฉันจะตีความความสูงของแปลงความหนาแน่นได้อย่างไร:

ป้อนคำอธิบายรูปภาพที่นี่

ตัวอย่างเช่นในพล็อตข้างต้นจุดสูงสุดอยู่ที่ประมาณ 0.07 ที่ x = 18 ฉันสามารถสรุปได้ว่าประมาณ 7% ของค่าประมาณ 18? ฉันจะเจาะจงมากกว่านี้ได้ไหม? นอกจากนี้ยังมีจุดสูงสุดที่สองที่ x = 30 ที่มีความสูง 0.02 นั่นหมายความว่าประมาณ 2% ของค่าประมาณ 30?

แก้ไข: คำถามเกี่ยวกับค่าการแจกแจงความน่าจะเป็นที่เกิน 1 นั้นเป็นไปได้ไหมกล่าวถึงค่าความน่าจะเป็น> 1 ซึ่งไม่ใช่ปัญหาเลย นอกจากนี้ยังกล่าวถึงความสัมพันธ์ที่ไร้เดียงสากับ Bayes classfier ซึ่งไม่ใช่จุดที่นี่ ฉันต้องการมีการอนุมานเชิงตัวเลขที่เราสามารถวาดจากเส้นโค้งความหนาแน่นเช่นในภาษาที่เรียบง่าย มีการกล่าวถึงบทบาทของพื้นที่ภายใต้เส้นโค้ง แต่คำถามของฉันคือสิ่งที่เราสามารถอนุมานได้โดยเฉพาะเกี่ยวกับชุดค่าผสม x และ y เฉพาะที่มีอยู่บนเส้นโค้ง ตัวอย่างเช่นเราจะเชื่อมโยง x = 30 และ y = 0.02 บนกราฟนี้ได้อย่างไร เราสามารถเขียนข้อความอะไรเกี่ยวกับความสัมพันธ์ระหว่าง 30 ถึง 0.02 ที่นี่ เนื่องจากความหนาแน่นมีค่าหน่วยเดียวเราสามารถพูดได้ว่า 2% ของค่าเกิดขึ้นระหว่าง 29.5 และ 30.5? หากเป็นกรณีนี้เราจะตีความได้อย่างไรว่าค่าแตกต่างจากเพียง 0 ถึง 1 เช่นเดียวกับพล็อตต่อไปนี้:

ป้อนคำอธิบายรูปภาพที่นี่

หาก 100% ของค่าเกิดขึ้นระหว่าง 0 ถึง 1 เหตุใดโค้งจึงมีอยู่นอก 0 และ 1

มีส่วนแบนที่นี่ที่ x = 0.1 ถึง x = 0.2 โดยที่ y เท่ากับ 0.8 มันเป็นรูปสี่เหลี่ยมผืนผ้า เราจะทราบได้อย่างไรว่าสัดส่วนของค่าใดเกิดขึ้นระหว่าง x = 0.1 และ x = 0.2

(ป.ล. : หากคุณพบว่าคำถามนี้น่าสนใจ / สำคัญโปรดโหวตขึ้น;)



4
เธรดแรกที่กล่าวถึงว่าซ้ำซ้อนนั้นมีความเกี่ยวข้องแม้จะมีการใช้ถ้อยคำที่แม่นยำในชื่อเรื่องเนื่องจากมันทำให้ประเด็นสำคัญที่คำนวณจากตัวแปรต่อเนื่องความหนาแน่นของความน่าจะเป็นไม่ใช่ความน่าจะเป็น (เวอร์ชันที่ละเอียดยิ่งขึ้นจะกำหนดความหนาแน่นอย่างเข้มงวดและรวมถึงความเป็นไปได้ที่ความหนาแน่นถูกกำหนดโดยการนับการวัด)
Nick Cox

ฉันเห็นด้วยกับ @NickCox แม้ว่าจะมีการแก้ไขเพิ่มเติม แต่ก็มีจุดเน้นที่พื้นที่ (ซึ่งเป็นเหมือนคำถามที่สาม) และความสูง (ซึ่งเป็นเหมือนคำถามที่สอง) ในรายการคำถามที่เกี่ยวข้องอย่างใกล้ชิดของทิม
Silverfish

3
นอกจากนี้ยังมีประเด็นแยกต่างหากที่ไม่ได้เกิดขึ้นในคำถามเหล่านั้นซึ่งเป็นสาเหตุที่ฉันไม่คิดว่านี่เป็นภาพรวมของคำถามเหล่านั้นซ้ำ ๆ : ทำไมในเชิงประจักษ์เมื่อเทียบกับความหนาแน่นเชิงทฤษฎีสามารถมี "ความหนาแน่น" นอก การสนับสนุน (หรือค่าสังเกต) ของการกระจาย? ที่ต้องมีการอภิปรายเพิ่มเติมเกี่ยวกับแบนด์วิดท์และการสร้างและการตีความของความหนาแน่นของเคอร์เนล บางทีคำถามนี้อาจได้รับประโยชน์จากการแก้ไขและทบทวนประเด็นที่ไม่ซ้ำกับคำถามที่มีอยู่
Silverfish

คำตอบ:


6

คุณต้องระวังถ้อยคำของคุณที่นี่ สมมติว่าxเป็นตัวแปรต่อเนื่องความน่าจะเป็นของค่าแต่ละค่าจะเป็นศูนย์อย่างแม่นยำ การพูดคุยกับคุณได้เกี่ยวกับความน่าจะเป็นของค่าโกหกรอบบางจุดที่ดีแม้ว่าคุณอาจต้องการที่จะเป็นบิตที่แม่นยำมากขึ้น ข้อความที่สองของคุณซึ่งคุณให้ช่วงเวลาพร้อมกับความน่าจะเป็นเป็นสิ่งที่ฉันจะมองหา

ในสาระสำคัญฟังก์ชันความหนาแน่นที่เกี่ยวข้องกับxจะบอกคุณเกี่ยวกับความน่าจะเป็น (นั่นคือสาเหตุที่เรียกว่าความหนาแน่น ) เห็นได้ชัดว่าช่วงเวลาที่คุณจะรวมอาจมีขนาดเล็กโดยพลการดังนั้นคุณสามารถเข้าใกล้จุดหนึ่งไปสู่ระดับใดก็ได้ ที่กล่าวว่าเมื่อฟังก์ชั่นความหนาแน่นที่แตกต่างกันจะช้ามากกว่าช่วงเวลาที่คุณจะได้ใกล้เคียงกับหนึ่งโดยบางส่วนเทคนิคตัวเลขเช่นกฎสี่เหลี่ยมคางหมู

เพื่อสรุป: ความสูงของฟังก์ชั่นความหนาแน่นคือเพียงแค่นั้นความสูงของมัน สิ่งใดที่คุณอาจต้องการสรุปเกี่ยวกับความน่าจะเป็นจะต้องรวมการรวมรูปแบบหรืออื่น ๆ


พื้นที่ใต้เส้นโค้งรวมเป็น 1.0 เสมอในพล็อตประเภทนี้หรือไม่?
นักนิเวศวิทยา

1
@ ecologist1234 ใช่เนื่องจากนี่คือการกระจายความหนาแน่นของความน่าจะเป็นอินทิกรัลจากถึง (ที่ "แย่ที่สุด") จะส่งผลให้ 1.0 หมายความว่าข้อมูลทั้งหมดอยู่ที่ใดช่วงหนึ่งที่มีความน่าจะเป็น 100%
Fato39
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.