ช่วยฉันเข้าใจฟังก์ชัน quantile (inverse CDF)


25

ฉันกำลังอ่านเกี่ยวกับฟังก์ชั่นควอไทล์ แต่มันไม่ชัดเจนสำหรับฉัน คุณสามารถให้คำอธิบายที่เข้าใจง่ายกว่าคำอธิบายด้านล่างได้ไหม?

เนื่องจาก cdfเป็นฟังก์ชันที่เพิ่มขึ้นแบบ monotonically จึงมีค่าผกผัน ให้เราแสดงถึงนี้โดย1} ถ้าเป็น cdf ของดังนั้นคือค่าของเช่นนั้น ; นี้เรียกว่า quantile ของFค่าคือค่ามัธยฐานของการแจกแจงโดยมีค่าความน่าจะเป็นครึ่งทางด้านซ้ายและครึ่งทางด้านขวา ค่า และเป็นควอไทล์ส่วนบนและล่างF - 1 F X F - 1 ( α ) x α P ( X x α ) = α α F F - 1 ( 0.5 ) F - 1 ( 0.25 ) F - 1 ( 0.75 )FF1FXF1(α)xαP(Xxα)=ααFF1(0.5)F1(0.25)F1(0.75)


คุณควรเรียนรู้การใช้มาร์กอัปคณิตศาสตร์ดูการแก้ไขของฉัน!
kjetil b halvorsen

6
นี่เป็นตัวอย่างของคำอธิบายที่กระชับในระดับหนึ่งและมีตัวอย่างอยู่แล้ว ไม่ชัดเจนว่าคุณต้องการคำอธิบายในระดับใด คำตอบอาจยาวกว่านี้ถึง 10 เท่าโดยขึ้นอยู่กับสิ่งที่คุณไม่รู้ เช่นคุณรู้ cdf หรือไม่ คุณรู้หรือไม่ว่า 'การเพิ่มความน่าเบื่อหน่าย' หมายถึงอะไร คุณรู้หรือไม่ว่าฟังก์ชันผกผันคืออะไร? พวกเราไปแค่ประโยคเดียวเท่านั้น คำถามของคุณเทียบเท่ากับข้อความที่คุณไม่เข้าใจ (ทั้งหมด) และแม้ว่าเราจะไม่มีเหตุผลที่จะสงสัยคุณ แต่นั่นไม่ใช่คำถามที่แม่นยำ
Nick Cox

คำตอบ:


38

ทั้งหมดนี้อาจฟังดูซับซ้อนในตอนแรก แต่มันเกี่ยวกับสิ่งที่ง่ายมาก

โดยฟังก์ชั่นการแจกแจงสะสมเราแสดงฟังก์ชั่นที่ให้ผลตอบแทนน่าจะเป็นของเป็นขนาดเล็กกว่าหรือเท่ากับค่าบาง ,Xx

Pr(Xx)=F(x).

ฟังก์ชั่นนี้จะใช้เวลาเป็น input xและผลตอบแทนค่าจาก[0,1]ช่วงเวลา (น่าจะ) แสดงว่า -let ของพวกเขาเป็นพีpผกผันของฟังก์ชันการแจกแจงสะสม (หรือฟังก์ชั่น quantile) จะบอกคุณว่าxจะทำให้F(x)กลับค่าบางp ,

F1(p)=x.

นี่คือตัวอย่างในแผนภาพด้านล่างซึ่งใช้ฟังก์ชั่นการแจกแจงสะสมปกติ (และอินเวอร์สของมัน) เป็นตัวอย่าง

ป้อนคำอธิบายรูปภาพที่นี่

ตัวอย่าง

ตัวอย่างง่ายๆคุณสามารถใช้การกระจายแบบกัมเบลมาตรฐาน ฟังก์ชันการแจกแจงสะสมคือ

F(x)=eex

และจะสามารถกลับได้อย่างง่ายดาย: การเรียกคืนลอการิทึมธรรมชาติฟังก์ชั่นเป็นสิ่งที่ตรงกันข้ามกับที่ชี้แจงฟังก์ชั่นจึงเป็นสิ่งที่เห็นได้ชัดทันทีว่าquantileฟังก์ชั่นสำหรับการกระจายกัมเบลเป็น

F1(p)=ln(ln(p))

อย่างที่คุณเห็นฟังก์ชั่นควอไทล์ตามชื่อทางเลือก "กลับ" พฤติกรรมของฟังก์ชันการแจกแจงสะสม

ฟังก์ชันการแจกแจงผกผันทั่วไป

ไม่ใช่ทุกฟังก์ชั่นที่มีการผกผัน นั่นคือเหตุผลที่ใบเสนอราคาที่คุณอ้างถึงพูดว่า "ฟังก์ชั่นที่เพิ่มขึ้นซ้ำซากจำเจ" จำได้ว่าจากความหมายของฟังก์ชั่นนั้นจะต้องมีการกำหนดสำหรับแต่ละค่าที่ป้อนเข้าหนึ่งเอาท์พุท ฟังก์ชันการแจกแจงสะสมสำหรับตัวแปรสุ่มแบบต่อเนื่องทำให้คุณสมบัตินี้เป็นที่น่าพึงพอใจเนื่องจากมีการเพิ่มความน่าเบื่อ สำหรับฟังก์ชั่นการแจกแจงสะสมแบบสุ่มตัวแปรไม่ต่อเนื่องและเพิ่มขึ้นดังนั้นเราจึงใช้ฟังก์ชั่นการแจกแจงแบบผกผันทั่วไปซึ่งจะต้องไม่ลดลง ฟังก์ชั่นการแจกแจงแบบผกผันทั่วไปมีการกำหนดเป็น

F1(p)=inf{xR:F(x)p}.

ความหมายแปลเป็นภาษาอังกฤษธรรมดากล่าวว่าสำหรับการกำหนดค่าความน่าจะเป็นเรากำลังมองหาบาง , ให้ผลในกลับมามากขึ้นค่าหรือเท่ากับแล้วแต่เนื่องจากอาจมีค่าหลายค่าของที่ตรงนี้ เงื่อนไข (เช่นเป็นจริงสำหรับใด ๆ ) ดังนั้นเราจึงใช้เล็กที่สุดของมันpxF(x)pxF(x)0x x xx

ฟังก์ชั่นที่ไม่มีผู้บุกรุก

โดยทั่วไปจะไม่มีค่าผกผันสำหรับฟังก์ชันที่สามารถส่งคืนค่าเดียวกันสำหรับอินพุตที่แตกต่างกันเช่นฟังก์ชันความหนาแน่น (เช่นฟังก์ชันความหนาแน่นปกติมาตรฐานคือสมมาตรดังนั้นจึงส่งกลับค่าเดียวกันสำหรับและเป็นต้น) การกระจายปกติเป็นตัวอย่างที่น่าสนใจสำหรับอีกหนึ่งเหตุผลที่มันเป็นหนึ่งในตัวอย่างของฟังก์ชั่นการกระจายสะสมที่ไม่ได้มีการปิดรูปแบบผกผัน ไม่ใช่ทุกฟังก์ชั่นการแจกแจงสะสมที่จะต้องมีค่าผกผันแบบปิด ! หวังว่าในกรณีเช่นนี้ผู้รุกรานสามารถพบได้โดยใช้วิธีการเชิงตัวเลข22

กรณีการใช้งาน

ฟังก์ชัน quantile สามารถใช้สำหรับการสร้างแบบสุ่มตามที่อธิบายไว้ในวิธีการแปลงผกผันทำงานอย่างไร


2
คำตอบนี้ใช้ได้ดีจนถึงย่อหน้าสุดท้าย ในเวลาที่คุณไปถึงคุณยืนยันว่า CDF ต่อเนื่องทุกตัวมีค่าผกผัน แต่จากนั้นคุณดูเหมือนจะเสนอการแจกแจงแบบปกติว่าเป็นตัวอย่างที่ตรงกันข้ามกับคำสั่งนั้นมาก นั่นอาจทำให้สับสนมาก
whuber

2
@ เมื่อคุณพูดถูกเพิ่มอีกหนึ่งประโยคเพื่อให้ชัดเจนยิ่งขึ้น
ทิม

2
ทิมและผมเพิ่มอีกหนึ่งคำที่จะทำให้มันชัดเจนมากขึ้น :)
อะมีบากล่าวว่าคืนสถานะโมนิกา

@ คำตอบที่ยอดเยี่ยมมาก แต่คุณช่วยอธิบายความหมายของคำผกผันของ cdfไหม? ในขณะที่คุณกล่าวถึงสิ่งที่เราถามจะทำให้ P ฉันเข้าใจx F ( x ) = pF1(u)=inf{x:F(x)u}xF(x)=pinfF(x)uinf

@AlexanderCska ใช่แล้วโดยทั่วไปค่า F (x) หลายค่านั้นมากกว่า u ดังนั้นเราจึงใช้ขอบเขตล่าง "ค่าที่เล็กที่สุดที่ตรงตามเงื่อนไขนี้"
ทิม

1

ทิมมีคำตอบอย่างละเอียดมาก เยี่ยมมาก!

ฉันต้องการเพิ่มคำพูดอีกหนึ่งข้อ ไม่ใช่ทุกฟังก์ชันที่เพิ่มขึ้นอย่างน่าเบื่อมีฟังก์ชันผกผัน ที่จริงแล้วฟังก์ชั่นการเพิ่ม / ลดที่น่าเบื่อหน่ายอย่างเคร่งครัดเท่านั้นมีฟังก์ชั่นผกผัน

สำหรับ cdf ที่เพิ่มขึ้นแบบ monotonically ซึ่งไม่ได้เพิ่มขึ้นอย่างต่อเนื่องอย่างเคร่งครัดเรามีฟังก์ชัน quantile ซึ่งเรียกว่าฟังก์ชันการแจกแจงสะสมแบบผกผัน คุณสามารถค้นหารายละเอียดเพิ่มเติมได้ที่นี่

F1

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.