มีวิธีในการประมาณค่าพารามิเตอร์การกระจายที่ได้รับเพียงแค่จำนวน


9

มีวิธีที่จะพอดีกับการกระจายที่ระบุถ้าคุณได้รับเพียงไม่กี่ quantiles?

ตัวอย่างเช่นถ้าฉันบอกคุณว่าฉันมีชุดข้อมูลแกมม่ากระจายและเชิงประจักษ์ 20%, 30%, 50% และ 90% - คุณสมบัติคือตามลำดับ:

      20%       30%       50%       90% 
0.3936833 0.4890963 0.6751703 1.3404074 

ฉันจะไปและประมาณค่าพารามิเตอร์ได้อย่างไร มีหลายวิธีในการทำเช่นนั้นหรือมีขั้นตอนเฉพาะอยู่แล้ว?

แก้ไขเพิ่มเติม:ฉันไม่ได้ขอการกระจายแกมม่าโดยเฉพาะนี่เป็นเพียงตัวอย่างเพราะฉันกังวลว่าฉันไม่สามารถอธิบายคำถามได้อย่างเหมาะสม งานของฉันคือฉันมี quantiles ที่กำหนด (2-4) และต้องการประเมินพารามิเตอร์ (1-3) ของการแจกแจงไม่กี่อย่างที่เป็น "ปิด" ที่สุด บางครั้งมีวิธีแก้ปัญหาที่แน่นอน (หรือไม่มีที่สิ้นสุด) บางครั้งไม่ถูกต้องใช่ไหม


1
ฉันโหวตให้ปิดสิ่งนี้ซ้ำกับstats.stackexchange.com/questions/6022แต่มันเกิดขึ้นกับฉันว่ามีการตีความที่เป็นไปได้ของคำถามนี้ที่ทำให้มันแตกต่างในวิธีที่น่าสนใจ ตามคำถามทางคณิตศาสตร์ล้วนๆ - ถ้ามีคนล้อเลียนให้คุณแจกแจงทางคณิตศาสตร์สองสามข้อ - นี่คือสิ่งที่ไม่มีความสนใจเชิงสถิติและเป็นของไซต์คณิตศาสตร์ แต่ถ้าวัดปริมาณเหล่านี้ในชุดข้อมูลโดยทั่วไปแล้วพวกเขาจะไม่ตรงกับปริมาณของการแจกแจงแกมมาใด ๆ และเราจำเป็นต้องค้นหาพอดี "ดีที่สุด" ในบางแง่
whuber

1
ดังนั้นหลังจากความเห็นเกริ่นนำมานานแล้วคุณอยู่ในสถานการณ์ใด Alexx? เราควรส่งคำถามของคุณไปยังผู้คนทางคณิตศาสตร์เพื่อหาคำตอบเชิงทฤษฎีหรือว่า quantiles เหล่านี้ได้มาจากข้อมูลหรือไม่? หากอย่างหลังคุณสามารถช่วยให้เราเข้าใจว่าโซลูชันที่ "ดี" (หรือ "ดีที่สุด") จะมีลักษณะอย่างไร ตัวอย่างเช่นการกระจายที่พอดีควรตรงกับควอนไทล์บางส่วนดีกว่าบางส่วนเมื่อไม่สามารถทำได้อย่างสมบูรณ์แบบ?
whuber

แต่จริงๆแล้วคำตอบที่สอง (โดย @mpiktas) ในลิงก์ที่คุณโพสต์นั้นประเมินการกระจายแม้ว่าปริมาณของคุณจะไม่ถูกต้อง (มาจากข้อมูล)
Dmitry Laptev

1
@ สถานะปัญหานี้เกี่ยวข้องกับ GMM อย่างไร ฉันไม่เห็นหลักฐานใด ๆ เลย !
whuber

1
"ช่วงเวลา" เป็นชื่อที่ไม่ดีที่พวกเขาติดอยู่เป็นที่ยอมรับ วิธีการที่ใช้งานได้จริงกับการประมาณสมการและฉันหวังว่าคุณจะเห็นบางอย่างในตัวอย่างนี้ @whuber ในการใช้ถ้อยคำใหม่ทฤษฎี GMM ครอบคลุมถึงทุกสิ่งที่สามารถทำได้ด้วยการสูญเสียกำลังสองสำหรับการประมาณสมการรวมถึงเส้นกำกับที่สูงกว่าและการพึ่งพาแปลก ๆ ระหว่างการสังเกตหรือสมการ
StasK

คำตอบ:


3

ฉันไม่รู้ว่ามีอะไรในโพสต์อื่น แต่ฉันได้รับคำตอบ หนึ่งสามารถดูสถิติการสั่งซื้อซึ่งเป็นตัวแทนของปริมาณที่เฉพาะเจาะจงของการกระจายคือkสถิติลำดับที่ X(k)เป็นค่าประมาณของ 100k/nควิไทล์ของการแจกแจง มีบทความที่มีชื่อเสียงใน Technometrics 1960 โดย Shanti Gupta ซึ่งแสดงวิธีการประมาณค่าพารามิเตอร์รูปร่างของการแจกแจงแกมม่าโดยใช้สถิติการสั่งซื้อ ดูลิงค์นี้: http://www.jstor.org/discover/10.2307/1266548


ฉัน TeXed ส่วนหนึ่งของคำตอบของคุณ (ออกจากเนื้อหาเหมือนกัน) แต่ฉันสับสนเล็กน้อยและคิดว่าอาจมีการพิมพ์ผิดหรือบางสิ่งบางอย่าง Re: "หนึ่งสามารถดูสถิติการสั่งซื้อซึ่งเป็นตัวแทนของปริมาณที่เฉพาะเจาะจงของการกระจาย ..... " คุณหมายถึง quantiles ของการกระจายเชิงประจักษ์หรือไม่? นอกจากนี้ยังมีkสถิติลำดับที่มักจะหมายถึง kค่าที่น้อยที่สุดไม่ใช่ k/nควิไทล์ของการกระจายเชิงประจักษ์ใช่ไหม คุณช่วยอธิบายได้ไหม (ขอโทษถ้าฉันหนาแน่น)
มาโคร

ถ้า n เป็นขนาดตัวอย่างสถิติลำดับที่ kth แสดงการประมาณเปอร์เซ็นต์ไทล์ 100 k / n ของการแจกแจงที่ถูกสุ่มตัวอย่าง
Michael R. Chernick

@MichaelChernick ฉันได้แก้ไขคำตอบของคุณเล็กน้อยเพื่อให้ชัดเจน - หวังว่านี่จะโอเค
มาโคร
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.